Tip:
Highlight text to annotate it
X
Idéias que te transformam
Luis von Ahn: Utilizando o poder de milhões de mentes humanas
Olá. Bom, quero começar fazendo uma pergunta:
Quantos de vocês já tiveram que preencher um formulário na internet
onde tiveram que colocar umas letras distorcidas assim como estas?
Ok. Quantos odeiam fazer isso?
Excelente. Bom, isso foi inventado por mim.
(Risos)
(Aplausos)
Isso se chama um captcha
É para estar seguro de que a entidade que completa o formulário
é um humano, e não um programa de computador
desenhado para preencher este formulario milhões e milhões de vezes.
Isto funciona porque os humanos
podem ler estes caracteres distorcidos
mas os computadores ainda não podem fazê-lo.
Por exemplo, quando estão comprando entradas para um espetáculo na internet
têm que introduzir essas letras
para ter certeza de que os revendedores de entradas não possam comprar,
não possam fazer um programa
que compre todas as entradas, duas por vez.
Agora, esses são usados por toda a internet.
E já que são usados tantas vezes,
muitas vezes a sequência exata de caracteres ou de letras escolhidas por acaso
é um pouco desafortunada.
Por ejemplo, este vem do Yahoo.
As letras escolhidas totalmente por acaso,
neste caso foram W, A, I, T, que, em inglês, é uma palavra, WAIT,
que significa esperar.
Mas o melhor é que, ao redor de 20 minutos depois,
o e-mail que recebeu o Yahoo deste usuário
(Texto: Ajudem-me! Estou esperando há 20 minutos e não acontece nada") (Risos)
Isso, entretanto, não é tão terrível como o que ocorreu com essa pobre pessoa.
(Texto: REINICIAR) (Risos)
Bom, posso contar a vocês histórias divertidas de captchas por horas
mas, como não posso fazer isso
quero lhes contar sobre outro projeto que fizemos depois deste projeto.
Seria como a evolução dos captchas.
É um projeto que se chama recaptcha.
É um projeto que começamos na Universidade.
Depois o convertemos numa companhia start-up.
E depois a Google comprou esta companhia,
assim que, durante os seguintes 5 minutos, tudo que eu disser
é propriedade da Google. Ou seja, não repitam isso.
Este projeto começou pelo seguinte,
O que ocorre é que cerca de 200 milhões de captchas são introduzidos a cada dia.
Agora, quando eu soube disso, estava muito orgulhoso de mim mesmo.
E pensei "olhem o impacto que o meu trabalho teve".
Mas depois comecei a me sentir mal.
Não só são odiosos, mas além disso,
cada vez que alguém introduz um captcha realmente
perde cerca de 10 segundos do seu tempo.
E se multiplicamos 10 segundos por 200 milhões, chegamos a que
toda a humanidade está perdendo cerca de 500 mil horas diárias
introduzindo captchas na internet.
Então comecei a me sentir mal.
E comecei a pensar: será que existe alguma maneira?
ou, como podemos utilizar este esforço para o bem da humanidade?
Durante esses 10 segundos que alguém está ingressando um captcha
seu cérebro está fazendo algo incrível,
seu cérebro está fazendo algo que os computadores ainda não podem fazer.
Então será que podemos fazer com que façam algo que seja
benéfico para a humanidade?
Outra maneira de expressá-lo:
Será que existe algum problema gigantesco que ainda não podemos
conseguir que os computadores resolvam
mas que podemos dividir em pedacinhos pequenos
de tal forma que cada vez que alguém resolva um captcha
resolva um pedacinho deste problema?
E parece ser que sim, e isso é o que estamos fazendo agora.
Ou seja que hoje em dia, se alguém introduz um captcha, o que talvez não saiba
é que não só estão mostrando que são humanos
senão, além disso, nos estão ajudando a digitalizar livros.
Deixem-me explicar como funciona isso.
Há vários projetos tratando de digitalizar
todos os livros que foram escritos.
Google tinha um:
Amazon tem outro com o Kindle.
E a maneira que isso funciona é que pegam um livro.
Essas coisas físicas; vocês já viram algumas, verdade?
Essas coisas dalí de fora.
(Risos)
Pegam um livro e o escaneiam.
Escanear um livro consiste em tirar uma foto digital de cada página.
O próximo passo nesse processo é que o computador
tem que descifrar todas as palavras que estão nessa foto.
O problema é que, nos livros que foram escritos há varios anos,
o computador não pode descifrar muitas dessas palavras.
Porque a tinta está gasta, as páginas já se tornaram amarelas.
Então a palavra se vê um pouquinho diferente
e o computador não pode descifrar.
Para os livros escritos há mais de 50 anos.
o computador não pode descifrar cerca de 30% das palavras.
Então agora estamos
pegando todas as palavras que o computador não pode descifrar
e estamos fazendo com que alguém as descifre para nós na internet
enquanto completam um captcha.
Ou seja, que na próxima vez que completem um captcha
(Aplausos)
estas palavras que estão introduzindo
são palavras que vêm diretamente de livros que foram digitalizados
e que o computador não pode reconhecer.
A razão pela qual temos duas palavras em vez de uma
é que necessitamos verificar se a resposta está correta.
Porque uma das palavras é a que o sistema já sabe a solução
e a outra é uma palavra que o sistema acaba de pegar de um livro,
não sabe o que é, e a vai apresentar a algum usuário.
Vamos a pedir ao usuário que introduza as duas.
E não vamos informá-lo qual é qual.
E, se introduzem a resposta correta
para a qual o sistema já sabe a resposta,
suporemos que é um humano,
e como temos um pouco de confiança em que introduziram a outra corretamente,
E se repetimos este processo com 10 diferentes pessoas com a nova palavra
e todas introduzem a mesma coisa com a nova palavra
temos muita segurança de que essa nova palavra
está corretamente digitalizada.
Essa é a maneira como funciona esse sistema.
E o bom é que teve muito sucesso.
Estamos digitalizando cerca de 100 milhões de palavras diárias.
O que equivale a 2 milhões de livros por ano
que estão sendo digitalizados uma palavra por vez
por pessoas escrevendo captchas na internet.
Agora, já que estamos fazendo tantos pares de palavras,
também podem ocorrer coisas interessantes ou divertidas.
Isso é especialmente certo porque agora estamos mostrando duas palavras,
em inglês, uma ao lado da outra, escolhidas ao acaso,
Então isso pode levar a que ocorram coisas divertidas.
Por exemplo, mostramos esta palavra.
Que só é "cristãos", não tem nada de mau.
Mas se a colocamos com outra palavra escolhida totalmente ao acaso
podem ocorrer coisas ruins.
Por exemplo, mostramos isso (Texto: maus cristãos).
(Risos)
É um pouco divertido.
Mas é ainda pior porque há milhões de sites
que usam captchas na internet, mas resulta que este captcha foi mostrado
num site chamado A Embaixada do Reino de Deus.
(Risos)
Ups!
Aqui tem outro muito mau.
Um político nos E.U.A., JohnEdwards.com (Texto: maldito liberal).
(Risos)
Bom, insultamos as pessoas todos os dias com isso.
Mas não são só insultos
Também muitas vezes são só coisas interessantes que podem ocorrer
e isso deu auge a uma nova moda na internet
na que participaram milhões de pessoas
que se chama captchart ou arte de captchas.
A idéia dessa moda é a seguinte.
Imaginem que estão navegando pela internet e de repente
vêem um captcha que paresse interessante
Como esse. (Texto: torradeira invisível)
O que se supõem que devem fazer é capturar a imagem da tela
Depois têm que introduzir o captcha
porque assim nos ajudam a digitalizar os livros, por favor,
e depois, o que se supõem que devem fazer,
é desenhar algo baseado neste captcha e colocá-lo com o captcha, assim como esse.
(Texto: torradeira invisível)
(Risos)
É um exemplo da arte de captcha.
Agora, há milhões desses.
Há alguns como esse, interessantes.
Há outros como esse que são mais ternos. (Texto: Ganhei!)
E há outros como esse que são muito mais divertidos.
(Texto: Fundadores drogados) (Risos)
Este é o meu número favorito sobre este projeto: 900 milhões.
Esse é o número total de pessoas distintas
que nos ajudaram a digitalizar pelo menos uma palavra
de algum livro através de captchas.
Um pouco mais de 10% da humanidade
nos ajudou a digitalizar livros.
Agora, são números como esse que motivam o meu trabalho.
E, em particular, a pergunta que me motiva é a seguinte:
Se vemos todos os maiores projetos da história da humanidade.
Todos estes mega-projetos
que a humanidade fez
como por exemplo, as pirâmides do Egito,
ou o Canal do Panamá,
ou colocar o homem na Lua,
uma coisa curiosa sobre estes mega-projetos
é que foram feitos com cerca do mesmo número de pessoas.
Todos foram feitos com cerca de 100 mil pessoas.
E podemos nos perguntar por que todos usaram
cerca do mesmo número de pessoas.
E a razão é porque antes da internet,
coordenar mais de 100 mil pessoas era impossível.
Mas agora com a internet, acabo de lhes mostrar um projeto
onde coordenamos a 900 milhões de pessoas.
Então a pergunta que me motiva é
se podemos colocar um homem na Lua com 100 mil pessoas,
O que podemos fazer com 100 milhões de pessoas?
E baseados nessa pergunta
trabalhamos em vários projetos.
Não vou contar a vocês todos os projetos que fizemos.
mas quero contar pra vocês de um que estamos trabalhando agora.
Já vimos trabalhando dois anos neste projeto.
E vamos lançá-lo em cerca de 30 dias.
É um projeto que se chama Duolingo.
Este projeto começou com a seguinte pergunta:
Como podemos fazer que 100 milhões de pessoas
traduzam Internet a todos os maiores idiomas, grátis?
Há várias coisas que dizer desta pergunta.
A primeira é traduzir internet.
Como todos sabemos, a Internet está repartida em vários idiomas.
Uma grande fração está em inglês.
E se alguém não sabe inglês, não pode usá-la
mas há frações em outros idiomas
e se alguém não sabe esses idiomas, perde isso.
Eu queria traduzir toda a Internet a todos os maiores idiomas.
Isso é o que eu queria fazer.
Agora, se isso é o que eu queria fazer, muita gente poderia dizer
por que não usamos computadores para fazê-lo?
Ultimamente, os computadores estão traduzindo algumas orações aqui e acolá.
Mas como todos sabemos, os computadores simplesmente
não são muito bons para traduzir.
E não serão pelos próximos 20 ou 30 anos.
Deixem-me mostrar somente um exemplo do que pode ocorrer
quando traduzimos algo com o computador
Isso é um exemplo do que encontramos num foro da Internet sobre...
é um foro para perguntas de programação
Ou seja, esta é uma pergunta de programação que foi traduzida do japonês
ao inglês e daí, eu a traduzi ao espanhol, mas a minha tradução é boa.
A outra é a que é ruim. Já vão ver.
Só vou deixar que leiam isso.
A princípio só está pedindo perdão pelo fato de ser uma tradução
Desde já, isso foi feito com o melhor programa de tradução
do japonês ao inglês.
Lembrem-se: se supõem que isso é uma pergunta sobre programação.
Aqui vem o preâmbulo da pergunta.
(Texto: Frequentemente, a cabra, durante a instalação de um erro é vomitar) (Risos)
Depois vem a primeira parte da pergunta.
(Texto: Quantas vezes como o vento, um poste, e o dragão?) (Risos)
Depois vem a minha parte favorita da pergunta.
(Texto: Este insulto às pedras do meu pai?) (Risos)
E depois vem a minha parte favorita de toda a mensagem.
(Texto: Por favor, pedir desculpas pela sua estupidez. Há muitos obrigados) (Risos)
Ou seja que os computadores não são muito bons
Assim que necessitamos humanos.
Então, o que eu quero fazer é que 100 milhões de pessoas
traduzam a internet a todos os maiores idiomas e grátis.
Não creio que eu possa pagar a 100 milhões de pessoas.
Então quero que façam grátis.
Agora, se isso é o que eu quero fazer,
quando começamos a trabalhar nesse projeto vimos
que havia dois grandes obstáculos para conseguir fazer isso.
O primeiro é a falta de pessoas bilingües.
Eu não sei se existem 100 milhões de pessoas que usam a internet
que sejam suficientemente blingües para nos ajudar a traduzir.
Esse é um grande problema.
O segundo problema é a falta de motivação.
Como vamos fazer para motivar as pessoas a que traduzam grátis?
Depois de pensar nesses dois problemas por vários meses,
vimos que havia uma maneira
de resolver ambos problemas com a mesma solução.
Vimos que havia uma maneira de matar dois pássaros com uma pedra.
E a maneira é transformar a tradução de idiomas
em algo que milhões de pessoas queiram fazer
e que, além disso, ajude com o problema da falta de pessoas bilingües.
E isso é aprendizagem de outros idiomas.
Resulta ser que há milhões de pessoas que querem aprender outros idiomas.
Hoje em dia há 1 bilhão, 200 milhões de pessoas no mundo aprendendo outro idioma.
E mais. Não é só porque os estejam forçando a aprender no colégio.
Nos E.U.A., por exemplo, há mais de 5 milhões de pessoas
que pagaram mais de 500 dólares por programas de computação
para aprender novos idiomas.
Muita gente quer aprender novos idiomas.
Então o que estamos trabalhando nos últimos dois anos
é um novo site da Internet que se chama Duolingo.
A idéia com Duolingo é que as pessoas possam aprender um novo idioma,
100% grátis, e, ao mesmo tempo, enquanto aprendem, estão traduzindo a internet.
Ou seja, aprendem traduzindo.
Essa é a maneira como funciona.
E a maneira como funciona mais precisamente, é que quando estão começando
vamos dar orações muito simples da internet para eles.
E se não sabem alguma palavra, vamos dizer a eles o que significa essa palavra
mas vamos dizer a eles "traduza essa oração".
E resulta que as pessoas podem fazê-lo.
Ainda que não saibam nada do idioma, se lhes explicamos
o que significa cada palavra, a traduzirão.
E depois vão ver como outras pessoas traduzem
a mesma oração e assim irão aprendendo como se traduz.
E depois que vão usando o site
iremos dando a eles frases mais e mais complexas.
E assim nos ajudarão a traduzir. Assim é como funciona o site.
Agora já terminamos de construí-lo
e o que estamos fazendo agora é testá-lo.
Quando começamos a trabalhar com isso
eu não pensei que fosse funcionar, na verdade.
Mas resulta que funciona. E é incrível.
Em primeiro lugar a pessoa aprende idiomas.
Neste caso estamos testando com pessoas
que sabem inglês e aprendem espanhol.
E pessoas que sabem espanhol e aprendem inglês.
E o resultado é que as pessoas aprendem o idioma muito bem.
Aprendem tão bem como com qualquer outro método computadorizado
de aprender idiomas.
O que é muito bom. Mas ainda mais incrível é que as traduções
que nos dão as pessoas quando estão aprendendo são muito boas.
É mais: são tão boas como as traduções
que nos dão tradutores profissionais.
Agora, tem um truque que estamos usando para isso
e é que cada oração é traduzida por várias pessoas, vários estudantes,
e escolhemos a melhor. E o resultado é que essa melhor
é tão boa como a que nos dá um tradutor profissional.
Mas além de que cada oração seja traduzida por muitas pessoas,
outra coisa boa é que com Duolingo
podemos traduzir realmente bastante rápido.
Deixe-me dar uma estimação de quão rápido podemos traduzir.
Se quiséssemos traduzir a Wikipedia do Inglês ao Espanhol
-obviamente a Wikipedia existe em espanhol, mas é muito menor
que em inglês, é ao redor de 20% do tamanho em inglês -
se quiséssemos traduzir a Wikipedia do Inglês ao espanhol com Duolingo,
se tivéssemos 100 mil usuários aprendendo inglês com Duolingo
poderíamos fazê-lo em 5 semanas.
E se tivéssemos um milhão de usuários, poderíamos fazê-lo em 80 horas.
E já que todos os meus projetos até a data conseguiram
ter mais de um milhão de pessoas
esperamos que possamos traduzir toda a internet grátis.
Não lançamos Duolingo.
(Aplausos)
Só quero deixá-los...
Não lançamos Duolingo, mas vamos fazê-lo em 30 dias.
Se vão a Duolingo.com, vamos deixá-los
entrar ao beta privado em cerca de 30 dias.
Ajudem-nos.
Obrigado.
(Aplausos)