Tip:
Highlight text to annotate it
X
BRADY HARAN: Quero falar de
um número que deve ser
o mais popular aqui no
Numberphile, o número 301.
Aqueles que não prestam muita atenção
aos contadores de visualizações do Youtube,
devem questionar o porquê
do 301 ser tão popular, e eu vou explicar.
Quando um novo vídeo é carregado,
e se for muito popular
vemos o contador de visualizações
a aumentar, aumentar, aumentar
até chegar ao 301, e aí pára.
E fica no número 301 por
um dia, talvez 12 horas,
e a seguir a isso continua a
aumentar normalmente.
Muitas pessoas acham isto
muito intrigante
e pediram-nos para abordar o assunto.
TED HAMILTON: O meu nome é Ted Hamilton,
Sou o Gestor
de produto do Youtube Analytics.
BRADY HARAN: E assim o fizemos.
Entramos em contacto com
as pessoas responsáveis pela
contagem de visualizações do Youtube.
TED HAMILTON: É exactamente isso.
Bom, nós temos computadores
que fazem isso.
Não as contamos nós próprios, mas sim.
BRADY HARAN: Antes de discutirmos
esta questão do número 301,
o que é realmente uma
visualização no YouTube?
Sempre me questionei isso.
Basta clicar no play para
contar como visualização?
TED HAMILTON: Bem, isso é uma espécie
de segredo do Youtube.
Uma visualização deve ser uma
reprodução de vídeo pedida
por um utilizador que viu o que
pretendia ver
e por isso teve uma boa experiência.
Pensamos nas visualizações como
uma moeda, e por isso
temos que fazer um esforço
significativo para eliminar
visualizações fraudulentas,
se quisermos chamar assim.
BRADY HARAN: Eu sei que isto
parece ser tudo um pouco misterioso
e voltaremos a isso mais à frente no vídeo
mas vamos primeiro investigar
a questão do número 301.
E vamos descobrir que as
visualizações fraudulentas
até têm algo a ver com isso.
O que precisamos de perceber agora
é se quando vemos um
video, como este por exemplo,
provavelmente não o estamos a ver
a partir do mesmo servidor.
É distríbuido por servidores de
todo o mundo.
TED HAMILTON: Há o vídeo original que
tu vais carregar.
Ou suponho que quando
estiverem a ver isto,
o vídeo já tenha sido carregado.
Depois fica, como se diz?
Fica em cache em diferentes locais,
de modo a que quando fazes
um pedido para ver um vídeo,
ele não tem que ir
de Londres até à California
para dizer "OK, manda-me
de volta esses bytes todos até aqui".
BRADY HARAN: Com múltiplas
cópias do vídeo espalhadas
por todo o mundo, contar as
visualizações, começa a ficar
um pouco mais complicado.
TED HAMILTON: Aqui estás tu
no teu computador
a ver o vídeo.
Se fizeres um pedido a este
servidor, ele vai
dar-te o vídeo, certo?
E ao mesmo tempo, o servidor
vai escrever
uma pequena mensagem num log.
É apenas uma linha nesse log.
Depois nós reunimos todas essas linhas,
mandamos a informação da Europa Central
ou doutro sítio
para nossa central de recolha de dados
reunimos e verificamos todos os logs
e contamos tudo.
BRADY HARAN: OK, isto parece
bastante simples
mas não explica o porquê de o contador
de visualizações parar.
TED HAMILTON: As visualizações,
como mencionei, são uma moeda.
Quando temos um vídeo com
muito poucas visualizações,
não precisamos de nos preocupar
de onde veio essa visualização.
No entanto, quando se tem 300 ou mais
desta moeda, precisamos mesmo
de fazer verificação para certificar
que esse número é o que deve ser
Isto significa que temos que
executar um processo
estatístico de verificação,
e esse processo,
leva algum tempo.
E assim deixamos de aumentar
o contador um a um para algo em que
dizemos: "OK, a partir de agora
vamos incrementar em grupos
e todas essas visualizações que
vão ser adicionadas, foram verificadas
e são visualizações reais."
Queremos evitar que coisas
como bots possam acrescentar
visualizações a um vídeo.
Ou excluir os casos em que
algo tenha enganado
alguém a ver o vídeo.
Imagina que tens um título
que é completamente enganador e
uma miniatura que induziu
em erro as pessoas a clicarem,
elas viram o vídeo apenas
por alguns segundos
e depois saíram.
Se virmos isso acontecer vezes
o suficiente, é um indicador
que algo estava errado com
esse vídeo e não devemos
deixar que todas essas
visualizações contem.
BRADY HARAN: Tudo bem, então
Eles estão a verificar os números.
Estão a verificar tudo.
Acho que poderíamos
ter imaginado isso
Mas porquê 301?
TED HAMILTON: Eu não estava
aqui quando se decidiu
mas em algum momento, decidiu-se que
seria preciso definir a diferença
entre o que era negligível e a
database podia gerir
facilmente, e o que era mais sério.
Essa diferença foi traçada
à volta do número 300.
É esse o número com que
nos precisamos de preocupar.
Mas a fórmula que usamos para
chegar a 300, não sei se
alguém realmente a sabe.
BRADY HARAN: Bom, OK.
Eles fizeram uma linha na areia.
Foi algo arbitrário.
Eles queriam diferenciar entre
pessoas que apenas queriam partilhar
os vídeos que faziam em casa,
e os que eram mais populares,
os que eram mais sérios.
Aqueles que precisavam de escrutínio.
E dai surgiu o 300.
Mas o contador pára nos 301.
Qual o porquê disso?
Há alguma razão?
TED HAMILTON: Sim, há uma razão.
E a razão é que o número 300
foi escolhido.
E quando alguém escreve código,
precisa de colocar
uma condição lógica que diga
ao código quando parar
ou quando se deve,
se uma condição for verdadeira,
ir para a esquerda.
Ou se outra condição for verdadeira,
ir para a direita.
E a condição pode
ser escrita desta forma:
Se o contador de visualizações
for menor que 300, então adiciona
uma visualização ao contador.
Caso contrário, vai para x,
onde x é o nosso processo
mais complicado de contagem.
No entanto, o que foi escrito,
não foi exactamente isso, foi que
se o contador é menor ou igual
a 300, então incrementa
uma visualização ao contador.
O que isto significa é que quando
o contador está em 300, por exemplo,
está o contador menor ou igual
a 300?
Sim, está.
Então vou adicionar 1.
E assim acabamos com 301.
BRADY HARAN: Deixem-me recapitular
o que acontece.
O código que está a controlar quando
o contador de visualizações
pára, contém um sinal
de menor ou igual.
Isto significa quando uma nova
visualização aparece
é verificada pelo código.
Supunhamos que o contador
está em 299.
OK, então.
Deixamos que outra visualização venha.
Entretanto chega outra visualização.
Agora o contador está em 300.
Isso não é menor que 300,
mas é igual a 300.
Então o código deixa que essa
visualização conte também para o total.
Estamos agora em 301, e quando
outra visualização chega
o total não é menor que 300, mas
também já não é igual a 300
e a porta fecha-se.
Não irão haver mais visualizações
adicionadas ao contador público
até que o Youtube faça
as suas verificações.
E isso pode demorar entre 12 horas a 1 dia.
Passado esse tempo, todas as
visualizações que foram contadas
internamente, são adicionadas ao total.
Nada é perdido.
Pelo menos é o que me disseram.
TED HAMILTON: Provavelmente
quem escreveu o código
não se apercebeu da dimensão
do que estava a fazer.
Os contadores de visualizações
existem desde o início do
YouTube, e quem poderia adivinhar
no que o Youtube se iria tornar.
Portanto sim, foi um segundo de tempo
em San Bruno, California,
em que um programador escreveu
essa condição lógica.
E é agora uma das idiossincrasias do Youtube
BRADY HARAN: Consigo imaginar
agora, alguns de vocês
a gritar para o computador.
O contador nem sempre pára nos 301.
Às vezes pára em 302, ou 305 ou 310.
Porque é que isso acontece?
Há uma explicação para isso,
e tem a ver com o que disse antes,
dos vídeos estarem espalhados
em vários servidores
por todo o mundo.
Eis o que se passa.
As visualizações chegam dos
logs dos diferentes servidores
que estão espalhados
em diferentes partes do mundo.
E chegam todos a uma database central
E sabemos que a porta fecha-se
aos 301 no contador
como explicamos há um minuto atrás.
Mas o que aconteçe se as
visualizações chegarem ao mesmo tempo?
Se alguém vir o vídeo em África
ao mesmo tempo que
alguém na Europa?
Agora temos várias visualizações a chegar.
Verifica-se se elas podem entrar
para o contador, sim podem.
É menor ou igual a 300.
E assim elas são adicionadas
ao total ao mesmo tempo.
Quando uma nova visualização
tenta entrar, não consegue,
as portas estão fechadas.
Por causa das visualizações
simultâneas, algumas
visualizações extra conseguem entrar.
TED HAMILTON: Estão-nos sempre
a perguntar isso.
Não acho que cause propriamente
irritação, mas é certamente
uma situação que diria chata.
Podes ir a um vídeo muito popular
e ver por vezes que ele tem 2,000 likes
e apenas 300 views.
É algo curioso.
A questão aqui é que não
submetemos os likes ao
mesmo processo rigoroso de verificação.
E os likes são sempre bastante
menos em número, por isso
os nossos servidores conseguem
gerir mais facilmente.
Mas as visualizações param,
e isso pode resultar em
situações estranhas.
Mas isso resulta em vídeos
terríficos como este, por isso...
BRADY HARAN: Eu falei com o Ted
talvez durante 45, 50 minutos,
e gravei tudo.
Tenho mais imagens, mais detalhes,
incluindo uma explicação
mais detalhada sobre o que
é uma visualização.
E eu sei que alguns de vocês
estão interessados em ver.
Ainda não tive tempo para editar
tudo, mas fiquem atentos
porque vou carregar isso para
o Numberphile brevemente.
E para aqueles entre vocês que
não gostam de vídeos como este
que são mais sobre computadores
e internet, peço desculpa.
O Numberphile tem sempre algo
inesperado, e prometo
que da próxima vez,
o vídeo será sobre algo que
gostarão mais.
MATT PARKER: Quantas setas queres?
Então para o próximo, digamos que
fazemos 3 elevado a, elevado a,
elevado a, oh, seta, seta,
seta, ou como quer que queiras
chamar a isto.
3.
Será--