Tip:
Highlight text to annotate it
X
Olá, pessoal.
Sou Matt Cutts.
Estamos de volta para falar um pouco
sobre as técnicas de cloaking.
Muitas pessoas têm dúvidas sobre as técnicas de cloaking.
O que é isso exatamente?
Como o Google as define?
Por que é um comportamento de alto risco?
Esse tipo de coisa.
E há muita documentação em HTML.
Já fizemos várias postagens em blogs.
Mas eu queria fazer o vídeo definitivo sobre técnicas de cloaking,
responder uma parte das perguntas e oferecer às pessoas
algumas dicas para garantir que não caiam
em uma área de alto risco.
Então, primeiro, o que são técnicas de cloaking?
Essencialmente, é mostrar um conteúdo para os usuários
e outro para o Googlebot.
Imagine que você tem um servidor da Web.
Um usuário chega e solicita uma página.
Aqui está seu usuário.
Você dá a ele uma página.
Todos ficam felizes.
Agora, faremos o GoogleBot pedir
uma página também.
Você dá uma página ao Googlebot.
Em grande parte das situações, o mesmo conteúdo
vai para o Googlebot e para os usuários.
Todos ficam felizes.
Cloaking é quando se mostra aos usuários um conteúdo diferente
do mostrado ao Googlebot.
Isso é um alto risco.
É uma violação de nossas diretrizes de qualidade.
Se você pesquisar por diretrizes de qualidade no Google,
encontrará uma lista de tudo,
muita documentação auxiliar sobre como saber
se você está em uma área de alto risco.
Mas discutiremos isso um pouco mais.
Por que as técnicas de cloaking são más ou por que
o Google não gosta de cloaking?
Bem, a resposta está nos primeiros dias dos mecanismos
de pesquisa, quando muitas pessoas realmente faziam
coisas enganosas ou fraudulentas com cloaking.
Por exemplo, quando o Googlebot aparecia, o servidor da Web que
usava técnicas de cloaking podia retorna uma página sobre desenhos,
desenhos da Disney, algo assim.
Mas quando um usuário visitava a página, o servidor
da Web podia retornar algo inadequado, como pornografia.
Então você fazia uma pesquisa por desenhos da Disney no Google,
chegava a uma página que parecia ser sobre
desenhos, clicava e aparecia pornografia.
Essa é uma experiência horrível.
As pessoas reclamam disso.
É uma experiência horrível para os usuários.
Dizemos que todos os tipos de cloaking são contra nossas
diretrizes de qualidade.
E não existe técnica de cloaking "white hat".
Com certeza, quando alguém faz uma coisa
enganosa ou fraudulenta, é nossa maior preocupação.
É neste momento que a equipe de spam na Web se envolve.
Mas qualquer técnica de cloaking é contra nossas diretrizes.
Ok.
Então quais são as dicas para, digamos, poupar você do
problema ou ajudar a ficar fora de uma área de alto risco?
Um modo de pensar sobre técnicas de cloaking é
carregar a página, usando Wget ou cURL.
Você de algum modo carrega a página e tira um hash dela.
Então pegue todo o conteúdo diferente e reduza-o a
um número.
Depois imagine que você é o Googlebot com um
user agent do Googlebot.
Temos até um recurso Carregar como Googlebot nas Ferramentas
do Google para Webmasters.
Então você carrega uma página como Googlebot e tira um hash
dessa página também.
Se esses números forem diferentes, pode
ser meio complicado.
Pode ser uma situação em que você está
em uma área de alto risco.
Mas as páginas podem ser dinâmicas.
É possível ter coisas como timestamps, os anúncios podem
mudar. Então não é uma regra rígida e simples.
Outra heurística simples para lembrar é: se você tiver que
examinar o código de seu servidor da Web, encontrará
algo que verifica a presença de um user agent
do Googlebot ou do endereço IP do Googlebot
especificamente?
Porque se você faz algo muito diferente,
especial ou incomum para o Googlebot,
seja seu user agent ou seu endereço IP,
isso tem o potencial de, talvez, mostrar conteúdos
diferentes para o Googlebot e para os usuários.
E esse tipo de atividade é de alto risco.
Essas são dicas importantes para se ter em mente.
Agora, uma pergunta feita por vários "white hat"
que não querem se envolver de modo algum,
mas querem ter certeza de que passarão longe de
áreas de alto risco, é sobre geolocalização e user agents
para dispositivos móveis, telefones, essas coisas.
A boa notícia, fazendo um resumo executivo, é que
você não precisa se preocupar com isso.
Mas discutiremos por que o uso da localização geográfica
e de celulares não é cloaking.
Ok.
Até agora, temos um usuário.
Agora, vamos em frente e dizer que esse usuário
vem da França.
Usaremos um usuário diferente e digamos
que ele venha do Reino Unido.
Idealmente, se seu conteúdo estiver disponível em um
domínio .fr, um domínio .uk, ou em idiomas diferentes,
porque você teve o trabalho de traduzi-los,
ajuda muito se alguém que vem de um endereço IP
francês receba o conteúdo em francês.
Ele ficará mais feliz se isso acontecer.
A função da localização geográfica é fazer com que, sempre que uma solicitação
chegue ao servidor da Web, você olhe o endereço IP e diga
que esse endereço IP é francês.
Enviarei para ele a versão em francês ou
a versão .fr de meu domínio.
Se alguém entrar no navegador e ele estiver em inglês,
se o endereço IP vier dos Estados Unidos,
Canadá ou algo do gênero, você diz que inglês é
provavelmente a mensagem certa, a menos que venha da
parte francesa do Canadá, é claro.
Então o que acontece é que você toma a decisão com
base no endereço IP.
Contanto que você não crie um país específico
ao qual o Googlebot pertença,
Googlelândia ou algo parecido,
você não fará algo especial ou diferente
para o Googlebot.
No momento, enquanto fazemos este vídeo,
o Googlebot faz o rastreamento a partir dos Estados Unidos.
Então você trata o Googlebot como um visitante
dos Estados Unidos.
Você veicula o conteúdo em inglês.
Em geral, recomendamos tratar o Googlebot como
um navegador da área de trabalho, como o Internet Explorer
7 ou o navegador da área de trabalho bastante comum
para seu site específico.
Localização geográfica,
isto é, ver o endereço IP e reagir ao que está lá,
não tem problema, contanto que você não reaja
especificamente ao endereço IP do Googlebot, apenas àquela
faixa bem estreita.
Em vez disso, você pensa: "Ok, qual a melhor experiência
de usuário em geral, dependendo do endereço IP?"
Do mesmo modo, se alguém entrar,
digamos que venha
de um telefone celular,
e acessa via iPhone ou um telefone Android.
É possível pensar "ok, é um user agent totalmente
diferente".
Tem capacidades completamente diferentes.
Tudo bem responder a esse user agent e dar
a ele uma versão mais simples do site ou algo que
sirva melhor em uma tela menor.
Novamente, a diferença é: se tratar o Googlebot como
um usuário de computador, de modo que o user agent não perceba
o que você faz como algo especial ou diferente,
você não terá problema algum.
Então você olha as capacidades do telefone
celular, retorna uma página personalizada apropriada,
mas não tenta fazer algo fraudulento ou
enganoso.
Você não trata o Googlebot de um modo realmente diferente,
com base no user agent.
Então aqui, tudo bem.
E o último aspecto que desejo mencionar, e este é o
tipo de dica para usuários avançados, é que para algumas
pessoas, é ok não fazer a distinção baseada na string de
user agent exata ou na faixa de endereço IP exata
da qual o Googlebot vem. Mas talvez seja bom dizer
para verificar os cookies.
Se alguém não responder aos cookies ou se
não tratar o JavaScript da mesma maneira, será removido
e eu o tratarei de maneira diferente.
O *** decisivo é se você usa isso
como desculpa para tentar tratar o Googlebot
de outro modo ou encontrar uma forma de segmentar o Googlebot
e forçá-lo a fazer algo completamente diferente.
Novamente, o instinto por trás das técnicas de cloaking é tratar
os usuários do mesmo modo que você trata o Googlebot?
Queremos encontrar e retornar a mesma página que
será vista pelo usuário.
Então queremos que o usuário final tenha, quando clicar em
um resultado do Google, a mesma experiência que teria
se ele mesmo chegasse à página.
Por isso, não se deve tratar o Googlebot de maneira diferente.
Por essa razão, cloaking é uma má experiência, e por esse motivo
viola as diretrizes de qualidade.
E é por isso que prestamos atenção.
Não existe uma técnica de cloaking "white hat".
Queremos assegurar que a página vista pelo usuário é
a mesma página vista pelo Googlebot.
Ok, espero que isto ajude.
Espero ter explicado um pouco sobre técnicas de cloaking,
algumas dicas simples.
De novo, se nada neste vídeo ajudar,
pergunte se você tem um código especial que parece
feito para o user agent do Googlebot ou o endereço
IP exato do Googlebot e que o trate de maneira diferente.
Se você o trata sem diferenças, você o envia com
base em localização geográfica, vê os
telefones do user agent,
tudo isso não tem problema.
Mas se você especificamente procura o Googlebot e
faz algo diferente, é então que você
começa a entrar em uma área de alto risco.
Nós temos mais documentação em nosso site.
Provavelmente, temos links para ela, se você consultar
os metadados deste vídeo.
Mas espero ter explicado um pouco sobre por que
pensamos assim sobre cloaking, por que levamos isso a sério e
como pensamos no efeito geral quando tentamos decidir
se algo é uma técnica de cloaking.
O efeito no usuário final é nosso principal interesse.
Assim, não importa qual é seu código, se algo
veiculado difere radicalmente do Googlebot
para os usuários, é provável que
nos preocupemos com ele.
Espero que isso ajude.