Na semana passada, vimos aqui posts do Luis e do Bruno mostrando como evitar conteúdo duplicado e dicas para corrigir esse problema. Agora o que vou fazer é mostrar uma outra forma de detectar esse problema.
Já sabemos que o Google Webmaster Tools pode nos ajudar com isso, mas o próprio Google também é muito útil para isso e veremos agora como utiliza-lo para verificar se você tem um problema de conteúdo duplicado.
O que faremos é simplesmente olhar no index do Google para ver o que ele salvou, e se algo é duplicado.
Use seu bom senso
Comece fazendo uma busca do tipo site:exemplo.com.br.
Dica: após fazer a busca, adicione &filter=0 no fim da URL que foi gerada na barra de endereço do seu navegador para que o Google não omita nenhum resultado.
Preste atenção na quantidade de páginas indexadas. Você realmente tem esse número de páginas ou o número está muito alto? Se estiver, você tem conteúdo duplicado.
Percorra os resultados
Provavelmente foi a primeira coisa que você pensou, e se ainda não fez, percorra as páginas para ver os resultados.
Procure por URLs parecidas, mal formadas, com query strings (como ?=sessionid ou ?first_page etc.), que levem a páginas idênticas. Preste mais atenção nas ultimas páginas, é lá que geralmente ficam escondidos os erros. Veja se os títulos e descrições não são os mesmos.
Verifique os resultados suspeitos
Pegue alguma query string encontrada nos resultados, por exemplo:
?atributo_valor
Será que essa string vai te causar problema? Cheque o que está indexado (página no cache do Google) para ver se há algum problema.
Mesmo que a versão sem a string apresente um conteúdo diferente, ela pode ter as mesmas meta tags e title. Ou seja, conteúdo duplicado.
Descubra quantas páginas estão duplicadas
Não é muito difícil. Utilize o modelo para fazer uma busca:
site:exemplo.com.br inurl:atributo_valor (exemplo que vimos acima)
Aqui você vai ver exatamente quais páginas duplicadas estão sendo geradas por algum atributo.
Pronto, agora com o problema detectado você pode voltar aos nossos posts sobre conteúdo duplicado que irá encontrar algumas boas soluções para isso.
Até a próxima!
=)
fonte: seogadget
Flávio,
Eu fiz a busca site:nomedosite.com.br e apareceu 232 resultados, depois adicionei &filter=0 no final da URL gerada e foi pra 228, porém ao navegar até a última página dos resultados, o google me mostrou apenas 143 página indexadas, este é o valor real. Ou seja acho que não funciona o lance do &filter=0.
Ou então isto significa conteúdo duplicado como vc explicou neste post ?
Como faz pra matar conteudo duplicado em uma paginação, digo sem usar ajax, o titulo deveria ser diferente como seria as regras pra paginação?
Ola gostaria de saber qual é o problema ,tipo na ferramentas para webmasters ele mostra que todos os meus posts estao duplicados ( 5800 posts) ai ele mostra os links :
/2010/01/baixar-filme-download-legion-legiao.html
/2010/01/baixar-filme-download-legion-legiao.html?pr=5685&site=http://downloadsferoz.com.br/
todos as paginas tem esse trecho ( ?pr=5685&site=http://downloadsferoz.com.br/)
o que seria isso ?e teria como eu bloquear isso usando o robots.txt