Conteúdo duplicado é algo muito comum e que muitas vezes é gerado devido a erros simples dos webmasters e profissionais de SEO. Claro existem também espertalhões que propositalmente copiam conteúdo alheio e publicam como se fosse próprio, mas esse não é o caso, nesse artigo falarei um pouco de sobre como evitar a geração de conteúdo duplicado por você mesmo, dentro do seu próprio site e de maneira não proposital.
Alguns casos em que conteúdo duplicado acidental é gerado:
- Problemas com canonização de páginas, tais como a existência e possibilidade de uso da URL com e sem o www sem redirecionamento
- Páginas com title tags e meta description idênticas, fato que além de poder ser interpretado como conteúdo duplicado também pode gerar competição desnecessária entre páginas de conteúdo diferente.
- Home page não canonizada ( exemplo.: www.seusite.com.br e www.seusite.com.br/index.php )
- Desconhecimento por parte dos desenvolvedores de sites do fato que as URLs são case sensitive ( as maiúsculas e minúsculas são levadas em conta ). As URLs, www.seusite.com.br/Carros e www.seusite.com.br/carros por exemplo embora referenciem a mesma página e sejam de um certo modo a mesma URL, para o crawler são URLs diferentes por temos “C” minúsculo e maiúsculo.
O Google vem se esforçando para desenvolver o algoritmo do Googlebot de modo que ele identifique as páginas duplicadas e indexe as páginas certas dentro do seu site, mas no entanto, sempre é bom evitar o conteúdo duplicado porque podem ocorrer os seguintes casos:
- A taxa de web crawl pode cair, o Googlebot pode perder tempo identificando ou até indexando páginas erradas e pular as páginas que deveriam realmente ser lidas.
- O Googlebot pode errar e dar uma página pior como a página oficial e a página correta como conteúdo duplicado.
Ferramentas úteis para detectar conteúdo duplicado
Existem algumas boas ferramentas gratuitas, que podem ajudar a identificar se o seu site tem conteúdo duplicado:
1. Duplicate content tool: Tool gratuita bastando se cadastrar e usar. Com ela é possivel determinar:
- A existencia de versões com www e sem www da sua Página
- Verificar o cache do Google
- Verificar o nível de similaridade entre as páginas do seu site
- Checagem da dispersão do Pagerank ( se versões com www e sem www das suas páginas caso existam contém diferentes PRs )
2. Xenu: Verifica o seu site e retorna uma tabela contendo todas as URLs disponíveis no seu site, tudo o que você tem que fazer é verificar as meta tags e ver se elas não estão duplicadas.
3. Google Webmaster Tools: Também pode ser usado para encontrar e identificar meta tags duplicadas.
O que é uma homepage “canonizada”? Homepages evangélicas podem ser canonizadas? ;o)
Falando sério: sempre tive essa dúvida. No sitemap, por exemplo, qual URL devo listar? http://www.meusite.com ou http://www.meusite.com/index.php?
Dica muito boa, melhor ainda a ferramenta de Duplicate.
Olá Leonardo Antoniolli bom dia
Dizer que uma URL do seu site está canonizada significa dizer que só exisite uma URL válida para aquela determinada página, ou seja, não é possivel por exemplo acessar esta página usando http://www.meusite.com ou http://www.meusite.com/index.php, apenas usando um dos dois modos.
Recomendamos que você utilize sempre a forma http://www.meusite.com.br no seu sitemap por se tratar de uma forma mais simples, prática e funcional.
Olá Luis, tudo bem?
Bem legal a matéria. Sempre to aqui no MestreSeo aprendendo!
Ainda não achei o vídeo do “mindubim”… hehehe
Seguinte, meu site tá com esse problema de home “não-canonizada”, mesmo já tendo colocado recentemente no sitemap só a url ” http://www.meusite.com.br “. Será que o Google vai excluir a URL “http://www.meusite.com/index.php” com o tempo, ou existe outra forma de canonizar a home?
Um abraço e obrigado!
E aí Carlos! O mindubim vai virar folclore hehehehe
Você já viu algum destes nossos posts:
Redicionamento 301
Canonizaçao de URLs
eles explicam outros detalhes para a canonizaçao de URLs.
Abraços!
Olá Frank,
Outra dúvida.
Digamos que possuo um conteúdo duplicado em:
http://www.site.com.br/exemplo.html
Ele caiu no filtro do google, passado alguns meses eu modifico o conteúdo para um original e ele passa a ter um conteúdo único.
Há chances desse caso o google indexar a página? ou terei que aplicar um novo nome para que a página seja adicionada pelo robo do google?
Agradeço
Você consegue que ela seja indexada na URL antiga sim. Basta conseguir novos links. Quando o Google descobrir o novo conteúdo, ele atualiza o seu índice.
Cara gostei deste artigo muito bom cheguei aqui atravez do google com a seguinte pergunta:evitar conteudo duplicado em index e page do wordpress, minha real duvida era a seguinte:
No google webmaster tenho meta descrição duplicada heim index e page2 e por ai vai como consigo mudar a descriçâo da page2, instalei esses plugins de seo, com eles consigo mudar descrições nas categorias, tags, post em tudo mas este esquema de mudar na page2, page3 eu não consigo. Sera que você tem uma dica para me passar?