Como eu disse no meu post sobre como aumentar visitas do site, uma das razões para um site não receber muitas visitas é o problema de conteúdo duplicado.
No post Evitando Conteúdo Duplicado do Heron aqui no Agência Mestre, ele indica o uso do robots.txt para evitar conteúdo duplicado. Para blogs, o uso do robots.txt é praticamente vital, pois um mesmo post pode ser encontrado em diversos locais, como a página inicial, a página de posts do autor e a página de categoria de posts.
Com o mesmo texto aparecendo em tantos lugares diferentes, acredite, é bastante conteúdo duplicado. O problema disso, como o Heron também comentou, é que o google (ou yahoo, msn, etc) vai ter que decidir qual dessas versões de conteúdo mostrar nas suas páginas de resposta. O ideal, para blogs, seria mostrar a página do post em si, e não a página de categoria ou outras.
Mas o que realmente pode derrubar o site em relação a conteúdo duplicado é quando a mesma informação pode ser encontrada por 2 URLs diferentes e existem links para ambas páginas. Ou seja, o poder de o seu site aparecer para o assunto dessas páginas fica dividido por 2, pois as 2 páginas serão cadidatas a aparecer e estarão concorrendo uma com a outra, mas qual a melhor? Com certeza a versão do seu concorrente que estiver melhor estruturado.
Como Identificar Conteúdo Duplicado?
Os lugares mais críticos onde você pode encontrar conteúdo duplicado são o título (tag <title>) das páginas do site, meta description e o conteúdo (texto) em si.
A identificação realmente é um processo manual. Para identificar meta description repetidas, o Google Webmaster Tools pode te dar uma mão. Ele possui uma seção que indica as meta description duplicadas, se houver, e ainda outras dicas como meta description muito curta ou muito longa.
A identificação de conteúdo duplicado para textos já é mais fácil, basta copiar uma frase longa do texto que você deseja verificar e procurar por esta frase no google, escrevendo a frase entre àspas no campo de busca. Por exemplo, confira esta busca no google. O resultado dela é único, o meu post sobre como aumentar as visitas de um site.
Agora, tente a busca “Este barraco aconteceu um pouco antes do programa ao vivo de terça feira, dia 4 de Março.”. Um exemplo de conteúdo duplicado entre sites. O mesmo texto (e vídeo) no youtube e no avmaroc.
Para garantir, teste com mais de uma frase.
Como Corrigir Conteúdo Duplicado?
Certo, você identificou, como corrigir então? Para título ou meta description basta alterá-las, fazendo com que cada página tenha título exclusivo e meta description única.
Para conteúdo texto, quando identificado o problema, deve-se fazer o redirecionamento 301 para a melhor versão de tal conteúdo.
Se cont-dup1.html fala sobre conteúdo duplicado e cont-dup2.html tem o mesmo texto, então você faz o redirecionamento 301 (permanente) de uma para a outra, digamos, de 1 para 2.
Agora os bots de busca sabem exatamente o que mostrar nas suas páginas quando o internauta faz uma busca e você tem a resposta.
Para conteúdo duplicado entre sites, o melhor a fazer é entrar em contato com o webmaster que copiou o conteúdo. Tente pedir para que ao invés de copiar, ele referencie o seu site, mesmo que seja com um nofollow.
Fiquem sempre de olho. Às vezes, a falta de atenção é que não permite um rankeamento melhor nas buscas orgânicas. Às vezes, pode ser alguém que está te prejudicando por copiar o seu conteúdo.
Confiram o tutorial de SEO da Agência Mestre para aprender tudo sobre SEO e também o glossário de SEO e SEM para ficar por dentro do vocabulário usado no mundo das buscas.
Até a próxima!
Marcel.
Tenho a maior bronca de sites que duplicam meu conteúdo, e quando encontro algum tento de todas as formas que removam o excesso (um parágrafo de citação, com o respectivo link, é tudo o que eu espero).
Contudo já fui bastante criticado por essa minha atitude, muita gente diz que não há com o que se preocupar, pois se eu escrevi o conteúdo primeiro, os buscadores saberão disso e darão a relevância pra mim. Eu me recuso a acreditar nisso, mas gostaria de saber sua opinião.
A propósito, está faltando um “subscribe to comments” aqui, fica difícil de acompanhar eventuais discussões que surjam nos comentários do seu blog sem ele.
Olá pessoal, primeiramente parabens pelo conteúdo! Conheci a pouco tempo o blog e já esta nos meus RSS favoritos.
Lendo este artigo dicidi perguntar sobre uma solução para redirecionamento:
Atualmente em meu blog eu utilizo DOMINIO.COM/%POSTNAME na estrututa de permalink. Ou seja, sem o .HTML ou .HTM no final de cada title post.
Se eu seter no meu POST SLUG o título com .HTML ou .HTM no final, quem tentar acessar o post vai ler página não encontrada.
Gostaria de fazer com que o htaccess considerasse o .HTML ou .HTM no final. Ou seja:
DOMUNIO.COM/TITULO-DO-POST
DOMUNIO.COM/TITULO-DO-POST.HTM
DOMUNIO.COM/TITULO-DO-POST.HTML
Os três fossem lidos corretamente.
Obrigado
E aí Janio!
A princípio, é isso mesmo. Você publicou primeiro, é seu. Mas se o conteúdo copiado receber mais links que você, a situação pode inverter e você pode perder o ranking.
O melhor é fazer o que você disse. Entrar em contato e pedir para que você seja referenciado, não tenha dúvidas.
Abraços!
ps.: agora você pode receber comentários por email, além de assinar o feed de comentários!
Thalis, confira nosso post sobre Redirecionamento 301, lá você vai encontrar a resposta para o seu problema! =)
Mas cuidado, não deixe com que todas as formas sejam acessíveis, escolha uma e redirecione as outras permanentemente – redirecionamento 301.
Se eu tiver duas páginas iguais e uma delas conter o redirect 301, o Google vai ler e indexar o conteúdo deta página ou ele desconsidera tudo e vai direto para a página redirecionada?
OBS: Que bom que colocaram a notificação por email, parabéns !
Olá Demétrio!
Em casos de redirecionamento 301 o google vai direto para a página de destino mesmo, como é um código de cabeçalho, ele nem chega a avaliar o que está no conteúdo.
É como você ir à uma loja que mudou de endereço e deixou um aviso sobre a mudança na porta. Você não entra na loja do endereço antigo pra ver se tem alguma coisa dentro. Você já vai logo pra loja nova que é o que interessa!
Entendi. No meu caso eu coloquei o redirect 301 entre as tags , no final da página, ou seja, primeiro o buscador lê o conteúdo e depois o redirect 301. Esta correto? O Google indexa alguma coisa? Sou penalizado por isso?
Valeu!
Como fica a página index(wordpress) onde é listado certa de 1/4 do conteúdo de cada post ?
Pelo que eu sei o Google não indexa mesmo não. Ele vai direto para a outra página.
Mas não troque o certo pelo incerto! Coloque o código no começo da página.
Assim, com certeza está certo.
Abraços!
Fabrício, a index tem o link para o post, funcionaria como se estivesse referenciando o dono do conteúdo.
Mas além disso, acredita-se que blogs tenham um tratamento especial em relação a isso.
O fato é que não há razão para ficar preocupado, existem centenas de milhares de blogs na internet e eles rankeam bem mesmo assim.
Fabrício, o ponto é que você coloca apenas uma parte de cada artigo na index. Assim, não é caracterizado conteúdo duplicado, mas sim um tipo de “quote”.
Abraços
Tenho uma dúvida sobre a ferramenta do google webmasters:
A meta tag de “confirmação de propriedade do site” deve ser inserida apenas na página home ou é necessário incluir em todas as páginas para que o google webmasters colha dados de todo o site?
Olá,
Você deve fazer apenas na home mesmo. Daí o Google reconhece.
Tipo eu quero evitar o conteudo duplicado pelo robots, só q no blogger. Como? dá pra upar um robot pro blogspot?
Rafael, você tem certeza que está tendo problemas com conteúdo duplicado no blogger? Ele possui um robots padrão nativo, acesse seublog.blogspot.com/robots.txt e você verá. Ele bloqueia todas as tags e buscas.
Acredito que somente se você criar 2 posts iguais você terá problemas com conteúdo duplicado no blogger.
Se ficou alguma dúvida, continue comentando!
Abraços!
Opa vlw Frank vou seguir suas dicas
Opa Frank,
Estou com problemas de títulos duplicados no meu blog. Todo o problema começou após a instalação do plugin permalink migration. Antes não tinha ocorrência de nenhum título duplicado, mas após 3 dias de instalação do plugin já estou com mais de 400 títulos duplicados.
Desativei o plugin assim que percebi o problema e mudei o robots.txt mas mesmo com essas mudanças os problemas persistem.
Gostaria de saber o que mais posso fazer para acabar com esse problema de títulos duplicados.
Exemplo:
http://www.birajones.com/2008/07/25/a-primeira-vez-do-bira/
http://www.birajones.com/a-primeira-vez-do-bira/
Abraços.
E aí Bira.. Você aprontou bastante hein!? hehehehe
Primeiro, você poderia verificar se esse plugin faz o redirecionamento 301, para evitar esse tipo de problema com conteúdo duplicado.
Agora que você já abandonou o plugin, você pode aguardar que as páginas duplicadas “desapareçam” naturalmente – que eu acho que seja o caso mesmo, já que as URLs sem data, redirecionam permanentemente (301) para as URLs com data – ou tentar a ferramenta de remoção de URL, que, se não me engano, está disponível no Google Webmasters Tools, mas não acho isso necessário.
Abraços!
Também estou com problemas de de meta descrições e títulos duplicados, e o meu blog é hospedado no Blogger.com veja:
http://img98.imageshack.us/img98/1679/metasdescrioesduplicadaxl0.jpg
http://img152.imageshack.us/img152/1768/titulosduplicadosma2.jpg
O blog estava com quase 8 mil páginas indexadas agora diminuiu para pouco mais de 2 mil, acredito que este seja o problema.
Como faço para resolver?
E aí Edu!
Se for este mesmo o problema, você deve restringir no template do blogger para que meta tags somente sejam mostrados na página inicial, caso contrário vai se repetir por todos os posts mesmo.
O melhor, no caso do Blogger, é não usar mesmo. Eu tenho um blog por lá também e não defini meta informações pq não será útil, vai mais atrapalhar do que ajudar.
No caso do título, pq vc tem títulos repetidos? era só definir títulos diferentes para cada post! O que mais do que recomendado – é uma Regra!
Mas cada post tem de fato um título diferente uai! o problema como você pode ver nas imagens é que parece que Google está indexando páginas de comentários, e as de arquivo como uma URL diferente, ou algo parecido com isto , porque não entendo muito bem o está acontecendo e por isso cheguei até aqui para conseguir alguma ajuda
Olá, ótimo post Frank.
Este post já foi criado a algum tempo então não sei se alguém ainda pode tirar minha dúvida.
Mas gostaria de saber como faço para não permitir que utilizem o “index.php” para abrir a página inicial do meu site, ficando somente o domínio.
Atualmente estou utilizando o código PHP abaixo, mas não se ele é adequado para o SEO.
if($_SERVER[“REQUEST_URI”] == “/index.php”){
header (‘Location: http://‘.$_SERVER[“SERVER_NAME”]);
}
Também já utilizo o código abaixo no .htaccess para arrumar URLs sem “www”.
RewriteCond %{HTTP_HOST} !^www.meu-dominio.com$ [NC]
RewriteRule ^(.*)$ http://www.meu-dominio.com/$1 [R=301,L]
Olá Paulo, você está passando perto aí nos códigos. O Fábio Ricotta escreveu um artigo aqui na Agência Mestre sobre redirecionamento 301 e por lá você encontra os códigos corretos para a solução desses casos.
Abraços!
Olá,
No meu estou com problema de “Titulos Duplicados”.
Creio que por causa de edição de titulos, apos a varedura dos robot.
Sendo que o titulo antigo está com redirecionamento 301, para o titulo seguinte, espero atualizar ou é outra forma para se resolver?
Se as páginas com títulos duplicados estão redirecionadas para páginas com títulos únicos e não há nenhuma outra forma de página com título duplicado, então a questão é esperar realmente.
OLá amigos
Estou com um problema
estou fazendo a transferencia de um blog do blogger para o wordpress mais a minha intenção não é deletar o blogger por enquanto pois quero colocar um redirecionador nele depois que o wp tiver tudo certo.
bom eu importei as postagens
e para não ser punido estarei mundando as datas das postagens de todas.
minha dúvida
Será que somente mudar as datas eu ja me livro da punição ou tenho que mudar os titulos tambem?
Só mudar datas e títulos não resolve, pois o conteúdo em si continuará duplicado. É melhor fazer o contrário – troque os conteúdos e pode manter títulos e datas iguais (brincadeira).
Enquanto houver conteúdo duplicado, conteúdo duplicado será – disso não tem como fugir.
Quando eu troquei meu blogger por domínio próprio e wordpress, eu permiti em um primeiro momento o conteúdo duplicado. O que eu fiz na sequência foi substituir os posts no blogger por resumos dos textos com links para o respectivo post no wordpress.
Em um terceiro momento, coloquei o redirecionamento por meta-refresh e utilizei a meta tag robots com valor noindex.
Resultado: o Google entendeu que o wordpress estava substituindo o blogger.
Hoje, eu utilizaria a cross-domain canonical tag. Muito mais simples.
Estava lendo esse artigo: A identificação de conteúdo duplicado para textos já é mais fácil, basta copiar uma frase longa do texto que você deseja verificar e procurar por esta frase no google, escrevendo a frase entre àspas no campo de busca. Por exemplo, confira esta busca no google. O resultado dela é único, o meu post sobre como aumentar as visitas de um site. Cliquei no link que vcs citaram e tem enumeras cópias. No caso vcs aparecem em primeiro e depois lá embaixo também. Não afeta nos resultados? é só uma curiosidade, pois quando fizeram esse post pelo visto não tinha essa duplicação. abçs
Celi, é um caso bem chato quando outros sites copiam conteúdo, mas uma vez que o Google tenha reconhecido o original e lhe atribuido os devidos rankings, o conteúdo duplicado afeta o resultados das cópias somente. O problema acontece quando o Google erra a mira e acaba dando um ranking melhor para o site que copiou conteúdo.
Na época do post realmente ele era o único resultado para a busca indicada.
tenho uma dúvida e preciso de ajuda, na configuração do plugin yoast seo aparece a seguinte mensagem:
“A palavra-chave foco não aparece na URL para esta página. Se você decidir mudar o nome do URL não deixe de verificar o URL antigo 301 redireciona para o novo!”
Mas a palavra chave estar corretamente na url, é page rank 8, gostaria de saber se isso é erro do plugin e se interfere nos resultados de busca se preciso resolver ou não.