A inserção de arquivos em Flash nos sites é uma pratica comum e bem difundida na Internet de hoje. No entanto animações em Flash não eram devidamente indexadas e muitas vezes informações importantes ficavam de fora do web crawl. No dia 30 de Junho a Google divulgou através dos seus engenheiros de software Ron Adler e Janis Stipins que o Googlebot a partir deste dia passava a ter funções avançadas de indexação de Flash. Abaixo trechos da entrevista destes dois profissionais, realizada neste mesmo dia 30 de Julho:
Que tipo de conteúdo em Flash especificamente o Google indexa melhor agora ?
Nós ampliamos a capacidade de indexação para arquivos SWF de todos os tipos. Isto também inclui “gadgets” tais como botões, menús, sites majoritariamente construidos em flash e tudo neste contexto.
Que tipo de informações o Google indexa melhor a partir destes arquivos ?
Todo o texto que os usuários que os usuários forem capazes de ver e interagir no seu arquivo de Flash. Se o seu site contém trechos em Flash, agora o texto dentro dos seus arquivos em Flash também será usado quando o Google ler e indexar o seu site. Assim como palavras que aparecerem nos seus arquivos em Flash poderam ser usadas como keywords e portanto aproveitadas nas buscas do Google.
E Quanto a conteúdo não textual, do tipo imagens por exemplo ?
No momento só estamos detectando e indexando o texto dos seus arquivos Flash. Se as suas animações conterem imagens, nós ainda não vamos conseguir ler e indexar texto contido dentro destas imagens. Nós também não vamos gerar âncoras a partir de botões em Flash sem texto e que contenham um link. Também não serão indexados videos de Flash tais como arquivos FLV, como os que você vê no YouTube porque geralmente estes videos não contém elementos de texto.
Como o Google “vê” o conteúdo de um arquivo Flash ?
Nós desenvolvemos um algoritmo que explora os arquivos em Flash da mesma maneira que uma pessoa que estivesse os lendo. Nosso algoritmo lê e identifica todo o texto que encontrar no caminho e disponibiliza estes dados para a indexação. Não podemos por hora dar detalhes mais especificos, mas podemos adiantar que a efetividade do nosso algoritmo foi ampliada por que usamos a nova biblioteca Searchable SWF da Adobe.
O que eu preciso para que o Google leia e indexe os textos dos meus arquivos Flash ?
Basicamente você não precisa mexer em nada. As utlimas melhorias do Googlebot que fizemos não vão demander esforço extra dos webdesigners e dos webmasters. Se você tem conteúdo em Flash no seu site, ele automaticamente a partir de hoje passará a ser indexado. Agora, se você preferir que o Google não veja algum conteúdo que é exibido do tipo uma mensagem de “loading” ou algo sem importância, troque este arquivo em Flash por uma imagem, isto tornará este conteúdo invisivel para o crawler.
Quais as limitações técnicas atuais para a indexação em Flash do Google ?
Ainda temos algumas limitações:
- O Googlebot ainda não executa alguns tipos de código JavaScript, logo, caso a sua página utiliza JavaScript para carregar um arquivo Flash há uma boa chance deste conteúdo em flash não ser indexado.
- Nós atualmente também não incluimos conteúdo externo em Flash carregado a partir da sua animação. Se o seu Flash carregar algum conteúdo algum conteúdo externo do tipo um arquivo HTML, XML ou outro Flash quando o usuário interagir com ele estes conteúdos extras não serão indexados. Eles podem sim, ser indexados separadamente se o Googlebot de outra maneira os encontrar, mas não serão dados como parte da página inicial.
- Nós estamos em um estágio que já conseguimos indexar quase todas as linguas encontradas na web e todos os tipo de caracteres, mas no entanto ainda temos dificuldades de indexar arquivos flash escritos com caracteres disitintos de duas linguas diferentes. Enquanto não melhorarmos o algoritmo, se o seu arquivo em Flash tiver caracteres da lingua Hebraica e da lingua Árabe juntos por exemplo, o texto escrito desta maneira ainda não poderá ser indexado.
obrigado pela tradução….
valeu !
…”Nós também não vamos gerar âncoras a partir de botões em Flash sem texto e que contenham um link.”…
Quer dizer que o robô não vai segur um link se ele não foi construído com texto?
Já existe na web algum exemplo de código que o crawler segue? se não, fica uma dica para os próximos posts.
Obrigado!
No fim das contas o Google não fez nenhuma super revelação ou mudança. Já sabíamos que o Google tinha problema com Flash e ele confirmou isso. Tem problema com Flash, consegue indexar algumas coisas muito específicas mas está trabalhando, no caso a Adobe está, para melhorar essa situação.
Mas é isso. O que não for claramente texto o googlebot vai ignorar…
Muito bom o artigo!