Индексация флэша поисковыми системами -- новости и баяны по теме.

Tags:

В один прекрасный момент Адоб всерьез озаботились видимостью флэш-контента для поисковиков. Они вступили в тайный сговор с Гуглом и Яху и сделали удивительную хрень -- флэш-плеер для поискового бота.

Отныне поисковый бот (пока только гугловский) может запускать на выполнение swf-файл, имитировать действия пользователя (нажимать на кнопки) и считывать весь контент, который таким образом может быть обнаружен. В том числе и тот контент, который непосредственно в swf-файле не присутствует, а загружается им из внешних источников.

Не стесняясь в пафосе (и не без оснований) Адоб заявляет, что это начало большого прорыва в индексации контента любых RIA-приложений, независимо от технологий, на которых они были созданы. Интересно, как быстро Микрософт сделает свои Silverlight приложения видимыми хотя бы для собственной поисковой системы.

Что говорит Гугл

30 июня 2008 года (давно это было, а мы тут ничего и не знаем) Гугл в своем Webmaster Central Blog опубликовал статью Improved Flash indexing, где рассказал о том, как он индексирует флэш-контент.

We've developed an algorithm that explores Flash files in the same way that a person would, by clicking buttons, entering input, and so on. Our algorithm remembers all of the text that it encounters along the way, and that content is then available to be indexed. We can't tell you all of the proprietary details, but we can tell you that the algorithm's effectiveness was improved by utilizing Adobe's new Searchable SWF library.

Нужно отметить некоторые значимые детали:

  1. Индексируется только текстовый контент. Графика, видео и т.д. не индексируются, но это планируется;
  2. Гугл бот не выполняет JavaScript, поэтому если swf-файл подключен средствами JavaScript, то бот его не увидит; Это не касается SWFObject и SWFObject2 -- их гугл-бот понимает;
  3. Если флэш-контент дублируется в html (как рекомендует Адоб), то бот видит это дублирование контента, но не снижает рейтинг за это;

Не Гуглом единым

Ну то Гугл, а что остальные поисковики? Яху тож активно сотрудничает с Адобом в этом направлении, так что и он будет индексировать флэшки. Но пока этого нет.

А как скоро такое смогут поддерживать национальные поисковики, типа Яндекс? Об этом ничего не говорится, но здравый смысл подсказывает, что не скоро.

Но это и не важно. Потому что контент все равно можно сделать видимым для всех поисковиков ценой его дублирования в html. Это настолько очевидная вещь, что приходит в голову любому, кто задумывается об индексации флэш-контента.

Рекомендации Адоб по SEO флэш-контента

Итак, Адоб завел целый раздел на своем сайте, посвященный SEO. Пока там не густо информации, но пища для размышлений и руководство к действию есть.

В основном тема раскрыта в статье Damien Bianchi Search optimization techniques for RIAs. Статья довольно большая и многословная. Но специально для тех, кому лень все это читать, есть ее краткий вариант Search optimization checklist for RIAs, где включены только существенные моменты.

С технической стороны методика, предлагаемая Адобом, мало отличается от того, что предлагал я сам. Но там есть ряд других важных моментов, помимо собственно технической реализации. И, что немаловажно, есть примеры крупных интернет-ресурсов, которые уже сейчас используют эту технику.

Еще в этом разделе есть FAQ, небольшой рассказ об SWFObject и еще одна невнятная статья. В общем неплохо.

Flash SEO существует

Где-то месяц назад, еще до того, как я узнал обо всем вышеизложенном, я наткнулся на amazone.com на книгу Search Engine Optimization for Flash.

Я был поражен -- оказывается об этом уже и книги пишут! Я купил ее вместе с парой других книг, и сейчас она уже у меня в руках. Там внутри 240 страниц, из которых первые 60, это что-то вроде SEO для чайников (как раз для меня), а остальные посвящены именно флэшу и флексу. Написано там всякого-разного побольше, чем у Адоба. Но я еще не прочитал ее, так что рассказать пока не могу :)

Ну что ж, все это весьма кстати. Уже в ближайшем будущем я начну испытывать все это на собственном сайте.

Add new comment

Filtered HTML

  • Web page addresses and e-mail addresses turn into links automatically.
  • Allowed HTML tags: <a> <em> <strong> <cite> <blockquote> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Lines and paragraphs break automatically.

Plain text

  • No HTML tags allowed.
  • Web page addresses and e-mail addresses turn into links automatically.
  • Lines and paragraphs break automatically.
CAPTCHA
question for bots )
Image CAPTCHA
Enter the characters shown in the image.