Библиотека Интернет Индустрии I2R.ru |
|||
|
Яндекс индексирует Flash30.09.2004 13:39 Яндекс с небольшим отрывом по времени от Google объявил, что научился индексировать содержимое flash-страниц. Москва, 29 сентября 2004. Яндекс научился индексировать документы, созданные по технологии Macromedia Flash (*.swf). Уже сейчас в базе Яндекса десятки тысяч flash-страниц, содержащих текст, и сотни тысяч страниц, содержащих ссылки. В результах поиска такие документы перед заголовком имеют пометку "flash)". По ссылке "Сохраненная копия" можно посмотреть текстовое представление документа, которое, конечно, не сохраняет красоту флэша, но позволяет узнать содержание даже тем пользователям, у которых не установлен соответствующий плагин. — Macromedia Flash — современный мультимедийный формат информации, позволяющий сочетать текст, графику и звук. — говорит Александр Садовский, менеджер поисковых проектов. — Все большее число сайтов строятся на технологии Flash, не дублируя содержимое в виде HTML-страниц. Добавление нового формата позволит нам увеличить полноту поисковой базы. Кроме стандартного HTML, Яндекс понимает такие форматы, как PDF, DOC, RTF, а теперь и Flash. Задавая запрос со страницы расширенного поиска, можно ограничить поиск только документами нужного формата. Источник: Компания Яндекс объявила сегодня о том, что одноименная поисковая система теперь умеет индексировать документы в формате Macromedia Flash и уже проиндексировано десятки тысяч страниц, содержащих текст, и сотни тысяч страниц со ссылками в этом формате. Такие страницы помечаются значком "flash" перед заголовком страницы в результатах поиска. "Macromedia Flash - современный мультимедийный формат информации, позволяющий сочетать текст, графику и звук. - отметил Александр Садовский, менеджер поисковых проектов компании - Все большее число сайтов строятся на технологии Flash, не дублируя содержимое в виде HTML-страниц. Поскольку мы хотим предложить пользователям как можно более полную базу поиска, мы решили, что пришло время индексировать Flash". Напомним, что первой из рунетовских поисковых систем понимать формат файлов Flash научилась поисковая система Рамблер, однако при этом она ограничилась индексацией ссылок в файлах, обходя наиболее часто встречающуюся проблему для индексации в виде навигации по сайту, выполненной в этом формате. Мы обратились за комментариями к специалистам компании Яндекс - Илье Сегаловичу, Елене Колмановской и Александру Садовскому: - Насколько оправданна индексация Flash - иначе говоря, какое количество уникального контента оказалось доступным благодаря нововведению? Не секрет, что большинство веб-сайтов дублируют содержание Flash-версии в обычном HTML, в том числе и для улучшения индексации поисковыми системами. Индексация Flash - это не эпохальное событие, а просто еще один шаг в сторону полноты базы поиска. До сих пор многие владельцы Flash-сайтов дублировали их содержание в HTML именно потому, что поисковые роботы на флэше "не читали". Теперь веб-мастера могут выбирать основу для построения сайта, думая об удобстве пользователя, а не о том, будет ли он находиться в Яндексе. Теперь будет! Как сказал Илья Сегалович: "Когда сайтом месяца стал сайт Джоан Роулинг (jkrowling.com), выполненный полностью на флеше и содержащий огромную массу интересного и уникального материала, не повторяющегося в виде HTML, стало понятно, что индексации flash не избежать :-)". - При разборе страницы в обычном HTML у индексатора есть определенные правила обработки отдельных элементов страниц - т.е. заголовку страницы придается одно значение, тексту ссылки другое и т.д. А как индексируется содержание Flash, анализируется ли там структура текста? У индексатора есть определенные правила и при работе с Flash, но технические подробности рассказывать не хотим - это не очень интересно, да и провоцировать флэшовый спам не хочется. - Если робот Яндекса попадает на сайт, где автоматически определяется наличие flash-плагина в браузере и в зависимости от этого происходит редирект на соответствующую версию сайта - на какую версию сайта он попадает теперь? Робот Яндекса не представляется как браузер, имеющий плагин. Поэтому попадать будет туда же, куда и теперь. Но если есть хотя бы одна ссылка на чистую flash-версию, без редиректов, то и она попадет в индекс. - Чему Яндекс доверяет больше при прочих равных условиях - HTML или Flash? Формат не влияет на ранжирования - это верно не только для flash, но и для doc, pdf, txt. При ранжировании мы учитываем извлеченный роботом текст и особенности оформления, а не способ представления данных, каковым, по сути, формат и является. - Какие еще форматы данных на очереди на индексирование? Нет ли планов начать индексацию RSS - тем более, что опыт такой есть? Сергей, ну Вы же нас знаете - по традиции мы планов не раскрываем... последние новости 02.02.2007 20:40 | Adobe Labs Flash Media Encoder - трансляция видеоматериалов в режиме реального времени...» 02.02.2007 14:40 | Девять советов для предпринимателей в Веб 2.0...» 30.01.2007 17:01 | Code Contest - конкурсное программирование...» 29.01.2007 19:25 | РА "Артон" проводит практический семинар "Эффективная реклама в Интернете"...» 25.01.2007 18:58 | Adobe передает PDF в организацию по стандартизации...» 25.01.2007 16:35 | Сисадмины и юзеры вновь стали героями сборника курьезных историй...» 23.01.2007 20:04 | IBM впрыскивает в Lotus дозу Web 2.0...» 23.01.2007 19:47 | Сайт Софт@Mail.Ru предоставил рейтинг самых популярных программ 2006 года...» 23.01.2007 17:18 | 16 февраля - бесплатный семинар по анализу, продвижению и управлению ресурсом...» 22.01.2007 20:29 | Пользователи недовольны платежной системой Google Checkout...» 22.01.2007 19:31 | Firefox «ворует» идеи у Opera, Opera «ворует» идеи у Firefox...» 21.01.2007 15:46 | Первая конференция веб-разработчиков состоится в апреле...» 19.01.2007 19:27 | «Яндекс» оживил слоган шестилетней давности. У «Яндекса» лучший слоган 2006 года?...» 18.01.2007 16:15 | Adobe выпустила Flash Player 9 для Linux...» 17.01.2007 13:17 | Web 2.0 и тэговый спам...» 15.01.2007 15:34 | Corel поддержит и ODF, и Open XML...» 11.01.2007 17:22 | Контекстная реклама в AdWords становится слишком дорогой...» 10.01.2007 15:34 | Semonitor 3.5 расширяет возможности...» 05.01.2007 20:45 | Web 2.0 и тэговый спам...» 02.01.2007 17:20 | Оптимизация блога: аккуратный метод...» |
|
2000-2008 г. Все авторские права соблюдены. |
|