Библиотека Интернет Индустрии I2R.ru |
|||
|
"Яндекс" индексирует быстрее, но не всех12.08.2005 19:38 «Яндекс» сообщил о запуске «быстрого» робота, который работает одновременно с основным и предназначен для оперативного обнаружения и индексации актуальных страниц. Новость о запуске быстрого робота появилась 1 августа, но на самом деле он работал уже в конце июля, что наверняка заметили самые внимательные посетители «Яндекса». По словам программиста отдела разработки поисковых сервисов Александра Авдонкина, база быстрого робота обновляется каждые 1,5–2 часа, а время от момента скачивания документа до момента его появления на поиске составляет от 2 до 5 ч. На сегодняшний день база быстрого робота насчитывает около 4 млн документов. Таким образом, быстрый робот создан для обслуживания «элитных» веб-сайтов, которые теперь будут обновляться в индексе гораздо чаще, чем остальные сайты Рунета. Естественно, многих волнует вопрос — как попасть в число этой «элиты»? С этим вопросом мы обратились к главному редактору компании «Яндекс» Елене Колмановской: «Быстрый робот нужен для индексации актуальных документов, наиболее востребованных пользователями. Соответственно, база быстрого робота меняется в зависимости от изменения интересов аудитории. Никаких специальных усилий для попадания в базу быстрого робота предпринимать не требуется и даже невозможно — разве что опубликовать что-то очень интересное». Каким же образом определяется популярность страниц в конкретный момент времени? Как «Яндекс» определяет, что должен индексировать быстрый робот? «Востребованность документа определяется автоматически на основе разных источников информации (пока — четырех). Алгоритм мы, естественно, не публикуем — по тем же причинам, по которым не раскрываем алгоритм релевантности», — говорит Елена Колмановская. При отсутствии официальной информации можно попытаться самостоятельно определить, какими факторами руководствуется алгоритм при определении «элитных» сайтов. Благо, выдача результатов «Яндекса» позволяет определить, какие из сайтов проиндексированы «быстро», а какие — в обычном порядке. Результаты из быстрого робота отличаются наличием поясняющей надписи о том, как давно была проиндексирована последняя версия документа (столько-то часов назад, вчера, позавчера). Среди нормальных результатов такая метка отсутствует. Страницы быстрого робота особенно хорошо заметны при сортировке результатов поиска по дате. Как можно заметить, это, в основном, средства массовой информации и форумы. Материалы по теме: текст: Анатолий Ализар последние новости 31.10.2006 15:43 | Запущен тест Интернет-Аналитика...» 31.10.2006 14:15 | Google отменила ограничение на индексацию страниц с id в URL...» 30.10.2006 21:20 | Adobe Systems представила новые продукты в России...» 30.10.2006 20:27 | Vox - блогосервис нового поколения...» 27.10.2006 20:29 | Web 2.0 служит катализатором в «плавке» Oracle...» 27.10.2006 19:46 | "Нейрон" - сервис сетевых закладок...» 27.10.2006 18:57 | "Планета" в кармане...» 27.10.2006 18:36 | Google признал Украину...» 27.10.2006 18:29 | "Суп" рассказал интернетчикам о судьбе русского LiveJournal...» 27.10.2006 17:29 | Капитализация Google зашкалила...» 26.10.2006 19:04 | Вышла бета-версия инструментария Microsoft Atlas...» 25.10.2006 18:22 | Роботы, которые делают сайты. Новое в сайтостроении...» 25.10.2006 14:38 | Mozilla гордится безопасностью и быстродействием Firefox 2...» 24.10.2006 20:41 | Google предлагает настраиваемый поиск...» 24.10.2006 18:16 | Компания IT-Online и учебный центр Микроинформ провели первый совместный семинар на тему "Поисковая оптимизация и интернет-статистика"...» 24.10.2006 16:28 | Коммуникационная поддержка бизнеса: реклама и pr в сети Интернет...» 23.10.2006 12:40 | MySpace: объединение социальных сетей невозможно...» 22.10.2006 19:28 | Adobe: Internet-приложения без Internet...» 22.10.2006 19:24 | Opera 9.1 проверит сайты на благонадежность...» 21.10.2006 16:06 | Дыра в IE 7 на самом деле содержится вовсе не в браузере...» |
|
2000-2008 г. Все авторские права соблюдены. |
|