Библиотека Интернет Индустрии I2R.ru |
|||
|
"Яндекс" индексирует быстрее, но не всех12.08.2005 19:38 «Яндекс» сообщил о запуске «быстрого» робота, который работает одновременно с основным и предназначен для оперативного обнаружения и индексации актуальных страниц. Новость о запуске быстрого робота появилась 1 августа, но на самом деле он работал уже в конце июля, что наверняка заметили самые внимательные посетители «Яндекса». По словам программиста отдела разработки поисковых сервисов Александра Авдонкина, база быстрого робота обновляется каждые 1,5–2 часа, а время от момента скачивания документа до момента его появления на поиске составляет от 2 до 5 ч. На сегодняшний день база быстрого робота насчитывает около 4 млн документов. Таким образом, быстрый робот создан для обслуживания «элитных» веб-сайтов, которые теперь будут обновляться в индексе гораздо чаще, чем остальные сайты Рунета. Естественно, многих волнует вопрос — как попасть в число этой «элиты»? С этим вопросом мы обратились к главному редактору компании «Яндекс» Елене Колмановской: «Быстрый робот нужен для индексации актуальных документов, наиболее востребованных пользователями. Соответственно, база быстрого робота меняется в зависимости от изменения интересов аудитории. Никаких специальных усилий для попадания в базу быстрого робота предпринимать не требуется и даже невозможно — разве что опубликовать что-то очень интересное». Каким же образом определяется популярность страниц в конкретный момент времени? Как «Яндекс» определяет, что должен индексировать быстрый робот? «Востребованность документа определяется автоматически на основе разных источников информации (пока — четырех). Алгоритм мы, естественно, не публикуем — по тем же причинам, по которым не раскрываем алгоритм релевантности», — говорит Елена Колмановская. При отсутствии официальной информации можно попытаться самостоятельно определить, какими факторами руководствуется алгоритм при определении «элитных» сайтов. Благо, выдача результатов «Яндекса» позволяет определить, какие из сайтов проиндексированы «быстро», а какие — в обычном порядке. Результаты из быстрого робота отличаются наличием поясняющей надписи о том, как давно была проиндексирована последняя версия документа (столько-то часов назад, вчера, позавчера). Среди нормальных результатов такая метка отсутствует. Страницы быстрого робота особенно хорошо заметны при сортировке результатов поиска по дате. Как можно заметить, это, в основном, средства массовой информации и форумы. Материалы по теме: текст: Анатолий Ализар последние новости 19.08.2006 17:31 | Как выбрать компанию для продвижения сайта в Интернет...» 19.08.2006 17:23 | Сайты Рунета не попали в список "крутых"...» 16.08.2006 20:18 | Google предупреждает об "опасных" сайтах...» 16.08.2006 19:42 | Компания Google приглашает...» 16.08.2006 19:29 | Стандарт векторной графики для мобильных устройств...» 16.08.2006 19:07 | Рассылка, зачем она нужна и как ее организовать?...» 16.08.2006 14:45 | Google запрещает «гуглить»...» 16.08.2006 14:04 | Рекламодатели требуют от сайтов улучшить отчетность ...» 16.08.2006 13:56 | Зачем ИТ-директору знать Web 2.0? ...» 16.08.2006 08:49 | Три цвета...» 15.08.2006 17:54 | Существуют ли понятия хорошего и плохого дизайна?...» 14.08.2006 20:28 | Порносайт угрожает свободе в Сети?...» 14.08.2006 13:25 | Фотосъемка: создан алгоритм от дрожащих рук ...» 13.08.2006 20:37 | Сеть Google Wi-Fi: первые впечатления...» 12.08.2006 20:33 | Gtalk научился отправлять голосовые сообщения и делиться файлами...» 10.08.2006 19:00 | Цифровая фотография на отдыхе. Полноцветное издание...» 10.08.2006 18:18 | Посетители расскажут о себе ссылками на любимые сайты...» 10.08.2006 17:54 | Google Maps сохраняет карты...» 10.08.2006 17:24 | Google раскрыл мошенничество аналитиков...» 09.08.2006 22:58 | Рисуем и сканируем - "Русский дизайн"...» |
|
2000-2008 г. Все авторские права соблюдены. |
|