Библиотека Интернет Индустрии I2R.ru |
|||
|
Елена Колмановская о "быстром" "Яндексе"17.08.2005 15:51 Главный редактор "Яндекса" Елена Колмановская комментирует статью, посвященную запуску "быстрого" робота "Яндекса", индексирующего определенную часть Рунета. Как удалось увеличить скорость индексирования? База быстрого робота — это менее 1% всей базы, поэтому процесс обхода документов и выкладывания может происходить заметно чаще без существенного увеличения нагрузки. Выборка из быстрой базы делается одновременно с выборкой из медленной? Да. В момент запроса метапоиск обращается как к основным поисковым машинам, так и к машинам с базой быстрого робота. Основную базу некорректно называть "медленной", ее обновление происходит каждые 2–3 дня. Пришлось ли ради этого увеличивать серверный парк? Мы добавили десяток серверов к примерно пяти сотням, на которых работал поиск и робот. Насколько возросла нагрузка на сервера? "Быстрая база" расположена на отдельных серверах. Планируется ли в дальнейшем увеличивать скорость? Возможно, но скорость выкладывания не является самоцелью. Работа над быстрым роботом подразумевает: обнаружение актуальных документов; оперативную индексацию и выкладывание; правильное ранжирование. Все три составляющие важны для пользователей. Сейчас в вашей базе находится почти 800 млн документов. Если учесть все факторы, можно сказать примерно, когда ее размер достигнет миллиарда? Когда на главной странице "Яндекса" будет написано "Поиск по 1 000 000 000 документов Рунета". :) И еще — мне кажется, что в этой статье допущена ошибка. А именно — прочтя ее, остаешься под впечатлением, что "Яндекс" априори назначил какие-то сервера актуальными и включил их в быструю базу. На самом деле так не происходит, включение в базу идет постранично и динамично, поэтому состав страниц (и сайтов, с которых они взяты) постоянно обновляется. Материалы по теме: последние новости 22.08.2005 17:11 | Google обновила ПО для поиска...» 20.08.2005 21:26 | Сроки проведения DeArt фестиваля переносятся...» 19.08.2005 22:45 | Кухня Photoshop...» 19.08.2005 20:27 | Опубликованы спецификации RSS 3...» 19.08.2005 20:11 | Рассылка Библиотеки Сайтостроительства стала золотой!...» 19.08.2005 18:51 | Google и заговор масонов...» 19.08.2005 18:17 | Romir определил любимые сайты рунетчиков...» 17.08.2005 21:56 | Обновления третьей версии программы для оптимизации и раскрутки сайтов Semonitor 3.11...» 17.08.2005 19:08 | Google приостановила создание цифровой библиотеки...» 17.08.2005 18:48 | Народное голосование "Премии Рунета" началось...» 17.08.2005 18:28 | Белорусский КГБ охотится за флэш-аниматорами...» 17.08.2005 17:20 | Интернетчики требуют большей персонализации...» 17.08.2005 16:37 | 10 лучших ресурсов по CSS...» 17.08.2005 15:51 | Елена Колмановская о "быстром" "Яндексе"...» 12.08.2005 20:05 | Результаты Google в таблице Excel...» 12.08.2005 19:38 | "Яндекс" индексирует быстрее, но не всех...» 12.08.2005 19:23 | MSN начнет тестировать контекстную рекламу в октябре...» 12.08.2005 17:27 | URLex поможет сделать комментарии...» 11.08.2005 19:41 | Как Рунет кликает по СМИ...» 11.08.2005 18:47 | Opera находит ответы...» |
|
2000-2008 г. Все авторские права соблюдены. |
|