![]() |
Библиотека Интернет Индустрии I2R.ru |
||
![]() ![]() |
Rambler ввел в строй новую архитектуру поиска22.09.2003 08:53 Поисковая система Rambler ввела в строй новую версию поисковой машины, которая принципиально отличается от предыдущей по двум основным параметрам. Во-первых, увеличилась скорость поиска; во-вторых, появилась возможность оперативного обновления поискового индекса. Если раньше индексная база обновлялась в среднем раз в месяц, то теперь, благодаря новой архитектуре поисковой системы, обновление может происходить каждый день, и даже несколько раз в день. После изменения механизма работы поисковой машины, в течение двух месяцев последовательно перестраивались все компоненты системы. Вначале был запущен новый индексатор, затем технология автоматической доставки данных на поисковые сервера. В результате с середины июля индекс стал пополняться ежедневно. С момента создания поисковой машины и до недавнего времени индекс состоял из двух больших частей, одна из которых использовалась для поиска, а другая - для формирования цитат и подсветки найденных слов запроса. Копии этих частей размещались соответственно на поисковых и цитирующих серверах. Такая архитектура позволяла поднимать по запросу все имеющиеся данные и проводить поиск и ранжирование, опираясь на полную информацию о документах. Однако обновление индексной базы на всех серверах одновременно было непростой и трудоемкой процедурой. Кроме того, с ростом интернета увеличивался и размер индекса, что приводило к замедлению поиска. Поэтому было принято решение изменить структуру поисковой системы. В новой версии индексная база разбита на восемь частей. Семь из них представляют собой поисковые индексы, каждый из которых построен по седьмой части Рунета. Ежедневно обновляется одна из частей индекса. Таким образом, с момента скачивания страницы роботом до ее появления в поиске проходит от 2 до 8 дней. Восьмая часть индекса представляет собой "быструю базу", построение которой занимает два часа. В быструю базу входят страницы, содержащие счетчик Тор100. Каждый раз, когда в рейтинге Тор100 появляется новая страница, которой еще нет в индексе, она отправляется в очередь на обработку. Перед обработкой страницы фильтруются, из них отбираются наиболее посещаемые. В настоящее время быстрая база обновляется два раза в сутки, однако в ближайшее время планируется обновлять ее чаще. Поиск по всем восьми базам осуществляется параллельно, результаты поиска объединяются. За счет этого поиск происходит в несколько раз быстрее по сравнению с поиском по монолитной индексной базе. Каждая из семи частей основной базы размещена на семи серверах. Такое распределение обеспечивает устойчивость и стабильность работы системы при повышении нагрузки или авариях. В подобных случаях из результатов поиска не пропадают соответствующие части индекса, так как поток запросов динамически перенаправляется на наименее нагруженные машины. последние новости 22.09.2003 12:10 | Вышла новая версия ICQ...» 22.09.2003 12:00 | Qualcomm успешно испытал технологию GSM1x...» 22.09.2003 11:24 | Новое поколение офисного пакета StarOffice...» 22.09.2003 11:05 | Система "Яндекс.Деньги" упростила оплату мобильной связи и телевидения...» 22.09.2003 10:43 | Эпидемия нового червя набирает силу...» 22.09.2003 10:30 | Исправлена дыра в Sendmail...» 22.09.2003 10:08 | При покупке домена потребуется предъявлять паспорта...» 22.09.2003 10:01 | Российский региональный директор MSDN признан лучшим...» 22.09.2003 09:56 | J-Phone предложит "телевизионные" мобильники к концу года...» 22.09.2003 09:36 | Две новые материнские платы MSI для Pentium 4 на чипсете SiS...» 22.09.2003 09:29 | Интернет-пейджер Yahoo! обновляется...» 22.09.2003 09:04 | SCO Group против Red Hat...» 22.09.2003 08:53 | Rambler ввел в строй новую архитектуру поиска...» 22.09.2003 08:31 | Телефон Motorola V60t с цветным экраном...» 22.09.2003 07:50 | Falcom анонсировал новый GPS-приемник...» 22.09.2003 07:46 | Создан первый корпоративный курс для дистанционного обучения сотрудников банков...» 20.09.2003 14:42 | В портрете интернет-пользователя главное - возраст, а не деньги...» 20.09.2003 14:35 | Yahoo!: оплачиваемый поиск окупится сторицей...» 19.09.2003 18:07 | Борцы со спамом стали жертвой спамеров...» 19.09.2003 17:05 | Sonoma, Azalia и другие планы Intel по мобильным устройствам...» |
|
![]() |
![]() |
2000-2008 г. Все авторские права соблюдены. |
![]() |
![]() |
![]() |
![]() |