Библиотека Интернет Индустрии I2R.ru |
|||
|
Google DanceФил Крэвин - Webworkshop Что такое Google Dance? Примерно раз в месяц Google обновляет свой индекс путем пересчета PageRank каждой страницы. Период, в течение которого происходит обновление, называют Google Dance. В связи с особенностями строения PageRank, расчеты необходимо производить около 40 раз, а так как индекс очень большой, требуется несколько дней для того, чтобы завершить расчеты. В течение этого периода результаты поиска изменчивы; иногда изменения происходят каждую минуту. Именно из-за этих колебаний был введен термин Google Dance. Обычно Google "танцует" где-то в последней трети каждого месяца. У Google есть еще два сервера, которые можно использовать для поиска. Результаты поиска по этим серверам также изменяются во время ежемесячного обновления, и они тоже являются частью танца Google. В остальное время в результатах поиска тоже иногда бывают колебания, но не путайте их с настоящим танцем. Эти изменения происходят в связи с "добавочным танцем" (Fresh Crawl) Google и тем, что известно как "Everflux" ("Вечное движение"). На период проверки новых рейтингов во время танца, у Google есть два других поисковых сервера, кроме www.google.com. Это www2.google.com и www3.google.com. Большую часть времени результаты на всех трех серверах одинаковы, но во время танца они отличаются. В течение большей части танца, рейтинги, показываемые на www2 и www3, - это новые рейтинги, которые перейдут на www, когда танец закончится. Несмотря на то, что расчеты проводятся около 40 раз, окончательные рейтинги можно будет увидеть уже скоро. Причина в том, что во время нескольких первых циклов цифры приближаются к окончательным данным. Это можно увидеть в калькуляторе PageRank, проверив ячейку данных и произведя некоторые расчеты. После нескольких первых циклов результаты поиска на www2 и www3 могут все еще отличаться, но незначительно. Во время танца результаты с www2 и www3 будут иногда появляться на www сервере, но только кратковременно. Новые результаты на www2 и www3 могут ненадолго исчезать. В конце Google Dance результаты на www будут соответствовать результатам на www2 и www3. Здесь есть удобный инструмент для одновременного просмотра результатов со всех трех серверов. При проверке новых PageRank во время танца, у Google есть семь информационных центров, в любом из которых можно найти PageRank любой страницы. По мере развития танца, информационные центры по очереди обновляются. Перед началом танца все они показывают одно и то же, текущее значение PageRank для данной страницы, но во время танца они по очереди обновляются новыми значениями PageRank. При проверке каждого центра во время танца обнаруживаются новые значения PageRank, по мере их поступления. Если PageRank страницы не меняется, центры, естественно, показывают те же значения. Как отправить запрос в информационный центрДля этого необходимо, чтобы была установлена панель инструментов Google (Toolbar) и включен индикатор PageRank. Каждый раз, когда браузер принимает страницу, Toolbar запрашивает ее PageRank в одном из информационных центров Google. Информация подается в виде текстового файла одной строкой и помещается в папку временных файлов (Temporary Internet Files). URL запроса Toolbar включает URL страницы, для которой необходимо определить PageRank (целевая страница), и контрольную сумму, соответствующую этому URL. Естественно, контрольная сумма должна соответствовать URL целевой страницы. Пример URL типичного запроса Toolbar: http://216.239.33.102/search?client=navclient-auto&ch=5150615727&features=Rank:FVN&q=info:http%3A%2F%2Fwww%2Eexampledomain%2Ecom%2F. Если вы скопируете и вставите этот URL в ваш браузер, вы получите "запрещенную" страницу Google. Это произойдет потому, что целевая страница и контрольная сумма не соответствуют друг другу - это просто пример URL запроса. Обратите внимание, что целевая страница в переключенном формате - некоторые знаки представлены шестнадцатеричными кодами (напр., %2F). Чтобы получить новый PageRank для конкретной страницы, необходимо сделать такой же запрос, который делает Toolbar. Т.е., вам нужен URL, который использует Toolbar. К тому же, вам нужно запросить PageRank во всех семи информационных центрах Google. Такой метод занимает больше времени, но он срабатывает. Вот как это делать:Информационные центры
СОВЕТ: Если хотите проверять эти же страницы во время следующих танцев, сохраните URLы в текстовом документе, чтобы не нужно было каждый раз снова искать их в папке Temporary Internet Files. Alisa |
|
2000-2008 г. Все авторские права соблюдены. |
|