Библиотека Интернет Индустрии I2R.ru |
|||
|
PageRank отлично подходит для оценки научных публикаций28.04.2006 18:44 Алгоритм Google PageRank, который используется для анализа относительной важности веб-страниц, великолепно подходит для оценки научных публикаций. Ведь это такая же коллекция с перекрестными ссылками. Обычно для оценки ценности научных публикаций подсчитывается количество раз, когда данная работа цитируется в других работах. В сетевом жаргоне это называется «количество входящих ссылок». Однако, данная техника не всегда надежна. На самом деле иногда встречаются работы, которые оказали огромное влияние на науку, но при этом относительно редко цитируются. Точно известно, что «недооцененные» работы существуют. Но сколько их? Какие из них наиболее важны? Чтобы ответить на эти вопросы, американские физики из Бостонского университета и Брукхэвенской лаборатории (при участии Сергея Маслова) провели эксперимент. Они использовали алгоритм, подобный PageRank, для анализа большой базы научных публикаций, сообщает PhysicsWeb. В рамках эксперимента алгоритм был применен для анализа перекрестных ссылок во всех документах, напечатанных в различных журналах издательства Physical Review между 1893 г. и июнем 2003 г. Общее количество статей составило 353.268, а количество цитат (ссылок) — 3.110.839. Алгоритм предполагал запуск множества случайных «блуждающих» программ-роботов по сети научных ссылок. Роботы могут посещать или случайный документ, или идти по случайной ссылке. В итоге наибольшее количество роботов скапливается на самых важных документах, куда приводит больше всего цепочек ссылок. После окончания процедуры подсчитывается среднее количество заходов и высчитывается рейтинг (PR) каждого документа. Статистический анализ показал, что рейтинг PR в большинстве случаев напрямую соответствует традиционной оценке по количеству входящих ссылок. То есть наиболее цитируемые документы также имеют высокий PR. Однако, к удивлению исследователей, в базе данных обнаружился ряд документов с аномально высоким PR, который явно не соответствовал количеству входящих ссылок. Важность этих документов трудно переоценить. Среди них — классические труды Вигнера и Зейтца (1933 г.), Гелл-Манна и Брюкнера (1957 г.), Глаубера (1963 г.). Вигнер, Гелл-Манн и Глаубер были удостоены Нобелевских премий спустя десятилетия после публикации своих работ. Рой Глаубер удостоился этой награды только в прошлом году. Во время публикации их работы были трудны для восприятия. Только спустя годы, благодаря усилиям других ученых, их идеи были приняты и признаны классическими. По этой причине ссылок на оригинальные работы существует очень мало, поскольку идеи получили развитие только в научных работах других ученых. Таким образом, в данной ситуации алгоритм PageRank способен распознать важность документов, а стандартный метод по количеству входящих ссылок — нет. Исследователи подчеркивают, что PageRank более эффективен не только в отношении старых, но и при анализе самых новых публикаций. Статьи по теме:
Текст - Анатолий Ализар последние новости 15.11.2006 11:50 | Дума на страже авторских прав...» 14.11.2006 19:09 | Разработчики начинают играть с .Net 3.0...» 13.11.2006 18:46 | Google локализовала службу создания приложений для Интернет-порталов...» 13.11.2006 15:03 | Sun выбрала лицензию GPL для распространения открытого кода Java...» 12.11.2006 18:38 | Проблемы медленной работы Photoshop CS2...» 11.11.2006 17:55 | Азы и буки онлайн-продвижения. В США издано «Руководство по интернет-рекламе"...» 10.11.2006 17:02 | Исследование "Индексы цитирования сайтов Рунета" от Алексея Тутубалина...» 09.11.2006 15:39 | Вышла новая версия СУБД Cache...» 08.11.2006 16:34 | Adobe открывает код механизма сценариев Flash...» 08.11.2006 16:26 | Yahoo начнёт рассылать владельцам сотовых телефонов рекламные баннеры...» 08.11.2006 12:16 | Бесплатный семинар по анализу, продвижению и управлению ресурсом...» 04.11.2006 17:50 | Создатель интернета: "Web грозит коллапс"...» 03.11.2006 15:01 | IT-Online - официальный спонсор конференции iDate2006 - Europe...» 02.11.2006 00:26 | Александр Садовский держит ответ перед оптимизаторами...» 02.11.2006 00:11 | 14 ноября - День Юзабилити в России...» 01.11.2006 23:37 | Оптимизатор создал SEO – поиск...» 01.11.2006 21:15 | Обзор Всероссийской онлайн-конференция «Интернет в регионах РФ: шаг вперед, два назад?..»...» 01.11.2006 20:46 | Сообщество «Для разработчиков» от Софт@Mail.Ru...» 01.11.2006 15:50 | Вышел номер журнала AboutPC №1 (104)...» 01.11.2006 12:39 | Продукты Corel будут оптимизированы под Vista...» |
|
2000-2008 г. Все авторские права соблюдены. |
|