На главную

Библиотека Интернет Индустрии I2R.ru

Rambler's Top100

Малобюджетные сайты...

Продвижение веб-сайта...

Контент и авторское право...

Забобрить эту страницу! Забобрить! Блог Библиотека Сайтостроительства на toodoo
  Поиск:   
Рассылки для занятых...»
I2R » Рынок
Разделы в "Рынок":
Компании РунетаТуризмКомпанииЭлектронное правоAmazon, eBay и YahooТенденции и цифрыНовое в разделе "Рынок"

"... А воз и ныне там..."

Подведем итог. Во-первых, при Информационном Поиске Вы никогда не получите, если конечно не случится чудо, все релевантные вашему запросу документы и только их. Как правило, пользователь получает только некоторые из релевантных документов и достаточно большое количество "мусора". Во-вторых, каждый найденный документ только в некоторой степени соответствует вашей информационной потребности. В-третьих, начиная Информационный Поиск в массиве документов, вы никогда не можете быть уверены, что там вообще есть нечто, что вас может заинтересовать.

Все выше сказанное выглядит не очень обнадеживающе. Но не следует отчаиваться, ведь Вы все же находите информацию посредством Яndex или Rambler. Просто следует трезво смотреть на инструмент, которым пользуетесь и не требовать от него невозможного.

Изменилось ли с наступлением эры Интернет содержание понятия "Информационный Поиск"? Смею утверждать, что – нет. До сих пор поиск слабоструктурированной информации или неструктурированной информации - это задачка типа "Пойди туда, – не знаю куда, найди то, – не знаю что". При этом степень успеха во многом зависит от того, насколько хорошо подготовлен пользователь системы к решению этой задачи. Знает ли он в действительности цель своего поиска.

Снизилась ли неопределенность Информационного Поиска в современных информационно-поисковых системах? Нет, не снизилась. Новые инструменты поиска существенно повлияли на интерфейс системы, позволили существенно повысить интерактивность поиска, но неопределенность не снизили.

Материалы семинаров и конференций по вопросам Информационного Поиска нас убеждают в том, что проблема только усугубляется. Достаточно сказать, что среди наиболее перспективных моделей поисковых систем Интернет на семинаре по моделированию поведения поисковых систем в рамках конференции SIGIR`99 названа модель черного ящика. Т.е. исследователи воспринимают поисковую систему как нечто таинственное и загадочное и изучают ее поведение путем анализа отклика на набор специально разработанных поисковых запросов. Нечего сказать допроектировались!

Практически повсеместно при поиске применяется синтез различных методов поиска: поиск по ключевым словам, поиск по каталогу, переходы по гипертекстовым ссылкам и коррекция запросов по релевантности. Последние два механизма поиска стали широко применяться только последние десять лет. Их внедрение в поисковые системы было стимулировано появлением World Wide Web.

Гипертекстовая навигация позволяет расширить результат поиска за счет документов, связанных с найденными. Все хорошо работает до тех пор, пока мы не очень далеко "ушли" от первоисточника. Хорошо известна проблема блуждания в гипертексте. Для ее решения используют либо классификации, либо поиск по ключевым словам. Таким образом, круг замкнулся. Решая одну проблему, мы порождаем другую. Тем не менее, диверсификация и гибридизация систем являются постоянной темой обсуждения в рамках SIGIR-семинаров с 1989 года.

Коррекция запросов по релевантности таит в себе другую опасность. Разработчики алгоритмов такой коррекции предполагают, что процесс поиска должен быть конечным и сходиться к некоторому фиксированному результату. Говоря математическим языком, при поиске должно выполняться условие сходимости. Такими условием является неизменность поисковых предпочтений пользователя. Говоря проще, пользователь точно знает, что он хочет получить.

Но вот с последним как раз и возникают проблемы. Если в традиционных системах конечный потребитель информации был отделен от системы посредником, который был обучен для работы с ней, то в Инетернет каждый может непосредственно искать сам. Если в традиционных системах средняя длина запросов колебалась от 5 до 10 терминов, то в Интернет-системах запрос в три слова и более достаточно большая редкость.

Информационные предпочтения пользователя могут изменяться в соответствии с очередным результатом поиска подобно тому, как флюгер вращается под порывами переменчивого ветра.

Существуют проблемы и с каталогизацией. В Интернет нет своей Универсальной Десятичной Классификации (Пресловутая УДК, которой каждый, кто хоть раз посетил библиотеку, пользовался при просмотре библиотечных каталогов). Попадая на тот или иной информационный портал, нельзя быть уверенными в том, что раздел каталога, обозначенный знакомым словом, приведет к нужным вам документам. Развернутые исследования по созданию электронных библиотек обещают нам некоторое продвижение в направлении стандартизации каталогов, но чем все это завершиться, пока так до конца и не ясно.

Продолжение...

Павел Храмцов

Другие разделы
Туризм
Компании
Электронное право
Amazon, eBay и Yahoo
Тенденции и цифры
Новое в разделе
I2R-Журналы
I2R Business
I2R Web Creation
I2R Computer
рассылки библиотеки +
И2Р Программы
Всё о Windows
Программирование
Софт
Мир Linux
Галерея Попова
Каталог I2R
Партнеры
Amicus Studio
NunDesign
Горящие путевки, идеи путешествийMegaTIS.Ru

2000-2008 г.   
Все авторские права соблюдены.
Rambler's Top100