Библиотека Интернет Индустрии I2R.ru |
|||
|
FineReader 6.0: распознавание текста, верстки, база данных и поисковик в придачу03.04.2002 21:44 ABBYY Software House, выпустила новую - уже шестую - версию системы распознавания текста ABBYY FineReader. Правда, назвать FineReader просто средством распознавания текста, значит, унизить и разработчиков, и их произведение (так и хочется назвать его произведением искусства). Как сказал Сергей Андреев, гендиректор ABBYY, еще когда компания только-только начинала заниматься разработкой OCR-систем, им хотелось создать программу, которая не только отличала бы шрифт от картинок, но и сохраняла бы макет документа при переводе его из печатного в цифровой вид - то есть, чтобы сохранялись на месте все картинки, таблицы, и распознавались шрифты. Сейчас, похоже, ABBYY довольно близко подобралась к этой цели, судя по описанию возможностей новой версии пакета FineReader. По словам Андреева, за последние 50 месяцев пакет получил более пятидесяти наград во всем мире, и на CeBit, где изначально и была представлена шестая версия "Отменного чтеца", пользовался изрядной популярностью у посетителей. Как утверждают разработчики, в шестой версии FineReader используются новые алгоритмы адаптивной бинаризации и фильтрации текстуры, что повышает точно распознавания документов сложного дизайна. А если проще, то FineReader больше не испытывает проблем с цветными шрифтами и цветным фоном, а также многоколоночными текстами. Кроме того, появилась возможность воспроизводить при распознавании и картинки неправильной формы, оптекание их текстом и т.д. Шрифты для многоязычных текстов встроены в программу изначально, что весьма полезно. В версии 6.0 поддерживается, по утверждению разработчиков, до 176 языков, в том числе некоторые тюркские и монгольские. Правда, японского или китайского по-прежнему нет. ABBYY способен работать с PDF-файлами, с его помощью PDF можно редактировать и сохранять. А помимо PDF, есть возможность работать с сетевыми форматами - HTML и CSS, который позволяет без потерь сохранять распознанные документ для публикации в интернете. Кроме того, за счет встроенного многоколоночного WYSIWYG-редактора, качество распознавания и сохранения формата можно проверять "не отходя от кассы", не экспортируя документ в Word или браузер, если речь идет о размещении документа в Сети. Само собой, FineReader совместим с Windows 2000/XP. Впрочем, стоит пакет недешево. Например, версия Professional, обойдется в 129 долларов (89 для апгрейда с предыдущей версии), а Corporate Edition - более, чем в два раза дороже, 299 долларов. Корпоративное издание предназначено для оптимизации процесса ввода больших объемов документов и обработки информации, иначе говоря, чтобы это делалось быстро. Так что в отличие от "профессионального" издания, корпоративное можно устанавливать по сети, причем с сервера же контролируется количество работающих одновременно программ. Иначе говоря, лицензионная политика ABBYY подразумевает, что, закупив небольшое количество лицензий, копии программы можно устанавливать на неограниченное количество компьютеров. Серийные номера вводятся на сервере, и контролируется только то, чтобы число одновременно работающих пользователей в любой момент времени не превышало число приобретенных лицензий. По сети же можно и обрабатывать распознаваемые документы, - на одном компьютере может осуществляться сканирование, на другом - распознавание, на третьем - проверка результатов. Кроме того, как сообщается, в FineReader 6.0 появилась возможность искать среди всех распознанных страниц пакета те, которые содержат заданное слово или несколько слов. Для этого в программу включена система полнотекстового поиска, способная находить заданные слова во всех их формах (для всех языков со словарной поддержкой). По окончании поиска найденные на странице слова подсвечиваются во всех открытых окнах программы - как на исходном изображении, так и в окне редактора. Таким образом, любой FineReader можно использовать и в качестве небольшой базы данных с возможностью полнотекстового поиска. последние новости 04.04.2002 11:53 | Споры об ответственности провайдеров за интернет-контент: сайт группировки "Хамас" хостировался в США...» 04.04.2002 11:08 | Новые американские правила распространения музыки в сети нарушают права потребителей...» 04.04.2002 10:31 | Обновление Internet Explorer решило проблемы с запуском исполняемых файлов...» 04.04.2002 10:09 | Московский зоопарк открыл в интернете страницу, чтобы попросить помощи...» 04.04.2002 09:45 | Компания nVidia планирует представить GeForce4 MX420 с поддержкой DDR...» 04.04.2002 09:10 | Свобода информации — моя свобода...» 04.04.2002 08:42 | Домены .aero получили прописку в России...» 04.04.2002 08:09 | Первые настольные системы на Pentium 4 с частотой 2.4 ГГц...» 04.04.2002 07:35 | Фотопринтер за $80...» 04.04.2002 06:31 | На заметку апологетам стабильности и владельцам HDD...» 04.04.2002 06:14 | МАСМИ объявляет результаты второй волны исследования Интернет Монитор...» 04.04.2002 05:01 | Ещё одна жертва компьютерной игры......» 04.04.2002 03:42 | Вместе с Kazaa загружаются агенты тайной сети...» 04.04.2002 02:03 | "Компьюлинка" больше не будет...» 04.04.2002 00:15 | Украинские интернет-издания проверены на надежность...» 03.04.2002 23:15 | 25 ведущих электронных бирж Европы получили в 2001г. только 350 млн. евро доходов при объеме инвестиций в данную отрасль 2 млрд. евро...» 03.04.2002 21:44 | FineReader 6.0: распознавание текста, верстки, база данных и поисковик в придачу...» 03.04.2002 20:21 | Цены на память должны упасть в мае...» 03.04.2002 19:53 | Новый поисковик Teoma собирается занять место Google...» 03.04.2002 19:13 | Американскому Интернету расти больше некуда...» |
|
2000-2008 г. Все авторские права соблюдены. |
|