Авторизируйтесь,
чтобы продолжить
Некоторые функции доступны только зарегистрированным пользователям
Неправильный логин или пароль
Добавить софт
Мой софт

FineReader9

Автор: Роберт Басыров
Опубликовано: 29.10.2007
Источник: SoftKey.info

Новая версия всем С…РѕСЂРѕС?Рѕ известной программы РїРѕ распознаванию текста

Новая версия всем хорошо известной программы по распознаванию текста FineReader от компании ABBYY характеризуется двумя основными моментами: технологией Adaptive Document Recognition Technology (технология адаптивного распознавания документов) и включением возможности распознания текста с фотографий как одной из основных возможностей программы. Естественно, что отличия девятой версии от восьмой этими двумя аспектами не оканчиваются, но распознавание с фотографии и ADRT станут основными привлекательными моментами при обновлении версии программы. Как обычно, вышло три редакции: для дома и учебы - Home Edition, для профессионалов - Professional Edition, для работы в корпоративной сети - Corporate Edition.

Поддержка многоядерных процессоров и другое

При распознавании разница в нагрузке на ядра - 20%

Среди того, что добавлено в новую версию "по мелочи", можно отметить, пожалуй, адаптацию под мноядерные процессоры. Действительно, компьютеров с двух- и четырехъядерными процессорами становиться все больше, несмотря на их приличную стоимость. Распознавание текста - довольно ресурсоемкое занятие. Поэтому естественно, что для этой работы предпочтительнее мощные процессоры. Но число ядер не имеет особого смысла, если выполняемый процесс не распараллелен надлежащим образом. При создании разработчиками девятой версии программы этому моменту (распараллеливанию задач) уделено особое значение. В результате при тестировании (на двухядерном Intel D 805) программа показала довольно приемлемые результаты, расхождение в нагрузке на ядра хоть и достигало иной раз до 25%, но было периодичным. Как правило, разница эта была не более 10%.

Их остальных добавлений отметим следующее.

  • Поддержка новой ОС Windows Vista.
  • Новый интерфейс, созданый на основе опросов пользователей предыдущих версий. Программа выглядит намного приятнее, да и сам интерфейс ее стал гораздо удобнее, прежде всего, для профессионалов.
  • Появилась панель "Основные сценарии", в которую вынесены все типовые сценарии работы. В эту панель пользователь сможет добавлять свои сценарии, если используемый алгоритм отличается чем-то от базового, и использовать свой порядок действий "в один клик".
  • Появление режима фоновой работы программы, который помогает быстрее начать работу по проверке и форматированию при больших объемах отсканированного материала. Пока FineReader распознает остальные страницы, вы экономите время, начиная работу над уже распознанным материалом.
  • Возможность автоматической обработки документов из электронной почты (есть только в редакции Corporate Edition).
  • Возможность автоматического распознавания языка документа. Для этого достаточно выставить в свойствах создаваемого документа режим "Авто".
  • Новые форматы, которые поддерживает программа.
Ну, а теперь о существенных изменениях.

Новый интерфейс программы
Новый интерфейс программы

Распознавание с фотографий

Основная сложность в процессе распознавания текста с фотографий - это получение снимка "понятного" для программы. Сложность в том, что фотография отличается от скана по уровню освещенности, равномерности освещения, разрешению снимка, резкости. Наиболее сложные моменты - это получение при фотографии равномерного освещения и удовлетворительной резкости. Для того чтобы сделать снимок технически правильно, компания ABBYY выработала рекомендации.

Одним из основных требований к снимкам для распознавания является разрешение фотографии. Минимально необходимым считается фотоаппарат с матрицей в 4 мегапикселя. Снимки с таких фотоаппаратов распознаются без проблем с коэффициентом неуверенности всего в 1-2%. Но если у вас фотоаппарат с матрицей меньшей, то распознавание все равно возможно, правда, придется обратиться за дополнительной обработкой к графическому редактору. Вам необходимо будет повысить разрешение фоторафии минимум до 400 dpi, откорректировать уровень освещенности, повысить резкость и контрастность изображения. После выполнения этих операций можно добиться автоматического распознавания программой кадров с коэффициентом неуверенности порядка 6-9% и ниже.

Фотография такого качества вполне распознаваема с помощью программы
Фотография такого качества вполне распознаваема с помощью программы

В ряде случаев, даже при использовании рекомендуемой фототехники, но при несоблюдении рекомендаций по условиям съемки, даже 4-мегапиксельные фотоаппараты не смогут выдать кадра, приемлемого для распознавания. Но и в таких случаях распознавания возможно. Прежде всего повысьте качество снимка с помощью графического редактора. Если автоматического распознавания не произошло, то "помогите" программе ручками. Дело в том, что для ABBYY FineReader основную трудность составляет не распознавание текста как такового, а разбиение фотографии на зоны текста, таблицы или картинки. Если с помощью штатных инструментов вы выполните эту работу, то распознавание текста, как правило, происходит без проблем с достаточно низким коэффициентом неуверенности.

Технология ADRT

Технология адаптивного распознавания документов (Adaptive Document Recognition Technology) служит для облегчения работы по форматированию электронных документов. Для большинства случаев работы по оцифровке текстов важным бывает не только перевод текста в электронный вид, но и сохранение его внешнего вида, его форматирования. Раньше для сохранения такой идентичности приходилось прибегать к сплошному ручному форматированию. Технология ADRT позволяет существенно сократить трудозатраты на эту операцию.

Эта технология в состоянии самостоятельно определить элементы структуры документа (колонтитулы, сноски, нумерация страниц, подписи к таблицам и картинкам) и транслировать их на весь документ. Вам останется только проконтролировать, как она это сделала и, при необходимости, подправить.

Технология ADRT автоматически сохраняет форматирование
Технология ADRT автоматически сохраняет форматирование

При этом можно использовать дополнительные возможности, свойственные электронным документам, которых лишены бумажные носители. Достаточно часто встречаются ситуации, когда таблицы (а про абзацы и говорить нечего) публикуются "разорванными", то есть часть таблицы - на одной странице, часть - на другой. На бумаге это понятно и оправдано - ее не растянешь. Но в случае с электроным документом вполне можно избежать неудобств, связанных с таким разделением единого логического элемента - таблицы или абзаца.

В принципе это и раньше делалось при распознавании, но только "ручками". ADRT автоматически соединяет таблицы и абзацы в единое целое, существенно облегчая участь бибилиотекаря, студента, научного работника.

Резюме

ABBYY FineReader сделал хороший шаг вперед. Новые поддерживаемые форматы, фоновая работа и распараллеливание нагрузки для многоядерных процессоров – все это очень полезные опции. Более удобный интерфейс программы также облегчает работу с документами. Технология ADRT послужит серьезным подспорьем для тех, кому по роду деятельности приходится постоянно заниматься форматированием распознанных текстов. Использование цифровой фотографии существенно расширит возможности пользователей, за счет того, что не нужно будет искать сканер в ситуациях ограниченного доступа к изданиям на бумаге.

Системные требования:

  • Процессор с тактовой частотой процессора 1ГГц или выше;
  • Операционная система Microsoft Windows VistaServer 2003XP2000 (для работы с локализованным интерфейсом операционная система должна обеспечивать необходимую языковую поддержку);
  • Объем оперативной памяти не менее 512 МБ, дополнительно 512 МБ для каждого ядра процессора;
  • Свободное место на диске 250 МБ для обычной установки, 512 МБ для работы системы;
  • TWAIN или WIA – совместимый сканер, цифровая камера или факс-модем;
  • Видеокарта и монитор с разрешением не менее 1024x768 точек;
  • Клавиатура, мышь или другое указательное устройство.
Демоверсия программы ограничена работой в 30 дней.



Статистика
Всего программ 28589
Скачиваний сегодня 65
Скачиваний вчера 1944