Листовые и многоцелевые сканеры
В области деловых коммуникаций типа OCR и архивации, а также дизайнерских агентствах, использующих отражающие оригиналы как шаблоны для создания новых оригиналов, листовые сканеры еще не сказали своего последнего слова. Листовые сканеры – обычно черно-белые (1-битные) или полутоновые (8-битные) инструменты, которые протягивают гибкий оригинал через ролики или другое стационарное устройство. Недавно на рынке появился новый класс многоцелевых деловых машин, удовлетворяющих типичные потребности сканирования в области деловых коммуникаций – они включают OCR, электронную почту, архивирование и факс. Часто в них имеется автоматический загрузчик документов для сканирования многостраничных документов, которые засоряют любое ведомство.
Ручные сканеры
Ручные сканеры обычно не интересуют профессионалов в области обработки изображений, потому что их область отображения, разрядность битового представления и диапазон плотности чрезвычайно ограничены. Тенденция быстрее-лучше-дешевле среди простых моделей планшетных сканеров привела к частичному вытеснению ручных сканеров с рынка. Однако ручные сканеры все еще имеют нишу среди пользователей PC, в основном в областях деловых коммуникаций (OCR) и настольных издательских средств – простых моделей или внутреннего использования. Эти компактные устройства также полезны для сканирования небольших отражающих оригиналов или поверхностей громоздких предметов (больших книг, шаблонов ковров, крышек мебели и т.д.), которые нелегко уложить на стекло планшетного сканера.
Распознавание текста
Сканер или клавиатура? Еще лет пять назад этот вопрос был спорным. Скептики утверждали, что компьютер допускает ошибок больше, чем человек. И были правы. Быстрее было ввести текст вручную, чем исправлять ошибки после распознавания. Но с недавнего времени система распознавания символов ABBYY FineReader допускает меньше ошибок, чем человек! А работает в 10 раз быстрее.
FineReader – это система оптического распознавания текстов. Она преобразует полученное с помощью сканера графическое изображение (картинку) в текст (т.е. в коды букв, “понятные” системе).
В чем отличие FineReader от других OCR-систем?
Основное отличие – в точности распознавания или, иначе говоря, в том, сколько программа допускает ошибок при вводе. Согласно официальным тестам FineReader допускает в несколько раз меньше ошибок, чем другие лучшие системы OCR для русских и английских текстов. Система FineReader продается в США и Канаде под торговой маркой Presto! OCR Pro. Система FineReader – это победитель по точности распознавания всех опубликованных сравнительных тестов в России, начиная с апреля 1995 года (момента выпуска FineReader 2.0) и по сегодняшний день. За последние несколько лет FineReader вошел в тройку сильнейших OCR систем в мире, получил 4 Editor's Choice (“Выбор редакции”) от именитых западных журналов.
Существуют следующие модификации FineReader:
FineReader Light
FineReader 4.0 Standard
FineReader 4.0 Professional
FineReader Рукопись
FineReader Банк
Сравнительная таблица возможностей модификаций FineReader 4.0 Standard, FineReader 4.0 Professional и FineReader 4.0 Рукопись.
Табл. 6.7.1.
Функциональные возможности | Standart | Proffesional | Рукопись |
Распознавание текстов | |||
Типы распознаваемых текстов | печатные | печатные | печатные, рукописные (английский, русский, немецкий, украинский) |
Точность распознавания | 1 - 2 ошибки на страницу (на текстах хорошего и среднего качества печати). | ||
Улучшенное распознавание документов плохой печати (распечатки матричных принтеров, пишущих машинок, “ксерокопии”, факсы) | Да | Да | Да |
Улучшенное распознавание документов плохой печати (распечатки матричных принтеров, пишущих машинок, “ксерокопии”, факсы) | Да | Да | Да |
Распознавание штрих-кода | Да | Да | |
Возможность обучения новым символам | Да | Да | Да |
Распознавание многоколоночного текста с картинками и сохранение документа в формате RTF | Да | Да | Да |
Internet: сохранение документа в формате HTML | Да | Да | Да |
Поддержка языков | |||
Языки распознавания печатных текстов | Албанский, английский (британский, американский), африкаанс, баскский, белорусский, болгарский, венгерский, голландский (стандартный, бельгийский), датский, индонезийский, ирландский, исландский, испанский, итальянский, каталонский, латышский, литовский, македонский, немецкий, норвежский (букмол, нюнорск), польский, португальский (стандартный, бразильский), румынский, русский, сербский, словацкий, суахили, тагальский, турецкий, украинский, финский, французский, хорватский, чешский, шведский, эстонский | ||
Встроенная система проверки орфографии для языков | английский, голландский, датский, испанский, итальянский, немецкий, норвежский, польский, португальский, русский, украинский, финский, французский, шведский, эстонский | ||
Распознавание многоязычных документов | Да | Да | Да |
Создание новых языков | Да | Да | |
Взаимодействие с другими приложениями | |||
Экспорт в MS Word, MS Excel, Word Pro, WordPerfect, ODMA | Да | Да | Да |
Распознавание таблиц | |||
Распознавание и сохранение в форматах RTF, XLS,CSV, DBF | Да | Да | Да |
Ручная и автоматическая сегментация таблиц | Да | Да | Да |
Пост-редактор распознанных таблиц | Да | Да | Да |
Распознавание форм | |||
Распознавание и сохранение в формате DBF | Да | Да | |
Дизайнер шаблонов форм | Да | Да | |
Автоматическое совмещение шаблона формы по реперным точкам | Да | Да | |
Экспорт в базы данных через ODBC 32 | Да | ||
Автоматический подбор шаблона формы | Да | ||
Экспорт графического изображения элементов форм в БД | Да | ||
Автоматический контроль результатов распознавания с помощью регулярных выражений, контрольных сумм, сверкой по БД | Да | ||
Пакетная обработка документов и профессиональные возможности | |||
Фоновое распознавание и многопроцессорная работа | Да | Да | Да |
Распределенная обработка пакетов в сети | Да | Да | |
Компенсация искажений сканирования при совмещении шаблона | Да | Да | |
Интеграция с приложениями через API, OLE-Automation, Active-X | Возможно в FineReader Toolkit |