Установка параметров сканирования
Рис. 35.1. Окно программы FineReader 7.0
Работая с программой FineReader, пользователь всегда имеет дело с некоторым пакетом. Пакет – это папка, в которой хранятся изображения и рабочие файлы программы. Каждое отсканированное изображение записывается как отдельная страница пакета. При запуске программы FineReader по умолчанию открывается новый пакет и можно продолжить работу с новым пакетом или же открыть уже существующий пакет.
Панель Scan&Read позволяет произвести полную обработку текста: отсканировать, распознать, проверить и сохранить распознанный текст. Это главная панель программы FineReader.
Окно «Пакет» отображает страницы, которые входят в пакет.
В окне «Изображение» отображается отсканированное изображение и производится выделение блоков на изображении.
Панель «Изображение» позволяет произвести анализ макета страницы – выделить и отредактировать блоки.
В окне «Текст» отображается распознанный текст.
В окне «Крупный план» отображается увеличенное изображение редактируемой строки или обрабатываемого участка изображения.
Кнопки на панели Scan&Read связаны с базовыми операциями системы – Сканированием, Распознаванием, Проверкой и Сохранением результатов распознавания. Цифры на кнопках указывают, в каком порядке нужно выполнить действия, чтобы получить электронную версию бумажного документа. Каждое из этих действий можно провести по отдельности или объединить в одно, нажав на кнопку Мастер Scan&Read. Она позволяет провести полный цикл обработки текста автоматически. Каждая из кнопок имеет несколько режимов работы (таблица 35.1). Нажав на стрелку, справа от кнопки и в открывшемся локальном меню можно выбрать один из них, при этом «информация» об этом отразится на значке кнопки. Для того чтобы повторить ту же операцию для другого изображения, достаточно повторно нажать кнопку.
Таблица 35.1
Кнопки панели Scan&Read
Кнопка | Режимы работы |
Сканировать и распознать – запускает сканирование и распознавание документа. Сканировать и распознать несколько страниц – сканирует и распознает несколько страниц в цикле. Открыть и распознать – позволяет открыть и распознать изображения, выбранные в диалоге Открыть (Open). Мастер Scan&Read – запускает специальный режим сканирования и распознавания, во время которого система контролирует действия пользователя и подсказывает ему, что надо делать, чтобы получить тот или иной результат. | |
Открыть изображение – добавляет изображение в пакет, при этом копия изображения сохраняется в папке пакета. Сканировать изображение – сканирует изображение. Сканировать несколько страниц – сканирует изображения в цикле. Чтобы остановить сканирование, надо в меню Файл выбрать пункт Остановить сканирование. Опции – открывает закладку Сканирование/Открытие диалога Опции, на которой можно установить опции сканирования и предварительной обработки документа. | |
Распознать – распознает открытую страницу (или выделенные страницы) пакета. Распознать все – распознает все нераспознанные страницы пакета. Опции – открывает закладку Распознавание диалога Опции, на которой можно установить опции распознавания документа. | |
Проверить – позволяет найти в тексте слова, содержащие неуверенно распознанные символы, и неправильно написанные слова. Опции – открывает закладку Проверка диалога Опции, на которой можно установить опции проверки документа. | |
Мастер сохранения результатов – открывает диалог Мастер сохранения результатов, в котором можно выбрать приложение для сохранения и установить опции сохранения. Сохранить текст в файл – сохраняет распознанный текст в файл на диск. Передать страницы в – напрямую передает распознанный текст в выбранное приложение без сохранения его на диск. При передаче распознанного текста с нескольких страниц пакета сначала выделите их в окне Пакет. Передать все страницы в – передает все распознанные страницы в выбранное приложение без сохранения их на диск. Опции – открывает закладку Форматирование диалога Опции, на которой можно установить опции сохранения документа. |
На панели Стандартная находятся кнопки, управляющие работой с файлами и изображением (отмена и повтор действия, перемещение по страницам пакета, очистка и поворот изображения), а также список языков распознавания (рис. 35.2).
Рис. 35.2. Панель инструментов Стандартная
Панель Изображение содержит кнопки, позволяющие производить анализ макета страницы (например, создать и отредактировать блоки), а также кнопки, позволяющие увеличить/уменьшить масштаб изображения, отредактировать изображение (например, стереть ненужные участки изображения, такие, как подписи или большие участки мусора) (рис. 35.3).
Рис. 35.3. Панель инструментов Изображение
2. Получение и обработка изображения
FineReader работает со сканерами через TWAIN–интерфейс. Это единый международный стандарт, введенный в 1992 году для унификации взаимодействия устройств для ввода изображений в компьютер (например, сканера) с внешними приложениями. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN–драйвер:
· через интерфейс FineReader: в этом случае для настройки опций сканирования используется диалог программы FineReader Настройки сканера;
· через интерфейс TWAIN–драйвера сканера: для настройки опций сканирования используется диалог TWAIN–драйвера сканера.
В режиме Использовать интерфейс TWAIN–драйвера сканера, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, тут же контролируя результаты этих изменений. К сожалению, диалог TWAIN–драйвера сканера у каждого сканера выглядит по-своему, в большинстве случаев все надписи на английском языке. Вид этого окна и смысл опций описан в документации, прилагаемой к сканеру.
В режиме Использовать интерфейс FineReader доступны такие опции, как возможность сканирования в цикле на сканерах без автоподатчика, сохранение опций сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.
FineReader позволяет легко переключаться между этими режимами. Для этого надо выбрать пункт меню Сервис команду Опции и на закладке Сканирование/Открытие установить переключатель в одно из положений: Использовать интерфейс TWAIN–драйвера сканера или Использовать интерфейс FineReader.
Чтобы запустить сканирование надо нажать кнопку или в меню Файл выбрать пункт Сканировать. Спустя некоторое время в Главном окне программы FineReader появится окно Изображение с “фотографией” вставленного листа.
Если надо отсканировать несколько страниц, то нажать на стрелке справа от кнопки Сканировать и в локальном меню выбрать пункт Сканировать несколько страниц.
Установка параметров сканирования
Качество распознавания во многом зависит от того, насколько хорошее изображение получено при сканировании. Качество изображения регулируется установкой основных параметров сканирования: типа изображения, разрешения и яркости.
Тип изображения – серый (256 градаций). Сканирование в сером является оптимальным режимом для системы распознавания. В случае сканирования в сером режиме осуществляется автоматический подбор яркости. Черно-белый тип изображения обеспечивает более высокую скорость сканирования, но при этом теряется часть информации о буквах, что может привести к ухудшению качества распознавания на документах среднего и низкого качества печати. Если надо, чтобы содержащиеся в документе цветные элементы (картинки, цветные буквы и цветной фон) были переданы в электронный документ с сохранением цвета, необходимо выбрать цветной тип изображения.
Разрешение –300 dpi используется для обычных текстов (размер шрифта 10 и более пунктов) и 400–600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов).
Яркость – в большинстве случаев подходит среднее значение яркости –50 %.