Главное окно программы FineReader

ПРОГРАММЫ «FINE READER»

Пособие

для студентов дневной и заочной форм обучения специальностей 350700 “Реклама” и 061500 “Маркетинг”

Шахты 2003

УДК 004.4(07)

ББК 32.973.202-018.2я7

С 42

Составители:

ассистент кафедры «Информатика»

О.В.Шемет

магистрант первого курса

А.Н.Самоделов

Рецензент:

доценткафедры «Информатика»

О.И.Лантратов

С 42 Шемет О.В. Сканирование и распознавание информации с использованием программы Fine Reader: Пособие / О.В.Шемет, А.Н. Самоделов. – Шахты: Изд-во ЮРГУЭС, 2003. – 16 с.: ил.

Пособие состоит из четырех разделов: главное окно программы Fine Reader, инструментальные панели программы, работа с текстом, полезные советы. Пособие содержит полезные для студентов сведения по сканированию и распознаванию текстов различной сложности.

Предназначено для студентов дневной и заочной форм обучения специальностей 350700 “Реклама” и 061500 “Маркетинг”.

УДК 004.4(07)

ББК 32.973.202-018.2я7

ã Южно-Российский государственный

университет экономики и сервиса, 2003

ã О.В. Шемет, А.Н. Самоделов, 2003

 

оглавление

ВВЕДЕНИЕ. 4

1. Главное окно программы FineReader 5

2. Инструментальные панели программы FineReader 6

2.1. Главная панель программы - Scan&Read. 6

2.2. Панель Изображение. 8

3. Работа с текстом. 9

3.1. Сканирование. 9

3.2. Распознавание. 10

3.3. Проверка распознанного текста. 10

4. Рекомендации по оптимизации распознавания. 13

4.1. Сканирование. 13

4.2. Распознавание. 15

БИБЛИОГРАФИЧЕСКИЙ СПИСОК.. 17

ВВЕДЕНИЕ

Ввести со сканера текст в компьютер — задача не слишком трудная. Однако работать с таким текстом невозможно, как и любое сканированное изображение, страница с текстом представляет собой графический файл — обычную картинку. Отсюда возникают проблемы: во-первых, в графическом формате страница занимает слишком много места, и отсканированная книга поместится не на каждый жесткий диск; во-вторых, сканированный текст можно будет только читать, но не редактировать и не вставлять его фрагменты в создаваемый вами документ. Ведь сам сканер распозна­вать буквы именно как буквы не умеет: они для него — всего лишь пят­на и точки черного цвета.

К счастью, существуют программы, способные перевести сканированный текст из графического в текстовый формат — програм­мы распознавания текста или OCR.

Современная OCR должна уметь многое: распознавать тексты, на­бранные не только определенными шрифтами, но и самыми «экзотическими», вплоть до рукописных; уметь корректно работать с текстами, содержа­щими слова на нескольких языках; корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей маши­нописной копии. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата - Microsoft Word или Excel.

Все эти операции в большинстве программ OCR могут выполнять­ся как в автоматическом, с помощью программы-Мастера, так и в руч­ном режиме, по отдельности. Именно эту программу чаще всего вспоминают, когда речь заходит о системах распознавания. И вполне заслуженно — компания ABBYY смогла не просто создать удобный для пользователя и качественный продукт.

Удачным ходом разработчиков FineReader стало внедрение в продукт массы дополнительных функций. Так, одной из главных функций FinReader является поддержка неимоверного количества языков распознавания — почти 200, в числе которых не только экзотические и древние языки, но и популярные языки программирования (Basic, C/C++, Fortran, Java, Pascal). Так что FineReader сможет без проблем справить­ся с древнегреческим свитком или с бледными распечатками исходных текстов программ, сделанных вашими предками лет 30 назад.

В данном пособии будет рассмотрена офисная версия FineReader'а. Здесь приведены краткие указанная и рекомендации начинающему пользователю для работы со сканерами.

Панель Изображение

Панель Изображение (рис. 3) содержит кнопки, позволяющие производить анализ макета страницы (например, создать и отредактировать блоки), а также кнопки, позволяющие увеличить/уменьшить масштаб изображения, отредактировать изображение (например, стереть ненужные участки изображения, такие, как подписи или большие участки мусора).

Рисунок 3 – Панель изображения

Работа с текстом

Сканирование

FineReader работает со сканерами через TWAIN-интерфейс. Это единый международный стандарт, введенный в 1992 году для унификации взаимодействия устройств для ввода изображений в компьютер с внешними приложениями. При этом возможно два варианта взаимодействия программы со сканерами через TWAIN-драйвер:

- через интерфейс FineReader: в этом случае для настройки опций сканирования используется диалог программы FineReaderНастройки сканера;

- через интерфейс TWAIN-драйвера сканера: для настройки опций сканирования используется диалог TWAIN-драйвера сканера.

Преимущества одного режима перед другим

В режиме Использовать интерфейс TWAIN-драйвера сканера, как правило, доступна функция предварительного просмотра изображения (preview), позволяющая точно задать размеры сканируемой области, подобрать яркость, одновременно контролируя результаты этих изменений. К сожалению, диалог TWAIN-драйвера сканера у каждого сканера выглядит по-своему, в большинстве случаев все надписи на английском языке. Вид этого окна и смысл опций описан в документации, прилагаемой к сканеру.

В режиме Использовать интерфейс FineReader доступны такие опции, как возможность сканирования в цикле на сканерах без автоподатчика, сохранение опций сканирования в отдельный файл Шаблон пакета (*.fbt) и возможность использования этих опций в других пакетах.

Вы можете легко переключаться между этими режимами: на закладке Сканирование/Открытие диалога Опции (меню Сервис>Опции) установите переключатель в одно из положений: Использовать интерфейс TWAIN-драйвера сканера или Использовать интерфейс FineReader.

Чтобы запустить сканирование:

Нажмите кнопку 1-Сканировать. Спустя некоторое время в Главном окнепрограммы FineReader появится окно Изображениес "фотографией" вставленного листа.

Если Вы хотите отсканировать несколько страниц, то нажмите стрелку справа от кнопки 1-Сканировать и в локальном меню выберите пункт Сканировать несколько страниц.

В случае если сканирование не началось сразу:

- откроется встроенный TWAIN-интерфейс сканера;

- откроется диалог Настройки сканера.

Если Вы хотите сразу запустить распознавание отсканированных страниц, воспользуйтесь опцией Сканировать и распознатьили Сканировать и распознать несколько страниц: Нажмите стрелку справа от кнопки Scan&Readи в локальном меню выберите один из пунктов: Сканировать и распознатьили Сканировать и распознать несколько страниц.

FineReader отсканирует и распознает изображения. В Главном окне программы появятся окно Изображение с "фотографией" вставленного листа и окно Текстс результатом распознавания. Распознанный текст Вы можете сохранить во внешние редакторы и форматы.

Распознавание

Вы можете:

1. Распознать блок или несколько блоков, выделенных на изображении.

2. Распознать открытую страницу или все страницы, выделенные в окне Пакет.

3. Распознать все нераспознанные страницы пакета.

4. Распознать все страницы в фоновом режиме. В этом режиме возможно распознавание с одновременным редактированием уже распознанных страниц.

5. Распознать страницы в режиме распознавание с обучением. Данный режим используется в основном для распознавания текстов, использующих декоративные шрифты, или распознавания большого объема (более 100 страниц) документов плохого качества печати.

6. Распознать страницы одного пакета на нескольких компьютерах одновременно.

Чтобы запустить распознавание:

- нажмите кнопку 2-Распознать на панели Scan&Read;

- в меню Процесс выберите нужный Вам пункт: Распознать- чтобы распознать открытую страницу или все страницы, выделенные в окнеПакет; Распознать все- чтобы распознать все нераспознанные страницы пакета; Распознать Блок- чтобы распознать блок или несколько блоков, выделенных на изображении; Запустить фоновое распознавание- чтобы запустить распознавание в фоновом режиме. Кнопка Распознать запускает распознавание открытого изображения. Чтобы изменить режим кнопки, нажмите на стрелку справа от нее и из открывшегося меню выберите нужный пункт.

Редактирование таблиц

При редактировании таблицы Вы можете:

1. Объединить содержимое ячеек или строк.

2. Разбить содержимое ячеек.

3. Разбить содержимое строки (столбца).

4. Удалить содержимое ячейки.

Чтобы объединить содержимое ячеек или строк:

Удерживая клавишу CTRL, выделите на изображении ячейки или строки, которые Вы хотите объединить. В меню Правка выберите пункт Объединить ячейки таблицы или Объединить строки таблицы.

Чтобы разбить содержимое ячеек:

В меню Правка выберите пункт Разбить ячейки таблицы.

Внимание! Команда применяется только к ранее объединенным ячейкам таблицы.

Чтобы разбить содержимое строки или столбца:

1. На панели Изображение выберите инструмент или .

2. Вставьте горизонтальную/вертикальную линию в строку/столбец таблицы, содержимое которых Вы хотите разделить.

Замечание.Воспользовавшись инструментом или командой меню Объединить строки таблицы (меню Правка), Вы можете объединить содержимое строк (столбцов).

Чтобы удалить содержимое ячейки:

В окне Текст выделите ячейку (или несколько ячеек), содержимое которой Вы хотите удалить, и нажмите клавишу DEL.

Рекомендации по оптимизации распознавания

Сканирование

Прежде всего нужно четко осознавать: чем лучше сканирование, тем меньше правки. Это очень важная составляющая. Перед выходом в свет книги её текст проходит через профессиональную корректуру, поэтому количество опечаток и пропущенных ошибок в книге мало. Подавляющее большинство всех помарок и ошибок текст приобретает после сканирования. И чем лучше настроить сканер и FineReader перед сканированием, тем меньше будет ошибок.

Под OCR будет рассматриваться как само сканирование, в т.ч. и графики, так и последующее распознавание с сохранением.

Перед тем, как приступить к довольно продолжительной операции сканирования, нужно определиться со следующими аспектами.

Яркость

Выставляется в зависимости от качества бумаги. Имеет смысл поэкспериментировать с разворотом книги (или с одной страницей), добиваясь наилучшего качества распознавания. Принцип тут ясен – чем желтее (темнее) бумага, тем выше яркость и наоборот. Если вы завышаете или занижаете чрезмерно яркость, FineReader вам об этом подскажет (если не отключили функцию "Показывать советы по время распознавания").

После того, как вы отрегулировали яркость, определимся с разрешением.

Разрешение

Оптимальное разрешение (без научных поисков и проб) при сканировании – 400 dpi. Если вы сканируете не каждый день, то примечание ниже можете игнорировать, – ставьте 400 точек. А если вы сканируете каждый день, то при снижении разрешения (ниже 400 dpi) резко снижается качество распознавания. Значит, у вас пока не выходит найти хороший баланс между разрешением и настройками сканера, или сканер плохой, или драйвер сканера плохой – тогда вы также ставьте 400 точек (и не ниже). Лучше потерять час на сканировании, чем затем 2 часа на правке.

Примечание. За счёт снижения разрешения можно сократить время сканирования. Но тогда вам (возможно) придется потратить лишнее время на правку. Всё зависит от качества печати и бумаги.

Вы можете снизить разрешение за счет обучения FineReader какому-то конкретному типу книг. Нужно создать мастер-шаблон на серию, если вы собираетесь сканировать много одинаково полиграфически исполненных книг. (Подробнее об этом см. в заметке по распознаванию с обучением, ниже).

Разрешение зависит от качества каждой отдельно взятой книги. Есть простейший способ выявить оптимальное разрешение для определенной книги. Если программа корректно распознает "п" и "н"; "о" и "р", "3" и "З" и "I" и "1" (то есть, не путает их друг с другом), значит, разрешение выбрано верно.

Область сканирования

Важно, чтобы в нее попадали номера страниц. Обычно область сканирования – это разворот книги. Если настроить область сканирования так, чтобы в неё попадали только страницы книги, но не внутреннее покрытие крышки сканера, то и время сканирования уменьшится, и качество будет гораздо выше.

Крышка при сканировании может мешать. Есть сканеры, где крышка снимается, без нее тоже можно нормально сканировать, это повышает производительность труда и экономит силы оператора.

Сгиб книги

Некоторые книги не хотят разворачиваться. И крышка сканера недостаточно тяжела, чтобы прижать книгу как следует. Но прижимать зачастую надо – лучше потратить 5 секунд на это, чем потом полчаса – на лишнюю правку или пересканирование. Но не доходите до крайностей. Корректное сканирование области при сгибе книги зависит от глубины резкости сканера. Большинство сканеров имеют достаточно хорошую глубину сканирования. А вот плоские (типа CanoScan), толщиной в 5 см – в этом качестве практически безнадёжны, книги ими не посканируешь. Достаточная глубина сканирования – 5-6 см., ее хватит для того, чтобы особо не прижимать книгу, а просто тщательней (но аккуратно) её раскрывать.

Распознавание

Поставим перед собой задачу задача отсканировать 4 книги: 1-я книга без картинок, только текст; 2-я книга с обильными картинками в тексте; 3-я книга двухколоночная; 4-я книга дореволюционная.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Леонтьев В.П. Новейшая энциклопедия персонального компьютера 2003 / В.П. Леонтьев. – М.: ОЛМА-ПРЕСС, 2003. – 920 с.: ил.

2. Симонович С.В. Специальная информатика: Универсальный курс: Учеб. пособие / С. В. Симонович, Г.А. Евсеев, А.Г. Алексеев. - М.: АСТ-ПРЕСС КНИГА: Информ-Пресс, 2002. - 480 с.: ил.

3. Информатика: Учебник / Под ред. Н.В. Макаровой. – 3-е изд., перераб. – М.: Финансы и статистика, 1999. – 768 с.: ил.

Пособие обсуждено и рекомендовано к внутривузовскому изданию на заседании кафедры «Информатика», протокол № 5 от 28.03.03., согласовано на заседании НМСС, протокол № 5 от 14.01.03.

Ответственный за выпуск Н.В. Ковбасюк

Редактор В.В. Крайнова

Технический редактор Т.В. Кватер

Компьютерная верстка Е.Н. Черненко

ИД № 06457 от 19.12.01 г. Подписано в печать 07.04.03.

Печать оперативная. Усл. п.л. 1,2. Уч.-изд. л. 1,0. Тираж 100 экз.

Заказ №42.

ПЛД № 65-175. Издательство ЮРГУЭС.

Типография Издательства ЮРГУЭС.

346500, г. Шахты, Ростовская обл., ул. Шевченко, 147.

 

 
 
 

 

ПРОГРАММЫ «FINE READER»

Пособие

для студентов дневной и заочной форм обучения специальностей 350700 “Реклама” и 061500 “Маркетинг”

Шахты 2003

УДК 004.4(07)

ББК 32.973.202-018.2я7

С 42

Составители:

ассистент кафедры «Информатика»

О.В.Шемет

магистрант первого курса

А.Н.Самоделов

Рецензент:

доценткафедры «Информатика»

О.И.Лантратов

С 42 Шемет О.В. Сканирование и распознавание информации с использованием программы Fine Reader: Пособие / О.В.Шемет, А.Н. Самоделов. – Шахты: Изд-во ЮРГУЭС, 2003. – 16 с.: ил.

Пособие состоит из четырех разделов: главное окно программы Fine Reader, инструментальные панели программы, работа с текстом, полезные советы. Пособие содержит полезные для студентов сведения по сканированию и распознаванию текстов различной сложности.

Предназначено для студентов дневной и заочной форм обучения специальностей 350700 “Реклама” и 061500 “Маркетинг”.

УДК 004.4(07)

ББК 32.973.202-018.2я7

ã Южно-Российский государственный

университет экономики и сервиса, 2003

ã О.В. Шемет, А.Н. Самоделов, 2003

 

оглавление

ВВЕДЕНИЕ. 4

1. Главное окно программы FineReader 5

2. Инструментальные панели программы FineReader 6

2.1. Главная панель программы - Scan&Read. 6

2.2. Панель Изображение. 8

3. Работа с текстом. 9

3.1. Сканирование. 9

3.2. Распознавание. 10

3.3. Проверка распознанного текста. 10

4. Рекомендации по оптимизации распознавания. 13

4.1. Сканирование. 13

4.2. Распознавание. 15

БИБЛИОГРАФИЧЕСКИЙ СПИСОК.. 17

ВВЕДЕНИЕ

Ввести со сканера текст в компьютер — задача не слишком трудная. Однако работать с таким текстом невозможно, как и любое сканированное изображение, страница с текстом представляет собой графический файл — обычную картинку. Отсюда возникают проблемы: во-первых, в графическом формате страница занимает слишком много места, и отсканированная книга поместится не на каждый жесткий диск; во-вторых, сканированный текст можно будет только читать, но не редактировать и не вставлять его фрагменты в создаваемый вами документ. Ведь сам сканер распозна­вать буквы именно как буквы не умеет: они для него — всего лишь пят­на и точки черного цвета.

К счастью, существуют программы, способные перевести сканированный текст из графического в текстовый формат — програм­мы распознавания текста или OCR.

Современная OCR должна уметь многое: распознавать тексты, на­бранные не только определенными шрифтами, но и самыми «экзотическими», вплоть до рукописных; уметь корректно работать с текстами, содержа­щими слова на нескольких языках; корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей маши­нописной копии. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата - Microsoft Word или Excel.

Все эти операции в большинстве программ OCR могут выполнять­ся как в автоматическом, с помощью программы-Мастера, так и в руч­ном режиме, по отдельности. Именно эту программу чаще всего вспоминают, когда речь заходит о системах распознавания. И вполне заслуженно — компания ABBYY смогла не просто создать удобный для пользователя и качественный продукт.

Удачным ходом разработчиков FineReader стало внедрение в продукт массы дополнительных функций. Так, одной из главных функций FinReader является поддержка неимоверного количества языков распознавания — почти 200, в числе которых не только экзотические и древние языки, но и популярные языки программирования (Basic, C/C++, Fortran, Java, Pascal). Так что FineReader сможет без проблем справить­ся с древнегреческим свитком или с бледными распечатками исходных текстов программ, сделанных вашими предками лет 30 назад.

В данном пособии будет рассмотрена офисная версия FineReader'а. Здесь приведены краткие указанная и рекомендации начинающему пользователю для работы со сканерами.

Главное окно программы FineReader

Вся работа в программе FineReader ведется в пакетном режиме. Пакет - это папка, в которой хранятся изображения и рабочие файлы программы. Каждое отсканированное изображение записывается как отдельная страница пакета.

При первом запуске FineReader на его экране появляется пакет, созданный программой по умолчанию и содержащий файл с изображением demo.tif. Вы можете продолжить работу с пакетом по умолчанию или создать новый пакет.

Рисунок 1 – Общий вид программы

Вверху Главного окна(рис. 1) FineReader находится меню системы, под ним - инструментальные панели. В программе их четыре: Стандартная, Форматирование, Изображение и Scan&Read.

Спрятать или показать инструментальные панели на экране можно через меню Вид (пункт Панели инструментов) или через локальное меню. Чтобы открыть локальное меню, нажмите правой кнопкой мыши на одной из инструментальных панелей. Панели, которые видны на экране, отмечены галочкой. Выберите панель, которую Вы хотите спрятать или, наоборот, показать.

Внизу окна расположена информационная панель (еще ее называют строкой состояния), где Вы можете получить сведения о состоянии системы и производимых ею операциях, а также краткую справку о выбираемых Вами пунктах меню и кнопках.

Остальное пространство Главного окна занимают по мере своего появления рабочие окна системы:Пакет, Изображение, Крупный план и Текст.

В окне Крупный план по умолчанию показывается черно-белое изображение независимо от того, какое именно (цветное, серое или черно-белое) изображение Вы открывали. Если Ваше изображение цветное и Вы хотите, чтобы в окне Крупный план показываемое изображение также было цветным, снимите отметку с пункта черно-белая палитра в окне Крупный план в группе Окно Изображение на закладке Вид (меню Сервис>Общие).

Вы можете поменять взаимное расположение окон на экране:

В меню Вид выберите один из пунктов: Окно Пакет>...; Окна Изображение и Текст>...; Окно Крупный план>...

Наши рекомендации