Понятие о документах FineReader
Как будет показано ниже, работа по сканированию и распознаванию текста – достаточно медленная и кропотливая. И если необходимо перевести в текстовый формат содержимое книги, такая работа может потребовать нескольких дней или даже недель. Для удобства хранения промежуточных результатов работы в ABBYY FineReader предусмотрены документы FineReader (в старых версиях программы – пакеты).
Документ FineReader представляет собой именованное хранилище, куда складываются отсканированные изображения, вспомогательная информация по каждому из них, распознанный текст каждой страницы и т.д. Все промежуточные данные сохраняются в документе автоматически. Документ хранится в собственной папке на жестком диске компьютера. В одно и то же время на компьютере можно хранить сколько угодно документов ABBYY FineReader, но работать при этом можно только с одним.
При запуске программы в ее рабочих окнах ничего нет. Если будет просканировано или открыто первое изображение, оно помещается в безымянный документ. Последующие изображения добавляются туда же.
В случае, если предполагается продолжить работу с данными изображениями в следующий раз, безымянный документ должен быть сохранен под определенным именем. Если этого не сделать, при закрытии программы данные из безымянного документа будут удалены. Для сохранения документа служит меню Файл – Сохранить документ FineReader… (не путать с Сохранить как…). В открывшемся диалоговом окне следует указать имя пакета и место, где он будет размещен. Следует помнить, что объем документа может быть достаточно большим – до 1…2 МБ на каждую страницу текста.
С точки зрения операционной системы документ FineReader представляет собой папку(со специальным значком), внутри которой хранятся соответствующие файлы. Документ-папку можно переносить или копировать при помощи Проводника или любого другого файлового менеджера.
Для продолжения работы с документом после запуска программы его нужно открыть. Для этого служит меню Файл – Открыть документ FineReader…. Можно сохранить документ под новым именем (та же команда Файл – Сохранить документ FineReader…, будет создана копия документа), закрыть текущий документ (меню Файл – Закрыть документ FineReader, все изменения будут автоматически сохранены) или создать новый документ (меню Файл – Новый документ FineReader либо кнопка в нижней панели окна «Документ», будет создан безымянный документ). При создании нового документа или открытии сохраненного текущий документ будет закрыт.
Содержимое документа в виде страниц отображается в окне «Документ». Доступно два варианта отображения: в виде миниатюрных изображений страниц или в виде списка из названий файлов. Переключение осуществляется через меню Вид – Окно Документ – Пиктограммы / Со свойствами, либо через выпадающий список кнопки нижней панели окна «Документ». Меню Вид – Окно Документ – Настройка… вызывает диалоговое окно для тонкой настройки отображения страниц в окне (в пособии не рассматривается).
При сканировании страниц или открытии графических файлов они добавляются в документ, и им присваивается порядковый номер. Если щелкнуть левой кнопкой мыши по странице, она выделится, и ее изображение откроется в окне «Изображение», а увеличенный его фрагмент будет продублирован в окне «Крупный план». Щелчок по новой странице выделит и откроет ее. Быстро листать страницы в окне «Документ» можно кнопками панели быстрого доступа, кнопками , расположенными под вертикальными полосами прокрутки в окнах «Изображение» и «Текст», через меню Документ – Открыть предыдущую / следующую страницу или нажатием курсорных клавиш Вверх и Вниз одновременно с клавишей Alt. Также через меню Документ можно закрыть страницу, сняв с нее выделение, быстро перейти к произвольной странице (Документ – Открыть страницу с номером…), удалить выделенную страницу. Для удаления страницы также можно выделить ее в окне «Документ» и нажать клавишу Delete. Процедура удаления страниц из документа необратима, так как из папки документа удаляются соответствующие файлы!
Иногда бывает ситуация, когда при сканировании была нарушена последовательность страниц. Например, страница 18 была плохо отсканирована, а после повторного сканирования она оказалась в конце документа под номером 49. В этом случае достаточно удалить страницу 18, после чего стандартным для Windows методом переименования заменить номер последней страницы с 49 на 18.
Иногда может понадобиться изменить номера сразу нескольких страниц. Например, в отсканированной книге нужно расположить Главу 5 сразу после Главы 1, а уже после нее – главы 2, 3 и 4., В этом случае поможет меню Документ – Перенумеровать страницы…. Команда открывает одноименное диалоговое окно (рис. 8.2).
Перед выполнением команды страницы Главы 2 в окне «Документ» нужно выделить. Переключатель в окне оставить в верхнем положении, а в поле ввода задать номер страницы, идущей после последней страницы Главы 1. После нажатия кнопки ОК страницы будут перенумерованы.
Нижние положения переключателя полезны для владельцев сканеров с автоматическим податчиком оригиналов (ADF). Если документ отпечатан с двух сторон, такой сканер может самостоятельно просканировать все страницы с одной стороны, после чего пользователю придется вынуть пачку листов из выходного лотка податчика, перевернуть ее и заложить во входной лоток еще раз. После такого сканирования листы в документе будут идти в шахматном порядке. Второе положение переключателя в окне рис. 8.2 как раз и позволяет это исправить. Чтобы положение стало доступным, следует выделить как минимум три страницы, идущие подряд. Если этот режим был использован по ошибке, третье положение позволяет отменить изменение номеров.
Рис. 8.2 Диалоговое окно «Перенумеровать страницы»