Автоматизация ввода информации к компьютер

Основным методом перевода документов в электронную форму является сканирование. Сканирование - это технологический процесс, в результате которого создается графический образ бумажного документа. Существует несколько разных видов сканеров, но в их основе лежит один и тот же принцип. Документ освещается светом от специального источника, а отраженный свет воспринимается светочувствительным элементом. Минимальный элемент изображения интерпретируется сканером как цветная (или серая) точка. Таким образом, в результате сканирования документа создается графический файл, в котором хранится растровое изображение исходного документа. Растровое изображение состоит, как известно, из точек. Количество точек определяется как размером изображения, так разрешением сканера.

В настоящее время для ввода текстовой и графической информации используются следующие виды сканеров.

Ручные сканеры. Это самый простой вид сканеров, дающий наименее качественное изображение. Такой сканер не имеет движущихся частей, и сканирование производится путем перемещения сканера по документу.

Недостатком ручных сканеров является очень узкая полоса сканирования (стан­дартный лист бумаги приходится сканировать несколько проходов), а также высокие требования к самому процессу сканирования. Так, если рука, держащая сканер, слегка подрагивает или движется рывками, говорить о хорошем качестве сканирования не приходится.

Листовые сканеры позволяют за одну операцию сканировать лист бумаги стан­дартного формата. Блок сканирования у таких сканеров неподвижен, а бумага протягива­ется мимо него при помощи специальных валиков. Листовые сканеры гарантируют хоро­шее качество сканирования, но они способны сканировать только отдельные листы.

Планшетные сканеры обеспечивают наилучшее качество и максимальное удобство при работе с бумажными документами Под крышкой планшетного сканера располагается прозрачное основание, на которое укладывают документ. Блок сканирования перемещается вдоль документа внутри корпуса сканера. Продолжительность сканирования стандартного машинописного листа составляет от одной до нескольких секунд.

Барабанные сканеры обеспечивают наивысшее разрешение сканирования, но они предназначены для сканирования не бумажных документов, а прозрачных материалов, например слайдов, негативов. В сканерах этого типа считывающая головка установлена неподвижно, а изображение, закрепленное на цилиндрическом барабане, вращается с высокой скоростью и сканируется построчно.

Сканеры форм - специальные сканеры для ввода информации с заполненных бланков. С помощью них вводят данных из анкет, опросных листов, избирательных бюллетеней.

Штрих-сканеры - разновидность ручных сканеров. Предназначены для считывания штрих-кодов с маркировки товаров в магазине.

Штрих-сканеры позволяют автоматизировать процесс подсчета стоимости покупок. Они особенно удобны в торговых помещениях, оборудованных электронной связью и производящими расчеты с покупателями с помощью электронных платежных средств.

Поскольку аппаратные интерфейсы сканеров отличаются многообразием, были предприняты специальные меры для .стандартизации программного интерфейса, обеспе­чивающего связь между сканерами и операционной системой. Этот интерфейс основан на специальном протоколе TWAIN. Если сканер поддерживает данный протокол, то операционная система Windows способна обеспечить взаимодействие между сканером и программным приложением, предназначенным для работы с ним. Все современные ска­неры поддерживают стандарт TWAIN.

После обработки документа сканером пол\"чается графический образ, который не является текстовым документом.Для перевода графического образа в текстовый документ существуют программы распознавания тестов. Наиболее широко распространена программа FineReader.

После установки программы FineReader в меню Программы главного меню появляются пункты, обеспечивающие работу с ней. Окно программы имеет типичный для приложений Windows вид, содержит строку меню, ряд панелей инструментов и рабочую область.

В левой части рабочей области располагается панель Пакет, содержащая список графических документов, которые должны быть преобразованы в текст. Эти графические файлы рассматриваются как части одного документа. Результаты их обработки в дальнейшем объединяются в единый текстовый файл. Панель в нижней части рабочей области, содержит фрагменты графического документав увеличенном виде, с ее помощью можно оценить качество распознавания. Эту панель используют при «обучении» программы входе распознавания текста.

Порядок распознаваниятекстовых документов

Преобразование бумажного документа б электронный происходит в три этапа. Сканирование.

Сегментация текста применяется, если текст не располагается в фиксированном порядке. Текст разбивают па блоки, которые распознаются последовательно.

Распознавание. Программа выделяет цветом те символы, которые она рассматривает как неоднозначно опознанные. Это упрощает поиск ошибок.

Полученный текст можно сохранить в виде документа.Кроме того предусмотрена передача текста в программы Word и Excel.

Важной особенностью программы FineReader является возможность распознавания бланков. Бланк представляет собой отформатированный доклтяент, в специальные поля которою вносятся данные.

Наши рекомендации