Вопрос 37. Сканеры. Разновидность сканеров.
Сканер - это устройство ввода в ЭВМ информации непосредственно с бумажного документа. Можно вводить тексты, схемы, рисунки, графики, фотографии и другую графическую информацию.
Сканеры являются важнейшим звеном электронных систем обработки документов и необходимым элементом любого "электронного стола". Записывая результаты своей деятельности в файлы и вводя информацию с бумажных документов в ПК с помощью сканера с системой автоматического распознавания образов, можно сделать реальный шаг к созданию систем безбумажного делопроизводства.
Сканеры весьма разнообразны, и их можно классифицировать по целому ряду признаков. Сканеры бывают черно-белые и цветные.
Черно-белые сканеры могут считывать штриховые изображения и полутоновые Штриховые изображения не передают полутонов или, иначе уровней серого. Полутоновые позволяют распознать, и передать 16, 64 или 256 уровней серого.
Цветные сканеры работают и с черно-белыми, и с цветными оригиналами. В первом случае они могут использоваться для считывания и штриховых, и полутоновых изображений.
В цветных сканерах используется цветовая модель RGB, сканируемое изображение освещается через вращающийся RGB-светофильтр или от последовательно зажигаемых трех цветных ламп, сигнал, соответствующий каждому основному цвету, обрабатывается отдельно. Число передаваемых цветов колеблется от 256 до 65536 (стандарт High Color) и даже до 16,7 млн (стандарт True Color).
Разрешающая способность сканеров составляет от 75 до 1600 dpi (dot per inch). Конструктивно сканеры бывают ручные и настольные. Настольные в свою очередь, делятся на планшетные, роликовые и проекционные.
Ручные сканеры конструктивно самые простые, они вручную перемещаются по изображению. С их помощью за один проход вводится лишь небольшое количество строчек изображения (их захват обычно не превышает 105 мм). У ручных сканеров имеется индикатор, предупреждающий оператора о превышении допустимой скорости сканирования. Эти сканеры имеют малые габариты и низкую стоимость. Скорость сканирования 5-50 мм/с (зависит от разрешающей способности).
Файл, создаваемый сканером в памяти машины, называется битовой картой. Существуют два формата представления графической информации в файлах компьютера - растровый формат и векторный.
В растровом формате графическое изображение запоминается в файле в виде мозаичного набора множества точек (нулей и единиц), соответствующих пикселям отображения этого изображения на экране дисплея. Редактировать этот файл средствами стандартных текстовых и графических процессоров не представляется возможным, ибо эти процессоры не работают с мозаичным представлением информации. В текстовом формате информация идентифицируется характеристиками шрифтов, кодами символов, абзацев и т.п. Стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.
Следует так же иметь в виду, что битовая карта требует большого объема памяти для своего хранения. Так, битовая карта с 1 листа документа формата А4 (204x297 мм) с разрешением 10 точек/мм и без передачи полутонов (штриховое изображение) занимает около 1 Мбайта памяти, она же при воспроизведении 16 оттенков серого - 4 Мбайта, при воспроизведении цветного качественного изображения (65536 цветов) - 16 Мбайт. Сокращение объема памяти, необходимой для хранения битовых карт, осуществляется различными способами сжатия информации, например TIFF (Tag Image File Format), CTIFF (Compressed TIFF), JPEG, PCX, GIF (Graphics Interchange Format - формат графического обмена) и др. (файлы с битовыми картами имеют соответствующие указанным аббревиатурам расширения).
Наиболее предпочтительным является использование сканера совместно с программами систем распознавания образов, например типа OCR (Optical Character Recognition). Система OCR распознает считанные сканером с документа битовые (мозаичные) контуры символов (букв и цифр) и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов векторный формат.
Некоторые системы OCR предварительно нужно обучить распознаванию - ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при распознавании букв, совпадающих по начертанию в разных алфавитах (например, в латинском (английском) и в русском - кириллица), и разных гарнитур (способов начертания) шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы.
В последние годы появились интеллектуальные программы распознавания образов типа Omnifont, которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.
Сканер может подключаться к параллельному порту ПК. Для работы со сканером ПК должен иметь специальный драйвер, желательно драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов, поддерживающими стандарт TWAIN программами, например распространенными графическими редакторами Corel Draw, Max Mate, Picture Publisher, Adobe PhotoShop. Photo Finish.