Сканирование документов. Распознавание документов. Автоматизированный перевод документов
Преобразование документа в электронный вид делится на два этапа: получение графического образа документа и перевод графического образа в текстовый формат. Графический образ документа является результатом сканирования. Перевод графического образа документа в текстовый формат может быть произведен вручную или посредством автоматического распознавания.
Сканирование - процесс оцифровки аналогового изображения (документ, фотография, иллюстрация, слайд) при помощи специального устройства, называемого сканером. Сканирование производится для получения, на основе оригинала, его цифрового "портрета", пригодного для компьютерной обработки.
Сканер - оптико-электронное устройство для ввода в компьютер графических зображений. Сканер создает оцифрованное изображение документа и помещает его в память компьютера.
Для работы с архивными документами в настоящее время используются, в основном, черно-белые и полутоновые монохромные сканеры. Это связано в первую очередь, с тем, что преобладающим типом архивного документа является текстовый документ, отпечатанный на пишущей машинке или монохромном принтере, с рукописным заполнением или правкой темными чернилами и эпизодически включающий печати, рисунки, схемы или черно-белые фотографии. Исходя из этого, в настоящей лекции будут рассмотрены только монохромные сканеры.
Чтобы реализовать автоматический или автоматизированный перевод бумажных документов в электронный вид, необходимо выполнить сканирование бумажных документов и распознать их содержимое с помощью специальных программ, называемых системами оптического распознавания символов (Optical Character Recognition - OCR). Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения, переданного сканером, и распознавание каждого символа. Процессы анализа макета страницы:
определение областей распознавания
определение таблиц
определение картинок
выделение в тексте строк и отдельных символов
и распознавания изображения тесно связаны между собой: алгоритм поиска блоков использует информацию о распознанном тексте для более точного анализа страницы.
Современные программно-аппаратные системы позволяют автоматизировать ввод больших объемов информации в компьютер, используя, например, сетевой сканер и параллельное распознавание текстов на нескольких компьютерах одновременно.
25. Способы создания звуковых файлов и их представление в персональном компьютере. Обработка звуковых файлов. Использование аудиотехнологий при подготовке учебных материалов
Способы создания звуковых файлов и их представление в персональном компьютере. Как уже было сказано, звук невозможно передать на расстояние и записать на носитель. Вначале нужно преобразовать звук в сигнал тока. Устройством для такого преобразования является микрофон. Он преобразует звуковые колебания в аналогичные колебания электрического тока. Полученный сигнал можно усиливать и предавать с помощью электромагнитных волн на сколь угодно большие расстояния. Для записи звука с помощью компьютера необходимо иметь звуковую плату и программное обеспечение. Звуковая плата (карта) служит для записи и воспроизведения звука. При записи аналоговый сигнал, поступающий на вход платы, преобразуется (ЦАП) в цифровой и записывается в файл на физическом носителе. При воспроизведении звука цифровой сигнал преобразуется в аналоговый (АЦП), усиливается и подается на акустическую систему. Усилитель низкой частоты звуковой платы рассчитан на подключение к нему динамиков с большим сопротивлением (головные телефоны) или внешнего усилителя. Акустическая система, состоящая из динамиков и встроенного в одну из колонок УНЧ, называется активной. Выход звуковой платы, с которого берется сигнал для усиления обозначается как линейный выход (lin out или speaker). Для записи сигналов от внешнего источника на звуковой плате имеются разьёмы линейного выхода (lin in) и микрофонный (mic). Как правило, встроенные в материнскую плату звуковые карты имеют два канала (стерео) звукозаписи (воспроизведения). Кроме микросхемы АЦП-ЦАП преобразователей на звуковой карте устанавливают УНЧ и микшер, который обеспечивает смешение сигналов при записи одновременно от двух источников. Операционная система Windows имеет стандартные инструменты для записи (Звукозапись и Регулятор громкости) и воспроизведения (проигрыватель Windows Media) звуковых файлов. Обе программы находятся в группе программ «Стандартные».
26. Использование видеотехнологий при подготовке учебных материалов. Способы создания видео файлов и их форматы. Ввод и редактирование видеоинформации. Методы сжатия видеоинформации. Обзор программного обеспечения для работы с видеофайлами.
Программные средства создания мультимедийных учебных пособий. Основные технические средства, используемые для подготовки и представления мультимедийного учебного материала: сканер, цифровые фото- и видеокамеры, видеомагнитофон, DVD-плеер, персональный компьютер, оверхедпроектор, видеопроектор, Web-камера, электронная доска, Flash-накопитель, средства беспроводного доступа. Типы входных и выходных разъемов устройств, коммутация и подключение. Технические параметры, функциональные возможности и принципы работы видеоустройств.
Система современных средств обучения и пути ее совершенствования. Плазменные панели, системы для видеоконференций. Мультимедийные проекторы и их разновидности. Кинескопная система. Жидкокристаллическая система. Основные технические характеристики и критерии выбора электронного проектора. Методические рекомендации по использованию мультимедийного оборудования в учебном процессе.
Интерактивные доски их типы и разновидности. Комплект программного обеспечения учебного назначения, ориентированный на работу с использованием интерактивной электронной доски. Методические рекомендации по работе с интерактивной доской.
Мультимедиа. Программные средства создания мультимедийных учебных пособий. Основные технические средства, используемые для подготовки и представления мультимедийного учебного материала: сканер, цифровые фото- и видеокамеры, видеомагнитофон, DVD-плеер, персональный компьютер, оверхедпроектор, видеопроектор, Web-камера, электронная доска, Flash-накопитель, средства беспроводного доступа. Типы входных и выходных разъемов устройств, коммутация и подключение. Технические параметры, функциональные возможности и принципы работы видеоустройств.
Система современных средств обучения и пути ее совершенствования. Плазменные панели, системы для видеоконференций. Мультимедийные проекторы и их разновидности. Кинескопная система. Жидкокристаллическая система. Основные технические характеристики и критерии выбора электронного проектора. Методические рекомендации по использованию мультимедийного оборудования в учебном процессе.
Интерактивные доски их типы и разновидности. Комплект программного обеспечения учебного назначения, ориентированный на работу с использованием интерактивной электронной доски. Методические рекомендации по работе с интерактивной доской.
Форматы видеофайлов определяют структуру видео, т.е. отражают, как именно хранится файл на каком-либо носителе информации. В настоящее время существует огромное количество разнообразных форматов видеофайлов, и разобраться в их особенностях иногда бывает довольно сложно. Кроме этого, пользователи часто путают понятия "кодек", "контейнер", "стандарт видео" и подменяют одно другим.
В настоящей статье мы постараемся разобраться, какие бывают форматы видео, каковы их отличия и в какой формат конвертировать видео лучше всего.
Для сжатия цифровых мультимедиа файлов используется специальные программы - кодеки. Это своеобразная формула, которая определяет, каким образом можно "упаковать" видео контент. Кодеки выполняют и обратную операцию раскодирования, в этом случае их называют декодерами. Наиболее популярными видео кодеками являются следующие: DivX, XviD, H.261, H.263, H.264 и др. Любая операционная система изначально содержит некий набор кодеков, но, как правило, их недостаточно для воспроизведения определенных форматов видеофайлов. Кодеки преобразуют данные в особый файл, который называют контейнером. Контейнер - это специальная оболочка, в которой хранится зашифрованная с помощью кодеков информация. По сути, медиаконтейнеры - это и есть форматы видеофайлов, которые содержат данные о своей внутренней структуре. Первый медиаконтейнер был создан в 1985 году. В контейнере может храниться информация разного качества, в частности, изображения, аудио, видео и субтитры. Разные виды контейнеров определяют объем и качество информации, которая может быть в нем сохранена, но при этом не влияют на способы кодирования данных.
На практике возникает огромное количество случаев, когда необходимо преобразовать видео из одного формата в другой. Основная проблема заключается в том, что различные устройства накладывают особые требования к качеству загружаемого видео, в частности к его формату. В этой ситуации на помощь приходят специальные программы - конвертеры, которые позволяют переделать видео в нужный формат. Например, удобный видео конвертер на русском языке - ВидеоМАСТЕР.
Далее рассмотрим наиболее известные форматы видеофайлов.
AVI (Audio-Video Interleaved) - один из самых распространенных медиаконтейнеров для операционных система Windows. Этот формат может содержать в себе информацию четырех типов: видео, аудио, текст и midi. В этот контейнер может входить видео различных форматов от MPEG-1 до MPEG-4. AVI имеет большое количество разновидностей по внутренней структуре и может воспроизводиться на смартфонах, коммуникаторах и других устройствах. Медиаконтейнер AVI не накладывает никаких ограничений на тип используемого кодека.
WMV (Windows Media Video) - цифровой видео формат, созданный и контролируемый компанией Microsoft. WMV файлы могут содержать аудио- и видео данные, упакованные с помощью кодеков Windows Media Audio (WMA) и Windows Media Video (WMV).
MOV - этот формат разработан компанией Apple для QuickTime медиа плеера. Для воспроизведения подобных файлов необходимо иметь QuickTime плеер или плееры с уже установленными кодеками MOV. Формат может содержать видео, анимацию, графику, 3D. Данный формат поддерживает любые аудио- и видеокодеки.
ASF (Advanced Streaming Format) - потоковый формат от Microsoft. Основан на MPEG-4 и сипользуется для передачи видео с низким и средним битрейтом в Интернет. ASF представляет собой мультимедиа контейнер, поддерживающий практически все видеокодеки.
MPEG (Moving Pictures Experts Group) - видеофайлы, в которых содержится видео, закодированное с помощью стандартов Mpeg1, Mpeg2, Mpeg3, Mpeg4. Технология MPEG использует поточное сжатие видео, при котором обрабатывается не каждый кадр по отдельности, а анализируются изменения видеофрагментов и удаляется избыточная информация. MPEG-1 - представляет собой формат для хранения аудио и видео данных на мультимедиа носителях. Формат MPEG-4 обычно используется для обмена и передачи видео-файлов в Интернете, видеотелефонии, электронных информационных изданиях и т.п. В этом формате используется раздельное сжатие для аудио и видео дорожек. MPEG-4 рассчитан на очень низкие потоки данных.
Мы перечислили лишь самые основные форматы видеофайлов, которые используются на практике. При выборе того или иного формата, исходите из того, где этот файл будет воспроизводится, а для преобразования видео из одного формата в другой используйте видео конвертеры.
Sony Vegas Pro – это профессиональная программа для создания и монтажа видео. Удобный интерфейс, универсальность и большое количество профессиональных возможностей принесли большую популярность данному видеоредактору.
Немаловажный факт, что разработчиками Vegas Pro является компания Sony – общепризнанный лидер и «законодатель мод» в мире цифрового видео.