Два вида видео: аналоговое и цифровое
Стандарты аналоговых видеосистем:
-NTSC
-PAL
-SECAM
Мультимедиа – технология, позволяющая отображать на экране монитора видео и воспроизводить с помощью акустических систем звук. (audio, video, image)
Форматы: DV, DVD, Digital 8, MPEG-4, Blu-ray, HDTV
Принципы распознавания речи:
-акустическая модель
-лингвистическая модель
Классификация систем расп. Речи:
1.по назначению:
-командные системы
-системы диктовки текста
2.по потребительским качествам:
-диктороориентированные
-дикторонезависимые
-распознающие отдельные слова
-распознающие слитную речь
Система генерации речи:
-естественность звучания
-фонетическая разборчивость
-комфортность восприятия и время привыкания
70. Информационные кросс-технологии:
Определение иклассификация.
Кросс-технологии – это такие технологии, основой построения которых являются разные дисциплины (подходы) и/или группы дисциплин (подходов). Примером кросс-технологии может являться сочетание когнитивной графики (информатика) с психологическим мониторингом (психология) и физическими упражнениями, повышающими работоспособность (физиология).
По назначению:
1 Командные системы;
2 системы диктовки текста.
По механизмам функционирования:
1) Корреляционные системы;
2) Экспертные системы;
3 Вероятностные модели принятия решений, в том числе нейронные сети.
По ориентации на пользователя:
1) дикторо — независимые;
2) диктороориентированные.
По ориентации на слитную речь:
1) Распознающая отдельные слова;
2) Распознающая слитную речь.
Простейшая программа распознавания способна распознавать только относительно небольшой набор команд и символов(цифры от 0 до 9, слова да и нет), такие программы давно употребляются в компьютерной телефонии для голосового набора номера и реализации голосового меню, а также могут применяться для управления компьютером.
Программа для диктовки текста первоначально могли распознавать только раздельную речь, в которой после каждого слова требовалось сделать паузу. Первые успехи в распознавании слитной речи были достигнуты коммерческими системами в 1997 году. Современные системы по мнению разработчиков компании Dragon Systems, IBM, Lernou & Hauspie способны распознавать до 95 процентов текста при непрерывной диктовки, тогда как для комфортной работы требуется 99 процентов.
В ходе сканирования печатного текста получается растровое изображение текста, а не сам текст. OCR — получение текста как последовательности символов из растрового изображения.
Первое исследование в области OCR проводились в 50 годах XX века. Принципы, заложенные в то время, используются в большинстве систем. Это сравнение изображения с имеющимися эталонами и выбор наиболее подходящего эталона.
Современная OCR — технология включает в себя два аспекта: 1) Считывание исходного документа универсальным сканером;
2) формирование растрового изображения и распознавание путем программной обработки изображения.
Основные методы OCR:
1) Сопоставление матриц или сравнение с образцом(распознавание выполняется путем сравнения изображения сканированного символа с базой данной растрового изображения символов, успешно работает только с непропорциональными шрифтами, где символы чётко отделяются друг от друга);
2) Выделение признаков.Распознавание символов основывается на идентификации их универсальных особенностей, что позволяет сделать распознавание независимым от шрифтов. Практические результаты использования этого метода весьма чувствительны к качеству печати. Идентификация ?типов? изображений, относящихся к шумам, стало отдельной областью исследования, некоторые средства сначала используют сравнения с образцом или выделения признаков для распознавания максимального количества символов, а затем уточняют результат, используя грамматическую проверку получающегося текста;
3) Прогнозирующее оптическое распознавание слов POWR — Predictive Optical Word Recognotion. Анализируется все множество способов, которыми точки изображения могут быть собраны в слово. Каждой возможной интерпретации приписываются … .