Два вида видео: аналоговое и цифровое

Стандарты аналоговых видеосистем:

-NTSC

-PAL

-SECAM

Мультимедиа – технология, позволяющая отображать на экране монитора видео и воспроизводить с помощью акустических систем звук. (audio, video, image)

Форматы: DV, DVD, Digital 8, MPEG-4, Blu-ray, HDTV

Принципы распознавания речи:

-акустическая модель

-лингвистическая модель

Классификация систем расп. Речи:

1.по назначению:

-командные системы

-системы диктовки текста

2.по потребительским качествам:

-диктороориентированные

-дикторонезависимые

-распознающие отдельные слова

-распознающие слитную речь

Система генерации речи:

-естественность звучания

-фонетическая разборчивость

-комфортность восприятия и время привыкания

70. Информационные кросс-технологии:

Определение иклассификация.

Кросс-технологии – это такие технологии, основой построения которых являются разные дисциплины (подходы) и/или группы дисциплин (подходов). Примером кросс-технологии может являться сочетание когнитивной графики (информатика) с психологическим мониторингом (психология) и физическими упражнениями, повышающими работоспособность (физиология).

По назначению:

1 Командные системы;

2 системы диктовки текста.

По механизмам функционирования:

1) Корреляционные системы;

2) Экспертные системы;

3 Вероятностные модели принятия решений, в том числе нейронные сети.

По ориентации на пользователя:

1) дикторо — независимые;

2) диктороориентированные.

По ориентации на слитную речь:

1) Распознающая отдельные слова;

2) Распознающая слитную речь.

Простейшая программа распознавания способна распознавать только относительно небольшой набор команд и символов(цифры от 0 до 9, слова да и нет), такие программы давно употребляются в компьютерной телефонии для голосового набора номера и реализации голосового меню, а также могут применяться для управления компьютером.

Программа для диктовки текста первоначально могли распознавать только раздельную речь, в которой после каждого слова требовалось сделать паузу. Первые успехи в распознавании слитной речи были достигнуты коммерческими системами в 1997 году. Современные системы по мнению разработчиков компании Dragon Systems, IBM, Lernou & Hauspie способны распознавать до 95 процентов текста при непрерывной диктовки, тогда как для комфортной работы требуется 99 процентов.

В ходе сканирования печатного текста получается растровое изображение текста, а не сам текст. OCR — получение текста как последовательности символов из растрового изображения.

Первое исследование в области OCR проводились в 50 годах XX века. Принципы, заложенные в то время, используются в большинстве систем. Это сравнение изображения с имеющимися эталонами и выбор наиболее подходящего эталона.

Современная OCR — технология включает в себя два аспекта: 1) Считывание исходного документа универсальным сканером;

2) формирование растрового изображения и распознавание путем программной обработки изображения.

Основные методы OCR:

1) Сопоставление матриц или сравнение с образцом(распознавание выполняется путем сравнения изображения сканированного символа с базой данной растрового изображения символов, успешно работает только с непропорциональными шрифтами, где символы чётко отделяются друг от друга);

2) Выделение признаков.Распознавание символов основывается на идентификации их универсальных особенностей, что позволяет сделать распознавание независимым от шрифтов. Практические результаты использования этого метода весьма чувствительны к качеству печати. Идентификация ?типов? изображений, относящихся к шумам, стало отдельной областью исследования, некоторые средства сначала используют сравнения с образцом или выделения признаков для распознавания максимального количества символов, а затем уточняют результат, используя грамматическую проверку получающегося текста;

3) Прогнозирующее оптическое распознавание слов POWR — Predictive Optical Word Recognotion. Анализируется все множество способов, которыми точки изображения могут быть собраны в слово. Каждой возможной интерпретации приписываются … .

Наши рекомендации