Информационные технологии в менджменте

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ВЫСШАЯ ШКОЛА МЕНЕДЖМЕНТА

Информационные технологии в менджменте

Обзор по теме «Распознавание речи»

работа

студентки 2 курса группы № 5

программы бакалавриата

направления «Менеджмент»

Рухлиной Любови Дмитриевной

Санкт-Петербург

Оглавление

История развития систем распознавания речи. 3

Виды систем.. 6

Голосовая почта как услуга оператора. 9

Голосовая почта как услуга офисной АТС. 9

Схема обработки телефонных вызовов. 10

Характеристики систем голосовой почты.. 10

Применение систем распознавания речи. 10

Введение

Распознавание речи — процесс преобразования речевого сигнала в цифровую информацию.

Виды систем

На сегодняшний день существует два типа систем распознавания речи — работающие «на клиенте» (client-based) и по принципу «клиент-сервер» (client-server). При использовании клиент-серверной технологии речевая команда вводится на устройстве пользователя и через Интернет передается на удаленный сервер, где обрабатывается и возвращается на устройство в виде команды (GoogleVoice, Vlingo, пр.); ввиду большого количества пользователей сервера система распознавания получает большую базу для обучения. Первый вариант работает на иных математических алгоритмах и встречается редко (SpeereoSoftware) — в этом случае команда вводится на устройстве пользователя и обрабатывается в нем же. Плюс обработки «на клиенте» в мобильности, независимости от наличия связи и работы удаленного оборудования. Так, система, работающая «на клиенте» кажется надежнее, но ограничивается, порой, мощностью устройства на стороне пользователя.

Сейчас применяется также технология SIND (без привязки к голосу конкретного человека).

На сегодняшний день можно выделить пять основных направлений использования систем распознавания речи:

§ Голосовое управление

§ Голосовой набор в различной технике (мобильники, компьютеры, и пр.)

§ Голосовой ввод текстовых сообщений в смартфонах и прочих мобильных компьютерах

§ Голосовой поиск

§ Голосовая почта

Голосовое управление - способ взаимодействия и управления работой устройства при помощи голосовых команд. Системы голосового управления малоэффективны для ввода текста, зато удобны для ввода команд, таких как: создание нового документа, поиск информации и отключение звука.

Распознавание отдельных команд несколько проще, чем распознавание слитного текста и не требует значительных вычислительных мощностей. Благодаря этому, сегодня существует богатый выбор программного обеспечения и оборудования (специализированных цифровых сигнальных процессоров), имеющих небольшую стоимость и высокое качество распознавания команд.[4]

Голосовое управление различными приборами сегодня очень востребовано. Современные мобильные телефоны и автомобили VIP-класса оснащаются системами голосового управления, позволяющими без лишних манипуляций и трудоемких движений управлять миниатюрным, многофункциональным устройством или движением транспортного средства. Аналогичные системы повсеместно применяются в новейших моделях мобильных телефонов, компьютеров, ноутбуков и прочих устройств, управляемых человеком.

Система голосового управления мобильным телефоном основана на считывании голосовых команд, их анализе и сравнении с записанными в памяти аппаратуры данными. Если голосовая команда идентифицируется, как имеющаяся в памяти устройства, она выполняется. Если аппаратура «заметит» малейшие отклонения, то добиться активации не удастся.

Сегодня существуют различные типы систем управления голосом. Одни срабатывают на смысловое значение команд, другие идентифицируют не только смысл команды, но и голос «хозяина». Последние типы устройств активно применяются в мобильных телефонах, автоугонных устройствах, системах сигнализации.

Как все это работает? В памяти такой системы записаны все возможные комбинации команд. Цифровое устройство, распознавая голосовые данные, отцифровывает и сравнивает эту цифровую команду с уже записанными. Совпадение цифрового кода должно быть стопроцентным, иначе защитное устройство среагирует, заблокировав управление. В некоторых системах, особенно антивандальных и противоугонных, несовпадение цифрового кода считывается, как попытка взлома. В этом случае срабатывает противоугонная система и воспользоваться транспортным средством, снабженным такой системой будет не только невозможно, но и выбраться из него можно будет только при помощи истинного владельца автомобиля. В мобильных телефонах все проще. Он просто не активируется и воспользоваться устройством будет совершенно невозможно.

Голосовые системы управления помимо мобильных телефонов и противоугонных систем не редко используются в кодовых замках, пропускных системах, паролях доступа к компьютерам, ноутбукам и прочим электронным устройствам.[5]

Голосовой набор в различной технике -Данная функция позволяет осуществлять набор нужного телефонного номера голосом (без набора номера на клавиатуре). Если произнести ключевое слово, например имя или фамилию абонента, то сам аппарат вызовет телефонный номер из записной книжки и начнет его набирать. Голосовые метки, соответствующие различным телефонным номерам, предварительно необходимо занести в память телефона самим владельцем.

Голосовой ввод текста и текстовых сообщений в смартфонах и прочих мобильных компьютерах

Подходит для людей, у которых возникают проблемы с набором текста. Однака, до сих пор существуют некоторые ограничения, которые не позволяют голосовому вводу текста стать основным методом набора. Прежде всего, это необходимость произносить текст очень четко и раздельно. Кроме того, системы распознавания текста до сих пор склонны совершать ошибки, особенно это касается окончаний слов.

Голосовой поиск - технология распознавания речи, позволяющая осуществлять перевод речевого запроса пользователя в текстовый вид, который затем передается в стандартную систему поиска по базе данных.

Приложения наиболее явно связанные с термином «голосовой поиск» основываются на использовании систем распознавания речи и часто синтеза речи для автоматизированного возвращения результатов поиска. Голосовой поиск реализуется в следующих направлениях:

  • алфавитный справочник, поиск компании по имени или категории, поиск человека по списку;
  • поиск информации, такой как новости, финансы, пробки, направление движения, погода или информация по кинотеатрам (при этом часто используется управление многоуровневым голосовым меню);
  • поиск в Интернете, аналогичный тому, как если бы запрос был напечатан в поисковой строке, но осуществляемый голосом (иногда приводящий к текстовой выдаче результатов на мобильном телефоне);
  • выбор опций из длинного списка служб мобильного сервиса, на портативном устройстве или в автомобильной системе (песни или радиостанции).

Все эти формы поиска инициализируются голосовым запросом, результатом чего является либо выбор нужного действия, либо доставка информации в виде синтезированной речи. Отличительной характеристикой этих основных приложений является быстрый доступ к информации, сводящей до минимума ее усилия по ее поиску.

Причиной дляиспользование голоса часто служит то, что используемое устройство является мобильным телефоном, где текстовый ввод неудобен или опасно отвлекает внимание, и где трудно просматривать длинные списки из-за маленького экрана.

Бизнес-модель для голосовых приложений может охватывать бесплатные услуги по поддержанию лояльности или для построения бренда, платные сервисы по подписке, сервисы объявлений, сервисы с оплатой за услуги (usage-based-fee) и сервисы, ориентированные на совершение сделок.

Другая категория приложений, которые можно считать частью голосового поиска — «голосовой набор номера» — поиск контакта в каталоге. Сервис состоит в том, что после голосового обращения к системе и определения искомого имени она совершает звонок по выбранному контакту.

Иногда под понятием «звуковой поиск» понимается поиск по аудио (или аудиодорожке видеофрагмента) для нахождения фрагментов речи и преобразования их в доступное для поиска содержание. Приложения включают в себя обнаружение в видео или в подкасте определенной темы или упоминания компании; радиокомпании могут преобразовывать заархивированное звуковое/видео содержание в более удобную для использования форму, а дикторы могут более легко находить информацию. Эта технология базируется на речевых технологиях, позволяющих анализировать голосовое содержание файлов.

При использовании данных технологий в call-центрах они носят название «речевой аналитики», которая дополняет распознанную речевую информацию, чтобы сделать некоторый статистический и языковой анализ, используя готовый текстовый и фонетический материал. Такие приложения позволяют искать определенные звуковые фрагменты по необходимым атрибутам (например, определять недовольные отзывы позвонивших клиентов).

Преобразование голосовых файлов в текст для дальнейшего текстового поиска по ним существует, например, в таких сервисах, которые позволяют преобразовывать голосовую почту (voicemail) в текст для более легкого поиска и просмотра, а также позволяют дальнейшую пересылку голосовой почты в виде электронной почты или sms. Так же доступны сервисы, предоставляющие возможность оставлять голосовые заметки по телефону и преобразовывать их в текст. Одна из главных целей такого обслуживания состоит в том, чтобы сделать голосовое содержимое легко архивируемым и удобным для поиска.

«Голосовой поиск» открывает коммерческие перспективы в обеспечении быстрого доступа к информации, особенно на мобильных устройствах. Он предоставляет некоторые из преимуществ письменной речи, сохраняя преимущества разговорной речи.

Голосовая почта — это электронная система для регистрации, сохранения и перенаправления телефонных голосовых сообщений (иногда — для розыска и оповещения пользователей).

В настоящее время под голосовой почтой понимают два вида сервисов, предоставляемых операторами и почтовыми серверами:

  • Возможность для абонента телефонной сети оставить адресату голосовое сообщение, которое тот сможет прослушать позже.
  • Возможность прослушать по телефону хранящиеся на сервере электронной почты сообщения, читаемые роботом.

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ВЫСШАЯ ШКОЛА МЕНЕДЖМЕНТА

Информационные технологии в менджменте

Наши рекомендации