Характеристики слухового анализатора
В системах управления значительная часть информации поступает к человеку в форме звуковых сигналов. Отражающие эти сигналы ощущения вызываются действием звуковой энергии на слуховой анализатор. Он состоит из уха, слухового нерва и сложной системы нервных связей и центров мозга. В аппарат, обозначаемый термином «ухо», входят: наружное (звукоулавливающий аппарат), среднее (звукопередающий аппарат) и внутреннее (звуковоспринимающий аппарат) ухо. Ухо воспринимает определенные частоты звуков благодаря функциональной способности волокон его мембраны к резонансу. Физиологическое значение наружного и среднего уха заключается в проведении и усилении звуков. Слуховой анализатор человека улавливает форму волны, частотный спектр чистых тонов и шумов, осуществляет анализ и синтез в определенных пределах частотных компонент звуковых раздражении, обнаруживает и опознает звуки в большом диапазоне интенсивностей и частот. Слуховой анализатор позволяет дифференцировать звуковые раздражения и определять направление звука, а также удаленность его источника. Источником звуковых волн может быть любой процесс, вызывающий местное изменение давления или механические напряжения в среде. Слуховой аппарат человека воспринимает как слышимый звук колебания с частотой 16 Гц — 20 кГц; ухо наиболее чувствительно к колебаниям в области средних частот — от 1000 до 4000Гц. Звуки частот ниже 16 Гц называются инфразвуками, а выше 20кГц — ультразвуками. Инфразвуки и ультразвуки также могут оказывать воздействие на организм, но оно не сопровождается слуховым ощущением.
Физически звук характеризуется амплитудой (интенсивностью), частотой и формой звуковой волны. Интенсивностью звукового сигнала принято считать силу звука в Вт/м2. Так как сила звука пропорциональна квадрату звукового давления, то в практике психофизиологической акустики чаще всего используется непосредственно звуковое давление, выраженное в децибелах от исходного уровня, равного 2x10—5 Па. Сила звука в децибелах определяется выражением
где J — сила звука данного сигнала; J0 — исходный уровень силы звука эталонного сигнала.
Так как , то
где а — коэффициент пропорциональности; Рзв — звуковое давление; — исходный уровень давления.
Давление 210 —5 Па при частоте 2000 Гц соответствует силе звука, равной 10 ~12 Вт/м2, и считается абсолютным порогом звукового анализатора.
В реальных условиях деятельности человеку приходится воспринимать звуковые сигналы на том или ином фоне. При этом фон может маскировать полезный сигнал, что, естественно, затрудняет его обнаружение. При разработке и конструировании акустических индикаторов задача борьбы с эффектом маскировки и поисков оптимального отношения интенсивности полезного сигнала к интенсивности шума (фона) является одной из важнейших.
Основными количественными характеристиками слухового анализатора являются абсолютный и дифференциальный пороги. Нижний абсолютный порог соответствует интенсивности звука в децибелах, обнаруживаемого испытуемым с вероятностью 0,5; верхний порог — интенсивность, при которой возникают различные болевые ощущения (щекотание, покалывание, головокружение и т.д.). Между ними расположена область восприятия речи (рис. 11.7).
Рис. 11.7. Линии равной громкости.
Рис. 11.8. Дифференциальные пороги слухового анализатора:
а — по интенсивности (D 13); б — по частоте (D F).
Человек оценивает звуки, различные по интенсивности, как равные по громкости, если частоты их также различны. Например, тон с интенсивностью 120 дБ и частотой 10 Гц оценивается как равный по громкости тону, имеющему интенсивность 100 дБ и частоту 1000 Гц. Таким образом, снижение интенсивности как бы компенсируется увеличением частоты. Субъективное ощущение интенсивности звука называется громкостью и измеряется в фонах. Уровень громкости в фонах численно равен интенсивности звука в децибелах для чистого тона частотой 1000 Гц, воспринимаемого как равногромкий с данным звуком.
Величина едва различимой прибавки к исходному звуковому раздражителю зависит не только от его интенсивности, но и от частоты. В пределах среднего участка диапазона изменения звука по частоте и интенсивности величина энергетического дифференциального порога примерно постоянна и составляет 0,1 от исходной интенсивности раздражителя (рис. 11.8, а).
Дифференциальный порог по частоте зависит как от частоты исходного звука, так и от его интенсивности. В пределах от 60 до 2000 Гц при интенсивности звука выше 30 дБ абсолютная величина едва различимой прибавки равна примерно 2 — 3 Гц. Для звуков выше 2000 Гц эта величина резко возрастает и изменяется пропорционально росту частоты (рис. 11.8, б). Относительная величина дифференциального порога для звуков в зоне 200— 16000 Гц является почти константной и равна примерно 0,002. При сокращении интенсивности звука ниже 30 дБ величина дифференциального порога резко возрастает.
Временной порог чувствительности акустического анализатора, т. е. длительность звукового раздражителя, необходимая для возникновения ощущения, так же как пороги по громкости и высоте, не является постоянной величиной. С увеличением как интенсивности, так и частоты он сокращается. При достаточно высокой интенсивности (30 дБ и более) и частоте (1000 Гц и более) слуховое ощущение возникает уже при длительности звукового раздражителя, равной всего 1 мс. Однако при уменьшении интенсивного звука той же частоты до 10 дБ временной порог достигает 50 мс. Аналогичный эффект дает и уменьшение частоты.
Оценка громкости и высоты очень коротких звуков затруднена. При длительности синусоидального тона 2 — 3 мс человек лишь отмечает его наличие, но не может определить его качеств. Любой звук оценивается только как «щелчок». С увеличением длительности звука слуховое ощущение постепенно проясняется: человек начинает различать высоту и громкость. Минимальное время, необходимое для отчетливого ощущения высоты тона, равно примерно 50 мс.
Дифференцировка двух звуков по частоте и интенсивности также зависит от отношения их по длительности и от интервала между ними. Как правило, звуки, равные по длительности, различаются точнее, чем неравные.
Акустический анализатор обеспечивает также отражение и положения источника звука в пространстве: его расстояние и направление относительно субъекта.
Пороги зависят от времени предъявления сигнала, положения головы испытуемого, адаптации и изменяются с течением времени для одного и того же испытуемого. Эти изменения могут составлять до 5 дБ за 0,5 мин, тогда как в некоторых условиях ярко выраженной тенденции к увеличению или уменьшению порога может и не быть даже в течение часа. Сравнение каждодневных изменений порогов, полученных в течение некоторого периода времени, с усредненными данными этих изменений показывает, что колебание изменений в 3 — 4 раза превышает усредненное. Иногда порог может изменяться даже в течение нескольких секунд. Если стимул состоит из пяти сигналов одного тона длительностью по 0,4 с, следующих друг за другом с интервалом в 0,6 с, то все они будут восприняты только при интенсивности, на 6 дБ превышающей абсолютный порог, когда не слышно ни одного из этих сигналов. Значительное влияние на величину порогов оказывает длительность сигнала. Так, для синусоидальных сигналов средних и высоких частот в диапазоне длительностей от 10 до 100 — 200 мс удвоение длительности приводит к понижению порога на 3 дБ.
Специфическим видом слухового восприятия является восприятие речевых сообщений. Речь представляет одно из наиболее эффективных исторически сложившихся средств передачи информации человеку. Вопрос о характеристиках речевых сигналов прежде всего возникает при разработке аппаратуры, предназначенной для передачи информации от человека к человеку. Однако этим его значение не ограничивается. В связи с развитием синтетической телефонии открываются возможности использования речевых сигналов также при обмене информацией между человеком и машиной.
Проблема речи имеет кардинальное значение в психологии. Она выступает в той или иной форме при изучении сенсорных процессов, памяти, умственных действий, двигательных навыков, свойств личности и т. д. Данные, накопленные в экспериментальной психологии, позволили раскрыть ряд существенных аспектов механизмов восприятия речи и речеобразования. Они послужили основой для постановки проблемы речевой коммуникации в плане инженерной психологии.
Задачи техники связи потребовали изучения зависимости восприятия речевых сигналов от их акустических характеристик, определения разборчивости речи в условиях шума, поиска путей повышения разборчивости и т. п.
Форма волны является функцией, которая связывает мгновенное речевое давление со временем. Речевое давление есть сила, с которой речевая волна давит на единицу площади, обычно перпендикулярной к губам говорящего и расположенной в произвольном, но определенном участке по отношению к говорящему, на расстоянии 1 м от него.
Речевой звук является сложным. Он включает ряд обертонов, находящихся в гармоничном отношении к основному тону (гармоник). Для повышения разборчивости речи увеличивают ее интенсивность.
Важным условием восприятия речи является различение длительности произнесения отдельных звуков и их комбинаций. Среднее время длительности произнесения гласного равно примерно 0,35 с. Длительность согласных колеблется от 0,02 до 0,3 с. При восприятии потока речи особенно важно различение интервалов между словами или группами слов. Исключение пауз или их неверная расстановка может привести к искажению смысла воспринимаемой речи.
Речь обладает не только акустическими, но и некоторыми другими специфическими характеристиками. Слово имеет определенный фонетический, фонематический, слоговой, морфологический состав, является определенной частью речи, несет определенную смысловую нагрузку. Важным фактором, влияющим на опознание слов, является их частотная характеристика. Чем чаще встречается слово, тем при более низком отношении речи к шуму оно опознается.
При восприятии отдельных слогов и слов существенную роль играют их фонетические характеристики; при восприятии словосочетаний в действие вступают синтаксические зависимости, а фонетические отступают на второй план.
Слушатель улавливает синтаксическую связь между словами, которая помогает ему восстановить сообщение, разрушенное шумом. Если абстрагироваться от лексико-семантических характеристик словосочетаний и представить только модель связи, то оказывается, что слушатель легче всего улавливает согласование, затем управление и, наконец, примыкание. Интересно отметить, что стереотипные словосочетания, фразеологизмы опознаются згачительно хуже, чем можно было бы ожидать исходя из вероятностной модели восприятия. Слишком большое сужение сочетательных возможностей слова ограничивает возможность поиска. Увеличение количества возможных ответов как бы расширяет «зону поиска» и тем самым повышает вероятность правильного опознания. Это лишний раз подтверждает положение о том, что аудирование есть активный процесс.
При переходе к фразам слушатель начинает ориентироваться уже не на отдельные элементы предложения, а на весь его сложный грамматический каркас.
Изучалось также восприятие речевых сообщений, которые включали фразы, допускающие неоднозначную интерпретацию (вызывающие «семантический шум»). Было показано, что в этих условиях процесс восприятия замедляется, возникает необходимость повторного восприятия тех частей текста, которые предшествуют критической фразе. В ходе восприятия человек, преодолевая неоднозначность, осуществляет трансформацию фраз.
Приведенные данные показывают, что аудирование представляет собой многоуровневый процесс, в котором сочетаются фонетический, синтаксический и семантический уровни. При этом вышележащие уровни играют ведущую роль, определяя ход всего процесса аудирования, что необходимо иметь в виду при организации речевых сообщений.
На качество восприятия и понимания речевых сообщений оператором оказывает влияние два основных интегральных фактора: правильное построение аудиотекста и организация речевого сообщения.
Аудиотекстом называется текст, предназначенный для смыслового восприятия на слух. Звуковая речевая связь в деятельности оператора очень часто принимает именно такую форму логического и семантического объединения отдельных слов и предложений в смысловые блоки — сверхфазовые единства (СФЕ). Понимание звучащего сообщения во многом обусловлено действием двух факторов: логико-смысловой структуры аудиотекста и его паралингвистической реализации (скорости речи, распределения фраз, интонации).
Логико-смысловая структура аудиотекста определяется способом изложения мыслей. Наиболее оптимальным считается дедуктивный способ их изложения (от общего к частному), при котором первое предложение нацеливает аудитора на восприятие определенной темы, после чего следует ряд конкретных положений, доказывающих правильность посылок умозаключений. В психолингвистических исследованиях при анализе текстов исходят из следующих положений:
■ расчленение всего текста на смысловые блоки — СФЕ;
■ представление схемы всего текста в виде логической цепочки, являющейся каркасом, на который как бы нанизывается весь текст;
■ вычисление в выделенных СФЕ информации с помощью некоторых формализованных процедур.
Информационная ценность аудиотекста может быть усилена с помощью полного или частичного повторения, особенно ключевых слов в СФЕ. Это обеспечивает избыточность сообщения и его помехоустойчивость. Большое значение при организации аудиотекста имеет также выбор слов для компоновки текстов и выбор грамматических конструкций. Словарь текста должен быть максимально ограничен условиями деятельности: чем он меньше, тем выше помехоустойчивость аудиотекста. Все слова должны быть понятны и знакомы, частота их встречаемости должна быть высокой. Грамматические конструкции и связи между словами должны быть четкими и простыми. Любое усложнение ведет к ухудшению понимания и разборчивости. Определенное значение имеет длина предложений аудиотекста (не более 9—11 слов) и компоновка смысловых блоков (не более 7). В противном случае происходит перегрузка оперативной памяти.
Организация речевого сообщения предусматривает построение его в форме, наиболее пригодной для восприятия оператором. Правильная организация речевого сообщения позволяет обеспечить требуемые уровни разборчивости речи. Она оценивается процентным отношением числа правильно принятых слушателем элементов речевой передачи к числу переданных. Элементами речи считаются: форманты (области концентрации энергии в спектре данного звука), отдельные звуки (фонемы), слоги, слова, словосочетания (фразы).
Разборчивость речи можно определить экспериментально с помощью артикуляционных таблиц и расчетным методом, исходя из разборчивости формант и известных функциональных зависимостей. Нормы разборчивости речи приведены в табл. 11.5.
Таблица 11.5
Нормы разборчивости речи
Вид речи | Качество связи, % | ||||
срыв связи | минимально допустимое | удовлетворительное | хорошее | отличное | |
Формантная | |||||
Звуковая | |||||
Слоговая | |||||
Словесная | |||||
Фразовая | — |
Разборчивость речи является важнейшей характеристикой, определяющей качество ее восприятия. В условиях тишины основным фактором, влияющим на разборчивость, является интенсивность. Частота голоса не оказывает существенного влияния на разборчивость речи: высокий и низкий голос понимаются одинаково хорошо. Оптимальный диапазон интенсивности речи составляет от 40 до 60 дБ. Основным фактором, влияющим на разборчивость
Рис. 11.9. Влияние уровня шума на разборчивость речи.
речи в условиях шума, является отношение мощности речи к мощности шума (рис. 11.9). Обычно речь бывает понятной, если интенсивность речи превышает интенсивность шума на 6 дБ.
Большое значение на разборчивость оказывает правильный выбор слов. В условиях шума двухсложные слова опознаются на 30% лучше, чем односложные, а трехсложные — на 50%. Слова с ударением на последнем слоге опознаются лучше, чем с ударением на первом. Важным фактором является также вероятностная характеристика слов: чем чаще оно встречается, тем лучше опознается. Наибольшей помехоустойчивостью к белому шуму обладают звуки Р, Л, М, Н, наихудшей — С, Ф, Ц, Т, Г. Распознаваемость слов повышается, если они начинаются с гласных. Оптимальным считается темп речи от 60 до 80 слов в минуту, допустимым — до 120 слов в минуту.
Длина фразы не должна превышать 7±2 слов, что определяется объемом оперативной памяти. Наиболее значащие слова следует располагать в первой трети фразы. В разрешающих фразах, командах разрешение следует располагать в конце фразы, после содержания действия, в запрещающих — наоборот.
Повышению разборчивости речи способствует зрительный контроль (возможность видеть говорящего). Эффективным при интенсивности речи более 85 дБ является применение шумозаглушек. Однако при уровне более 95 дБ применение шумозаглушек может оказаться неэффективным. Большое значение имеет выполнение специальных требований к говорящему: достаточная интенсивность и оптимальный темп речи; большая продолжительность слогов; повышенная вариативность звуковых высот; преобладание (по времени) речевых звуков, а не пауз; повторение передачи должно иметь ту же структуру и те же слова, что в первоначальном случае.
С помощью речи формируется особый вид сигналов, называемых речевыми. Любой сигнал является носителем информации (см. главу И). Речевой сигнал и представляемая им информация используются в деятельности оператора, а следовательно являются объектом изучения инженерной психологии в следующих случаях:
■ при организации общения между операторами (речевая коммуникация);
■ при организации взаимодействия между человеком и ЭВМ (речевой ввод и вывод информации);
■ при проведении контроля функционального состояния оператора: по анализу спектрально-временных характеристик речи можно судить о состоянии человека в процессе его работы;
■ при организации подсказки оператору о необходимых действиях.