Тема: Представление звуковой информации

ЛЕКЦИЯ

План:

1. Аналоговый и дискретный способы представления изображений и звука

2. Двоичное кодирование звуковой информации

Тема: Представление звуковой информации - student2.ru 1. Аналоговый и дискретный способы представления изображений и звука

Человек способен воспринимать и хранить информацию в форме образов (зрительных, звуковых, осязательных, вкусовых и обонятельных). Зрительные образы могут быть сохранены в виде изображений (рисунков, фотографий и так далее), а звуковые — зафиксированы на пластинках, магнитных лентах, лазерных дисках и так далее.

Информация, в том числе графическая и звуковая, может быть представлена в аналоговойили дискретнойформе. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Приведем пример аналогового и дискретного представления информации. Положение тела на наклонной плоскости и на лестнице задается значениями координат X и Y. При движении тела по наклонной плоскости его координаты могут принимать бесконечное множество непрерывно изменяющихся значений из определенного диапазона, а при движении по лестнице — только определенный набор значений, причем меняющихся скачкообразно.

Тема: Представление звуковой информации - student2.ru Рис.1. Аналоговое и дискретное кодирование

Примером аналогового представления графической информации может служить, например, живописное полотно, цвет которого изменяется непрерывно, а дискретного — изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета. Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации произ­водится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.

Тема: Представление звуковой информации - student2.ru Дискретизация— это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.

Тема: Представление звуковой информации - student2.ru 2. Двоичное кодирование звуковой информации

Временная дискретизация звука. Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек» — рис. 2.

Тема: Представление звуковой информации - student2.ru

Рис. 2 Временная дискретизация звука

Каждой «ступеньке» присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

звуковая волна —> МИКРОФОН —> переменный электрический ток —> АУДИОАДАПТЕР —> —> двоичный код —> ПАМЯТЬ КОМПЬЮТЕРА

Процесс воспроизведения звуковой информации, сохранённой в памяти компьютера:

ПАМЯТЬ КОМПЬЮТЕРА —> двоичный код —>АУДИОАДАПТЕР —> переменный электрический ток —> ДИНАМИК —> звуковая волна

Тема: Представление звуковой информации - student2.ru Аудиоадаптер (звуковая плата) — специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера: частотой дискретизации и разрядностью

Тема: Представление звуковой информации - student2.ru Частота дискретизации — это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду — 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров: 11 кГц, 22 кГц, 44,1 кГц и др.

Тема: Представление звуковой информации - student2.ru Разрядность регистра — число битов в регистре аудиоадаптера. Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 28 = 256 (216 = 65 536) различных значений. Очевидно, 16-разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный.

Тема: Представление звуковой информации - student2.ru Звуковой файл — файл, хранящий звуковую информацию в числовой двоичной форме. Как правило, информация в звуковых файлах подвергается сжатию.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2I = 216 = 65536,

где I— глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты, дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

Тема: Представление звуковой информации - student2.ru Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц – качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.

Можно оценить информационный объём стереоаудиофайла длительностью звучания 1 секунда при высоком качестве звука (16 битов, 48кГц). Для этого количество битов, приходящихся на одну выборку, необходимо умножить на 2 (стерео):

16 бит ∙ 48000 ∙ 2 = 1 536 000 бит = 192 000 байт = 187,5 Кбайт.

Стандартное приложение Звукозапись играет роль цифрового магнитофона и позволяет записывать звук, то есть дискретизировать звуковые сигналы, и сохранять их в звуковых файлах в формате WAV. Эта программа позволяет редактировать звуковые файлы, микшировать их (накладывать их друг на друга), а также воспроизводить.

Тема: Представление звуковой информации - student2.ru Запись звукового файла

1. Запустить Звукозапись [Пуск - Программы - Стандартные - Развлечения - Звукозапись]. Для установки параметров дискретизации звука ввести команду [Файл - Свойства]. На панели Свойства объекта «Звук» щёлкнуть по кнопке Преобразовать.

2. На панели Выбор звука из раскрывающегося списка выбрать режим кодирования звука (глубина кодирования, частота дискретизации, моно/стерео).

Тема: Представление звуковой информации - student2.ru Тема: Представление звуковой информации - student2.ru

Тема: Представление звуковой информации - student2.ru ЗНАТЬ

Информация, в том числе графическая и звуковая, может быть представлена в аналоговойили дискретнойформе.

Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, то есть разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации произ­водится кодирование, то есть присвоение каждому элементу конкретного значения в форме кода.

Дискретизация— это преобразование непрерывных изображений и звука в набор дискретных значений в форме кодов.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

звуковая волна —> МИКРОФОН —> переменный электрический ток —> АУДИОАДАПТЕР —> —> двоичный код —> ПАМЯТЬ КОМПЬЮТЕРА

Процесс воспроизведения звуковой информации, сохранённой в памяти компьютера:

ПАМЯТЬ КОМПЬЮТЕРА —> двоичный код —>АУДИОАДАПТЕР —> переменный электрический ток —> ДИНАМИК —> звуковая волна

Аудиоадаптер (звуковая плата) — специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

Частота дискретизации — это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду — 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров: 11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра — число битов в регистре аудиоадаптера. Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 28 = 256 (216 = 65 536) различных значений. Очевидно, 16-разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный.

Звуковой файл — файл, хранящий звуковую информацию в числовой двоичной форме. Как правило, информация в звуковых файлах подвергается сжатию.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Контрольные вопросы и задания

1. Приведите примеры аналогового и дискретного способов представления графической и звуковой информации.

2. В чем состоит суть процесса дискретизации?

3. В чём состоит принцип двоичного кодирования звука?

4. От каких параметров зависит качество двоичного кодирования звука?

Наши рекомендации