Представление звуковых данных
Звук – это упругая продольная волна в воздушной среде. Чтобы ее представить в виде, читаемом компьютером, необходимо выполнить следующие преобразования (рис. 1.5.1).
Звуковой сигнал преобразовать в электрический аналог звука с помощью микрофона. Электрический аналог получается в непрерывной форме и непригоден для обработки на цифровом компьютере. Чтобы перевести сигнал в цифровой код, надо пропустить его через аналого-цифровой преобразователь (АЦП). При воспроизведении происходит обратное преобразование – цифро – аналоговое (ЦАП). АЦП и ЦАП находятся в звуковой карте компьютера.
| |||||||
Токовый аналог Дискретизация Обработка
звука двоичного кода кода
Упругая
волна в
воздушной
среде U U
t t
Рис. 1.5.1. Схема обработки звукового сигнала
Во время оцифровки сигнал дискретизируется по времени и по уровню. Дискретизация по времени выполняется следующим образом: весь период времени Т разбивается на малые интервалы времени , точками t1, t2, …, tn. Предполагается, что в течение интервала уровень сигнала изменяется незначительно и может с некоторым допущением считаться постоянным. Величина n= называется частотой дискретизации. Она измеряется в герцах. (Гц) – количество измерений в течение сек.
Дискретизация по уровню называется квантованием и выполняется так: область измерения сигнала от самого малого значения X min до самого большого X max разбивается на N равных квантов, промежутков величиной точками х1, х2, … , хn, xi = Xmin + Каждый квант связывается с его порядковым номером, т.е. целым числом, которое легко может быть представлено в двоичной С.С. Если сигнал после дискретизации по времени попадает в промежуток xi-1 , то ему в соответствие ставиться код i. Теорема Найквиста утверждает, что, если сигнал оцифрован с частотой , то высшая «слышимая» частота будет не более . Число уровней подбирается так, чтобы звук не имел высокого уровня шума и «электронного» оттенка звучания. Число уровней берется как 2n. Чтобы измерение занимало целое число байт, выбирают n=8 или n=16, т.е. один или два байта.
Высокое качество воспроизведения получается в формате лазерного аудиодиска при следующих параметрах оцифровки: частота дискретизации – 44,1 Гц, квантование – 16 бит, т.е. . Т.о. 1 сек стерео звука займет 2 байт * 44100 байт/с * 2 кан. * 1 с = 176400 байт дисковой памяти. При этом качество звука получается очень высоким.
Для телефонных переговоров удовлетворительное качество получается при частоте дискретизации 8 кГц и частоте квантования 255 уровней, т.е. 1 байт, при этом 1 сек звуковой записи, займет на диске 1 байт * 8000 байт/с * 1 с = 8000 байт.