Выбор частоты оцифровки звука

Главная задача при оцифровке звука — создавать высококачественные звуковые дорожки, которые хорошо воспроизводятся и при этом занимают меньше места на диске и быстрее передаются по сети.

Правильно выбрать частоту оцифровки — это только половина дела. Значения напряжения при записи звука хранятся в виде чисел, поэтому точность — количество цифр после запятой — также важна. Высокая точность означает больше нюансов в диапазоне от самого громкого до самого тихого звука, но также и больше ресурсов компьютера. Выбор точности так же важен, как и выбор цветовой глубины изображения: 8-разрядный файл (256 цветов) проще обрабатывать и хранить, чем 16-разрядное изображение (65 536 цветов).

Высокими частотами можно пожертвовать, хотя ревнители качества наверняка поморщатся. Частота самой высокой ноты, которую может сыграть скрипач, не превышает 5 кГц (или 5000 колебаний в секунду) и легко воспроизводится на звуковой дорожке сравнительно низкого класса. Гармоники с частотой больше 5 кГц добавляют блеск и естественность и помогают отличать скрипку Страдивари от инструмента, купленного в универмаге, но они не существенны для восприятия музыкальных нот как таковых. Для сравнения: наибольшая частота, передаваемая телефоном, — около 3,5 кГц, хотя телефоны также вносят шумы и искажения. Цифровой звук не может воспроизвести детали, попавшие между моментами измерения напряжения (между сэмплами). С математической точки зрения частота оцифровки должна в два раза превышать частоту записываемого сигнала. При записи компакт дисков, чтобы иметь определенный "запас прочности", используют частоту оцифровки 44 100 сэмплов/с — 44 100 Гц для передачи звука частотой 20 кГц с высокой точностью. Однако при создании компьютерных видеоклипов мультимедиа-проектов необходимо считаться с возможностями машины: большая частота оцифровки (sample rate) требует больше места для хранения файла и более совершенного компьютера для воспроизведения. Результат незначительного добавления высоких частот может не стоить затрачиваемых усилий.

Изменение частоты оцифровки с 22 до 24 кГц позволяет записывать только на одну ноту выше (на низких частотах такой прием более эффективен: в диапазоне первой тысячи герц содержатся все тона — от самого низкого звука органа до самой верхней ноты саксофона-сопрано). Очень немногие взрослые люди могут слышать звуки частотой выше 15 кГц: эта частота обычно также является предельной для стереофонической радиотрансляции. Фильмы, снятые до середины 60-х годов, — даже знаменитые голивудские мюзиклы — ограничивались частотой 12 кГц, что приблизительно соответствует компьютерному звуку с дискретностью 22 кГц. Голос взрослого мужчины редко поднимается выше частоты 7,5 кГц, и это стало общепринятым ограничением для "разговорных" радиопередач, звучащих в эфире вполне натурально.

Параметры цифровой обработки звука в зависимости от области применения представлены в следующей таблице.

Применение Частота оцифровки (КГц)
44,1
Телепередача + + +        
Звуковой компакт-диск   +          
Радиопередача УКВ (США)     +        
Радиопередача УКВ (Европа)   +          
Радиопередача ДВ       +      
Видеомагнитофон     + +      
Презентации на компьютере         +    
Звук в Интернете           +  
Музыкальная дорожка       +      
Голос за кадром       + +    
Звуковые эффекты         + +  
Смешанная дорожка       +      
Учебный видеофильм         + +  
Голосовая почта           + +
Приблизительный размер файла (Мбайт) для записи длительностью 1 мин.
16-разрядная запись 7,3 2,5 1.8 1,1
8-разрядная запись 2,7 2,5 1,8 1,25 0,62 0,45 0,3

Цифровой звук не имеет цветов, но у него есть эквиваленты черного и белого — разница между тишиной (все биты равны нулю) и максимальной громкостью (все биты равны единице). Все, что "тише" нуля, не может быть записано. Все, что звучит громче максимума, ужасно искажается. Можно увеличить громкость, но при этом станут звучать громче и тихие звуки. Диапазон уровня записи не меняется и зависит только от разрядности сэмпла. Аудиоинженеры называют это отношением "сигнал/шум" и измеряют его в децибелах (дБ). При записи компакт-дисков используются 16-разрядные "слова", именно поэтому получается такая чистая запись с очень слабым шумом, вносимым системами записи и воспроизведения. Профессиональное записывающее оборудование часто работает с разрядностью 20 или 24 бита, чтобы гарантировать еще более чистый сигнал. Тем не менее каждый лишний разряд требует дополнительного времени процессора и места на диске.

В окончательном варианте записи такой диапазон вам может и не понадобиться. Голивудские мюзиклы обычно имели отношение "сигнал/шум" 50 дБ, в цифровых терминах — менее 9 бит. Лучшие студийные магнитофоны десять лет назад достигали диапазона всего лишь 72 дБ — порядка 12 бит (система шумоподавления Dolby, как казалось, добавляла еще пару битов, но на самом деле сводилась лишь к сжатию с потерей качества). Поскольку в компьютерах используются 8-разрядные байты, вам придется выбирать между 8-разрядной записью (48 дБ — приблизительно столько же, сколько в средней радиопередаче на УКВ) и 16-разрядной (96 дБ, что уже переходит разумные границы).

Если мультимедийное приложение будет проигрываться на выставке или в шумном офисе, тонкостей никто не услышит. Это подобно бликам на экране, мешающим видеть изображение. Даже шум вентилятора вашего компьютера понизит эффективную разрядность на 2 бита. Работники радиостанций понимают это (автомобиль с открытыми окнами — еще худшая среда) и стараются "загнать" свой сигнал в возможно более узкий диапазон. Для деловых и мультимедиа-применений качественная 8-разрядная звуковая дорожка более чем достаточна — если вы тщательно над ней поработали. Это может не получиться на дешевых звуковых платах. Проблема не в цифровой части, а в аналоговых схемах, используемых для дискретизации сигнала и обратного преобразования. Дешевле добавить лишний разряд данных, чем спроектировать хороший преобразователь, поэтому производители пишут на коробке "16-битовый звук", но не говорят вам, насколько некачественны эти биты.

Даже если ваш компьютер имеет превосходные звуковые параметры, в процессе обработки и монтажа файлов в них привносится шум. В большинстве случаев полезно записывать и редактировать звук с 16 разрядами, а окончательный вариант преобразовать в 8-разрядный формат. Это не касается частоты оцифровки. После дискретизации звука высокие частоты никуда не денутся, если вы их специально не обрежете. Большинство звуковых плат лучше всего работают на максимальных частотах, поэтому запись лучше всего произвести с дискретизацией 44,1 кГц., а затем сразу же преобразовать файл к низшей частоте.

Наши рекомендации