Перечень и области применения наиболее распространенных форматов звуковых файлов без заголовка

Http://bourabai.ru/mmt/audio.htm

Аудиоинформация в мультимедийных технологиях

Звуковая информация (аудиоинформация) в мультимедийных системах технологически обычно представляется в виде аудиоряда, то есть последовательности значений амплитуды звукового давления, записанных в цифровой форме.

Аудиоряд может включать речь, музыку, эффекты (звуки типа шума, грома, скрипа и т.д.). Файлы, содержащие цифровую запись аудиоданных (голоса, музыкальных произведений или их фрагментов и других звуков любой природы).

Существуют два основных типа звуковых файлов: с оцифрованным звуком и нотной записью.

Файлы с оцифрованным звуком

Звуковые файлы, в которых исходная непрерывная ("аналоговая") форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных ("выбранных") через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией, а такую форму записи - импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation – PCM). Аппаратная реализация обработки оцифрованного звука состоит в том, что АЦП преобразует аналоговый сигнал во множество цифровых замеров, а при воспроизведении ЦАП осуществляет обратный процесс - преобразование цифрового сигнала в аналоговый. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.

Основные понятия, термины и другие данные, связанные с оцифровкой звука

Выборка, отсчет (звукового сигнала) - дискретное ("мгновенное") значение, соответствующее минимальному фрагменту исходного звукового сигнала. Выборка характеризует амплитуду звукового сигнала и обычно представляет собой целое число (8 или 16 бит). Может производиться по одному каналу (моно), двум (стерео) или большему числу каналов. Процесс разделения сигнала на выборки называется квантованием.

Разрядность дискретизации - величина, определяющая количество бит на один канал. Чем выше разрядность дискретизации, тем выше качество записи и воспроизведения звука.

Частота дискретизации - величина, которая определяет, сколько раз в секунду производится считывание выборок из аналогового сигнала. При цифровой записи звуков частота дискретизации измеряется в герцах и килогерцах. Чем выше частота дискретизации, тем выше качество звука.

Некоторые форматы звуковых файлов поддерживают произвольную частоту дискретизации (например, VOC-файлы в диапазоне от 5000 до 44100 Гц); другие - только определенные частоты дискретизации (WAV-файлы могут быть оцифрованы с частотами 11 025, 22050, 44100 Гц). Поэтому конвертирование (преобразование) файла одного формата в другой не всегда возможно.

Файлы с заголовком

В заголовке указываются параметры, которые характеризуют оцифрованный звук, включая: частоту дискретизации; количество битов на отсчет (8 или 16); количество каналов - моно (1) или стерео (2); ASCII-символы, описывающие тип файла; длину записанных данных в байтах; номер версии формата; метод компрессии; величину смещения блока данных относительно начала файла и др.

Перечень и области применения наиболее распространенных форматов звуковых файлов с заголовком:

Расширение Краткие сведения о форматах
*.aiff, *.aif AIF, AIFF [Audio Interchange File Format] - данный формат распространен в системах Apple Macintosh и Silicon Graphics; AIFC, AIFF-С [Audio Interchange File Format-Compressed] - тот же AIFF, только с заданными параметрами сжатия (компрессии); используются в ПК фирмы Apple.
*.au *.snd AU - звуковой формат предназначен для работы со звуком в рабочих системах SUN, NeXT, DEC, Linux и FreeBSD; обеспечивает экономию памяти, благодаря чему нашел широкое распространение в Интернете.
*.iff IFF [Interchange File Format] - формат, который имеет сходство с RIFF [Resource Interchange File Format], являющимся универсальным для записи любых структурированных данных. Основное отличие заключается в поддержке им так называемой программно-сэмплерной эмуляции музыкальных инструментов. Звук в файле делится на две части: то, что должно звучать вначале, и элемент того, что идет за началом. В результате вторая часть звукового фрагмента повторяется за начальной столько раз, сколько нужно пользователю и нота может звучать сколь угодно долго. Используется в системах типа IFF/8SVX на компьютерах фирмыAmiga.
*.mp3 MР3 - формат, в котором использованы параметры сжатия, имеющие сходство с форматом jpeg для изображений. Коэффициент сжатия составляет 10 - 12 раз, однако специалистами он считается достаточно сложным и не обеспечивающим высокое качество звука.
*.voc VOC [Voice File] - 8-битный моно-формат семейства звуковых карт SoundBlaster фирмы Creative Labs. Широко используется в старых немузыкальных программах. HСОМ - то же самое, что и VOC (8 бит, моно), но только для ПК фирмы Apple Macintosh.
*.wav WAVE [Waveform Audio File] - формат, разработанный фирмой Microsoft и зарекомендовавший себя одним из простейших для записи и хранения дискретных данных. Относится к одному из вариантов файлов семейства RIFF [Resource Interchange File Format] и является жестко структурированным. В заголовке помимо обычных значений (в том числе разрядность, уровни громкости и т.п.) в wav могут быть указаны и многие другие параметры, например, метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также текстовая информация.

Перечень и области применения наиболее распространенных форматов звуковых файлов без заголовка

Расширение Краткие сведения о форматах
*.pcm PCM* [Pulse Code Modulation] - буквально: "Импульсно-кодовая модуляция - ИКМ". Хотя файлы с таким расширением встречаются редко (в основном на аудио-CD), ИКМ является основополагающей для всех звуковых файлов. Метод записи и хранения аудиоинформации в этом формате неэкономный, однако объемы современных устройств внешней памяти (в том числе винчестеров и оптических дисков) позволяют его использовать несмотря на связанные с этим потери, которые могут составлять десятки мегабайт.
*.dpcm DPCM* [Difference Pulse Code Modulation] - вариант формата PCM, в котором с целью повышения экономии хранения звуковых данных на диске использован метод сжатия записи, получивший наименования "Разностного РСМ". Данная схема сжатия с фиксированной скоростью преобразовывает последовательность измерений, сохраняя только разницу между последующим и предыдущим значениями сигналов. Сохранение дискового пространства происходит за счет того, что значение разности меньше самих измерений
*.adpcm ADPCM [Adaptive DPCM] - "Адаптивный DPCM": формат DPCM, дополненный использованием так называемого коэффициента масштабируемости. Необходимость этой меры обусловлена требованием исключения искажений звука, вызванных ошибками измерения разности амплитуд сигналов, которые связаны со значительными перепадами громкости отдельных составляющих звука.

Форматы семейства PCM используются не только для записи звука, но и сейсмограмм, где неприемлемы способы сжатия по времени, не дающие возможность осуществить прецизионную службу времени (точность записи по временной шкале).

Наши рекомендации