Понятие формата аудиофайлов
В процессе развития индустрии звукозаписи для решения различных задач были разработаны различные физические методы хранения аудиоданных, например виниловые пластинки, магнитная лента, компакт-диски, теперь - DVD, и т. д., точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных. Мы знаем эти методы как форматы аудиофайлов. Формат аудиофайла представляет собой спецификацию, описывающую структуру, в которой аудиоданные хранятся в файле. Например, один формат аудиофайлов может указывать, что биты и байты аудиоданных должны быть сохранены в определенном порядке, а другой формат - что данные должны быть сохранены в совершенно другом порядке.
Почему вы не можете обойтись одним форматом аудиоданных? А потому, что вы можете использовать ваши аудиоданные для различных задач, например для воспроизведения в дисководе для компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа или даже для загрузки через Интернет. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает около 10 Мбайт. Это слишком большой объем данных для того, чтобы его можно было пропускать через медленные телефонные линии.
Кроме различий в разрядности и частоте сэмплирования, некоторые форматы аудиофайлов предлагают также сжатие данных. В некоторых случаях сжатие не влияет на качество звука, но в большинстве случаев ухудшение звука наблюдается. При сжатии вам приходится находить компромисс между качеством звука и размером файла, который вы, в конце концов, получите. Существует много различных схем сжатия, и о них мы вкратце поговорим ниже.
Ниже рассмотрены наиболее распространенные форматы аудиофайлов:
Dialogic VOX - это оптимизированный формат аудиофайлов, используемый в основном для телефонных приложений. Формат Dialogic VOX позволяет сохранять 16-битные аудиоданные и сжимать их, преобразуя в 4-битные аудиоданные, что дает степень сжатия 4:1. Конечно, качество звука при этом страдает, да и этот формат поддерживает только монофонические данные. Файлы в формате Dialogic VOX имеют расширение vox.
РСМ (pulse code modulation - импульсно-кодовая модуляция) это цифровое кодирование, используемое для представления несжатых аудио-данных на AudioCD. Звук может быть записан с частотой дискретизации до 96 кГц. и размером отсчета до 24 бит.
Dolby Digital - многоканальный звук, сокращенно DD, сжатый с использованием технологии АС-3 с частотой дискретизации 48 кГц и размером отсчета до 24 бит. Dolby Digital поддерживает до шести каналов звука, один из которых низкочастотный, поэтому шесть каналов Dolby Digital часто обозначаются как 5.1. Данный формат чаще всего используется для записи звука на VideoDVD. В формате Dolby Digital может быть записан как монозвук, так и звук Dolby Surround.
Digital Theater Sound - система объемного звучания, впервые примененная в фильме "Парк Юрского периода", сокращенно DTS. Формат DTS поддерживает шестиканальный звук 5.1, но отличается лучшим качеством звучания по сравнению с Dolby Digital за счет меньшего сжатия сигнала, из-за чего звук в формате DTS занимает больше места на диске. Если звуковая дорожка в формате DD оставляет возможность записи звукового сопровождения на разных языках, то с форматом DTS подобной возможности нет. Для декодирования формата DTS нужен внешний декодер, существуют также DTS -совместимые бытовые DVD-плееры, которые имеют логотип DTS Digital Out и встроенный DTS-декодер.
ADPCM (adaptive delta pulse code modulation - адаптивная импульсно-кодовая модуляция) является методом кодирования, применяемым для представления сжатых аудиоданных. Существует стандартный метод ADPCM, утвержденный IMA (International Multimedia Association - Международная Ассоциация Мультимедиа).
InterVoice - формат InterVoice предназначен для использования в приложениях телефонии. Он поддерживает только 8-битные монофонические аудиоданные, зато имеет несколько различных схем сжатия. В число этих схем входят как A-Law, так и u-Law. Файлы InterVoice имеют расширение ivc.
Ø A-Law представляет собой схему сжатия звука, оптимизированную для сжатия голосовых аудиоданных, и широко используется для телекоммуникационных приложений в США. Схема сжатия A-Law позволяет перекодировать 16-битный звук РСМ в 8-битный звук РСМ.
Ø u-Law (или mu-Law) тоже является схемой сжатия, оптимизированной для сжатия голосовых аудиоданных, но используется для телекоммуникационных приложений в Европе. Как и A-Law, схема u-Law позволяет перекодировку 16-битного звука РСМ в 8-битный звук РСМ.
Macintosh AIFF (.AIF/.SND) - это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Он поддерживает 8- и 16-битные монофонические и стереофонические аудиоданные. Файлы этого формата могут содержать заголовок Mac-Binary. Если файл данного типа не содержит заголовка Mac-Binary, он, скорее всего, имеет расширение aif. Если файл данного типа содержит заголовок Mac-Binary, то Sound Forge откроет его, но идентифицирует как файл формата Macintosh Resource. В этом случае файл, скорее всего, имеет расширение snd.
Macintosh Resource - используется для хранения звуковых файлов, но для него является обязательным наличие заголовка Mac-Binary, (расширение - snd).
MPEG Audio - формат звуковых файлов МРЗ - многоканальный звук, сжатый с частотой дискретизации 48 КГц и размером отсчета 16 бит. Этот формат позволяет сжимать аудиоданные приблизительно в 12 раз, сохраняя при этом качество, близкое к качеству записей на компакт-дисках.
NeXT/Sun - формат аудиофайлов NeXT/Sun также является стандартным форматом для компьютеров NeXT и Sun Spare station. Этот формат поддерживает много типов аудиоданных, в том числе 8- и 16-битные, моно и стерео.
RealMedia - формат позволяет создавать потоковые аудио- и видеофайлы для передачи через Интернет. Он предлагает сложные собственные функции сжатия, позволяющие передавать аудио- и видеоданные через Интернет в режиме реального времени. Это означает, что вы можете начинать прослушивать или просматривать данные еще до того, как они будут полностью скачаны на жесткий диск вашего компьютера. Формат RealMedia был создан компанией RealNetworks.
Sound Designer 1 - формат аудиофайлов, предназначен для конкретного приложения - Sound Designer 1, используемого на компьютерах Macintosh. Поддерживает только 16-битный монофонический звук. Файлы имеют расширение dig или sd.
AVI (Audio Video Interleaved - чередование видео и аудио) представляет собой специальный цифровой формат файлов, разработанный для работы с видео. AVI формат для Windows, а это означает, что любой компьютер с Windows может воспроизводить файлы AVI. Формат предоставляет несколько различных схем сжатия для сохраняемых в нем видео- и аудиоданных. Кроме того, файлы AVI поддерживают многодорожечный звук, но программа Sound Forge позволяет работать только с одной звуковой дорожкой.
Microsoft Wave – этот формат представляет собой еще один очень популярный формат аудиофайлов, является форматом для Windows. Поддерживает множество типов аудиоданных, в том числе 8- и 16-битные, моно и стерео. Формат Wave имеет поддержку для огромного количества схем сжатия, включая многие варианты ADPCM через Microsoft ACM (Audio Compression Manager - Менеджер сжатия звука). Файлы в Wave имеют расширение wav.
Windows Media Audio - специальный формат аудиофайлов, позволяющий создавать потоковые аудиофайлы для передачи через Интернет. Он является форматом для операционной системы Windows, а это означает, что любой компьютер с операционной системой Windows (с установленной программой Windows Media Player) может воспроизводить файлы Windows Media Audio. Формат Windows Media Audio поддерживает также и видеоданные. Windows Media Audio содержит собственные сложные функции сжатия, позволяющие передавать аудиоданные через Интернет в режиме реального времени. Другим сходством с RealMedia является то, что сжатие влияет на качество звуковых данных. Файлы Windows Media имеют расширения wma и asf.