Редактирование цифровой записи
После записи выполняется редактирование. Типовые функции редактирования в обычной программе записи и редактирования звуковых файлов:
Тримминг (Trimming). Удаление "мертвого воздуха" или пустого места в начале записи или в конце. Удалив всего несколько секунд записи, можно существенно изменить размер файла
Секционирование и сборка. Удаление шумов, которые проникли в запись, выполнение сборки длинных записей из имеющихся коротких записей или разрезка имеющихся длинных записей.
Преобразование форматов. Большинство программ редактирования звука для Macintosh записывают звуковые файлы в форматах SND AIF, и большинство инструментальных систем могут читать эти форматы. В среде Windows большинство программ редактирования звука читает файл в формате WAV.
Повторное квантование. Если запись или редактирование звука выполнялась с 16-битными частотами квантования, а используются более низкие частоты и разрешение, то необходимо повторить процесс квантования с соответствующими частотами и разрешением. Это значительно уменьшит размер файлов.
Нарастание (fade-in) и затухание (fade-out) звука. Большинство программ имеют возможность создавать эффект затухания или нарастания звука, что часто используется для сглаживания начала и конца звукового файла.
Временное растяжение. Более сложные программы позволяют изменять длительность файла, не изменяя при этом уровня звучания. Но необходимо помнить, что большинство алгоритмов растяжения понижают качество звукового файла, если растяжение превышает несколько процентов в обоих направлениях.
Цифровая обработка сигнала. Некоторые программы позволяют обрабатывать сигнал с помощью специальных эффектов: реверберация (reverberation), задержки включения (multitap delay), рефрен (chorus), двойное звучание (flange) и др.
Сжатие звуковых файлов
Для сжатия информации используется дифференциальная импульсно-кодовая модуляция (Differential Pulse Code Modulation). В этом случае сохраняется только разность между текущим значением сигнала и предшествующим. Дифференциальная импульсно-кодовая модуляция основана на том факте, что разность требует меньшего количества бит, чем полная величина амплитуды. Дельта-модуляция (Delta Modulation) представляет собой вариант дифференциальной импульсно-кодовой модуляции, при которой для кодирования каждого дискретного значения сигнала используется единственный бит, отражающий изменение сигнала на единичную величину в сторону увеличения или уменьшения. Однако наибольшее распространение, в частности, для записи звука получила так называемая адаптивная импульсно-кодовая модуляция (Adaptive Pulse Code Modulation, ADPCM).
Формат МРЗ
MP3 (сокращение от MPEG Layer3) - один из цифровых форматов хранения аудио, используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.
МРЗ - потоковый формат; исходный сигнал при кодировании разбивается на равные по продолжительности участки, именуемые фреймами и кодируемые отдельно, а при декодировании конечный сигнал формируется из последовательности декодированных фреймов.
Высокая степень компактности МРЗ по сравнению с импульсно-кодовой модуляцией 16Bit Stereo 44.1 kHz (в формате CD Audio) достигается с помощью дополнительного квантования с учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом, предыдущего фрейма, вызывающего временное понижение чувствительности уха о к сигналу текущего фрейма. Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов.
Степень сжатия, и, соответственно, объем дополнительного квантования, определяются не форматом, а самим пользователем в момент задания параметров кодирования. Ширина потока (bitrate) варьируется от наибольшего для МРЗ, равного 320kbs (320 килобит в секунду), до 96kbs и ниже. Термин битрейт обозначает общую ширину потока, безразлично к тому, монофонический или стереофонический сигнал он содержит.
Разные программы обработки и проигрывания звука дают разное качество кодирования и декодирования.
Выбор программы кодирования, ее параметров и степени cжатия/битрейта (и связанного с его уровнем качества) зависит главным образом от трех факторов:
— содержания оцифрованной звуковой информации (речь, звуковое сопровождение, высококачественная музыка);
— предполагаемого адресата аудиоинформации и уровня его претензий к качеству звука или скорости передачи аудиофайла по сети;
— предполагаемого качества воспроизводящей аудиоаппаратуры (аудиокарты и акустических систем).
Разные битрейты дают разное качество. Любители МРЗ абсолютно по-разному оценивают степень приемлемости одних и тех же битрейтов и имеют свой взгляд на то, какой битрейт следует считать оптимальным. Кто-то выбирает 128 kbs, другие 160 kbs, третьи золотую середину - от 192 kbs до 256 kbs. Некоторые - 320 kbs.
Битрейт 256 kbs следует считать совершенно достаточным для абсолютного большинства пользователей;
Тесты определили МРЗ 160 kbs... 192 kbs в большинстве случаев вполне приемлемыми для хранения аудио на компьютере, например, в компьютерных играх, когда внимание отвлечено;
Битрейт 320kbs - максимальный (степень сжатия - более чем в четыре раза), для кодирования аудио с характеристиками CD Audio, то есть 44.1 kHz 16bit Stereo;
Самым популярным все же остается битрейт 128 kbs, но при его использовании мы имеем скорее качество аудиокассеты, записанной с очень низким уровнем шумов.
В сети INTERNET, как правило, можно найти только МРЗ, закодированные с битрейтом 128 kbs, признанным оптимальным для использования в сети INTERNET.
МРЗ стал массово признанным форматом хранения аудиоинформации. Ситуация с форматом MP3 создала правовую коллизию, связанную с нелегальным распространением аудиотреков через сеть Интернет.
Стандарт МРЗ не определяет никакого точного стандартного математического алгоритма кодирования; он индивидуален для каждого разработанного кодера. Вместо этого стандарт определяет общую схему процесса кодирования, а также формат закодированного фрейма. Сами последовательности фреймов могут передаваться потоком (streaming) или храниться в файлах.
МРЗ файл, как и поток, состоит из последовательно расположенных фреймов, между которыми может содержаться произвольная информация. Основное требование состоит в том, что не должно быть совпадений с сигнатурой начала фрейма.
Часто к последовательности фреймов добавляют стандартный заголовок мета-аудиоформата WAV, и получается то, что называют WAV-MP3. Формат WAV является метаформатом для данных любого типа. Формат имеет стандартный заголовок и описания областей данных, которых может быть несколько, способ же кодирования аудиосигнала может быть каким угодно. Вполне могут содержаться данные, к аудио отношения не имеющие.
Оптические компакт-диски
Компакт-диск - традиционная среда для записи музыки, которую потом можно прослушать на бытовом CD-плейере или другом компьютере. Смонтированное видео можно записать в MPEG-4 или MPEG-1, если необходимо высокое качество, на стандартный CD-R емкостью 650 Мбайт поместится около 20 минут видео DVD-качества (MPEG-2 с разрешением 720 х 576, 25 кадров/с). Очень удобна архивация мультимедийных данных с последующим переносом их на любой компьютер.
Приводы CD-R и CD-RW соответствуют системам однократной (CD-Recordable -записываемый CD) и многократной (CD-ReWritable - перезаписываемый CD) записи компакт-дисков. Терминами CD-R и CD-RW обозначаются как устройства для записи, так и сами диски.
Для однократной записи используются компакт-диски, в которых отражающий слой выполнен преимущественно из золотой или серебряной пленки, а между ним и поликарбонатной основой расположен регистрирующий слой из органического материала, темнеющего при нагревании. В процессе записи лазерный луч нагревает выбранные точки слоя, которые темнеют и перестают пропускать свет к отражающему слою, образуя участки, аналогичные питам.
Ha CD-R организуется та же информационная структура, что и на штампованных дисках - ТОС и набор дорожек различных типов. Это позволяет при помощи соответствующего программного обеспечения записывать звуковые, фото- и видеодиски, которые могут затем проигрываться в бытовых звуковых и видеопроигрывателях. Однако отражающая способность зеркального слоя и четкость питов у дисков CD-R ниже обычного, отчего некоторые устройства могут работать с ними неуверенно.
В перезаписываемых дисках используется промежуточный слой из органической пленки, изменяющей под воздействием луча свое фазовое состояние с аморфного на кристаллическое и обратно, в результате чего меняется прозрачность слоя. Фиксация изменений состояния происходит благодаря тому, что материал регистрирующего слоя при нагреве свыше критической температуры переходит в аморфное состояние и остается в нем после остывания, а при нагреве до температуры значительно ниже критической восстанавливает кристаллическое состояние. Существующие диски выдерживают от тысяч до десятков тысяч циклов перезаписи. Однако их отражающая способность существенно ниже штампованных и однократных CD, что затрудняет их считывание в обычных приводах.
Для чтения CD-RW необходим привод с автоматической регулировкой усиления фотоприемника (Auto Gain Control), хотя некоторые обычные приводы CD-ROM и бытовые проигрыватели способны читать их наравне с обычными дисками. Способность привода читать CD-RW носит название Multiread.
Диски CD-R/CD-RW изготовляются со вспомогательной разметкой (pregroove) в которой закодирована временная сетка (ATIP - Actual Time In Pregroove, действительное время по разметке), которая одновременно служит и для разбивки диска на кадры (блоки), и дополнительная информация о диске - коды, рекомендуемые значения скорости вращения и мощности записывающего лазера. Разметка используется для нахождения служебных и пользовательских областей диска и для облегчения слежения за информационной дорожкой в процессе записи. При считывании слежение производится, как обычно, по записанной информационной дорожке. Кроме этого, диск содержит две служебные области: РСА (Power Calibration Area - область калибровки мощности) и РМА (Program Memory Area - область памяти программы), расположенные внутри от "официального" радиуса начала записи. РСА используется для выбора оптимальной мощности лазера перед каждой записью, а РМА - для временного хранения ТОС в случае записи одной сессии в несколько приемов. РСА и РМА являются таблицами фиксированной длины емкостью по 100 элементов каждая, что ограничивает как общее количество случаев записи, так и этапов формирования незакрытых сессий.
Минимальной единицей информации, записываемой на CD-R за один прием, является дорожка (track) в формате CD-DA или CD-ROM. Минимальная длина дорожки - 300 блоков (600 Кбайт, 4 сек). В начале каждой дорожки формируется служебный зазор (pre-gap), содержащий ее параметры, размером 150 блоков (300 Кбайт, 2 сек) для однотипных дорожек и 225 блоков (450 Кбайт, 3 сек) для дорожек разных типов. Одна или несколько дорожек образуют программную область (Program Area), которая может формироваться в несколько приемов, между которыми адреса и параметры дорожек (ТОС) сохраняются в РМА.