Редактирование цифровой записи

После записи выполняется редактирование. Типовые функции редакти­рования в обычной программе записи и редактирования звуковых файлов:

Тримминг (Trimming). Удаление "мертвого воздуха" или пустого места в начале записи или в конце. Удалив всего несколько секунд записи, мо­жно существенно изменить размер файла

Секционирование и сборка. Уда­ление шумов, которые проникли в запись, вы­полнение сборки длинных записей из имеющихся коротких записей или раз­резка имеющихся длинных записей.

Преобразование форматов. Большинство программ редактирования звука для Macintosh записывают звуковые файлы в форматах SND AIF, и большинство инструментальных систем могут читать эти форматы. В среде Windows большинство программ редактирования звука читает файл в формате WAV.

Повторное квантование. Если запись или редактирование звука выполнялась с 16-битными частотами квантования, а используются более низкие частоты и разрешение, то необходимо повторить процесс квантования с соответствующими частотами и разрешением. Это значительно уменьшит размер файлов.

Нарастание (fade-in) и затухание (fade-out) звука. Большинство программ имеют возможность создавать эффект затухания или нарастания звука, что часто используется для сглаживания начала и конца звукового файла.

Временное растяжение. Более сложные программы позволяют изменять длительность файла, не изменяя при этом уровня звучания. Но необходимо помнить, что большинство алгоритмов растяжения понижают качество звукового файла, если растя­жение превышает несколько процентов в обоих направлениях.

Цифровая обработка сигнала. Некоторые программы позволяют обра­батывать сигнал с помощью специальных эффектов: реверберация (reverberation), задержки включения (multitap delay), рефрен (chorus), двой­ное звучание (flange) и др.

Сжатие звуковых файлов

Для сжатия информации используется дифференциальная импульсно-кодовая модуляция (Differential Pulse Code Modulation). В этом случае сохраняется только разность между текущим значением сигнала и предшествующим. Дифферен­циальная импульсно-кодовая модуляция основана на том факте, что раз­ность требует меньшего количества бит, чем полная величина амплитуды. Дельта-модуляция (Delta Modulation) представляет собой вариант диффе­ренциальной импульсно-кодовой модуляции, при которой для кодирования каждого дискретного значения сигнала используется единственный бит, от­ражающий изменение сигнала на единичную величину в сторону увеличе­ния или уменьшения. Однако наибольшее распространение, в частности, для записи звука по­лучила так называемая адаптивная импульсно-кодовая модуляция (Adaptive Pulse Code Modulation, ADPCM).

Формат МРЗ

MP3 (сокращение от MPEG Layer3) - один из цифровых форматов хране­ния аудио, используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.

МРЗ - потоковый формат; исходный сигнал при кодировании разбивается на равные по продолжительности участки, именуемые фреймами и кодируемые отдельно, а при декодировании конечный сигнал формируется из последовательности декодированных фреймов.

Высокая степень компактности МРЗ по сравнению с импульсно-кодовой модуляцией 16Bit Stereo 44.1 kHz (в формате CD Audio) достигается с помощью дополнительного квантования с учетом особенностей человеческого слуха, в том числе эффекта маскирования слабого сигнала одного диапазона частот более мощным сигналом соседнего диапазона, когда он имеет место, или мощным сигналом, преды­дущего фрейма, вызывающего временное понижение чувствительности уха о к сигналу текущего фрейма. Также учитывается неспособность большинства людей различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов.

Степень сжатия, и, соответственно, объем дополнительного квантования, определяются не форматом, а самим пользователем в момент задания па­раметров кодирования. Ширина потока (bitrate) варьируется от наибольшего для МРЗ, равного 320kbs (320 килобит в секунду), до 96kbs и ниже. Термин битрейт обозначает общую ширину потока, безразлично к тому, монофони­ческий или стереофонический сигнал он содержит.

Разные программы обработки и проигрывания звука дают разное качест­во кодирования и декодирования.

Выбор программы кодирования, ее параметров и степени cжатия/битрейта (и связанного с его уровнем качества) зависит главным обра­зом от трех факторов:

— содержания оцифрованной звуковой информации (речь, звуковое сопро­вождение, высококачественная музыка);

— предполагаемого адресата аудиоинформации и уровня его претензий к качеству звука или скорости передачи аудиофайла по сети;

— предполагаемого качества воспроизводящей аудиоаппаратуры (аудиокарты и акустических систем).

Разные битрейты дают разное качество. Любители МРЗ абсолютно по-разному оценивают степень приемлемости одних и тех же битрейтов и имеют свой взгляд на то, какой битрейт следует считать оптимальным. Кто-то выбирает 128 kbs, другие 160 kbs, третьи золотую середину - от 192 kbs до 256 kbs. Некоторые - 320 kbs.

Битрейт 256 kbs следует считать совершенно достаточным для абсолют­ного большинства пользователей;

Тесты определили МРЗ 160 kbs... 192 kbs в большинстве случаев вполне приемлемыми для хранения аудио на компьютере, например, в компьютер­ных играх, когда внимание отвлечено;

Битрейт 320kbs - максимальный (степень сжатия - более чем в че­тыре раза), для кодирования аудио с характеристиками CD Audio, то есть 44.1 kHz 16bit Stereo;

Самым популярным все же остается битрейт 128 kbs, но при его использовании мы имеем скорее качество аудиокассеты, записанной с очень низким уровнем шумов.

В сети INTERNET, как правило, можно найти только МРЗ, закодированные с битрейтом 128 kbs, признанным оптимальным для использования в сети INTERNET.

МРЗ стал массово признанным форматом хранения ау­диоинформации. Ситуация с форматом MP3 создала правовую колли­зию, связанную с нелегальным распространением аудиотреков через сеть Ин­тернет.

Стандарт МРЗ не определяет никакого точного стандартного математи­ческого алгоритма кодирования; он индивидуален для каждого разработанного кодера. Вместо этого стандарт определяет общую схему процесса кодирования, а также формат закодированного фрейма. Сами последова­тельности фреймов могут передаваться потоком (streaming) или храниться в файлах.

МРЗ файл, как и поток, состоит из последовательно расположенных фреймов, между которыми может содержаться произвольная информация. Основное требование состоит в том, что не должно быть совпадений с сигнатурой начала фрейма.

Часто к последовательности фреймов добавляют стандартный заголовок мета-аудиоформата WAV, и получается то, что называют WAV-MP3. Формат WAV является метаформатом для данных любого типа. Формат имеет стандартный заголовок и описания областей данных, которых может быть несколько, способ же кодирования аудиосигнала может быть каким угодно. Вполне могут содержаться данные, к аудио отношения не имеющие.

Оптические компакт-диски

Компакт-диск - традиционная среда для записи музыки, которую потом можно прослушать на бытовом CD-плейере или дру­гом компьютере. Смонтированное видео можно записать в MPEG-4 или MPEG-1, если необходимо высокое качество, на стандартный CD-R емкостью 650 Мбайт поместится около 20 минут видео DVD-качества (MPEG-2 с разрешением 720 х 576, 25 кадров/с). Очень удобна архивация мультиме­дийных данных с последующим переносом их на любой компьютер.

Приводы CD-R и CD-RW соответствуют системам однократной (CD-Recordable -записываемый CD) и многократной (CD-ReWritable - перезаписываемый CD) записи компакт-дисков. Терминами CD-R и CD-RW обозначаются как устройства для записи, так и сами диски.

Для однократной записи используются компакт-диски, в которых отражающий слой вы­полнен преимущественно из золотой или серебряной пленки, а между ним и поликарбонатной основой расположен регистрирующий слой из органиче­ского материала, темнеющего при нагревании. В процессе записи лазерный луч нагревает выбранные точки слоя, которые темнеют и перестают про­пускать свет к отражающему слою, образуя участки, аналогичные питам.

Ha CD-R организуется та же информационная структура, что и на штам­пованных дисках - ТОС и набор дорожек различных типов. Это позволяет при помощи соответствующего программного обеспечения записывать зву­ковые, фото- и видеодиски, которые могут затем проигрываться в бытовых звуковых и видеопроигрывателях. Однако отражающая способность зер­кального слоя и четкость питов у дисков CD-R ниже обычного, отчего неко­торые устройства могут работать с ними неуверенно.

В перезаписываемых дисках используется промежуточный слой из орга­нической пленки, изменяющей под воздействием луча свое фазовое со­стояние с аморфного на кристаллическое и обратно, в результате чего ме­няется прозрачность слоя. Фиксация изменений состояния происходит бла­годаря тому, что материал регистрирующего слоя при нагреве свыше кри­тической температуры переходит в аморфное состояние и остается в нем после остывания, а при нагреве до температуры значительно ниже крити­ческой восстанавливает кристаллическое состояние. Существующие диски выдерживают от тысяч до десятков тысяч циклов перезаписи. Однако их отражающая способность существенно ниже штампованных и однократных CD, что затрудняет их считывание в обычных приводах.

Для чтения CD-RW необходим привод с автоматической регулировкой усиления фотоприемника (Auto Gain Control), хотя некоторые обычные приводы CD-ROM и бытовые проигрыватели способны читать их наравне с обычными дисками. Способность привода читать CD-RW носит название Multiread.

Диски CD-R/CD-RW изготовляются со вспомогательной разметкой (pregroove) в которой закодирована временная сетка (ATIP - Actual Time In Pregroove, действительное время по разметке), которая одновременно слу­жит и для разбивки диска на кадры (блоки), и дополнительная информация о диске - коды, рекомендуемые значения скорости вращения и мощности записывающего лазера. Разметка используется для нахождения служебных и пользовательских областей диска и для облегчения слежения за инфор­мационной дорожкой в процессе записи. При считывании слежение произ­водится, как обычно, по записанной информационной дорожке. Кроме этого, диск содержит две служебные области: РСА (Power Calibration Area - об­ласть калибровки мощности) и РМА (Program Memory Area - область памяти программы), расположенные внутри от "официального" радиуса начала за­писи. РСА используется для выбора оптимальной мощности лазера перед каждой записью, а РМА - для временного хранения ТОС в случае записи одной сессии в несколько приемов. РСА и РМА являются таблицами фик­сированной длины емкостью по 100 элементов каждая, что ограничивает как общее количество случаев записи, так и этапов формирования незакры­тых сессий.

Минимальной единицей информации, записываемой на CD-R за один прием, является дорожка (track) в формате CD-DA или CD-ROM. Мини­мальная длина дорожки - 300 блоков (600 Кбайт, 4 сек). В начале каждой дорожки формируется служебный зазор (pre-gap), содержащий ее парамет­ры, размером 150 блоков (300 Кбайт, 2 сек) для однотипных дорожек и 225 блоков (450 Кбайт, 3 сек) для дорожек разных типов. Одна или несколько дорожек образуют программную область (Program Area), которая может формироваться в несколько приемов, между которыми адреса и параметры дорожек (ТОС) сохраняются в РМА.

Наши рекомендации