Специальные методы сжатия

Проведенные в конце XX века исследования психофизиологических характеристик зрения и слуха обнаружили ряд особенностей человеческого восприятия информации, использование которых позволяет существенно увеличивать степень сжатия звуковой, графической и видеоинформации.

Например, было установлено, что глаз человека наиболее чувствителен к зеленому цвету, чувствительность к красному ниже примерно в 4 раза, а к синему — почти в 10 раз! Это означает, что на хранение информации о красной и синей составляющих цвета можно было бы отводить меньше бит, чем на зеленую составляющую.

К середине 90-х годов прошлого века были разработаны высокоэффективные методы сжатия графической, звуковой и видео информации, учитывающей особенности человеческого зрения и слуха.

Характерной чертой этих методов является возможность регулируемого удаления маловажной для человеческого восприятия информации, за счет чего удается достичь высоких коэффициентов сжатия. Но т.к. часть данных удаляется (безвозвратно), то полное восстановление исходной информации невозможно.

Наиболее известными методами сжатия с регулируемой потерей информации являются:

• JPEG — метод сжатия графических данных;

• МРЗ — метод сжатия звуковых данных;

• МРЕG — группа методов сжатия видеоданных.

Эти методы непросты в реализации, в них используется достаточно сложный математический аппарат, поэтому мы рассмотрим лишь обзорное описание данных методов.

Алгоритм JPEG

Алгоритм JPEG используется для сжатия статических изображений.

Сжатие JPEG осуществляется в несколько этапов: сперва цвета пикселей переводятся из RGB-представления в YCbCr-представление (в данной модели цвет представляется компонентами «яркость» Y, «цветоразность зеленый-красный» Сr и «цветоразность зеленый-синий» Сb). Затем в каждой второй строке и каждом втором столбце матрицы пикселей информация о цветовых компонентах Сb и Сr просто удаляется, что мгновенно уменьшает объем данных вдвое. Оставшиеся данные подвергаются специальной процедуре «сглаживания», при которой объем данных не изменяется, но потенциальная степень их сжимаемости резко увеличивается (на этом этапе учитывается коэффициент сжатия). Затем данные сжимаются алгоритмом Хаффмана.

Алгоритм JPEG способен упаковывать графические изображения в несколько десятков раз, при этом потери качества становятся заметными только при очень высоких коэффициентах сжатия.

Алгоритм МРЗ

Сжатие МРЗ является частью стандарта MPEG и применяется для сжатия аудиоинформации. По мимо сжимаемой информации алгоритму передается желаемый битрейт – количество бит, используемых для кодирования одной секунды звука. Этот параметр регулирует долю информации, которая будет удаляться.

Сжатие MP3 также осуществляется в несколько этапов: звуковой фрагмент разбивается на небольшие участки — фреймы, а в каждом фрейме звук разлагается на составляющие звуковые колебания, которые в физике называют гармониками. Затем начинается психоакустическая обработка — удаление маловажной для человеческого восприятия звуковой информации. Желаемый битрейт определяет, какие эффекты будут учитываться при сжатии, а также какое количество информации будет удалятся. На следующем этапе оставшиеся данные сжимаются алгоритмом Хаффмана.

Алгоритм МРЗ позволяет сжимать звуковые файлы в несколько раз. Даже при самом «плохом» раскладе обеспечивается четырехкратное сжатие аудиоинформации.

Алгоритмы МРЕG

МРЕG — это целое семейство методов сжатия видеоданных. В них используется очень большое количество приемов сжатия.

Первый прием - использование «опорного кадра» — заключается в том, чтобы сохранять не целиком кадры, а только изменения кадров. Например, в фильме есть сцена беседы героев в комнате. При этом от кадра к кадру меняются только выражения лиц, а большая часть изображения неподвижна. Закодировав первый кадр сцены и отличия остальных ее кадров от первого, можно получить очень большую степень сжатия.

Следующий прием заключается в том, чтобы быстро сменяемые участки изображения кодировать с качеством, которое намного ниже качества статичных участков, — человеческий глаз не успевает рассмотреть их детально.

Кроме того, формат МРЕG позволяет сохранять в одном файле несколько так называемых потоков данных. Так, в основном потоке можно сохранить фильм, в другом — логотип (храниться один раз, а не в каждом кадре), в третьем — субтитры (как текст), и т. д. Потоки данных накладываются друг на друга только при воспроизведении.

Разновидности формата МРЕG отличаются друг от друга по возможностям, качеству воспроизводимого изображения и максимальной степени сжатия:

• MPEG-1 — использовался в первых Video CD (VCD-I);

• MPEG-2 — используется в DVD и Super Video CD (SVCD, VCD-II);

• МJPEG — формат сжатия видео, в котором каждый кадр сжимается по методу JPEG;

• MPEG-4 — усовершенствованный формат сжатия видео;

• DivX, XviD — улучшенные модификации формата МРЕG-4.

Контрольные вопросы:

  1. Что такое код?
  2. Что понимают под кодированием?

3. Как происходит кодирование текстовой информации?

  1. Как происходит кодирование звуковой информации?
  2. Как происходит кодирование графической информации?
  3. Какие стандарты кодирования видеоинформации существуют?

7. Что такое дискретизация?

8. В чем заключается матричный принцип кодирования графических изображений?

9. В чем заключается метод кодирования?

10. При каком условии кодирование информации является избыточным? Что обеспечивает избыточность ?

11. Какие существуют методы кодирования информации? В чем их особенность?

12. Приведите примеры форматов файлов на разные методы кодирования.

13. В чем суть метода упаковки? Его преимущества и недостатки.

14. В чем суть метода Шеннона-Фано? Его преимущества и недостатки.

15. В чем суть метода Хаффмана? Его преимущества и недостатки.

16. Как рассчитать коэффициент сжатия информации?


Наши рекомендации