Теоретические сведения по теме «Представление текстов. Сжатие текстов.

Раздаточный материал к ПР №4

Представление изображений и звука»

Таблица 1. Основная таблица ASCII

Теоретические сведения по теме «Представление текстов. Сжатие текстов. - student2.ru Текстовая информация дискретна и состоит из отдельных знаков. В памяти компьютера она размещается по следующей модели: за каждой буквой алфавита, цифрой, знаком препинания и иным общепринятым при записи текста символом закрепляется определенный двоичный код, длина которого фиксирована. В популярных системах кодировки (windows-1251) каждый символ заменяется на 8-разрядное целое положительное двоичное число; оно хранится в одном байте памяти. Это число является порядковым номером символа в кодовой таблице.

ASCII — название таблицы (кодировки, набора), в которой некоторым распространённым печатным и непечатным символам сопоставлены числовые коды.

Таблица ASCII определяет коды для символов: десятичных цифр; латинского алфавита; национального алфавита; знаков препинания; управляющих символов. В системе ASCII закреплены две таблицы кодирования: базовая (таблица 1). и расширенная.

Теоретические сведения по теме «Представление текстов. Сжатие текстов. - student2.ru Алгоритм Хаффмана. Сжатием информации в памяти компьютера называют такое ее преобразование, которое ведет к сокращению объема занимаемой памяти при сохранении закодированного содержания. С помощью алгоритма Хаффмана строится двоичное дерево, которое позволяет однозначно декодировать двоичный код, состоящий из символьных кодов различной длины. Двоичным называется дерево, из каждой вершины которого выходят две ветви. На рисунке 1 приведен пример такого дерева, построенного для алфавита английского языка с учетом частоты встречаемости его букв.

Рисунок 1. – Дерево Хаффмана

Таблица 2. Двоичный код восьмицентовой палитры

Теоретические сведения по теме «Представление текстов. Сжатие текстов. - student2.ru Графическая информация также дискретна. Она состоит из отдельных точек, которые называются пикселями.

Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования.

Растровое изображение представляет собой совокупность пикселей разных цветов.

Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная - 1, либо белая – 0).

Для четырех цветного – 2 бита. Для 8 цветов необходимо – 3 бита (таблица 2).

Цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого, синего

Звуковая информация представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон.

Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть оцифрован звуковой картой, т.е. превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости.

Разрядность звуковой карты (R) - это количество распознаваемых дискретных уровней сигналов. Современные звуковые карты обеспечивают 8 или 16-битную глубину кодирования звука.

Частота дискретизации (η) - это количество измерений уровня сигнала в единицу времени. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования. Одно измерение в секунду соответствует частоте 1 Гц (Герц). 1000 измерений в секунду - 1 кГц.

Качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Качество звука в дискретной форме может быть очень плохим (при 8 битах и 5,5 кГц) и очень высоким (при 16 битах и выше 40 кГц), так же как радиотрансляция и аудиоCD.

Формула для расчета объема цифрового моноаудио файла: V = R · t ·η, где V - информационный объем аудиофайла, R - разрядность звуковой карты, t - время звучания аудиофайла, η - частота дискретизации

Наши рекомендации