Форма представления данных в компьютере 319
и с чем большей частотой эти уровни замеряются, тем точнее звуковая информация преобразуется в цифровой вид и с тем большей достоверностью она потом будет восстановлена.
С момента, когда звуковой сигнал приводится к цифровому виду, он уже необратимо искажается, однако звуковая информация не теряется. Если частота дискретизации выбрана высокой (в несколько раз выше, чем 22 000 Гц — частота, которую может различить человеческое ухо), а динамический диапазон (то есть количество уровней в каждой точке) достаточно велик, то при восстановлении невозможно будет различить аналоговый сигнал, записанный на аналоговый носитель (виниловый диск), и данные, сохраненные на цифровой носитель (компакт-диск).
Чем выше качество сохраняемого в компьютере звука, тем больше для него необходимо места в памяти. Для получения сигнала с гарантированно высоким качеством нужно задать достаточно большое количество уровней и высокую частоту дискретизации.
Пример. Если мы разобьем входной сигнал по амплитуде на 65 536 уровней (то есть для хранения каждого измерения будем использовать 2 байта) и измерим его с частотой 110 000 раз в секунду, то получим гарантированный запас по качеству. Несложный подсчет покажет, что для хранения музыкального фрагмента длительностью 3 минуты, оцифрованного таким образом, требуется 2 х 110 000 х 60 х 3 = = 39 600 000 байт, или 38,7 Мбайт компьютерной памяти. Примерно такой размер имеют музыкальные фрагменты, записанные на современные компакт-диски.
Для хранения в памяти персонального компьютера, а в особенности для передачи звуковых файлов через Интернет, объемы их слишком велики. Для уменьшения объема данных в несколько раз применяются специальные процедуры сжатия. Из исходного оцифрованного звука после сжатия получаются данные в 8-10 раз меньшего объема. Одним из популярных форматов хранения звуковой информации, получаемой при помощи таких специальных процедур, является МРЗ. Надо заметить, что при сжатии данных в формат МРЗ часть звуковой информации необратимо теряется, поэтому он называется форматом сжатия звука с потерями.
В том случае, когда данные, несущие звуковую информацию, требуется преобразовать в звуковой сигнал, записанную в памяти последовательность байтов подают на вход цифроаналогового преобразователя (ЦАП). Это устройство преобразует числа сначала в уровни электрического сигнала, затем сглаживает эти уровни, преобразуя их в аналоговый электрический сигнал, а потом аналоговый сигнал подается на воспроизводящее устройство (аудиоколонки или головные телефоны).
Видеоданные
Видеоданные представляют собой практически те же данные в растровом графическом формате, и получаются они примерно таким же образом, как и цифровая фотография. Многие современные цифровые фотоаппараты позволяют производить видеосъемку, а цифровые видеокамеры — делать фотографии. Механизм один и тот же, но в случае, когда происходит видеосъемка, фотографии делаются с боль-
Глава 11. Представление данных в компьютере
шой скоростью одна за другой и последовательно записываются в цифровом виде в память видеокамеры. Эта последовательность фотографий образует видеоряд, аналогичный кадрам на кинопленке.
Служебные данные
Когда мы производим сбор первичных данных и перевод их в цифровую форму, мы осуществляем кодирование сигнала выбранным способом и последовательно записываем полученные коды в память компьютера. Это верно как для символьной информации, так и для растровых графических данных при цифровой фото- или видеосъемке, при кодировании аудиосигнала процесс происходит примерно так же. Однако следующим шагом, который требуется, чтобы хранить и передавать данные, является их оформление. Например, введенный нами необработанный текст преобразуется текстовым процессором в документ. В документе, кроме самого текста, присутствует множество объектов, имеющих нетекстовую природу: рамки, разделительные линии, блоки, признаки разбиения на страницы и форматирования, другие служебные конструкции. Аналогично для хранения графических данных изображение определенным образом разбивается на слои, каналы, градации яркости, над данными производятся операции сжатия для уменьшения хранимого и передаваемого объема. Таким образом, к данным, хранящим собственно символьную, аудио- или видеоинформацию, добавляются специальные служебные данные, данные структурируются, и для хранения в постоянной памяти они приводятся к типу файлов определенного формата.
Любой файл, в общем случае, является последовательностью байтов, которая записывается на физический носитель и получает имя (или некоторый идентификатор). Как известно, файлы имеют разный формат. Слово «формат» в данном случае говорит о том, что разные группы байтов, записанные внутри файла, имеют разное назначение. Часть байтов несет в себе непосредственно данные, а часть — информацию о том, как эти данные правильно восстановить и отобразить на экране компьютера или воспроизвести другим необходимым образом. Таким образом, любой файл представляет собой неоднородную структуру данных, и тип файла непосредственно связан, с той последовательностью действий, которую нужно проделать, чтобы данные из файла превратились в сигналы, несущие информацию.
Системы счисления
Определение и классификация
Числа отображаются с помощью системы счисления.
Совокупность символов, при помощи которых записывается система счисления, называется алфавитом системы счисления. Количество символов, составляющих алфавит, называется его размерностью.
11.2. Системы счисления
Системы счисления делятся на позиционные и непозиционные. В позиционной системе счисления значение каждой цифры в записи числа зависит от ее позиции (разряда). В непозиционной системе счисления для обозначения чисел вводятся специальные знаки, количественное значение которых всегда одинаково и не зависит от их места в записи числа, например, числу 25 в непозиционной римской системе счисления соответствует запись XXV, а числу 53 соответствует запись LIII.
Последовательность чисел, каждое из которых задает «вес» соответствующего разряда, называется базисом позиционной системы счисления. Основным достоинством позиционной системы счисления является возможность записи произвольного числа при помощи ограниченного набора символов.
В табл. 11.4 сравниваются несколько двоичных и десятичных чисел, находящихся в одной и той же позиции.Обе эти системы счисления являются позиционными. Значение каждой цифры в числе легко определить, воспользовавшись формулой
V=BN.
Здесь V— значение, В — основание системы счисления, N— порядковый номер позиции.
Таблица 11.4.Двоичные и десятичные числа
Двоичные | Десятичные | |||
Двоичное число (двоичное представление) | Двоичное число (десятичное представление) | Степень | Десятичное число (десятичное представление) | Степень |
2° | 10° | |||
21 | 101 | |||
22 | ю2 | |||
23 | 103 | |||
24 | ю4 | |||
25 | ю5 | |||
26 | 106 |
Очевидно, что десятичная запись намного удобнее двоичной, поскольку более компактна. Так, в 6-й позиции в десятичной системе закодирован миллион, а в двоичной — только шестьдесят четыре. В двоичной системе представление чисел получается весьма громоздким, но оно идеально для компьютера, так как не требует сложных инженерных и технологических решений.
Позиционную систему счисления называют традиционной, если ее базис образуют члены геометрической прогрессии, а значения цифр есть целые неотрицательные числа. Знаменатель Р геометрической прогрессии, члены которой образуют базис традиционной системы счисления, называется основанием этой системы счисления. Традиционные системы счисления с основанием Р иначе называют Р-ичными.