Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный обьем текста

Ответ:

Преобразование информации из одной формы в другую знаковую форму называют кодированием. Для кодирования используют определенную систему знаков алфавит. Количество знаков в алфавите может быть различным. Самый короткий алфавит состоит из двух знаков. Если для кодирования информации используется только два знака - 0 и 1, то кодирование называют двоичным. Информация закодированная таким способом является дискретной (цифровой), т.е. представляется просто набором двоичных цифр. Такой способ достаточно универсален. Он может использоваться для представления всех видов знаковой информации (в том числе числовых данных, тогда речь идет о двоичных числах), а также для представления аналоговой информации (изображений, звука и т.п.). В последнем случае речь идет об аналого-цифровом преобразовании (АЦП), в процессе которого исходная аналоговая информация подвергается дискретизации - разбиению на элементы, каждый из которых описывается конечным набором двоичных знаков.

Для записи текстовой (знаковой) информации всегда используется какой-либо язык (естественный или формальный). Всё множество используемых в языке символов называется алфавитом. Полное число символов алфавита называют его мощностью. При записи текста в каждой очередной позиции может появиться любой из N символов алфавита, т.е. может произойти N событий. Следовательно, каждый символ алфавита содержит iбит информации, где i определяется из неравенства: 2i ≥ N. Тогда общее количество информации в тексте определяется формулой:

V = k * i , где V количество информации в тексте; k число знаков в тексте (включая знаки препинания и даже пробелы), i- количество бит, выделенных на кодирование одного знака.

Так как каждый бит это 0 или 1, то любой текст может быть представлен последовательностью нулей и единиц. Именно так текстовая информация хранится в памяти компьютера.Присвоение символу алфавита конкретного двоичного кода - это вопрос соглашения, зафиксированного в кодовой таблице. В настоящее время широкое распространение получили кодовые таблицы ASCII и Unicode.

ASCII(American Standart Code for Informational Interchange - Американский стандартный код информационного обмена) используется достаточно давно. Для хранения кода одного символа выделено 8 бит, следовательно, кодовая таблица поддерживает до 28 = 256символов. Первая половина таблицы (128 символов) - управляющие символы, цифры и буквы латинского алфавита. Вторая половина отводится под символы национальных алфавитов. К сожалению, в настоящее время существует целых пять вариантов кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке неверно отображаются в другой. (Наверное, Вы встречали русскоязычные сайты, тексты которых выглядят как бессмысленный набор знаков? Приходилось менять кодировку?).

Unicode - получил распространение в последние годы. Для хранения кода одного символа выделено 16 бит, следовательно, кодовая таблица поддерживает до 216 = 65536 символов. Такого пространства достаточно, чтобы в одном стандарте объединить все "живые" официальные (государственные) письменности. Кстати, стандарт ASCII вошел в состав Unicode.

Билет 4

Дискретное представление информации: кодирование цветного изображения в компьютере (растровый подход). Представление и обработка звука и видеоизображения. Понятие мультимедиа.

Ответ:

Растровая графика.

Графическая информация может быть представлена дискретно. Для этого изображение разбивают на отдельные маленькие фрагменты (пиксели), затем каждому пикселю присваивается код цвета (считаем, что весь пиксель целиком одноцветный, а изображение в целом мозаика мелких цветных точек). Этот процесс называют пространственной дискретизацией изображения.

Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный обьем текста - student2.ru Дискретное представление информации: двоичные числа; двоичное кодирование текста в памяти компьютера. Информационный обьем текста - student2.ru

Качество такого изображения зависит от двух параметров. Качество выше при меньшем размере пикселя и большем количестве используемых цветов (или оттенков серого, для монохромного изображения). Полный набор цветов, которые можно использовать для создания изображения называется палитрой. Изображение, сформированное таким способом, называют растровым. Формула для определения количества информации в нём имеет вид:

V = k * i, где V количество информации в изображении; k количество пикселей, а i глубина цвета (т.е. количество бит, выделенных на кодирование цвета), определяемая по формуле: 2i ≥ N, где N количество цветов в палитре. Цвет пикселя формируется как комбинация трех основных цветов ( обычно красного - Red, зеленого - Green и синего - Blue). Ниже приведена таблица кодирования шестнадцатицветной (глубина цвета - 4 бита) палитры:

Номер Цвет Яркость Красный Зеленый Синий
Черный
Синий
Зеленый
Голубой
Красный
Фиолетовый
Коричневый
Белый
Серый
Светло-синий
Светло-зеленый
Светло-голубой
Светло-красный
Светло-фиолетовый
Желтый
Ярко-белый

Такая палитра используется например при создании программ на Qbasic. Она не дает возможности получить качественную графику, поэтому сейчас используют палитры с глубиной цвета 16 или 32 бита (см. настройки параметров экрана). В последнем случае, на каждую составляющую (R, G, B) и яркость отводится по восемь бит (что составляет диапазон десятичных значений от 0 до 255), а общее количество цветов в палитре 224, что соответствует примерно 16-ти миллионам. Если учесть еще и градации яркости, то получим 232. Такое количество цветов намного превышает возможности восприятия цветовой гаммы глазом человека. 32 битная глубина цвета способна обеспечить самое высокое качество графики. Выше отмечалось, что качество растровой графики зависит также от размера пикселя. Количество пикселей на экране дисплея (растр) указывают соотношением количества пикселей в строке по горизонтали к их количеству в столбце по вертикали (800*600, 1024*768 и т.д.). Максимально возможное количество пикселей на экране называют разрешающей способностью дисплея. Качество растровых изображений может быть очень высоким, но размер файла также весьма велик (изучите свойства нескольких Точечных рисунков *.BMP, созданных с помощью Paint). При уменьшении размера изображения и последующим сохранением рисунка (например, с целью экономии места на диске) качество безвозвратно ухудшается. Для уменьшения размера файлов часто используют другие форматы файлов такие как *.JPG,*.GIFи др.

Векторная графика.

Отметим также, что рассмотренный выше способ представления изображений не единственный. Можно представить изображение совокупностью простых геометрических фигур (прямых линий, окружностей, эллипсов, дуг, прямоугольников и т.д.) графических примитивов и записать информацию о координатах и параметрах каждого их них. При этом координатная сетка должна совпадать с сеткой пикселей на экране. Такой способ представления изображений называют векторной графикой. На рисунке показаны примеры графических примитивов:

Такой способ представления изображения дает возможность получить файл малого размера. Качество изображения не изменяется с изменением размера рисунка, но даже профессиональные векторные графические редакторы не могут обеспечить качество графики, сравнимое с растровыми изображениями.

Видеоинформация.

Если рассматривать видеоинформацию как последовательность изображений, появляющихся на экране с определенной частотой (частотой кадров), то можно понять, что видео может быть закодировано подобно тому, как кодируются растровые изображения (с той разницей, что этих изображений много). Такой способ используется в формате *.AVI (несжатое видео) - высокое качество и огромные размеры файлов. Существуют способы сжатия видеоинформации путем преобразования файла в другие форматы.

Наши рекомендации