Кодирование текстовых и графических данных, решение задач по объему информации.

Цель работы: изучить способы представления текстовой, графической информации и подсчитывать ее объем.

Краткие теоретические сведения:

Вся информация, которую обрабатывает компьютер, должна быть представлена двоичным кодом с помощью двух цифр 0 и 1. Эти два символа принято называть двоичными цифрами или битами. С помощью двух цифр 0 и 1 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организованно два важных процесса: кодирование и декодирование.

Кодирование – преобразование входной информации в форму, воспринимаемую компьютером, то есть двоичный код.

Декодирование – преобразование данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

0 – отсутствие электрического сигнала;

1 – наличие электрического сигнала.

Эти состояния легко различать. Недостаток двоичного кодирования – длинные коды. Но в технике легче иметь дело с большим количеством простых элементов, чем с небольшим числом сложных.

Способы кодирования и декодирования информации в компьютере, в первую очередь, зависит от вида информации, а именно, что должно кодироваться: числа, текст, графические изображения или звук.

Кодирование графических изображений

Создавать и хранить графические объекты в компьютере можно двумя способами – как растровое или как векторное изображение. Для каждого типа изображений используется свой способ кодирования.

Рассмотрим кодирование растровых изображений

Растровое изображение представляет собой совокупность точек (пикселей) разных цветов. Пиксель– минимальный участок изображения, цвет которого можно задать независимым образом.

В процессе кодирования изображения производится его пространственная дискретизация. Пространственную дискретизацию изображения можно сравнить с построением изображения из мозаики (большого количества маленьких разноцветных стекол). Изображение разбивается на отдельные маленькие фрагменты (точки), причем каждому фрагменту присваивается значение его цвета, то есть код цвета (красный, зеленый, синий и так далее).

Для черно-белого изображения информационный объем одной точки равен одному биту (либо черная, либо белая – либо 1, либо 0).

Для четырех цветного – 2 бита.

Для 8 цветов необходимо – 3 бита.

Для 16 цветов – 4 бита.

Для 256 цветов – 8 бит (1 байт).

(Формула Хартли 2 i = N, где N – количество цветов, i – глубина цвета (бит)).

Качество изображения зависит от количества точек (чем меньше размер точки и, соответственно, больше их количество, тем лучше качество) и количества используемых цветов (чем больше цветов, тем качественнее кодируется изображение).

Для представления цвета в виде числового кода используются две обратных друг другу цветовые модели: RGB или CMYK. Модель RGB используется в телевизорах, мониторах, проекторах, сканерах, цифровых фотоаппаратах… Основные цвета в этой модели: красный (Red), зеленый (Green), синий (Blue). Цветовая модель CMYK используется в полиграфии при формировании изображений, предназначенных для печати на бумаге.

Цветные изображения могут иметь различную глубину цвета, которая задается количеством битов, используемых для кодирования цвета точки.

Если кодировать цвет одной точки изображения тремя битами (по одному биту на каждый цвет RGB), то мы получим все восемь различных цветов.

Таблица №4

R G B Цвет
Белый
Желтый
Пурпурный
Красный
Голубой
Зеленый
Синий
Черный

На практике же, для сохранения информации о цвете каждой точки цветного изображения в модели RGB обычно отводится 3 байта (то есть 24 бита) - по 1 байту (то есть по 8 бит) под значение цвета каждой составляющей. Таким образом, каждая RGB-составляющая может принимать значение в диапазоне от 0 до 255 (всего 28=256 значений), а каждая точка изображения, при такой системе кодирования может быть окрашена в один из 16 777 216 цветов. Такой набор цветов принято называть True Color (правдивые цвета), потому что человеческий глаз все равно не в состоянии различить большего разнообразия.

Для того чтобы на экране монитора формировалось изображение, информация о каждой точке (код цвета точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для одного из графических режимов. Для расчёта информационного объёма растрового графического изображения используется формула

V=K*i

где V – это информационный объём растрового графического изображения, измеряющийся в байтах, килобайтах, мегабайтах;K– количество пикселей (точек) в изображении, определяющееся разрешающей способностью носителя информации (экрана монитора, сканера, принтера); i– глубина цвета, которая измеряется в битах на один пиксель.

В современных компьютерах разрешение экрана обычно составляет 1280х1024 точек. Т.е. всего 1280 * 1024 = 1310720 точек. При глубине цвета 32 бита на точку необходимый объем видеопамяти:

32 * 1310720 = 41943040 бит = 5242880 байт = 5120 Кб = 5 Мб.

Растровые изображения очень чувствительны к масштабированию (увеличению или уменьшению). При уменьшении растрового изображения несколько соседних точек преобразуются в одну, поэтому теряется различимость мелких деталей изображения. При увеличении изображения увеличивается размер каждой точки и появляется ступенчатый эффект, который можно увидеть невооруженным глазом.

Рассмотрим примеры.

Пример 1. Видеопамять компьютера имеет объем 512Кб, размер графической сетки 640х200, в палитре 16 цветов. Какое количество страниц экрана может одновременно разместиться в видеопамяти компьютера?

Дано:

K=640х200=128000 пикселей;

N=16 цветов;

Vвп=512 Кб

Решение:

Используем формулу

N=2i, т.к. в палитре 16 цветов, то 2i=16, тогда i=4 бита/пиксель;

K=640х200=128000 пикселей

V=128000*4=512000 бит=64000байт=62,5Кб на один экран

M=512/62,5=8 страниц

Ответ: 8 полных страниц экрана можно одновременно хранить в видеопамяти компьютера.

Пример 2. В результате преобразования растрового графического изображения количество цветов уменьшилось с 256 до 16. Как при этом изменится объем видеопамяти, занимаемой изображением?

Дано:

N1=256 цветов;

N2=16 цветов;

Решение:

Используем формулы

N1=2i1; N2=2i2; V1=K*i1; V2=K*i2;

N1=256=28; i1=8 бит/пиксель

N2=16=24; i2=4 бит/пиксель

V1=K*8; V2=K*4;

V2/V1=4/8=1/2

Ответ: объём графического изображения уменьшится в два раза.

Пример 3. Сканируется цветное изображение стандартного размера А4 (21*29,7 см). Разрешающая способность сканера 1200dpi и глубина цвета 24 бита. Какой информационный объём будет иметь полученный графический файл?

Дано:

i=24 бита на пиксель;

S= 21см*29,7 см

D=1200dpi (точек на один дюйм)

Решение:

Используем формулы

V=K*i;

1дюйм=2,54 см

S=(21/2,54)*(29,7/2,54)=8,3дюймов*11,7дюймов

K=1200*8,3*1200*11,7=139210118 пикселей

V=139210118*24=3341042842бита=417630355байт=407842Кб=398Мб

Ответ: объём сканированного графического изображения равен 398 Мегабайт

Задания для самостоятельного решения.

1. Определите количество цветов в палитре при глубине цвета 4, 8, 16, 24, 32 бита.

2. Черно-белое (без градаций серого) растровое графическое изображение имеет размер 10x10 точек. Какой объем памяти займет это изображение?

3. Цветное (с палитрой из 256 цветов) растровое графическое изображение имеет размер 10x10 точек. Какой объем памяти займет это изображение?

4. В процессе преобразования растрового графического изображения количество цветов уменьшилось с 65536 до 16. Во сколько раз уменьшится объём занимаемой им памяти?

5. 256-цветный рисунок содержит 120 байт информации. Из скольких точек он состоит?

6. Достаточно ли видеопамяти объёмом 256 Кбайт для работы монитора в режиме 640*480 и палитрой из 16 цветов?

7. Растровый графический файл содержит черно-белое изображение с 2 градациями цвета (черный и белый) размером 600х480 точек. Определите необходимый для кодирования цвета точек (без учета служебной информации о формате, авторстве, способах сжатия и пр.) размер этого файла на диске в байтах.

8. Для кодирования черно-белого изображения используется 8 цветов. Чему будет равен объем файла размером 600х800 пикселей.

9. Для кодирования цветного изображения используется 16 цветов. Чему будет равен объем файла размером 400х600 пикселей.

10. Информационный объем растрового изображения размером 120х120 пикселей равен 5400 байт. Каково максимально возможное число цветов в палитре изображения?

11. Найдите объем цветного растрового изображения размером 700 х 400, если в палитре используется 256 цветов.

12. Для хранения растрового изображения размером 128 x 128 пикселей отвели 4 КБ памяти. Каково максимально возможное число цветов в палитре изображения.

13. Какой объем видеопамяти необходим для хранения четырех страниц изображения, если битовая глубина равна 24, а разрешающая способность дисплея- 800 х 600 пикселей?

14. Определите информационный объем изображения первых мониторов, если они использовали пространственное разрешение 640*480 и были двухцветными.

15. Определите разрешающую способность изображения, если глубина цвета 4 бита, а информационный объем изображения 2,5 кбайт. Сколько цветов в палитре?

16. Растровый файл, содержащий черно-белый рисунок, имеет объем 300 байт. Какой размер может иметь рисунок в пикселях?

17. Укажите минимальный объем памяти (в килобайтах), достаточный для хранения любого растрового изображения размером 256 х 256 пикселей, если известно, что в изображении используется палитра из 216 цветов.

18. Сколько секунд потребуется модему, передающему сообщения со скоростью 14400 бит/сек, чтобы передать цветное растровое изображение размером 800 х 600 пикселей, при условии, что в палитре 16 миллионов цветов?

19. Каков минимальный объем памяти ( в байтах), достаточный для хранения черно-белого растрового изображения размером 32 х 32 пикселя, если известно, что в изображении используется не более 16 градаций серого цвета.

20. Монитор работает с 16 цветной палитрой в режиме 640*400 пикселей. Для кодирования изображения требуется 1250 Кбайт. Сколько страниц видеопамяти оно занимает?

21. Страница видеопамяти составляет 16000 байтов. Дисплей работает в режиме 320*400 пикселей. Сколько цветов в палитре?

22. Сканируется цветное изображение размером 10´10 см. Разрешающая способность сканера 600 dpi и глубина цвета 32 бита. Какой информационный объем будет иметь полученный графический файл.

Кодирование текстовых сообщений.

Расчёт информационного объёма текстового сообщения (количества информации, содержащейся в информационном сообщении) основан на подсчёте количества символов в этом сообщении, включая пробелы, и на определении информационного веса одного символа, который зависит от кодировки, используемой при передаче и хранении данного сообщения.

В традиционной кодировке (ASCII, КОИ8-Р, Windows, MS DOS, ISO) для кодирования одного символа используется 1 байт (8 бит). Эта величина и является информационным весом одного символа. Такой 8-ми разрядный код позволяет закодировать 256 различных символов, т.к. 28=256.

В настоящее текстовая информация кодируется при помощи международного стандарта Unicode, который отводит на каждый символ два байта (16 бит). С его помощью можно закодировать 216=65536 различных символов.

Итак, для расчёта информационного объёма текстового сообщения используется формула

V=K*i

где V– это информационный объём текстового сообщения, измеряющийся в байтах, килобайтах, мегабайтах; K– количество символов в сообщении, i – информационный вес одного символа, который измеряется в битах на один символ.

Рассмотрим примеры.

Пример 1. Считая, что каждый символ кодируется одним байтом, оцените информационный объем сообщения: Без труда не вытащишь рыбку из пруда!

Решение: Считаем количество символов в сообщении с учетом пробелов и знаков препинания. Получаем N=35. Т.к. один символ кодируется 1 байтом, то всё сообщение будет занимать в памяти компьютера 35 байт.

Пример 2. Определить информационный объем книги (в Мбайтах) подготовленной на компьютере, состоящей из 150 страниц (каждая страница содержит 40 строк, 60 символов в каждой строке).

Решение:

1) Подсчитаем количество символов в книге 40 * 60 * 150 = 360000

2) Информационный объем книги составит 360 000 * 1байт = 360 байт

3) Переведем в заданные единицы 360 000 байт / 1024 = 351,5625 Кбайт/ 1024= 0,34332275 Мбайт

Пример 3. Через ADSL-соединение файл размером 1000 Кбайт передавался 32 с. Сколько секунд потребуется для передачи файла размером 625 Кбайт.

Решение:

Найдем скорость ADSL соединения: 1000 Кбайт / 32 с. = 8000 Кбит / 32 с. = 250 Кбит/с.

Найдем время для передачи файла объемом 625 Кбайт: 625 Кбайт / 250 Кбит/с = 5000 Кбит / 250 Кбит/с. = 20 секунд.

Задания для самостоятельного решения.

1. Сколько потребуется секунд для передачи 50 страниц текста в 40 строк по 60 символов каждая в кодировке ASCII, если скорость передачи равна 25600 бит/сек.

2. Скорость передачи данных через ADSL-соединение равна 256000 бит/сек. Передача файла через это соединение по времени заняла 3 мин. Определите размер файла в килобайтах.

3. Скорость передачи данных через ADSL-соединение равна 286000 бит/сек. Передача файла через это соединение по времени заняла 2 мин. Определите размер файла в килобайтах.

4. Сколько потребуется секунд для передачи 40 страниц текста в 50 строк по 60 символов каждая в кодировке ASCII, если скорость передачи равна 28600 бит/сек.

5. Сколько бит составляет информационный объем фразы «Главная задача студента – учиться» при кодировании в системе Unicode.

6. Определите объем файла в килобайтах в кодировке ASCII. Файл состоит из 30 страниц, на странице находится 60 строк по 60 символов в каждой строке.

7. Скорость передачи данных через ADSL─соединение равна 512 000 бит/c. Передача файла через это соединение заняла 1 минуту. Определить размер файла в килобайтах.

8. Какой информационный объем оперативной памяти требуется для хранения текста статьи объемом 4 страницы, на каждой из которых размещены 32 строки по 64 символа?

9. Даны 16 слов, состоящих из 6 символов. Считается, что каждый символ кодируется одним байтом. Какое минимальное количество бит понадобится для кодирования всех слов?

10. Некоторый текст имеет объем 40 килобайт. На каждой странице текста – 32 строк по 64 символа в строке, кодировка символов – ASCII. Сколько страниц в тексте?

11. Некоторый текст имеет объем 68 килобайт. На каждой странице текста – 40 строк по 80 символа в строке, кодировка символов – UNICOD. Сколько страниц в тексте?

12. Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 65536 символов. Второй текст в алфавите мощностью 16 символов. Во сколько раз количество информации в первом тексте больше второго?

13. Автоматическое устройство осуществило перекодировку информационного сообщения на русском языке, первоначально записанного в 16-битном коде Unicode, в 8-битную кодировку КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?

14. Скорость передачи данных через модем равна 96000 бит/с. Передача файла через данное соединение происходило 8 минут. Определите размер файла в килобайтах.

Содержание отчета:

Отчет должен содержать:

1. Название работы.

2. Цель работы.

3. Задание и его решение.

Контрольные вопросы

1. Чем отличается кодирование от декодирования?

2. Что такое пиксель?

3. Для чего используется формула Хартли?

4. Какие цветовые модели кодирования графических изображений вы знаете?

5. Что такое глубина цвета?

6. Какие виды кодировок текстовых сообщений вы знаете?

7. Сколько бит на один символ отводится в кодировке UNICOD, ASCII.

Практическая работа №3

Наши рекомендации