Объективный (алфавитный) подход к измерению информации
Теперь познакомимся с другим способом измерения информации. Этот способ не связывает количество информации с содержанием сообщения, и называется объективныйили алфавитный подход.
При объективном подходе к измерению информации мы отказываемся от содержания информации, от человеческой важности для кого-то.
Информация рассматривается как последовательность символов, знаков (определение3).
Количество символов в сообщении называется длиной сообщения.
Основой любого языка является алфавит.
Алфавит – это набор знаков (символов), в котором определен их порядок.
Полное число символов алфавита принято называть мощностью алфавита. Обозначим эту величину буквой M.
Например, мощность алфавита из русских букв равна 33:
мощность алфавита из английских букв равна 26.
При алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (т.е. от числа знаков в тексте) и от мощности алфавита. Тогда информацию можно обрабатывать, передавать, хранить.
Каждый символ несет x бит информации. Количество информации x, которое несет один символ в тексте, зависит от мощности алфавита M, которые связаны формулой 2x = M. Следовательно x = log2M бит.
Количество информации в тексте, состоящем из K символов, равно K*x или
K* log2M, где x – информационный вес одного символа алфавита.
Удобнее измерять информацию, когда мощность алфавита M равна целой степени числа 2. Для вычислительной системы, работающей с двоичными числами, также более удобно представление чисел в виде степени двойки.
Пример_6, в 2-символьном алфавите каждый символ несет 1 бит информации (2x = 2, откуда x = 1 бит).
Если M=16, то каждый символ несет 4 бита информации, т.к. 24 = 16.
Если M=32, то один символ несет 5 бит информации.
При M=64, один символ «весит» 6 бит и т.д.
Пример_7: Племя “Обезьяны” пишет письма, пользуясь 32-символьным алфавитом. Племя “Слоны” пользуется 64-символьным алфавитом. Вожди племен обменялись письмами. Письмо племени “Обезьяны” содержало 90 символов, а письмо племени “Слоны” – 80 символов. Сравните объем информации, содержащейся в письмах.
Решение: Мощность алфавита племени “Обезьяны” равна 32, информационный вес одного символа алфавита log232 = 5 бит. Количество информации в тексте, состоящем из 90 символов, равно 90*log232 = 450 бит.
Рассуждая аналогично про племя “Слоны”, получим: 80*log264 = 480 бит.
Следовательно, объем информации в письме вождя племени “Слоны” больше объема информации, которую передал в письме вождь племени “Обезьяны”.
Есть алфавит, который можно назвать достаточным. Это алфавит мощностью 256 символов. Алфавит из 256 символов используется для представления текстов в компьютере. В этом алфавите можно поместить практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания, знаки псевдографики. Поскольку 256=28, то один символ этого алфавита «весит» 8 бит.
8 бит информации присвоили свое название – байт.
Байт – поле из 8 последовательных бит. Байт широко используется как единица измерения количества информации.
1 байт = 8 бит
Компьютерные текстовые редакторы работают с алфавитом мощности 256 символов. Поскольку в настоящее время при подготовке книг используются текстовые редакторы, легко посчитать объем информации в тексте.
Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов, полученное значение даст информационный объем текста в байтах.
В любой системе единиц измерения существуют основные единицы и производные от них.
Для измерения больших объемов информации используются производные от байта единицы:
1 килобайт = 1 Кб = 210 байт = 1024 байта
1 мегабайт = 1 Мб = 210 Кб = 1024 Кб = 1048576 байт
1 гигабайт = 1 Гб = 210 Мб = 1024 Мб = 1048576 Кб = 1073741824 байт
Пример_8: Книга, набранная с использованием текстового редактора, содержит 70 страниц, на каждой странице 38 строк, в каждой строке 56 символов. Определить объем информации, содержащейся в книге.
Решение: Мощность компьютерного алфавита равна 256 символов. Один символ несет 1 байт информации. Значит 1 страница содержит 38*56=2128 байт информации. Объем всей информации в книге 2128*70=148960 байт.
Если оценить объем книги в килобайтах и мегабайтах, то
148960/1024 = 145,46875 Кбайт.
145,46875/1024 = 0,142059 Мбайт.
Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода. Только алфавитный подход пригоден при использовании технических средств работы с информацией.
В заключении следует отметить, что мы рассмотрели только два подхода к измерению количества информации. Наряду с этим, существуют и другие подходы, но это уже материал другой статьи.
Контрольные задания
Представленные ниже задачи являются контрольным заданием. Решения необходимо оформить в электронном виде и предоставлять на проверку преподавателю.