Количество информации. Единицы измерения информации
Количество информации, передаваемой от источника к приемнику, связано с вероятностью пребывания источника в том или ином состоянии. Если состояние источника известно заранее (до передачи информации), то количество информации, получаемой приемником при передаче, равно нулю. Если же состояние источника не известно заранее, то количество получаемой информации определяется формулой
где N — число состояний, в которых может находиться источник;
Pi — вероятность появления i-ro состояния (i = 1, 2, . . . , N - 1, N).
При равновероятных состояниях источника (т.е. при Р1 = Р2=…= РN= )
Основание логарифма k в последней формуле определяет единицу количества инфор-мации. При k = 2 соответствующая единица называется бит (Bit — от слов binary digit). Такая единица чаще всего встречается в технике, что обусловлено наиболее частым использованием двузначного алфавита для представления дискретной информации. Один бит равен количеству информации, получаемому от источника с двумя равновероятными состояниями.
Современные ЭВМ могут обрабатывать не только числовую информацию, но и информа-цию, заданную любыми другими символами. Обычно для представления одного символа служит слово длиной в 23 = 8 бит, получившее название байта. Посредством слов такой длины можно закодировать 28 = 256 различных символов, чего вполне достаточно при решении многих задач, связанных с обработкой символьной информации. Количество информации в этом случае удобно из-мерять также в байтах.
Для измерения больших объемов информации в ВТ применяются специальные единицы, ко-торые обозначаются К и М и читаются соответственно «кило» и «мега». При этом 1К = 1024 = 210, 1М = 1 048 576 = 220. Например, 1М байт = 210 К байт = 220 байт = 223 бит, 1М бит = 210 К бит = 220 бит, 1К байт = 210 байт = 213 бит, 1К бит = 210 бит. Иногда в приближенных расчетах полагают, что К 103, М 106.
Единицей измерения скорости передачи информации по каналам связи служит бод, равный 1 .
Кроме перечисленных единиц для измерения количества информации, обрабатываемой и хранимой в ЭВМ, используются также единицы, не имеющие постоянного количественного эквивалента. К таким единицам относятся поле, слово, массив, сегмент и другие. Поле представляет собой группу бит, имеющую определенное значение (например, поле, в котором указывается в кодированном виде операция, выполняемая на ЭВМ).
Совокупность бит, байтов, полей, слов, объединяемых некоторым общим признаком (напри-мер, исходные данные для решения задачи), называется массивом. Сегмент — упорядоченная совокупность бит, байтов, полей, слов, массивов, сгруппированных вместе с целью наименования.