Алфавитный подход к измерению информации

Алфавит – это набор букв, цифр, знаков препинания и др. символов, используемых в тексте.

Мощность алфавита- полное число его символов (N).

Информационный вес символа, выраженный в битах (b), и мощность алфавита (N) связаны формулой N=2b.

Пример:Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

Мощность алфавита N = 32. Какое количество информации несет одна буква?

32 = 2 5, значит вес одного символа b = 5 бит.

Пример: Сообщение, записанное буквами из 16 символьного алфавита, содержит 10 символов. Какой объем информации в битах оно несет?

Мощность алфавита N = 16. Текст состоит из 10 символов.

1. 16 = 2 4, значит вес одного символа b = 4 бита.

2. Всего символов 10, значит объем информации 10 * 4 = 40 бит.

Семантическая мера информации

Семантическая мера информации используется для измерения смыслового содержания информации.

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.

Тезаурус — это совокупность сведений, которыми располагает пользователь или система.

Алфавитный подход к измерению информации - student2.ru Максимальное количество семантической информации Iс потребитель получает при согласовании ее смыслового содержания со своим тезаурусом, когда поступающая информация понятна пользователю и несет ему ранее не известные сведения. С семантической мерой количества информации связан коэффициент содержательности С, определяемый как отношение количества семантической информации к общему объему данных.

где V – общий объем данных.

Прагматическая мера информации

Прагматическая мера информации – определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Системы счисления

Информация в ЭВМ хранится и отрабатывается в определенном, закодированном виде. ЭВМ оперируется числами, представленными в некоторой системе счисления.

Системой счисления называется способ записи чисел с помощью заданного набора специальных знаков (цифр).

Системы счисления принято делить на:

· Позиционные.

· Непозиционные.

В позиционных системах счисления вес каждой цифры изменяется в зависимости от ее положения (позиции) в последовательности цифр, изображающих число.

Пример: в числе 555 первая пятерка означает пять сотен, вторая – 5 десятков, а третья 5 единиц.

В непозиционных системах вес цифры (т.е. тот вклад, который она вносит в значение числа) не зависит от ее позиции в записи числа.

Пример: Римская система счисления. Число ХХI (двадцать один) вес цифры Х в любой позиции равен просто десяти.

Любая позиционная система счисления характеризуется основанием – количеством различных знаков или символов, используемых для изображения чисел в данной системе.

За основание системы можно принять любое натуральное число. Следовательно, возможно бесчисленное множество позиционных систем: двоичная, троичная, четверичная и т.д. Запись чисел в каждой из систем счисления с основанием g означает сокращенную запись выражения

Алфавитный подход к измерению информации - student2.ru (1.4)

где, ai – цифры системы счисления;

n и m – число целых и дробных разрядов, соответственно.

Любая позиционная система счисления должно удовлетворять условию a<g.

Наибольшее распространение для представления чисел в ЭВМ, получили двоичная, восьмеричная и шестнадцатеричная системы счисления.

Двоичная система счисления – в этой системе счисления для представления числа применяются две цифры – 0 и 1.

Восьмеричная системасчисления–в этой системе счисления для представления числа применяются цифры – от 0 до 7.

Шестнадцатеричная система счисления – для представления числа используются цифры от 0 до 9 и буквы латинского алфавита – A, B, C, D, E, F.

Наши рекомендации