Семантическая мера информации

Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства со способностью пользователя принимать поступившие сообщения. Для этого используется понятие тезаурус пользователя.

Тезаурус –это совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан нарисунке 5. Рассмотрим два предельных случая, когда количество семантической информации Icравно 0:

· При Sp » 0 пользователь не воспринимает, не понимает поступающую информацию;

· При Sp® ¥ пользователь все знает, и поступающая информация ему не нужна.

 
  Семантическая мера информации - student2.ru

Ic

Семантическая мера информации - student2.ru Семантическая мера информации - student2.ru Семантическая мера информации - student2.ru Sp opt Sp

Рисунок 5.

Зависимость количества семантической информации, воспринимаемой

потребителем, от его тезауруса Ic = f(SP)

Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом SP (SP = SP opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и тоже сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему:

Семантическая мера информации - student2.ru

Прагматическая мера информации

Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера величина также относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

Пример.В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:

Семантическая мера информации - student2.ru

где: Inb (g) – ценность информационного сообщения b для системы управления g,

П(g) – априорный ожидаемый экономический эффект функционирования системы управления g,

П(g /b)– ожидаемый эффект функционирования системы g при условии, что для управления будет использована информация, содержащиеся в сообщении b.

Для сопоставления введенные меры информации представим в таблице 2.

Таблица 2. Единицы измерения информации и примеры

Мера информации Единицы измерения Примеры (для компьютерной области)
Синтаксическая: шенноновский подход;   компьютерный подход.     Степень уменьшения неопределенности. Единицы представления информации.   Вероятность события.   Бит, байт, Кбайт, и т.д.
Семантическая Тезаурус   Экономические показатели Пакет прикладных программ, персональный компьютер, компьютерные сети и т.д. Рентабельность, производительность, коэффициент амортизации и т.д.
Прагматическая Ценность использования Емкость памяти, производительность компьютера, скорость передачи данных и т.д. Денежное выражение. Время обработки информации и принятия решений.

Системы счисления

Семантическая мера информации - student2.ru С незапамятных времен людям приходилось выполнять элементарные подсчеты, связанные с определением количества животных в стаде, числа убитых и раненых воинов, размера добычи охотника и т. п. Наиболее древние числительные – один, два, пять, десять, двадцать – обязаны своим происхождением самым естественным счетным приспособлениям – пальцам рук и ног.

Английский исследователь первобытной культуры Э. Тейлор описывает происхождение вычислительных терминов на примере языка племени таманакс Ориноко. Для обозначения «пятерки» у них применялось сочетание, означающее в переводе «целая рука». Число «шесть» представлялось как «один с другой руки». И так до числа «десять», звучавшего как «обе руки». Затем в ход шли пальцы ног – «один с ноги» (11), «один с другой ноги» (16), «один человек» (20). Для больших величин приходилось прибегать к аналогичным «разрядам» другого человека – «один с руки другого человека» (21), «два человека» (40) и т. д.

Аналогичная техника использования «пятерок» хорошо прослеживается на письменности индейцев майя. Их жрецы в своих календарных расчетах применяли следующие цифры и производные от них числа.

В древнем Египте привились более близкие нам числовые компоненты – единицы, десятки, сотни и тысячи.

Подобный способ счета заложил основу для аддитивных (от слова складывать – add) систем счисления, в которых число представляется в виде суммы стандартных слагаемых.

Так называемая римская система счисления представляет собой несколько более усложненную аддитивную модель:

1=I 5=V 10=X 50=L 100=C 500=D 1000=M 1972=MCMLXXII

Если меньшая числовая компонента находится справа, то она увеличивает значение предыдущего слагаемого (VI=V+I=6, XII+X+I+I=12), а если слева, то вместо прибавления приходится вычитать (IV=-1+V=4, IX=-1+X=9). И хотя запись чисел в римской системе не так уж сложна, но попробуйте перемножить CCXLVII на MMCDXI или хотя бы сложить эти два числа. А в десятичной системе такая же задача (247*2411) решается за несколько секунд.

Следующий шаг в математическом развитии человечества связан с появлением мультипликативных систем счисления. Теперь каждая цифра множится на некий весовой коэффициент, зависящий от нахождения цифры в числе. Одна из наиболее ранних попыток такого рода предпринималась жрецами майя, которые для записи больших чисел использовали формулу:

Семантическая мера информации - student2.ru

Здесь Семантическая мера информации - student2.ru - одна из описанных выше цифр, принадлежащая диапазону Семантическая мера информации - student2.ru . Выбор столь странных весовых коэффициентов объясняется тем, что жрецы делили год на 18 месяцев, каждый из которых насчитывал по 20 дней. В расшифрованных документах было обнаружено довольно большое число:

Семантическая мера информации - student2.ru Семантическая мера информации - student2.ru

Появлению современной десятичной системы счисления предшествовали различные счетные приспособления, которыми люди пользовались для ускорения рыночных операций и более сложных рыночных расчетов. К ним относятся и примитивные кучки из камушков разного размера, и более удобные приспособления из доски, разделенные на отсеки со счетными шариками (абак). Кстати, латинское слово для обозначения счета «calculare» произошло от «calculus» – камень.

Одна и та же цифра в разных позициях числа имеет, естественно, разный вес.

Десятичная система, обязанная своим происхождением первобытным средствам счета, далеко не единственная, придуманная людьми. Отголоски системы с основанием 60 можно обнаружить в наших представлениях об измерении времени и угловых величин. В Нидерландах сохранилась тенденция к счету дюжинами. Однако десятичная система доминирует в мире людей. А вот в мире компьютеров с момента появления первой ЭВМ используется только двоичная система. За всю историю информатики известна единственная попытка построить ЭВМ, работающую в троичной системе счисления, она была сконструирована в МГУ и называлась «Сетунь».

Система счисления— это совокупность правил и при­емов записи чисел с помощью набора цифровых знаков (алфавита). Количество цифровых знаков называют ос­нованием системы счисления.

Различают два типа систем счисления:

♦ позиционные,когда значение каждой цифры числа определяется ее местом (позицией) в записи числа;

♦ непозиционные, когда значение цифры в числе не зависит от ее места в записи числа.

Примером непозиционной системы счисления являет­ся римская: XI, IV, XV и т.д. Примером позиционной системы счисления можно назвать десятичную систему, используемую повседневно.

Десятичная система счисления пришла в Европу из Индии, где она появилась не позднее VI века н.э. В этой системе 10 цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, но информацию несет не только цифра, но и место, на котором цифра стоит (то есть ее позиция). В десятичной системе счисления особую роль играют число 10 и его степени: 10, 100, 1000 и т.д. Самая правая цифра числа показывает число единиц, вторая справа - число десятков, следующая - число сотен и т.д.

Двоичная система счисления. В этой системе всего две цифры - 0 и 1. Особую роль здесь играет число 2 и его степени: 2, 4, 8 и т.д. Самая правая цифра числа показывает число единиц, следующая цифра - число двоек, следующая - число четверок и т.д. Двоичная система счисления позволяет закодировать любое натуральное число - представить его в виде последовательности нулей и единиц. В двоичном виде можно представлять не только числа, но и любую другую информацию: тексты, картинки, фильмы и аудиозаписи. Инженеров двоичное кодирование привлекает тем, что легко реализуется технически.

Наши рекомендации