Семантический подход к измерению информации

В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность (учитывают прагматику информации) и истинность информации (учитывает семантику информации).

Целесообразность информации


(5.23)
Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле (5.23):

где p1, p2 – вероятности достижения цели после и до получения сообщения, соответственно.

Пример 5.12. Пусть вероятность сдачи экзамена по информатике до получения сообщения (подсказки от соседа) оценивается студентом с вероятностью p2 = 0,2. После того, как ему удалось получить подсказку, вероятность сдачи увеличилась: p1 = 0,8. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

В соответствии с (5.23) имеем:

I = log2(0,8/0,2) = log24 = 2.

Пример 5.13. Пусть положение студента до получения подсказки оценивается аналогично примеру 5.12. После получения подсказки, вопреки ожиданиям, вероятность сдачи еще уменьшилась, поскольку подсказка содержала неверную информацию: p1 = 0,1. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

В соответствии с (5.23) имеем:

I = log2(0,1/0,2) = log20,5 = -1.

Таким образом, полученная информация является дезинформацией, поскольку имеет отрицательный знак при измерении.

Полезность информации

Количество усваиваемой потребителем информации Iусв тесно связано с теми знаниями, которые имеет потребитель к моменту получения информации – с тезаурусом(ТЗ) потребителя. Этим определяется полезность информации. В самом деле, для усвоения тех знаний, которые получаются в ВУЗе, требуется среднее образование - иначе студент ничего не поймет. С другой стороны, любая учебная дисциплина ориентируется на знания, которые учащийся должен приобрести в предыдущих курсах. Этим объясняется последовательность учебных дисциплин по годам обучения.

Зависимость усваиваемой потребителем информации от его тезауруса выражается графически следующей кривой:

усваиваемая

потребителем

информация Iусв = f(ТЗ)

Iусв

0 opt max тезаурус (ТЗ)

Как видно из графика, при тезаурусе, равном нулю и максимальному значению в точке max, информация не усваивается: в первом случае, потребителю непонятна принимаемая информация, во втором – она ему уже известна. Максимально усваивается информация (т.е. она наиболее полезна) в точке opt, когда потребитель обладает достаточным (но не максимально возможным) тезаурусом для понимания получаемой информации. При значении тезауруса i-го потребителя ТЗi количество усваиваемой им информации определяется как Iусв = f(ТЗi). Сам тезаурус ТЗi может быть практически определен как результат интеллектуального тестирования, которое проводится, например, в некоторых западных странах. При таком тестировании человеку выставляется некоторый балл, который и может расцениваться как его ТЗi.

Истинность информации

Пусть r(mess) – функция, оценивающая истинность сообщения mess как соответствие его реальному положению вещей:

0 £ r(mess) £ 1,

причем при r(mess) = 1 сообщение истинно, а при r(mess) = 0 сообщение ложно.

Например,

r(«данное пособие посвящено информатике») = 1,

r(«данное пособие имеет объем 5 страниц») = 0.

Оценить истинность сложного сообщения можно, разбив его на простые. Например, сообщение mess(5.24):

«данное пособие посвящено информатике и имеет объем 5 страниц» (5.24)

можно представить как два простых сообщения mess(5.25) и mess(5.26):

«данное пособие посвящено информатике» , (5.25)

«данное пособие имеет объем 5 страниц». (5.26)

Тогда можно предложить рассчитывать истинность сложного сообщения как среднее арифметическое значение истинностей сообщений, его составляющих (что называют «истинно лишь наполовину»). В таком случае имеем:

r(mess(5.24)) = ½ (r(mess(5.25)) + r(mess(5.26))) = ½ (1 + 0) = 0,5.

Количество информации I, получаемое с сообщением mess, можно рассчитать как:

I = 2*r(mess) –1, (5.27)

где r(mess) – истинность сообщения mess.

Пример 5.14. Рассчитать количество информации I в сообщении, соответствующем определению информации 5 из прил.2. Поскольку данное сообщение истинно, для него r(mess) = 1. Тогда по формуле (5.27)

I = 2 * 1 – 1 = 1.

Пример 5.15. Рассчитать количество информации I в сообщении 5 из прил. 1, которое дано студентом в качестве определения информации. Поскольку данное сообщение является определением информатики, оно не соответствует действительности, а потому для него r(mess) = 0. Тогда в соответствии с (5.27) имеем: I = 2 * 0 – 1 = -1, т.е. сообщение является дезинформацией.

КАЧЕСТВО ИНФОРМАЦИИ

Качество информации является одним из важнейших параметров для потребителя информации. Оно определяется следующими характеристиками:

1) репрезентативность – правильность отбора информации в целях адекватного отражения источника информации. Например, в целях большей репрезентативности данных о себе абитуриенты стремятся представить в приемную комиссию как можно больше свидетельств, дипломов, удостоверений и другой информации, подтверждающей их высокий уровень подготовки, что учитывается при зачислении в ВУЗ;

2) содержательность – семантическая емкость информации. Рассчитывается как отношение количества семантической информации к ее количеству в геометрической мере. Это характеристика сигнала, про который говорят, что «мыслям в нем тесно, а словам просторно». В целях увеличения содержательности сигнала, например, используют для характеристики успеваемости абитуриента не полный перечень его аттестационных оценок, а средний балл по аттестату;

3) достаточность (полнота) – минимальный, но достаточный состав данных для достижения целей, которые преследует потребитель информации. Эта характеристика похожа на репрезентативность, однако разница состоит в том, что в данном случае учитывается минимальный состав информации, который не мешает принятию решения. Например, абитуриент – золотой медалист может не представлять в приемную комиссию свой аттестат: диплом, подтверждающий получение золотой медали, свидетельствует о полном наборе отличных оценок в аттестате;

4) доступность – простота (или возможность) выполнения процедур получения и преобразования информации. Эта характеристика применима не ко всей информации, а лишь к той, которая не является закрытой. Для обеспечения доступности бумажных документов используются различные средства оргтехники для их хранения, а для облегчения их обработки используются средства вычислительной техники;

5) актуальность – зависит от динамики изменения характеристик информации и определяется сохранением ценности информации для пользователя в момент ее использования. Очевидно, что касается информации, которая используется при зачислении, она актуальна, так как само обучение уже закончилось, и его результаты изменены быть не могут, а, значит, остаются актуальными;

6) своевременность – поступление не позже заранее назначенного срока. Этот параметр также очевиден недавним абитуриентам: опоздание с представлением позитивной информации о себе при поступлении может быть чревато незачислением;

7) точность – степень близости информации к реальному состоянию источника информации. Например, неточной информацией является медицинская справка, в которой отсутствуют данные о перенесенных абитуриентом заболеваниях;

8) достоверность – свойство информации отражать источник информации с необходимой точностью. Эта характеристика вторична относительно точности. В предыдущем примере получаемая информация недостоверна;

9) устойчивость – способность информации реагировать на изменения исходных данных без нарушения необходимой точности.

Наши рекомендации