Семиотические аспекты информации
Перенос информации с одного носителя на другой, как правило, сопровождаться изменением формы представления информации, важно при этом, чтобы информация была узнаваемой, то есть, смысл информации не менялся. Например, информация о внешнем облике конкретного человека может быть представлена в форме фотоснимка, рисунка или текста. Очевидно, что в каждой из этих форм исходный облик человека не передается в точности. Например, черно-белая фотография не выражает всю цветовую гамму. Текст вообще внешне не похож на человеческий облик, но информацию о нём он содержит. Следовательно, одна и та же по смыслу информация может быть представлена в различных видах. Важно при этом чтобы результат представления информации был понятен и однозначен с требуемой точностью. Иными словами, требуется, чтобы между исходным представлением информации и её новым представлением было установлено соответствие.
Информатика занимается разработкой и исследованием способов представления информации, в основе которых лежат знаки и знаковые системы. Под знаком понимается некий информационный образ, который служит представителем (заместителем) информационного образа объекта (источника информации) и использующийся для восприятия информации от объекта на другом носителе информации.
Определение отношений между знаками и тем, что они обозначают, представляют, замещают, относится к семиотическим аспектам информации. Знаковые системы, обладающие семантикой (смыслом), называются языками. Знаки лежат в основе реализации любого информационного процесса. Языки предназначены для восприятия и интерпретации информации и реализации свойств относительной независимости информации от её носителя. Так как различные носители информации, благодаря своим материальным свойствам, в большей или меньшей степени приспособлены под различные знаковые системы, то в общем случае возникает необходимость перевода информации из одной знаковой системы в другую (с одного языка на другой). Например, мелодия, выраженная языком звуков, переносится на бумагу и запечатлевается на ней в виде символов нотной грамоты. То есть, знаку в виде звука ставится в соответствие знак в виде графического символа – нота.
Знаки и знаковые системы изучает наука семиотика. Семиотические аспекты информации представлены синтаксисом, семантикой и прагматикой.
Синтаксис определяет правила построения знаков для выражения информации в выбранной знаковой системе (языке). Выбор знаковой системы зависит от свойств носителя информации, который предполагается использовать для восприятия информации. Например, на бумаге можно зафиксировать письменную речь, состоящую из графических символов (знаков). Вода для таких знаков практически не приспособлена.
Семантика устанавливает отношение между знаком и тем, что он представляет. Даже в простейшем случае между знаком и его обозначением стоит субъективная смысловая интерпретация знака (семантика знака). Например, знак 5 может быть использован для обозначения различной по смыслу информации. Это могут быть номер 5, или 5 лет, или 5 км, или 5 книг и т.д.
С точки зрения семантики каждое сочетание знаков является осмысленным или бессмысленным. Сопоставляя синтаксис и семантику важно отметить, что неточные с точки зрения синтаксиса знаковые построения могут иметь смысл. Примером этому является детская речь. Верно и обратное, точные с позиции синтаксиса знаковые построения могут быть лишены смысла (ничего не обозначать). Например, выражение "глокая куздра" построено по правилам русского языка, но в рамках современного русского языка смысла не имеет.
Результат представления информации в виде совокупности знаков в информатике называется набором данных или данными. Данные позволяют зафиксировать информацию, воспринимаемую от источника информации, и работать с ней независимо от источника информации.
Прагматика выражается в оценке и сравнении различных знаковых систем по критериям полезности, выгодности и эффективности их использования с целью выражения конкретной информации. Прагматика стимулирует развитие и позволяет оценить эффективность использования для представления той или иной информации искусственных знаковых систем, которые создаются на формальной основе. Например, арабская десятичная система счисления (знаковая система для обозначения количества) заменила римскую систему счисления, так как с позиции прагматики оказалась более эффективной для обозначения информации о любом количестве.
Мера информации
Наиболее распространенными глаголами, употребляемыми с термином "информация", являются "получить", "приобрести", "передать" (даже "купить" или "продать"). При этом возникает потребность как-то оценить (измерить) информацию. И здесь обнаруживается удивительная вещь: говоря о количестве информации (много информации, мало информации), величину информации трудно выразить в единицах измерения. Более того, очевидно, что объем информации, получаемой приемником из поступившего сообщения, зависит от того, какой информацией он уже обладает (информационного состояния приемника). Причина трудности создания системы измерения информации кроется в её не материальности.
Существуют различные взгляды на проблему измерения информации. В рамках любого подхода предполагается, что существует некий приемник информации, который с целью получения информации от источника информации вступает с ним в информационное взаимодействие, результатом которого является передача от источника приемнику информационного сообщения. Система измерения информации должна позволять определить количество информации доставляемой приемнику при получении сообщения от источника информации.
Для примера рассмотрим подходы к измерению информации, основанные на использовании так называемых синтаксической или семантической мер информации.
Синтаксическая мера
Синтаксическая мера рассматривает информационное сообщение как совокупность знаков, соответствующую информационной модели источника информации, посредством которых информация от источника информации воспринимается приемником информации. Таким образом, в качестве единицы информации выступает единичный знак.
Предполагается, что информационное взаимодействие приемника и источника информации с необходимостью повторяется, и цель получения очередного сообщения заключается в том, чтобы поддерживать адекватность информации, хранимой приемником, текущему информационному состоянию источника информации. Если источник информации не изменяет во времени своего информационного состояния, то при получении от него сообщения никаких изменений в информационном образе источника информации, хранимом приемником, не произойдет. Иными словами количество новых или изменившихся знаков в информационном образе будет равно нулю, а следовательно и количество информации, доставленной сообщением, будет равно нулю. Если объект изменяет свое состояние во времени, то возникает необходимость обновлять информационный образ для обеспечения его адекватности источнику информации. Очевидно, что в общем случае, чем больше времени проходит между предыдущим и последующим обменами сообщениями, тем больше знаков будет меняться в информационном образе, отражая изменение состояния источника информации. Количество изменившихся или дополнившихся в информационном образе знаков и составляет объем информации, полученной приемником.
Семантическая мера
Семантическая мера предназначена для измерения объема сведений (смыслового содержания), поступающих приемнику при получении сообщения от источника информации. Для измерения смыслового содержания информации, т.е. её количества на семантическом уровне, существует так называемая тезаурусная мера, которая связывает семантику получаемого сообщения с семантикой информации, которой приемник уже располагает. Тезаурус - это совокупность сведений, которыми располагает приемник информации.
Пусть S - тезаурус приемника информации, I - количество семантической информации, включаемой приемником в тезаурус при получении сообщения.
Тогда характер зависимости I от S при поступлении очередных сообщений будет иметь вид:
| |||
|
При S=0 приемник воспринимает информацию, но "не понимает смысла", так как у него нет соответствующих знаний (тезаурус пуст).
При S ® ¥ приемник "всё знает", и поступающее сообщение не приносит ему дополнительных сведений.
Максимальное количество семантической информации Imax доставляется сообщением тогда, когда поступающая информация "понятна" приемнику и несет ему ранее не известные сведения (отсутствующие в тезаурусе). Следовательно, количество семантической информации в сообщении является величиной относительной, зависящей от состояния тезауруса. Очевидно, что существует оптимальное состояние тезауруса Sopt, при котором поступающие сообщения доставляют максимальное количество смысловой информации. Единица измерения смысловой информации зависит от выбранного способа построения тезауруса и им определяется.