Ценность и количество информации
В настоящее время все более широкое признание получает идея определения количества семантической информации с помощьютезауруса, предложенная Ю. А. Шрейдером. В качестве меры количества семантической информации Ю. А. Шрейдер предлагает рассматривать степень изменения тезауруса получателя при приеме некоторого сообщения (количество семантической информации, заключенной в данном сообщении, можно оценить как степень изменения тезауруса приемника этой информации под действием данного сообщения). Если сообщение не имеет ничего общего с тезаурусом потребителя, не пересекается с ним, то принимаемая информация будет равна нулю. Под тезаурусом потребителя информации здесь понимается запас знаний потребителя, представленный в виде специального словаря (тезауруса). Получатель в состоянии использовать лишь некоторую часть смысловой информации, объем которой зависит от приспособленности его тезауруса к приему той или иной информации. Идеи такого тезауруса целесообразно использовать при отборе наиболее приемлемой информации и при решении задач преобразования информации в формы, наиболее удобные для восприятия адресатом информации.
Основные понятия
Независимо от сферы деятельности человека выполнение любой работы и решение любой проблемы всегда связано с использованием уже существующей и созданием новой информации. С этой точки зрения любая основная деятельность человека связана с его информационной деятельностью, т. е. с деятельностью по сбору и обработке существующей и созданию новой информации. Иными словами, информационная деятельность неразрывно связана с основной деятельностью, а субъект основной деятельности (СОД) всегда выполняет три взаимосвязанных функции: потребителя (приемника) информации, собственно исполнителя основной работы (деятельности) и генератора (источника) информации.
Следовательно, понятие информации тесно связано с понятием потребителя (приемника) информации, генератора (источника) информации, информационной потребности и другими понятиями, определяющими степень соответствия информации, полученной потребителем, его информационным потребностям.
Под потребителем (приемником) информации понимают отдельное лицо, коллектив, машинную или человеко - машинную (организационную) систему, использующие информацию/данные в целях выполнения определенной работы в процессе основной деятельности. Иными словами потребителем информации является любой субъект основной деятельности.
В отличие от потребителя информации генератором (источником) информации является отдельное лицо, коллектив, машинная или человеко-машинная система, создающая сообщения в ходе (или в результате) выполнения той или иной деятельности.
Ä Информационная потребность (ИП) - совокупность элементов информации/данных, необходимая и достаточная для эффективного выполнения заданной работы (решения задач) субъектом основной деятельности.
ИП зависит от степени подготовленности СОД к выполнению заданной работы, его знаний, умений, наличия уже собранной информации/данных, а также от трудоемкости и сложности заданной работы, ее внутреннего многообразия и взаимосвязей с внешней средой.
Информационная потребность СОД удовлетворяется в результате поиска сообщений в информационной среде по информационному запросу, сформулированному на естественном языке, и в той или иной мере отражающему информационную потребность. Степень адекватности (соответствия) информационного запроса информационной потребности определяется различными факторами, основным из которых является способность СОД сформулировать свою информационную потребность на естественном языке с учетом специфики как стоящей перед СОД проблемы, так и информационной среды.
Найденные в результате информационного поиска сообщения в той или иной мере соответствуют информационному запросу и информационной потребности.
Ä Характеристика степени соответствия сообщения информационной потребности носит название пертинентности.
Ä Характеристика степени соответствия сообщения информационному запросу получила название релевантности.
В силу того, что информационный запрос практически никогда не соответствует полно и точно информационной потребности, (информационный запрос может быть адекватен информационной потребности только в единственном случае, когда СОД абсолютно полно и точно знает свою информационную потребность и может ее сформулировать, но это может быть только после получения им всей необходимой информации) релевантность информации всегда отличается от ее пертинентности.
Понятия пертинентности и релевантности информации тесно связана с понятиями количества информации и ее ценности с точки зрения решаемой СОД проблемы.
Тезаурус найденного сообщения может иметь мало общего с тезаурусами как задачи, так и информационной потребности. Цель информационного поиска состоит в поиске множества сообщений, совокупный тезаурус которых должен соответствовать тезаурусу информационной потребности, который, в свою очередь, вместе с тезаурусом потребителя должен покрывать тезаурус решаемой задачи. Информационный запрос (и его тезаурус) служат промежуточным звеном между потребителем и информационной средой, обеспечивающим поиск необходимой информации.
Количество информации, по Шрейдеру, определяется степенью изменения тезауруса потребителя (ТП) под воздействием тезауруса сообщения (ТИС), т. е. рассогласованием нового тезауруса потребителя (ТП), являющегося результатом воздействия сообщения, и исходного тезауруса ТП.
В отличие от количества информации, ценность сообщения (информации) определяется по отношению к решаемой задаче и, следовательно, ее можно оценить при рассмотрении взаимоотношения тезаурусов сообщения и задачи. Ценность сообщения, кроме того, зависит от большой совокупности различных факторов и, прежде всего, от важности самой решаемой задачи.
Основные процессы преобразования информации
С информационной точки зрения любая деятельность человека или человеко-машинной системы включает следующие этапы :
1.Поиск сообщений. Внешняя среда с точки зрения СОД представляет собой некоторый генератор потока сообщений, представленных на языке коммуникаций, в общем случае, не тождественном "внутреннему языку" потребителя информации, связанному с конкретной решаемой проблемой. Целью данного этапа является отбор из внешнего потока сообщений тех из них, которые могут быть использованы при выполнении основной деятельности. На этапе поиска сообщений используются услуги различных информационных систем и неформальные каналы, доступные конкретному потребителю информации.
2.Интерпретация сообщений. В связи с конкретным характером решаемой задачи и тезауруса потребителя информации, имеет место упомянутое различие "языка коммуникаций" и "внутреннего языка". Данный этап заключается в адаптации сообщений, интерпретации в терминах "внутреннего языка", т. е. в конечном итоге - в извлечении из сообщений информации, необходимой для решения поставленной задачи. Этап 2 приводит к созданию информационного обеспечения решаемой задачи, которое должно привести к повышению эффективности ее решения. (В более узком смысле информационным обеспечением можно считать результат этапа 2 - построение совместными усилиями СОД и информационной системы некоторой совокупности сообщений, релевантных (потенциально полезных) задачам СОД).
3.Решение задачи. На данном этапе, используя полученную информацию, собственные знания и опыт, а также материальные, энергетические, трудовые и иные ресурсы, СОД вырабатывает новую информацию, которая является результатом решения задачи. Эта информация зафиксирована на "языке задачи" и без дополнительных затрат труда, как правило, не представляет ценности при выходе за пределы конкретной задачи, являясь достоянием СОД или достаточно ограниченного множества лиц (организаций), связанных с конкретной проблемой.
4.Создание сообщений.На данном этапе СОД интерпретирует полученный результат на "языке коммуникаций", т. е. подготавливает сообщение в стандартной форме, принятой на данном этапе развития системы научной коммуникации вообще и систем научно-технической информации (НТИ), в частности. Это может быть подготовка статьи, отчета, выступления на научной конференции, семинаре и т. д. Новая информация, зафиксированная в форме сообщения (например, документальной), потенциально представляет собой общественную ценность для решения большого круга задач, так или иначе связанных с задачей, в результате решения которой она получена.
5. Распространение и преобразование сообщений. Автор сообщения вступает в активное взаимодействие с системой коммуникации, затрачивая определенные усилия (в основном организационного характера) по вводу сообщения в один (или несколько) из доступных каналов коммуникации (депонирование сообщения, публикация, выступление и т. д.). Эффективность данного этапа деятельности определяется как степенью усилий, предпринимаемых СОД, так и теми возможностями, которые ему предоставляет система коммуникации.
Очевидно, что в общем случае данные этапы реализуются сложным последовательно-параллельным образом. Вышеизложенное отображает обобщенную логику рассматриваемого процесса, но необязательно - последовательность его реализации во времени. Кроме того, в конкретных ситуациях процесс решения задачи необязательно включает все указанные этапы, или, по крайней мере, не все они предполагают сравнимые затраты труда (времени).
Этапы 1 и 5 приведенной декомпозиции деятельности являются этапами собственно информационной деятельности. Этап 3 - собственно основная деятельность. Этапы 2 и 4 носят пограничный, диффузный характер и могут быть отнесены как к основной, так и к информационной деятельности.