Измерение и представление информации
Количество информации; при различных вероятностях событий количество информации может быть измерено по формуле К. Шеннона: ,
где a - априорные сведения о системе;
H(a) - энтропия системы после получения сообщения В;
- количество информации о системе, полученной в сообщении В.
Энтропия системы может рассматриваться как мера недостатка информации до полного исчерпывающего знания о системе. n
N=mn, где Pi-вероятность того, что система находится в i –ом состоянии;
N-число состояний системы;
-равновероятные состояния системы.
Тезаурус-совокупность сведений, которыми располагает пользователь или система. Максимальное количество семантической информации потребитель получает при согласовании смыслового содержания со своим тезаурусом. Сообщение может иметь смысл для компетентного пользователя и быть бесполезным для некомпетентного.
Классификация информационных объектов
Классификация - система распределения объектов по классам в соответствии с определенным признаком.
Классификация объектов - процедура группировки на качественном уровне, направленная на выделение однородных свойств.
В информатике мы решаем дело с информационными объектами. Св-ва объекта определ-ся параметрами, называемыми реквизитами.
Реквизит - логически неделимый информационный элемент, описывающий опред. св-во объекта. Пример: Инфор. объект "студент" харак-ся набором след. реквизитов: ФИО; пол; год рождения; место рождения; адрес проживания; факультет; курс; группа.
Методы классификации:
Любая система классиф-и должна отвечать след. требованиям:
полнота охвата объектов рассматриваемой области;
однозначность реквизитов;
возможность включения новых объектов.
В любой стране применяются государственные, отраслевые, региональные. классификаторы. Например: классиф-ры отрасли промышленности, виды изданий, профили и т.д.
Разработаны 3 метода классиф-и объектов:
иерархический;
фасентный;
дескрипторный.
Иерархическая система
Иерархическая система - Исходное множество сост.0-ой уровень, он делится на классы, которые образуют 1-ый уровень. Каждый класс 1-ого уровня делится на подклассы, которые образуют 2-ой уровень и т.д. В иерархической системе классиф-и из-за жесткой структуры, особое внимание уделяют выбору классиф-и признаков. Кол-во уровней харак-ет таблицу классиф-ии.
Достоинства: простота построения и использование независимых классиф-ых признаков.
Фасетная система
Фасетная система - Признаки классиф-и называется фасетами. Каждый фасет содержит сов-ть однородных значений данного классиф-ого признака. Процедура классиф-и состоит в присвоении каждому объекту соответствующих. значений из фасетов.
Достоинства: возможность создания большой емкости классиф-и, простота модификации всей структуры классиф-и без изменения структуры существующих признаков.
Дескрипторная система
Дескрипторная система - Суть дескрипторного метода в след.: отбирается сов-ть ключевых слов и словосочетаний, описывающих предметную область; выборка ключевых слов подвергается нормализации, т.е. из совокупности синонимов выбираются наиболее употребляемые; создается словарь дескрипторов. Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска. Связи между дескрипторами могут быть 3-х видов: синонимические, указывающие некоторую сов-ть ключевых слов и синонимов; родовидные, отражающие включение некоторого класса объектов в более представительный класс; ассоциативные, соединенные дескрипторы, обладающие общими свойствами.