Измерение и представление информации

Количество информации; при различных вероятностях событий количество информации может быть измерено по формуле К. Шеннона: Измерение и представление информации - student2.ru ,

где a - априорные сведения о системе;

H(a) - энтропия системы после получения сообщения В;

Измерение и представление информации - student2.ru - количество информации о системе, полученной в сообщении В.

Энтропия системы может рассматриваться как мера недостатка информации до полного исчерпывающего знания о системе. n

Измерение и представление информации - student2.ru

Измерение и представление информации - student2.ru

N=mn, где Pi-вероятность того, что система находится в i –ом состоянии;

N-число состояний системы;

Измерение и представление информации - student2.ru -равновероятные состояния системы.

Тезаурус-совокупность сведений, которыми располагает пользователь или система. Максимальное количество семантической информации потребитель получает при согласовании смыслового содержания со своим тезаурусом. Сообщение может иметь смысл для компетентного пользователя и быть бесполезным для некомпетентного.

Классификация информационных объектов

Классификация - система распределения объектов по классам в соответствии с определенным признаком.

Классификация объектов - процедура группировки на качественном уровне, направленная на выделение однородных свойств.

В информатике мы решаем дело с информационными объектами. Св-ва объекта определ-ся параметрами, называемыми реквизитами.

Реквизит - логически неделимый информационный элемент, описывающий опред. св-во объекта. Пример: Инфор. объект "студент" харак-ся набором след. реквизитов: ФИО; пол; год рождения; место рождения; адрес проживания; факультет; курс; группа.

Методы классификации:

Любая система классиф-и должна отвечать след. требованиям:

полнота охвата объектов рассматриваемой области;

однозначность реквизитов;

возможность включения новых объектов.

В любой стране применяются государственные, отраслевые, региональные. классификаторы. Например: классиф-ры отрасли промышленности, виды изданий, профили и т.д.

Разработаны 3 метода классиф-и объектов:

иерархический;

фасентный;

дескрипторный.

Иерархическая система

Иерархическая система - Исходное множество сост.0-ой уровень, он делится на классы, которые образуют 1-ый уровень. Каждый класс 1-ого уровня делится на подклассы, которые образуют 2-ой уровень и т.д. В иерархической системе классиф-и из-за жесткой структуры, особое внимание уделяют выбору классиф-и признаков. Кол-во уровней харак-ет таблицу классиф-ии.

Достоинства: простота построения и использование независимых классиф-ых признаков.

Фасетная система

Фасетная система - Признаки классиф-и называется фасетами. Каждый фасет содержит сов-ть однородных значений данного классиф-ого признака. Процедура классиф-и состоит в присвоении каждому объекту соответствующих. значений из фасетов.

Достоинства: возможность создания большой емкости классиф-и, простота модификации всей структуры классиф-и без изменения структуры существующих признаков.

Дескрипторная система

Дескрипторная система - Суть дескрипторного метода в след.: отбирается сов-ть ключевых слов и словосочетаний, описывающих предметную область; выборка ключевых слов подвергается нормализации, т.е. из совокупности синонимов выбираются наиболее употребляемые; создается словарь дескрипторов. Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска. Связи между дескрипторами могут быть 3-х видов: синонимические, указывающие некоторую сов-ть ключевых слов и синонимов; родовидные, отражающие включение некоторого класса объектов в более представительный класс; ассоциативные, соединенные дескрипторы, обладающие общими свойствами.

Наши рекомендации