Данные и метаданные информационных систем
Информационные системы используют ресурсы нескольких категорий — средства вычислительной техники, системное и прикладное программное обеспечение, информационные, лингвистические и человеческие ресурсы.
Информационные ресурсы системысоставляют главный компонент модели предметной области, которую система поддерживает.Важно заметить, что в любой информационной системе поддерживается две категории информационных ресурсов. Ресурсы первой категории непосредственно используются конечными пользователями системы. Ресурсы второй категории можно было бы назвать метаресурсами.Описывая свойства ресурсов первой категории, они позволяют системе корректно оперировать ими. Как уже отмечалось, ресурсы первой категорий часто называют данныминезависимо от среды их представления (изображения, текстовые документы, аудиозаписи и т.д.), а метаресурсы — метаданными. метаданные — это данные о данных. Однако фактически метаданные могут описывать свойства не только собственно данных, но и информационной системы в целом, отдельных ее механизмов и их функций, других ее ресурсов, поддерживаемых технологий, пользователей и т.д. данные в информационной системе представляют собой некоторую абстрактную модель реальности. Рассматривая соотношение между данными и метаданными, можно сказать, что метаданные — это данные более высокого уровня абстракции по отношению к описываемым ими данным. Метаданные, предназначенные для компьютерного использования, представляются в формализованном виде. Если же они предназначены для пользователей, то чаще всего представляются на естественном языке. В системах, основанных на технологиях баз данных, поддерживаются структурированные данные, организованные в виде таблиц или каких-либо иных структур данных. К информационным ресурсам систем баз данных относятся также и схемы баз данных. В таких системах они относятся к категории метаданных. В текстовых системах информационные ресурсы включают коллекции документов, представленных на естественных языках. Это информационные ресурсы для конечных пользователей. Кроме того, поддерживаются метаданные — тезаурусы, спецификации онтологии.
Тезаурус –от греческого «сокровищница», множество смысловых единиц некоторого языка с заданной на нем системой семантических отношений. Тезаурус фактически определяет семантику языка (нац. языка, языка науки, формального языка).
Семантика –от греческого «обозначающий».Одно из направлений трактовки – «значение» (смысл) единиц языка.
Онтология –от греческого ontos – сущность. Раздел философии, в котором рассматривается всееобщие основы, принципы бытия, его структура и закономерности.
Структурированные модели, слабоструктурированные модели
Структурированные модели
Модели такого рода основаны на выявлении регулярной структурыпредметной области. Для конструирования таких моделей нужно типизировать сущности предметной области, относя к одному типу сущности с одинаковым набором свойств. Аналогичным образом типизируются связи между сущностями. Связи определяются на множествах типов сущностей и могут иметь различную арность.Представление предметной области, сконструированное с помощью рассматриваемого подхода, также называется структурированным.
Одной из разновидностей рассматриваемого подхода к моделированию предметной области является объектный (или объектно-ориентированный) подход, который дает возможность моделировать не только структуру предметной области, но и поведение экземпляров сущностей, относящихся к каждому определенному типу. С этой целью определение каждого типа сущностей включает определения допустимых на его экземплярах операций(или методов).
При использовании структурированных моделей представление предметной области имеет два уровня.
Представление более высокого уровня абстракции — это модель предметной области, отображающая ее свойства, инвариантные во времени. Эта модель представляется в терминах типов сущностейпредметной области и типов связеймежду ними. Такую модель называют интенсионалом предметной области.
Второй, более конкретный уровень, моделирует состояние предметной области в зависимости от времени. Модель этого уровня представляется в терминах конкретных экземпляров сущностейи связейопределенных типов между ними. Эту модель называют экстенсионалом предметной области.
На структурированных моделях предметной области с регулярной структурой основаны системы баз данных.