Хранение и накопление информации. Характеристика уровней и моделей представления данных предметной области при хранении

Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных и склада (хранилища) данных.

База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных – система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.

Система баз данных – совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (используют также термины Data Warehouse, «склад данных», «информационное хранилище») – это база, хранящая данные, агрегированные по многим измерениям. Основные отличия хранилища данных от базы: агрегирование данных; данные из хранилища никогда не удаляются; пополнение хранилища происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых, – автоматическое.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных – множество тематических баз данных, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое) (рисунок).

Хранение и накопление информации. Характеристика уровней и моделей представления данных предметной области при хранении - student2.ru

СУБД – система управления базами данных; МБД – машина баз данных (вспомогательный периферийный процессор, выполняющий функции СУБД и необходимый вследствие возросших объемов информации и требований к скорости доступа)

Рисунок – Описание предметной области

Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью базы данных и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность–связь» (ER-модель (диаграмма), модель Чена), инфологические модели, семантические сети). На рисунке представлена концептуальная модель (модель «сущность–связь») для описания данных химико-технологического процесса (процесса спекания керамических материалов).

Хранение и накопление информации. Характеристика уровней и моделей представления данных предметной области при хранении - student2.ru Рисунок – Модель «сущность–связь» для описания данных химико-технологического процесса

Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются следующие виды даталогических моделей: иерархические, сетевые, реляционные, объектно-ориентированные, объектно-реляционные.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие-к-одному» и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), она базируется на реляционной алгебре и теории отношений. В ней сущность предметной области примерно соответствует таблице, а атрибут сущности – полю (столбцу) таблицы.

На рисунке представлена реляционная модель базы данных химико-технологического процесса (процесса спекания керамических материалов).

Хранение и накопление информации. Характеристика уровней и моделей представления данных предметной области при хранении - student2.ru

Рисунок – Реляционная модель базы данных химико-технологического процесса

В объектно-ориентированной модели используются понятия класса, объекта, метода. Данные называются свойствами класса, а алгоритмы – методами. Начало работы класса задается с помощью специальных внутренних (например, нажатие кнопки) или внешних (вызов из другой программы) сигналов, называемых событиями. Для построения объектно-ориентированной модели необходимо: провести инкапсуляцию данных, т.е. выделить классы и объекты; определить возможные виды структуры таблиц; создать наследование классов данных (трансформацию классов путем изменения свойств и методов); обеспечить полиморфизм (возможность использования метода с одним именем как в базовом, так и в производных классах).

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

Конкретная реализация системы баз данных, с одной стороны, определяется спецификой данных предметной области, отраженной в концептуальной модели, а, с другой стороны, – типом конкретной СУБД, устанавливающей логическую и физическую организацию.

Основные стандарты СУБД:

• независимость данных на концептуальном, логическом, физическом уровнях;

• универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);

• совместимость, неизбыточность данных;

• безопасность и целостность данных;

• актуальность и управляемость.

Критерии оценки баз данных принято делить на количественные и качественные. Количественные критерии: время, необходимое для ответа на запрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию. Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.

Трудность в оценке проектов баз данных связана с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимыми изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Основные направления научных исследований в области баз данных:

• развитие теории реляционных баз данных;

• моделирование данных и разработка конкретных моделей разнообразного назначения;

• создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;

• разработка, выбор и оценка методов доступа;

• создание самоописываемых баз данных, позволяющих применять единые методы доступа для данных и метаданных;

• управление конкурентным доступом;

• развитие системы программирования баз данных, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;

• совершенствование машин баз данных;

• разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных;

• интеграция неоднородных информационных ресурсов.

Наши рекомендации