Реляционная модель и модель сущность - связь

Идеи, послужившие основанием для разработки ER-подхода, во многом очень близки тем идеям, которые послужили Кодду неформальной основой при создании им исходной формальной реляционной модели. При этом первые описания неформальной ER-модели были опубликованы спустя несколько лет после опубликования описания формальной реляционной модели, изначально основанной на некоторых идеях ER-модели.

Ценность научного вклада Кодда состоит в том, что он нашел удачную формальную модель для определенных аспектов реального мира. В противоположность этому ER-модель не является (или, по крайней мере, не в первую очередь является) формальной моделью. Фактически она состоит из набора преимущественно неформальных концепций. В то же время проектирование базы данных не может быть завершено без применения формальных объектов и правил. ER-модель можно рассматривать как модель данных, которая представляет собой лишь тонкий слой на вершине базовой реляционной модели.

ER-модель не может заменить реляционную модель, поскольку в ее рамках нет формальных механизмов, обеспечивающих выполнение основных операций обработки данных (какие были включены в состав реляционной модели и рассматриваются в следующей лекции) и отсутствуют средства описания ограничений целостности данных. В то же время графические компоненты ER – модели могут быть полезны для представления «всей картины в целом», но они слишком просты, чтобы с их помощью можно было выполнить все необходимые проектировочные работы.

Семантическое моделирование весьма полезно с точки зрения словаря данных, который в определенном смысле можно рассматривать как "базу данных разработчика для создаваемой им базы данных". В словаре данных разработчик может хранить сведения о решениях, принятых в процессе проектирования базы данных.

Совмещение словаря данных со средствами автоматизированного построения реляционных моделей на основе заданных ER – моделей легло в основу специального класса программных систем – систем автоматизированного проектирования программного обеспечения (CASE - систем), одна из которых (ERWIN) входит в план проведения лабораторных работ.

Помимо описанной схемы ER-моделирования, существует много других семантических схем моделирования. Однако большинство из них очень похожи одна на другую; в частности, многие из них можно характеризовать просто как тот или иной вариант графических обозначений для представления некоторых ограничений для внешних ключей, плюс несколько иных дополнительных компонентов.

ЯЗЫКИ ЗАПРОСОВ К РЕЛЯЦИОННАМ БАЗАМ ДАННЫХ

Как говорилось выше, важным свойством реляционной модели является существование некоторого набора операций и формальных языков, с помощью которых можно построить запрос (последовательность запросов) к набору связанных отношений, в результате выполнения которого будет получена одна или несколько других отношений с искомыми данными в нужном сочетании.

Операции, выполняемые над отношениями, можно разделить на две группы. Первую группу составляют операции над множествами (теоретико – множественные операции), к которым относятся операции: объединения, пересечения, разности, деления и декартова произведения. Вторую группу составляют специальные операции над отношениями, к которым, в частности, относятся операции: проекции, соединения, выбора. В различных СУБД реализована некоторая часть операций над отношениями, определяющая в какой-то мере возможности данной СУБД и сложность реализации запросов к БД.

В реляционных СУБД для выполнения операций над отношениями используются две группы языков, имеющие в качестве своей математической основы теоретические языки запросов, предложенные Э.Коддом:
- реляционная алгебра;
- реляционное исчисление.

Лекция 10-11

ПРИНЦИПЫ ОРГАНИЗАЦИИ ХРАНЕНИЯ ДАННЫХ

УСТРОЙСТВА ХРАНЕНИЯ ДАННЫХ

В процессе работы СУБД для хранения данных используются два основных типа устройств хранения данных – первичные (оперативная память) и вторичные (магнитная лента, жесткий, оптический или компакт диск и т.д.).

Существуют принципиальные отличия в характеристиках данных устройств, влияющие на способы их использования при обработке данных:
а) скорость доступа: у первичных на несколько порядков выше;
б) скорость последовательного чтения/записи: у первичных на несколько порядков выше;
в) надежность и длительность хранения: у вторичных на несколько порядков выше
г) стоимость хранения: у вторичных на несколько порядков ниже;
д) объем хранимых данных: у вторичных на несколько порядков больше.

Таким образом, первичные устройства предназначены для хранения наиболее интенсивно используемых в настоящий момент данных (высокая скорость доступа, чтения, записи для сравнительно малого объема данных), а вторичные устройства – для длительного и надежного хранения всего объема данных (большой объем данных сравнительно медленного доступа для дешевого и надежного хранения). В процессе работы одни и те же данные перемещаются из вторичных устройств в первичные (для быстрой обработки), затем – из первичных во вторичные (для длительного хранения).

Разница в характеристиках устройств и способах их применения для хранения данных приводит обычно к различным способам отображения данных в устройства хранения. Большинство СУБД при этом выполняют достаточно сложные операции преобразования с целью максимально эффективного использования и первичных и вторичных устройств.

Однако, для хранения данных и на тех, и на других устройствах используются одни и те же типовые схемы хранения данных, которые мы рассмотрим на данной лекции применительно к устройствам вторичной памяти. Знание типовых схем хранения позволит оптимизировать структуру БД на этапе физического проектирования и разработать более эффективные процедуры обработки данных на этапе создания приложения базы данных.

Наши рекомендации