Уровни представления информации, понятие модели данных.
Модель данных – совокупность структуры информации и набора операций, определённых над элементами описания.
Представление данных используют 2 уровня в СУБД:
· Логический уровень – представляет информацию в формате удобном для пользователя и прикладных программ.
· Физический уровень – информация на конкретном носителе (ЗУ).
Любая модель данных должна содержать три компоненты:
1) структура данных - описывает точку зрения пользователя на представление данных.
2) набор допустимых операций, выполняемых на структуре данных. Модель данных предполагает, как минимум, наличие языка определения данных (ЯОД), описывающего структуру их хранения, и языка манипулирования данными (ЯМД), включающего операции извлечения и модификации данных.
3) ограничения целостности - механизм поддержания соответствия данных предметной области на основе формально описанных правил.
Два варианта классификации моделей данных:
1. Классификация по способу группировки связей на логическом уровне:
1.2. Внутренняя модель данных;
1.3. Внешняя модель данных.
2. Классификация по отражению структуры данных на логическом уровне:
1.1.Иерархическая (граф типа дерева, нет перекрестных связей!),
Достоинства | Недостатки |
· Простота организации. · Наиболее быстрый доступ к информации (заранее известны все вершины и все ключи к доступу информациии). | · Избыточность - нельзя ссылаться на одно и то же, необходимо дублировать информацию. · Не любая предметная область может быть представлена такой структурой. · При изменении структуры модели данных требуется изменение программного обеспечения и программных средств или создание нового. |
1.2.Сетевая
Достоинства | Недостатки |
· Более адекватно отражает состав и структуру предметной области за счет дополнительных связей между отдельными компонентами (Более гибкая модель). · Быстрый доступ к информации БД. Всё определяется на этапе проектирования. · Простота реализации. | · При изменении информации требуется изменение программного обеспечения (доработка). |
1.3.Реляционная, отражает структуру предметн области в виде совокупности взаимосвяз таблиц
Достоинства | Недостатки |
· Простота и наглядность представления информации на логическом уровне. · Возможность изменения структуры модели данных не только на этапе проектирования создания данных, но и на этапе эксплуатации. · Возможность создания и использования непроцедурных языков запроса для доступа к данным. · Возможность манипулирования данными на уровне выходного элемента. | · Трудоемкость разработки · Объектно-ориентированный подход к построению данных |
сложный тип данных может включать эти структуры в качестве элементов. Например, элементами записи может быть массив, стек, дерево и т.д.
4. Реляционная модель данных, основные понятия.
Реляционная модель данных (РМД) — логическая модель данных, прикладная теория построения баз данных, которая является приложением к задачам обработки данных таких разделов математики как теория множеств и логика первого порядка.
На реляционной модели данных строятся реляционные БД. Включет аспекты:
Структурный аспект - данные в базе данных представляют собой набор отношений.
Аспект целостности- отношения (таблицы) отвечают определенным условиям целостности. РМД поддерживает декларативные ограничения целостности уровня домена (типа данных), уровня отношения и уровня базы данных.
Аспект обработки (манипулирования) - РМД поддерживает операторы манипулирования отношениями (реляционная алгебра).
Определения:
Декартово произведение: Для заданных конечных множеств (не обязательно различных) декартовым произведением называется множество произведений вида: , где
Пример: если даны два множества A (a1,a2,a3) и B (b1,b2), их декартово произведение будет иметь вид С=A*B (a1*b1, a2*b1, a3*b1, a1*b2, a2*b2, a3*b2)
Отношение: Отношением R, определенным на множествах называется подмножество декартова произведения При этом: множества называются доменами отношения элементы декартова произведения называются кортежами число n определяет степень отношения ( n=1 - унарное, n=2 - бинарное, ..., n-арное) количество кортежей называется мощностью отношения.
Пример: на множестве С из предыдущего примера могут быть определены отношения R1 (a1*b1, a3*b2) или R2 (a1*b1, a2*b1, a1*b2)
Отношения удобно представлять в виде таблиц.
Строки таблицы = кортежам. Каждая строка фактически представляет собой описание одного объекта реального мира (в данном случае работника), характеристики которого содержатся в столбцах. Можно провести аналогию между элементами реляционной модели данных и элементами модели "сущность-связь". Реляционные отношения соответствуют наборам сущностей, а кортежи - сущностям. Поэтому, также как и в модели "сущность-связь" столбцы в таблице, представляющей реляционное отношение, называют атрибутами.