Структурные элементы базы данных
Понятие базы данных тесно связано с такими понятиями структурных элементов, как поле, запись, файл (таблица).
Поле — элементарная единица логической организации данных, для описания которого используются следующие характеристики:
имя, например, Фамилия, Имя, Отчество, Дата рождения;
тип, например, символьный, числовой, календарный;
длина, например, 15 байт, причем будет определяться максимально возможным количеством символов;
точность (для числовых данных), например два десятичных знака для отображения дробной части числа.
Основные структурные элементы БД
Запись— совокупность логически связанных полей. Экземпляр записи — отдельная реализация записи, содержащая конкретные значения ее полей.
Файл (таблица) — совокупность экземпляров записей одной структуры.
В структуре записи файла указываются поля, значения которых являются ключами: первичными (ПК), которые идентифицируют экземпляр записи, и вторичными (ВК), которые выполняют роль поисковых или группировочных признаков (по значению вторичного ключа можно найти несколько записей).
Виды моделей данных
Модель данных — совокупность структур данных и операций их обработки.
Модель данных представляет собой множество структур данных, ограничений целостности и операций манипулирования данными.
СУБД основывается на использовании иерархической, сетевой или реляционной модели, на комбинации этих моделей.
Иерархическая модель данных
Иерархическая структура представляет совокупность элементов, связанных между собой по определенным правилам.
К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Узел — это совокупность атрибутов данных, описывающих некоторый объект. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в базе данных определяется числом корневых записей.
Сетевая модель данных
В сетевой структуре при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом.
Реляционная модель данных
Понятие «реляционный» (от англ. relation — отношение) связано с разработками известного американского специалиста в области систем баз данных Е. Кодда.
Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.
Кроме того, реляционные модели данных характеризуются высокой степенью независимости данных и легкостью установления новых связей.
Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
· каждый элемент таблицы — один элемент данных;
· все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;
· каждый столбец имеет уникальное имя;
· одинаковые строки в таблице отсутствуют;
· порядок следования строк и столбцов может быть произвольным.
Отношения представлены в виде таблиц, строки которых соответствуют кортежам или записям, а столбцы — атрибутам отношений, доменам, полям.
Поле, каждое значение которого однозначно определяет соответствующую запись, называется простым ключом (ключевым полем). Если записи однозначно определяются значениями нескольких полей, то такая таблица базы данных имеет составной ключ.
Для того чтобы связать две реляционные таблицы, необходимо ключ первой таблицы ввести в состав ключа второй таблицы (возможно совпадение ключей); в противном случае нужно ввести в структуру первой таблицы внешний ключ — ключ второй таблицы.
Наиболее распространены реляционные БД и СУБД, основанные на реляционной модели данных. Реляционные модели обладают следующими свойствами:
· информация представляется одними значениями данных без связующих параметров;
· интерфейс реализуется с помощью языка высокого уровня.
К недостаткам реляционной модели относятся сравнительно невысокая производительность, большое количество служебной информации, проблемы при хранении графических изображений.
В настоящее время крупнейшие разработчики СУБД встраивают в свои программные продукты поддержку объектной ориентации. В этом случае разработан способ описания объекта в СУБД в виде формата интегрального файла с поддержкой следующих типов объектов:
· элементарный объект;
· сложный или составной объект, состоящий из нескольких записей базы данных;
· структурированный объект, состоящий из одной записи базы данных и содержащий описание как основного объекта так и сопутствующего ему;
· распределенные объект, объединяющий в себе несколько объектов предыдущих типов (такая база данных представляет собой дерево таких объектов, построенное в соответствии с иерархией классификатора базы знаний предметной области).
Единицей хранения и обработки информации является одна структурированная запись объекта, содержащая компоненты:
· идентификационная часть объекта;
· атрибуты объекта;
· межобъектные отношения;
· структурированное описание объекта;
· метрическое описание;
· текстовое описание;
· мультимедийная информация объекта.
Особенностью всех форматов представления этой СУБД интегрального файла является однотипность логического представления объектов, что позволяет иметь унифицированные средства разработки.
В программном обеспечении такой СУБД выделяют 4 основных компонента:
1. Комплекс сервисных программ для работы с базами данных в локальной сети.
2. Комплекс серверных программ для удаленного доступа к базам данных по сети Интернет.
3. Инструментальный комплекс.
4. Система запросов.
Объектно-реляционные СУБД являются постепенным развитием реляционных СУБД. Основная идея объектно-реляционного подхода – допущение использования в качестве атрибутов не только простых типов данных, но и составных, абстрактных типов данных (это противоречит классической концепции реляционных СУБД). В объектно-ориентированных СУБД заложены основные принципы объектно-ориентированного программирования при создании структуры базы данных.
Объектно-ориентированный язык – язык программирования, на котором программа задается описанием поведения совокупности взаимосвязанных объектов. Объекты обмениваются запросами, реагируя на полученный запрос, объект посылает запрос другим объектам, получает ответы, изменяет значения своих внутренних переменных и выдает ответ на полученный запрос. Механизм запросов в объектно-ориентированных языках состоит в том, что при выполнении запроса объектом непосредственно могут быть изменены только значения переменных этого объекта.
Архитектура СУБД
Базы данных и программные средства их создания и ведения (СУБД) имеют многоуровневую архитектуру.
Многоуровневое представление данных БД под управлением СУБД
Различают концептуальный, внутренний и внешний уровни представления данных баз данных, которым соответствуют модели аналогичного назначения.
Концептуальная модель состоит из множества экземпляров различных типов данных, структурированных в соответствии с требованиями к СУБД.
Внутренняя модель состоит из отдельных экземпляров записей, физически хранимых во внешних носителях.
Внешняя модель является подмножеством концептуальной модели. Возможно пересечение внешних моделей по данным. Частная логическая структура данных для отдельного приложения (задачи) или пользователя соответствует внешней модели. С помощью внешних моделей поддерживается санкционированный доступ к данным БД приложений (ограничен состав и структура данных концептуальной модели БД, доступных в приложении, а также заданы допустимые режимы обработки этих данных: ввод, редактирование, удаление, поиск).
Появление новых или изменение информационных потребностей существующих приложений требуют определения для них корректных внешних моделей, при этом на уровне концептуальной и внутренней модели данных изменений не происходит. Изменения в концептуальной модели, вызванные появлением новых видов данных или изменением их структур, могут затрагивать, не все приложения, т.е. обеспечивается определенная независимость программ от данных. Изменения в концептуальной модели должны отражаться на внутренней модели, и при неизменной концептуальной модели возможна самостоятельная модификация внутренней модели БД с целью улучшения ее характеристик (время доступа к данным, расхода памяти внешних устройств и др.). Таким образом, БД реализует принцип относительной независимости логической и физической организации данных.