Базы данных. Модели хранения данных.
База данных (БД) обеспечивает хранение информации и представляет со-бой поименованную совокупность данных, организованных по определенным правилам, включающим общие принципы описания, хранения и манипулирования данными.
Модели организации данных
Набор принципов, определяющих организацию логической структуры хранения данных в базе, получил название модели данных.
Тип модели баз данных определяется тремя компонентами:
· допустимой организацией данных;
· ограничениями целостности;
· множеством допустимых операций.
В теории систем управления базами данных выделяют три наиболее распространённых типа моделей:
· Иерархическая модель (иерархический организованный набор (рис.1)) - предусматривает поиск данных по одной из ветвей "дерева", в котором каждая вершина имеет только одну связь с вершиной более высокого уровня. Для поиска данных необходимо указать полный путь, начиная с корневого элемента.
· Сетевая модель (рис. 2) допускает усложнение "дерева" без ограничения количества связей, входящих в вершину. Это позволяет строить сложные поисковые системы.
· Реляционная модель - реализует табличный способ, т.е. все объекты и взаимосвязи между ними представлены с помощью таблиц. В реляционной модели таблица называется отношением, строка таблицы - кортежем, столбцы - атрибутами, но наряду с этими названиями используются альтернативные понятия (столбцы называют полями, а строки - записями). (Рис.3).
В реляционной базе данных каждая таблица должна иметь первичный ключ (ключевой элемент) - поле или комбинацию полей, которые единственным образом идентифицируют каждую строку в таблице.
Преимуществом реляционной модели данных является то, что в ней действия над данными могут быть сведены к операциям реляционной алгебры, которые выполняются над отношениями (объединение, пересечение, выборка, вычитание, декартово произведение, проекция, соединение, деление).
При проектировании базы данных необходимо создать структуру, которая обеспечивала быминимальное дублирование информации и упрощала процедуры обработки и обновления данных. Набор требований к организации данных, которые позволили бы эффективно решать перечисленные задачи, называются нормальными формами.
Для приведения таблиц к состоянию, удовлетворяющему требованию нормальных форм (нормализации данных) над ними выполняют перечисленные выше операции реляционной алгебры.
Для работы с данными, организованными в виде таблиц, был создан язык, впоследствии получивший название SQL (Structured Query Language - структурированный язык запросов). В 1986 году стал стандартом для работы с базами данных.
Именно реляционные модели положены в основу большинства работающих СУБД.
Таким образом БД - является организованной на машином носителе совокупностью взаимосвязанных данных и содержит сведения о различных сущностях одной предметной области - реальных объектах, процессах, событиях или явлениях. Реляционная БД представляет собой множество взаимосвязанных двумерных таблиц, называемых также отношениями, в каждой из которых содержатся сведения об одной сущности автоматизируемой предметной области.
Логическую структуру РБД образует совокупность реляционных таблиц, между которыми установлены логически связи.
Все данные, необходимые для решения задач в предметной области должны храниться в таблицах, причем только в одном экземпляре. Для создания таблиц, соответствующих реляционной модели, используют процесс нормализации данных - т.е. удаление из таблиц повторяющихся записей путем переноса их в новые таблицы, записи которых не содержат повторяющихся значений.
Структура РБД определяется составом полей. Каждое поле отражает определенную характеристику сущности. Поле имеет ряд свойств, которые определяются при создании таблиц.
Каждая строка таблицы является записью. Структура записи определяется составом полей. Для однозначного определения (идентификации) каждой записи таблица должна иметь уникальный (первичный) ключ. Ключ может состоять из одного или нескольких полей таблицы. Значение уникального ключа не может повторяться в нескольких записях.
Логические связи между таблицами позволяют объединить данные из разных таблиц. В нормализованной РБД связь двух таблиц характеризуется отношениями записей типа один-к-одному (1:1) или один-ко-многим (1:М). Отношение 1:1 предполагает, что каждой записи из одной таблицы соответствует одна запись в другой. Отношение 1:М предполагает, что каждой записи первой таблицы, соответствует много записей во второй, но каждой записи второй таблицы соответствует только одна запись из первой таблицы.
Реляционные базы данных. Основные понятия реляционных баз данных.
Реляционная модель данных
Модель данных в общем случае описывает набор базовых признаков, кото-рыми должны обладать все конкретные СУБД и управляемые ими БД, основан-ные на этой модели.
Реляционная модель данных некоторой предметной области представляет собой набор отношений, изменяющихся во времени. При создании информацион-ной системы совокупность отношений позволяет хранить данные об объектах предметной области и моделировать связи между ними.
Важнейшим является понятие «отношения», которое представляет собой двумерную таблицу, содержащую некоторые данные.
Сущность есть объект любой природы, данные о котором хранятся в базе данных. Данные о сущности хранятся в отношении.
Атрибуты представляют собой свойства, характеризующие сущность.
Ключом отношения, или первичным ключом, называется атрибут отноше-ния, однозначно идентифицирующий каждую запись таблицы. Ключ может быть составным, т.e. состоять из нескольких атрибутов.
Наиболее часто таблица с отношением размещается в отдельном файле. В некоторых СУБД, например, Microsoft Access, в одном файле размещается полно-стью база данных (несколько таблиц).
Приведем условия и ограничения, накладываемые на отношения, выполне-ние которых позволяет таблицу считать отношением:
1. Все строки таблицы должны быть уникальны, т.е. не может быть строк с одинаковыми первичными ключами.
2. В таблице не должно быть столбцов с повторяющимися именами.
3. Все строки одной таблицы должны иметь одну структуру, соответствую-щую именам и типам столбцов.
4. Имена столбцов таблицы должны быть различны, а значения их просты-ми, т.е. недопустима группа значений в одном столбце одной строки.
5. Порядок размещения строк в таблице может быть произвольным.
К отношениям можно применять систему операций, позволяющую полу-чать одни отношения из других. Например, результатом запроса к реляционной БД может быть новое отношение, вычисленное на основе хранящихся в базе от-ношений. Отсюда появляется возможность разделить обрабатываемые данные на хранимую и вычисляемую части. Основная операция над отношениями — это фильтрация (поиск в базе данных записей отвечающих определенным условиям). Используются также операции объединения и пересечения отношений, которые выполняются сразу более чем над одной таблицей.