Этапы построения базы данных
База данных — совокупность связанных данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования, независимая от прикладных программ.
Для понятия «база данных» существует несколько классификаций. По модели представления данных БД можно классифицировать следующим образом: картотеки, иерархические, сетевые, многомерные, объектно-ориентированные, дедуктивные и реляционные. Далее речь пойдет о реляционной модели. Эта модель баз данных не была хронологически первой, но первой получила математическое описание, и, будучи экономной по части базовых понятий (что сделало ее невероятно привлекательной для программистов и пользователей), в основном используется в web-приложениях.
Так что же такое «реляционная модель БД»? В реляционных базах данных вся информация заключена в таблицы. Столбцы в такой таблице имеют конкретный тип и размер; все содержимое ячеек столбца должно соответствовать их типу. Строки представляют собой набор неструктурированных данных и образуют математическое отношение. Таким образом, вся база данных – это множество таблиц-отношений, отсюда и название модели (от англ. relation – отношение).
Один из главных принципов организации данных – построение взаимосвязей между всеми элементами, что и отличает базу данных от простого набора таблиц. Т.е. информация в таблицах реляционной базы данных должна быть соответствующим образом организована. Еще один важнейший принцип — нормализация таблиц, которая сводится к устранению недостатков структуры базы данных, приводящих к различным аномалиям и нарушениям целостности данных. Недостатками структуры можно назвать, например, противоречивость данных, а аномалией – возникновение случайных ошибок в процессе эксплуатации БД. Проще говоря, нормализация – разбиение таблицы на две или более для исключения повторения (избыточности) информации.
Разработка базы данных – сложный длительный процесс, который можно разделить на 3 этапа:
· концептуальное проектирование — сбор, анализ и редактирование требований к данным;
· логическое проектирование — преобразование требований к данным в структуры данных;
· физическое проектирование — определение особенностей хранения данных, методов доступа и т. д.
На уровне физической модели электронная БД представляет собой файл или их набор в формате TXT, CSV, Excel, DBF, XML либо в специализированном формате конкретной СУБД (системы управления базами данных).
Основные функции СУБД.
СУБД обеспечивают надежное хранение больших объемов данных сложной структуры во внешней памяти компьютера и эффективный доступ к ним. Их появление сняло с разработчиков информационных систем необходимость создавать каждый раз весьма сложные компоненты управления данными. К основным функциям СУБД относятся:
o Непосредственное управление данными во внешней и оперативной памяти и обеспечение эффективного доступа к данным в процессе решения задач.
o Поддержание целостности данных и управление транзакциями.
o Ведение системного журнала изменений в базе данных, что обеспечивает восстановление базы данных после технического или программного сбоя.
o Реализация поддержки языка описания данных и языка запросов к данным.
o Обеспечение безопасности данных.
o Обеспечение параллельного доступа к данным нескольких пользователей.
27. Модели данных: иерархические, сетевые, реляционные
Информация в базе данных определенным образом структурирована, т.е. ее можно описать моделью представления данных (моделью данных), поддерживаемой СУБД. Классические модели представления данных: иерархическая, сетевая, реляционная.
При использовании иерархической модели представления данных связи между данными можно описать с помощью упорядоченного графа (или дерева). При программировании для описания структуры иерархической базы данных используется тип данных «дерево».
Основные достоинства иерархической модели данных:
1) эффективное использование памяти ЭВМ;
2) скорость выполнения основных операций над данными;
3) удобство работы с иерархически упорядоченной информацией.
Недостатки иерархической модели представления данных:
1) громоздкость данной модели для обработки информации с достаточно сложными логическими связями;
2) трудность в понимании ее функционирования обычным пользователем.
Достаточно небольшое количество СУБД построено на иерархической модели данных.
Сетевую модель представления данных можно рассматривать как развитие и обобщение иерархической модели данных, позволяющее отображать разнообразные взаимосвязи данных в виде произвольного графа.
Достоинства сетевой модели представления данных:
1) эффективность в использовании памяти ЭВМ;
2) высокая скорость выполнения основных операций надданными;
3) сетевая модель обладает большими возможностями в смысле возможности образования произвольных связей.
Недостатки сетевой модели представления данных:
1) высокая сложность и жесткость схемы БД, построенной на ее основе;
2) трудность для понимания и выполнения обработки информации в БД непрофессиональным пользователем.
СУБД, построенные на основе сетевой модели, также не получили широкого распространения на практике. Реляционную модель представления данных разработал сотрудник фирмы «IBM» Э. Кодд. В основе данной модели лежит понятие отношения (relation). Простейшим примером отношения является двумерная таблица. Достоинства реляционной модели представления данных заключаются в понятности, простоте и удобстве практической реализации реляционных БД на ЭВМ.
Недостатки реляционной модели представления данных:
1) отсутствие стандартных средств идентификации отдельных записей;
2) сложность описания иерархических и сетевых связей.
Большинство СУБД, используемых как профессиональными, так и непрофессиональными пользователями, построены на основе реляционной модели данных.
Реляционная модель данных
Реляционная СУБД (РСУБД; иначе Система управления реляционными базами данных, СУРБД) — СУБД, управляющая реляционными базами данных.
Понятие реляционный (англ. relation — отношение) связано с разработками известного английского специалиста в области систем баз данных Эдгара Кодда (Edgar Codd).
Эти модели характеризуются простотой структуры данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.
Реляционная модель ориентирована на организацию данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:
- каждый элемент таблицы — один элемент данных
- все ячейки в столбце таблицы однородные, то есть все элементы в столбце имеют одинаковый тип (числовой, символьный и т. д.)
- каждый столбец имеет уникальное имя
- одинаковые строки в таблице отсутствуют
- порядок следования строк и столбцов может быть произвольным
Базовыми понятиями реляционных СУБД являются: