Первая нормальная форма(1НФ)
Определение. Таблица находится в первой нормальной форме, если в каждой ее ячейке находится не более одного значения.
Пример. Преобразуем таблицу «ИЗДЕЛИЯ» из предыдущего примера в таблицу вида: ИЗДЕЛИЯ (код изделия, деталь). Тогда, за счет дублирования кода изделия, в каждой строке в колонке «Деталь» будет стоять только одно значение – наименование кода детали. Новая таблица будет в первой нормальной форме.
Покажем процесс нормализации на следующей исходной таблице:
ВЫПУСК ИЗДЕЛИЙ (Код подразделения (KP), наименование подразделения (NP), код изделия (KI), наименование изделия (NI), код типа изделия (KTI), наименование типа изделия (NTI), дата выпуска (DVI), количество (KVI), себестоимость изделия (SI)). Ключевые атрибуты первичного ключа подчеркнуты. Эта таблица находится в первой нормальной форме.
Рассмотрим аномалии (недостатки) первой нормальной формы.
1. Избыточное дублирование данных. Все наименования будут дублироваться в каждой строке нашей таблицы.
2. Аномалия включения. Пока изделие не будет выпущено, информация о нем (проектируемом или ранее снятом с производства) будет отсутствовать в базе.
3. Аномалия удаления. Если изделие не выпускается в отчетный период, то информация об изделии исчезнет из базы.
4. Аномалия корректировки. Если меняется, например, название изделия, то нужно откорректировать наименование не в одной строке, а во всех строках таблицы, где оно встречается.
Для устранения этих недостатков продолжим процесс нормализации. Вторая нормальная форма(2НФ)
Определение. Таблица находится во второй нормальной форме, если она уже находится в первой нормальной форме, и все неключевые атрибуты целиком зависят от всего ключа, а не от отдельной его части.
Рассмотрим нашу таблицу на предмет выявления неключевых атрибутов, зависящих только от части ключа.
Атрибут «Наименование подразделения» зависит только от атрибута «Код подразделения» и не зависит от атрибутов «Код изделия» и «Дата выпуска». Поэтому его следует удалить из таблицы. Чтобы не потерять информацию о подразделении, создадим новую таблицу «ПОДРАЗДЕЛЕНИЯ» и в нее включим удаляемый атрибут «Наименование подразделения» вместе с ключевым атрибутом «Код подразделения» (иначе потеряется связь с таблицей «ВЫПУСК ИЗДЕЛИЙ») и получим таблицу вида:
ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения).
Атрибут «Наименование изделия» зависит только от атрибута «Код изделия» и не зависит от остальных ключевых атрибутов. Аналогично предыдущему случаю удалим его из таблицы в новую таблицу:
ИЗДЕЛИЯ (Код изделия, наименование изделия).
Атрибут «Код типа изделия» зависит только от атрибута «Код изделия» и не зависит от атрибутов «Код подразделения» и «Дата выпуска». Аналогично предыдущему случаю удалим его из таблицы, добавим в таблицу «ИЗДЕЛИЯ» и получим таблицу:
ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия).
Атрибут «Наименование типа изделия» зависит только от атрибута «Код изделия». Аналогично предыдущему случаю удалим его из таблицы и добавим в таблицу «ИЗДЕЛИЯ» и получим таблицу:
ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия, наименование типа изделия).
Атрибуты «Количество» и «Себестоимость изделия» зависят от всего ключа, поэтому оставим их в исходной таблице.
Таким образом, получим три таблицы:
ВЫПУСК ИЗДЕЛИЙ (Код подразделения, код изделия, дата выпуска, количество, себестоимость изделия).
ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения).
ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия, наименование типа изделия).
Очевидно, что все они находятся во второй нормальной форме.
Третья нормальная форма(3НФ)
Определение. Таблица находится в третьей нормальной форме, если она уже находится во второй нормальной форме, и все неключевые атрибуты взаимно функционально независимы.
Очевидно, что первые две таблицы удовлетворяют определению третьей нормальной формы. Рассмотрим таблицу «ИЗДЕЛИЯ».
Атрибут «Наименование типа изделия» функционально зависит от неключевого атрибута «Код типа изделия», поэтому его следует удалить (по определению третьей нормальной формы) из таблицы в новую:
ТИПЫ ИЗДЕЛИЙ (Код типа изделия, наименование типа изделия).
В результате получим модель базы данных из четырех таблиц в третьей нормальной форме (рисунок 3.2.6.1):
ВЫПУСК ИЗДЕЛИЙ (Код подразделения, код изделия, дата выпуска, количество, себестоимость изделия).
ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения).
ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия).
ТИПЫ ИЗДЕЛИЙ (Код типа изделия, наименование типа изделия).
Рисунок 3.2.6.1. Модель базы данных «Выпуск изделий»
Убедимся в исчезновении аномалий из первой нормальной формы.
1. Избыточное дублирование данных. Все наименования сохраняются в таблицах по одному разу без дублирования.
2. Аномалия включения. Хотя изделие еще не выпущено, но информацию о нем можно занести или сохранить в таблице «ИЗДЕЛИЯ».
3. Аномалия удаления. Если изделие не выпускается в отчетный период, то информация об изделии сохранится в таблице «ИЗДЕЛИЯ».
4. Аномалия корректировки. Если меняется название изделия, то нужно откорректировать наименование только в одной строке таблицы «ИЗДЕЛИЯ»..
Существуют еще несколько, редко используемых нормальных форм, которые связаны только с составными ключами.
Усиленная третья нормальная форма,или нормальная форма Бойса‑Кодда(НФБК)
Определение. Таблица находится в усиленной третьей нормальной форме, если она уже находится в третьей нормальной форме, и в ней отсутствуют функциональные зависимости ключевых атрибутов составного ключа от неключевых атрибутов.
Четвертая нормальная форма(4НФ)
Определение. Таблица находится в четвертой нормальной форме, если она уже находится в третьей нормальной форме, и в ней отсутствуют многозначные функциональные зависимости вида M:M между атрибутами.
Пример. Имеется таблица вида:
ПРЕПОДАВАТЕЛИ (Табельный номер преподавателя, предмет, группа).
Очевидно, что имеем многозначную функциональную зависимость между атрибутами «Предмет» и «Группа». Будем считать, что для каждой группы одним преподавателем читается один набор предметов. Существует аномалия: при добавлении новой группы нужно добавить несколько записей, по числу читаемых преподавателем предметов, что вызывает нежелательное дублирование значений атрибута «Предмет». Исключим многозначную функциональную зависимость путем переноса этих атрибутов в разные таблицы, разделяя исходную таблицу на две:
ПРЕПОДАВАТЕЛИ ПРЕДМЕТЫ (Табельный номер преподавателя, предмет).
ПРЕПОДАВАТЕЛИ ГРУППЫ (Табельный номер преподавателя, группа).
Пятую нормальную форму(5НФ) не будем рассматривать из‑за крайне редкого ее использования (она возможна при наличии трех и более объектов, связанных друг с другом отношением «многие-ко-многим»), тем более что она имеет недостатки.
Денормализация– процесс введения избыточности данных в таблицах (нарушения нормализации) в целях повышения производительности. Существуют нисходящая (копирование атрибута из родительского объекта в дочерний) и восходящая (копирование атрибута из дочернего в родительский объект в форме итога) денормализация.
Пример. Нормализованные таблицы «ПРЕПОДАВАТЕЛИ ПРЕДМЕТЫ» и «ПРЕПОДАВАТЕЛИ ГРУППЫ» из предыдущего примера можно объединить в исходную таблицу «ПРЕПОДАВАТЕЛИ». Хотя и имеет место дублирование данных, но работа с одной таблицей будет быстрее, чем с двумя нормализованными.
В реальном проектировании разработчик должен достигнуть компромисса между нормализацией (устранение избыточности) и денормализацией (увеличение производительности) таблиц.
Домены
Для создания домена нужно выполнить команду Model/Domain Dictionary (рисунок 3.2.7.1), нажать кнопку New и заполнить поля (рисунок 3.2.7.2).
Рисунок 3.2.7.1. Окно редактирования доменов на логическом уровне
Рисунок 3.2.7.2. Окно создания домена
Домен можно создать на основе родительского домена (из списка Domain Parent). На страницах Datatype, Definition, Note, UDP (рисунок 3.2.7.1) можно указать тип значений, описание, комментарий и свойство соответственно. Можно создать один домен («код подразделения») и использовать его при создании атрибутов различных сущностей (рисунок 3.2.7.3).
Рисунок 3.2.7.3. Окно создания атрибута на основе домена
На физическом уровне можно корректировать домен командой Model/Domain Dictionary (рисунок 3.2.7.4).
Рисунок 3.2.7.4. Окно редактирования доменов на физическом уровне
На странице Genaral задаются имя родительского домена, наименование колонки. Параметры сервера (например, ORACLE (рисунок 3.2.7.4)) задаются на странице с наименованием типа СУБД.
Домены используются при генерации системы для создания типов пользователя.