Сущности и атрибуты в реляционной модели
Применение CASE-средства ERwin 2.5 для информационного моделирования в системах обработки данных
С.В.Горин, А.Ю.Тандоев, Фирма АлконсСофт
Введение
В условиях рынка все большее число компаний осознают преимущества использования информационных систем (ИС). В некоторых случаях ИС - это не только набор услуг, но и важнейший компонент бизнеса, как, например, система резервирования билетов или средства предоставления финансовой информации. Чтобы получить выгоду от использования информационной системы, ее следует создавать в короткие сроки и с уменьшенными затратами. Информационная система должна быть легко сопровождаемой и управляемой.
Создание информационной системы предприятия - достаточно сложный и многоступенчатый процесс, который, весьма часто, содержит фазу информационного моделирования. Информационная модель - это спецификация структуры данных и бизнес правил (правил предметной области).
Информационное моделирование
В данной статье мы рассмотрим некоторые аспекты информационного моделирования и его автоматизации с использованием CASE-средства ERwin 2.5 фирмы LogicWorks.
ERwin - средство разработки структуры базы данных (БД). ERwin сочетает графический интерфейс Windows, инструменты для построения ER-диаграмм, редакторы для создания логического и физического описания модели данных и прозрачную поддержку ведущих реляционных СУБД и настольных баз данных. С помощью ERwin можно создавать или проводить обратное проектирование (реинжиниринг) баз данных.
Предыдущие версии ERwin - 1.5 и 2.1 - завоевали все возможные призы среди программ своего класса, в том числе DBMS Readers' Choice в 1992, 1993, 1994, 1995 годах, Software Development Productivity Award 1993, Data Based Advisor Readers' choice 1992 и 1994. Текущая версия продукта - 2.5.
Реализация моделирования в ERwin базируется на теории реляционных баз данных и на методологии IDEF1X.
Методология IDEF1X была разработана для ВВС США и теперь используется, в частности, в правительственных, аэрокосмических и финансовых учреждениях, а также в большом числе частных компаний.
Методология IDEF1X определяет стандарты терминологии, используемой при информационном моделировании, и графического изображения типовых элементов на диаграммах.
Возможны две точки зрения на информационную модель и, соответственно, два уровня модели. Первый - логический (точка зрения пользователя) - описывает данные, задействованные в бизнесе предприятия. Второй - физический - определяет представление информации в БД. ERwin объединяет их в единую диаграмму, имеющую несколько уровней представления .
Реляционные базы данных
В реляционной модели все данные представляются как факты о сущностях и связях. Например, система резервирования билетов содержит информацию о сущностях "пассажир" и "рейс". Между сущностями определяются функциональные связи. Продолжая пример, между сущностями "пассажир" и "рейс" определяется связь "перевозит" ("рейс" "перевозит" много "пассажиров").
Сущность - это, например, человек, место, вещь, событие, концепция, о которых хранится информация. Сущности именуются обычно существительными, такими как "покупатель", "компьютер", "служащий", "продажа".
Более точно, сущность - это множество индивидуальных объектов - экземпляров, причем все эти объекты являются различными.
Связь - это функциональная зависимость между сущностями. Например, "служащий" совершает "продажи".
Каждая сущность обладает атрибутами. Атрибут - это свойство объекта, характеризующее его экземпляр. Сущность "служащий" может иметь атрибуты "имя", "дата рождения" и т.д.
Общепринятым видом графического изображения реляционной модели данных является ER- диаграмма. На такой диаграмме сущности (таблицы) изображаются прямоугольниками, возможно, соединенными между собой линиями (связями). Такое графическое представление облегчает восприятие структуры базы данных по сравнению с текстовым описанием.
Сущности и атрибуты в реляционной модели
Таблицы в реляционной СУБД состоят из строк данных, однородных по своей природе. Другими словами, каждая строка таблицы описывает один экземпляр некоторой сущности, причем набор атрибутов каждого экземпляра постоянен.
Предположим, в базе данных хранится информация о служащих. Таблица "покупатель" содержит 3 колонки и 4 строки:
Имя | Адрес | Идент. карты |
Сидоров | 1 улица 8 марта | |
Иванов | 2 улица 8 марта | |
Петров | 3 улица 8 марта | |
Павлов | 4 улица 8 марта |
Имя таблицы и имена ее колонок составляют структуру таблицы: customer (name, address, card_id). В реляционной модели все значения данных являются атомарными, т.е. нельзя в клетке таблицы хранить список значений.
Таблицы в реляционной модели соответствуют (не обязательно совпадают по имени) сущностям, а колонки - атрибутам.