Под проектом базы данных понимают совокупность логической и физической схем данных и их описание.
Пример.
Рассмотрим массив информации: Иванов Иван Иванович родился 21.01.1967 года в городе Москве.
Иванов – элемент информационного массива.
Т.е. данное по своей сути - это элемент информации, который содержит конкретное значение характеристики какого-либо объекта (процесса или события) реального мира.
Если данному присвоить имя Фамилия получим: – Фамилия: Иванов.
Если каждому данному присвоить имя, то массив информации можно выразить следующим образом:
Фамилия: Иванов
Имя: Иван
Отчество: Иванович
Дата рождения: 21.01.1967
Место рождения: город Москва.
При этом содержание массива не изменилось. Информация в нем упорядочена, и, кроме того, указанные данные взаимосвязаны, потому что относятся к одному и тому же объекту материального мира – человеку по имени Иванов Иван Иванович. Такую совокупность данных относящихся к одному объекту реального мира называют записью. А каждое имя – полем.
Следовательно, данное – это значение поля.
Вопрос: А если необходимо сохранить информацию не об одном, а о нескольких объектах?
Мы можем переписать поля в виде таблицы и под ними указать данные. Затем ниже дописать данные для другого человек и третьего.
Фамилия: | Имя: | Отчество: | Дата рождения: | Место рождения: |
Иванов | Иван | Иванович | 21.01.1967 | город Москва |
Петров | Петр | Петрович | 26.06.1968 | город Ленинград |
Сидоров | Сидор | Сидорович | 17.09.1969 | город Одинцово |
Упорядочение данных позволяет исключить дублирование одинаковых данных, а также облегчает создание, ведение и применение базы данных.
В базу данных могут включаться записи для других объектов реального мира. Например, не только для человека, но и для города:
Наименование города: | Год создания: | Количество жителей: |
город Москва | 1147 | 11 млн. человек (2004). |
город Ленинград | 1703 | 4 млн. человек (2004). |
город Одинцово | 1957 | 126,8 тыс. человек (2002). |
И все эти данные будут связаны между собой.
Вопрос: Как проводится обслуживание хранимых данных в базе данных?
Что является таким средством в ЭВМ для данных или информации – ПРОГРАММЫ.
Поэтому, разрабатываются специальные программные средства, которые используются для обслуживания данных. Такие специальные программы, получили название систем управления базой данных.
Система управления базой данных (СУБД) – специальная программа (комплекс программ), предназначенная для обслуживания базы данных. СУБД обеспечивает поиск, хранение, редактирование данных, формирование ответов на запросы.
Таким образом, СУБД играет в информационной системе роль посредника (интерфейса) между базой данных и пользователями.
Отличие базы данных от файла и состоит, прежде всего, в возможности включения в БД более одного типа записей и в наличии связей между записями.
Преимущества работы с БД для пользователя окупают затраты и издержки на ее создание. Оно заключается в следующем:
повышение производительности работы пользователей;
эффективное удовлетворение информационных потребностей пользователя;
независимость программ от данных - централизованное управление данными освобождает прикладные программы от организации данных – разные программы могут использовать одни и те же данные;
организация базы данных позволяет реализовать другие нерегламентированные запросы, приложения;
снижение затрат не только на создание и хранение данных, но и на поддержание их в актуальном динамическом состоянии;
уменьшение потоков данных, циркулирующих в системе;
сокращение избыточности и дублирования данных.
2. Этапы проектирования БД
Прежде чем приступить к созданию таких объектов базы данных, как таблицы, формы и отчеты, нужно разработать их проект. Главное назначение проекта – выработка четкого пути, по которому нужно следовать при его реализации.
Выделение (выявление) сущностей и атрибутов сущностей.
Для выявления сущностей и их атрибутов можно применить следующий прием:
Установление связей между сущностями
Связи между сущностями устанавливается с помощью атрибутов, которые для подчиненных сущностей именуются атрибутами связи.
Атрибут связи создается путем переноса ключевого атрибута главной сущности (со стороны связи «один» - без стрелки) в подчиненную сущность (со стороны связи «многие» - со стрелкой. Таким образом, стрелки на линиях связи указывают направление переноса ключевых атрибутов и создание атрибутов связи.
В процессе установления связей между сущностями необходимо применять исторический подход: учитывать информацию о предметной области в :
прошлом;
настоящем;
будущем,
которая может пригодиться при формировании запросов к базе данных.
Примечание:
Одним из средств построения простейших (элементарных) ассоциаций является диаграмма Бахмана. Она представляет собой совокупность двух сущностей, объединенных структурной связью. Одна из сущностей выступает в роли основной, другая -–в роли подчиненной, зависимой. Суть разработки ИЛМ сводится к построению множества диаграмм Бахмана и объединению их в единую схему. Количество диаграмм выбирается равным числу отношений, выявленных по результатам предметной области.
Полученное множество диаграмм и совокупность операций над ними является простейшей моделью предметной области. Если такая модель охватывает все сущности и все связи, она является информационно полной моделью предметной области. Однако, как уже отмечалось выше, в результате анализа потребностей пользователей может быть установлено, что достаточной будет и некоторая информационно неполная модель, в которой не включены отдельные сущности и связи.
Модель в виде набора диаграмм Бахмана проста, наглядна, удобна в описании. В то же время она обладает рядом недостатков, а именно:
Большой информационной избыточностью (некоторые сущности могут фигурировать в различных диаграммах по несколько раз);
Ограниченными возможностями в выборе маршрутов поиска данных, то есть ограниченным числом запросных связей (поиск данных по запросу «выдать список преподавателей кафедры физики» реализуется достаточно просто путем использования элементов диаграммы КАФ-ПРЕП, а по запросу «найти дисциплины, читаемые преподавателем Ивановым с кафедры физики» – затруднен).
Для устранения указанных недостатков выполняется композиция диаграмм – элементарные ассоциации объединяются в более крупные. В результате последовательного применения операций композиции ко всем полученным диаграммам образуется единая схема.
Примеры инфологических моделей предметно области
Кодирование данных
Кодирование данных - составная часть процесса подготовки информации к записи в базу данных. Отдельные, а в некоторых случаях и все данные, прежде всего, подвергаются кодированию в ходе заполнения входных документов, что позволяет сократить объем потребной памяти и обеспечить удобство обработки данных. Кроме того, все данные кодируются в машинную форму представления при переносе их на машинный носитель или при вводе их с клавиатуры дисплея. Кодирование в этом случае выполняется автоматически.
В целом под кодированием понимается процесс установления соответствия между кодируемыми данными и комбинациями знаков, составляющих алфавит кода.
При подготовке входных документов используется два способа кодирования: кодирование отдельных символов (побуквенное кодирование) и кодирование реквизита в целом (пословное кодирование). Первое, как правило, применяется для кодирования сообщений и иногда - для кодирования реквизитов-оснований, второе - для кодирования реквизитов-признаков. На практике для кодирования реквизитов-признаков применяются такие коды, как порядковый, серийно-порядковый, классификационный, матричный и другие.
Порядковое кодирование состоит в том, что все множество возможных значений (область определения) реквизита нумеруется сквозной нумерацией, и кодовой комбинацией является номер значения в данном множестве. Этот тип кодирования использовался при кодировании первичных ключей. В качестве кода первичного ключа используется последовательно возрастающее значение ("счетчик"), генерируемое СУБД при каждом появлении нового значения первичного ключа. Например, в отношении СОТРУДНИК первичный ключ кодируется десятичным полем КОД СОТРУДНИКОВ.
Серийно-порядковое кодирование предусматривает деление номе ров, используемых в качестве кодовых комбинаций, на группы (серии) по некоторому признаку. Так для кодирования должностей сотрудников в таблице ДОЛЖНОСТЬ значения кодовых комбинации поля КОД_ДОЛЖНОСТИ с 10 по 09 отведены для категории "начальники", с 21 по 29 - для категории "заместители начальника"; с 31 по 39 – для категории «сотрудники» и т.д.
Оба метода кодирования - порядковый и серийно - порядковый отличаются простотой образования кодовых комбинаций и возможностью расширения кода. В тоже время эти коды обеспечивают только идентификацию объектов, не предоставляя информацию об их свойствах в отличие от классификационного кодирования.
В рамках нашей задачи проектирования базы данных мы будем использовать первый способ кодирования – ключевой атрибут будет принимать последовательно возрастающее значение ("счетчик"), генерируемое СУБД при каждом появлении нового значения первичного ключа.
Пример.
Рассмотрим массив информации: Иванов Иван Иванович родился 21.01.1967 года в городе Москве.
Иванов – элемент информационного массива.
Т.е. данное по своей сути - это элемент информации, который содержит конкретное значение характеристики какого-либо объекта (процесса или события) реального мира.
Если данному присвоить имя Фамилия получим: – Фамилия: Иванов.
Если каждому данному присвоить имя, то массив информации можно выразить следующим образом:
Фамилия: Иванов
Имя: Иван
Отчество: Иванович
Дата рождения: 21.01.1967
Место рождения: город Москва.
При этом содержание массива не изменилось. Информация в нем упорядочена, и, кроме того, указанные данные взаимосвязаны, потому что относятся к одному и тому же объекту материального мира – человеку по имени Иванов Иван Иванович. Такую совокупность данных относящихся к одному объекту реального мира называют записью. А каждое имя – полем.
Следовательно, данное – это значение поля.
Вопрос: А если необходимо сохранить информацию не об одном, а о нескольких объектах?
Мы можем переписать поля в виде таблицы и под ними указать данные. Затем ниже дописать данные для другого человек и третьего.
Фамилия: | Имя: | Отчество: | Дата рождения: | Место рождения: |
Иванов | Иван | Иванович | 21.01.1967 | город Москва |
Петров | Петр | Петрович | 26.06.1968 | город Ленинград |
Сидоров | Сидор | Сидорович | 17.09.1969 | город Одинцово |
Упорядочение данных позволяет исключить дублирование одинаковых данных, а также облегчает создание, ведение и применение базы данных.
В базу данных могут включаться записи для других объектов реального мира. Например, не только для человека, но и для города:
Наименование города: | Год создания: | Количество жителей: |
город Москва | 1147 | 11 млн. человек (2004). |
город Ленинград | 1703 | 4 млн. человек (2004). |
город Одинцово | 1957 | 126,8 тыс. человек (2002). |
И все эти данные будут связаны между собой.
Вопрос: Как проводится обслуживание хранимых данных в базе данных?
Что является таким средством в ЭВМ для данных или информации – ПРОГРАММЫ.
Поэтому, разрабатываются специальные программные средства, которые используются для обслуживания данных. Такие специальные программы, получили название систем управления базой данных.
Система управления базой данных (СУБД) – специальная программа (комплекс программ), предназначенная для обслуживания базы данных. СУБД обеспечивает поиск, хранение, редактирование данных, формирование ответов на запросы.
Таким образом, СУБД играет в информационной системе роль посредника (интерфейса) между базой данных и пользователями.
Отличие базы данных от файла и состоит, прежде всего, в возможности включения в БД более одного типа записей и в наличии связей между записями.
Преимущества работы с БД для пользователя окупают затраты и издержки на ее создание. Оно заключается в следующем:
повышение производительности работы пользователей;
эффективное удовлетворение информационных потребностей пользователя;
независимость программ от данных - централизованное управление данными освобождает прикладные программы от организации данных – разные программы могут использовать одни и те же данные;
организация базы данных позволяет реализовать другие нерегламентированные запросы, приложения;
снижение затрат не только на создание и хранение данных, но и на поддержание их в актуальном динамическом состоянии;
уменьшение потоков данных, циркулирующих в системе;
сокращение избыточности и дублирования данных.
2. Этапы проектирования БД
Прежде чем приступить к созданию таких объектов базы данных, как таблицы, формы и отчеты, нужно разработать их проект. Главное назначение проекта – выработка четкого пути, по которому нужно следовать при его реализации.
Под проектом базы данных понимают совокупность логической и физической схем данных и их описание.
База данных – достаточно сложный объект, и время, затраченное на ее планирование, может значительно сократить сроки ее разработки. Отсутствие продуманной структуры базы данных приводит к необходимости постоянной переделки и перенастраиванию базы данных.
При проектировании БД используется понятие «инфологическая модель».
Вопрос: Зачем нужна инфологическая модель предметной области при проектировании БД?
Ответ: Для того что бы заказчик и разработчик говорили на одном языке – языке моделей, который занимает пограничное положение между двумя языками – разработчика и заказчика.
Исходя из сказанного проектирование БД включает следующие этапы:
1. Разработка инфологической модели предметной области:
2. Выбор типа БД и СУБД.
3. Разработка логической модели базы данных.
4. Разработка физической модели базы данных.
3. Разработка инфологической модели ПрО