Под проектом базы данных понимают совокупность логической и физической схем данных и их описание.

Пример.

Рассмотрим массив информации: Иванов Иван Иванович родился 21.01.1967 года в городе Москве.

Иванов – элемент информационного массива.

Т.е. данное по своей сути - это элемент информации, который содержит конкретное значение характеристики какого-либо объекта (процесса или события) реального мира.

Если данному присвоить имя Фамилия получим: – Фамилия: Иванов.

Если каждому данному присвоить имя, то массив информации можно выразить следующим образом:

Фамилия: Иванов

Имя: Иван

Отчество: Иванович

Дата рождения: 21.01.1967

Место рождения: город Москва.

При этом содержание массива не изменилось. Информация в нем упорядочена, и, кроме того, указанные данные взаимосвязаны, потому что относятся к одному и тому же объекту материального мира – человеку по имени Иванов Иван Иванович. Такую совокупность данных относящихся к одному объекту реального мира называют записью. А каждое имя – полем.

Следовательно, данное – это значение поля.

Вопрос: А если необходимо сохранить информацию не об одном, а о нескольких объектах?

Мы можем переписать поля в виде таблицы и под ними указать данные. Затем ниже дописать данные для другого человек и третьего.

Фамилия: Имя: Отчество: Дата рождения: Место рождения:
Иванов Иван Иванович 21.01.1967 город Москва
Петров Петр Петрович 26.06.1968 город Ленинград
Сидоров Сидор Сидорович 17.09.1969 город Одинцово

Упорядочение данных позволяет исключить дублирование одинаковых данных, а также облегчает создание, ведение и применение базы данных.

В базу данных могут включаться записи для других объектов реального мира. Например, не только для человека, но и для города:

Наименование города: Год создания: Количество жителей:
город Москва 1147 11 млн. человек (2004).
город Ленинград 1703 4 млн. человек (2004).
город Одинцово 1957 126,8 тыс. человек (2002).

И все эти данные будут связаны между собой.

Вопрос: Как проводится обслуживание хранимых данных в базе данных?

Что является таким средством в ЭВМ для данных или информации – ПРОГРАММЫ.

Поэтому, разрабатываются специальные программные средства, которые используются для обслуживания данных. Такие специальные программы, получили название систем управления базой данных.

Система управления базой данных (СУБД) – специальная программа (комплекс программ), предназначенная для обслуживания базы данных. СУБД обеспечивает поиск, хранение, редактирование данных, формирование ответов на запросы.

Таким образом, СУБД играет в информационной системе роль посредника (интерфейса) между базой данных и пользователями.

Отличие базы данных от файла и состоит, прежде всего, в возможности включения в БД более одного типа записей и в наличии связей между записями.

Преимущества работы с БД для пользователя окупают затраты и издержки на ее создание. Оно заключается в следующем:

повышение производительности работы пользователей;

эффективное удовлетворение информационных потребностей пользователя;

независимость программ от данных - централизованное управление данными освобождает прикладные программы от организации данных – разные программы могут использовать одни и те же данные;

организация базы данных позволяет реализовать другие нерегламентированные запросы, приложения;

снижение затрат не только на создание и хранение данных, но и на поддержание их в актуальном динамическом состоянии;

уменьшение потоков данных, циркулирующих в системе;

сокращение избыточности и дублирования данных.

2. Этапы проектирования БД

Прежде чем приступить к созданию таких объектов базы данных, как таблицы, формы и отчеты, нужно разработать их проект. Главное назначение проекта – выработка четкого пути, по которому нужно следовать при его реализации.

Выделение (выявление) сущностей и атрибутов сущностей.

Для выявления сущностей и их атрибутов можно применить следующий прием:

Под проектом базы данных понимают совокупность логической и физической схем данных и их описание. - student2.ru

Установление связей между сущностями

Связи между сущностями устанавливается с помощью атрибутов, которые для подчиненных сущностей именуются атрибутами связи.

Атрибут связи создается путем переноса ключевого атрибута главной сущности (со стороны связи «один» - без стрелки) в подчиненную сущность (со стороны связи «многие» - со стрелкой. Таким образом, стрелки на линиях связи указывают направление переноса ключевых атрибутов и создание атрибутов связи.

В процессе установления связей между сущностями необходимо применять исторический подход: учитывать информацию о предметной области в :

прошлом;

настоящем;

будущем,

которая может пригодиться при формировании запросов к базе данных.

Примечание:

Одним из средств построения простейших (элементарных) ассоциаций является диаграмма Бахмана. Она представляет собой совокупность двух сущностей, объединенных структурной связью. Одна из сущностей выступает в роли основной, другая -–в роли подчиненной, зависимой. Суть разработки ИЛМ сводится к построению множества диаграмм Бахмана и объединению их в единую схему. Количество диаграмм выбирается равным числу отношений, выявленных по результатам предметной области.

Полученное множество диаграмм и совокупность операций над ними является простейшей моделью предметной области. Если такая модель охватывает все сущности и все связи, она является информационно полной моделью предметной области. Однако, как уже отмечалось выше, в результате анализа потребностей пользователей может быть установлено, что достаточной будет и некоторая информационно неполная модель, в которой не включены отдельные сущности и связи.

Модель в виде набора диаграмм Бахмана проста, наглядна, удобна в описании. В то же время она обладает рядом недостатков, а именно:

Большой информационной избыточностью (некоторые сущности могут фигурировать в различных диаграммах по несколько раз);

Ограниченными возможностями в выборе маршрутов поиска данных, то есть ограниченным числом запросных связей (поиск данных по запросу «выдать список преподавателей кафедры физики» реализуется достаточно просто путем использования элементов диаграммы КАФ-ПРЕП, а по запросу «найти дисциплины, читаемые преподавателем Ивановым с кафедры физики» – затруднен).

Для устранения указанных недостатков выполняется композиция диаграмм – элементарные ассоциации объединяются в более крупные. В результате последовательного применения операций композиции ко всем полученным диаграммам образуется единая схема.

Примеры инфологических моделей предметно области

Под проектом базы данных понимают совокупность логической и физической схем данных и их описание. - student2.ru Под проектом базы данных понимают совокупность логической и физической схем данных и их описание. - student2.ru

Под проектом базы данных понимают совокупность логической и физической схем данных и их описание. - student2.ru

Кодирование данных

Кодирование данных - составная часть процесса подготовки информации к записи в базу данных. Отдельные, а в некоторых случаях и все данные, прежде всего, подвергаются кодированию в ходе заполнения входных документов, что позволяет сократить объем потребной памяти и обеспечить удобство обработки данных. Кроме того, все данные кодируются в машинную форму представления при переносе их на машинный носитель или при вводе их с клавиатуры дисплея. Кодирование в этом случае выполняется автоматически.

В целом под кодированием понимается процесс установления соответствия между кодируемыми данными и комбинациями знаков, составляющих алфавит кода.

При подготовке входных документов используется два способа кодирования: кодирование отдельных символов (побуквенное кодирование) и кодирование реквизита в целом (пословное кодирование). Первое, как правило, применяется для кодирования сообщений и иногда - для кодирования реквизитов-оснований, второе - для кодирования реквизитов-признаков. На практике для кодирования реквизитов-признаков применяются такие коды, как порядковый, серийно-порядковый, классификационный, матричный и другие.

Порядковое кодирование состоит в том, что все множество возможных значений (область определения) реквизита нумеруется сквозной нумерацией, и кодовой комбинацией является номер значения в данном множестве. Этот тип кодирования использовался при кодировании первичных ключей. В качестве кода первичного ключа используется последовательно возрастающее значение ("счетчик"), генерируемое СУБД при каждом появлении нового значения первичного ключа. Например, в отношении СОТРУДНИК первичный ключ кодируется десятичным полем КОД СОТРУДНИКОВ.

Серийно-порядковое кодирование предусматривает деление номе ров, используемых в качестве кодовых комбинаций, на группы (серии) по некоторому признаку. Так для кодирования должностей сотрудников в таблице ДОЛЖНОСТЬ значения кодовых комбинации поля КОД_ДОЛЖНОСТИ с 10 по 09 отведены для категории "начальники", с 21 по 29 - для категории "заместители начальника"; с 31 по 39 – для категории «сотрудники» и т.д.

Оба метода кодирования - порядковый и серийно - порядковый отличаются простотой образования кодовых комбинаций и возможностью расширения кода. В тоже время эти коды обеспечивают только идентификацию объектов, не предоставляя информацию об их свойствах в отличие от классификационного кодирования.

В рамках нашей задачи проектирования базы данных мы будем использовать первый способ кодирования – ключевой атрибут будет принимать последовательно возрастающее значение ("счетчик"), генерируемое СУБД при каждом появлении нового значения первичного ключа.

Пример.

Рассмотрим массив информации: Иванов Иван Иванович родился 21.01.1967 года в городе Москве.

Иванов – элемент информационного массива.

Т.е. данное по своей сути - это элемент информации, который содержит конкретное значение характеристики какого-либо объекта (процесса или события) реального мира.

Если данному присвоить имя Фамилия получим: – Фамилия: Иванов.

Если каждому данному присвоить имя, то массив информации можно выразить следующим образом:

Фамилия: Иванов

Имя: Иван

Отчество: Иванович

Дата рождения: 21.01.1967

Место рождения: город Москва.

При этом содержание массива не изменилось. Информация в нем упорядочена, и, кроме того, указанные данные взаимосвязаны, потому что относятся к одному и тому же объекту материального мира – человеку по имени Иванов Иван Иванович. Такую совокупность данных относящихся к одному объекту реального мира называют записью. А каждое имя – полем.

Следовательно, данное – это значение поля.

Вопрос: А если необходимо сохранить информацию не об одном, а о нескольких объектах?

Мы можем переписать поля в виде таблицы и под ними указать данные. Затем ниже дописать данные для другого человек и третьего.

Фамилия: Имя: Отчество: Дата рождения: Место рождения:
Иванов Иван Иванович 21.01.1967 город Москва
Петров Петр Петрович 26.06.1968 город Ленинград
Сидоров Сидор Сидорович 17.09.1969 город Одинцово

Упорядочение данных позволяет исключить дублирование одинаковых данных, а также облегчает создание, ведение и применение базы данных.

В базу данных могут включаться записи для других объектов реального мира. Например, не только для человека, но и для города:

Наименование города: Год создания: Количество жителей:
город Москва 1147 11 млн. человек (2004).
город Ленинград 1703 4 млн. человек (2004).
город Одинцово 1957 126,8 тыс. человек (2002).

И все эти данные будут связаны между собой.

Вопрос: Как проводится обслуживание хранимых данных в базе данных?

Что является таким средством в ЭВМ для данных или информации – ПРОГРАММЫ.

Поэтому, разрабатываются специальные программные средства, которые используются для обслуживания данных. Такие специальные программы, получили название систем управления базой данных.

Система управления базой данных (СУБД) – специальная программа (комплекс программ), предназначенная для обслуживания базы данных. СУБД обеспечивает поиск, хранение, редактирование данных, формирование ответов на запросы.

Таким образом, СУБД играет в информационной системе роль посредника (интерфейса) между базой данных и пользователями.

Отличие базы данных от файла и состоит, прежде всего, в возможности включения в БД более одного типа записей и в наличии связей между записями.

Преимущества работы с БД для пользователя окупают затраты и издержки на ее создание. Оно заключается в следующем:

повышение производительности работы пользователей;

эффективное удовлетворение информационных потребностей пользователя;

независимость программ от данных - централизованное управление данными освобождает прикладные программы от организации данных – разные программы могут использовать одни и те же данные;

организация базы данных позволяет реализовать другие нерегламентированные запросы, приложения;

снижение затрат не только на создание и хранение данных, но и на поддержание их в актуальном динамическом состоянии;

уменьшение потоков данных, циркулирующих в системе;

сокращение избыточности и дублирования данных.

2. Этапы проектирования БД

Прежде чем приступить к созданию таких объектов базы данных, как таблицы, формы и отчеты, нужно разработать их проект. Главное назначение проекта – выработка четкого пути, по которому нужно следовать при его реализации.

Под проектом базы данных понимают совокупность логической и физической схем данных и их описание.

База данных – достаточно сложный объект, и время, затраченное на ее планирование, может значительно сократить сроки ее разработки. Отсутствие продуманной структуры базы данных приводит к необходимости постоянной переделки и перенастраиванию базы данных.

При проектировании БД используется понятие «инфологическая модель».

Вопрос: Зачем нужна инфологическая модель предметной области при проектировании БД?

Ответ: Для того что бы заказчик и разработчик говорили на одном языке – языке моделей, который занимает пограничное положение между двумя языками – разработчика и заказчика.

Исходя из сказанного проектирование БД включает следующие этапы:

1. Разработка инфологической модели предметной области:

2. Выбор типа БД и СУБД.

3. Разработка логической модели базы данных.

4. Разработка физической модели базы данных.

3. Разработка инфологической модели ПрО

Наши рекомендации