Тема 4. Информационное обеспечение

БАЗЫ И БАНКИ ДАННЫХ

Понятия «база данных» и «банк данных»

На начальном этапе автоматизированной обработки данныхиспользовалась файловая организация данных. Но для обработки больших массивов информации, часто используемой многими, она имела ряд недостатков:

1) высокая степень избыточности данных в файлах;

2) жесткая связь данных и прикладных программ;

3) нет возможности установки связи между данными разных файлов;

4) ограниченный контроль данных;

5) недостаточные возможности управления данными.

Перечисленные недостатки файловой организации, а также необходимость централизации данных с целью коллективного доступа к ним, повышенные требования к скорости обработки и достоверности данных стали причинами, обусловившими появление и быстрое развитие баз данных.

Концепцию баз данных разработала американская компания IBM в 1970 г. Идеолог баз данных Джеймс Мартин дал следующее определение базы данных.

База данных (БД) – именованная совокупность данных, отображающая состояние объектов, их свойства и взаимоотношения в некоторой предметной области

Объектом может быть предмет, вещество, событие, лицо, явление, абстрактное понятие, то есть все то, что может характеризоваться набором значений некоторой совокупности атрибутов

Атрибут – это информационное отображение свойства объекта

Предметная область – часть реального мира, которая описывается и моделируется с помощью БД.

Преимущества БД:

· БД можно рассматривать как информационную модель объекта;

· в БД информация хранится централизованно;

· организация данных в БД дает возможность поиска, анализа и отображения данных.

· БД представляет собой новый подход к организации данных. Она позволяет обращение к данным без знания физического расположения их в памяти компьютера.

Широкоупотребительным в настоящее время является термин «банк данных».

Банк данных – система файлов и баз данных, предоставляющая услуги по хранению и поиску данных по одной предметной области

1.2.Устройства для хранения баз данных

Современные базы данных имеют большие объемы, измеряемые в Терабайтах (1 Тб=1024 Гб) и даже Петабайтах (1 Пб=1024 Тб).

Устройство Емкость БД
Жесткие диски (винчестеры) до 0,5 Тб
RAID-массивы от 2 Тб и более
CD-ROM до 800 Мб
DVD от 4,7 до 17 Гб
Оптические библиотеки от нескольких десятков Гб до 5-6 Тб
Роботизированные библиотеки от единиц до десятков Тб

1.3. Приложения базы данных

Приложениями БД являются:

· запросы. Этотребования пользователей на отбор данных из БД и/или на выполнение определенных действий;

· формы. Формы используются для разных целей. Наиболее часто они применяются для ввода, просмотра и редактирования данных;

· отчеты. Этопредставления информации из БД в виде, удобном для ее восприятия и анализа пользователем;

· Web-страницы для публикации данных базы в Internet;

· прикладные программы. Это программы, работающие с БД, и написанные на языке программирования, встроенном в СУБД.

1.4. Компоненты базы данных

БД состоит из четырех основных элементов:

1) данных пользователей;

2) метаданных. СУБД производит описание структуры базы данных, которое носит название метаданных (данных о данных);

3) данных, призванных улучшить производительность и доступность базы данных. Эти данные состоят, главным образом, из индексов;

4) метаданных приложений. Это описания структуры и формата пользовательских запросов, форм, отчетов и других приложений, выполненное СУБД.

МОДЕЛИ ДАННЫХ

Первоначально исследования в области баз данных были направлены на разработку способов структуризации данных, получивших название моделей данных. Модель данных –это совокупность­ принципов организации базы данных

Классическими являются иерархическая, сетевая и реляционная модели данных.

2.1. Иерархическая модель

Тема 4. Информационное обеспечение - student2.ru Иерархическая модель представляет собой перевернутое дерево, из корня и узлов (элементов данных) которого исходят ветви (соответствующие связям элементов данных). На самом верхнем уровне только один узел – корень. Каждый элемент связан с одним или несколькими элементами на более низком уровне (порожденными элементами) и только с одним элементом на более высоком уровне, за исключением корня.

На рис. 1 показан пример иерархической организации данных.

Тема 4. Информационное обеспечение - student2.ru

Рис. 1. Пример иерархической организации данных

Недостатком иерархической модели является ее громоздкость для обработки данных со сложными логическими связями.

Достоинство иерархической модели данных состоит в эффективном использовании памяти компьютера при хранении данных.

2.2. Сетевая модель

Сетевая модель является развитием иерархической модели.

Сетевая модель представляет структуру, у которой один или несколько порожденных элементов имеют более одного исходного элемента. В сетевой структуре любой элемент может быть связан с любым другим элементом.

На рис. 2 показан пример сетевой организации данных.

 
  Тема 4. Информационное обеспечение - student2.ru

Недостатками сетевой модели являются сложность ее понимания для обычного пользователя и большие объемы памяти компьютера на хранение данных.

К достоинствам сетевой модели данных относятся возможность образования произвольных связей и быстрый доступ к данным.

2.3. Реляционная модель

Реляционная модель данных представляет собой комплекс взаимосвязанных простейших двумерных таблиц, называемых отношениями.

Свойства таблицы-отношения:

· каждый столбец таблицы – это элемент данных (атрибут) и его значения должны быть не расчленяемыми на несколько значений;

· все столбцы однородные;

· в таблице нет двух одинаковых строк;

· столбцы и строки могут просматриваться в любом порядке, безотносительно к их информационному содержанию и смыслу;

· число строк не ограничено.

Элементы таблицы, отношения, таблицы реляционной БД называются по-разному, что показано в нижеприведенной таблице:

Таблица Отношение Таблица реляционной БД
столбец домен поле
строка кортеж запись

Одно или несколько полей, однозначно определяющих записи таблицы, называют ключом.

2.3.1.Связи между отношениями

Связи устанавливаются посредством связи ключей, содержащих общую информацию для обоих отношений. Пусть отношение R1 связывается с отношением R2. Тогда R1 – главное отношение, а R 2 – подчиненное. Ключ главного называется первичным, а подчиненного – внешним. Значения первичного ключа всегда уникальны, а значения внешнего ключа могут повторяться.

Графическое изображение связи между таблицами называется схемой данных.

Наши рекомендации