Тема 4. Информационное обеспечение
БАЗЫ И БАНКИ ДАННЫХ
Понятия «база данных» и «банк данных»
На начальном этапе автоматизированной обработки данныхиспользовалась файловая организация данных. Но для обработки больших массивов информации, часто используемой многими, она имела ряд недостатков:
1) высокая степень избыточности данных в файлах;
2) жесткая связь данных и прикладных программ;
3) нет возможности установки связи между данными разных файлов;
4) ограниченный контроль данных;
5) недостаточные возможности управления данными.
Перечисленные недостатки файловой организации, а также необходимость централизации данных с целью коллективного доступа к ним, повышенные требования к скорости обработки и достоверности данных стали причинами, обусловившими появление и быстрое развитие баз данных.
Концепцию баз данных разработала американская компания IBM в 1970 г. Идеолог баз данных Джеймс Мартин дал следующее определение базы данных.
База данных (БД) – именованная совокупность данных, отображающая состояние объектов, их свойства и взаимоотношения в некоторой предметной области
Объектом может быть предмет, вещество, событие, лицо, явление, абстрактное понятие, то есть все то, что может характеризоваться набором значений некоторой совокупности атрибутов
Атрибут – это информационное отображение свойства объекта
Предметная область – часть реального мира, которая описывается и моделируется с помощью БД.
Преимущества БД:
· БД можно рассматривать как информационную модель объекта;
· в БД информация хранится централизованно;
· организация данных в БД дает возможность поиска, анализа и отображения данных.
· БД представляет собой новый подход к организации данных. Она позволяет обращение к данным без знания физического расположения их в памяти компьютера.
Широкоупотребительным в настоящее время является термин «банк данных».
Банк данных – система файлов и баз данных, предоставляющая услуги по хранению и поиску данных по одной предметной области
1.2.Устройства для хранения баз данных
Современные базы данных имеют большие объемы, измеряемые в Терабайтах (1 Тб=1024 Гб) и даже Петабайтах (1 Пб=1024 Тб).
Устройство | Емкость БД |
Жесткие диски (винчестеры) | до 0,5 Тб |
RAID-массивы | от 2 Тб и более |
CD-ROM | до 800 Мб |
DVD | от 4,7 до 17 Гб |
Оптические библиотеки | от нескольких десятков Гб до 5-6 Тб |
Роботизированные библиотеки | от единиц до десятков Тб |
1.3. Приложения базы данных
Приложениями БД являются:
· запросы. Этотребования пользователей на отбор данных из БД и/или на выполнение определенных действий;
· формы. Формы используются для разных целей. Наиболее часто они применяются для ввода, просмотра и редактирования данных;
· отчеты. Этопредставления информации из БД в виде, удобном для ее восприятия и анализа пользователем;
· Web-страницы для публикации данных базы в Internet;
· прикладные программы. Это программы, работающие с БД, и написанные на языке программирования, встроенном в СУБД.
1.4. Компоненты базы данных
БД состоит из четырех основных элементов:
1) данных пользователей;
2) метаданных. СУБД производит описание структуры базы данных, которое носит название метаданных (данных о данных);
3) данных, призванных улучшить производительность и доступность базы данных. Эти данные состоят, главным образом, из индексов;
4) метаданных приложений. Это описания структуры и формата пользовательских запросов, форм, отчетов и других приложений, выполненное СУБД.
МОДЕЛИ ДАННЫХ
Первоначально исследования в области баз данных были направлены на разработку способов структуризации данных, получивших название моделей данных. Модель данных –это совокупность принципов организации базы данных
Классическими являются иерархическая, сетевая и реляционная модели данных.
2.1. Иерархическая модель
Иерархическая модель представляет собой перевернутое дерево, из корня и узлов (элементов данных) которого исходят ветви (соответствующие связям элементов данных). На самом верхнем уровне только один узел – корень. Каждый элемент связан с одним или несколькими элементами на более низком уровне (порожденными элементами) и только с одним элементом на более высоком уровне, за исключением корня.
На рис. 1 показан пример иерархической организации данных.
Рис. 1. Пример иерархической организации данных
Недостатком иерархической модели является ее громоздкость для обработки данных со сложными логическими связями.
Достоинство иерархической модели данных состоит в эффективном использовании памяти компьютера при хранении данных.
2.2. Сетевая модель
Сетевая модель является развитием иерархической модели.
Сетевая модель представляет структуру, у которой один или несколько порожденных элементов имеют более одного исходного элемента. В сетевой структуре любой элемент может быть связан с любым другим элементом.
На рис. 2 показан пример сетевой организации данных.
Недостатками сетевой модели являются сложность ее понимания для обычного пользователя и большие объемы памяти компьютера на хранение данных.
К достоинствам сетевой модели данных относятся возможность образования произвольных связей и быстрый доступ к данным.
2.3. Реляционная модель
Реляционная модель данных представляет собой комплекс взаимосвязанных простейших двумерных таблиц, называемых отношениями.
Свойства таблицы-отношения:
· каждый столбец таблицы – это элемент данных (атрибут) и его значения должны быть не расчленяемыми на несколько значений;
· все столбцы однородные;
· в таблице нет двух одинаковых строк;
· столбцы и строки могут просматриваться в любом порядке, безотносительно к их информационному содержанию и смыслу;
· число строк не ограничено.
Элементы таблицы, отношения, таблицы реляционной БД называются по-разному, что показано в нижеприведенной таблице:
Таблица | Отношение | Таблица реляционной БД |
столбец | домен | поле |
строка | кортеж | запись |
Одно или несколько полей, однозначно определяющих записи таблицы, называют ключом.
2.3.1.Связи между отношениями
Связи устанавливаются посредством связи ключей, содержащих общую информацию для обоих отношений. Пусть отношение R1 связывается с отношением R2. Тогда R1 – главное отношение, а R 2 – подчиненное. Ключ главного называется первичным, а подчиненного – внешним. Значения первичного ключа всегда уникальны, а значения внешнего ключа могут повторяться.
Графическое изображение связи между таблицами называется схемой данных.