Определения и отличительные признаки баз данных
Общепризнанная формулировка баз данных (БД) отсутствует, для раскрытия понятия удобно пользоваться определениями из разных источников.
1. Базой данных является совокупность самостоятельных материалов (статей, расчетов, нормативных актов и подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью ЭВМ[24].
2. База данных – совокупность данных, хранимых в соответствии со схемой данных, манипулирование которыми выполняют в соответствии с правилами средств моделирования данных[25].
3. База данных – набор и описание логически связанных данных, предназначенных для удовлетворения информационных потребностей.
В связи с отсутствием общепринятой формулировки для уточнения понятия используют также отличительные признаки, которые выражаются в следующем.
1. БД хранятся в компьютерах и обрабатываются с помощью компьютерных программ. Этот признак исключает из числа баз данных некомпьютерные хранилища, например, бумажные архивы или библиотеки.
2. Данные в базе логически структурированы или систематизированы для удобства пользования – поиска, дополнения или другой обработки.
3. В БД встраивается логическая структура данных в соответствии с моделью, заложенной при разработке базы.
Наряду с определениями и отличительными признаками существует общепринятая практика, в соответствии с которой не называют базами данных файловые архивы, Интернет-порталы и электронные таблицы, хотя они обладают некоторыми признаками БД.
Для надежного сохранения информации, которая может иметь большую ценность, в базе данных в отличие от других программ используют двойной подход, который заключается в следующем.
1. Операции по созданию или изменению структуры базы данных производят только с копией и никогда не производят с базой данных, находящейся в эксплуатации.
2. Все изменения с данными сохраняются немедленно и автоматически. Базу данных нельзя закрыть без сохранения, так как все сохранения бывают завершены к моменту закрытия.
Отличительные особенности баз данных свидетельствуют о том, что они созданы для хранения огромных массивов данных и автоматической обработки этих массивов с помощью вычислительной техники.
Классификации баз данных
Первое оборудование и программное обеспечение для обработки структурированных цифровых записей появилось в 50-х годах прошлого века. Термин «база данных» стал общепринятым в 60-х, а в 70-х годах была сформирована модель представления данных, основанная на математических и логических подходах. С начала 80-х базы данных стали широко использоваться для удовлетворения потребностей многих предприятий и организаций.
Множество созданных баз данных поддаётся различным видам классификаций. Одной из распространенных является классификация по модели данных, в которой выделяются следующие категории.
1. Иерархические базы данных могут быть представлены как дерево, состоящее из объектов различных уровней. Примером иерархической структуры является файловая система.
2. Сетевые базы данных состоят из элементов (узлов), каждый из которых находится на определенном уровне и может быть связан любым другим элементом.
3. Реляционные базы данных формируются на основе таблиц, связанных между собой определенными отношениями.
В классификации по содержимому название категории определяется содержанием БД, например, базы данных исторические, экологические, экономические и т.п.
В классификации по степени распределённости в зависимости от места расположения выделяют централизованные (сосредоточенные) и распределенные базы данных. Распределенные базы данных, как правило, обрабатываются разными удаленными друг от друга организациями.
Структура и свойства
База данных имеет табличную структуру, в которой в отличие от обычной таблицы столбец называют полем, а строку – записью. Поля образуют структуру, а записи относятся к данным, которые хранятся в базе (табл. 13.1)
Структура – это сетка с наименованием полей, которая может быть построена и без записей. Например, ежедневник – это определенная база данных, даже если не заполнена ни одна строка этого документа. Структура базы данных создается в процессе её проектирования и не может быть изменена пользователем при занесении данных.
Таблица 13.1
Структура базы данных
Поле 1 | Поле 2 | Поле 3 | |
Запись 1 | |||
Запись 2 | |||
Запись 3 |
Каждому полю при создании базы данных задаются определенные свойства. Свойства полей зависят от типа данных, например, различаются свойства текстовых и графических данных. В приложении к текстовым данным могут быть выбраны, например, следующие свойства.
1. Имя поля – по умолчанию именем поля является заголовок столбца.
2. Тип поля – определяет тип данных, которые могут содержаться в поле.
3. Размер поля – определяет предельную длину данных (в символах), которые могут размещаться в поле.
4. Формат поля – определяет способ форматирования данных в ячейках, принадлежащих полю.
5. Маска ввода – определяет форму, с помощью которой вводятся данные в поле (средство автоматизации ввода).
6. Значение по умолчанию – значение, которое вводится в ячейки автоматически ( средство автоматизации ввода).
7. Сообщение об ошибке – текстовое сообщение, которое выдается автоматически при вводе ошибочных данных.
8. Обязательное поле – свойство, определяющее обязательность заполнения данного поля.
9. Индексированное поле – полю придается дополнительное свойство для ускорения поиска или сортировки записей.
Перечень и названия свойств полей могут быть значительно расширены в зависимости от специфики базы данных.
Данные, которые вводят в базу, принято различать по типу. Таблицы баз данных могут иметь значительное число типов данных.
1. Текстовый– тип данных для хранения текста ограниченного размера (до 255 символов).
2. Поле Мемо– специальный тип данных для хранения больших объемов текста.
3. Числовой – для хранения действительных чисел.
4. Дата/время – для хранения календарных дат и текущего времени.
5. Денежный – для хранения денежных сумм.
6. Счетчик – для натуральных чисел с автоматическим наращиванием, например, для организации порядковой нумерации.
7. Логический –для хранения логических данных типа Да или Нет.
8. Гиперссылка– специальное поле для хранения адресов Web-страниц.
9. Мастер подстановок– тип данных, которые вводятся из раскрывающегося списка.
Тип данных не ограничивается данным списком и может быть значительно расширен.
Связанные таблицы
Базу данных, содержащую большое количество полей и записей, чаще всего представляют в виде нескольких таблиц, которые называют связанными таблицами, а саму базу данных при этом называют реляционной базой данных. Название «реляционная» подчеркивает наличие определенных отношений между полями связанных таблиц.
Связанные таблицы состоят, как правило, из одной базовой и нескольких подчиненных таблиц или нескольких таблиц, между которыми обозначены связи.Базовая таблица и подчиненные таблицы связаны потому, что они хранятся в одной базе данных. Графическая связь между таблицами отражается с помощью схемы данных. Пример схемы данных представлен в табл. 13.2.
Программная связь между таблицами осуществляется с помощь полей с одинаковыми типами данных. Каждая из таблиц – базовая и подчиненная – имеют в своем составе уникальное поле или поле, значения в котором не могут повторяться.
Уникальное поле базовой таблицы называется ключевым полем или первичным ключом. В ключевом поле записи не могут повторяться.Любому значению первичного ключа соответствует единственная запись в таблице.
Таблица 13.2
Схема данных в связанных таблицах
Ключевое поле в подчиненной таблице называется внешним ключом. Внешний ключ однозначно связан с первичным ключом, поскольку это столбец таблицы, значения которого полностью соответствуют значениям первичного ключа другой таблицы. Наличие ключевых полей позволяет осуществлять корректный переход от одной таблицы к другой.
Из приведенных определений связанных таблиц и ключей следует несколько правил работы с реляционной базой данных.
1. В подчиненную таблицу нельзя добавить запись с несуществующим в базовой таблице ключом.
2. В базовой таблице нельзя удалить запись, если не удалены соответствующие записи в подчиненной таблице.
3. Изменения ключа базовой таблицы должны сопровождаться изменениями соответствующих записей подчиненной таблицы.