Различают 3 подхода к логической организации БД
1. предусматривает создание иерархическоймодели, которая предусматривает совокупность элементов, связанных по определенным правилам:
Ø иерархическое дерево имеет только одну вершину
Ø элементы иерархической структуры нижнего уровня могут быть связаны только с одним элементом вышестоящего уровня.
Поиск данных происходит по одной из ветвей дерева.
Пример, наиболее популярная иерархическая СУБД была Information Management System (IMS) фирмы IBM, появившаяся в 1968 г. она использовалась на больших ЭВМ.
Преимущества - простота, быстродействие. Недостаток – простота структуры базы, т.к. структура данных сложнее.
2. Сетевая модель является разновидностью иерархической модели и отличается от нее тем, что позволяет установить между объектами разных уровней множество связей.
Пример,в 1971 на конференции по языкам систем данных был опубликован официальный стандарт сетевых БД, который известен как модель CODASYL. В 70 годах независимые производители программного обеспечения реализовали сетевую модель в программных продуктах: IDMS компании синкот и СУБД Adabas, которые были очень популярны.
К достоинствам можно отнести гибкость, стандартизацию и быстродействие.
Но иерархически и сетевые БД были очень жесткими, наборы отношений и структуру записей приходилось задавать наперед, а изменение структуры БД обычно означало перестройку всей БД. Они были инструментами программистов. Чтобы получить ответ на вопрос, программисту приходилась писать программу для навигации по БД. Реализация пользовательских запросов часто затягивалась, что приводило к ненужности обработанной информации.
Недостаток сетевой и иерархической модели привели к появлению новой реляционной модели, созданной Коддом в 1970. в 1985 году Кодд написал статью, где сформулировал 12 привил, которым должна отвечать любая реляционная БД.
3. Реляционная модельориентирована на организацию данных в виде таблиц. Каждая реляционная таблица на физическом уровне представляет двумерный массив. Реляционная таблица обладает свойствами:
Ø Каждый элемент таблицы рассматривается как отдельный элемент данных
Ø Каждый элемент таблицы состоит из однородных элементов, имеющих уникальное имя, одинаковый тип и длину. Элементы столбца называются полем. В таблице могут задаваться следующие типы полей: текстовый, числовой, денежный, логический, дата.
Ø В таблице каждая строка состоит из одинакового набора полей. При этом количество строк не ограничено. В таблице не может быть 2 одинаковых по содержанию строк
Ø В таблице допускается наличие 2 одинаковых полей, т.е одно поле может входить в состав нескольких полей.
Табельный номер | Фамилия | Имя | Отчество | Дата рождения |
Петров | Олег | Сергеевич | 15.02.1954 | |
Сидоров | Иван | Петрович | 23.02.1976 | |
Панин | Петр | Борисович | 07.09.1986 |
Поле (столбец) – элементарная единица логической организации данных. Каждое поле имеет уникальное имя, при этом каждое из полей однородно, т.е. имеет одинаковую тип и длину.
Поле, значение которого однозначно определяет соответствующую запись, называется ключевым.
В реляционной таблице существует 2 типа ключевых полей: простой ключ,который указывает и однозначно определяет соответствующую запись в таблице; внешний ключ, который указывает на связь одинаковых полей, размещенных в различных таблицах.
Запись – это совокупность значений связанных элементов данных. Экземпляр записи – это отдельная строка таблицы, содержащая конкретное значение ее полей.
Таблица БД – это совокупность экземпляров записей одной структуры. Описание структуры БД содержит перечень полей записи и их основные характеристики.
Между объектами в реляционной БД могут быть установлены 3 типа отношений:
ü 1:1 – одному объекту соответствует 1 объект
ü 1:многим – 1 объекту соответствует много объектов
ü много элементов в одной таблице: множество элементов другой таблицы.
Логическая модель должна обеспечить следующие свойства:
- целостность и не противоречивость данных – физическая сохранность данных, предотвращение неверного использования данных и поддержка допустимых сочетаний данных.
- минимальная избыточность данных – исключение дублирования данных, хранение любого элемента в едином экземпляре, что упрощает процедуры обработки и обновления данных.
Физическая организация БД представляет совокупность средств и методов размещения данных в памяти компьютера и создание внутренней модели данных, которая является средством отображения логической модели. Конечным итогом является файл БД и файлы поисковых структур. Наиболее распространенные поисковые структуры: линейные и цепные списки, инвентированные и индексные файлы.
Линейные списки –это наиболее простой способ организации. Файлы рассматриваются, как последовательность не взаимосвязанных записей. Поиск записей осуществляется путем вычисления адреса записи по некоторому алгоритму. Экономится память, но низкая скорость поиска.
Цепной список – это файл, записи которого имеют ссылки на другие записи, образуя ассоциативную организацию данных.
Инвентированный файл – является копией основного файла, в котором производится систематизация записей не по ключевому полю (№ записи, ФИО, дата), поиск по дате (дублируется информация).
Индексный файл – файл, в котором содержатся не записи основного файла, а адреса записи основного файла.
4.
СУБД –это комплекс программных и языковых средств, необходимых для создания БД и поддержания их в актуальном состоянии.
Существуют различные виды СУБД:
1. по способу организации данных
ü иерархическая
ü сетевая
ü реляционная
2. по категориям пользователей
ü профессиональные
Широкий спектр применяемых программных средств накопления и хранения информации диктует необходимость разработки СУБД, отличающихся друг от друга функциональными возможностями и предназначенных для широкого круга пользователей: от новичка до системного программиста.
Современные БД можно разделить на 3 категории:
- программные продукты корпоративного направления – Oracle и MS SQL Server (надежность, резервное копирование, работа с большим объемом данных и обладает широкими функциональными возможностями)
- СУБД, предназначенные для работы с информационными массивами в небольших компаниях, - MS Access и Borland Intervase (надежность и функциональность, и возможность работы без выделенного сервера)
- СУБД для Web, реализующих создание web-сайта с небольшими БД, - MySQL и Borland Intervase (высокая скорость обработки данных, нетребовательность к ресурсам и удобное удаленное администрирование).
Наиболее популярными СУБД являются:
Oracle –одна из наиболее мощных СУБД, предназначенных для реализации БД на уровне корпорации. Может работать в большинстве операционных систем, дает возможность выбора языка программирования (PL/SQL, Java), располагает средствами администрирования не только одного сервера, но и группы серверов, расположенных в разных частях планеты.
MS SQL Server –широкое распространение в стране и за рубежом, т.к. обладает широкими возможностями администрирования и масштабируемости, что позволяет использовать ее в ИС для среднего бизнеса и больших компьютерных ИС. В основе лежит среда Windows, что позволять экспортировать и импортировать данные в программные продукты Microsoft.
Borland Intervase –одна из самых быстродействующих СУБД и нетребовательна к аппаратной части.
MySQL –высокая производительность и используется в качестве средства работы с БД в Интернете. Программа совершенно не требовательна к ресурсам сервера и бесплатная: исходные коды и дистрибутивы для различных платформ доступны на сайте в Интернете. Она предназначена для работы в сети.