Базы данных и знаний: назначение и общая характеристика. Модели баз данных

Базами данных называют совокупность данных, совместно используемых различными задачами в рамках единой автоматизированной информационной системы.

Основными понятиями теории баз данных являются:

- предметная область – часть реального мира, подлежащая изучению с целью организации управления в этой сфере и последующей автоматизации процесса управления;

- объект – элемент информационной системы, сведения о котором хранятся в базе данных.

- атрибут – это информационное отображение свойств объекта;

- ключевой атрибут – это такой атрибут (или группа атрибутов), который позволяет определить значения других атрибутов;

- запись данных – совокупность значений связанных элементов данных;

- первичный ключ - это атрибут (или группа атрибутов), который уникальным образом идентифицирует каждый экземпляр объекта (запись).

Процедуры хранения данных в базе должны подчиняться некоторым общим принципам, среди которых в первую очередь выделить следующие:

- целостность и непротиворечивость данных, под которым понимается как физическая сохранность данных, так и предотвращение неверного использования данных, поддержка допустимых сочетаний их значений, защита от структурных искажений и несанкционированного доступа;

- минимальная избыточность данных обозначает, что любой элемент данных должен храниться в базе данных в единственном виде, что позволяет избежать дублирования операций, проводимых над ними.

Программное обеспечение, осуществляющее операции над базами данных получило название система управления базами данных (СУБД).

Возможны три модели баз данных: сетевые, иерархические и реляционные. Сетевые и иерархические СУБД по­лучили наибольшее распространение на больших- и мини-ЭВМ. На ПК ис­пользуется преимущественно реляционная модель данных.

В ие­рархических СУБД (рис.15.1) данные представляются в виде древовидной структуры. В этой модели все записи, агрегаты и атрибуты образуют иерархически организованный набор, то есть такую структуру, в которой все элементы связаны отношением подчиненности, и при этом любой элемент может подчиняться только одному какому-нибудь элементу.

 
  Базы данных и знаний: назначение и общая характеристика. Модели баз данных - student2.ru

Сетевые СУБД (рис.15.2) ис­пользуют модель представления данных в виде произвольного графа. Сетевой подход является развитием иерархической модели. В сетевой модели запись-потомок может зависеть не от одного прародителя, а от многих.

 
  Базы данных и знаний: назначение и общая характеристика. Модели баз данных - student2.ru

Реляционная модель ориентирована на представление данных в виде табли­цы. Таблица реляционной БД (рис. 15.3) представляет собой двухмерный мас­сив и обладает следующими свойствами:

- каждый элемент таблицы - это один элемент данных, повторяющиеся группы отсутствуют;

- все столбцы (колонки) в таблице однородные. Это означает, что все элементы одного столбца имеют одинаковую природу. Например: марка бензонасоса или раз­мер заработной платы;

- столбцам присвоены уникальные имена;

- в таблице нет одинаковых строк;

 
  Базы данных и знаний: назначение и общая характеристика. Модели баз данных - student2.ru

- в операциях с таблицей ее строки и столбцы могут просматриваться в лю­бом порядке и в любой последовательности безотносительно к их информа­ционному содержанию и смыслу.

Основные понятия реляционных баз данных.

Таблица на экране дисплея соответствует файлу данных на диске, строка таблицы - записи файла, колонка таблицы - полю записи.

Строка таблицы с данными представляет собой один конкретный экземпляр отношения данного типа или его кортеж, а всю таблицу в целом называют отношением. Таким обра­зом, при описании реляционной модели данных отношением называют всю таблицу в целом как совокупность конкретных экземпляров отношения. Слова "отношения" и "реляционный" (от латинского relation - отношение) представляют собой синонимы.

Совокупность значений элементов данных, размещенных в одном столбце таблицы и определяющих некоторую характеристику или свойство объектов, описываемых строками таблицы, называют атрибутом отношения. Количество элементов данных в кортеже (количество столбцов в таблице) определяет степень отношения. Если таблица включает n столбцов, то она представляет собой отношение степени n. Количество кортежей в отноше­нии (число строк в таблице) определяют его мощность - m. Тогда общее количество элементов данных в отношении степени n будет равно n х m.

Атрибут, значение которого идентифицирует кортеж, то есть позволяет однозначно выделить его из других кортежей данного отношения, называ­ется ключевым атрибутом или просто ключом. Ключ может включать нес­колько атрибутов - составной ключ или представлять собой только часть значения атрибута - частичный ключ. В приведенном выше примере в ка­честве ключа может быть марка автомобиля, что позволяет однозначно вы­делить кортеж из всего отношения. Часто степень отношения БД может быть достаточно большой. Пользоваться такой базой данных неудобно, по­этому она может быть разбита на несколько самостоятельных частей - несколько отношений. В таком случае возникает потребность установления логической связи между различными кортежами, обеспечивающей непротиво­речивость и полноту базы данных. Логическая связь между кортежами раз­ных отношений в целях их совместной обработки реализуется различными способами:

а) использованием в отношениях одинаковых ключей;

б) вклю­чение в отношение внешнего ключа;

в) использование связующего отноше­ния.

Основными операциями над отношениями реляционной базы данных являются объединение отношений, их пересечение, декартово произведение, проекция, деление, соединение и выбор.

Для выполнения операций над отношениями реляционной базы данных используются языки реляционной алгебры и языки реляционного исчисления.

Языки реляционной алгебры основаны на реляционной алгебре (алгебра Кодда). Записывая последовательно операции над отношениями в соответствующем порядке можно получить желаемый результат.

Примеры операций над отношениями:

Клиент 1   Клиент(результирующее отношение
Фамилия Возраст   Фамилия Возраст
Иванов   Иванов
Петров   Петров
Тихонов   Тихонов
Тихонов   Тихонов
Клиент 2   Достоевский
Фамилия Возраст      
Иванов      
Тихонов      
Достоевский      

Объединение. Операция выполняется над двумя совместимыми отношениями (отношения совместимы, если они имеют одинаковую степень и одинаковые типы соответствующих атрибутов). Результат объединения включает все кортежи первого отношения и недостающие кортежи из второго отношения.

Пересечение.Результат пересечения содержит только те кортежи первого отношения, которые есть во втором отношении.

Разность. Результат включает только те кортежи первого отношения, которых нет во втором отношении.

Клиент(результирующее отношение. Разность)
Фамилия Возраст
Петров
Тихонов

Декартово произведение. Здесь отношения- операнды могут иметь разные схемы:

Степень результирующего отношения равна сумме степеней отношений операндов, а мощность – произведению их мощностей:

        (результирующее отношение. Декартово произведение)  
Фамилия   Предмет Дата Фамилия Предмет Дата
Иванов   Информ. 7.06.05 Иванов Информ. 7.06.05
Петров   Математ. 10.06.05 Петров Информ. 7.06.05
Тихонов       Тихонов Информ. 7.06.05
        Иванов Математ. 10.06.05
        Петров Математ. 10.06.05
        Тихонов Математ. 10.06.05
               

Наши рекомендации