Механизмы доступа к данным
Между клиентским приложением и базой данных дополнительно встраиваются особые программные модули, позволяющие клиентскому приложению получать доступ к базе данных. Такие модули называются механизмами доступа к данным.
Существует два основные способа доступа к данным из клиентских приложений: использование прикладного программного интерфейса (набор функций, вызываемых из клиентского приложения. Такие функции инициируют передачу запросов серверу баз данных и получение от сервера результатов выполнения запросов или кодов ошибок, которые затем обрабатываются клиентским приложением) и использование универсального программного интерфейса (API) (обычно реализован в виде библиотек и дополнительных модулей, называемых драйверами. Библиотеки содержат некий стандартный набор функций или классов, нередко подчиняющийся той или иной спецификации)
Прикладн. API «+» высокое быстродействие; «-» необход-ть изменения программного кода приложения при изменении формата базы данных.
Универсал API «+»возможность применения одного и того же API для доступа к разным форматам баз данных; «-» снижается быстродействие обработки данных из-за наличия дополнительного программного драйвера.
Распределенная БД (РаБД) – набор логически связанных между собой разделяемых данных и их описаний, которые физически распределены по нескольким компьютерам (узлам) в некоторой компьютерной сети.
Каждая таблица в РАБД может быть разделена на некоторое количество частей, называемых фрагментами.С целью улучшения доступности данных и повышения производительности системы для отдельных фрагментов может быть организована репликация – поддержка актуальной копии некоторого фрагмента на нескольких различных узлах. Существуют несколько альтернативных стратегий размещения данных в системе: раздельное (фрагментированное) размещение, размещение с полной репликацией и размещение с выборочной репликацией.
Раздельное (фрагментированное) размещение. В этом случае БД разбивается на непересекающиеся фрагменты, каждый из которых размещается на одном из узлов системы. Размещение с полной репликацией. Эта стратегия предусматривает размещение полной копии всей БД на каждом из узлов системы.
Размещение с выборочной репликацией. Данная стратегия представляет собой комбинацию методов фрагментации, репликации и централизации. Эта стратегия используется чаще всего.
РаБД можно классифицировать на гомогенные и гетерогенные.
Гомогенной РаБД управляет один и тот же тип СУБД. Гетерогенной РаБД управляют различные типы СУБД, использующие разные модели данных – реляционные, сетевые, иерархические или объектно-ориентированные СУБД.
70. Распределенные СУБД (РаСУБД). Двенадцать правил К. Дейта Распред. СУБД. Распределенная СУБД (РаСУБД) – комплекс программ, предназначенный для управления распределенной БД и позволяющий сделать распределенность информации «прозрачной» для конечного пользователя. Назначение обеспечения «прозрачности» состоит в том, чтобы распределенная система внешне вела себя точно так же, как и централизованная. Основная задача РаСУБД состоит в том, чтобы пользователь, работающий в любом узле сети, имел доступ ко всем этим БД как к единой БД.12правил. К. Дейтом были сформулированы 12 правил (1987) для типичной РаБД. Основой этих правил является то, что РАБД должна восприниматься пользователем точно так же, как и привычная централизованная БД.
1. Локальная автономность.
2. Отсутствие опоры на центральный узел.
3. Непрерывное функционирование
4. Независимость от расположения.
5. Независимость от фрагментации.
6. Независимость от репликации.
7. Обработка распределенных запросов.
8. Обработка распределенных транзакций.
9. Независимость от типа оборудования.
10. Независимость от сетевой архитектуры.
11. Независимость от операционной системы.
12.Независимость от типа СУБД.71. Обработка распределенных запросов трактуется как возможность выборки над распределенной БД, сформулированных в рамках обычного запроса на языкеSQL. Операцию выборки из РаБД можно сформулировать с помощью тех же языковых средств, что и операцию над локальной БД.
Достоинства РаБД: они более полно отражают территориально распределенную структуру предприятия, обеспечивают большую живучесть ИС, т.к. в случае разрушения одной из локальных БД другие БД остаются работоспособными.
Недостатки: повышенная сложность их практичской реализации.
Хранилища данных.
Харнилище данных – ориентированная на предметную область, интегрированная, статичная, неразрушимая совокупность данных, предназначенная для поддержки принятия решений.
Предметная ориентированность означает, что хранилище данных предназначено для представления данных, связанных с одним организационным процессом.
Интегрированность – применение единых законов именования, способов вычисления значений данных, полученных из различных источников.
Статичность(независимость от времени) – означает, что хранилище данных содержит как исторические данные, так и данные, кот-е имели статус текущих при последнем погружении в БД.
Неразрушаемая совокупность данных означает, что в хранилище данных помещается большой объём данных, кот-е будучи раз погруженными уже больше не подверг-ся никаким изменениям.
Для хранилища данных создаётся репозитарий – специальное хранилище данных о данных(метаданных), кот-е содержит описания структур данных . их взаимосвязей; инфу о хранилищах данных и др.