Стратегии распределения данных

С целью приближения данных к месту их использования, сокращения нагрузки на сеть и повышения скорости обработки данных создаются реплики, т.е. копии БД в различных узлах сети. После этого как в оригинал БД, так и в реплику могут вноситься изменения. Затем выполняется операция синхронизации данных, т.е. перенос в оригинальную БД всех изменений из реплик.

В РаБД м.б. реализованы след. стратегии распределения данных по комп-рам сети:

1. Фрагментация: когда БД распределена частями по комп-рам сети и реплики не создаются.

2. Репликация: когда БД разделена и создаются реплики на каждом комп-ре сети.

3. Фрагментация и репликация: создание на комп-рах сети копий отдельных частей БД.

При создании РаБД на основе реляционной модели данных разделение или фрагментация БД м.б горизонт., вертик., смешанной.

При горизонт. фрагментации табл. разбивается на совокупности строк по значениям столбца «место работы», кот-е располагаются на различных комп-рах. (рис. 1)

При вертик. фрагм-и табл. Разбивается на совокупности столбцов, кот-е хранятся на различных комп-рах. (рис. 2)

При смешанной фрагм-и происходит разделение реляционной таблицы как по столбцам, так и по строкам.

Правила К. Дейта для РаБД

Правила К.Дейта для РаБД;

1. локальная незав-сть означает, что управл-е локальными БД выполняется на каждом из узлов сети независимо от др. узлов сети.

2. отсутствие опоры на центр. узел означает, что ни один узел сети не зав-ит от центр-ного или какого-л др. Узла. Все узлы имеют равные возможности.

3. непрерывное функционирование состоит в том, что система продолжает функционировать и в случае сбоя на каком-л узле и при неисправности узла и при расширении сети.

4. незав-сть от расположения означает прозрачность расположения данных. Пользователь, обращающийся к РаБД, ничего не должен знать о реальном физическом размещении данных и узлах сети.

5. незав-сть от фрагм-и даёт пользователю возмож-ть работать с РаБД как с единой БД, хотя физически она м.б. разделена на отдельные фрагменты.

6. незав-сть от репликации предполагает, что процесс внесения изменений в реплики БД невидим для пользователей.

7. обработка распределённых запросов характ-ся как возмож-ть выполнения выборки распределённых данных в виде обычного запроса на узлах SQL, как и для операции выборки локальных данных.

8. управ-е распределёнными транзакциями означает возм-ть выполнения операции обновления РаБД, не нарушая целостность и согласованность данных.

9. аппаратная незав-сть означает, что в качестве узлов сети могут выступать компы любых моделей и любых производителей.

10. незав-сть от ОС предполагает использ-е различных ОС, управляющих узлами сети

11. незав-сть от сети означает возм-сть использ-я различных сетей и сетевых технологий для различных узлов.

12. незав-сть от типа СУБД даёт возм-сть использ-ть СУБД различных производителей, кот. должны обеспечивать одинаковый интерфейс взаимодействия между узлами.

10-12 - рекомендации, главные 1-9

Достоинства РаБД: они полно отражают территориально распределённую структуру предприятий и обеспечивают большую живучесть информац. системы, т.к. в случае разрушения одной из локальных БД др. БД остаётся работоспособной.

Недостаток РаБД: повышенная сложность их практич. Реализации.

Хранилища данных

ХД - совокупность данных, ориентированная на предметную область, интегрированная, статичная, неразрушаемая, предназначенная для поддержки принятия решений.

Предметная ориентированность: хранилище предоставляет данные, связанные с одним организационным процессом. Н-р, компания предоставляет клиентам услуги городской тел.связи интернета. Каждым видом услуг занимаются разные отделы, имеющие свои БД и создающие свои отдельные отчёты. Создание общего ХД о клиентах может обеспечить единый взгляд на предоставленные услуги. Из него исключаются ненужные данные (н-р,индексы,№ телефонов и т.д.). Основываясь на демографических данных клиентов и тенденции их покупательного поведения в прошлом, компания может предложить им новые услуги.

Интегрированность: применение единых законов именования и способов вычисления значений данных, полученных из разных источников.Н-р, могут использоваться несколько разных форматов представления дат или один и тот же показатель может называться по-разному(«дата выполнения», «дата исполнения» ).

При записи в ХД такие несоответствия устраняются автоматически. В процессе погружения данные:

1)очищаются-устраняются ненужная или служебная информация

2)агрегируются (укрупняются)-вычисляются суммы, сред.значения и т.д.

3)изменяются-происходит преобразование типов данных, изменения структур хранения и т.д.

4)объединяются из разных источников (1 клиент получ. разные услуги из разн. отделов)

5)синхронизируются-приводятся к одному моменту времени

Статичность (независ-сть от времени ): ХД содержит как прошлые данные, кот. имели статус текущих при последнем погружении. Временные рамки могут изменяться от нескольких месяцев до нескольких лет.

Неразрушаемая совок-сть данных означает, что в хранилище помещается большой объём данных, кот-ые никогда больше не изменятся, т.е. пользователи, выполняющие один и тот же запрос к ХД, получают один и тот же результат.

В наст.вр. кроме ХД создаются витрины данных или киоски данных.

Киоск данных - небольшое ХД, обслуживающее одно из направлений бизнеса компании или одно её структурное подразделение. Стоимость киоска данных в 10-ки раз меньше стоимости корпоративного ХД, а его результат его внедрения окупается быстро.

Наши рекомендации