Складові сховищ даних та їх характеристика
Враховуючи те, що сховища даних є новою технологію, яка розвивається, існують різні підходи до викладення структури. сховища даних включає до свого складу такі компоненти
Менеджер завантаженнявиконує функції диспетчеризації щодо регулярності завантаження нових даних до сховища даних згідно зі встановленим регламентом. Оскільки джерелом даних можуть бути різні OLTP-системи, функції менеджера завантаження також полягають в очищенні, конвертації та приведенні даних до заданого виду їх представлення в СД.
Менеджер сховищавиконує операції аналізу та управлін даними. Це такі основні операції: аналіз узгодженості та несун речності даних; перетворення та переміщення даних з тимчасон го сховища в основні таблиці СД; створення індексів; денорма.і зація даних у разі її необхідності; агрегація (узагальнення) дани резервне копіювання та архівування даних.
Детальні (оперативні) дані— ця складова містить усі де льні дані, які визначені схемою сховища даних. Це можуть б як первинні дані найнижчого рівня деталізації, так і узагальне до певного рівня деталізації.
Агреговані дані— ця компонента містить дані, які попе дньо оброблені менеджером сховища з метою їх часткового глибокого узагальнення. У цій частині зберігаються певним ч ном відсортовані та згруповані дані, необхідні для виконання питів.
Ця частина сховища є тимчасовою і змінною, оскільки во постійно модифікується у відповідь на зміни запитів. Необхі ність цієї компоненти пов'язана з підвищенням продуктивно виконання запитів. Узагальнені дані поновлюються по мірі на ходження нових даних до системи. Частково узагальнені дані це результат певного узагальнення та агрегації детальних дан Глибоко узагальнені дані отримуються на основі узагальнення ча ково узагальнених даних.
Репозитарій метаданих— це інформація про дані, що збе гаються в СД.
Менеджер запитів— це складова сховища, яка виконує операції, пов'язані з управлінням запитів користувачів. Ця компонента реалізується, як правило, на базі СКБД, що підтримує сховище даних, а також сховища даних і програш власної рззробки.
Або
Основними елементами даних, які зберігаються в сховищі даних, є:
• показники (змінні);
« виміри та їх ієрархія;
• факти.
Основними задачами проектування сховищ даних є визначення кандидатів на змінні, факти та виміри. Для цього застосовуються кілька підходів, кожен з яких характеризується певною послідовністю ідентифікації основних елементів моделі. Згідно з послідовністю ідентифікації елементів сховища даних можна визначити такі підходи до визначення основних елементів сховища даних:
Підхід «від запиту».Передусім визначаються змінні, потім виміри, пов'язані зі змінними, а надалі формуються факти. Цей підхід називається «від запиту», оскільки він орієнтований насамперед на аналітичні запити до сховища даних. Тобто визначення елементів сховища даних виконується на основі аналізу запитів користувачів-аналітиків.
Підхід, орієнтований на бізнес.Визначаються факти, потім виміри, а на завершення змінні. Цей підхід називається орієнтованим на бізнес, оскільки спочатку аналізується предметна область, для якої будується сховище даних, і визначаються основні бізнес-події, які необхідно відобразити в сховищі як факти, а вже потім з'ясовуються виміри та змінні, що характеризуватимуть ці факти.
Підхід «від джерела». Визначаються виміри, далі змінні, а вже потім факти. Цей підхід називається орієнтованим на джерело даних. Тобто при проектуванні сховища даних відштовхуємось від існуючих моделей баз даних, які будуть виступати основним джерелом наповнення даними сховища.
У реальній дійсності при проектуванні сховищ даних може бути використана комбінація цих усіх підходів. Оскільки йдеться про визначення кандидатів на виміри, змінні та факти, то, наприклад, спочатку може бути застосовано підхід «від бізнесу». Використовуючи його, вивчається предметна область і з'ясовуються бізнес-події, які необхідно відображати у вигляді фактів, а потім визначаються виміри та змінні, що їх характеризують. Далі проводиться опитування майбутніх користувачів і виявляється перелік аналітичних запитів, які можуть бути поставленими до майбутнього сховища. На основі аналізу запитів користувачів проводиться уточнення фактів, змінних та вимірів, які були отримані при вивченні предметної області. 1 нарешті, отриманий перелік кандидатів на змінні факти та виміри уточнюється з використанням підходу «від джерела».