Тема 2. Характеристики та компоненти сховищ даних

Основні характеристики сховищ даних (предметна орієнтація, інтегрованість, підтримка хронології, незмінність, мінімальна надлишковість).

Характеристика основних компонент сховища даних (менеджер завантаження, менеджер сховища, детальні (оперативні) дані, агреговані дані, репозиторій мета даних, менеджер запитів);

Види сховищ даних (корпоративні сховища даних, вітрини, або кіоски, даних).

Лекція №2. Характеристики та компоненти сховищ даних ( 2 год.)

1. Основні характеристики сховищ даних

Ø Предметна орієнтація

Ø Інтегрованість

Ø Підтримка хронології

Ø Незмінність

Ø Мінімальна надлишковість

2. Характеристика основних компонент сховища даних

Ø Менеджер завантаження

Ø Менеджер сховища

Ø Детальні (оперативні) дані

Ø Агреговані дані

Ø Репозиторій метаданих

Ø Менеджер запитів

3. Види сховищ даних

Ø Корпоративні сховища даних

Ø Вітрини або кіоски даних.

Лабораторна робота №1.Розробка концептуального проекту багатомірного сховища даних "Індивідуальна система" на основі індивідуального завдання [10] (8год.) .

Перелік питань до самостійної роботи

1. Корпоративні сховища даних

2. Вітрини або кіоски даних

Література [1]- [9], [12]- [15]

Тема 3. Архітектура сховищ даних

Архітектура сховищ даних. Віртуальне сховище даних. Архітектура сховища на основі семантичної інтеграції предметних областей. Архітектура із системою управління запитами до предметних областей. Монолітне сховище. Стандартний архів

Лекція №3. Архітектура сховищ даних ( 2 год.)

1. Архітектура сховищ даних.

2. Віртуальне сховище даних.

3. Архітектура сховища на основі семантичної інтеграції предметних областей.

4. Архітектура із системою управління запитами до предметних областей.

5. Монолітне сховище.

6. Стандартний архів.

Перелік питань до самостійної роботи

1. Архітектура із системою управління запитами до предметних областей.

2. Монолітне сховище.

3. Стандартний архів.

Література [1]- [9], [12]- [15]

змістовний МОДУЛЬ 2

Моделі сховищ даних та особливості їх проектування

Тема 4. Сховища даних на основі реляційних СУБД

Моделі сховищ даних. Багатовимірна модель. Операції у багатовимірній моделі СД. Недоліки багатовимірної моделі сховища даних. Реляційна модель сховища даних. Відмінності проектування сховищ даних від проектування баз даних

Лекція №4. Сховища даних на основі реляційних СУБД (4год.)

1. Моделі сховищ даних

1.1. Багатовимірна модель

Ø Операції у багатовимірній моделі сховища даних

Ø Недоліки багатовимірної моделі сховища даних

1.2. Реляційна модель сховища даних

2. Відмінності проектування сховищ даних від проектування баз даних

Перелік питань до самостійної роботи

1. Недоліки багатовимірної моделі сховища даних

Література [1]- [9], [12]- [15]

Тема 5. Концепція проектування багатовимірної моделі сховищ даних

Способи проектування сховищ даних. Підходи до проектування сховищ даних. Визначення основних елементів сховища даних (підходи до визначення основних елементів сховища даних, визначення та вимоги до змінних, визначення ступеня деталізації змінних, визначення та вимоги до вимірів, визначення та вимоги до фактів). Вимірне моделювання сховищ даних (співвідношення вимірів і показників). Визначення метаданих при проектуванні сховищ даних (Мотивації (мета) створення та розвитку сховища даних (навіщо?). Дії, які виконуються з даними при їх завантаженні (як?), Місце розташування даних (де?). Користувачі, які використовують сховище даних (хто?). Моменти завантаження та обчислення підсумкових даних (коли?). Сутності або наповнення сховища даних (що?).)

Лекція №5. Концепція проектування багатовимірної моделі сховищ даних ( 4год.)

1. Способи та підходи до проектування сховищ даних

Ø Способи проектування сховищ даних

Ø Підходи до проектування сховищ даних

2. Визначення основних елементів сховища даних

Ø Підходи до визначення основних елементів сховища даних

Ø Визначення та вимоги до змінних

Ø Визначення ступеня деталізації змінних

Ø Визначення та вимоги до вимірів

Ø Визначення та вимоги до фактів

3. Вимірне моделювання сховищ даних (співвідношення вимірів і показників)

4. Визначення метаданих при проектуванні сховищ даних

Ø Мотивації (мета) створення та розвитку сховища даних (навіщо?)

Ø Дії, які виконуються з даними при їх завантаженні (як?)

Ø Місце розташування даних (де?)

Ø Користувачі, які використовують сховище даних (хто?)

Ø Моменти завантаження та обчислення підсумкових даних (коли?)

Ø Сутності або наповнення сховища даних (що?).

Лабораторна робота №2.Автоматизація проектування сховищ даних в середовищі CASE-засобу ERwin на основі прототипу – системи "СД з автоматизації реалізації продукції" (4год.).

Перелік питань до самостійної роботи

1. Співвідношення вимірів і показників сховищ даних

2. Визначення метаданих при проектуванні сховища даних на прикладі "Індивідуального проекту"

Ø Мотивації (мета) створення та розвитку сховища даних (навіщо?)

Ø Дії, які виконуються з даними при їх завантаженні (як?)

Ø Місце розташування даних (де?)

Ø Користувачі, які використовують сховище даних (хто?)

Ø Моменти завантаження та обчислення підсумкових даних (коли?)

Ø Сутності або наповнення сховища даних (що?).

Література [1]- [9], [12]- [15]

Тема 6. Автоматизація проектування сховищ даних

Призначення CASE-засобів. CASE-технологія як методологія проектування і набір інструментальних засобів. Вимоги до організацій, які впроваджують CASE-засоби та вигоди від впровадження. Особливості застосування CASE-засобів. Склад CASE-засобів. Класифікація CASE-засобів. Особливості вимірного проектування сховищ даних за допомогою CASE-засобу ERwin.

Лекція №6.Автоматизація проектування сховищ даних ( 4 год.)

1. Призначення CASE-засобів.

2. CASE-технологія як методологія проектування і набір інструментальних засобів.

3. Вимоги до організацій, які впроваджують CASE-засоби та вигоди від впровадження.

4. Особливості застосування CASE-засобів.

5. Склад і класифікація CASE-засобів.

6. Особливості вимірного проектування сховищ даних за допомогою CASE-засобу ERwin.

Лабораторна робота №2.Автоматизація проектування сховищ даних в середовищі CASE-засобу ERwin на основі прототипу – системи "СД з автоматизації реалізації продукції" (4год.).

Лабораторна робота №3.Автоматизація проектування сховищ даних в середовищі CASE-засобу ERwin з розробки проекту СД "Індивідуальна система" на основі концептуальної моделі (8 год.).

Перелік питань до самостійної роботи

1. Вимоги до організацій, які впроваджують CASE-засоби та вигоди від впровадження.

2. Склад та класифікація CASE-засобів.

Література [1]- [9], [12]- [15]

МОДУЛЬ ІІ

змістовний МОДУЛЬ 3

Технології формування та використання сховищ даних

Тема 7. Технології формування сховищ даних

Технологія ETL (витяг, перетворення, завантаження) - базовий процес управління сховищами даних. Консолідація та трансформація даних. Технології і методи оцінки якості даних.

Лекція №7. Технології формування сховищ даних (2год.).

1. Технологія ETL (витяг, перетворення, завантаження) - базовий процес управління сховищами даних.

2. Консолідація та трансформація даних.

3. Технології і методи оцінки якості даних.

Перелік питань до самостійної роботи

1. Технології і методи оцінки якості даних.

Література [1]- [9], [12]- [15]

Тема 8. Технології інтеграції глобально розподілених багаторівневих інформаційних систем

Інтеграція корпоративних застосувань EAI (Enterprise Application Integration). Інтеграція корпоративної інформації EII (Enterprise Information Integration). Інтеграція метаданих.

Лекція №8. Технології інтеграції глобально розподілених багаторівневих інформаційних систем (4год.)

1. Глобально розподілені багаторівневі інформаційні системи

2. Інтеграція корпоративних застосувань EAI (Enterprise Application Integration).

3. Інтеграція корпоративної інформації EII (Enterprise Information Integration).

4. Інтеграція метаданих.

Перелік питань до самостійної роботи

1. Глобально розподілені багаторівневі інформаційні системи

Література [1]- [9], [12]- [15]

Тема 9. Інструментальні засоби та системи роботи зі сховищем даних

Засоби централізованого збору інформації від об’єктів господарської діяльності, її аналізу та розповсюдження - Adelite: ETL, "EXmile. Інтеграція зі сховищами даних". Використання MS SQL Server Analysis Services для побудови сховищ даних.

Лекція №9.Інструментальні засоби та системи роботи зі сховищем даних (2год.)

1. Засоби централізованого збору інформації від об’єктів господарської діяльності, її аналізу та розповсюдження (Adelite: ETL, "EXmile. Інтеграція зі сховищами даних").

2. Використання MS SQL Server Analysis Services для побудови сховищ даних.

Перелік питань до самостійної роботи

1. Використання MS SQL Server Analysis Services для побудови СД

Література [1]- [9], [12]- [15]

5.ЗМІСТ ЛАБОРАТОРНОГО ПРАКТИКУМУ „АВТОМАТИЗОВАНЕ ПРОЕКТУВАННЯ СХОВИЩА ДАНИХ”

Лабораторна робота №1(6 год.- 8 балів).

Тема роботи:Розробка концептуального проекту багатомірного сховища даних "Індивідуальна система" на основі індивідуального завдання [10].

Мета роботи: Виробити навики ескізного проектування багатомірного сховища даних для OLAP системи.

Завдання:

Розробити в паперовому варіанті ескізний проект сховища даних для OLAP системи за темою індивідуального завдання [7], як продовження дослідження обраної предметної області при виконанні лабораторних робіт в попередніх курсах.

Лабораторна робота №2(4 год. – 4 бали).

Тема роботи:Автоматизація проектування сховищ даних в середовищі CASE-засобу ERwin пакету AllFussion Modeling Suite на основі прототипу – системи "СД з автоматизації реалізації продукції".

Мета роботи: вивчити концепцію та функціональні можливості сучасних CASE-засобів для проектування сховищ даних на прикладі пакета ERwin пакету AllFussion Modeling Suite.

Завдання:

На прикладі задачі "Реалізація" ознайомитись з особливостями проектування сховищ даних у середовищі CASE-засобу ERwin пакету AllFussion Modeling Suite:

Ø запуск пакета;

Ø створення нової моделі сховища даних;

Ø створення сутностей та робота з моделлю;

Ø заповнення сутностей атрибутами;

Ø побудова зв'язків;

Ø встановлення параметрів таблиць сховища даних (особливості вкладки Dimensional, вибір типу правил маніпулювання даними);

Ø визначення метаданих (документування інформації про джерела даних, внесення додаткової інформації про методи);

Ø друк звіту.

Лабораторна робота № 3(6 год – 4 бали.)

Тема роботи: Проектування сховища даних у середовищі CASE-засобу ERwin пакету AllFussion Modeling Suite на основі ескізного проекту "Індивідуальна система".

Мета роботи: Виробити навики проектування сховища даних "Індивідуальна система" у середовищі CASE-засобу ERwin пакету AllFussion Modeling Suite.

Завдання:

Створити в ERwin новий проект сховища даних для OLAP системи за темою індивідуального завдання на основі ескізного проекту, розробленого в Лабораторній роботі №2 даного практикуму, шляхом виконання наступних етапів:

Ø запуск пакета;

Ø створення нової моделі сховища даних;

Ø створення сутностей та робота з моделлю;

Ø заповнення сутностей атрибутами;

Ø побудова зв'язків;

Ø встановлення параметрів таблиць сховища даних (особливості вкладки Dimensional, вибір типу правил маніпулювання даними);

Ø визначення метаданих (документування інформації про джерела даних, внесення додаткової інформації про методи);

Ø друк звіту.

Оформлення роботи

Оформлена робота повинна містити:

Ø теоретичні відомості про предмет дослідження;

Ø структуру об’єктів дослідження;

Ø екранні вікна проектів в програмних середовищах розробки;

Ø екранні вікна результатів реалізації проектів в програмних середовищах розробки;

Ø результати виконання кожного звіту за допомогою MS Word.

Захист роботи

Розроблений проект захистити і представити на іспит

7.ФОРМИ ТА ЗАСОБИ ПОТОЧНОГО ТА ПІДСУМКОВОГО КОНТРОЛЮ ЗНАНЬ СТУДЕНТІВ

Об‘єктивність оцінки знань студентів залежить від форм та засобів поточного й підсумкового контролю.

Форми проведення поточного контролю, їх періоди визначаються робочим планом викладача

Контроль засвоєння студентами дисципліни здійснюється в кілька етапів:

1. Контрольний захід після кожного залікового кредиту;

2. Підсумкова атестація з кожного модульного контролю;

3. Підсумкова атестація з формування сумарної модульної оцінки.

Програмний матеріал навчальної дисципліни поділяється на два модулі.

Перший модуль охоплює з 1 - 6 теми; другий – 7-12.

Оцінювання проводиться з урахуванням усіх видів навчального процесу:

- знань з теорії за відсутності практичної роботи по темі відбувається у вигляді письмового контрольного заходу на 10-15хв. під час лекції;

- знань, умінь і практичних навичок студента за результатами захисту звіту про виконання лабораторних робіт;

- індивідуальної роботи студента;

- самостійної роботи студента.

Контрольний захід проводиться у вигляді контрольної роботи в аудиторії за розкладом у кожній академічній групі окремо.

У випадку неявки студента на контрольний захід з поважних причин, підтверджених документально, викладач проводить контрольне опитування студента в усній формі під час чергової консультації.

Узагальнююче оцінювання знань, умінь і практичних навичок студента здійснюється за 100 бальною системою.

8.КРИТЕРІЇ ОЦІНКИ ЗНАНЬ

Критерії оцінки успішності повинні відповідати навчальній програмі й найбільш важливим вимогам до знань студентів:

1.Знання фактів, явищ. Правильне та науково достовірне їх пояснення.

2.Оволодіння науковими термінами, поняттями, законами, методами, правилами; навики користуватися ними при пояснені нових фактів, розв‘язуванні різних задач і виконанні практичних завдань.

3.Максимальна ясність, точність думки, навики відстоювати свої погляди.

4.Знання повинні мати практичну значимість.

Усні відповіді повинні бути повними, логічними, доведеними. Письмові відповіді повинні бути виконані з точним дотриманням методичних вказівок, інструкцій, акуратно оформлені.

Перевіряючи відповіді, викладач оцінює рівень знань з кожного питання.

Оцінювання проводиться з урахуванням всіх видів навчального процесу: знань, умінь і практичних навичок студента за результатами захисту звіту в залежності від її складності про виконання

1. Лабораторні роботи - 32 (4, 4, 4, 4, 8, 4, 4)балів.

2. Індивідуальні роботи - 12 (4, 4, 4) балів.

3. Клнтрольна робота - 6 балів.

Якщо захист лабораторних робіт виконується у встановлені терміни, то в цьому випадку реалізація роботи на ПЕОМ представляється у вигляді машинних документів і захищається в класі обчислювального центру університету без представлення друкованого звіту.

За власним бажанням студента, а також при порушенні графіка виконання та захисту лабораторних робіт студент обов'язково повинен надати друкований звіт.

Умови переведення даних 100-бальиої шкали оцінювання

у 5 - бальну та шкалу ECTS*

Переведення даних 100-бальної шкали оцінювання в 5 - бальну та шкалу за системою

ECTS здійснюється в такому порядку **:

Оцінка за шкалою ECTS Оцінка за бальною шкалою Оцінка за розширеною шкалою Еквівалент оцінки за п'ятибальною шкалою
А 90 -100 відмінно
В 80 - 89 дуже добре 4,5
С 65 -79 добре
D 55 - 64 задовільно 3,5
Е 50 -54 достатньо
FX 35 - 49 незадовільно
F 1 - 34 неприйнятно

У разі отримання оцінки "Незадовільно" студент має право на два перескладання:

викладачу та комісії.

Замість перескладання комісії студент може вибрати:

Ø повторне вивчення дисципліни;

Ø проходження практики;

Ø виконання курсової роботи понад обсяги встановлені навчальним планом в наступному навчальному періоді.

У разі отримання оцінки "Неприйнятно" студент зобов'язаний:

Ø вивчити навчальну дисципліну;

Ø пройти практику;

Ø виконати курсову роботу понад обсяги встановлені навчальним планом за рахунок власного часу в наступному навчальному періоді.

9.Розподіл балів при рейтинговій системі

10.КОНТРОЛЬНІ ПИТАННЯ З ДИСЦИПЛІНИ

Перелік питань до 1-го модуля

Тема 1. Характеристика OLTP і OLAP систем. Поняття та передумови створення сховищ даних.

1. Характеристика трансакційних (OLTP)систем.

2. Характеристика аналітичних (OLAP) систем.

3. Поняття сховищ даних.

4. Передумови створення сховищ даних.

5. Порівняльні характеристики трансакційних та аналітичних систем.

Наши рекомендации