Сценарий цикла лабораторных работ
В данном цикле лабораторных работ будет использован образец информационных баз компании Microsoft, который описывает вымышленную компанию Adventure Works Cycles. Это производственная компания, производящая и реализующая металлические и композитные велосипеды для рынков Северной Америки, Европы и Азии. Компания Adventure Works Cycles имеет в своем составе несколько групп сбыта на региональных рынках.
По окончанию успешного финансового года Adventure Works Cycles хочет расширить свое присутствие на рынке путем направленной рекламы для своих лучших клиентов, повысить доступность продукта при помощи внешнего веб-узла и уменьшить стоимость продаж за счет снижения стоимости производства.
Для поддержки нужд анализа данных групп маркетинга и сбыта, а также высшего руководства компания использует данные о транзакциях из базы данных AdventureWorks и другие сведения, например целевые показатели объема продаж из электронных таблиц, и объединяет эту информацию в реляционном хранилище данных AdventureWorks. Однако использование реляционного хранилища данных влечет следующие проблемы:
- Отчеты статичны. Пользователи не могут интерактивно просматривать данные отчетов для получения более подробной информации так, как это делается в сводной таблице в редакторе Microsoft Office Excel. Хотя существующий набор предопределенных отчетов достаточен для многих пользователей, более квалифицированным пользователям потребуется прямой доступ к запросам базы данных для выполнения интерактивных запросов и создания специализированных отчетов. Однако из-за сложности базы данных AdventureWorksDW2008 таким пользователям потребуется много времени, чтобы освоить создание эффективных запросов.
- Скорость выполнения запросов меняется в широком диапазоне. Например, некоторые запросы возвращают результаты очень быстро, через считанные секунды, для выполнения других запросов требуется несколько минут.
- Таблицами статистических вычислений сложно управлять. Для сокращения времени обработки запросов команда разработчиков по хранилищам данных компании Adventure Works составила несколько таблиц статистических вычислений в базе данных AdventureWorks DW2008. Например, они создали таблицу, суммирующую продажи за месяц. Однако хотя такие таблицы существенно ускорили выполнение запросов, инфраструктура, поддерживающая эти таблицы, хрупка и подвержена ошибкам.
- Комплексная логика вычислений скрыта в определениях отчетов и сложна в передаче между отчетами. Так как бизнес-логика формируется отдельно для каждого отчета, данные сводки иногда различаются для разных отчетов. Поэтому руководство не слишком доверяет отчетам хранилища данных.
- Пользователи различных подразделений компании заинтересованы в различных представлениях данных. Пользователей отдельной группы приводят в замешательство и отвлекают элементы данных, не относящиеся к их группе.
- Логика вычислений особенно сложна для пользователей, которым требуются специализированные отчеты. Так как данные пользователи должны определять логику вычислений отдельно для каждого отчета, централизованного контроля за логикой вычислений нет. Например, некоторые пользователи знают, что им следовало бы использовать базовые статистические методы, такие как скользящее среднее, однако они не знают, как построить такие вычисления, и поэтому не используют эти методы.
- Трудно сочетать связанные наборы данных. Специализированные запросы, сочетающие два набора связанных данных, такие как продажи и квоты продаж, пользователям построить непросто. Такие запросы перегружают базу данных, поэтому компания потребовала от пользователей запросить у команды разработчиков хранилища данных межпредметные наборы данных. В результате создано лишь небольшое количество предопределенных отчетов, сочетающих данные из нескольких предметных областей. Пользователи неохотно модифицируют эти отчеты из-за их сложности.
- Отчеты сконцентрированы в основном на деловых сведениях в Соединенных Штатах. Пользователи из остальных стран недовольны этим и хотят иметь возможность просматривать отчеты в разных денежных единицах и на разных языках.
- Сведения сложны для аудита. Финансовый отдел в данное время использует базу данных AdventureWorks DW2008 только как источник данных для массовых запросов. Затем данные загружаются в отдельные электронные таблицы, что приводит к большим затратам времени на подготовку данных и на управление таблицами. Таким образом, корпоративные финансовые отчеты трудно готовить, проверять и управлять ими.
Команда разработчиков хранилища данных недавно провела исследование структуры текущей системы аналитики. Исследование включало анализ просчетов прогнозирования текущих проблем и будущих требований. Команда разработчиков хранилища данных определила, что база данных AdventureWorks DW2008 — это многомерная база данных с согласованными измерениями и суррогатными ключами. Согласованные измерения позволяют использовать измерение, например измерение времени или измерение продукта, в нескольких витринах данных. Суррогатные ключи — это искусственные ключи, связывающие измерения и таблицы фактов, они используются для обеспечения уникальности и повышения производительности. Кроме того, команда разработчиков хранилища данных определила, что в данный момент нет никаких значительных проблем с загрузкой и управлением базовыми таблицами в базе данных AdventureWorks DW2008. Поэтому было решено с использованием базы данных служб SSAS выполнить следующие задачи:
- предоставить унифицированный доступ к данным через общий слой метаданных для анализа и отчетов;
- упростить просмотр данных пользователями, ускорив разработку интерактивных и предопределенных запросов, а также предопределенных отчетов;
- правильно составлять запросы, сочетающие данные из нескольких предметных областей;
- управлять статистическими вычислениями;
- хранить и повторно использовать сложные вычисления;
- предоставлять возможность локализации пользователям за пределами Соединенных Штатов.
Практические задания
Первая лабораторная работа посвящена процессу развертывания инфраструктуры, которая будет использоваться в дальнейшем. Рассмотрим процесс базовой установки русской версии SQL Server 2008 Enterprise в операционной системе MS Windows XP Professional. На первом этапе программа-установщик проверяет наличие в системе установленных .NET Framework 3.5 и Microsoft Windows Installer 4.5 и при их отсутствии предлагает скачать их дистрибутивы с сайта Microsoft и установить их. Эту процедуру можно выполнить самостоятельно заранее, до установки SQL Server 2008.
Далее производится проверка конфигурации операционной системы на предмет возможности установки SQL Server (Рисунок 22). Например, проверяется, не является ли компьютер, на который устанавливается SQL Server 2008, контроллером домена.
Рисунок 36. Проверка конфигурации операционной системы на предмет возможности установки SQL Server
Далее осуществляется выбор компонентов SQL Server 2008, подлежащих установке (Рисунок 23).
Для выполнения данного цикла лабораторных работ потребуется установка следующих компонентов:
- службы компонента Database Engine;
- полнотекстовый поиск – потребуется в дальнейшем для установки демонстрационной базы данных AdventureWorksDW2008;
- службы Analysis Services;
- среда Business Intelligence Development Studio;
- службы Integration Services;
- электронная документация по SQL Server;
- средства управления – основные (подкомпонент Средства управления – полный набор);
Рисунок 37. Выбор устанавливаемых компонентов SQL Server 2008
Следующий этап работы мастера установки заключается в выборе названия устанавливаемого экземпляра SQL Server 2008 и каталога на жестком диске, куда он будет установлен (Рисунок 24).
По умолчанию предлагается название экземпляра MSSQLSERVER и каталог для установки C:\Program Files\Microsoft SQL Server.
Рисунок 38. Выбор названия экземпляра и каталога для установки
Далее производится проверка наличия на выбранном жестком диске требуемого для установки выбранных компонентов свободного места (Рисунок 25).
Рисунок 39. Проверка наличия свободного места
На следующем этапе необходимо указать, от имени каких учетных записей будут работать службы SQL Server, а также режим их запуска – ручной или автоматический (Рисунок 26). Для службы SQL Server Analysis Services укажем учетную запись NT LOCAL AUTHORITY\NETWORK SERVICE.
Рисунок 40. Указание учетных записей для служб SQL Server
Далее производится выбор режима безопасности для компонента Database Engine (Рисунок 26).
Рисунок 41. Выбор режима безопасности для Database Engine
Возможны два варианта – режим проверки пользователей Windows и смешанный, при котором помимо пользователей Windows могут использоваться учетные записи пользователей SQL Server. Выберем второй вариант, и назначим для встроенной учетной записи системного администратора SQL Server пароль. Кроме того, добавьте текущего пользователя в группу администраторов SQL Server, нажав кнопку «Добавить текущего пользователя» (Рисунок 28).
Рисунок 42. Задание пароля для пользователя sa и добавление текущего пользователя в группу администраторов SQL Server
Далее на закладке FILESTREAM (Рисунок 33) следует установить флажки «Разрешить FILESTREAM при доступе через Transact-SQL» и «Разрешить FILESTREAM при потоковом доступе файлового ввода-вывода». Использование технологии FILESTREAM потребуется в дальнейшем при установке демонстрационных баз данных.
Рисунок 43. Закладка FILESTREAM
Далее необходимо выбрать пользователей, которые будут иметь административные полномочия для служб Analysis Services (Рисунок 29). В данной лабораторной работе следует нажать кнопку «Добавить текущего пользователя».
Рисунок 44. Выбор пользователей с административными полномочиями для служб Analysis Services
Следующим этапом установки является настройка режима работы службы Reporting Service (Рисунок 34). Необходимо выбрать вариант «Установить конфигурацию для работы в собственном режиме».
Рисунок 45. Настройка режима работы служб Reporting Services
На следующем этапе работы мастера производится выбор сведений об ошибках и об использовании компонентов SQL Server, которые будут отправляться в компанию Microsoft в ходе эксплуатации устанавливаемого экземпляра SQL Server (Рисунок 30).
Рисунок 46. Выбор сведений, автоматически отправляемых в компанию Microsoft
Далее программа установки проверяет, выполняются ли правила, предусмотренные разработчиками. Их выполнение позволяет гарантировать, что процесс установки завершится успешно. В случае возникновения несоответствий пользователю будет выдано соответствующее сообщение (Рисунок 31).
Рисунок 47. Проверка правил перед установкой
После проверки правил формируется файл конфигурации установки и пользователю показывается его содержимое, для того, чтобы он имел возможность проверить правильность указанных им параметров (Рисунок 32).
Рисунок 48. Перечень параметров установки
Далее происходит выполнение процесса установки (Рисунок 33), по завершении которого пользователю выдается сообщение об его успешном завершении (Рисунок 34).
Рисунок 49. Процесс установки SQL Server 2008
Рисунок 50. Сообщение об успешном завершении процесса установки
Для последующей установки демонстрационных баз данных необходимо убедится, что для экземпляра SQL Server, для которого будет производиться установка, разрешено использование технологии FILESTREAM. Для этого следует запустить Диспетчер конфигурации SQL Server при помощи Пуск | Все программы | Средства настройки | Диспетчер конфигурации SQL Server (Рисунок 35).
Рисунок 51. Диспетчер конфигурации SQL Server
В диспетчере конфигурации следует выбрать службу SQL Server и в ее контекстном меню выбрать пункт «Свойства». На закладке «FILESTREAM» открывшегося диалогового окна необходимо проверить, установлены ли флажки «Разрешить FILESTREAM при доступе через Transact-SQL» и «Разрешить FILESTREAM при потоковом доступе файлового ввода-вывода» (Рисунок 36).
Рисунок 52. Закладка FILESTREAM диалогового окна свойств экземпляра SQL Server
Далее следует провести установку тестовой базы данных AdventureWorksDW2008, входящей в комплект демонстрационных баз AdventureWorks, которая будет использоваться в дальнейшем в качестве источника данных для создаваемого ХД. Установка выполняется при помощи мастера установки (Рисунок 35).
Рисунок 53. Мастер установки баз данных AdventureWorks
На первом этапе работы мастера следует принять лицензионное соглашение (Рисунок 36).
Рисунок 54. Лицензионное соглашение
Далее следует выбрать устанавливаемые компоненты (Рисунок 37). Вариант «по умолчанию» является подходящим для данной лабораторной работы.
Рисунок 55. Устанавливаемые компоненты
Выбор экземпляра SQL Server, в котором будут установлены БД AdventureWorks, осуществляется при помощи раскрывающегося списка (Рисунок 38).
Рисунок 56. Выбор экземпляра SQL Server
После нажатия кнопки «Install» (Рисунок 39) начнется копирование файлов и установка баз данных в выбранном экземпляре SQL Server (Рисунок 40).
Рисунок 57. Мастер готов к установке
Рисунок 58. Процесс копирования файлов и установки БД
Аналогичным образом производится процесс установки образцов файлов для служб SSIS, которые будут использованы в лабораторной работе № 11. Установка выполняется при помощи мастера (Рисунок 51).
Рисунок 59. Мастер установки Integration Services Samples
Необходимо принять лицензионное соглашение (Рисунок 52).
Рисунок 60. Лицензионное соглашение
Далее следует выбрать устанавливаемые компоненты (Рисунок 53). Необходимым является компонент Sample Files. Остальные компоненты – опционально.
Рисунок 61. Выбор устанавливаемых компонентов
После выбора компонентов мастер уведомляет о готовности к установке (Рисунок 54).
Рисунок 62. Мастер готов к установке
После копирования требуемых файлов установка завершена (Рисунок 55).
Рисунок 63. Сообщение об успешном завершении установки
Контрольные вопросы
- Опишите назначение служб Analysis Services.
- Какие инструментальные средства используются для создания, управления и работы с OLAP-кубами?
- Каким образом устанавливаются службы Analysis Services?
- Какие требования к файловой системе, программному и аппаратному обеспечению предъявляет MS SQL Server 2008?
- Какие существуют редакции SQL Server 2008?
- В каких редакциях SQL Server 2008 предусмотрена возможность работы с хранилищами данных? В чем заключается отличие между этими версиями с точки зрения функционала при работе с хранилищами данных?