Принципы организации хранилища
1. Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.
2. Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса.
3. Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются.
4. Зависимость от времени. Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.
Классификация:
· Финансовые Хранилища данных. В большинстве случаев финансовые Хранилища данных- это Хранилища, которые организации строят в первую очередь. Создание финансового Хранилища - очень привлекательное решение, поскольку: Финансовые данные ВСЕГДА находятся в центре, \"мозге\", организации. Поэтому привлечь внимание к хорошо построенному финансовому Хранилищу данных очень легко. В большинстве организаций (но не во всех) финансовые данные представляют самые маленькие объемы данных из имеющихся. Финансы охватывают все аспекты функционирования корпорации и имеют один общий знаменатель - деньги. Финансовые данные по своей природе имеют структуру, на которую напрямую влияет повседневная практика обработки финансовой информации, и так далее. По этим причинам финансы становятся предпочтительной областью построения корпоративного Хранилища данных.
· Хранилища данных в области страхования за некоторыми небольшими исключениями похожи на другие Хранилища. Первое исключение (и это особенно справедливо в отношении страхования жизни) заключается в том, что продолжительность существования имеющихся Хранилищ очень велика. Такие Хранилища содержат данные, которые являются старыми, очень старыми. В этом случае вполне разумно обращаться к данным начала столетия - к началу XX века. Причина, по которой страховые компании вынуждены интересоваться столь \"древней историй\", - актуарная обработка данных. Практически для каждого дела приводится довод, что деятельность, которой организация занималась в 1950 году, практически не связана с сегодняшним занятием. И часто этот довод звучит правдоподобно. Второе отличие этих Хранилищ определяется датами, которые хранятся в этом бизнесе. Среда страхования - по каким бы то ни было причинам - отличается наличием огромного числа дат, связанных с бизнесом, чем какой-либо другой вид деятельности. Третье отличие заключается в том, что эти Хранилища данных используют свой рабочий цикл деловой активности. Большинство организаций имеет весьма ограниченный и короткий экономический цикл. Так, в банках это обналичивание чека. В торговле - покупка изделия. В телефонной компании - звонок. Однако, в страховании им может быть заявка на страховое возмещение, которая может быть удовлетворена спустя пять лет. Или закрытие полиса может сопровождаться двухмесячной отсрочкой. Резюмируя, можно сказать, что скорость, с которой функционирует страхование, отличается от скорости, характерной для других отраслей.
· Хранилища данных для управления людскими ресурсами имеют весьма существенные отличия от других Хранилищ. Первое отличие - число предметных областей. Такое Хранилище данных неизбежно имеет одну важную предметную область - это работник. Практически все остальное подчинено этой области или занимает второстепенное положение. Большинство же других Хранилищ данных имеют несколько базовых предметных областей. Однако, основное отличие Хранилищ данных для управления людскими ресурсами состоит в том, что такие Хранилища вообще-то используют очень мало транзакций. Так, имеется дата, когда субъект становится работником. Дата, когда человек увольняется. Годовые прибавки и повышения. Но, кроме транзакций фонда заработной платы и прочих редких, сгенерированных работником, транзакций, в таком Хранилище практически больше ничего и нет.
· Глобальные Хранилища данных предназначены для глобального представления корпорации. Различают три типа таких Хранилищ: Географически превалирующая обработка данных. Например, необходимо интегрировать бизнес в Гонконге с бизнесом в Париже, который в свою очередь следует интегрировать с Рио-де-Жанейро, а тот - с Нью-Йорком. Функционально превалирующая обработка данных. Производственная деятельность должна быть интегрирована с поставками, которые необходимо интегрировать с продажами, а те - с исследованиями и так далее. Отраслевая превалирующая обработка данных. Например, требуется интегрировать печатное дело с консалтингом, который подлежит интеграции с бизнесом в сфере медицинского оборудования, а тот со специализацией в области программного обеспечения.
· Хранилища данных с возможностями Data Mining/Data Mining и Exploration. Хранилища данных, поддерживающие технологию Data Mining и Exploration (методы \"добычи\" и исследования данных), являются гибридом классических Хранилищ. Такие Хранилища используются для выполнения мощной статистической обработки данных. Эти Хранилища являются: очень детальными, глубоко историческими, оптимизированными для статистического анализа.
· Хранилища данных в области телекоммуникаций. Отличительная особенность этих Хранилищ состоит в том, что они в значительной степени определяются данными, сгенерированными в деталях на уровне звонка. Разумеется, в отрасли телекоммуникации присутствует множество других типов данных. Но ни одна другая область Хранилищ данных не предопределяется в такой степени размером одной предметной области - деталями на уровне звонка. Существуют много способов хранения деталей на уровне звонка: хранение деталей на уровне звонка только за несколько месяцев; хранение множества деталей на уровне звонка, размещенных на различных носителях; резюмирование или агрегирование деталей на уровне звонка; хранение только отобранных деталей на уровне звонка, и так далее. К сожалению, несмотря на разнообразие методов обработки, для данного Хранилища данных обработка может быть выполнена только над деталями на уровне звонка. А работа на итоговом или агрегированном уровне просто невозможна