Структура программных средств ИАС
· Средства сбора и доработки данных, создания и поддержки информационного хранилища.
· Средства управления и администрирования информационно-аналитической системы, репозиторий.
· Средства оперативного анализа
· Средства визуального конструирования запросов и отчетов
· Средства интеллектуального анализа
· Средства формирования отчетов (графика, мультимедиа)
· Средства моделирования и разработки приложений
· Средства удаленного доступа, обеспечения режимов корпоративной базы данных
Все эти средства можно более обще представить в виде четырех групп:
1. Средства сбора и доработки данных
2. Средства преобразования данных
3. Средства оперативного (OLAP) анализа
4. Средства интеллектуального анализа данных
Средства сбора и доработки данных
Сбор данных из различных источников сопряжен с тем, что информация в них формируется в различных форматах, имеет разнообразную структуру. В информационном хранилище и в системах поддержки принятия решений или в витринах данных информация должна быть приведена к определенной в ИХ структуре и форматам витрин данных.
Инструменты ИАС различного вида имеют в своем составе средства сбора данных из источников, созданных на различных аппаратных платформах: Intel, RISC, AS/400 и работающих во многих вариантах операционных сред, в том числе: в различных версиях Windows, Unix, Linux и т.д. Обеспечивается совместная работа со многими СУБД, как то: Access, Fox Pro, MS SQL-Server, Oracle, и т.д. Мощные средства ИАС насчитывают до 50-ти типов форматов, с которыми может взаимодействовать система.
Средства преобразования данных
Ввиду чрезвычайно высокой значимости информации, используемой для анализа, которая повышается после выполнения аналитических работ, обязательна процедура предварительной очистки данных. Производится обеспечение и проверка достоверности различными аппаратно-программными средствами и многими способами, в том числе: обратная проверка, контрольное суммирование, помехозащитное кодирование, семантический контроль и т. д.
Помимо этого производится логическая обработка данных в виде отбраковки нехарактерных для данного набора значений разного рода показателей. В этом случае используются средства статистической обработки данных и другие методы.
Средства оперативного (OLAP) анализа
Оперативный анализ — это функция ИАС, обеспечивающая быстрый, в соответствии с правилами FASMI(Fast Analysis of Shared Multidimensional Information - Быстрый Анализ Разделяемой Многомерной Информации), доступ к любой необходимой информации, содержащейся в информационном хранилище или, точнее в факт-таблице, представляемой также в виде многомерного куба (на практике трехмерных комбинаций кубов). Извлечение информации, как правило, сопровождается обработкой ее по несложным алгоритмам, как то: производится суммаризация, определение процентов от заданных величин, получение относительных показателей, вычисление величин с заданными коэффициентами и другие действия над данными на разных уровнях детализации. Анализ производится с данными, представленными в виде электронных таблиц, над которыми предоставляется возможность оперативно производить различные более сложные вычисления.
Средства интеллектуального анализа данных
Это наиболее сложная, интеллектуально насыщенная часть информационно-аналитических систем, что служит причиной наличия соответствующего модуля лишь в составе наиболее развитых систем. К тому же состав задач, выполняемых модулями такого назначения, зависит от уровня развития системы.
Интеллектуальный анализ чаще реализуется автономными программными системами в связи со сложностью выполняемых задач.
Основными задачами интеллектуального анализа являются:
− выявление взаимозависимостей, причинно-следственных связей, ассоциаций и аналогий,
определение значений факторов времени, локализация событий или явлений по месту;
− классификация событий и ситуаций, определение профилей различных факторов;
− прогнозирование хода процессов, событий.
Для обработки накопленных в различных источниках и местах сбора и хранения данных и выполнения интеллектуального анализа используются все достижения математической науки и информационных технологий. В первую очередь используются методы линейной алгебры, классического математического анализа, дискретной математики, многомерного статистического анализа.
К специфическим методам интеллектуального анализа относятся:
— методы нечеткой логики;
— системы рассуждений на основе аналогичных случаев;
— классификационные и регрессионные деревья решений;
— нейронные сети;
— генетические алгоритмы;
— байесовское обучение (ассоциации);
— кластеризация и классификация;
— эволюционное программирование;
— алгоритмы ограниченного перебора.