От переработки данных к анализу

Естественно, что не все нужные данные присутствуют в ИС в "чистом" виде. Полезную информацию приходится вылавливать из большого количества дополнительных данных, и этот процесс называется извлечением данных (Data Mining - DM).

Полезная информация может быть спрятана очень глубоко; ИС извлекает правдоподобные данные, но они могут не отражать ее суть, может возникнуть опасность получения смещенных оценок (Biased Estimator), когда выявляется не совсем тот фактор, который влиял на исследуемый объект или систему. Информация практически всегда бывает "зашумлена", при этом часто амплитуда полезного сигнала сравнима с амплитудами побочных явлений. Реальную информацию в такой ситуации извлечь трудно, и это может привести к ошибочным оценкам и прогнозам.

Пользователи могут получать полноценную отдачу от информации только в том случае, если эта информация точна, полна, из нее несложно извлекать знания. Информация из хранилищ и витрин данных может быть объединена с информацией из неструктурированных источников, с последующим предоставлением доступа к ней различным группам пользователей, причем каждая из подобных групп может иметь свои ожидания относительно того, каким образом им должна быть предоставлена информация.

Некоторые руководители просто хотят, чтобы отчеты предоставлялись каждое утро, другим требуется иметь перед собой инструментальную панель руководителя, отображающую критически важные бизнес-показатели. Кто-то из менеджеров хочет выполнять усложненные запросы с иерархической детализацией данных или же делать срезы и манипулировать своими данными.

Знания имеют небольшую ценность, если они не являются руководством к действию или не намечаются к использованию в бизнес-процессах! Пользователи нуждаются в таком представлении информации, которое бы соответствовало их уникальным бизнес-процессам. На рынке предлагается много программных продуктов для решения разнообразных общих и частных проблем. Среди них:

  • системы генерации отчетов для формального представления информации (например, программный продукт Crystal Reports компании Crystal Decisions, предназначенный для создания корпоративной отчетности);
  • аналитические системы для сложного динамического анализа данных ;
  • системы генерации персональных запросов, анализа и создания отчетов для индивидуальных пользователей, имеющих разнообразные потребности по представлению и анализу информации;
  • решения по разработке КИС-приложений (Enterprise Information System Applications - EISA), предназначенные для создания инструментальных панелейруководителя и аналитических приложений для добычи данных.

В самом общем виде задачи менеджмента можно свести к пяти ключевым вопросам:

  • Где мы находимся?
  • Чего мы хотим достичь?
  • Как мы туда попадем?
  • Сколько времени и ресурсов на это потребуется?
  • Сколько это будет стоить?

Для сложных систем характерно то, что управлять ими приходится, как правило, в условиях неполной информации, отсутствия знания закономерностей функционирования и постоянного изменения внешних факторов. Поэтому процессы управления и принятия решений имеют итерационный характер. После принятия решения и применения управляющего воздействия необходимо вновь оценить состояние, в котором находится система, и решить вопрос о том, правильно ли мы движемся по намеченному пути. Если отклонения нас не удовлетворяют, то необходимо переопределить наборы данных, скорректировать решение и "перезапустить" процесс управления.

Современные информационные технологии при поиске ответов на поставленные вопросы позволяют аналитику формулировать и решать задачи нижеследующих классов.

Аналитические - вычисление заданных показателей и статистических характеристик бизнес-деятельности на основе ретроспективной информации из баз данных.

Визуализация данных - наглядное графическое и табличное представление имеющейся информации.

Извлечение (добыча) знаний (Data Mining) - определение взаимосвязей и взаимозависимостей бизнес-процессов на основе существующей информации. К данному классу можно отнести задачи проверки статистических гипотез, кластеризации, нахождения ассоциаций и временных шаблонов. Например, путем анализа экономических и финансовых показателей деятельности компаний, которые затем обанкротились, банк может выявить некоторые стереотипы, которые можно будет учесть при оценке степени риска кредитования.

Имитационные - проведение на ЭВМ экспериментов с формализованными (математическими) моделями, описывающими поведение сложных систем в течение заданного или формируемого интервала времени. Задачи этого класса применяются для анализа возможных последствий принятия того или иного управленческого решения (анализ "что, если?..." ).

Синтез управления - используется для определения допустимых управляющих воздействий, обеспечивающих достижение заданной цели. Задачи этого типа применяются для оценки достижимости намеченных целей, определения множества возможных управляющих воздействий, приводящих к нужному результату.

Оптимизационные - основаны на интеграции имитационных, управленческих, оптимизационных и статистических методов моделирования и прогнозирования. Вместе с постановкой задачи синтеза управления позволяют выбрать на множестве возможных управлений те из них, которые обеспечивают наиболее эффективное (с точки зрения определенного критерия) продвижение к поставленной цели.

От переработки данных к анализу - student2.ru


увеличить изображение
Рис. 6.6. Категории ИС для обработки различных типов данных

В настоящее время существуют определенные категории информационных систем (или соответствующие модули интегрированных ИС), которые обслуживают каждый организационный уровень и помогают успешно решать указанные выше классы задач с обработкой соответствующего типа данных (рис. 6.6 и 6.7).

От переработки данных к анализу - student2.ru


Рис. 6.7. Категории ИС, поддерживающие различные типы решений

Современная компания с разветвленным бизнесом, как правило, имеет:

Наши рекомендации