Типичные аналитические технологии
Руководители организаций, которые планируют стать аналитическими конкурентами, должны быть знакомы с ключевыми категориями аналитических программ.
Электронные таблицы – такие как Microsoft Excel – наиболее распространённые аналитические инструменты, так как ими легко пользоваться и они отражают мыслительные модели пользователей. Менеджеры и аналитики используют их на «последнем километре» аналитики – на этапе, предшествующем презентации данных в отчёте или графической форме для лиц, принимающих решения. Но слишком многие пользователи пытаются применять таблицы при решении задач, для которых те мало пригодны, что ведёт к ошибкам или неверным выводам. Даже когда ими пользуются правильно, они весьма подвержены человеческим ошибкам; более 20% таблиц содержат ошибки, причина которых – человек, и не менее 5% всех вычисляемых ячеек оказываются неверными. Чтобы свести такие огрехи к минимуму, менеджеры должны настаивать на том, чтобы анализ начинался с точных, проверенных данных и чтобы составители таблиц обладали достаточными навыками и опытом для разработки моделей.
Программы оперативной аналитической обработки данных обычно известны как OLAP (online analytical processors) и используются для слабоструктурированных решений и видов анализа. Хотя для транзакционных систем реляционные базы (или RDBMS) –- где данные хранятся в связанных друг с другом таблицах – являются высокоэффективным способом организации данных, их полезность невысока в случае с анализом массивов данных (организованных в ячейки наподобие крупноформатной таблицы), например временных рядов. Средства OLAP специально придуманы для многомерных задач, подразумевающих обработку массивов данных. Они организуют данные в «кубы» для анализа данных по параметрам времени, географии, товарной линейки и так далее. Кубы данных – это просто собрания данных в три и более переменные, готовые для отчётности и анализа. Их можно сравнить с многомерными крупноформатными таблицами. В то время как у таблиц типа Excel не более трёх измерений – вертикаль, горизонталь и рабочие листы, – у моделей OLAP их семь и более. Таким образом, для их составления требуются специальные навыки, хотя этим могут заняться и опытные пользователи, знакомые с их возможностями. В отличие от традиционных таблиц, средства OLAP призваны решать проблему обилия данных – в противном случае модели быстро становятся слишком громоздкими. Считается, что для комплексных запросов средства OLAP выдают ответ примерно за 0,1% времени, которое было бы затрачено на обработку того же запроса с использованием реляционных данных.
Статистические или количественные алгоритмы позволяют статистикам и менеджерам, обладающим соответствующими знаниями, анализировать данные. Алгоритмы обрабатывают количественные данные с целью прийти к какому-то оптимальному числу – допустим, речь идёт о цене товара или услуги или величине кредита. В 1970-х годах такие компании, как SAS, вывели на рынок пакеты программных приложений, сделавших статистику гораздо доступнее. Кроме того, статистические алгоритмы лежат в основе прогнозного моделирования.
Движки правил обрабатывают набор бизнес-правил, которые с помощью условных предложений передают логические вопросы – к примеру, «если желающий застраховать мотоцикл – мужчина моложе 25 лет, не имеющий собственного жилья и высшего образования, ему следует отказать». Движки правил могут быть частью более крупного компьютерного приложения или предоставлять рекомендации пользователям, которым нужно принять решение определённого типа.
Средства интеллектуального анализа данных (data mining) базируются на различных техниках - от простого арифметического вычисления до искусственного интеллекта, статистики, деревьев принятия решений, нейронных и байесовских сетей. Их задача - выявлять закономерности в сложносо-ставных и неопределённых группах данных. К примеру, Sprint применяет нейронную аналитическую технологию для того, чтобы предсказывать, какие клиенты с наибольшей вероятностью сменят мобильного оператора, оставив за собой текущие телефонные номера. SAS предлагает возможности углублённого анализа, как данных, так и неструктурированной текстовой информации, и является ведущим поставщиком таких программ.
Средства анализа текстовых данных помогают менеджерам быстро выявить возникающие тенденции почти в реальном времени. Самый простой пример – поисковые агенты, или «пауки», которые находят и считают слова и фразы на сайтах. Средства поиска текстовой информации могут оказаться бесценными, когда нужно выяснить, какие зарождаются тенденции или отношения. Например, путём мониторинга блогов пользователей-«технарей» поставщик программного обеспечения может выяснить, что в его новой программе есть дефект, в считанные часы после выпуска новой версии ПО, вместо того чтобы сидеть и ждать, пока начнут поступать жалобы от клиентов. Другие продукты такого рода способны распознавать ссылки на людей, географические названия, предметы или темы и использовать эту информацию для составления заключений о поведении конкурентов.
Симуляционные инструменты моделируют бизнес-процессы с помощью комплекса символических, математических, научных, инженерных и финансовых функций. Подобно тому, как системами автоматизированного проектирования (computer-aided design, CAD) пользуются инженеры для моделирования нового продукта, симуляционные программы применяются в инженерии, НИОКР и в других самых разнообразных сферах. Например, симуляции можно использовать как тренажёры для того, чтобы помочь пользователям понять вероятные последствия того или иного изменения, вносимого в бизнес-процесс. Кроме того, они помогают рационализировать поток информации или продуктов. Скажем, работники здравоохранительных учреждений получают возможность решать, куда отправлять донорские органы, соответствующие определённым критериям – таким как группа крови или географическое происхождение/местоположение.