Краткое описание системы STATISTICA
STATISTICA - это универсальная компьютерная интегрированная система, предназначенная для статистического анализа и визуализации данных, а также разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике и бизнесе. Отличительной чертой системы STATISTICA является то, что в ней реализован так называемый графически-ориентированный подход к анализу данных. Смысл подхода состоит в том, чтобы получать всестороннее визуальное представление данных на всех эта-
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
пах статистической обработки и на основе этого представления выбирать следующий шаг анализа. Детальное рассмотрение примеров поможет читателю овладеть основными приемами работы в этой системе и успешно использовать ее в своей инженерной практике. Среди возможностей пакета отметим те задачи, с решением которых приходится сталкиваться в своей практической деятельности инженеру-металлургу: описательные статистики, анализ многомерных таблиц, подгонка распределений, многомерная регрессия, нелинейная регрессия, дисперсионный и ковариационный анализ. Для отображения результатов статистической обработки используются разнообразные графики: гистограммы, диаграммы рассеяния, круговые диаграммы, вероятностные графики, графики поверхностей и многие другие.
Помимо общих статистических и графических средств, в системе имеются специализированные модули, например, для решения инженерно-технических и, в частности, промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента. Работа со всеми модулями происходит в рамках единого программного пакета, для которого можно выбирать один из нескольких предложенных интерфейсов пользователя. С помощью реализованных в системе STATISTICA мощных языков программирования и языка макрокоманд, снабженных специальными средствами поддержки, пользователь может создать законченные статистические модули (процедуры) и встраивать их в различные другие приложения или вычислительные среды.
Программа использует стандартный интерфейс электронных таблиц. Предусмотрены возможность обмена данными со всеми популярными СУБД (в том числе с MS Excel и MS Access), работа с удаленными базами данных, поддержка технологий OLE, DDE и ODBC. Встроенные графический и текстовый редакторы позволяют публиковать полученные материалы на Internet-страницах.
Общая структура системы
Система STATISTICA состоит из следующих основных компонент: • многофункциональной системы для работы с данными, которая включает в себя электронные таблицы (Spreadsheet) для ввода и задания исходных данных, а также специальных таблиц (Scrollsheet) для вывода численных результатов анализа. Для сложной (специализированной) обработки данных в STATISTICA имеется модуль Управление данными.Для статистической обработки чрезвычайно
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ...
больших массивов данных имеется специальный инструмент Менеджер мега-файлов,который может быть использован и для предварительной обработки данных перед вводом их непосредственно в электронную таблицу STATISTICA;
• мощной графической системы для визуализации данных и результатов статистического анализа;
• набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур. В любом конкретном модуле можно выполнить определенный способ статистической обработки, не обращаясь к процедурам из других модулей. Каждый модуль является полноценным WINDOWS приложением. Поэтому пользователь имеет возможность одновременной работы как с одним, так и с несколькими модулями. Переключаться между ними можно как между обычными WINDOWS приложениями, например, при помощи комбинации клавиш [А1_Т]+[ТАВ] или выбирая их на панели задач. Все основные операции при работе с данными и графические возможности доступны в любом статистическом модуле и на любом шаге анализа;
• специального инструментария для подготовки отчетов. При помощи текстового редактора, встроенного в систему, можно готовить полноценные отчеты. В STATISTICA также имеется возможность автоматического создания отчетов;
• встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе.
Все структурные компоненты STATISTICA настолько тесно интегрированы между собой, что разделение на различные компоненты во многом условно и является полезным лишь для изучения системы с методической точки зрения.
Система STATISTICA работает с четырьмя различными типами документов, которые с соответствуют основным структурным компонентам системы:
• электронная таблица Spreadsheet, которая предназначена для ввода исходных данных и их преобразования;
• электронная таблица Scrollsheet для вывода численных и текстовых результатов анализа;
• график - документ в специальном графическом формате для визуализации графического представления численной информации;
• отчет - документ в формате RTF (Расширенный текстовой формат) для вывода текстовой и графической информации.
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
В соответствии со стандартами среды WINDOWS каждый тип документа выводится в своем собственном окне в рабочей области системы STATISTICA. Как только это окно становится активным, изменяется панель инструментов и меню. В них появляются команды и кнопки, доступные для активного документа. Имеется несколько различных способов работы с системой STATISTICA.