Статистические процедуры системы STATISTICA
Статистические процедуры системы STATISTICA, как уже было отмечено, сгруппированы в нескольких специализированных статистических модулях (рис. 7.3). В каждом модуле можно выполнить определенный способ обработки, не обращаясь к процедурам из других модулей. Ниже приводится краткое описание отдельных статистических модулей, знакомство с которыми поможет инженеру-исследователю в
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ...
его практике для профессиональной обработки, анализа и представления результатов эксперимента (промышленного, лабораторного, вычислительного и др.).
Модуль Основные статистики и таблицы(Basic Statistics/Tables) включает в себя следующие группы статистических процедур:
Описательные статистики (Descriptive statistics). Группа производит вычисление практически всех описательных статистик, среднее арифметическое, выборочную дисперсию, стандартное
Рис. 7.3. Основные статистические мо- отклонение, медиану, моду, мак-
дули системы STATISTICA симальное и минимальное значе-
ния, размах, доверительные интервалы для среднего и многие другие описательные статистики. Здесь же предусмотрен широкий выбор критериев для тестирования нормальности распределения. Практически все описательные статистики могут быть вычислены для данных, разделенных на группы с помощью одной или нескольких группирующих переменных. Имеется возможность интерактивного удаления выбросов на графике, выделение и маркировка необходимых подмножеств на графике, сглаживание данных и другие возможности.
Корреляционные матрицы (Correlation matrices). Данная группа включает большое количество средств, позволяющих исследовать зависимости между переменными путем вычисления практически всех общих мер зависимости (коэффициентов корреляции).
t-критерии для зависимых и независимых выборок (t-test for independent and dependent samples). Эта группа процедур позволяет осуществить проверку истинности статистических гипотез относительно наблюдаемых случайных величин путем выполнения специальных тестов.
Таблицы частот (Frequency tables). Группа позволяют строить таблицы частот и гистограммы выбранных переменных. При этом значения переменных можно разбивать на классы и группировать произвольным образом.
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
Калькулятор вероятностных распределений (Probability calculator). Данная группа позволяет вычислить характеристики многих стандартных вероятностных распределений: нормального, хи-квадрат, Стьюдента, F-распределения и др.
Модуль Множественная регрессия(Multiple regression) включает в себя исчерпывающий набор средств множественной линейной и фиксированной нелинейной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) регрессий, позволяющих вычислять неизвестные коэффициенты в заранее заданных пользователем регрессионных моделях.
Модуль Нелинейное оценивание(Nonlinear estimation) дает возможность оценить практически любые определенные пользователем нелинейные модели, осуществить подгонку к наблюдаемым данным кривой, по существу, любого типа. Важным преимуществом данного модуля, в отличие от других программ нелинейного оценивания, является то, что в нем не накладывается ограничения на размер обрабатываемого файла данных. Оценки коэффициентов нелинейной модели могут быть построены с помощью оценок метода наименьших квадратов, метода максимального правдоподобия или заданной пользователем функции потерь. Пользователь может выбрать одну из нескольких вычислительных процедур: квазиньютоновский метод, симплекс-метод и др. Кроме того, пользователь может сам определить любой тип нелинейной модели, набрав соответствующее уравнение в редакторе системы.
Модуль Дисперсионный анализ(AN OVA/MAN OVA) дает возможность оценить степень воздействия различных факторов на измеряемые данные и выделить среди них наиболее значимые (существенные). Для проверки основных предположений дисперсионного анализа имеется широкий выбор статистических процедур, в частности критерии Фишера, Кохрена, Бартлета и др.
Модуль Факторный анализ(Factor analysis) позволяет проводить факторный анализ, основная цель которого заключается в том, чтобы выделить скрытые общие факторы, т.е. воздействующие на все параметры объекта, а не на какой-то один параметр или группу. Выделяемые общие факторы определяют связи между наблюдаемыми параметрами объекта.
Модуль Непараметрическая статистика и подгонка распределения(Nonparametrics/Distribution) дает возможность сравнить распределение наблюдаемых величин с большим количеством различных теоретических распределений. Имеется возможность подогнать к данным нормальное, логнормальное, экспоненци-
7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …
альное, хи-квадрат, пуассоновское и др. распределения. Точность подгонки оценивается с помощью различных критериев (хи-квадрат, Колмогорова-Смирнова и др.).
Модуль Анализ временных рядов и прогнозирование(Time Series/Forecasting) позволяет строить модель, описывающую ряд данных, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье-анализ ряда и т.д. Модуль также включает процедуры автокорреляционного анализа.
Возможности системы STATISTICA далеко не исчерпываются перечисленными выше модулями. Кроме них, система содержит ряд модулей, предназначенных для более детального статистического анализа данных и необходимость в которых на практике возникает крайне редко.