Статистические процедуры системы STATISTICA

Статистические процедуры системы STATISTICA, как уже было отмечено, сгруппированы в нескольких специализированных статистических модулях (рис. 7.3). В каждом модуле можно выполнить определенный способ обработки, не обращаясь к процедурам из других модулей. Ниже приводится краткое описание отдельных ста­тистических модулей, знакомство с которыми поможет инженеру-исследователю в

7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ...

его практике для профессиональной обработки, анализа и представления результа­тов эксперимента (промышленного, лабораторного, вычислительного и др.).

Статистические процедуры системы STATISTICA - student2.ru

Модуль Основные стати­стики и таблицы(Basic Statistics/Tables) включает в себя следующие группы статистических процедур:

Описательные статисти­ки (Descriptive statistics). Группа производит вычисление практиче­ски всех описательных статистик, среднее арифметическое, выбо­рочную дисперсию, стандартное

Рис. 7.3. Основные статистические мо- отклонение, медиану, моду, мак-

дули системы STATISTICA симальное и минимальное значе-

ния, размах, доверительные ин­тервалы для среднего и многие другие описательные статистики. Здесь же преду­смотрен широкий выбор критериев для тестирования нормальности распределения. Практически все описательные статистики могут быть вычислены для данных, раз­деленных на группы с помощью одной или нескольких группирующих переменных. Имеется возможность интерактивного удаления выбросов на графике, выделение и маркировка необходимых подмножеств на графике, сглаживание данных и другие возможности.

Корреляционные матрицы (Correlation matrices). Данная группа включает большое количество средств, позволяющих исследовать зависимости между пере­менными путем вычисления практически всех общих мер зависимости (коэффициен­тов корреляции).

t-критерии для зависимых и независимых выборок (t-test for independent and dependent samples). Эта группа процедур позволяет осуществить проверку истинно­сти статистических гипотез относительно наблюдаемых случайных величин путем выполнения специальных тестов.

Таблицы частот (Frequency tables). Группа позволяют строить таблицы час­тот и гистограммы выбранных переменных. При этом значения переменных можно разбивать на классы и группировать произвольным образом.

7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …

Калькулятор вероятностных распределений (Probability calculator). Данная группа позволяет вычислить характеристики многих стандартных вероятностных распределений: нормального, хи-квадрат, Стьюдента, F-распределения и др.

Модуль Множественная регрессия(Multiple regression) включает в себя ис­черпывающий набор средств множественной линейной и фиксированной нелиней­ной (в частности, полиномиальной, экспоненциальной, логарифмической и др.) рег­рессий, позволяющих вычислять неизвестные коэффициенты в заранее заданных пользователем регрессионных моделях.

Модуль Нелинейное оценивание(Nonlinear estimation) дает возможность оценить практически любые определенные пользователем нелинейные модели, осуществить подгонку к наблюдаемым данным кривой, по существу, любого типа. Важным преимуществом данного модуля, в отличие от других программ нелинейно­го оценивания, является то, что в нем не накладывается ограничения на размер об­рабатываемого файла данных. Оценки коэффициентов нелинейной модели могут быть построены с помощью оценок метода наименьших квадратов, метода макси­мального правдоподобия или заданной пользователем функции потерь. Пользова­тель может выбрать одну из нескольких вычислительных процедур: квазиньютонов­ский метод, симплекс-метод и др. Кроме того, пользователь может сам определить любой тип нелинейной модели, набрав соответствующее уравнение в редакторе системы.

Модуль Дисперсионный анализ(AN OVA/MAN OVA) дает возможность оце­нить степень воздействия различных факторов на измеряемые данные и выделить среди них наиболее значимые (существенные). Для проверки основных предполо­жений дисперсионного анализа имеется широкий выбор статистических процедур, в частности критерии Фишера, Кохрена, Бартлета и др.

Модуль Факторный анализ(Factor analysis) позволяет проводить факторный анализ, основная цель которого заключается в том, чтобы выделить скрытые общие факторы, т.е. воздействующие на все параметры объекта, а не на какой-то один па­раметр или группу. Выделяемые общие факторы определяют связи между наблю­даемыми параметрами объекта.

Модуль Непараметрическая статистика и подгонка распределения(Nonparametrics/Distribution) дает возможность сравнить распределение наблюдае­мых величин с большим количеством различных теоретических распределений. Имеется возможность подогнать к данным нормальное, логнормальное, экспоненци-

7. КОМПЬЮТЕРНЫЕ МЕТОДЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ …

альное, хи-квадрат, пуассоновское и др. распределения. Точность подгонки оцени­вается с помощью различных критериев (хи-квадрат, Колмогорова-Смирнова и др.).

Модуль Анализ временных рядов и прогнозирование(Time Series/Forecasting) позволяет строить модель, описывающую ряд данных, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье-анализ ряда и т.д. Модуль также включает про­цедуры автокорреляционного анализа.

Возможности системы STATISTICA далеко не исчерпываются перечисленны­ми выше модулями. Кроме них, система содержит ряд модулей, предназначенных для более детального статистического анализа данных и необходимость в которых на практике возникает крайне редко.

Наши рекомендации