Статистическая проверка гипотез
МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ЭКСПЕРИМЕНТА
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
Эксперимент — система операций и (или) наблюдений, направленных на получение информации об объекте исследования. Составной частью эксперимента является опыт — воспроизведение исследуемого явления в определенных условиях при возможности регистрации и количественной оценки состояния или результатов функционирования исследуемого объекта. Эксперимент проводится на промышленном оборудовании, лабораторной установке или физической модели. При этом механизм изучаемого процесса обычно известен лишь частично или совсем неизвестен. В таких случаях объект исследования можно условно представить в виде «черного ящика» — системы внутренних связей, не доступных исследователю. Известны лишь переменные величины, воздействующие на объект исследования, и величины, характеризующие его состояние или результаты функционирования (рис. 3.1). Первые называют входными величинами или факторами, а вторые — выходными или откликом.
Все факторы делятся на три группы:
1) группа постоянных или случайно изменяющихся в ходе исследования факторов W, значения которых известны;
2) группа управляемых факторов U, значения которых выбираются и целенаправленно изменяются в ходе исследования (две первых группы часто объединяют в одну группу контролируемых факторов X);
3) группа неконтролируемых факторов Z, значения которых остаются по той или иной причине неизвестными в ходе исследования.
Изменение отклика У под действием монотонно изменяющихся во времени неконтролируемых факторов называется временным дрейфом отклика, а зависимость математического ожидания отклика от контролируемых факторов — функцией отклика.
Геометрическое представление функции отклика называется поверхностью отклика. Чтобы такое представление стало возможным, вводится понятие факторного пространства, у которого координатные оси соответствуют отдельным факторам. Пример трехмерного факторного пространства показан на рис. 3.2.
Рис. 3.1. Кибернетическая модель объекта исследования
Рис. 3.2. Геометрическая модель трехфакторного пространства
Любая точка факторного пространства характеризуется набором значений факторов, при которых производится измерение отклика. Фиксированное значение фактора называют также уровнем фактора. При количестве факторов, большем трех, геометрическое моделирование факторного пространства становится невозможным. Поэтому чаще всего множество уровней факторов, при которых производится измерение отклика, задается матрицей условий эксперимента. Эта матрица для k факторов и N измерений имеет вид
Значения отклика, полученные при данных измерениях, также представляются в матрице, которая имеет один столбец и называется матрицей наблюдений:
(3.1)
По характеру организации и методам обработки результатов эксперимент может быть пассивным или активным.
При реализации пассивного эксперимента исследователь наблюдает за объектом, не вмешиваясь в процесс его функционирования. Поскольку в данном случае уровни факторов случайным или закономерным образом изменяются во времени, то появляется возможность, измеряя их значения и значения отклика, исследовать зависимость между факторами и откликом. Примером пассивного эксперимента является исследование точности обработки деталей на настроенном станке. Факторами в данном случае будут погрешности заготовок, их твердость, износ инструмента, жесткость станка, откликом — погрешность обработанных деталей.
При реализации активного эксперимента исследователь сам изменяет уровень факторов и поддерживает их на нужном уровне в течение данного этапа эксперимента.
К контролируемым факторам предъявляются следующие требования, которые должны учитываться при подготовке активного эксперимента.
1. Управляемость фактора — возможность поддерживать выбранный уровень фактора в течение необходимого для измерения отрезка времени.
2. Достаточно высокая точность, с которой поддерживается и измеряется уровень фактора.
3. Независимость фактора — возможность задать любой уровень данного фактора вне зависимости от уровней других факторов.
4. Совместимость факторов — безопасность функционирования объекта исследования и возможность измерения отклика в любой точке той части факторного пространства, которая является областью экспериментирования.
Кроме факторов, каждому уровню которых после измерения можно поставить в соответствие определенное число, могут быть и качественные факторы (например, рецепты связок шлифовальных кругов, материалы режущей части инструмента, химический состав обрабатываемого материала). В этом случае каждому уровню качественного фактора нужно поставить в соответствие число натурального ряда (код). Порядок уровней качественных факторов может быть произвольным, но после кодирования он фиксируется. Для упрощения расчетов при обработке результатов эксперимента рекомендуется проводить нормализацию факторов — преобразование их в безразмерные величины с (по возможности) целочисленными значениями. При симметричной нормализации расчетная формула имеет вид
(3.2)
где xij — нормализованный i-й уровень j-го фактора; Хij — натуральный i-й уровень j-го фактора; ΔXj — постоянный шаг изменения натурального значения j-го фактора; Xj — средний уровень j-го фактора:
(3.3)
r — число уровней фактора.
Чтобы нормализованные факторы приняли целочисленные значения, число уровней их должно быть нечетным. Например, при r = 5 коды факторов принимают значения -2; -1; 0; 1; 2.
При несимметричной нормализации
(3.4)
где Xj min — минимальный уровень j-го фактора.
В данном случае нормализованные факторы принимают значения 1, 2, 3, ..., r. В качестве факторов могут приниматься не только физические или геометрические величины, но и некоторые функции от них (например, логарифмы или показательные функции).
При выборе отклика из нескольких, обычно функционально связанных показателей результата функционирования исследуемого объекта должно учитываться следующее.
1. Необходимо, чтобы отклик был однозначным в статистическом смысле, т. е. заданному набору уровней факторов должно соответствовать одно (с точностью до погрешности измерения) значение отклика.
2. Отклик должен быть эффективным в статистическом смысле. Это значит, что из нескольких функционально связанных откликов выбранный можно измерить с наибольшей точностью.
3. Желательно, чтобы отклик можно было оценить количественно. Если нет способа количественного измерения результата, то следует пользоваться ранжированием. При этом отклику присваиваются оценки — ранги по заранее выбранной шкале.
План эксперимента — совокупность данных, определяющих число, условия и порядок реализации опытов. План эксперимента обычно записывается в виде матрицы плана — прямоугольной таблицы, строки которой отвечают отдельным опытам, а столбцы — факторам. Элементами матрицы плана обычно являются нормированные уровни факторов, т.е. (и, j)-й элемент равен нормированному уровню j-го фактора в u-м опыте. Матрица плана может иметь совпадающие строки. Чтобы сократить запись, используется матрица спектра плана, составленная из всех строк матрицы плана, отличающихся уровнем хотя бы одного фактора, и матрица дублирования — квадратная диагональная матрица, элементы которой равны числам параллельных (дублирующих) опытов в соответствующих точках спектра плана.
План, содержащий все возможные комбинации всех факторов на определенном числе уровней равное число раз, называется полным факторным планом. Если план содержит только часть комбинаций полного факторного плана, то его называют дробным факторным планом или дробной репликой полного факторного плана.
СТАТИСТИЧЕСКАЯ ПРОВЕРКА ГИПОТЕЗ
Основные определения
Статистическая гипотеза — предположение относительно статистических параметров генеральной совокупности или закона распределения случайных величин, проверяемое на основе выборочных данных.
Основная проверяемая гипотеза (нулевая гипотеза) обычно обозначается Н0. Одновременно формулируется альтернативная или конкурирующая гипотеза Н1. Например, если проверяется равенство математического ожидания генеральной совокупности некоторому значению μ0, нулевая гипотеза Н0 – М(Y) = μ0, альтернативная гипотеза Н1 – М(Y) ≠ μ0.
Критерием статистической гипотезы называют правило, позволяющее принять или отвергнуть гипотезу на основании выборки из генеральной совокупности. Принимая или отклоняя гипотезу Н0, можно допустить ошибки двух видов. Ошибка первого рода состоит в том, что гипотеза Н0 отвергается, в то время как в действительности она верна, ошибка второго рода – гипотеза Н0 принимается, в то время как верна гипотеза H1.
Вероятность ошибки первого рода обозначается α. Ее часто называют уровнем значимости критерия гипотезы. Вероятность ошибки второго рода обозначается β. Вероятность 1 – β принятия гипотезы Н1, когда она верна, называется мощностью критерия гипотезы Н0 относительно альтернативной гипотезы Н1. Очевидно, что при проверке гипотезы Н0 относительно альтернативной гипотезы Н1 лучшим является тот критерий, который обеспечивает наибольшую мощность при том же самом уровне значимости α.