Цель: Ознакомиться с методом проверки основных статистических гипотез, используемых в экономике, с помощью ЭВМ
Лабораторная работа № 10
Проверка статистических гипотез
Цель: Ознакомиться с методом проверки основных статистических гипотез, используемых в экономике, с помощью ЭВМ.
Решение многих практических (биологических, медицинских и т.п.) задач основано на принципе аналогии, когда для объяснения особенностей строения слабо изученных объектов используют закономерности, установленные при изучении аналогичных объектов. Для правильного выбора объекта-аналога необходимо оценить степень его сходства с исследуемым объектом.
В других случаях (например, при интерпретации многих биологических данных) возникает необходимость оценить степень различия объектов по тем или иным параметрам или свойствам.
Для объективного решения вопроса о сходстве или различии объектов используются статистические методы проверки гипотез о равенстве числовых характеристик или их свойствах. Чаще всего эти методы применяются для суждения:
- о равенстве средних значений изучаемого признака, например, у двух групп больных лечившихся по разным методикам или для одной же группы но в разные периоды времени (обострения заболевания);
- о равенстве дисперсий двух случайных величин по выборочным данным;
- об однородности изучаемого объекта;
- кроме того, бывает необходимым, в том числе для выбора способа проверки гипотез, получить обоснованное представление о виде распределения признака в генеральной совокупности.
Проверяемую гипотезу называют основной и обозначают Н0. В противовес к ней формулируют альтернативную гипотезу Н1.
Статистическая проверка гипотез производится с помощью критериев согласия. Статистический критерий или критерий согласия – это некоторая случайная функция, вычисляемая по выборочным значениям, распределение которой известно. Задав некоторое малое значение a, определяют критическую область, вероятность попадания вычисленного значения критерия при верной проверяемой гипотезе равна a. Предполагая событие с малой вероятностью практически невозможным, при попадании значения критерия в критическую область проверяемую гипотезу отвергают, принимая альтернативную.
Таким образом, вероятность совершить ошибку 1 рода, т.е. отвергнуть верную основную гипотезу, равна a. Число a называют уровнем значимости, а вероятность p=1-a, что принятая альтернативная гипотеза верна, - доверительной вероятностью. Исследователь сам определяет нужный ему уровень значимости.
Вероятность допустить ошибку второго рода, т.е. принять гипотезу Н0 когда она неверна, обычно обозначают b. Вероятность 1-b не допустить ошибку второго рода называется мощностью критерия. На мощность критерия исследователь может повлиять, лишь выбирая самый мощный из критериев, подходящих к задаче или увеличив объем выборки. Таким образом, отвергая основную гипотезу, обычно получают более достоверный результат, чем принимая ее.
Для решения задач на основе статистической проверки гипотез необходимо выполнить следующие операции:
· четко сформулировать проверяемую (Н0) и альтернативную (Н1) гипотезу исходя из существа поставленной задачи;
· выбрать наиболее мощный при данном объеме выборки критерий, условия применения которого не противоречат свойствам изучаемых случайных величин;
· оценить последствия ошибки первого и второго рода в условиях решаемой задачи и выбрать уровень значимости исходя из требования минимизации ущерба в результате неправильного решения;
· рассчитать эмпирическое значение критерия согласия K по выборочным данным, сравнить его с теоретическим значением K для принятого уровня значимости и принять решение относительно гипотезы Н0,
· интерпретировать полученный результат применительно к поставленной задаче.
Вопрос о том, какую гипотезу принять в качестве альтернативной не всегда решается однозначно, так как для одной и той же гипотезы Н0 может существовать несколько альтернативных гипотез Н1. Например, при расчете интервальных оценок гипотеза Н0 заключается в том, что неизвестное математическое ожидание Mх находится в определенном интервале значений, то есть
.
В то же время в качестве альтернативных могут выступать разные гипотезы:
;
;
.
В качестве альтернативной гипотезы может быть принята гипотеза . Однако, например, при подсчете запасов месторождений часто целесообразнее пользоваться альтернативной гипотезой , так как вопрос возможности промышленного использования определенных объемов руды решается путем сравнения полученных данных оценок среднего содержания полезного компонента с минимальным промышленным содержанием.
Неправильная формулировка альтернативной гипотезы может вызвать ошибки при пользовании статистическими таблицами, поскольку существуют таблицы для критериев двух типов – односторонних и двусторонних. В таблицах односторонних критериев (например, критерий Лапласа) приводятся доверительные вероятности или уровни значимости, соответствующие простым альтернативным событиям типа или ; для проверки с их помощью сложной АГ следует уровень значимости уменьшать вдвое. Таблицы двусторонних симметрично распределенных критериев (например, критерий Стьюдента) построены для сложных альтернатив типа , когда учитывается вероятность сразу двух событий.
Статистические критерии согласия разделяются на параметрические и непараметрические. Параметрические критерии выводятся из свойств тех или иных статистических законов распределения и могут использоваться лишь в том случае, если распределение выборочных данных согласуется с этим законом. Непараметрические критерии могут применяться даже в том случае, если закон распределения изучаемых величин неизвестен или их распределения не соответствуют никакому из известных законов. Непараметрические критерии обычно обладают несколько меньшей мощностью по сравнению с параметрическими аналогами, но область их применения значительно шире. Наиболее часто используются следующие критерии: критерий согласия (χ2 хи-квадрат) Пирсона, F — критерий Фишера и критерий Стьюдента (t-критерий)
Критерий χ2 (хи-квадрат)
Критерий χ2(хи-квадрат) применяется для сравнения распределений объектов двух совокупностей на основе измерений по шкале наименований в двух независимых выборках.
Критерий Фишерапозволяет сравнивать величины выборочных дисперсий двух независимых выборок. Для вычисления Fэмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая – в знаменателе. Формула вычисления критерия Фишера такова:
где - дисперсии первой и второй выборки соответственно.
Так как, согласно условию критерия, величина числителя должна быть больше или равна величине знаменателя, то значение Fэмп всегда будет больше или равно единице.
Число степеней свободы определяется также просто:
k1=nl - 1 для первой выборки (т.е. для той выборки, величина дисперсии которой больше) и k2=n2 - 1 для второй выборки.