Доверительный интервал оценки генеральной дисперсии

Построение доверительного интервала для дисперсии нормально распределенной генеральной совокупности основывается на том, что случайная величина:

Доверительный интервал оценки генеральной дисперсии - student2.ru (3.24)

имеет c2-распределение Пирсона c n=n–1 степенями свободы. Зададим доверительную вероятность g и определим числа Доверительный интервал оценки генеральной дисперсии - student2.ru и Доверительный интервал оценки генеральной дисперсии - student2.ru из условия

Доверительный интервал оценки генеральной дисперсии - student2.ru .

Числа Доверительный интервал оценки генеральной дисперсии - student2.ru и Доверительный интервал оценки генеральной дисперсии - student2.ru , удовлетворяющие этому условию, можно выбрать бесчисленным числом способов. Один из способов состоит в следующем

Доверительный интервал оценки генеральной дисперсии - student2.ru ,

т.е.

Доверительный интервал оценки генеральной дисперсии - student2.ru и Доверительный интервал оценки генеральной дисперсии - student2.ru .

Значения чисел Доверительный интервал оценки генеральной дисперсии - student2.ru и Доверительный интервал оценки генеральной дисперсии - student2.ru определяются из таблиц для распределения Пирсона. После этого образуем неравенство

Доверительный интервал оценки генеральной дисперсии - student2.ru

В результате получаем следующую интервальную оценку дисперсии генеральной совокупности:

Доверительный интервал оценки генеральной дисперсии - student2.ru . (3.25)

Иногда это выражение записывают в виде

Доверительный интервал оценки генеральной дисперсии - student2.ru , (3.26)

или

Доверительный интервал оценки генеральной дисперсии - student2.ru , (3.27)

где для коэффициентов Доверительный интервал оценки генеральной дисперсии - student2.ru и Доверительный интервал оценки генеральной дисперсии - student2.ru составляют специальные таблицы.

Пример 3.10. На фабрике работает автоматическая линия по фасовке растворимого кофе в жестяные 100-граммовые банки. Если средняя масса наполняемых банок отличается от точной, то линии налаживается для подгонки средней массы в рабочем режиме. Если дисперсия массы превышает заданное значение, то линия должна быть остановлена на ремонт и переналадку. Время от времени производится отбор банок с кофе для проверки средней массы и ее колеблемости. Предположим, что с линии в случайном порядке производится отбор банок с кофе и оценка дисперсии s2=18,540. Постройте 95%-й доверительный интервал для генеральной дисперсии s2.

Решение. Предполагая, что генеральная совокупность имеет нормальное распределение, воспользуемся формулой (3.26). По условию задачи уровень значимости a=0,05 и a/2=0,025. По таблицам для c2-распределение Пирсона с n=n–1=29 степенями свободы находим

Доверительный интервал оценки генеральной дисперсии - student2.ru и Доверительный интервал оценки генеральной дисперсии - student2.ru .

Тогда доверительный интервал для s2 можно записать в виде

Доверительный интервал оценки генеральной дисперсии - student2.ru ,

или

Доверительный интервал оценки генеральной дисперсии - student2.ru .

Для средне квадратичного отклонения ответ будет иметь вид

Доверительный интервал оценки генеральной дисперсии - student2.ru . â

Проверка статистических гипотез

Основные понятия

Большинство эконометрических моделей требует многократного улучшения и уточнения. Для этого необходимо проведение соответствующих расчетов, связанных с установлением выполнимости или невыполнимости тех или иных предпосылок, анализом качества найденных оценок, достоверностью полученных выводов. Поэтому знание основных принципов проверки гипотез является обязательным в эконометрике.

Во многих случаях необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид, то выдвигают гипотезу: генеральная совокупность распределена по этому закону. Например, можно выдвинуть предположение, что доход населения, ежедневное количество покупателей в магазине, размер выпускаемых деталей имеют нормальный закон распределения.

Возможен случай, когда закон распределения известен, а его параметры нет. Если есть основания предположить, что неизвестный параметр q равен ожидаемому числу q0, то выдвигают гипотезу: q=q0. Например, можно выдвинуть предположение о величине среднего дохода населения, среднего ожидаемого дохода по акциям, о разбросе в доходах и т.д.

Под статистической гипотезой H понимают любое предположение о генеральной совокупности (случайной величине), проверяемое по выборке. Это может быть предположение о виде распределения генеральной совокупности, о равенстве двух выборочных дисперсий, о независимости выборок, об однородности выборок, т.е. что закон распределения не меняется от выборки к выборке и др.

Гипотеза называется простой, если она однозначно определяет какое-либо распределение или какой-либо параметр; в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина X распределена по стандартному нормальному закону N(0;1); если же высказывается предположение, что случайная величина X имеет нормальной распределение N(m;1), где a£m£b, то это сложная гипотеза.

Проверяемая гипотеза называется основной или нулевой гипотезой и обозначается символом H0. Наряду с основной гипотезой рассматривают и противоречащую ей гипотезу, которую обычно называют конкурирующей или альтернативной гипотезой и обозначают символом H1. Если основная гипотеза будет отвергнута, то имеет место альтернативная гипотеза. Например, если проверяется гипотеза о равенства параметра q некоторому заданному значению q0, т.е. H0:q=q0, то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: H1:q>q0, H2:q<q0, H3:q¹q0, H4:q=q1. Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверка осуществляется статистическими методами, то в связи с этим с определенной долей вероятности может быть принято неправильное решение. Здесь могут быть допущены ошибки двух видов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода обозначают буквой a, т.е.

Доверительный интервал оценки генеральной дисперсии - student2.ru .

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают буквой b, т.е.

Доверительный интервал оценки генеральной дисперсии - student2.ru .

Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному риску. Что лучше или хуже – зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если H0 состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия этой ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.

Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, т.к. задачи их уменьшения являются конкурирующими. И снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения обеих вероятностей состоит в увеличении объема выборки.

Правило, в соответствие с которым принимается или отклоняется основная гипотеза, называется статистическим критерием. Для этого подбирается такая случайная величина K, распределение которой точно или приближенно, известно и которая служит мерой расхождения между опытными и гипотетическими значениями.

Для проверки гипотезы по данным выборки вычисляют выборочное (или наблюдаемое) значение критерия Kнабл. Затем, в соответствии с распределением выбранного критерия, строится критическая область Kкрит. Это такая совокупность значений критерия, при которых нулевую гипотезу отвергают. Оставшуюся часть возможных значений называют областью принятия гипотезы. Если ориентироваться на критическую область, то можно совершить ошибку
1-го рода, вероятность которой задана заранее и равна a, называемой уровнем значимости гипотезы. Отсюда вытекает следующее требование к критической области Kкрит:

Доверительный интервал оценки генеральной дисперсии - student2.ru .

 
  Доверительный интервал оценки генеральной дисперсии - student2.ru

Уровень значимости a определяет "размер" критической области Kкрит. Однако ее положение на множестве значений критерия зависит от вида альтернативной гипотезы. Например, если проверяется нулевая гипотеза H0:q=q0, а альтернативная гипотеза имеет вид H1:q>q0, то критическая область будет состоять из интервала (K2, +¥), где точка K2 определяется из условия P(K>K2)=a (правосторонняя критическая область). Если альтернативная гипотеза имеет вид H2:q<q0, то критическая область будет состоять из интервала (–¥;K1), где точка K1 определяется из условия P(K<K2)=a (левосторонняя критическая область). Если альтернативная гипотеза имеет вид H3:q¹q0, то критическая область будет состоять из двух интервалов (–¥;K1) и (K2, +¥), где точки K1 и K2 определяются из условий: P(K>K2)=a/2 и P(K<K2)=a/2 (двухсторонняя критическая область).

Основной принцип проверки статистических гипотез можно сформулировать следующим образом. Если Kнабл попадает в критическую область, то гипотеза H0 отвергается и принимается гипотеза H1. Однако поступая таким образом, следует понимать, что здесь можно допустить ошибку 1-го рода с вероятностью a. Если Kнабл попадает в область принятия гипотезы – то нет оснований, чтобы отвергать нулевую гипотезу H0. Но это вовсе не означает, что H0 является единственно подходящей гипотезой: просто расхождения между выборочными данными и гипотезой H0 невелико; однако таким же свойством могут обладать и другие гипотезы.

Мощностью критерия называется вероятность того, что нулевая гипотеза будет отвергнута, если верна альтернативная гипотеза; т.е. мощность критерия равна 1–b, где b – вероятность совершить ошибку 2-го рода. Пусть для проверки гипотезы принят определенный уровень значимости a и выборка имеет фиксированный объем. Поскольку в выборе критической области есть определенный произвол, то ее целесообразно строить так, чтобы мощность критерия была максимальной или чтобы вероятность ошибки 2-го рода была минимальной.

Критерии, используемые для проверки гипотез о параметрах распределения, называются критериями значимости. В частности, построение критической области аналогично построению доверительного интервала. Критерии, используемые для проверки согласия между выборочным распределением и гипотетическим теоретическим распределением, называются критериями согласия.

Наши рекомендации