Проверка гипотезы о величине средней арифметической и доли
Одной из важнейших статистических характеристик изучаемых статистических признаков является средняя арифметическая (или доля для альтернативных признаков).
При изучении массовых явлений часто возникает вопрос о существовании расхождений средней и доли по результатам двух наблюдений или между выборочной и генеральной совокупностями.
На следующем примере рассмотрим проверку гипотезы о существовании различия двух выборочных средних (для случая малых выборок).
По результатам оценки размеров дебиторской задолженности, проведенной финансовым директором фирмы, были внесены изменения в ее кредитную политику. По истечении отчетного квартала было решено проанализировать насколько эффективными были эти изменения, привела ли новая кредитная политика фирмы к сокращению срока оплаты дебиторской задолженности. Исходные данные:
Тип кредиторской политики | Продолжительность сбора дебиторской задолженности (дни) по клиентам | |||||||||
№1 | №2 | №3 | №4 | №5 | №6 | №7 | №8 | №9 | №10 | |
«старая» | ||||||||||
«новая» |
Пусть фирма ставит задачу проверки при уровне значимости 5%.
В данном случае может быть сформулирована как отсутствие различий в величине выборочных средних по этим политикам кредиторской зависимости, т.е. . Некоторое различие между средними по типам политики работы с клиентами обусловлены случайными обстоятельствами или весьма незначительными положительными изменениями. Альтернативная гипотеза может быть сформулирована так: . Уровень значимости выдвинутой гипотезы .
Существенность расхождения двух выборочных средних (или генеральной и выборочной средних) оценивается с использованием t – критерия.
(С этим критерием мы знакомились при распространении значения выборочной средней или доли на генеральную совокупность: и ).
Фактическое значение критерия , т.е. разность двух средних сопоставляется с величиной средней ошибки по данным выборкам.
Поскольку рассматриваются данные двух выборок, то средняя ошибки исчисляется как средняя арифметическая взвешенная из средних ошибок по этим выборкам (наблюдениям). Здесь полезно вспомнить, что ошибка выборки при малых выборках исчисляется по формуле .
Итак, для наших малых выборок отдельно имеем , и , а общая дисперсия для двух выборок будет , а формула средней ошибки для двух выборок будет иметь вид .
Применим эту формулу к промежуточным результатам по рассматриваемому примеру: дня.
Тогда .
Результаты расчетов для проверки выдвинутой гипотезы (об отсутствии влияния изменений в кредитной политике фирмы на продолжительность сбора дебиторской задолженности) представлены в данной таблице
Тип кредитной политики фирмы | Средняя продолжительность сбора дебиторской задолженности | Число обследованных потребителей | Сумма квадратов отклонений |
«Старая» | 24,1 | 187,69 | |
«Новая» | 29,2 | 185,80 | |
Итого | х | 353,49 |
Поскольку при уровне значимости 5%, нулевая гипотеза отклоняется. Следовательно, «новая» кредитная политика оказалась эффективной и обеспечивает существенное сокращение средней продолжительности сбора дебиторской задолженности.
Аналогичный подход реализуется и при проверке о существенности расхождений двух выборочных долей. Только в этом случае , а .
При проверке гипотезы о существенности расхождений между генеральной и выборочной средними (долями) из доверительных интервалов: и по таблице нормированной функции Лапласа (для больших выборок) или по таблице t – распределения Стьюдента с степенями свободы (для малых выборок) при установленной вероятности.