Величина пределов конкретной ошибки зависит от степени вероятности, с которой измеряется ошибка выборки.
Ошибка выборки, исчисленная с заданной степенью вероятности, представляет предельную ошибку выборки.
Если через Δ (или ) обозначим предельную ошибку, частное от деления Δ на приравняем к t , тогда t = , отсюда Δ = t , так как , то .
Следовательно, величина предельной ошибки зависит от величины средней ошибки и коэффициента t. Коэффициент зависит от степени вероятности, с которой производится выборочное наблюдение.
Величину вероятности для различных значений t можно определить на основе теоремы П.Л. Чебышева ( с уточнениями А.М.Ляпунова) (с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной генеральной дисперсии выборочные обобщающие показатели (средняя, доля) будут сколь угодно мало отличаться от соответствующих генеральных показателей).
Некоторые значения применяемые наиболее часто для выборок достаточно большого объема (n=≥ 30):
t | 1,000 | 1,960 | 2,000 | 2,580 | 3,000 |
Ф(t) | 0,683 | 0,950 | 0,954 | 0,990 | 0,997 |
Уже при значении t=3, вероятность очень близка к единице. Значит, если бы из одной и той же генеральной совокупности было произведено большое число случайных выборок одинаковой численности, то в среднем на 1000 выборок приходилось бы 997 таких, в которых отклонение выборочной средней от генеральной не превышало бы 3 , и только выборках отклонение могло бы выйти за эти пределы.
Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы.
При заданной вероятности генеральная средняя будет находится в следующих границах:
.
При определении границ генеральной доли при расчете средней ошибки используется дисперсия альтернативного признака, которая вычисляется по формуле:
где w- выборочная доля, т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака.
Например. В результате выборочного обследования незанятого населения, ищущего работу, осуществленного на основе собственно- случайной повторной выборки, получен следующий ряд распределения (табл.1)
Таблица 1
Результаты выборочного обследования незанятого населения
Возраст, лет | до 25 | 25-35 | 35-45 | 45-55 | 55 и более |
Численность лиц данного возраста |
С вероятностью 0,954 определите границы:
А) среднего возраста незанятого населения;
Б) доли (удельного веса) лиц, моложе 25 лет, в общей численности незанятого населения.
Решение.
А). Для определения средней ошибки выборки необходимо рассчитать среднюю величину и дисперсию изучаемого признака (табл.2):
41,2;
Таблица 2