Ошибки выборочного наблюдения. Рассмотрим некоторые формулы ошибок для разных видов выборки
Рассмотрим некоторые формулы ошибок для разных видов выборки .
Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признака и относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).
Выборочная доля w, или частость, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности n:
w =m / n.
Например, если из 100 деталей выборки (n=100) 95 деталей оказались стандартными (m =95), то выборочная доля равна:
w = 95/100 = 0,95.
Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.
Ошибка выборки (e)или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:
а) для средней количественного признака:
(7.1)
б) для доли (альтернативного признака):
(7.2)
Ошибка выборки свойственна только выборочным наблюдениям. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих генеральных показателей.
Выборочная средняя и выборочная доля по своей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок _ среднюю ошибку выборки.
От чего зависит средняя ошибка выборки? При соблюдении принципа случайного отбора, чем больше численность генеральной совокупности при прочих равных условиях, тем меньше величина средней ошибки выборки.
Средняя ошибка выборки также зависит от степени варьирования изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией или _ для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует) средняя ошибка выборки равна нулю, т.е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.
Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (х, р) неизвестны, и следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам (7.1 ), (7.2).
При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:
а) для средней количественного признака:
(7.3)
б) для доли (альтернативного признака):
(7.4)
Поскольку практически дисперсия признака в генеральной совокупности точно неизвестна, на практике пользуются значением дисперсии , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.
Таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:
а) для средней количественного признака:
(7.5)
б) для доли (альтернативного признака):
(7.6)
Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и следовательно, средние ошибки выборки, рассчитанные по формулам (7.5) и (7.6), будут приближенными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением:
(7.7)
Так как при достаточно больших n _ величина, близкая к единице, то можно принять, что , а следовательно, в практических расчетах средних ошибок выборки можно использовать формулы (7.5) и (7.6). И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент и исчислять среднюю ошибку малой выборки по формуле:
(7.8)
При случайном бесповторном отборе в приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на , поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:
а) для средней количественного признака:
(7.9)
б) для доли (альтернативного признака):
(7.10)
Так как n всегда меньше N, то дополнительный множитель всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице ( например, при 5 %-ной выборке он равен 0,95; при 2 %-ной _ 0,98 и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами (7.5) и (7.6) без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности N неизвестно или безгранично, или когда n очень мало по сравнению с N, и по существу, введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.
Механическая выборка. При достаточно большой совокупности механический отбор по точности результатов близок к собственно-случайному. Поэтому для определения средней ошибки механической выборки используют формулы собственно-случайной бесповторной выборки (7.9), (7.10).
Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
Среднюю ошибку выборки находят по формулам:
а) для средней количественного признака:
(повторный отбор); (7.11)
(бесповторный отбор); (7.12)
б) для доли (альтернативного признака):
(повторный отбор); (7.13)
(бесповторный отбор), (7.14)
где _ средняя из внутригрупповых дисперсий по выборочной совокупности;
_ средняя из внутригрупповых дисперсий доли (альтернативного признака) по выборочной совокупности.
Серийная выборка . Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.
Среднюю ошибку выборки для средней количественного признака при серийном отборе находят по формулам:
(повторный отбор); (7.15)
(бесповторный отбор), (7.16)
где r _ число отобранных серий; R _ общее число серий.
Межгрупповую дисперсию серийной выборки вычисляют следующим образом:
где _ средняя i-й серии;
_ общая средняя по всей выборочной совокупности.
Средняя ошибка выборки для доли (альтернативного признака) при серийном отборе определяется по формуле:
(повторный отбор); (7.17)
(бесповторный отбор) (7.18)
Межгрупповую (межсерийную) дисперсию доли серийной выборки определяют по формуле:
(7.19)
где _ доля признака в i-й серии;
_ общая доля признака во всей выборочной совокупности.