Доля студентов, получивших оценки 4 и 5
по генеральной совокупности: Р = (520 + 80) 1000 = 0.6 или 60%
по первой выборке W = Pi = (54+10)/ 100 = 0.64 или 64%
по второй совокупности W = Pi = (52+7)/ 100=0,59 или 59%.
Разность между показателями выборочной и генеральной совокупности и будет случайной ошибкой репрезентативности:
Хср1 - Хср = 3.65 -3,58 = 0.07
Xср2 - Xcp = 3.54-3.58 = -0.04
Wi - P = 0.64 - 0.6 = 0.04
W2 - P = 0.59 - 0.6 = -0.01
При выборочном наблюдении должна быть обеспечена случайность отбора единиц. Каждая единица должна иметь равную с другими возможность быть отобранной. Именно на этом основывается собственно-случайная выборка.
К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на какие-либо группы) посредством жеребьевки (преимущественно) или какого-либо иного подобного способа, например с помощью таблицы случайных чисел. Случайный отбор — это отбор не беспорядочный. Принцип случайности предполагает, что на включение или исключение объекта из выборки не может повлиять какой-либо фактор, кроме случая. Примером собственно-случайного отбора могут служить тиражи выигрышей: из общего количества выпущенных билетов наугад отбирается определенная часть номеров, на которые приходятся выигрыши. Причем всем номерам обеспечивается равная возможность попадания в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.
Доля выборкиесть отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:
Так, при 5 %-ной выборке из партии деталей в 1000 ед. объем выборки составляет 50 ед., а при 10%-ной выборке — 100 ед., и т.д. При правильной научной организации выборки ошибки репрезентативности можно свести к минимальным значениям, в результате — выборочное наблюдение становится достаточно точным.
Собственно-случайный отбор «в чистом виде» применяется в практике выборочного наблюдения редко, но он является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного наблюдения.
Рассмотрим некоторые вопросы теории выборочного метода и формулы ошибок для простой случайной выборки.
Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину количественного признакаи относительную величину альтернативного признака (долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой совокупности только наличием изучаемого признака).
Выборочная доля , или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности n:
Например, если из 100 деталей выборки (п =100), 95 деталей оказались стандартными (т =95), то выборочная доля
= 95 / 100 = 0,95.
Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.
Ошибка выборки или, иначе говоря, ошибка репрезентативности представляет собой разность соответствующих выборочных и генеральных характеристик:
для средней количественного признака
для доли (альтернативного признака)
Выборочная средняя и выборочная доля по своей сути являются случайными величинами, которые могут принимать различные значения в зависимости от того, какие единицы совокупности попали в выборку. Следовательно, ошибки выборки также являются случайными величинами и могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок — среднюю ошибку выборки .
От чего зависит средняя ошибка выборки?При соблюдении принципа случайного отбора средняя ошибка выборки определяется прежде всего объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, всё более точно характеризуем всю генеральную совокупность.
Средняя ошибка выборки также зависит от степени варьирования изучаемого признака. Степень варьирования, как известно, характеризуется дисперсией или — для альтернативного признака. Чем меньше вариация признака, а следовательно, и дисперсия, тем меньше средняя ошибка выборки, и наоборот. При нулевой дисперсии (признак не варьирует), средняя ошибка выборки равна нулю, т.е. любая единица генеральной совокупности будет совершенно точно характеризовать всю совокупность по этому признаку.
Зависимость средней ошибки выборки от ее объема и степени варьирования признака отражена в формулах, с помощью которых можно рассчитать среднюю ошибку выборки в условиях выборочного наблюдения, когда генеральные характеристики (х, р) неизвестны, и, следовательно, не представляется возможным нахождение реальной ошибки выборки непосредственно по формулам.
При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:
для средней количественного признака
для доли (альтернативного признака)
Поскольку практически дисперсия признака в генеральной совокупности - точно неизвестна, на практике пользуются значением дисперсии S2, рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.
Таким образом, расчетные формулы средней ошибки выборки при случайном повторном отборе будут следующие:
для средней количественного признака
для доли (альтернативного признака)
Однако дисперсия выборочной совокупности не равна дисперсии генеральной совокупности, и, следовательно, средние ошибки выборки, рассчитанные по формулам, будут приближенными. Но в теории вероятностей доказано, что генеральная дисперсия выражается через выборную следующим соотношением:
Так как п / (п -1) при достаточно больших п — величина, близкая к единице, то можно принять, что =S2, а следовательно, в практических расчетах средних ошибок выборки можно использовать формулы. И только в случаях малой выборки (когда объем выборки не превышает 30) необходимо учитывать коэффициент п / (п -1) и исчислять среднюю ошибку малой выборки по формуле:
При случайном бесповторном отборев приведенные выше формулы расчета средних ошибок выборки необходимо подкоренное выражение умножить на 1-(п/М), поскольку в процессе бесповторной выборки сокращается численность единиц генеральной совокупности. Следовательно, для бесповторной выборки расчетные формулы средней ошибки выборки примут такой вид:
для средней количественного признака
для доли (альтернативного признака)
Так как п всегда меньше N, то дополнительный множитель 1-(п/N) всегда будет меньше единицы. Отсюда следует, что средняя ошибка при бесповторном отборе всегда будет меньше, чем при повторном. В то же время при сравнительно небольшом проценте выборки этот множитель близок к единице ( например, при 5%-ной выборке он равен 0,95; при 2 %-ной — 0,98, и т.д.). Поэтому иногда на практике пользуются для определения средней ошибки выборки формулами и без указанного множителя, хотя выборку и организуют как бесповторную. Это имеет место в тех случаях, когда число единиц генеральной совокупности неизвестно или безгранично, или когда п очень мало по сравнению с N, и по существу введение дополнительного множителя, близкого по значению к единице, практически не повлияет на значение средней ошибки выборки.