Понятие выборочного наблюдения.
Одним из распространенных методов статистики, применяющим несплошное наблюдение, является выборочный метод. Он используется при обследовании бюджета семей, жилищных условий населения, уровня заработной платы, спроса и предложения на определённые виды товаров и во многих других случаях. Эффективность выборочного метода заключается в его оперативности – короткие сроки проведения обследования, и в минимизации затрат труда и финансовых средств.
Выборочным называется такое наблюдение, при котором характеристика всей совокупности обследуемых единиц даётся по их части, отобранной в случайном порядке (обычно 5-10%, реже 15-25%).
Выборочное наблюдение даёт возможность, не прибегая к сплошному обследованию, получить обобщающие характеристики изучаемого явления.
Вся исследуемая совокупность, из которой производиться отбор части единиц, называется генеральной совокупностью, а та часть единиц совокупности, которая отобрана и подвергается обследованию, называется выборочной совокупностью, или выборкой.
Основная задача выборочного наблюдения – получить правильное представление о показателях генеральной совокупности на основе изучения выборочной совокупности.
В выборочном наблюдении применяются 2 вида обобщающих показателей: относительная величина альтернативного признака и средняя величина количественного признака.
Относительная величина альтернативного признака характеризует долю (удельный вес) единиц совокупности, обладающих изучаем признаком. Например, при обследовании студентов определяется доля студентов, получающих стипендию.
Средняя величина количественного признака – это обобщающая характеристика изучаемого варьирующего признака, например, средняя зар.плата одного работника.
В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей (P), а средняя величина изучаемого варьирующего признака – генеральной средней ( ).
В выборочной совокупности долю изучаемого признака называют выборочной долей или частостью (p), а среднюю величину в выборке – выборочной средней ( ).
Задачей выборочного наблюдения является получить достоверное представление о генеральных показателях доли и средней на основе аналогичных характеристик выборочной совокупности.
Понятие ошибки выборки.
Обобщающие показатели у части единиц совокупности не будут совпадать с соответствующими показателями совокупности всех единиц. Одной из задач выборочного наблюдения является определение пределов отклонений характеристик выборочной совокупности и генеральной совокупности.
Возможные пределы отклонений генеральной и выборочной долей, а также генеральных и выборочных средних, называются ошибкой выборки (ошибкой репрезентативности). Чем она меньше, тем точнее показатели выборочного наблюдения отражают генеральную совокупность.
Ошибки выборки бывают:
1) тенденциозными – это преднамеренные ошибки, если специально отбираются или худшие единицы совокупности;
2) случайными – возникают вследствие случайности отбора, т.к. единицы из совокупности выбираются в случайном порядке, могут быть преувеличены или характеристики генеральной совокупности.
Ошибка выборки зависит от численности выборки и от степени варьирования изучаемого признака. Все возможные расхождения между характеристиками выборочной и генеральной совокупности аккумулируются в формуле средней ошибки выборки. Она рассчитывается по-разному в зависимости от способа отбора: повторный или бесповторный.
При повторном отборе каждая попавшая в выборку единица после фиксации значения изучаемого признака возвращается в генеральную совокупность и может быть опять случайно отобрана.
На практике чаще применяется бесповторный отбор, когда отобранные единицы в генеральную совокупность не возвращаются.
Повторный отбор:
1) для показателя средней величины количественного варьирующего признака: (1),
2) для показателя доли альтернативного признака: (2),
Бесповторный отбор.
При этом способе отбора численность единиц генеральной совокупности сокращается в процессе выборки, поэтому:
1) для показателя средней величины количественного признака: (3),
2) для показателя доли альтернативного признака: (4)
По правилам математической статистики значение средней ошибки выборки должно определяться не через выборочную дисперсию, а через генеральную дисперсию, но она, чаще всего, на практике при проведении выборочного обследования бывает неизвестна.
Доказано, что (5)
при достаточно большом значении n ( ) отношение близко к единице, т.е. при соблюдении принципа случайного отбора дисперсия большого объёма выборки близка к дисперсии в генеральной совокупности. Поэтому на практике для определения средней ошибки выборки обычно применяют дисперсию выборочную.
Приведённые формулы (1),(2),(3),(4) позволяют определить среднюю величину отклонений, равную , характеристик генеральной совокупности от выборочных характеристик. Доказано, что генеральные характеристики отклоняются от выборочных на величину ±μ с вероятностью равной 0,638. Это означает, что в 683 случаях из 1000 генеральная доля (генеральная средняя) будет находиться в пределах ±μ от выборочной доли (выборочной средней) , а в 317 случаях выйдет за эти пределы.
Вероятность суждений можно повысить, а границы характеристик генеральной совокупности расширить, если увеличить среднюю ошибку выборки в несколько раз (t раз, t=2,3,4...).
Величина, полученная как произведение t и средней ошибки выборки, называется предельной ошибкой выборки, т.е.
(6) и (7), где
t – коэффициент доверия, он зависит от вероятности, с которой можно гарантировать, что предельная ошибка не превысит t-кратную среднюю ошибку, находится по готовым таблицам функции F(t), определённой русским математиком А.М.Ляпуновым применительно к нормальному распределению.
На практике часто применяется несплошное обследование, при котором выборка образуется из небольшого числа единиц генеральной совокупности, обычно, не больше 30 единиц. Такая выборка называется малой выборкой.
Средняя ошибка малой выборки определяется по формуле: (8)
Так как при малой выборке отношение имеет существенное значение, дисперсия малой выборки определяется с учётом числа степеней свободы. Под ним понимается количество вариантов, которые могут принимать произвольные значения, не меняя величины средней, оно обычно для малой выборки =(n-1):
(9), (10) Зная доверительную вероятность малой выборки (обычно, 0,95 или 0,99) и численность выборки n, можно определить величину t по специальной таблице Стьюдента.