Тема 7. Выборочный метод в статистике. Способы формирования выборочных совокупностей. Методология и практика выборочного наблюдения
Статистическое исследование может осуществляться по данным несплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной её части. Одним из наиболее распространенных методов несплошного наблюдения является выборочный.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора.
Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки.
В математической статистике значение средней ошибки выборки определяется по формуле:
- для бесповторного случайного отбора;
Средняя ошибка выборочной доли:
- бесповторного случайного отбора.
Для определения коэффициента доверия t при заданной степени вероятности Р значения t определяется по специальной таблице, которые приводятся » учебнике "Общая теория статистики", под ред. проф. А, А. Спирина и проф. О», Э. Байтной.
Выборочный метод - это такое несплошное наблюдение, при котором подлежащие обследованию единицы отбираются в случайном порядке, отобранная часть изучается, а результаты распространяются на всю исходную совокуп-ность.Совокупность, из которой проводится отбор, называется генеральной (все обобщающие показатели совокупности - генеральными). Совокупность отобранных единиц именуют выборочной, а ее обобщающие показатели - выборочными.
Применяя выборочный метод, обычно используют два вида обобщаю показателей: среднюю величину количественного признака и относительную личину альтернативного признака (долю единиц, обладающую тем или ины признаком).
Приведем обозначения основных характеристик параметров генеральной и выборочной совокупностей (табл.6).
Таблица 6. Обозначения основных характеристик параметров генеральной и выборочной совокупностей
Характеристика | Генеральная совокупность | Выборочная совокупность |
Объем совокупности (численность единиц) | N | n |
Численность единиц, обладающих обследуемым признаком | M | m |
Доля единиц, обладающих обследуемым признаком | ||
Средний размер признака | ||
Дисперсия количественного признака | ||
Дисперсия доли |
Ошибки, возникающие при выборочном наблюдении. Основная задача выборочного наблюдения в экономике состоит в том, чтобы на основе характеристик выборочной совокупности (средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При решении этой задачи возникают ошибки двух видов: регистрации и репрезентативности (рис.1). Ошибки репрезентативности присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную.
Степень точности выборочных оценок зависит от величины ошибки репрезентативности. В общем виде ошибка репрезентативности, или предельная ошибка выборки, характеризуется величиной расхождения параметров выборочной и генеральной совокупностей. Так, для средней величины имеем:
где - предельная ошибка выборки;
- выборочная средняя;
- генеральная средняя.
Величина предельной ошибки выборки в соответствии с теоремами теории вероятностей будет кратна средней ошибке:
;
где t- нормированные отклонения, зависящие от вероятности, с которой гарантируется результат;
- средняя квадратическая стандартная ошибка выборки. Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:
- для средней: ;
- для доли: ;
Это означает, что с заданной вероятностью можно утверждать, что значение генеральной средней следует ожидать в пределах от , до .
Аналогичным образом может быть записан доверительный интервал генеральной доли:
;
Значения вероятности (функция Ф(t)) при различных значениях t определяются
на основе специально составленных таблиц. Приведем некоторые значения, применяемые наиболее часто для выборок достаточно большого объема (n = 30):
t 1,000 1.960 2,000 2,580 3,000
Ф(t) 0,683 0,950 0,954 0,990 0.997
Классификация выборок. Виды выборок различаются в зависимости от вида метода и способа отбора, а также степени охвата единиц совокупности (рис. 2).
При повторном отборе общая численность единиц генеральной совокупности остается неизменной. Та или иная единица, попавшая в выборку, после регистрации возвращается в генеральную совокупность и сохраняет равную возможность со всеми прочими единицами при повторном отборе вновь попасть в выборку.
При бесповторном отборе единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует. Таким образом, численность единиц генеральной совокупности сокращается в процессе отбора.
К собственно-случайной выборке относится отбор единиц из всей генеральной совокупности (без предварительного расчленения ее на группы) посредством жеребьевки (преимущественно) или иного подобного способа, например с помощью таблицы случайных чисел.
Средняя и предельная ошибки собственно-случайной выборки вычисляются по следующим формулам (табл.7).
Таблица 7.Формулы ошибок собственно-случайной выборки.
Повторная выборка | Бесповторная выборка | ||
вид ошибки | формула | вид ошибки | формула |
Средняя ошибка для средней | Средняя ошибка для средней | ||
Предельная ошибка для средней | Предельная ошибка для средней | ||
Средняя ошибка для доли | Средняя ошибка для доли | ||
Предельная ошибка для доли | Предельная ошибка для доли |
о2—дисперсия признака х в выборочной совокупности
Литература [1,2, 5]
Контрольные задания.
Средние величины.
Задача № 1. На основании таможенной декларации произведено 5 - процентное обследование качества поступившей партии товара из Турции. При механическом способе отбора в выборку взято 400 шт., из которых 60 шт. оказались нестандартными. Средний вес одного изделия в выборке составил 12 кг., а среднеквадратическое отклонение ± 0,3 кг.
Определите:
1.С вероятностью 0. 954 пределы, в которых находится генеральная доля нестандартной продукции.
2.0пределите с вероятностью 0,99 пределы, в которых находиться средний вес одного изделия во всей партии товара.
Задача № 2. При изучении покупательского спроса произведено 5 - процентное выборочное обследование розничной продажи женских туфель. При механическом способе отбора в выборку кассовых чеков получено следующее распределение реализованной обуви по цене:
Цена, тыс. руб. | Число пар туфель |
До 50 | |
50-60 | |
60-70 | |
70-80 | |
80 и выше |
На основе показателей выборочной совокупности определите для генеральной совокупности:
1. С вероятностью 0, 954 возможные значения доли продажи обуви по цене до 50 тыс. руб.
2. С вероятностью 0,977 возможные значения средней цены.
Указание. Для определения в пункте 2 средней ошибки выборки надо по данным ряда распределения исчислить среднюю цену одной пары обуви и дисперсию.
Задача № 3. Для выявления причин роста преступности в Ростовской области было произведено 3-процентное выборочное обследование. При механическом способе отбора в выборку попали следующие данные о возрасте преступников:
Возраст, лет | Число совершенных преступлений |
до 16 лет | |
16-18 | |
18-20 | |
20-22 | |
22-24 |
На основании данных выборочной совокупности:
1.Установите для всей совокупности с вероятностью 0, 954 возможные пределы возраста несовершеннолетних.
2.С вероятностью 0,997 определите пределы среднего возраста преступников.
3. Сделайте выводы.
Задачи № 4 . В городе А проживает 20 тыс. семей. В порядке случайной бесповторной выборки установите долю семей с доходом на душу 150 тыс. руб. и м нее. Какова должна быть численность выборки, чтобы с вероятностью 0,997 ошибка выборки не превышала 0,03 , если на основе предыдущих обследований известно, что дисперсия равна 0,16.
Задача № 5. Произведено выборочное наблюдение для установления процента изделий высшего сорта в партии однородной продукции. При механическом отборе из партии в 10000 единиц готовых изделий было обследовано 400 единиц, из которых 320 единиц отнесено к высшему сорту.
Определить с вероятностью 0,997 возможный процент изделий высшего сорта во всей партии.
Задача №6. При выборочном изучении квалификации рабочих на одном заводе, где работает 2000 человек, получено следующее распределение 100 рабочих по тарифным разрядам (рабочие отбирались по схеме случайного бесповторного
Тарифный разряд | ||||||
Число отобранных рабочих |
Определить, в каких пределах находятся в генеральной совокупности средний тарифный разряд (с вероятностью 0,954) и доля рабочих, имеющих 5 и 6 разряды (с вероятностью 0,683).
Задача №7. Выборочным обследованием было охвачено 10000 пассажиров пригородных поездов. На основе этого обследования установлена средняя дальность поездки пассажиров 24,2 км и среднее квадратическое отклонение - 12 км.
Определить возможные пределы средней дальности поездки пассажиров при вероятности:
а) 0,683;
б) 0,954;
в) 0,997.
Задача №8. По городской телефонной сети в порядке механической выборки произвели 100 наблюдений и установили среднюю продолжительность одного телефонного разговора 5 минут при среднем квадратическом отклонении 2 минуты.
Какова вероятность того, что предельная ошибка выборки при определении продолжительности телефонного разговора не превысит 18 секунд?
Задача №9. На основе выборочного обследования на почтамте предполагается определить долю простых писем, отправляемых частными лицами. Никаких предварительных данных об удельном весе этих писем в общей массе простой корреспонденции не имеется. Результаты выборки требуется дать с точностью до 1% и гарантировать с вероятностью 0,9.
Какова должна быть численность механической выборки?