Методы отбора единиц наблюдения
ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Основные вопросы
10.1. Понятие и этапы выборочного наблюдения
10.2. Ошибки выборки
10.3. Малая выборка
10.4. Методы отбора единиц наблюдения
10.1. Понятие и этапы выборочного наблюдения
Часто возникает необходимость определения средних и относительных величин для какой-либо совокупности на основе данных выборочного наблюдения. В этом случае из всей совокупности с помощью специальных приёмов отбирается определённая часть, для которой рассчитываются все необходимые характеристики. Результаты выборочного обследования с учётом возможных погрешностей переносятся на всю совокупность. При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью.Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой.
Выборочный метод применяется в том случае, когда невозможно проведение сплошного обследования изучаемой совокупности или в нём нет необходимости. Например, при проверке качества продукции или обследовании большого количества населения.
Отбор единиц наблюдения из генеральной совокупности в выборочную совокупность может быть повторным и бесповторным.
Повторным называется отбор, в результате которого каждая отобранная единица вновь возвращается обратно в совокупность и производится отбор следующей единицы.
Бесповторным называется отбор, при котором однажды отобранная из генеральной совокупности единица не может попасть в выборку во второй раз.
Этапывыборочного наблюдения:
1) определение объекта и целей выборочного наблюдения;
2) выбор схемы отбора единиц для наблюдения;
3) расчет объема выборки;
4) проведение случайного отбора установленного числа единиц из генеральной совокупности;
5) наблюдение отобранных единиц по установленной программе;
6) расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
7) определение ошибки, ее размера;
8) распространение выборочных данных на генеральную совокупность;
9) анализ и интерпретация полученных данных.
Основной задачей выборочного метода является определение характеристик генеральной совокупности – генеральной средней и генеральной доли (p) на основе расчёта основных показателей выборочной совокупности, т.е. выборочной средней и выборочной доли (w), с учётом средней (μ) и предельной (∆) ошибок выборки.
Выборочная совокупность должна быть репрезентативной, т.е. достаточно точно отражать основные показатели генеральной совокупности. Для этого необходимо оценить величину ошибок, которые могут возникнуть в процессе проведения выборочного наблюдения.
Ошибки выборки
Ошибкой выборки называются пределы отклонений характеристик генеральной совокупности от характеристик выборочной совокупности.
Различают среднюю и предельную ошибки выборки.
Средняя ошибка выборки (μ) характеризует среднюю величину отклонения показателя выборочной совокупности от соответствующего показателя генеральной совокупности.
При повторном отборе средняя ошибка выборки определяется по формулам:
Средняя ошибка выборки при бесповторном отборе рассчитывается по формулам:
Согласно закону нормального распределения, вероятность появления такой величины ошибки выборки в данном случае равна 0,683. На практике часто возникает необходимость получения данных с большей вероятностью, поэтому рассчитывают предельную ошибку выборки.
Предельной ошибкой выборки (∆) называется отклонение выборочной характеристики от генеральной.
Предельная ошибка выборки определяется по формуле:
где средняя ошибка выборки;
коэффициент кратности, или коэффициент доверия, который зависит от заданной вероятности P.
P | t |
0,683 0,866 0,954 0,988 0,997 | 1,0 1,5 2,0 2,5 3,0 |
При повторном отборе предельная ошибка выборки определяется по формулам:
Предельная ошибка выборки при бесповторном отборе рассчитывается по формулам:
Также рассчитывается относительная величина предельной ошибки:
Относительную ошибку также можно вычислить по формуле:
где коэффициент вариации.
Если то выборка считается репрезентативной.
После расчёта предельной ошибки выборки определяются доверительные границы генеральной совокупности для изучаемого показателя:
Пример.Из партии товара в 4500 единиц было обследовано 300 шт., из которых 4,5% оказались бракованными. С вероятностью 0,954 определить пределы бракованной продукции во всей партии товара, если дисперсия составила 3,2.
Решение.При заданной вероятности коэффициент доверия составляет Рассчитываем предельную ошибку выборки для бесповторного отбора:
Определяем генеральную среднюю
т.е. доля бракованной продукции во всей партии товара находится в пределах от 2,2% до 6,8%.
Малая выборка
Малой выборкой называется вид несплошного статистического наблюдения, при котором объём выборочной совокупности не превышает 20 единиц.
Средняя ошибка малой выборки вычисляется по формуле:
где дисперсия малой выборки рассчитывается как
Предельная ошибка малой выборки:
причем значение коэффициента доверия определяется по специальной таблице распределения Стьюдента для малых выборок:
n | P | |
0,95 | 0,99 | |
3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,103 2,093 | 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 |
Следует заметить, что так как при малой выборке изучению подвергается небольшое число единиц наблюдения, то это может привести к значительному искажению результатов исследования. Поэтому малая выборка применяется в редких случаях и в основном для предварительного анализа изучаемой совокупности.
Методы отбора единиц наблюдения
В статистике используются различные способы отбора единиц наблюдения из генеральной совокупности в выборочную совокупность, т.е. методов формирования выборки. Выбор типа выборки зависит от задач исследования, а также от характера предварительной информации об изучаемом объекте.
Наиболее распространенными видами выборки являются собственно-случайная, механическая, типическая, серийная, комбинированная и многоступенчатая.
Собственно-случайная выборка.
При собственно-случайной выборке отбор единиц наблюдения из генеральной совокупности осуществляется либо путём жеребьёвки, либо с использованием таблицы случайных чисел. Основная задача состоит в том, чтобы обеспечить каждой единице совокупности равные шансы попасть в выборку. При этом количество отобранных в выборочную совокупность единиц обычно определяется исходя из принятой доли выборки.
Доля выборки есть отношение числа единиц выборочной совокупности n к численности единиц генеральной совокупности N:
Например, при 15%-ной выборке из партии товара в 3 000 единиц численность выборки составляет 450 единиц:
Средняя и предельная ошибки для повторного и бесповторного отбора при собственно-случайной выборке определяются по рассмотренным в вопросе 10.2 формулам.
Механическая выборка.
При механическом способе отбора генеральная совокупность разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица. Генеральная совокупность нумеруется от 1 до N и далее отбираются объекты для наблюдения через определенный интервал. Величина интервала при этом равна обратной величине доли выборки ( ).
Например, при 5%-ной выборке отбирается каждая 20-я единица (1:0,05), при 10%-ной выборке — каждая 10-я единица (1:0,1).
Механический отбор часто используется при проверке качества продукции, когда происходит последовательный выход готовых изделий с конвейера.
Средняя и предельная ошибки выборки при механическом способе определяются по рассмотренным в вопросе 10.2 формулам для бесповторного отбора.
Типическая выборка.
Если изучаемый объект отличается разнородностью состава, т.е. большой колеблемостью признака в генеральной совокупности, то преимущественно применяют типическую выборку. Например, при выборочном исследовании среднего уровня заработной платы работников одной отрасли. В этом случае совокупность вначале делится на однородные группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
Типическая выборка дает более точные результаты по сравнению с другими способами отбора единиц.
Если отбор внутри типических групп производится пропорционально их объёму, то число единиц наблюдения в каждой группе определяется по формуле:
где объём выборки из типической группы;
общий объём выборки;
общий объём типической группы;
объём генеральной совокупности.
Для определения средней ошибки типической выборки используются формулы:
– при повторном отборе
– при бесповторном отборе
где средняя дисперсия выборочной совокупности;
выборочная дисперсия доли.
Дисперсия определяется по следующим формулам:
Пример. С целью определения доли брака во всей партии изготовленных деталей была проведена 10 %-ная типическая выборка с отбором единиц пропорционально численности единиц типических групп. Внутри типических групп применялся метод механического отбора (бесповторный отбор). Результаты выборки представлены в таблице 10.1.
Таблица 10.1
Тип станка | Выработка одного станка, шт. | Процент брака по данным выборки | Дисперсия |
1 500 | 2,0 | 0,0196 | |
2 000 | 3,0 | 0,0291 | |
4 000 | 1,5 | 0,014775 | |
5 000 | 1,0 | 0,0099 | |
2 500 | 1,8 | 0,017676 | |
Итого | 15 000 |
С вероятностью 0,997 определить пределы, в которых находится доля брака во всей партии деталей, изготовленных на всех станках.
Решение.Определяем средний процент бракованных изделий в выборке:
Рассчитываем среднюю из внутригрупповых дисперсий:
Определяем предельную ошибку выборочного процента брака. Для типической бесповторной выборки с вероятностью 0,997:
Отсюда находим генеральную среднюю:
т.е. средний процент брака во всей партии товара находится в пределах от 1,6% до 1,66%.
Серийная выборка.
При серийной выборке генеральную совокупность делят на одинаковые по объёму и однородные между собой группы – серии. В выборочную совокупность случайным методом отбираются серии, внутри которых проводится сплошное наблюдение. Например, серийная выборка часто применяется при обследовании населения, когда отбираются отдельные территориальные образования, в которых опрашиваются все жители.
Серийная выборка обычно проводится как бесповторная. Предельная ошибка выборки при этом определяется по формуле:
где межсерийная дисперсия средней или доли;
число серий в генеральной совокупности;
число отобранных серий.
Межсерийная дисперсия определяется по формулам:
Пример. В одной из школ насчитывается 36 классов. С целью изучения успеваемости учеников произведено обследование 4 классов, в которых средняя успеваемость составила 4,1; 4,2; 3,8; 3,5 балла. С вероятностью 0,997 установить пределы, в которых будет находиться средний балл учеников всей школы.
Решение.Определяем выборочную среднюю серийной выборки:
Рассчитываем дисперсию серийной выборки:
Определяем предельную ошибку выборки с вероятностью 0,997 ( ):
Средний балл всех учеников школы будет находиться в пределах:
Выборка также может быть одноступенчатой и многоступенчатой. При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.
При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность.
Комбинированная выборка.
Комбинированная выборка представляет сочетание различных способов отбора единиц наблюдения из генеральной совокупности. Комбинированная выборка может быть двухступенчатой. При этом генеральная совокупность сначала разбивается на группы. Затем производят отбор групп, а внутри последних осуществляется отбор отдельных единиц.
Контрольные вопросы
1. В каких случаях проводится выборочное наблюдение?
2. Что означает генеральная и выборочная совокупности?
3. Дайте характеристику повторного и бесповторного отбора единиц наблюдения.
4. Перечислите этапы выборочного наблюдения.
5. Что означает репрезентативность выборки?
6. По каким формулам определяются средняя и предельная ошибки выборки?
7. Что означает малая выборка?
8. В каких случаях применяется малая выборка?
9. Какие существуют способы отбора единиц наблюдения из генеральной совокупности в выборочную совокупность?
10. Как определяется средняя и предельная ошибки собственно-случайной и механической выборки?
11. По каким формулам вычисляются средняя и предельная ошибки при типической и серийной выборках?
12. Что означает комбинированная выборка?
Задачи и упражнения
Задача 1
Для определения качества товара в 3000 единиц была проведена 10%-ная механическая выборка и в результате установлено, что 82% из отобранных изделий соответствует стандарту.
С вероятностью 0,997 определить процент продукции, соответствующего стандарту, во всей партии товара.
Задача 2
В результате выборочного обследования населения города установлено, что из 1000 отобранных жителей 258 имеют среднедушевой денежный доход в пределах от 3564 до 3855 руб. в месяц. С вероятностью 0,954 установить доверительные пределы жителей всего города с указанным уровнем среднедушевого дохода.
Задача 3
Для определения среднего уровня успеваемости проведена 3%‑ная типическая выборка учащихся из пяти школ:
Школа | Объем выборки, чел., | Средняя успеваемость, | Дисперсия, %, |
3,8 3,7 4,2 3,9 4,4 |
С вероятностью 0,997 определить пределы, в которых будет находиться средняя успеваемость всех учеников.
Задача 4
В вузе проведена выборочная контрольная работа по профилирующему предмету у 250 студентов очного отделения и 140 студентов заочного отделения. Результаты контрольной работы следующие:
Студенты | Численность студентов | Средний балл за контрольную работу, | Среднее квадратическое отклонение, |
Очники Заочники | 4,1 3,7 | 2,5 1,8 |
Определить:
1. Общий средний балл за контрольную работу по выборочным данным.
2. С вероятностью 0,997 доверительные пределы среднего балла за контрольную работу студентов в генеральной совокупности.
РАЗДЕЛ 2. СОЦИАЛЬНО-ЭКОНОМИЧЕСКАЯ СТАТИСТИКА
ГЛАВА 11_________________________________________