III. Нахождение ошибок выборки
Собственно-случайный способ.
Заключается в отборе единиц наугад или на удачу, без каких-либо элементов системности. При этом используется метод жеребьевки или таблица случайных чисел.
Механический способ.
Применяется, когда генеральная совокупность каким-либо образом упорядочена, т.е. имеется определённая последовательность в расположении единиц: табельные номера работников, списки избирателей, телефонные номера респондентов, номера домов и квартир т.п.
При этом устанавливается процент отбора, исходя из которого определяется число отобранных единиц.
Пример: При формировании 5% выборки из 1 млн. единиц необходимо обследовать 50 тыс., т.е. из каждых 20 единиц одну (пропорция: 1/20 или 50 тыс./1 млн.).
Типическая выборка.
Используется когда все единицы генеральной совокупности можно разбить на несколько типичных групп. При этом выборка единиц из каждой группы проводится собственно-случайным или механическим способом.
Пример: Данная выборка используется:
а) при обследовании населения по районам, социальным, возрастным и другим социально-экономическим группам;
б) при обследовании предприятий по отраслям, формам собственности и другим группам.
Отбор единиц может быть организован:
А) Пропорционально объёму групп. Число единиц, подлежащих отбору из каждой группы, определяется:
ni = n х Ni / N , где
Ni – объем i-й группы в генеральной совокупности;
ni – объем выборки из i-й группы.
Б) Пропорционально групповой дифференциации признака. Число единиц выборки определяется:
δi Ni
ni = n х , где
Σ δi Ni
δi – среднее квадратическое отклонение признака в i-й группе.
Серийный отбор.
Применяется, когда единицы совокупности объединены в небольшие группы или серии. В качестве серий могут рассматриваться упаковки товаров, студенческие группы, бригады рабочих т.п.
Сущность его заключается в собственно-случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц.
Комбинированная выборка.
Представляет сочетание различных видов выборки.
Пример:
а) Типическая и серийная выборки. Используются, когда серии отбираются в установленном порядке из нескольких типичных групп.
б) Серийная и собственно-случайная выборки. Применяется, когда отдельные единицы отбираются внутри серий в собственно-случайном порядке.
III. Нахождение ошибок выборки.
В процессе проведения выборочного наблюдения различают 2 вида ошибок:
1. Систематические. Возникают в связи с принятым способом отбора или нарушением его правил. Их можно избежать при правильной организации и проведении наблюдения.
Пример: Результаты проводимых в России обследований бюджетов домашних хозяйств содержат значительную систематическую ошибку, т.к. в выборочной совокупности фактически не представлены наиболее богатые и наиболее бедные слои населения.
2. Ошибки репрезентативности (случайные).
Они неизбежно возникают вследствие различий характеристик выборочной и генеральной совокупности и представляют собой разность между параметрами генеральной и выборочной совокупности:
1) ошибка доли: εw = р – w
2) ошибка средней: εх = – ;
Для характеристики надёжности выборочных показателей определяют среднюю (μ) и предельную (Δ) ошибки выборки. Они зависят как от объёма выборочной совокупности (чем он выше, тем меньше ошибка), так и от степени варьирования (колеблемости) признака, характеризуемой дисперсией – δ2 (чем она меньше, тем меньше ошибка).
Таблица 1
Формулы расчета средней и предельной ошибки выборки при собственно-случайном и механическом отборе.
Ошибки выборочного наблюдения при нахождении средней | Ошибки выборочного наблюдения при нахождении доли | |
1. Средняя ошибка | ||
а) при повторном отборе: δ2 μх = n | а) при повторном отборе: w (1 – w) μw = n | |
б) при бесповторном отборе: δ2 n μх = 1 – n N | б) при бесповторном отборе: w (1 – w) n μw = 1 – n N | |
Ошибки выборочного наблюдения при нахождении средней | Ошибки выборочного наблюдения при нахождении доли | |
2. Предельная ошибка | ||
а) при повторном отборе: δ2 Δх = t х n | а) при повторном отборе: w (1 – w) Δ w = t х n | |
б) при бесповторном отборе: δ2 n Δ х = t х 1 – n N | б) при бесповторном отборе: w (1 – w) n Δw = t х 1 – n N | |
μх – средняя ошибка средней;
μw – средняя ошибка доли;
Δх – предельная ошибка средней;
Δw – предельная ошибка доли;
(1 – n / N) – поправка на бесповторный отбор;
(1 – w) – доля единиц не обладающих обследуемым признаком;
t – коэффициент гарантии (доверия).
Представляет собой нормированное отклонение, зависящее от вероятности (Р), с которой гарантируется предельная ошибка выборки. Определяется по таблице Фишера.
Таблица 2
Таблица Фишера (извлечение).
t | 1,5 | 1,96 | 2,58 | 3,5 | |||
Р(t) | 0,683 | 0,866 | 0,95 | 0,954 | 0,99 | 0,997 | 0,999 |
Предельная ошибка отвечает на вопрос о точности выборки с вероятностью Р, значение которой определяется коэффициентом t.
Пример: При t = 1 предельная ошибка будет равна средней ошибке, т.е. с вероятностью 0,683 или 68,3% можно утверждать, что разность между выборочными и генеральными показателями не превысит величины средней ошибки выборки.
С помощью предельной ошибки можно определить возможные пределы, в которых будут находиться характеристики генеральной совокупности:
а) для средней: х – Δх ≤ ≥ х + Δх или – х = ± Δх
б) для доли: w – Δw ≤ p ≥ w + Δw или р – w = ± Δw
Наряду с абсолютными значениями предельной ошибки определяется относительная ошибка выборки:
а) для средней:
Δ% = Δх / х х 100% ;
б) для доли:
Δ% = Δw / w х 100%
Если величина относительной ошибки не превышает заранее установленного для данного обследования предельного значения, то данные выборочного наблюдения являются представительными и могут быть распространены на генеральную совокупность. В противном случае следует попытаться восстановить исходные пропорции выборки.