Способы отборы и виды выборочного наблюдения
Выборочное наблюдение – это вид не сплошного наблюдения, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке. Отобранная часть изучается, а результат распространяется на всю исходную совокупность.
Генеральная совокупность – это совокупность, из которой производится отбор.
Выборочная совокупность (выборка) – часть единиц генеральной совокупности, которая непосредственно обследуется при выборочном наблюдении.
Таблица 1 – Основные характеристики генеральной и выборочной совокупности
Характеристика | Генеральная совокупность | Выборочная совокупность |
Объем совокупности | N | N |
Число единиц совокупности обладающих обследуемым признаком | M | m |
Доля единиц обладающих обследуемым признаком | P= | W= |
Среднее значение признака | ||
Дисперсия количественного признака | Генеральная дисперсия | Выборочная дисперсия |
Дисперсия альтернативного признака (доли) | ||
Число серий | R | r |
Основная задача выборочного наблюдения на основе характеристик выборки получить достоверное суждение о показателях (характеристиках) генеральной совокупности
Принципы выборочного наблюдения.
1. Принцип случайного отбора, т. е у отдельных единиц генеральной совокупности должна быть равная возможность попасть в выборочную совокупность.
2. Принцип достаточного числа единиц выборки.
Соблюдение этих принципов позволяет получить репрезентативную выборку. Отбор единиц в выборку может быть повторным и безповторным. При повторном отборе единица генеральной совокупности, попавшая в выборку после обследования, возвращается в генеральную совокупность и в дальнейшем отборе участвует. При безповторном отборе единица генеральной совокупности, попавшая в выборку, после обследования не возвращается в генеральную совокупность и в дальнейшем отборе не участвует.
Виды выборок.
1. Собственно-случайная. Отбор производится из всей массы единиц генеральной совокупности без предварительного разделения на группы. При этом единицы отбираются в случайном порядке, не зависящем ни от расположения единиц в совокупности, ни от значения признака.(жеребьевка, таблица случайных чисел)
2. Механическая . Применяется в тех случаях когда генеральная совокупность каким–либо образом упорядочена. (номера домов). При проведении механического отбора устанавливают шаг отсчета (h) т.е. расстояние между отбираемыми единицами. h = N/n. И начала отсчета – номер единицы которая должна быть обследована первой. Механический отбор всегда бесповторный при достаточно большом объеме совокупности механический отбор по точности близок к собственно-случайной выборки.
3. Типическая. Используется в тех случаях, когда все единицы генеральной совокупности могут быть объединены в несколько крупных типических групп по какому–либо существенному признаку. Отбор единиц в выборку осуществляется собственно – случайным или механическим способом. Отбор единиц в типическую выборку может быть организован либо пропорционально объему типических групп , либо пропорционально внутригрупповой вариации признака.
4. Серийная. Заключается в собственно – случайном или механическом отборе групп единиц(серий) внутри которых производится сплошное наблюдение. Единицей отбора является группа или серия, а не отдельные единицы генеральной совокупности.
5. Комбинированная. Предполагает использование нескольких рассмотренных выше способов выборки.
Вопрос. Ошибки выборки.
Основной задачей выборочного наблюдения является определение ошибок выборки, т.е. возможных расхождений между выборочной средней ( ) и генеральной средней ( ) или между выборочной долей ( ) и генеральной долей ( ).
Средняя (стандартная) ошибка выборки – обозначается буквой ( ) называется среднее квадратическое отклонение возможных значений выборочной средней ( ) от генеральной средней ( )
L – число всевозможных выборок
– выборочное среднее
1 ≤ i ≤ l
02.04.13 лекция
Или выборочной доли w от генеральной доли (p)
Средняя ошибка выборки (мю) характеризует среднюю величину возможных расхождений выборочной и генеральной средней (или доли).
В математической статистике доказывается что в случае повторной выборки (мю квадр) – дисперсия возможных значений выборочной средней, в n раз меньше дисперсии изучаемого признака в генеральной совокупности. ., .
Таким образом средняя ошибка выборки тем меньше, чем больше объем выборки n .
Средняя ошибка выборки зависит от степени вариации изучаемого признака. Характеристикой вариации выступает генеральная дисперсия.
Чем меньше вариация признака тем меньше средняя ошибка выборки.
Таблица 2. Средняя ошибка в зависимости от способа формирования выборочной совокупности.
Вид выборки | Повторный отбор | Бесповторный отбор | ||
Для средней (мю х волн) | Для доли (мю w) | Для средней (мю х волн) | Для доли (мю w) | |
Собственно-случайная или механическая | ||||
Типическая (при отборе пропорциональна объему групп) | ||||
Серийный |
1. При расчете средней ошибки выборки при бесповторном отборе под знаком радикала появляется множитель (1-n/N)
2. На практике величина дисперсии признака генеральной совокупности неизвестна, по этому формулы ошибки выборки подставляют дисперсию выборочной совокупности. Выборочная дисперсия несколько меньше генеральной. В математической статистике доказывается следующее равенство . При достаточно больших n , и выборочная дисперсия практически совпадает с генеральной дисперсией. . Выборку считают безусловно большой при n>100. Выборку считают безусловно малой при n меньше 20, средняя ошибка малой выборки
3. При типической выборке средняя ошибка зависит только от средней групповых дисперсий .
.
4. При серийной выборке средняя ошибка зависит не от числа обследованных единиц, а от числа обследованных серий r и от величины меж серийной дисперсии. . Хi (с волной) – среднее i серии, х (с волной) – общее среднее по всех выборке. . Wi – доли единиц определенной категории в iй серии w( с волной) - доля единиц в этой категории во всей выборочной совокупности.
Предельная ошибка выборки
Предельная ошибка выборки – максимально возможной расхождение выборочной и генеральной характеристик. Обозначают (дельта треугольник)
Предельная ошибка выборки (дельта) рассчитывается как t кратное значение ошибки .
t называется коэффициентом доверия и определяется по специальным таблицам в зависимости от доверительной вероятности . При достаточно больших значениях n (Интеграл Лапласа) (рисунок 29)
t | 1,96 | 2,0 | 2,58 | 3,0 | |
F(t) | 0,683 | 0,95 | 0,954 | 0,99 | 0,997 |
При t=1 вероятность F(t) отклонение выборочных характеристик от генеральных на величину однократной средней ошибки (мю) равна 0,683
. Следовательно, в среднем у каждой из 1000 выборок 683 дадут обобщающие показатели (средняя или доля) которые будут отличаться от генеральных не более чем на однократную среднюю ошибку (мю). При t=2, F(t)=0,954, что означает, что в среднем у каждой тысячи выборок 954 дадут обобщающие показатели, которые будут отличаться от генеральных не более чем на двукратную среднюю ошибку (мю) .
В случае малой выборки n меньше 30 вероятность попадания среднего значения изучаемого признака генеральной совокупности в пределы от (равносильно определяется по формуле . Случайная величина для малых выборок имеет распределение Стьюдента. (РИСУНОК 35)
S(t) называется функцией вероятности Стьюдента и характеризует вероятность того, что рассчитанные коэффициент доверия t фактическое не превысит заданного t табличного.
3 вопрос. Предельная ошибка выборки позволяет определить:
1. Доверительные интервалы для генеральной средней и для генеральной доли.
,
,
.
Пределы, в которых заданной вероятностью будет заключен неизвестный показатель генеральной совокупности называются доверительным интервалом, а вероятность доверительной вероятностью.
2. Вероятность допуска той или иной заданной предельной ошибки (дельта). Для этого сначала рассчитывают коэффициент доверия t = (дельта на мю) и затем находят F(t) по таблице значений интеграла Лапласа (при n больше 30) или S (t) по таблице значений функций Стьюдента, а затем 2S(t) – 1
3. Необходимую численность выборки n, обеспечивающие с определенной вероятностью заданную точность (дельта). Формулы для n получаются из соответствующих формул предельной ошибки
Таблица 3. Численность выборки при собственно-случайном отборе.
Способ отбора | Формула расчета для | |
Средней | Доли | |
Повторный | ||
Бесповторный |
Пи определении необходимого объема выборки n по приведенным формулам возникает трудность в нахождении (сигмы квадрат) и w. Так как эти величины можно получить только после проведения выборочного обследования. В этом случае подставляют приближенные значения, которые могли быть получены на основе пробных наблюдений, или из аналогичных предыдущих обследований. Если известно (икс с чертой) (по стандартам инструкциям и т.д.), то сигму берут равной 1/3(икс с чертой). Если известен размах вариации R, то (сигма) =1/6R для распределения близких к нормальному, или (сигма)=1/5.
Тема 7. Ряды динамики.
Ряды динамики и их виды.