Собственно-случайная выборка
Способ ориентирован на выборку единиц из генеральной совокупности без всякого расчленения на части или группы. При этом для соблюдения основного принципа выборки – равной возможности всем единицам генеральной совокупности быть отобранным – используются схема случайного извлечения единиц путем жеребьевки (лотереи) или таблицы случайных чисел. Возможен повторный и бесповторный отбор единиц.
Средняя ошибка собственно-случайной выборкипредставляет собойсреднеквадратическое отклонение возможных значений выборочной средней от генеральной средней. Средние ошибки выборки при собственно-случайном методе отбора представлены в табл. 7.2.
Таблица 7.2
Средняя ошибка выборки μ | При отборе | |
повторном | бесповторном | |
Для средней | ||
Для доли |
В таблице использованы следующие обозначения:
– дисперсия выборочной совокупности;
– численность выборки;
– численность генеральной совокупности;
– выборочная доля единиц, обладающих изучаемым признаком;
– число единиц, обладающих изучаемым признаком;
– численность выборки.
Для увеличения точности вместо множителя следует брать множитель , но при большой численности N различие между этими выражениями практического значения не имеет.
Предельная ошибка собственно-случайной выборки рассчитывается по формуле
, (7.6)
где t – коэффициент доверия зависит от значения вероятности.
Пример. При обследовании 100 образцов изделий, отобранных из партии в случайном порядке, 20 оказалось нестандартными. С вероятностью 0,954 определите пределы, в которых находится доля нестандартной продукции в партии.
Решение. Вычислим генеральную долю (Р): .
Доля нестандартной продукции: .
Предельная ошибка выборочной доли с вероятностью 0,954 рассчитывается по формуле (7.6) с применением формулы табл. 7.2 для доли:
С вероятностью 0,954 можно утверждать, что доля нестандартной продукции в партии товара находится в пределах 12 % ≤ P ≤ 28 %.
В практике проектирования выборочного наблюдения возникает потребность определения численности выборки, которая необходима для обеспечения определенной точности расчета генеральных средних. Предельная ошибка выборки и ее вероятность при этом являются заданными. Из формулы и формул средних ошибок выборки устанавливается необходимая численность выборки. Формулы для определения численности выборки (n) зависят от способа отбора. Расчет численности для собственно-случайной выборки приведен в табл. 7.3.
Таблица 7.3
Предполагаемый отбор | Формулы | |
для средней | для доли | |
Повторный | ||
Бесповторный |
Механическая выборка
При этом методе исходят из учета некоторых особенностей расположения объектов в генеральной совокупности, их упорядоченности (по списку, номеру, алфавиту). Механическая выборка осуществляется путем отбора отдельных объектов генеральной совокупности через определенный интервал (каждый 10-й или 20-й). Интервал рассчитывается по отношению к , где n – численность выборки, N – численность генеральной совокупности. Так, если из совокупности в 500 000 единиц предполагается получить 2%-ю выборку, т. е. отобрать 10 000 единиц, то пропорция отбора составит Отбор единиц осуществляется в соответствии с установленной пропорцией через равные интервалы. Если расположение объектов в генеральной совокупности носит случайный характер, то механическая выборка по содержанию аналогична случайному отбору. При механическом отборе применяется только бесповторная выборка [1, 5–10].
Средняя ошибка и численность выборки при механическом отборе подсчитывается по формулам собственно-случайной выборки (табл.7.2 и 7.3).
Типическая выборка
При типической выборке генеральная совокупность делится по некоторым существенным признакам на типические группы; отбор единиц производится из типических групп. При этом способе отбора генеральная совокупность расчленяется на однородные в некотором отношении группы, которые имеют свои характеристики, и вопрос сводится к определению объема выборок из каждой группы. Может быть равномерная выборка – при этом способе из каждой типической группы отбирается одинаковое число единиц Такой подход оправдан лишь при равенстве численностей исходных типических групп. При типическом отборе, непропорциональном объему групп, общее число отбираемых единиц делится на число типических групп. Полученная величина дает численность отбора из каждой типической группы.
Более совершенной формой отбора является пропорциональная выборка. Пропорциональной называется такая схема формирования выборочной совокупности, когда численность выборок, взятых из каждой типической группы в генеральной совокупности, пропорциональна численностям, дисперсиям (или комбинированно и численностям, и дисперсиям). Условно определяем численность выборки в 100 единиц и отбираем единицы из групп:
· пропорционально численности их генеральной совокупности(табл. 7.4). В таблице обозначено:
Ni – численность типической группы;
dj – доля (Ni/N);
N – численность генеральной совокупности;
ni – численность выборки из типической группы вычисляется по формуле
; (7.7)
n – численность выборки из генеральной совокупности.
Таблица 7.4
Группы | Ni | dj | ni |
0,3 | |||
0,5 | |||
0,2 | |||
1,0 |
· пропорционально среднему квадратическому отклонению (табл. 7.5). Здесь si – среднее квадратическое отклонение типических групп; ni – численность выборки из типической группы вычисляется по формуле
(7.8)
Таблица 7.5
Ni | si | ni | |
0.25 | |||
0.35 |
Продолжение табл. 7.5
Ni | si | ni | |
0.40 | |||
1.0 |
· комбинированно(табл. 7.6). Численность выборки вычисляется по формуле
. (7.9)
Таблица 7.6
si | siNi | |||
0.23 | ||||
0.53 | ||||
0.24 | ||||
1.0 |
При проведении типической выборки непосредственный отбор из каждой группы проводится методом случайного отбора.
Средние ошибки выборки рассчитываются по формулам табл. 7.7 в зависимости от способа отбора из типических групп.
Таблица 7.7
Способ отбора | Повторный | Бесповторный | ||
для средней | для доли | для средней | для доли | |
Непропорциональный объему групп | ||||
Пропорциональный объему групп |
Продолжение табл. 7.7
Способ отбора | Повторный | Бесповторный | ||
для средней | для доли | для средней | для доли | |
Пропорциональный колеблемости в группах (является наивыгоднейшим) |
Здесь – средняя из внутригрупповых дисперсий типических групп;
– доля единиц, обладающих изучаемым признаком;
– средняя из внутригрупповых дисперсий для доли;
– среднее квадратическое отклонение в выборке из i-й типической группы;
– объем выборки из типической группы;
– общий объем выборки;
– объем типической группы;
– объем генеральной совокупности.
Численность выборки из каждой типической группы должна быть пропорциональна среднему квадратическому отклонению в этой группе . Расчет численности производится по формулам, приведенным в табл. 7.8.
Таблица 7.8
Повторный | Бесповторный | |
Для определения средней |
Продолжение табл. 7.8
Для определения доли |
4. Серийная выборка
Данный способ отбора удобен в тех случаях, когда единицы совокупности объединены в небольшие группы или серии. При серийной выборке генеральную совокупность делят на одинаковые по объему группы – серии. В выборочную совокупность отбираются серии. Сущность серийной выборки заключается в случайном или механическом отборе серий, внутри которых производится сплошное обследование единиц. Средняя ошибка серийной выборки с равновеликими сериями зависит от величины только межгрупповой дисперсии. Средние ошибки сведены в табл. 7.9.
Таблица 7.9
Способ отбора серии | Формулы | |
для средней | для доли | |
Повторный | ||
Бесповторный |
Здесь R – число серий в генеральной совокупности;
r – число отобранных серий;
– межсерийная (межгрупповая) дисперсия средних;
– межсерийная (межгрупповая) дисперсия доли.
При серийном отборе необходимую численность отбираемых серий определяют так же, как и при собственно-случайном методе отбора.
Расчет численности серийной выборки производится по формулам, приведенным в табл. 7.10.
Таблица 7.10
Повторный | Бесповторный | |
Для определения среднего признака | ||
Для определения доли |
Пример. В механическом цехе завода в десяти бригадах работает 100 рабочих. В целях изучения квалификации рабочих была произведена 20%-я серийная бесповторная выборка, в которую вошли 2 бригады. Получено следующее распределение обследованных рабочих по разрядам.
Рабочие | Разряды рабочих в бригаде 1 | Разряды рабочих в бригаде 2 | Рабочие | Разряды рабочих в бригаде 1 | Разряды рабочих в бригаде 2 |
Необходимо определить с вероятностью 0,997 пределы, в которых находится средний разряд рабочих механического цеха.
Решение. Определим выборочные средние по бригадам и общую среднюю как среднюю взвешенную из групповых средних:
Определим межсерийную дисперсию по формулам (5.25):
Рассчитаем среднюю ошибку выборки по формуле табл. 7.9.
Вычислим предельную ошибку выборки с вероятностью 0,997:
С вероятностью 0,997 можно утверждать, что средний разряд рабочих механического цеха находится в пределах
Комбинированная выборка
В практике статистических исследований, помимо рассмотренных выше способов отбора, применяется и их комбинация. Например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и случайного отборов, при которой отдельные единицы отбираются внутри серии в случайном порядке
[1, 5–11].
Малая выборка
При большом числе единиц выборочной совокупности (n >100) распределение случайных ошибок выборочной средней, в соответствии с теорией А.М. Ляпунова, нормально или приближается к нормальному по мере увеличения числа наблюдений. Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа. Расчет ошибки выборки базируется на величине генеральной дисперсии , так как при больших n коэффициент , на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.
Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с небольшими по объему так называемыми малыми выборками. Под малой выборкой понимается такое выборочное наблюдение, численность единиц которого не превышает 30. В настоящее время малая выборка используется более широко, чем раньше, прежде всего за счет статистического изучения деятельности малых и средних предприятий, коммерческих банков, фермерских хозяйств и т. д.
Разработка теории малой выборки была начата английским статистиком В.С. Госсетом (печатавшимся под псевдонимом “Стьюдент”) в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.
При оценке результатов малой выборки величина генеральной дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента, определяемым по формуле
, (7.10)
где . (7.11)
Ее называют мерой случайных колебаний выборочной средней в малой выборке. Величина вычисляется на основе данных выборочного наблюдения. Она равна:
(7.12)
Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки в генеральной совокупности. При небольшой численности выборки распределение Стьюдента отличается от нормального. Предельная ошибка малой выборки в зависимости от средней ошибки представлена как
(7.13)
Но в данном случае величина t иначе связана с вероятной оценкой, чем при большой выборке. Согласно распределению Стьюдента, вероятная оценка зависит как от величины t, так и от объема выборки в случае, если предельная ошибка не превысит t-кратную среднюю ошибку в малых выборках.
В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений в большой выборке. Различие заключается в том, что при малой выборке вероятность нашего утверждения несколько меньше, чем при большой выборке. Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании [1, 3, 4].
Тесты
1. Отклонение выборочных характеристик от соответствующих характеристик генеральной совокупности, возникающее вследствие нарушения принципа случайности отбора, называется:
а) систематической ошибкой репрезентативности;
б) случайной ошибкой репрезентативности.
2. Чтобы уменьшить ошибку выборки, рассчитанную в условиях механического отбора, можно:
а) уменьшить численность выборочной совокупности;
б) увеличить численность выборочной совокупности;
в) применить серийный отбор;
г) применить типический отбор.
3. Проведено собственно-случайное бесповторное обследование заработной платы сотрудников аппарата управления двух финансовых корпораций. Обследовано одинаковое число сотрудников. Дисперсия заработной платы для финансовых корпораций одинакова, а численность аппарата управления больше в первой корпорации. Средняя ошибка выборки:
а) больше в первой корпорации;
б) больше во второй корпорации;
в) в обеих корпорациях одинакова;
г) данные не позволяют сделать вывод.
4. По данным 10%-го выборочного обследования дисперсия средней заработной платы сотрудников первого туристического агентства 225, а второго – 100. Численность сотрудников первого туристического агентства в четыре раза больше, чем второго. Ошибка выборки больше:
а) в первом туристическом агентстве;
б) во втором туристическом агентстве;
в) ошибки одинаковы;
г) предсказать результат невозможно.
5. По выборочным данным (2%-й отбор) удельный вес неуспевающих студентов на IV курсе составил 10 %, на III курсе – 15 %. При одинаковой численности выборочной совокупности ошибка выборки больше:
а) на IV курсе;
б) на III курсе;
в) ошибки равны;
г) данные не позволяют сделать вывод.
6. При осмотре партии деталей среди них оказалось 10 бракованных изделий. Если в полученной партии было 200 изделий, то дисперсия равна?
7. Численность выборки, которая позволила бы оценить долю брака в партии хлебобулочных изделий из 10000 единиц с точностью до 2 % при 5%-м уровне значимости составляет:
а) 2500;
б) 826;
в) не хватает данных;
г) 2000.
Глава 8. СТАТИСТИЧЕСКОЕ ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ
СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ЯВЛЕНИЙ