Некоторые значения t-распределения Стьюдента

Таблица

Основные характеристики генеральной и выборочной совокупности

Показатель Обозначение или формула  
Генеральная совокупность Выборочная совокупность  
Число единиц N N  
Единицы, обладающие каким-либо признаком N1 m  
Доля единиц, обладающих каким-либо признаком P=N1/N W=m/n  
Доля единиц, не обладающих этим признаком g=(1-p) (1-w)  
Средняя величина изучаемого признака ¯x x
Дисперсия изучаемого признака σ² σ²  
Дисперсия альтернативного признака pg w(1-w)  

2.При проведении выборочного наблюдения всегда допускаются ошибки. Различают систематические и случайные ошибки.

Систематические ошибки возникают в силу нарушения правил отбора единиц в выборку.

Случайные ошибки возникают в силу не сплошного характера обследования. Случайные ошибки делят на средние и предельные (с заданной степенью точности).

Те и другие определяют как для признака, так и для доли (альтернативного признака).

М – средняя ошибка

Мх – ошибка признака

Мр – ошибка доли.

Средние ошибки

Генеральная совокупность Выборочная совокупность
Для признака Для доли Для признака Для доли
Мх = √σ²/n Mp = √pg/n Mx = √σ²/n Mp = √w(1-w)/n

Предельная ошибка – это ошибка с заданной степенью точности, она не превышает размера средней ошибки взятой в t-раз, где t-это коэффициент доверия при заданной вероятности (степени точности).

Чем выше степень точности, тем больше коэффициент доверия:

P = 0,683 t = 1,000

P = 0,950 t = 1,960

P = 0,954 t = 2,000

P = 0,990 t = 2,580

P = 0,997 t = 3,000

Формулы предельных ошибок

Генеральная совокупность Выборочная совокупность
Для признака Для доли Для признака Для доли
∆x = t M x = t √ σ²/n ∆x = t M p = t √pg/n ∆x = t M x = t √σ²/n ∆p = t M p = t √w(1-w)/n

Ошибки выборки зависят не только от степени точности, но и от способа отбора:

1. случайный;

2. механический;

3. типический;

4. серийный;

5. смешанный.

Случайный отбор – это такой отбор, когда каждая единица изучаемой совокупности имеет одинаковую возможность попасть или не попасть в выборку.

Случайный отбор может быть повторным и бесповторным.

При бесповторном отборе каждая единица может попасть в выборку только 1 раз.

При повторном отборе – столько раз сколько раз производится выборка.

Теорией вероятности доказано, что меньше бесповторного отбора меньше ошибки повторного отбора в √(1- n/N) раз.

Ранее были даны формулы средних ошибок для повторного отбора.

Далее проводятся формулы расчета средних и предельных ошибок при бесповторном отборе.

Формулы расчета ошибок при бесповторном отборе.

Генеральная совокупность Выборочная совокупность
Для признака Для доли Для признака Для доли
Средние ошибки
M x = √σ²/n (1-n/N) M p = √pg/n (1-n/N) M x = √σ²/n (1-n/N) M p = √w(1-w)/n (1-n/N)
Предельные ошибки
∆x = t M x = √σ²/n (1-n/N) ∆p = t M p = t √pg/n (1-n/N) ∆x = t M x = t √σ²/n (1-n/N) ∆p = t M p = t √w(1-w)/n (1-n/N)

Механический отбор – вся совокупность разбивается на равные по объему группы по случайному признаку. Затем из каждой группы, как правило, берется одна единица. Все единицы предварительно располагаются в определенном порядке, – например, по алфавиту, местонахождению и т.п., а потом, в зависимости от объема выборки, механически через определенный интервал отбирается необходимое количество единиц. Чем меньше выборки, тем больше интервал (если выборка 5 %-ная, то отбирается каждый 20 студент).

МАЛАЯ ВЫБОРКА

В процессе оценки степени представительности данных выборочного наблюдения важное значение приобретает вопрос об объеме выборочной совокупности п. От него зависит не только величина пределов, которые с данной вероятностью не превзойдет ошибка выборки, но и способы определения этих пределов.

При большом числе единиц выборочной совокупности (n > 100)
распределение случайных ошибок выборочной средней в соответствии с теоремой А. М. Ляпунова нормально или приближается к нормальному по мере увеличения числа наблюдений. Вероятность выхода ошибки за определенные пределы оценивается на основе таблиц интеграла Лапласа. Расчет ошибки выборки базируется на величине генеральной дисперсии а2ген, так как при больших п коэффициент n/(n-1), на который для получения генеральной умножается выборочная дисперсия, большой роли не играет.

Однако в практике статистического исследования в условиях рыночной экономики все чаще приходится сталкиваться с небольшими по объему так называемыми малыми выборками. Под малой выборкойпонимается такое выборочное наблюдение, численность единиц которого не превышает 30. В настоящее время малая выборка используется более широко, чем раньше, прежде всего за счет статистического изучения деятельности малых и средних предприятий, коммерческих банков, фермерских хозяйств и т. д. Их количество в определенных случаях, особенно при региональных исследованиях, а также величина характеризующих их показателей (например, численность занятых) часто незначительны. Поэтому хотя общий принцип выборочного обследования (с увеличением объема выборки повышается точность выборочных данных) остается в силе, иногда приходится ограничиваться малым числом наблюдений. Наряду со статистическим изучением рыночных структур эта необходимость возникает при выборочной проверке качества продукции, в научно-исследовательской работе и в ряде других случаев.

Разработка теории малой выборки была начата английским статистиком В. С. Госсетом (печатавшимся под псевдонимом Стьюдент) в 1908 г. Он доказал, что оценка расхождения между средней малой выборки и генеральной средней имеет особый закон распределения.

При оценке результатов малой выборки величина генеральной
дисперсии в расчетах не используется. Для определения возможных пределов ошибки пользуются так называемым критерием Стьюдента,определяемым по формуле

T=(x%-x¯)/mмв

(8.26)

где µмв=s/(Ön-1)- мера случайных колебаний выборочной средней в малой выборке.

Величина s вычисляется на основе данных выборочного наблюдения. Она равна:

s=Öå(xi-x)²/n

(8.27)

Данная величина используется лишь для исследуемой совокупности, а не в качестве приближенной оценки а в генеральной совокупности. При небольшой численности выборки распределение Стьюдента отличается от нормального: большие величины критерия имеют здесь большую вероятность, чем при нормальном распределении.

Предельная ошибка малой выборки (мв) в зависимости от средней ошибки (mмв) представлена как

Dмв=t*mмв

(8.28)

Но в данном случае величина t иначе связана с вероятной оценкой, чем при большой выборке. Как указывалось ранее, английский ученый В. С. Госсет доказал, что при малой выборке действует особый закон распределения. Согласно распределению Стьюдента, вероятная оценка зависит как от величины t, так и от объема выборки в случае, если предельная ошибка не превысит t-кратную среднюю ошибку в малых выборках. Приведем выдержку из таблицы распределения Стьюдента (табл. 8.9).

Таблица 8.9

Распределение вероятности в малых выборках в зависимости
от коэффициента доверия t и объема выборки п*

N t
0,5 1,0 1,5 2,0 2,5 3,0
  * При п= ∞ в таблице даны вероятности нормального распределения. Для определения вероятности соответствующие табличные значения следует разделить на 1000.  

Как видно из табл. 8.9, при увеличении n это распределение стремится к нормальному и при n =20 уже мало от него отличается.

Покажем, как пользоваться таблицей распределения Стьюдента.

Пример. Предположим, что выборочное обследование 10 рабочих малого предприятия показало, что на выполнение одной из производственных операций рабочие затрачивали времени (мин): 3,4; 4,7; 1,8; 3,9; 4,2; 3,9; 4,2; 3,9; 3,7; 3,2; 2,2; 3,9. Найдем выборочные средние затраты:

x¯= (3,4 + 4,7 + 1,8 + … + 2,2 + 3,9)/10 = 3,49 мин.

Выборочная дисперсия

s² = (3,4 - 3,49)²+ (4,7 - 3,49)² + … + (3,9 - 3,49)² = 0,713

Отсюда средняя ошибка малой выборки

µмв = корень (0,713/(10-1) = 0,28 мин.

По табл. 8.9 находим, что для коэффициента доверия t = 2 и объема малой выборки n = 10 вероятность равна 0,924. Таким образом, с вероятностью 0,924 можно утверждать, что расхождение между выборкой и генеральной средней лежит в пределах от – 2µ до + 2µ, т. е. разность x-x¯ не превысит по абсолютной величине 0,56 (2 • 0,28). Следовательно, средние затраты времени во всей
совокупности будут находиться в пределах от 2,93 до 4,05 мин. Вероятность того, что это предположение в действительности неверно и ошибка по случайным причинам будет по абсолютной величине больше, чем 0,56, равна:
1 - 0,924 = 0,076.

Таблица вероятностей Стьюдента часто приводится в иной форме, нежели в табл. 8.9. Считается, что в ряде случаев такая форма более удобна для практического использования (табл. 8.10).

Таблица 8.10.

Некоторые значения t-распределения Стьюдента

Число степеней свободы     tp
для одностороннего интервала для двустороннего интервала
р = 0,95 р = 0,99 р = 0,95 р = 0,99
∞   2,35 2,13 2,01 1,94 1,89 1,86 1,83 1,81 1,75 1,73 1,70 1,67 1,64 4,54 3,75 3,37 3,14 3,00 2,90 2,82 2,76 2,60 2,53 2,46 2,39 2,33 3,18 2,78 2,57 2,45 2,36 2,31 2,26 2,23 2,13 2,09 2,04 2,00 1,96 5,84 4,60 4,03 3,71 3,50 3,36 3,35 3,17 2,95 2,85 2,75 2,66 2,58

Из табл. 8.10 следует, что для каждого числа степеней свободы k = n - 1 указана предельная величина tp , которая с данной вероятностью р не будет превышена в силу случайных колебаний результатов выборки. На основе указанной в табл. 8.10 величины tp определяются доверительные интервалы:x¯-мв и х + мв. Это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность, равную:

q = 1 - р.

В качестве доверительной вероятности при двусторонней проверке используют, как правило, р = 0,95 или р = 0,99, что не исключает, однако, выбора и других р, не приведенных в табл. 8.10.

Вероятности q случайного выхода оцениваемой средней величины за пределы доверительного интервала соответственно будут равны 0,05 и 0,01, т. е. весьма малы. Выбор между вероятностями 0,95 и 0,99 является до известной степени произвольным. Этот выбор во многом определяется содержанием тех задач, для решения которых применяется малая выборка.

В заключение отметим, что расчет ошибок в малой выборке мало отличается от аналогичных вычислений в большой выборке. Различие заключается в том, что при малой выборке вероятность нашего утверждения несколько меньше, чем при большой выборке (в частности, в приведенном ранее примере 0,924 и 0,954 соответственно). Однако все это не означает, что можно использовать малую выборку тогда, когда нужна большая выборка. Во многих случаях расхождения между найденными пределами могут достигать значительных размеров, что вряд ли удовлетворяет исследователей. Поэтому малую выборку следует применять в статистическом исследовании социально-экономических явлений с большой осторожностью, при соответствующем теоретическом и практическом обосновании.

Итак, выводы по результатам малой выборки имеют практическое значение лишь при условии, что распределение признака в генеральной совокупности является нормальным или асимптотически нормальным. Необходимо также принимать во внимание и то, что точность результатов выборки малого объема все же ниже, чем при большой выборке.

Контрольные вопросы по теме: «Выборочное наблюдение».

1. Что называется выборочным наблюдением?

2. Назовите причины, по которым статистика прибегает к выборочному наблюдению.

3. Что является важной особенностью выборочного наблюдения?

4. В чем заключается экономическая целесообразность выборочного наблюдения?

5. Назовите этапы выборочного наблюдения.

6. Дать определение генеральной совокупности.

7. Назовите основные характеристики генеральной и выборочной совокупностей.

8. Какие существуют виды ошибок в выборочном наблюдении?

9. Когда возникают систематические ошибки?

10. Как делятся случайные ошибки?

11. Что называют предельные ошибки?

12. Назовите способы отбора.

13. Раскройте понятие малой выборки.

Тест 1 уровня по теме: «Выборочное наблюдение».

1. Выборочное наблюдение – это вид не сплошного наблюдения

1) Да;

2) Нет.

2. Единицы, из которых производят отбор в выборку составляют:

1) выборочную совокупность;

2) генеральную совокупность.

3. Систематические ошибки возникают в силу не сплошного характера обследования

1) Да;

2) Нет.

4. Отклонение выборочных характеристик от соответствующих характеристик генеральной совокупности, возникающие вследствие нарушения принципа случайности отбора, называются:

1) систематической ошибкой репрезентативности;

2) случайной ошибкой репрезентативности.

5. Отклонение выборочных характеристик от соответствующих характеристик генеральной совокупности, возникающее вследствие не сплошного характера наблюдения, называется:

1) систематической ошибкой репрезентативности;

2) случайной ошибкой репрезентативности.

6. Теорией вероятности доказано, что ошибка бесповторного отбора меньше ошибки повторного отбора в … раз

1) n;

2) √(1-n/N);

3) (1-n/N);

4) √(1-N/n);

7. Отбор, при котором каждая единица изучаемой совокупности имеет одинаковую возможность попасть или не попасть в выборку называется:

1) смешанной;

2) типичной;

3) случайной;

4) механической;

5) серийной.

8. Предельная ошибка – это ошибка с заданной степенью точности

1) Да;

2) Нет.

9. Малая выборка – выборочное наблюдение, численность единиц которого не превышает

1) 40;

2) 20;

3) 10;

4) 30.

10. Случайный отбор может быть повторным и бесповторным

1) Да;

2) Нет.

Ответы к тесту 1 уровня по теме: «Выборочное наблюдение».

1. 1

2. 2

3. 2

4. 1

5. 2

6. 2

7. 3

8. 1

9. 4

10. 1

ТЕСТ К ГЛАВЕ 8

1. Отклонение выборочных характеристик от соответствующих
характеристик генеральной совокупности, возникающее вследствие
нарушения принципа случайности отбора, называется:

а) систематической ошибкой репрезентативности;

б) случайной ошибкой репрезентативности.

2. Отклонение выборочных характеристик от соответствующих
характеристик генеральной совокупности, возникающее вследствие
несплошного характера наблюдения, называется:

а) систематической ошибкой репрезентативности;

б) случайной ошибкой репрезентативности.

3. Чтобы уменьшить ошибку выборки, рассчитанную в условиях механического отбора, можно:

а) уменьшить численность выборочной совокупности;

б) увеличить численность выборочной совокупности;

в) применить серийный отбор;

г) применить типический отбор.

4. Средняя из групповых дисперсий в генеральной совокупности составляет 64% общей дисперсии. Средняя ошибка выборки при
механическом отборе из этой совокупности будет при одном и том
же объеме выборки больше ошибки типической выборки на:

а) 36%;

б) 64%;

в) 25%;

г) предсказать результат невозможно.

5. Проведено собственно-случайное бесповторное обследование
заработной платы сотрудников аппарата управления двух финансовых корпораций. Обследовано одинаковое число сотрудников. Дисперсия заработной платы для двух финансовых корпораций одинакова, а численность аппарата управления больше на первой корпорации. Средняя ошибка выборки:

а) больше на первой корпорации;

б) больше на второй корпорации;

в) на обеих корпорациях одинакова;

г) данные не позволяют сделать вывод.

6. Проведено обследование: 1) восьми кафе с целью изучения
их санитарного состояния; 2) шести магазинов из 40, переведенных
на новый график работы, с целью определения эффективности внедрения нового графика в магазинах города. Выборочным обследованием является:

а) –;

б) 1;2;

в) 1;

г) 2.

7. По данным 10%-ного выборочного обследования дисперсия
средней заработной платы сотрудников первого туристического агентства 225, а второго - 100. Численность сотрудников первого туристического агентства в четыре раза больше, чем второго. Ошибка выборки больше:

а) в первом туристическом агентстве;

б) во втором туристическом агентстве;

в) ошибки одинаковы;

г) предсказать результат невозможно.

8. При выборочном обследовании продуктивности скота в фермерских хозяйствах вначале отбирались группы фермерских хозяйств определенного производственного направления, а в отобранных группах - отдельные хозяйства. Этот отбор:

а) серийный;

б) типический;

в) двухступенчатый;

г) двухфазный.

9. При отборе рабочих экспедиторских фирм для обследования
причин потерь рабочего времени были заведомо исключены рабочие, имеющие сокращенный рабочий день. Результаты обследования содержат:

а) систематическую ошибку регистрации;

б) систематическую ошибку репрезентативности.

10. На таможенном посту проверено 36% ручной клади пассажиров. Ошибка собственно-случайной бесповторной выборки меньше ошибки повторной выборки на:

а) 10%;

б) 19%;

в) 1%;

г) предсказать результат невозможно.

11. По выборочным данным (2%-ный отбор), удельный вес неуспевающих студентов на IV курсе составил 10%, на III курсе - 15%. При
одинаковой численности выборочной совокупности ошибка выборки больше:

а) на IV курсе;

б) на III курсе;

в) ошибки равны;

г) данные не позволяют сделать вывод.

Наши рекомендации