Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ

2.1. Понятие и план подготовки статистического наблюдения

· СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - массовое, планомерное научно организованное наблюдение за явлениями социальной и экономической жизни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности. Может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими и социальными службами фирм, банков, бирж.

Статистическое наблюдение должно удовлетворять ряду требований: 1) наблюдаемые явления должны иметь научную (практическую) ценность; 2) непосредственный сбор массовых данных должен обеспечить полноту фактов, относящихся к рассматриваемому явлению; 3) результаты статистического наблюдения должны быть достоверны и сопоставимы.

Процесс подготовки статистического наблюдения включает решение программно-методологических и организационных вопросов (таблица 2).

Таблица 2 - Содержание подготовки статистического наблюдения

Программно-методологические вопросы 1. Формулировка задачи статистического наблюдения.
2. Определение объекта и единицы наблюдения.
3. Составление программы статистического наблюдения.
4. Выбор места и времени наблюдения. Выбор времени наблюдениязаключается в решении двух вопросов: - установление критического момента (даты) или интервала времени - определение срока (периода) наблюдения
Организационные вопросы 1. Выбор формы, вида и способа наблюдения (табл. 3).
2. Установление субъекта наблюдения (состав организаций и лиц, осуществляющих наблюдение).
3. Подбор, обучение и инструктаж кадров.
4. Подготовка формуляров и разработка инструментария
5. Подготовительные мероприятия: составление списка единиц, предоставляющих сведения; разбивка территории на участки; разъяснительная работа и пропаганда; проведение пробных наблюдений.

Таблица 3 - Формы, виды и способы статистического наблюдения

Организационные формы наблюдения Виды статистического наблюдения Способы наблюдения
по времени регистрации фактов по степени охвата единиц совокупности
1. Статистическая отчётность 2. Специально организованное наблюдение 3. Регистры 1. Текущее (непрерывное) 2. Прерывное: - периодическое; - единовременное 1. Сплошное 2. Несплошное: - выборочное; - основного массива; - монографическое 1. Непосредственное 2. Документированное 3. Опрос: экспедиционный; саморегистрации; корреспондентский; анкетный; явочный

2.2. Ошибки статистического наблюдения

Как показывает практика, даже при чётко организованном и спланированном статистическом наблюдении встречаются погрешности и ошибки, требующие исправления.

· Расхождение между расчетным и действительным значением изучаемых величин называется ОШИБКОЙ НАБЛЮДЕНИЯ.

В зависимости от причин возникновения различают:

1) ошибки регистрации (случайные и систематические);

2) ОШИБКИ РЕПРЕЗЕНТАТИВНОСТИ (случайные и систематические) ПРИСУЩИ ТОЛЬКО НЕСПЛОШНОМУ НАБЛЮДЕНИЮ.

После получения статистических формуляров, прежде всего, проводится проверка полноты собранных в процессе статистического наблюдения данных, а затем осуществляется их логический и арифметический контроль.

2.3. Понятие выборочного метода. Ошибка выборки

Статистическое исследование может осуществляться по данным несплошного наблюдения. Основная цель несплошного наблюдения – получение характеристик изучаемой совокупности по обследованной её части. Один из наиболее распространённых в статистике методов, применяющий несплошное наблюдение – выборочный метод.

· Под ВЫБОРОЧНЫМ понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой её части (обычно 5 – 10 %, реже 15 – 25 % изучаемой совокупности)на основе случайного отбора.

· Подлежащая изучению статистическая совокупность, из которой часть единиц отбирается для обследования, называется ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬЮ.

· Некоторая часть единиц, отобранная из генеральной совокупности и подвергающаяся обследованию, называется ВЫБОРОЧНОЙ СОВОКУПНОСТЬЮ (ВЫБОРКОЙ).

Значение выборочного метода состоит в следующем:

1) при минимальной численности обследуемых единиц исследование проводится в более короткие сроки и с минимальными затратами труда и денежных средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации;

2) при проведении ряда исследований выборочный метод является единственно возможным;

3) применяется для проверки данных сплошного учёта.

Выборочный метод имеет важную особенность по сравнению с другими методами несплошного наблюдения: в основу отбора единиц для обследования положен принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности. В результате соблюдения этого принципа исключается возможность образования выборки только за счёт лучших или худших образцов. Это предупреждает возникновение систематических ошибок.

· Поскольку любая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности составляет ОШИБКУ ВЫБОРКИ.

Величина ошибки выборки зависит от ряда факторов:

1) степени вариации изучаемого признака;

2) численности выборки;

3) методов отбора единиц в выборочную совокупность;

4) принятого уровня достоверности результата исследования.

ОБЩАЯ ВЕЛИЧИНА ВОЗМОЖНОЙ ОШИБКИ ВЫБОРКИ слагается из ошибок двух видов: ошибки регистрации и ошибки репрезентативности. Первый вид ошибок при выборочном наблюдении практически исключён. Второй вид ошибок присущ только несплошному наблюдению.

Ошибки репрезентативности бывают систематические и случайные.

· СИСТЕМАТИЧЕСКИЕ ОШИБКИ могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдения, или в связи с нарушениями установленных правил отбора единиц для обследования.

· Возникновение СЛУЧАЙНЫХ ОШИБОК РЕПРЕЗЕНТАТИВНОСТИ объясняется неравномерным распределением единиц в генеральной совокупности. Поэтому распределение отобранной для обследования совокупности единиц (выборки) не вполне точно воспроизводит распределение единиц генеральной совокупности.

Величина ошибки выборки характеризует степень надёжности результатов обследования выборочной совокупности и необходима для оценки параметров генеральной совокупности. Для каждого конкретного выборочного наблюдения величина ошибки выборки может быть определена по соответствующим формулам.

2.4. Основные способы формирования выборочной совокупности

Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности и зависит от степени вариации изучаемого признака в исследуемой совокупности.

В практике выборочных обследований наибольшее распространение получили следующие СПОСОБЫ ФОРМИРОВАНИЯ ВЫБОРКИ.

· СОБСТВЕННО-СЛУЧАЙНАЯ ВЫБОРКА заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Применяется в случае незначительной вариации изучаемого признака в пределах исследуемой совокупности.

При проведении отбора этим способом следует принять во внимание, что все единицы генеральной совокупности имеют равные шансы попадания в выборку. Следует также установить чёткие границы генеральной совокупности таким образом, чтобы включение или невключение в неё отдельных единиц не вызывало сомнений.

Технически собственно-случайный отбор проводится путём жеребьёвки или с помощью таблиц случайных чисел.

Собственно-случайный отбор может быть повторным и бесповторным (выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют).

Условия применения различных способов формирования выборочной совокупности (виды выборки) приведены в таблице.

Вид выборки Условия применения
Механическая Генеральная совокупность каким-либо образом упорядочена, т.е. имеется определённая последовательность в расположении единиц (телефонные номера респондентов, списки избирателей, номера домов, квартир). Для проведения механической выборки устанавливается пропорция отбора, которая устанавливается соотнесением объёмов выборочной и генеральной совокупности. Напр., при пропорции 1:50 (2%-ная выборка) отбирается каждая 50-я единица; при пропорции 1:20 (5%-ная выборка) – каждая 20 единица и т.д.
Типическая Все единицы генеральной совокупности можно разбить на типические группы; вариация исследуемого признака от группы к группе – значительная. При обследованиях населения такими группами могу быть районы, социальные, возрастные или образовательные группы; при обследовании предприятий – вид экономической деятельности, форма собственности и т.д. Выборка формируется из единиц из каждой типической группы собственно-случайным или механическим способом пропорционально объёму типических групп, либо пропорционально внутригрупповой дифференциации признака. При выборке, пропорциональной объёму типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом: ni = n · Ni/N, где ni – объём выборки из i-й группы; Ni – объём i-й группы, n – численность выборочной совокупности. Отбор, пропорциональный внутригрупповой дифференциации признака, осуществляется на основе использования внутригрупповых дисперсий по каждой типической группе.
Серийная Единицы генеральной совокупности объединены в небольшие группы или серии (упаковки с определённым количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения). Отбор заключается в собственно-случайном, либо механическом отборе серий, внутри которых производится сплошное обследование единиц; удобен в тех случаях, когда.
Комбинированная Различные способы формирования выборки используются в комбинации. Возможно комбинировать: - типическую выборку и серийную (серии отбираются в установленном порядке из нескольких типических групп); - серийный и собственно-случайный отбор (отдельные единицы отбираются внутри серии в собственно-случайном порядке).

2.5. Средняя и предельная ошибки выборки

После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.

СРЕДНЯЯ ОШИБКА ВЫБОРКИ показывает величину возможных отклонений характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.

Ошибки выборки могут быть рассчитаны для среднего значения признака и для доли альтернативного признака (табл.). В математической статистике доказывается, что генеральная средняя будет отличаться от выборочной средней на величину средней ошибки выборки (±m) только в 68,3% случаев. В 95% случаев ошибка выборки не выйдет за пределы ±2m. В 99,7% случаев разность между генеральной и выборочной средней на превзойдёт трёхкратной средней ошибки выборки (±3m) и т.д.

Метод отбора Формула для определения средней ошибки выборки
Для средней Для доли
Собственно-случайный и механический отбор
Повторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Бесповторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Типический отбор
Повторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Бесповторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Серийная выборка
Повторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru , где r – число отобранных серий; R – число серий в генеральной совокупности; Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru - межсерийная дисперсия средних Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru , где Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru - межсерийная дисперсия доли
Бесповторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru

Таким образом, о величине ошибки выборки можно судить с определённой вероятностью, от которой зависит множитель t, называемый коэффициентом доверия.

Логически связь выглядит так: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о её величине.

При заданной вероятности коэффициент доверия t определяют по таблице значений интегральной функции Лапласа j (t).

Величина D = ± tm называется предельной ошибкой выборки.

Зная выборочную среднюю величину признака (долю альтернативного признака в выборочной совокупности) и предельную ошибку выборки (для средней или для доли), можно определить ГРАНИЦЫ, В КОТОРЫХ ЗАКЛЮЧЕНА ГЕНЕРАЛЬНАЯ СРЕДНЯЯ (ГЕНЕРАЛЬНАЯ ДОЛЯ):

для средней Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru или Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru .

для доли Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru или Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru .

2.6. Определение необходимого объёма выборки

При проектировании выборочного наблюдения возникает вопрос о необходимой численности выборки. Эта численность может быть определена на базе допустимой ошибки при выборочном наблюдении исходя из вероятности, с которой гарантируется величина устанавливаемой ошибки, и наконец, на базе способа отбора.

Для определения необходимой численности выборки исследователь должен задать уровень точности характеристики выборочной совокупности с определённой вероятностью.

Необходимый объём выборки для различных способов формирования выборочной совокупности определяется исходя из формул для расчёта предельной ошибки выборки (табл.).

Метод отбора Формула для определения необходимой численности выборки
При определении среднего размера признака При определении доли признака
Собственно-случайный и механический отбор
Повторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Бесповторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Типический отбор
Повторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Бесповторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Серийная выборка
Повторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru
Бесповторный Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - student2.ru

УПРАЖНЕНИЯ

Задача 2.1. На участке месторождения 1000 скважин. Определите минимальный объем случайной бесповторной выборки, которая позволит с вероятностью 0,95 (t=1,96) оценить среднесуточный дебит с предельной ошибкой выборки 1 т/сут. Дисперсия среднесуточного дебита по данным предварительного обследования 34.

Задача 2.2. На предприятии 5000 рабочих, из них 1000 – в цехе №1, 1500 – в цехе №2, 2500 – в цехе №3. С целью определения средней выработки предполагается провести типическую выборку с пропорциональным механическим отбором рабочих внутри каждого цеха.

Какое количество рабочих следует отобрать, чтобы с вероятностью 0,997 (t=2,97) ошибка выборки не превышала 5 тыс.руб./чел.? Дисперсия выработки для типической выборки по данным предыдущих обследований 1600.

Сколько рабочих необходимо отобрать из каждого цеха?

Задача 2.3. На склад сырья и материалов предприятия поступила партия заготовок из 100 ящиков по 80 шт. в каждом. Для установления среднего веса заготовки следует провести серийную выборку методом механического отбора так, чтобы с вероятностью 0,954 (коэффициент доверия t=1,99) ошибка выборки не превысила 2 кг. На основе ранее проводимого контроля качества заготовок известно, что дисперсия серийной выборки равна 5.

Определите необходимый объем выборки (ящиков).

Задача 2.4. Для изучения уровня качества насосов проведено 10%-е выборочное обследование партии методом случайного бесповторного отбора. В результате обследования получены данные о распределении насосов по величине наработки на отказ.

Наработка на отказ, час. До 900 900 - 950 950 - 1000 1000 - 1050 1050 - 1100 1100 и более Итого
Число насосов, шт. (f)  
Центр интервала (х)             -
Взвешенный центр интервала (xf)              
Квадрат центра интервала (х2)              
Взвешенный квадрат центра интервала (х2f)              

С вероятностью 0,990 определите пределы, в которых находится среднее значение наработки на отказ во всей партии насосов. Коэффициент доверия t=2,58.

Задача 2.5. Для изучения содержания серы были взяты пробы на участке нефтяного месторождения методом 5%-ного собственно-случайного бесповторного отбора. В результате обследования проб получены следующие данные:

Содержание серы, % Менее 0,2 0,2 – 0,4 0,4 – 0,6 0,6 – 0,8 0,8 – 1,0 Более 1,0 Итого
Число обследованных скважин, шт. (f)  
Центр интервала (х)              
Взвешенный центр интервала (xf)              
Квадрат центра интервала (х2)              
Взвешенный квадрат центра интервала (х2f)              

С вероятностью 0,997 определите пределы, в которых находится средний уровень содержания серы по всему участку месторождения. Коэффициент доверия t=2,97.

Задача 2.6. Для планирования потребности буровой кампании в долотах проведено 10%-е выборочное обследование 100 буровых бригад методом случайного бесповторного отбора. В результате обследования получены данные о количестве израсходованных долот на одну скважину.

Число долот, шт. Менее 20 20 – 22 22 – 24 24 – 26 26 – 28 28 – 30 30 и более
Число бригад

С вероятностью 0,954 определите пределы, в которых находится среднее число долот, израсходованных при бурении одной скважины. Коэффициент доверия t=1,99.

Задача 2.7. По действующему фонду скважин проведено 5%-ное обследование с целью измерения обводненности продукции методом случайного бесповторного отбора. В результате обследования получены следующие данные.

Обводненность, % До 80 80 – 82 82 – 84 84 – 86 86 – 88 Более 88
Число скважин

С вероятностью 0,990 определите пределы, в которых находится средний уровень обводненности действующего фонда скважин. Коэффициент доверия t=2,58.

Задача 2.8. Для изучения степени износа оборудования на участке магистрального трубопровода проведено 10%-е выборочное обследование однотипных компрессоров методом случайного бесповторного отбора. В результате обследования получены данные о распределении оборудования по сроку эксплуатации.

Срок эксплуатации, лет Менее 5 5 – 8 8 - 11 11 - 14 14 - 17 Более 17
Число компрессоров, шт.

С вероятностью 0,990 определите пределы, в которых находится средний срок эксплуатации компрессоров на всем участке трубопровода. Коэффициент доверия t=2,58.

Задача 2.9. Для изучения качества нефти по резервуарному парку проведен отбор проб. В результате получены данные о распределении проб по величине содержания хлористых солей.

Содержание солей, % Менее 0,1 0,1 – 0,2 0,2 – 0,3 0,3 – 0,4 0,4 – 0,5 Более 0,5 Итого
Число проб (f)  
Центр интервала (х)              
Взвешенный центр интервала (xf)              
Квадрат центра интервала (х2)              
Взвешенный квадрат центра интервала (х2f)              

С вероятностью 0,990 определите пределы, в которых находится средний срок эксплуатации компрессоров на всем участке трубопровода. Коэффициент доверия t=2,58.

Наши рекомендации