Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ
КОНСПЕКТ ЛЕКЦИЙ
И ЗАДАНИЯ ДЛЯ ПРАКТИЧЕСКИХ ЗАНЯТИЙ
Для обучающихся
По направлению подготовки магистров
Нефтегазовое дело»
Составитель: к. с. н., доцент Дружинина И.В.
Ó Федеральное государственное бюджетное образовательное
учреждение высшего образования «Тюменский индустриальный университет», 2016 г.
ТЕМА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ И МЕТОДОЛОГИЯ
СТАТИСТИКИ
Термин «статистика» (от латинского слова «status» – состояние, определенное положение вещей) в настоящее время употребляется в основном в трех значениях:
1) ОТРАСЛЬ ПРАКТИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ, направленная на сбор, обработку и анализ данных, характеризующих социально-экономическое развитие страны, ее регионов, отраслей экономики, отдельных предприятий;
2) ОТРАСЛЬ ОБЩЕСТВЕННЫХ НАУК, занимающаяся разработкой теоретических положений и методов, которые используются статистической практикой;
как наука, статистика – это еще и УЧЕНИЕ О СИСТЕМЕ ПОКАЗАТЕЛЕЙ, дающих всестороннее представление об общественных явлениях, о народном хозяйстве в целом и отдельных его отраслях; - это ИНСТРУМЕНТ ПОЗНАНИЯ, используемый в различных науках для установления специфических закономерностей, которые действуют в конкретных массовых явлениях, изучаемых данной наукой;
3) СИНОНИМ СЛОВА "ДАННЫЕ", т.е. числовые (или цифровые) данные, характеризующие различные стороны жизни государства: политические отношения, культуру, население, производство, торговлю и т.д.
Как наука статистика имеет свой предмет и специфические методы исследования.
· ПРЕДМЕТ СТАТИСТИКИ - количественная сторона качественно определённых массовых социально-экономических явлений и процессов, их структура и распределение, размещение в пространстве, движение во времени. Статистика также выявляет действующие количественные зависимости, тенденции и закономерности развития явлений, причём в конкретных условиях места и времени.
Теоретическую основу статистикисоставляют следующие важнейшие категории: совокупность; вариация; признак; закономерность.
· СТАТИСТИЧЕСКАЯ СОВОКУПНОСТЬ - объект статистического исследования (в каждом конкретном случае), т.е. множество единиц, обладающих массовостью, качественной однородностью и наличием вариации. Например, множества промышленных предприятий, семей, студентов, граждан какой-либо страны.
· Каждый отдельно взятый элемент данного множества называется ЕДИНИЦЕЙ СОВОКУПНОСТИ.
Единицы совокупности обладают определёнными свойствами, качествами.
· Свойство, качество единицы совокупности, отличающее её от других единиц, называется ПРИЗНАКОМ.
Признаки различаются способами их измерения, характером выражения, вариации и другими особенностями, влияющими на приёмы статистического изучения (табл. 1).
· Под КАЧЕСТВЕННОЙ ОДНОРОДНОСТЬЮ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ понимается сходство единиц по каким-либо существенным признакам (т.е. определяющим главное содержание изучаемого явления), но различие по каким-либо другим.
Например, качественная однородность множества студентов заключается в принадлежности этих лиц к определённой социальной группе.
Таблица 1 - КЛАССИФИКАЦИЯ ПРИЗНАКОВ В СТАТИСТИКЕ
Основание классификации | Виды признаков |
1. По характеру выражения признаков | 1. Описательные (атрибутивные): а) номинальные; б) порядковые 2. Количественные |
2. По способу измерения (учёта) | 1. Первичные (учитываемые) 2. Вторичные (расчётные) |
3. По отношению ко времени | 1. Моментные 2. Интервальные |
4. По характеру вариации | 1. Альтернативные 2. Дискретные 3. Непрерывные |
5. По содержательности | 1. Существенные 2. Несущественные |
6. По причинности | 1. Факторные 2. Результативные |
· ВАРИАЦИЯ ПРИЗНАКОВ - различие величины того или иного признака у разных единиц совокупности - обусловлена различным сочетанием условий, в которых развиваются или существуют единицы совокупности. Именно наличие вариации предопределяет необходимость статистики.
Вариация признаков отражается статистическим распределением, которое имеет большое практическое и научное значение.
Важнейшей категорией статистики является статистическая закономерность.
· СТАТИСТИЧЕСКАЯ ЗАКОНОМЕРНОСТЬ – это количественная закономерность изменения в пространстве и во времени массовых явлений и процессов общественной жизни, состоящих из множества элементов (единиц совокупности).
Важнейшая особенность статистической закономерности (главное ее отличие от других видов закономерностей) заключается в том, что она свойственна не отдельным единицам совокупности, а всей их массе (совокупности в целом) и проявляется только при достаточно большом числе наблюдений и только в среднем.
Это обусловливает её взаимосвязь с ЗАКОНОМ БОЛЬШИХ ЧИСЕЛ, основное содержание которого заключается в том, что в сводных статистических характеристиках действия элементов случайности взаимопогашаются, хотя они и могут проявляться в индивидуальных признаках единиц статистической совокупности.
Предмет статистики имеет ряд особенностей:
1) исследуются не отдельные факты, а массовые социально-экономические явления и процессы (т.е. множества отдельных фактов, обладающих как индивидуальными, так и общими признаками);
2) статистика изучает, прежде всего, количественную сторону общественных явлений и процессов в конкретных условиях места и времени; количественную характеристику статистика выражает через определённого рода числа - СТАТИСТИЧЕСКИЕ ПОКАЗАТЕЛИ[1];
3) статистика характеризует структуру общественных явлений, т.е. их внутреннее строение, при этом выявляются составные части социально-экономических явлений, эти составные части сопоставляются с явлением в целом и между собой, данная структура сравнивается с другими однотипными структурами, а также с заданной (нормативной или плановой) и выявляются причины отклонений;
4) изменения уровня явления и его структуры исследуются во времени, при этом анализ динамики включает: установление уровня явления на определённые моменты или промежутки времени и среднего уровня, выявление характера изменений за каждый промежуток времени и в целом, определение величины и темпов изменения, установление основной тенденции изменений, их закономерности и составление статистического прогноза.
5) выявление связей; явления общественной жизни взаимосвязаны и взаимообусловлены: изменение одних явлений предопределяет другие; наибольшее значение имеет выявление причинно-следственных связей для того, чтобы воздействовать на общественные явления с целью их изменения в интересах общества; с помощью специальной методологии статистика определяет количественные связи между общественными явлениями.
Для изучения своего предмета статистика разрабатывает и применяет разнообразные МЕТОДЫ, совокупность которых образует СТАТИСТИЧЕСКУЮ МЕТОДОЛОГИЮ. Применение в статистическом исследовании конкретных методов обусловлено поставленными при этом задачами и зависит от характера исходной информации.
Всё многообразие статистических методов систематизируется по их целевому применению в трёх стадиях экономико-статистического исследования, выполняемых последовательно: 1) сбор первичной информации; 2) статистическая сводка и обработка первичной информации; 3) анализ статистической информации.
На начальной стадии статистического исследования применяется МЕТОД МАССОВОГО СТАТИСТИЧЕСКОГО НАБЛЮДЕНИЯ.
Важнейшим методом второй стадии является МЕТОД СТАТИСТИЧЕСКОЙ СВОДКИ И ГРУППИРОВКИ. Одним из этапов процесса группировки является построение РЯДОВ РАСПРЕДЕЛЕНИЯ, т.е. распределение единиц наблюдения по величине или значению признака. Результаты статистической сводки и группировки оформляются в виде СТАТИСТИЧЕСКИХ ТАБЛИЦ.
Для третьей стадии статистического исследования характерны:
- МЕТОД ОБОБЩАЮЩИХ СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ (включает применение абсолютных, относительных и средних величин);
- ИНДЕКСНЫЙ МЕТОД;
- ДИНАМИЧЕСКИЕ РЯДЫ;
- КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ;
- МЕТОДЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА;
- МЕТОД СТАТИСТИЧЕСКИХ ГРАФИКОВ;
- БАЛАНСОВЫЙ МЕТОД.
Познавательные задачи статистики, как науки:
1)изучение уровня, структуры, динамики и взаимосвязей массовых социально-экономических явлений;
2)разработка и совершенствование системы статистических показателей, приёмов и методов сбора, обработки, анализа и хранения статистической информации.
Тема 2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ
2.1. Понятие и план подготовки статистического наблюдения
· СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ - массовое, планомерное научно организованное наблюдение за явлениями социальной и экономической жизни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности. Может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими и социальными службами фирм, банков, бирж.
Статистическое наблюдение должно удовлетворять ряду требований: 1) наблюдаемые явления должны иметь научную (практическую) ценность; 2) непосредственный сбор массовых данных должен обеспечить полноту фактов, относящихся к рассматриваемому явлению; 3) результаты статистического наблюдения должны быть достоверны и сопоставимы.
Процесс подготовки статистического наблюдения включает решение программно-методологических и организационных вопросов (таблица 2).
Таблица 2 - Содержание подготовки статистического наблюдения
Программно-методологические вопросы | 1. Формулировка задачи статистического наблюдения. |
2. Определение объекта и единицы наблюдения. | |
3. Составление программы статистического наблюдения. | |
4. Выбор места и времени наблюдения. Выбор времени наблюдениязаключается в решении двух вопросов: - установление критического момента (даты) или интервала времени - определение срока (периода) наблюдения | |
Организационные вопросы | 1. Выбор формы, вида и способа наблюдения (табл. 3). |
2. Установление субъекта наблюдения (состав организаций и лиц, осуществляющих наблюдение). | |
3. Подбор, обучение и инструктаж кадров. | |
4. Подготовка формуляров и разработка инструментария | |
5. Подготовительные мероприятия: составление списка единиц, предоставляющих сведения; разбивка территории на участки; разъяснительная работа и пропаганда; проведение пробных наблюдений. |
Таблица 3 - Формы, виды и способы статистического наблюдения
Организационные формы наблюдения | Виды статистического наблюдения | Способы наблюдения | |
по времени регистрации фактов | по степени охвата единиц совокупности | ||
1. Статистическая отчётность 2. Специально организованное наблюдение 3. Регистры | 1. Текущее (непрерывное) 2. Прерывное: - периодическое; - единовременное | 1. Сплошное 2. Несплошное: - выборочное; - основного массива; - монографическое | 1. Непосредственное 2. Документированное 3. Опрос: экспедиционный; саморегистрации; корреспондентский; анкетный; явочный |
2.2. Ошибки статистического наблюдения
Как показывает практика, даже при чётко организованном и спланированном статистическом наблюдении встречаются погрешности и ошибки, требующие исправления.
· Расхождение между расчетным и действительным значением изучаемых величин называется ОШИБКОЙ НАБЛЮДЕНИЯ.
В зависимости от причин возникновения различают:
1) ошибки регистрации (случайные и систематические);
2) ОШИБКИ РЕПРЕЗЕНТАТИВНОСТИ (случайные и систематические) ПРИСУЩИ ТОЛЬКО НЕСПЛОШНОМУ НАБЛЮДЕНИЮ.
После получения статистических формуляров, прежде всего, проводится проверка полноты собранных в процессе статистического наблюдения данных, а затем осуществляется их логический и арифметический контроль.
2.3. Понятие выборочного метода. Ошибка выборки
Статистическое исследование может осуществляться по данным несплошного наблюдения. Основная цель несплошного наблюдения – получение характеристик изучаемой совокупности по обследованной её части. Один из наиболее распространённых в статистике методов, применяющий несплошное наблюдение – выборочный метод.
· Под ВЫБОРОЧНЫМ понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой её части (обычно 5 – 10 %, реже 15 – 25 % изучаемой совокупности)на основе случайного отбора.
· Подлежащая изучению статистическая совокупность, из которой часть единиц отбирается для обследования, называется ГЕНЕРАЛЬНОЙ СОВОКУПНОСТЬЮ.
· Некоторая часть единиц, отобранная из генеральной совокупности и подвергающаяся обследованию, называется ВЫБОРОЧНОЙ СОВОКУПНОСТЬЮ (ВЫБОРКОЙ).
Значение выборочного метода состоит в следующем:
1) при минимальной численности обследуемых единиц исследование проводится в более короткие сроки и с минимальными затратами труда и денежных средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации;
2) при проведении ряда исследований выборочный метод является единственно возможным;
3) применяется для проверки данных сплошного учёта.
Выборочный метод имеет важную особенность по сравнению с другими методами несплошного наблюдения: в основу отбора единиц для обследования положен принцип равных возможностей попадания в выборку каждой единицы генеральной совокупности. В результате соблюдения этого принципа исключается возможность образования выборки только за счёт лучших или худших образцов. Это предупреждает возникновение систематических ошибок.
· Поскольку любая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности. Это объективно возникающее расхождение между характеристиками выборки и генеральной совокупности составляет ОШИБКУ ВЫБОРКИ.
Величина ошибки выборки зависит от ряда факторов:
1) степени вариации изучаемого признака;
2) численности выборки;
3) методов отбора единиц в выборочную совокупность;
4) принятого уровня достоверности результата исследования.
ОБЩАЯ ВЕЛИЧИНА ВОЗМОЖНОЙ ОШИБКИ ВЫБОРКИ слагается из ошибок двух видов: ошибки регистрации и ошибки репрезентативности. Первый вид ошибок при выборочном наблюдении практически исключён. Второй вид ошибок присущ только несплошному наблюдению.
Ошибки репрезентативности бывают систематические и случайные.
· СИСТЕМАТИЧЕСКИЕ ОШИБКИ могут возникать в связи с особенностями принятой системы отбора и обработки данных наблюдения, или в связи с нарушениями установленных правил отбора единиц для обследования.
· Возникновение СЛУЧАЙНЫХ ОШИБОК РЕПРЕЗЕНТАТИВНОСТИ объясняется неравномерным распределением единиц в генеральной совокупности. Поэтому распределение отобранной для обследования совокупности единиц (выборки) не вполне точно воспроизводит распределение единиц генеральной совокупности.
Величина ошибки выборки характеризует степень надёжности результатов обследования выборочной совокупности и необходима для оценки параметров генеральной совокупности. Для каждого конкретного выборочного наблюдения величина ошибки выборки может быть определена по соответствующим формулам.
2.4. Основные способы формирования выборочной совокупности
Способ отбора определяет конкретный механизм или процедуру выборки единиц из генеральной совокупности и зависит от степени вариации изучаемого признака в исследуемой совокупности.
В практике выборочных обследований наибольшее распространение получили следующие СПОСОБЫ ФОРМИРОВАНИЯ ВЫБОРКИ.
· СОБСТВЕННО-СЛУЧАЙНАЯ ВЫБОРКА заключается в отборе единиц из генеральной совокупности наугад или наудачу без каких-либо элементов системности. Применяется в случае незначительной вариации изучаемого признака в пределах исследуемой совокупности.
При проведении отбора этим способом следует принять во внимание, что все единицы генеральной совокупности имеют равные шансы попадания в выборку. Следует также установить чёткие границы генеральной совокупности таким образом, чтобы включение или невключение в неё отдельных единиц не вызывало сомнений.
Технически собственно-случайный отбор проводится путём жеребьёвки или с помощью таблиц случайных чисел.
Собственно-случайный отбор может быть повторным и бесповторным (выпавшие жребии обратно в исходную совокупность не возвращаются и в дальнейшем отборе не участвуют).
Условия применения различных способов формирования выборочной совокупности (виды выборки) приведены в таблице.
Вид выборки | Условия применения |
Механическая | Генеральная совокупность каким-либо образом упорядочена, т.е. имеется определённая последовательность в расположении единиц (телефонные номера респондентов, списки избирателей, номера домов, квартир). Для проведения механической выборки устанавливается пропорция отбора, которая устанавливается соотнесением объёмов выборочной и генеральной совокупности. Напр., при пропорции 1:50 (2%-ная выборка) отбирается каждая 50-я единица; при пропорции 1:20 (5%-ная выборка) – каждая 20 единица и т.д. |
Типическая | Все единицы генеральной совокупности можно разбить на типические группы; вариация исследуемого признака от группы к группе – значительная. При обследованиях населения такими группами могу быть районы, социальные, возрастные или образовательные группы; при обследовании предприятий – вид экономической деятельности, форма собственности и т.д. Выборка формируется из единиц из каждой типической группы собственно-случайным или механическим способом пропорционально объёму типических групп, либо пропорционально внутригрупповой дифференциации признака. При выборке, пропорциональной объёму типических групп, число единиц, подлежащих отбору из каждой группы, определяется следующим образом: ni = n · Ni/N, где ni – объём выборки из i-й группы; Ni – объём i-й группы, n – численность выборочной совокупности. Отбор, пропорциональный внутригрупповой дифференциации признака, осуществляется на основе использования внутригрупповых дисперсий по каждой типической группе. |
Серийная | Единицы генеральной совокупности объединены в небольшие группы или серии (упаковки с определённым количеством готовой продукции, партии товара, студенческие группы, бригады и другие объединения). Отбор заключается в собственно-случайном, либо механическом отборе серий, внутри которых производится сплошное обследование единиц; удобен в тех случаях, когда. |
Комбинированная | Различные способы формирования выборки используются в комбинации. Возможно комбинировать: - типическую выборку и серийную (серии отбираются в установленном порядке из нескольких типических групп); - серийный и собственно-случайный отбор (отдельные единицы отбираются внутри серии в собственно-случайном порядке). |
2.5. Средняя и предельная ошибки выборки
После проведения отбора для определения возможных границ генеральных характеристик рассчитываются средняя и предельная ошибки выборки.
СРЕДНЯЯ ОШИБКА ВЫБОРКИ показывает величину возможных отклонений характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности.
Ошибки выборки могут быть рассчитаны для среднего значения признака и для доли альтернативного признака (табл.). В математической статистике доказывается, что генеральная средняя будет отличаться от выборочной средней на величину средней ошибки выборки (±m) только в 68,3% случаев. В 95% случаев ошибка выборки не выйдет за пределы ±2m. В 99,7% случаев разность между генеральной и выборочной средней на превзойдёт трёхкратной средней ошибки выборки (±3m) и т.д.
Метод отбора | Формула для определения средней ошибки выборки | |
Для средней | Для доли | |
Собственно-случайный и механический отбор | ||
Повторный | ||
Бесповторный | ||
Типический отбор | ||
Повторный | ||
Бесповторный | ||
Серийная выборка | ||
Повторный | , где r – число отобранных серий; R – число серий в генеральной совокупности; - межсерийная дисперсия средних | , где - межсерийная дисперсия доли |
Бесповторный |
Таким образом, о величине ошибки выборки можно судить с определённой вероятностью, от которой зависит множитель t, называемый коэффициентом доверия.
Логически связь выглядит так: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о её величине.
При заданной вероятности коэффициент доверия t определяют по таблице значений интегральной функции Лапласа j (t).
Величина D = ± tm называется предельной ошибкой выборки.
Зная выборочную среднюю величину признака (долю альтернативного признака в выборочной совокупности) и предельную ошибку выборки (для средней или для доли), можно определить ГРАНИЦЫ, В КОТОРЫХ ЗАКЛЮЧЕНА ГЕНЕРАЛЬНАЯ СРЕДНЯЯ (ГЕНЕРАЛЬНАЯ ДОЛЯ):
для средней или .
для доли или .
2.6. Определение необходимого объёма выборки
При проектировании выборочного наблюдения возникает вопрос о необходимой численности выборки. Эта численность может быть определена на базе допустимой ошибки при выборочном наблюдении исходя из вероятности, с которой гарантируется величина устанавливаемой ошибки, и наконец, на базе способа отбора.
Для определения необходимой численности выборки исследователь должен задать уровень точности характеристики выборочной совокупности с определённой вероятностью.
Необходимый объём выборки для различных способов формирования выборочной совокупности определяется исходя из формул для расчёта предельной ошибки выборки (табл.).
Метод отбора | Формула для определения необходимой численности выборки | |
При определении среднего размера признака | При определении доли признака | |
Собственно-случайный и механический отбор | ||
Повторный | ||
Бесповторный | ||
Типический отбор | ||
Повторный | ||
Бесповторный | ||
Серийная выборка | ||
Повторный | ||
Бесповторный |
УПРАЖНЕНИЯ
Задача 2.1. Для изучения динамического уровня скважин проведено 10%-е выборочное обследование действующего фонда методом случайного бесповторного отбора. В результате обследования получены данные о распределении скважин по величине динамического уровня.
Динамический уровень, м | До 1900 | 1900 - 2000 | 2000 - 2100 | 2100 - 2200 | 2200 - 2300 | 2300 и более | Итого |
Число скважин, шт. (f) | |||||||
Центр интервала (х) | - | ||||||
Взвешенный центр интервала (xf) | |||||||
Квадрат центра интервала (х2) | |||||||
Взвешенный квадрат центра интервала (х2f) |
С вероятностью 0,990 определите пределы, в которых находится средний динамический уровень по всему фонду скважин. Коэффициент доверия t=2,58.
Задача 2.2. Для изучения содержания серы были взяты пробы на участке нефтяного месторождения методом 5%-ного собственно-случайного бесповторного отбора. В результате обследования проб получены следующие данные:
Содержание серы, % | Менее 0,2 | 0,2 – 0,4 | 0,4 – 0,6 | 0,6 – 0,8 | 0,8 – 1,0 | Более 1,0 | Итого |
Число обследованных скважин, шт. (f) | |||||||
Центр интервала (х) | |||||||
Взвешенный центр интервала (xf) | |||||||
Квадрат центра интервала (х2) | |||||||
Взвешенный квадрат центра интервала (х2f) |
С вероятностью 0,997 определите пределы, в которых находится средний уровень содержания серы по всему участку месторождения. Коэффициент доверия t=2,97.
Задача 2.3. Для планирования потребности буровой кампании в долотах проведено 10%-е выборочное обследование 100 буровых бригад методом случайного бесповторного отбора. В результате обследования получены данные о количестве израсходованных долот на одну скважину.
Число долот, шт. | Менее 20 | 20 – 22 | 22 – 24 | 24 – 26 | 26 – 28 | 28 – 30 | 30 и более |
Число бригад |
С вероятностью 0,954 определите пределы, в которых находится среднее число долот, израсходованных при бурении одной скважины. Коэффициент доверия t=1,99.
Задача 2.4. По действующему фонду скважин проведено 5%-ное обследование с целью измерения обводненности продукции методом случайного бесповторного отбора. В результате обследования получены следующие данные.
Обводненность, % | До 80 | 80 – 82 | 82 – 84 | 84 – 86 | 86 – 88 | Более 88 |
Число скважин |
С вероятностью 0,990 определите пределы, в которых находится средний уровень обводненности действующего фонда скважин. Коэффициент доверия t=2,58.