Выборочное наблюдение
Выборочным называют такое несплошное наблюдение, при котором обследованию подвергаются не все единицы исследуемой совокупности, а лишь отобранные в определенном порядке. Не прибегая к сплошному обследованию, выборка позволяет получить обобщающие показатели, с той или иной вероятностью отражающие характеристики всей генеральной совокупности. Основное преимущество выборки заключается в экономии финансовых, материальных и трудовых ресурсов, а также времени.
Следует отметить, что не всякое несплошное наблюдение может считаться выборкой. Отбор единиц в выборочную совокупность базируется на принципе случайности, при этом заранее определен объем выборки или ее процент, а также выбрана система отбора (способ отбора и метод отбора).
Основными задачами, решаемыми при выборочном наблюдении, являются:
а) определение ошибок выборки при известном ее объеме;
б) определение необходимого объема выборки при заданных максимальных ошибках.
При изучении темы необходимо разобраться, в чем состоят отличия в решении этих задач при повторном и бесповторном методах отбора, реализуемых собственно-случайным, механическим, типическим или серийным способом.
Следует иметь ввиду, что при любой системе отбора выборочный метод позволяет получить не точечные, а интервальные характеристики генеральной совокупности при заданном уровне вероятности. При этом в качестве генеральной характеристики может выступать генеральная средняя, т.е. среднее значение признака во всей изучаемой совокупности, или генеральная доля, т.е. доля единиц, обладающих тем или иным значением признака.
Рассмотрим решение типовых задач по выборке.
Задача 1. В результате выборочного наблюдения затрат времени на изготовление некоторых деталей получены следующие данные:
Затраты времени на изготовление деталей, мин (Х) | 20-22 | 22-24 | 24-26 | 26-28 | ИТОГО |
Число деталей (f) |
Требуется:
1. Определить выборочные характеристики: средние затраты времени на изготовление одной детали и долю деталей, на которые затрачивается до 24 мин.
2. Вычислить средние ошибки этих показателей.
3. Рассчитать с вероятностью 0,954 предельные ошибки и границы нахождения генеральных характеристик.
Решение.
На основе ряда распределения определим требуемые характеристики:
1) средние затраты времени на изготовление одной детали:
2) доля деталей, на которые затрачивается до 24 мин.:
3) средние ошибки полученных характеристик определим по формулам собственно-случайного повторного отбора, так как доля выборки у нас незначительна и поправка на бесповторность отбора существенно не повлияет на результат:
;
Соответствующие дисперсии равны:
;
Тогда
(для средней)
(для доли)
4) переход от средней ( ) к предельной ( ) ошибке осуществляется по формуле (для всех видов выборки "t" - величина, связанная с вероятностью, с которой гарантируется результат). У нас Р = 0,954. Ей соответствует значение t = 2. Тогда имеем:
.
Отсюда с вероятностью 0,954 можно указать границы для генеральных характеристик:
или
или
Задача 2. По данным задачи N1 определить предельные ошибки выборочных показателей с той же вероятностью при условии 20-процентного бесповторного отбора:
Задача 3. Сколько деталей необходимо отобрать из партии в 2000 штук в порядке бесповторного отбора, чтобы ошибка средних затрат времени на изготовление деталей не превышала 0,2 мин., а ошибка доли деталей, на изготовление которых тратится менее 24 мин. - 4%, с вероятностью 0,95.
Примечание: необходимые для расчетов дисперсии взяты из первой задачи. Оценка дисперсии при определении объема выборки является наиболее трудной проблемой планирования выборочного наблюдения.
Вопросы для самопроверки.
1. В чем отличие выборочного наблюдения от других видов несплошного наблюдения?
2. Что такое ошибка выборки?
3. В чем состоят основные проблемы теории выборочного наблюдения?
4. Какие вы знаете способы отбора единиц из генеральной совокупности?
5. Назовите основные способы распространения выборочных данных на генеральную совокупность.
6. Назовите особенности планирования выборочного обследования и его основные этапы.
Задания для практических и самостоятельных работ.
Задача № 1. Определите среднюю и предельную (с вероятностью 0,997) ошибки среднего балла, если дисперсия успеваемости по дисциплине равна 0,36, а обследованию подвергнуто 100 студентов.
Ответ: 0,06 и 0,18 балла.
Задача № 2. Какую ошибку доли бракованных деталей можно ожидать с вероятностью 0,9, если дисперсия доли равна 0,09, а объем выборки 400 деталей.
Ответ: 2,47%.
Задача № 3. Сколько изделий необходимо отобрать для исчисления процента брака с ошибкой не более 2%, при вероятности 0,954, если выборка будет производиться из партии объемом: а) 1000 изделий; б) 10 000 изделий.
Ответ: а) 714; б) 2000.
Задача № 4. В результате измерения веса 100 деталей, отобранных из 1000 штук в порядке бесповторной выборки, оказалось, что средний вес детали равен 155 г, среднее квадратическое отклонение 5 г. Определить границы среднего веса всех 1000 деталей с вероятностью 0,9.
Ответ: от 154 до 156 г.
Задача № 5. Определить долю металлорежущих станков, возраст которых свыше 20 лет, если из отобранных по бесповторной 20-процентной выборке 6400 станков число станков такого возраста оказалось равным 1600.
Ответ: от 24 до 26 процентов.
Задача № 6. В результате отбора каждого пятого вклада населения в сберегательном банке получили следующий ряд распределения вкладов по их величине:
Размер вклада (долл. США) | до 100 | 100-200 | 200-300 | 300 и более |
Число вкладов |
Определите, с вероятностью 0,954 границы: а) размера среднего вклада; б) удельного веса вкладов размером 300 и более долл. США.
Ответ: а) от 277,5 до 289,1 долл.; б) от 44,4 до 51,6 процентов.
Задача № 7. Имеются следующие данные о генеральной совокупности, состоящей из трех типических групп:
Номера групп | Число единиц в группе | Максимальный размер доли единиц, считающихся хорошими (%) |
Выборочным путем предлагается установить границы нахождения общей генеральной доли с вероятностью 0,954. Определите необходимый объем типической выборки, пропорциональной размерам районов при бесповторном отборе, чтобы ошибка выборки была не больше 3%.
Задача № 8. При выборочной проверке банок консервов в 144 ящиках было обнаружено 2,5% бракованных банок. Определить с вероятностью 0,997 число бракованных банок по всей партии, если ящики содержат по 30 банок.
Ответ: не более 480.
Ряды динамики.
Процесс развития, движения социально-экономических явлений во времени в статистике принято называть динамикой. Для ее отражения строятся ряды динамики.
В данной теме студент должен уяснить, что такое ряд динамики и как он строится. Особое внимание следует обратить на условия сопоставимости данных, составляющих динамический ряд. При рассмотрении вопросов о видах рядов динамики надо прежде всего понять различие между моментными и интервальными рядами. Построение, обработка и анализ этих рядов во многом определяется их особенностями.
Затем следует перейти к изучению методов расчета аналитических показателей рядов динамики.
В настоящей теме эти показатели должны быть рассмотрены вместе с другими показателями анализа рядов динамики. Следует учесть при этом, что анализ относительных показателей должен производиться во взаимосвязи с анализом абсолютных величин (уровней ряда, абсолютных приростов). С этой точки зрения большое значение имеет исследование абсолютного значения одного процента прироста.
Рассчитывая аналитические показатели ряда динамики, необходимо правильно выбирать базу для сравнения. Этому вопросу следует уделить особое внимание. Необходимо также разобраться в способах получения средних величин ряда: среднего уровня, среднего абсолютного прироста, среднего темпа роста и прироста. Следует помнить, что способ расчета среднего уровня ряда динамики зависит от его вида. При расчете среднего темпа роста необходимо использовать среднюю геометрическую.
При изучении вопросов выявления тенденции ряда динамики необходимо уяснить такие методы выявления тенденции ряда динамики как укрупнение интервала, сглаживание способом скользящих средних, аналитическое выравнивание.
Рассмотрим для примера расчет аналитических показателей ряда динамики по следующим данным:
Число зарегистрированных крестьянских (фермерских) хозяйств
в Российской Федерации
Годы | |||||
млн. руб. | 4,4 | 49,0 | 182,8 | 270,0 | 279,2 |
На основе этих данных необходимо рассчитать абсолютные приросты, темпы роста и прироста, средний уровень ряда, средний темп роста и прироста, а также абсолютное значение одного процента прироста.
Для расчета абсолютного прироста необходимо из уровня каждого последующего года вычесть уровень предыдущего или начального года (или какого-либо другого, принятого за базу сравнения). Так, например, абсолютный прирост в 2013г. по сравнению с 2012г. составил , а по сравнению с начальным - 2009г. Темп роста представляет собой отношение уровня последующего года к уровню предыдущего или начального. Так для 2013г. темп роста по сравнению с 2012 г. составил , а по сравнению с 2009 г. .
Темп прироста есть отношение абсолютного прироста к предыдущему или начальному уровню (или какому-либо другому, принятому за базу сравнения). Для 2013 г. по сравнению с 2012 г. темп роста равен или . Абсолютное значение одного процента прироста получается в результате деления абсолютного прироста по сравнению с предыдущим периодом на соответствующий темп роста, выраженный в процентах.
Приведем в таблице результат расчета всех этих показателей анализа ряда динамики:
Годы | Число хозяйств, тыс. ( ) | Абсолютные приросты по сравнению, тыс. | Темп роста, в % к | Темп прироста, в % к | Абсолютное значение 1% прироста, тыс. | ||||
с преды-дущим | с 2009 годом | преды-дущему | 2009 году | Преды-дущему | 2009 году | ||||
A | |||||||||
4,4 | - | - | - | 100,0 | - | 0,0 | - | ||
49,0 | +44,6 | +44,6 | 1113,6 | 1113,6 | 1013,6 | 1013,6 | 0,044 | ||
182,8 | +133,8 | +178,4 | 373,1 | 4154,5 | 273,1 | 4054,5 | 0,49 | ||
270,0 | +87,2 | +265,6 | 147,7 | 6136,4 | 47,7 | 6036,4 | 1,83 | ||
279,2 | +9,2 | +274,8 | 103,4 | 6345,5 | 3,4 | 6245,5 | 2,70 | ||
785,4 | 274,8 | - | - | - | - | - | - |
Рассчитаем также средние показатели. Средний уровень ряда динамики числа фермерских хозяйств рассчитывается по формуле средней арифметической простой, поскольку данный ряд интервальный:
Столь же просто находится средний абсолютный прирост:
Для расчета среднего темпа роста используем среднюю геометрическую:
(3) или 100,9%;
Следующей проблемой изучения динамики является выявление основной тенденции, то есть главного направления в изменении изучаемого явления. Речь идет о случаях скрытой тенденции, присущей тому или иному ряду динамику. Например, за колебаниями уровней урожайности какой-либо сельскохозяйственной культуры в отдельные годы тенденция роста урожайности может не просматриваться непосредственно, и поэтому должна быть выявлена статистически.
Из различных методов выявления тенденции, обычно рассматриваемых в учебной литературе (укрупнение интервалов, механическое сглаживание, аналитическое выравнивание), обратите особое внимание на последний. Необходимо учитывать, что аналитическое выравнивание представляет собой частный случай применения метода регрессии к анализу социально-экономических явлений. Этот метод заключается в том, что уровни ряда динамики представляются как функция времени (t):
В качестве примера произведем выравнивание данных о выплавке чугуна по уравнению прямой: .
Таблица исходных данных и расчетных данных (цифры условные)
Годы | Выплавка чугуна | ||||
(млн.т.) | (млн.т.) | ||||
-2 | -216 | 109.36 | |||
-1 | -107 | 109.48 | |||
109.60 | |||||
+1 | +111 | 109.72 | |||
+2 | +224 | 109.84 | |||
ИТОГО | +12 | 548.0 |
Пояснения к таблице. Первые две графы - исходные уровни ряда динамики дополняются графой, в которой показана система отсчета времени "t". Причем эта система выбирается таким образом, чтобы .
Если число уровней ряда четное, то вместо нуля в центре мы поставили бы единицы с противоположными знаками у двух уровней, находящихся в середине ряда. Тогда разница между годами составляла бы две единицы времени и общий вид систем был бы таким (например, для ряда из 6 уровней):
2008 2009 2010 2011 2012 2013
-5 -3 -1 +1 +3 +5
В случае применения упрощенной системы отсчета времени параметры уравнения находятся по упрощенным формулам:
Таким образом, уравнение, выражающее тенденцию роста выплавки чугуна, имеет вид:
На основе этого уравнения находятся выравненные годовые уровни путем подстановки в него соответствующих значений "t" (они показаны в последней графе таблицы, причем общий объем выплавки чугуна остался неизменным).
Вопросы для самопроверки.
1. В чем состоит значение рядов динамики в экономико-статистическом исследовании?
2. Каковы принципы и правила построения рядов динамики?
3. Какие различают виды рядов динамики?
4. Как исчисляется средняя хронологическая интервальных и моментных рядов динамики?
5. Что такое абсолютный уровень ряда динамики, темп роста, абсолютный и относительный прирост, средний темп роста?
6. Какие вы знаете методы выявления основной тенденции ряда динамики?
7. Какая разница между механическим сглаживанием и аналитическим выравниванием?
8. Что показывают индексы сезонности и как они исчисляются?
Задания для практических и самостоятельных работ.
Задача № 1. Вычислите цепные и базисные абсолютные приросты, темпы роста и прироста, а также абсолютные значения 1% прироста по следующим данным:
Годы | ||||||
Валовой сбор зерновых культур области (тыс.т) | 140.1 | 223.8 | 195.7 | 237.4 | 179.3 | 189.1 |
Задача № 2. По данным задачи № 1 рассчитайте средние показатели ряда динамики за 2008-2013 гг.: средний абсолютный прирост валового сбора, средний темп роста и прироста.
Задача № 3. По данным задачи № 1 произведите аналитическое выравнивание ряда динамики по уравнению прямой и с помощью трехчленной скользящей средней.
Задача № 4. Темпы роста выпуска изделия "А" в отрасли составили: в 2008 г. - 101%, 2009 г. - 103%, 2010 г. - 84%. Определите средний годовой темп прироста за 2008-2009 гг.
Задача 5. Исчислите средние товарные запасы за I и II кварталы и за полугодие в целом по нижеследующим данным:
Дата | 1/I | 1/II | 1/III | 1/IV | 1/V | 1/VI | 1/VII |
Товарные запасы, млн.руб. | 22.4 | 23.5 | 20.8 | 22.2 | 24.6 | 25.0 | 26.2 |
Задача № 6. На основании приведенных данных сделайте анализ внутригодовой динамики о реализации картофеля на рынках города; выявите сезонность покупательского спроса на эти продукты, предварительно выравнив ряд по прямой (тыс. ц):
(цифры условные)
Месяцы | Месяцы | ||||
Январь | 64,3 | 66,2 | Июль | 49,7 | 54,9 |
Февраль | 59,4 | 62,5 | Август | 55,0 | 59,5 |
Март | 55,2 | 59,9 | Сентябрь | 55,9 | 61,9 |
Апрель | 53,2 | 57,2 | Октябрь | 62,0 | 64,9 |
Май | 49,3 | 55,5 | Ноябрь | 66,4 | 68,9 |
Июнь | 46,7 | 52,9 | Декабрь | 70,4 | 73,8 |
Задача № 7. Произведите обработку ряда динамики закупок картофеля в области методом: а) укрупнения интервалов; б) скользящей средней:
Годы | ||||||||
Закупки картофеля, тыс.т. | 21.5 | 21.1 | 25.4 | 21.2 | 24.5 | 23.4 | 27.1 | 25.0 |
Экономические индексы
Экономический индекс - это относительная величина, которая характеризует изменение исследуемого явления во времени, в пространстве, или по сравнению с некоторым эталоном (планируемым, нормативным уровнем и т.п.). Если в качестве базы сравнения используется уровень за какой-либо предшествующий период - получают динамический индекс, если же базой является уровень того же явления по другой территории - территориальный индекс. Индексы являются незаменимым инструментом исследования в тех случаях, когда необходимо сравнить во времени или в пространстве две совокупности, элементы которых являются несоизмеримыми величинами.
Индексы могут быть индивидуальными и сводными. Индивидуальные индексы характеризуют изменение исследуемого показателя по одному товару или виду продукции. Сводные индексы отражают общее изменение по товарной группе или продуктовому ряду предприятия.
Сводный индекс цен может исчисляться в агрегатной, среднеарифметической или среднегармонической формах. Например, для индекса цен имеем:
Агрегатный:
Средний арифметический:
Средний гармонический: , где p - цены, q - количество товаров.
Специфическим вопросом построения индексов является выбор весов. Так, при расчете сводного индекса цен текущие и базисные цены на товары, в большинстве случаев, взвешиваются по объему реализации текущего периода (как это сделано выше), но иногда могут использоваться и базисные веса. Необходимо уяснить, что выбор весов в одном индексе обуславливает их выбор во всех взаимосвязанных с ним индексах.
Приведем примеры индексных расчетов.
Пример 1. Рассчитать индивидуальные и общие индексы товарооборота, физического объема проданных товаров и цен по следующим данным о ценах и реализации (товаров) за два месяца:
Товары | Январь | Февраль | Индексы (%) | |||||||
Цена, руб. | Реализация | Цена, руб | Реализация | цен | Физического объема продажи | Товарооборота | ||||
кг | руб. | кг | руб. | |||||||
А | ||||||||||
А | ||||||||||
Б | ||||||||||
В | ||||||||||
Итого | - | - | - | - | 87,5 | 102,7 | 90,3 | |||
Индивидуальные индексы, характеризующие динамику показателей по каждому товару, помещены в графах 7, 8, 9 таблицы по строкам А, Б, В. Они легко получаются путем сравнения соответствующих показателей за январь и февраль (например, индекс цен по товару "А" равен i p = 8:10 = 80%). Сводные индексы записаны по итоговой строке этих колонок. Они рассчитаны следующим образом:
Полученный результат указывает на то, что цены снизились на 12.3%.
Из формулы следует, что индекс цен есть отношение стоимости товаров отчетного периода к стоимости тех же товаров, но по базисным (у нас январским) ценам. Снижение цен привело к удешевлению массы товаров, проданных в феврале в абсолютном выражении на сумму 1300 руб. (10600-9300).
Индекс количества проданных товаров (физического объема товарооборота) рассчитывается как отношение товарооборота отчетного периода по базисным ценам к товарообороту базисного периода:
Следовательно, физический объем продажи возрос на 2,7%.
Индекс товарооборота (стоимости проданных товаров) может быть получен двумя способами:
1) по формуле
2) на основе рассчитанных индексов
.
Если индексы рассчитываются за три и более периодов, то в зависимости от задач исследования и имеющихся данных выбирают один из четырех возможных вариантов построения индексной системы: цепные индексы с переменными или постоянными весами, базисные индексы с переменными или постоянными весами.
Для изучения динамики среднего уровня в статистике используют систему взаимосвязанных индексов, которая включает в себя индекс переменного состава, индекс фиксированного (постоянного) состава, индекс структурных сдвигов. Данные индексы позволяют определить, как изменится средняя величина за счет изменения индивидуальных значений признака и за счет изменения структуры производства или реализации.
Индекс переменного состава определяется по формуле
Данный индекс показывает как изменится средняя цена за счет изменения цен и структуры совокупности.
Индекс фиксированного состава показывает только изменение цен и рассчитывается по формуле:
Индекс структурных сдвигов показывает влияние структурных изменений на динамику средней цены. Он рассчитывается по формуле:
Между этими индексами существует следующая взаимосвязь:
Рассмотрим расчет этих индексов на примере.
Пример 2. По нижеследующим данным определим общий индекс цен на товар "А" в двух формах: фиксированного и переменного состава, а также оценим влияние структурных сдвигов на динамику средней цены:
Рынки | Цена за 1 кг товара (руб.) | Продано товара (кг) | ||
I кв. | II кв. | I кв. | II кв. | |
N1 | ||||
N2 |
Индекс цен переменного состава получается как отношение средней цены двух сравниваемых периодов:
или 84,8%
Таким образом, средняя цена товара на двух рынках снизилась на 15,2% во II квартале по сравнению с I кварталом за счет снижения цен и изменения в структуре реализации.
Индекс цен фиксированного состава рассчитаем по уже известной формуле:
Таким образом, цена товара на двух рынках снизилась на 7,9% во II квартале по сравнению с I кварталом.
Средняя цена товара снизилась на 8% во II квартале по сравнению с I кварталом за счет изменения структуры реализации.
Проверим взаимосвязь:
Вопросы для самопроверки.
1. Дайте определение сводного индекса.
2. Дайте определение индивидуального индекса
3. Назовите формы сводного индекса.
4. Как связаны между собой цепные и базисные индексы?
5. Как строятся системы индексов с переменными и постоянными весами?
6. Чем отличаются территориальные индексы от динамических?
7. Напишите формулы конкретных индексов, которые Вы знаете.
Задания для практических и самостоятельных работ.
Задача № 1. Рассчитайте индексы цен, физического объема товарооборота и товарооборота по следующим данным:
Товары | Цена за единицу товара (руб.) | Реализовано единиц | ||
I кв. | II кв. | I кв. | II кв. | |
А | 2,5 | |||
Б |
Задача № 2. Рассчитайте сводный индекс на основе следующих данных:
Товары | Индексы цен (%) | Товарооборот отчетного периода (тыс. руб.) |
А | ||
Б | ||
В |
Задача № 3. Рассчитайте общий индекс физического объема продукции по следующим данным:
Изделия | Изменение выпуска в отчетном периоде по сравнению с базисным | Удельный вес изделия в общем выпуске базисного периода (%) |
А | +5 | |
Б | -5 |
Задача № 4. Рассчитайте индексы производительности труда переменного и фиксированного состава. Определите индекс влияния структурных сдвигов на динамику средней выработки.
Шахты | Базисный период | Отчетный период | ||
Добыча угля (млн. т) | Число работников (тыс. чел.) | Добыча угля (млн. т) | Число работников (тыс. чел.) | |
N 1 | 1.6 | 2.7 | ||
N 2 | 1.3 | 1.4 |