Статистическое изучение вариации

Понятие вариации. При изучении совокупности явления нельзя ограничиваться только нахождением средней величины. Средние величины дают обобщенную характеристику варьирующего признака, показывают типичные характеристики для изучаемой совокупности. Однако в средней величине не проявляется степень колеблемости отдельных значений признаков вокруг среднего уровня. В зависимости от однородности в совокупности колеблемость признаков может быть большой или малой. Поэтому возникает необходимость в измерении вариации отдельных вариантов по отношению к средней величине.

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Вариация в переводе с латинского означает «колеблемость», «изменчивость», «непостоянство». Предполагая, что большинство социально-экономических явлений и процессов варьируют в некотором масштабе, статистика разработала методологию расчета показателей вариации, которые, в свою очередь, могут быть абсолютными, относительными и средними.

Величины признаков колеблются, варьируют под действием различных причин и условий, которые в статистике называют факторами. Нередко эти факторы действуют в противоположных направлениях и сами, в свою очередь, варьируют. Среди них есть существенные факторы, определяющие величину вариантов данного признака у всех единиц совокупности. Но есть и несущественные, которые на одни единицы совокупности могут оказывать влияние, на другие нет.

Например, вариация оценок студентов на экзамене в вузе вызывается, в частности, различными способностями студентов; временем, затраченным ими на самостоятельную работу; посещаемостью занятий; различием социально-бытовых условий и т.д. Но на оценку могут влиять и какие-либо привходящие, чисто случайные причины, например, временное недомогание.

Вариация, порождаемая существенными факторами, носит систематический характер, то есть наблюдается последовательное изменение вариантов признака в определенном направлении. Такая вариация называется систематической. В систематической вариации проявляются взаимосвязи между явлениями, их признаками, в такой связи – один как причина, другой как следствие его действия.

Вариация, обусловленная случайными факторами, называется случайной вариацией. Здесь не наблюдается систематического изменения вариантов зависимого признака от случайных факторов; все изменения носят хаотический характер, поскольку нет устойчивой связи этих факторов с единицами изучаемой совокупности.

Вариация зависимого признака, образовавшаяся под действием всех без исключения влияющих на него факторов, называется общей вариацией. Следовательно, общая вариация слагается из систематической и случайной вариации.

Пример 13. Возьмем два варьирующих признака: возраст студентов и долю студентов дистанционного отделения среди обучающихся в одном из ВУЗов.

Таблица 15

Возраст студента, лет 18-22 23–28 29–34 35–40 41–46
На 100 студентов дневного отделения приходится студентов дистанционного отделения

Из данных таблицы видно, что от возраста студента зависит выбор формы обучения. Здесь наблюдается систематическая вариация зависимого признака. Оба признака варьируют, но вариация зависимого признака идет в противоположном направлении по сравнению с вариацией факторного признака. Чем больше возраст студента, тем ниже доля студентов дневной формы обучения.

Пример 13. В цехе работают две бригады, каждая из трех человек. Пусть заработная плата отдельного рабочего составила:

В первой бригаде – 9500, 10000, 10500 ( Статистическое изучение вариации - student2.ru )

Во второй бригаде – 7500, 10000, 12500 ( Статистическое изучение вариации - student2.ru ).

Средняя зарплата одного рабочего в обеих бригадах одинакова и составляет 10000 шт., но колеблемость зарплаты отдельных рабочих в первой бригаде значительно меньше, чем во второй. Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей.

Показатели вариации. К показателям вариации относятся: размах вариации, среднее линейное (абсолютное) отклонение (с.л.о.), дисперсия, среднее квадратическое отклонение (с.к.о.), коэффициент вариации.

1) Размах вариации – разность между максимальным и минимальным значением признака:

Статистическое изучение вариации - student2.ru .

Он характеризует пределы изменения признака. В нашем примере размах вариации зарплаты для первой и второй бригад соответственно: Статистическое изучение вариации - student2.ru =1000 шт., Статистическое изучение вариации - student2.ru =5000 шт., что в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя зарплата первой бригады более равномерна.

Средний размах: Статистическое изучение вариации - student2.ru – это есть средняя арифметическая из ряда размахов, полученных из серии равных по объему наблюдений. Используется в контроле качества.

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику.

Простейший показатель такого типа СЛО.

2) Среднее линейное отклонение (СЛО) – представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (учитывает только крайние значения признака и не учитывает все промежуточные).

– СЛО для несгруппированных данных: Статистическое изучение вариации - student2.ru ,

где Статистическое изучение вариации - student2.ru – число членов ряда.

Т.е. Статистическое изучение вариации - student2.ru – СЛО равно средней арифметической из абсолютных отклонений (модулей) признака всех единиц совокупности от средней арифметической.

– СЛО для сгруппированных данных: Статистическое изучение вариации - student2.ru ,

где Статистическое изучение вариации - student2.ru – сумма частот вариационного ряда.

В формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль – алгебраическая сумма отклонений вариантов от их средней арифметической.

Поэтому СЛО применяют редко, только в случаях, когда суммирование показателей без учета знаков имеет экономический смысл. Например, анализ состава рабочих, ритмичность производства, оборот внешней торговли.

3) Дисперсия – это средний квадрат отклонений индивидуальных значений от средней арифметической (не имеет единиц измерения).

В общем виде взвешенная дисперсия исчисляется по формуле:

Статистическое изучение вариации - student2.ru

или простая дисперсия:

Статистическое изучение вариации - student2.ru .

Дисперсия альтернативного признака:

Статистическое изучение вариации - student2.ru

Пример 14. Определить дисперсию, если из обследованных 2000 деталей 100 – бракованные.

Статистическое изучение вариации - student2.ru – доля бракованных деталей, Статистическое изучение вариации - student2.ru – доля годных деталей.

Статистическое изучение вариации - student2.ru .

4) Среднее квадратическое отклонение (СКО) ‑ это есть квадратный корень из среднего квадрата отклонений отдельных значений признака от средней арифметической:

Статистическое изучение вариации - student2.ru – для несгруппированных данных;

Статистическое изучение вариации - student2.ru – для сгруппированных данных (для вариационного ряда).

Коэффициент вариации. В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны: нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией зарплаты, выраженной в рублях.

Для осуществления такого сравнения, а также сравнения колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации – коэффициент вариации (КВ).

КВ – представляет собой выраженное в процентах отношение СКО к средней арифметической.

Статистическое изучение вариации - student2.ru ,

это и есть коэффициент вариации. Это относительная мера вариации и позволяет сравнивать степень варьирования в разных вариационных рядах.

Рассмотрим расчет показателей вариации.

Пример 15. По исходным данным (таблица 1) определить: размах вариации, дисперсию, СКО, КВ.

Решение:

1) Статистическое изучение вариации - student2.ru руб.

Остальные показатели требуют более трудоемких расчетов.

Таблица 17

АО с размером дивидендов, руб Число АО ( Статистическое изучение вариации - student2.ru ) Середина интервала ( Статистическое изучение вариации - student2.ru ) Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
7 – 130 130 – 253 253 – 376 376 – 499 499 – 622 622 – 745 745 – 868 868 – 991 68,5 191,5 314,5 437,5 560,5 683,5 806,5 929,5 890,5 2201,5 5687,5 10484,5 -448,95 -325,95 -202,95 -79,95 43,05 166,05 289,05 412,05 201556,1 106243,4 41188,7 6392,003 1853,303 27572,6 83549,9 169785,2 2620229,33 1274920,83 288320,92 83096,03 29652,84 330871,23 1086148,73 2376992,84
ИТОГО 8090232,75

Статистическое изучение вариации - student2.ru – среднее значение находили ранее, оно равно 517,45 руб.

2) дисперсия: Статистическое изучение вариации - student2.ru .

3) СКО: Статистическое изучение вариации - student2.ru руб.

4) КВ: Статистическое изучение вариации - student2.ru .

Анализ полученных данных говорит о том, что размер дивидендов АО отличается от среднего размера ( Статистическое изучение вариации - student2.ru =517,45) в среднем на 284 рубля, или на 55 %. Значение коэффициента вариации превышает 33 %, следовательно, вариация размера дивиденда велика, найденный средний размер дивиденда плохо представляет всю совокупность АО, не является ее типичной, надежной характеристикой, а саму совокупность нет оснований считать однородной по размеру дивидендов.

Виды дисперсии.

Дисперсия – это средний квадрат отклонений всех значений признака ряда распределения от средней арифметической.

Свойства дисперсии:

1) Дисперсия постоянной величины равна нулю ( Статистическое изучение вариации - student2.ru );

2) Дисперсия не меняется, если все варианты увеличить или уменьшить на одно и то же число ( Статистическое изучение вариации - student2.ru );

3) Если все варианты умножить на число Статистическое изучение вариации - student2.ru , дисперсия увеличится в Статистическое изучение вариации - student2.ru раз Статистическое изучение вариации - student2.ru ;

4) Дисперсия от средней меньше, чем средний квадрат отклонений от любого числа Статистическое изучение вариации - student2.ru на Статистическое изучение вариации - student2.ru – свойство минимальности дисперсии от средней ( Статистическое изучение вариации - student2.ru ).

Использование свойств дисперсии позволяет упрощать ее расчеты, особенно в случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы. В этих случаях сначала находят дисперсию от условного нуля, а затем используют 4-е свойство, переходят к дисперсии от средней.

Виды дисперсий для сгруппированных данных, условия их применения в статистических исследованиях.

Если совокупность данных сгруппирована на группы по какому-то признаку, то в этом случае выделяются 3 вида дисперсий:

- Общая дисперсия Статистическое изучение вариации - student2.ru

– Средняя из внутригрупповых дисперсий Статистическое изучение вариации - student2.ru

- Межгрупповая дисперсия Статистическое изучение вариации - student2.ru

Общая Статистическое изучение вариации - student2.ru - измеряет вариацию во всей совокупности Статистическое изучение вариации - student2.ru

Средняя из внутригрупповых дисперсий исчисляется Статистическое изучение вариации - student2.ru ,

где Статистическое изучение вариации - student2.ru – частота появления внутригрупповой дисперсии одной величины (одного размера).

Статистическое изучение вариации - student2.ru – внутригрупповая Статистическое изучение вариации - student2.ru - измеряет вариацию признака внутри группы, Статистическое изучение вариации - student2.ru - групповая средняя.

Межгрупповая дисперсия Статистическое изучение вариации - student2.ru – измеряет колеблемость групповых средних Статистическое изучение вариации - student2.ru вокруг общей средней Статистическое изучение вариации - student2.ru :

Статистическое изучение вариации - student2.ru

Она измеряет вариацию, обусловленную признаком, положенным в основу группировки.

Правило сложения дисперсий.

Общий закон (правило) сложения дисперсий ‑ Общая дисперсия равна сумме средней из внутригрупповых дисперсий и межгрупповой дисперсии.

Статистическое изучение вариации - student2.ru

Показывает значение фактора, положенного в основу группировки (из всей совокупности факторов).

Коэффициент детерминации – есть квадрат эмпирического корреляционного отношения.

Эмпирическое корреляционное отношение – есть корень квадратный из отношения межгрупповой дисперсии к общей:

Статистическое изучение вариации - student2.ru – характеризует влияние группировочного признака на результативный признак (оба показателя (числитель и знаменатель) не превышают по своей величине единицы: чем больше показатели в этих пределах, тем теснее взаимосвязь между изучаемыми признаками).

Статистическое изучение вариации - student2.ru ; Статистическое изучение вариации - student2.ru – влияние других факторов равно 0.

Статистическое изучение вариации - student2.ru – влияние признака равно 0.

Пример 16. Имеются следующие данные о размере дивидендов и прибыли компании:

Таблица 16

АО с размером дивидендов, руб Число АО Прибыль в среднем на одно предприятие, млн.руб.
7 – 130 130 – 253 253 – 376 376 – 499 499 – 622 622 – 745 745 – 868 868 – 991 46,0 75,0 240,0 40,0 38,4 245,0 80,0 45,0
ИТОГО: 89,22

Определить: эмпирическое корреляционное отношение.

Решение: вычислим межгрупповую дисперсию по формуле:

Статистическое изучение вариации - student2.ru .

Таблица 17

АО с размером дивидендов, руб Число АО Прибыль в среднем на одно предприятие, тыс.руб.( Статистическое изучение вариации - student2.ru ) Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
7 – 130 130 – 253 253 – 376 376 – 499 499 – 622 622 – 745 745 – 868 868 – 991 46,0 75,0 240,0 40,0 38,4 245,0 80,0 45,0 -43,22 -14,22 150,78 -49,22 -50,82 155,78 -9,22 -44,22 1868,31 202,32 22733,40 2423,00 2583,08 24266,16 85,08 1955,76 24288,08 2427,87 159133,82 31499,03 41329,26 291193,95 1106,07 27380,67
ИТОГО: 89,22 - 578358,74

Теперь вычислим общую дисперсию выработки изделий на основе индивидуальных (несгруппированных) данных способом моментов: Статистическое изучение вариации - student2.ru .

Статистическое изучение вариации - student2.ru , тогда Статистическое изучение вариации - student2.ru или 4%, Статистическое изучение вариации - student2.ru .

Коэффициент детерминации говорит о том, что вариация прибыли АО на 4% зависит от вариации дивидендов и на 96% от прочих факторов.

Эмпирическое корреляционное отношение по своей величине далеко от единице, что свидетельствует о слабой связи между прибылью и дивидендами.

Выборочное наблюдение

Понятие о выборочном наблюдении. Как известно, все исследования связаны с большими материальными и временными затратами. Для оптимизации исследований производится отбор изучаемых единиц совокупности. Такие исследования принято называть несплошным наблюдением.

Совокупность единиц, из которых производится отбор, называют генеральной совокупностью,а совокупность отобранных единиц из генеральной совокупности – выборочной совокупностью.

Наиболее известным способом несплошного наблюдения является выборочное наблюдение. Выделим преимущества такого способа наблюдения:

- экономия времени и средств в результате сокращения объема работы;

- сведение к минимуму порчи или уничтожения исследуемых объектов (определение прочности пряжи при разрыве, испытание электрических лампочек на продолжительность горения, проверка консервов на доброкачественность);

- необходимость детального исследования каждой единицы наблюдения при невозможности охвата всех единиц (при изучении бюджета семей);

- достижение большой точности результатов обследования благодаря сокращению ошибок, происходящих при регистрации.

Можно утверждать, что выборочное наблюдение при строгом соблюдении условий случайности и достаточно большой численности отобранных единиц репрезентативно (представительно); по результатам изучения определенной части единиц с достаточной для практики степенью точности можно судить по всей совокупности.

Виды выборки.

I. По степени охвата единиц изучаемой совокупности:

1) большая выборка ( Статистическое изучение вариации - student2.ru ≥ 30);

2) малая выборка ( Статистическое изучение вариации - student2.ru < 30).

II. По методу отбора:

1) повторная – общая численность единиц генеральной совокупности не изменяется и каждая исследуемая единица может вновь попасть в выборку;

2) бесповторная – общая численность единиц генеральной совокупности меняется (сокращается) и исследуемая единица не может вновь попасть в выборку.

III По виду отбора:

1) индивидуальная – отбираются отдельные единицы генеральной совокупности;

2) групповая – отбираются качественно однородные группы изучаемых единиц;

3) комбинированная – сочетание первого и второго видов.

IV По способу отбора (формирования):

1) собственно случайная (простая случайная) – осуществляется путем жеребьевки, на основе таблиц случайных чисел и т.п. При этом каждой единице генеральной совокупности обеспечивается одинаковая вероятность (возможность) быть выбранной. Единица отбора совпадает с единицей наблюдения.

Случайный отбор может быть проведен в двух формах:

а) в форме возвратной (повторной) выборки – вероятность попадания каждой единицы генеральной совокупности остается постоянной, так как после отбора какой-то единицы она снова возвращается в генеральную совокупность и может быть выбранной;

б) в форме безвозвратной (бесповторной) выборки – выбранная единица не возвращается в генеральную совокупность и вероятность попадания отдельных единиц в выборку все время изменяется (для оставшихся единиц она возрастает).

Применение простой случайной повторной выборки на практике весьма ограниченно; обычно используется бесповторная выборка;

2) механическая – когда упорядоченно–расположенные единицы выбираются через определенные интервалы.

Механическая выборка заключается в отборе единиц из генеральной совокупности через равные промежутки из определенного расположения их в генеральной совокупности (по алфавиту, в пространстве, последовательности появления во времени). Такая выборка применяется при контроле качества различных продуктов.

При организации механического отбора возникают две задачи:

- определение «шага отчета» (интервала выборки);

- выбор единицы, с которой надо начинать отчет.

«Шаг отчета» определяется путем деления численности генеральной совокупности на численность выборочной совокупности Статистическое изучение вариации - student2.ru . Начала отчета находится путем случайного отбора из единиц первого интервала.

3) типическая (расслоенная или районированная) – всю совокупность предварительно разбивают на отдельные типические группы по какому-либо признаку, внутри группы проводится случайный или механический отбор в объеме пропорциональном численности единиц по группам в генеральной совокупности. Типический отбор обеспечивает наибольшую репрезентативность.

4) серийная (гнездовая) – производится отбор целых групп (серий, гнезд) единиц и внутри отобранных серий производится сплошное наблюдение. Серии (гнезда) состоят из единиц, связанных между собой или территориально, или организационно, или, наконец, во времени. Отбор серий может производиться в порядке повторного и бесповторного отбора. Серии могут быть равновеликими и неравновеликими. На практике чаще применяется серийный отбор с равными сериями.

5) комбинированная – предполагает использование нескольких способов выборки. Можно комбинировать, например, серийную выборку и случайную. В этом случае, разбив генеральную совокупность на серии (группы) и отобрав нужное число серий, производят случайную выборку единиц в серии. Такая комбинированная выборка может быть повторной (для групп и единиц) и бесповторной.

6) многоступенчатая выборка – предполагает извлечение из генеральной совокупности сначала укрупненных групп единиц, затем групп, меньших по объему, и так до тех пор, пока не будут отобраны те группы (серии) или отдельные единицы, которые будут подвергнуты наблюдению. Выборка может быть двухступенчатой, когда генеральная совокупность разбивается на группы и производится отбор групп, а затем внутри групп — отбор единиц наблюдения. На обеих ступенях отбор может вестись в случайном порядке. В отличие от типического отбора, где отбор производится из всех без исключения групп, при многоступенчатом отборе производится отбор самих групп, и, следовательно, не все они попадают в выборку.

Основные показатели выборки.

Таблица 18

Показатели Определения Генеральная совокупность Выборочная совокупность
Объем генеральной совокупности Численность единиц всей совокупности N
Объем выборки Число обследованных единиц n
Генеральная средняя Среднее значение признака в генеральной совокупности Статистическое изучение вариации - student2.ru
Выборочная средняя Среднее значение признака в выборке Статистическое изучение вариации - student2.ru
Генеральная доля Доля единиц обладающих данным значением признака в общем числе единиц генеральной совокупности p
Выборочная доля Доля единиц обладающих данным значением признака в общем числе единиц в выборке Статистическое изучение вариации - student2.ru
Число единиц, обладающих изучаемым признаком Статистическое изучение вариации - student2.ru
Генеральная дисперсия Дисперсия признака в генеральной совокупности Статистическое изучение вариации - student2.ru
Выборочная дисперсия Дисперсия признака в выборке Статистическое изучение вариации - student2.ru

Ошибки выборки. Определение необходимого объема выборки Ошибка выборки Статистическое изучение вариации - student2.ru (ошибка репрезентативности) – это разность соответствующих выборочных и генеральных характеристик:

Статистическое изучение вариации - student2.ru – для средней количественного признака;

Статистическое изучение вариации - student2.ru – для доли (альтернативного признака).

Величина этих отклонений называется ошибкой наблюдения,которая складывается из ошибок двоякого рода: ошибки регистрации (точности) и ошибки репрезентативности.

При помощи формул теории вероятности можно рассчитать возможную максимальную случайную ошибку – вероятный (стохастический) предел ошибки.

Максимально возможная ошибка – это такая величина отклонения выборочной средней (доли) от генеральной, вероятность превышения которой вследствие случайных причин в условиях данной выборки очень мала.

Величина случайной ошибки репрезентативности зависит от:

• степени колеблемости изучаемого признака в генеральной совокупности;

• способа формирования выборочной совокупности;

• объема выборки.

Конечной целью выборочного наблюдения является характеристика генеральной совокупности на основе выборочных результатов. В каждой конкретной выборке расхождение между выборочной средней и генеральной может быть меньше средней ошибки выборки, равно ей или больше ее.

Предельную ошибку выборки можно найти на основе средней ошибки выборки:

Статистическое изучение вариации - student2.ru .

Предельная ошибка выборки позволяет определить предельные значения характеристик генеральной совокупности и их доверительные интервалы:

Статистическое изучение вариации - student2.ru – для средней;

Статистическое изучение вариации - student2.ru – для доли.

Основные формулы для вычисления средних ошибок ( Статистическое изучение вариации - student2.ru ) и необходимого объема выборки ( Статистическое изучение вариации - student2.ru ) приведены в таблице, с использованием следующих обозначений:

Статистическое изучение вариации - student2.ru , Статистическое изучение вариации - student2.ru – межгрупповая дисперсия серийной выборки

Статистическое изучение вариации - student2.ru – средние ошибки выборки на отдельных ступенях отбора,

Статистическое изучение вариации - student2.ru – численность выборок на соответствующих ступенях.

Таблица 19

Формулы для вычисления средних ошибок и необходимого объема выборки

Вид отбора Способ отбора единиц Средняя ошибка μ Объем выборки
для средней для доли для средней для доли
Простая случайная выборка повторный Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
бесповторный Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
Механическая выборка Применяются формулы случайной бесповторной выборки
Типическая выборка повторный Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru - для каждой группы; Статистическое изучение вариации - student2.ru - число наблюдений в группе
бесповторный Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
Серийная выборка повторный Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru В зависимости от целей исследования
бесповторный Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
Комбинированная выборка повторный Статистическое изучение вариации - student2.ru В зависимости от комбинируемых методов
бесповторный Статистическое изучение вариации - student2.ru
Многоступенчатая выборка   Статистическое изучение вариации - student2.ru В зависимости от целей исследования

Элементы дисперсионного анализа. Дисперсионный анализ является одним из методов изучения влияния одного или нескольких факторных признаков на результативный признак. В зависимости от количества факторов дисперсионный анализ подразделяется на однофакторный и многофакторный. Ниже рассмотрено применение дисперсионного анализа для случая однофакторного комплекса.

В основе дисперсионного анализа лежит расчленение общей вариации изучаемого признака по источникам ее происхождения на два вида вариации:

систематическую вариацию, которая обусловлена изменением признака-фактора;

остаточную (случайную) вариацию, обусловленную действием прочих, случайных, не связанных с данным фактором обстоятельств.

Для разграничения этих вариаций всю совокупность наблюдавшихся единиц разбивают на группы (классы) по факторному признаку и исчисляют средние результативного признака по группам.

Групповые средние:

Статистическое изучение вариации - student2.ru ;

общая средняя:

Статистическое изучение вариации - student2.ru

где Статистическое изучение вариации - student2.ru – индивидуальные значения признака в группе;

Статистическое изучение вариации - student2.ru – число единиц, входящих в группу;

Статистическое изучение вариации - student2.ru – общее число наблюдений.

Если сравнение групповых средних показывает определенное различие в их уровне, то необходимо установить, является ли это различие существенным и вызвано ли оно влиянием признака-фактора.

Для ответа на поставленный вопрос определяют два показателя дисперсии:

1) показатель Статистическое изучение вариации - student2.ru , характеризующий колеблемость групповых средних вокруг общей средней (межгрупповая дисперсия);

2) показатель Статистическое изучение вариации - student2.ru ,отражающий остаточную, внутригрупповую дисперсию. Полученные показатели сравнивают, получая фактическое дисперсионное отношение:

Статистическое изучение вариации - student2.ru

При дисперсионном анализе межгрупповую и внутригрупповую дисперсии определяют путем деления суммы квадратов отклонений на соответствующее число степеней свободы.

По таблице F-распределения Фишерапри определенном уровне значимости (или доверительной вероятности) и числе степеней свободы ( Статистическое изучение вариации - student2.ru и Статистическое изучение вариации - student2.ru )определяется табличное дисперсионное отношение ( Статистическое изучение вариации - student2.ru ).

Если Статистическое изучение вариации - student2.ru , то следует считать, что гипотеза о влиянии признака-фактора не опровергается.

Пример 17: Пусть в регионе в порядке случайной бесповторной выборки было исследовано 100 предприятий из 1000 и получены следующие данные (таблица 1):

Требуется определить: 1) средний размер дивидендов, гарантируя результат с вероятностью 0,999; 2)долю предприятий, имеющих дивиденды более 745 руб., гарантируя результат с вероятностью 0,999.

Решение: 1) средний размер дивидендов лежит в доверительном интервале Статистическое изучение вариации - student2.ru . Средний размер дивидендов в выборке находили ранее (517,45 руб.). Необходимо рассчитать предельную ошибку в выборке, для чего используем формулу простой случайной бесповторной выборки для средней (дисперсия была найдена ранее Статистическое изучение вариации - student2.ru , Статистическое изучение вариации - student2.ru ):

Статистическое изучение вариации - student2.ru руб.

Соответственно: Статистическое изучение вариации - student2.ru

Статистическое изучение вариации - student2.ru

2) Доверительные интервалы для генеральной доли:

Статистическое изучение вариации - student2.ru

Статистическое изучение вариации - student2.ru – доля предприятий имеющих дивиденды более 745 руб.

Предельная ошибка доли

Статистическое изучение вариации - student2.ru

Соответственно: Статистическое изучение вариации - student2.ru

Статистическое изучение вариации - student2.ru

Пример 18: Фирма открыла два магазина по продаже товаров собственного изготовления в разных районах города. В результате механической выборки была зарегистрирована прибыль с единицы товара:

Таблица 20

Прибыль с единицы товара, тыс.руб. Количество проданного товара, шт.
Магазин 1 Магазин 2
0,5 – 1,5 1,5 – 2,5 2,5 – 3,5 3,5 – 4,5
ИТОГО:

Существенно ли расхождение прибыли с единицы товара в магазинах. Гарантировать результат с вероятностью 0,954.

Решение: Определим отношение: Статистическое изучение вариации - student2.ru , где Статистическое изучение вариации - student2.ru

Промежуточные вычисления представим в таблице:

Таблица 21

Прибыль с единицы товара, тыс.руб. . Магазин 1
Количество проданного товара, шт Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
0,5 – 1,5 -1,5 2,25 13,50
1,5 – 2,5 -0,5 0,25 3,25
2,5 – 3,5 0,5 0,25 2,50
3,5 – 4,5 1,5 2,25 18,00
ИТОГО:       37,25
Прибыль с единицы товара, тыс.руб. . Магазин 2
Количество проданного товара, шт Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru Статистическое изучение вариации - student2.ru
0,5 – 1,5 -2,11 4,44 22,22
1,5 – 2,5
2,5 – 3,5 -0,11 0,01 0,21
3,5 – 4,5 0,89 0,80 11,14
ИТОГО:       33,57

Статистическое изучение вариации - student2.ru ; Статистическое изучение вариации - student2.ru ; Статистическое изучение вариации - student2.ru

Статистическое изучение вариации - student2.ru , следовательно нулевая гипотеза не подтверждается, расхождение между прибылями существенно и не может быть объяснено случайностями выборки.

Наши рекомендации