Виды дисперсий, правило сложения дисперсий и его использование в
Анализе факторов
Вычисляя общую дисперсию изучаемого признака в пределах совокупности, мы не можем оценить влияние отдельных факторов, определяющих вариацию индивидуальных значений (вариант) признака. Это можно сделать лишь при помощи группировок, подразделив изучаемую совокупность на группы, однородные по признаку-фактору. В статистике, используя метод группировок, определяют три показателя вариации признака в совокупности в виде трех различных дисперсий:
– общей (генеральной) дисперсии;
– межгрупповой (факторной) дисперсии;
– средней внутригрупповых дисперсий (остаточной дисперсии).
Общая дисперсияхарактеризует вариацию признака, которая зависит от всех условий (факторов) в данной совокупности, и исчисляется по формуле
где – средняя величина изучаемого признака для всей совокупности.
Межгрупповая (факторная) дисперсияотражает вариацию изучаемого признака которая возникает под влиянием признака-фактора , положенного в основание группировки. Она характеризует вариацию групповых средних около общей средней и вычисляется по формуле
где – численность отдельных групп; – средние групповые значения признака.
Средняя внутригрупповых дисперсий (остаточная дисперсия)характеризует случайную, не обусловленную признаком-фактором, вариацию. Эта вариация возникает под влиянием других, не учитываемых факторов, и не зависит от признака-фактора , положенного в основание группировки. Она определяется по формуле
,
где – дисперсия изучаемого признака в каждой отдельной группе.
В математической статистике доказывается правило сложения дисперсий,которое говорит, что общая дисперсия равна сумме межгрупповой дисперсии и средней внутригрупповых дисперсий. Оно записывается в виде формулы
Это правило (закон) сложения дисперсий имеет большую практическую значимость, так как позволяет выявить зависимость вариации от определяющих её факторов при помощи соотношения межгрупповой и общей дисперсии
Последнее соотношение называется коэффициентом детерминациии определяет процент различий (отклонений) в совокупности, обусловленный признаком-фактором, выбранным для группировки в качестве основного.
Пример.При исследовании производительности труда (признак ) совокупности рабочих на предприятии была проведена группировка рабочих по размеру заработной платы (признак ). В результате статистической обработки данных и расчётов коэффициент детерминации (по признаку ) оказался равным Это означает, что различия в производительности труда отдельных рабочих лишь на 43% обусловлено фактором заработной платы и, следовательно, на 57 % – прочими факторами (условиями).
В статистике наряду с дисперсией количественного признака определяется дисперсия альтернативного признака. Альтернативными являются признаки, которыми обладают одни единицы совокупности и не обладают другие. Формула расчёта дисперсии альтернативного признака имеет вид
где доля вариант, обладающих определенным значением признака.
Контрольные вопросы
1. Что представляет собой вариация признака?
2. Какие показатели относят к абсолютным показателям вариации?
3. Что собой представляют относительные показатели вариации?
4. Назовите варианты расчета среднего линейного отклонения, дисперсии и среднеквадратического отклонения.
5. Как рассчитывается дисперсия и среднеквадратическое отклонение с использованием второго и первого начальных моментов?
6. Приведите формулы расчета коэффициентов осцилляции, среднего линейного отклонения и вариации.
6. Как рассчитывается дисперсия доли (альтернативного признака)?
7. Сформулируйте общее правило сложения дисперсий и объясните, что характеризует межгрупповая и средняя внутригрупповых дисперсий.
8. Как рассчитывается коэффициент детерминации? Поясните смысл этого коэффициента.
Задачи
1. Имеются данные об объемах закупок скота и птицы (в живом весе, тыс. т):
Номер хозяйства | |||||||
Объемы закупок |
Определите показатели вариации объемов закупок скота и птицы.
2. На основе данных о распределении посевной площади озимой пшеницы по урожайности произвести расчет дисперсий, используя правило их сложения:
Расчетные данные по всей совокупности участков:
Номер участка | Урожайность, ц/га (x) | Посевная площадь, га (f) | xf | x2 | x2 f |
32 000 | |||||
24 200 | |||||
12 500 | |||||
39 200 | |||||
90 000 | |||||
98 000 | |||||
72 200 | |||||
112 000 | |||||
Итого | - | 15 100 | - | 480 100 |
3. На основе данных о распределении деталей по затратам времени на их изготовление вычислить абсолютные и относительные показатели вариации