Среднее квадратическое отклонение – корень второй степени из среднего квадрата отклонений индивидуальных значений признака от их средней величины.
Дисперсия и среднее квадратическое отклонение являются наиболее широко применяемыми показателями вариации, что объясняется тем, что они входят в большинство теорем теории вероятностей, служащей фундаментом математической статистики. Кроме того, дисперсия может быть разложена на составные элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признаков. Дисперсия используется для построения показателей тесноты корреляционной связи, при оценке результатов выборочных наблюдений и т.д.
Среднее квадратическое отклонение и среднее линейное отклонение показывают, насколько в среднем колеблется величина признака у единиц исследуемой совокупности. По свойству мажорантности средних величин среднее квадратическое отклонение всегда больше среднего линейного отклонения. Если распределения признака близко к нормальному (т.е. значения моды, медианы и среднего практически совпадают), то между этими величинами существует взаимосвязь:
δ≈1,25d или d ≈ 0, 8δ
Среднее квадратическое отклонение показывает, как расположена основная масса единиц относительно средней арифметической. В соответствии с теоремой П.Л. Чебышева (1821 – 1894) можно утверждать, что независимо от формы распределения 75% значений признака попадают в интервал ± 2 δ, а по крайней мере 89% всех значений признака попадают в интервал ± 3 δ.
Пример: на основе данных о распределении учителей района по стажу работы рассчитать показатели вариации.
Стаж работы, лет xi | Число учителей, % к итогу fi | xi fi | xi - | │ xi - │fi | │ xi - │2 | │ xi - │2 fi |
-2 | ||||||
-1 | ||||||
Итого |
Пример расчета:
Размах вариации стажа | R =12—8 =4 года. |
Средний стаж работы | лет |
Среднее линейное отклонение | года |
Дисперсия |
Основная формула для расчета дисперсии:
– невзвешенная дисперсия
Пример расчета дисперсии для уровня бедности, тыс.руб./чел./мес.
Центр города | Окраина города | ||||||
x | x | ||||||
24,5 | 27,4 | ||||||
23,8 | 24,6 | ||||||
23,1 | 23,0 | ||||||
22,4 | 22,5 | ||||||
21,7 | 21,8 | ||||||
21,0 | 21,6 | ||||||
21,0 | 20,9 | ||||||
20,3 | 19,7 | ||||||
19,6 | 18,1 | ||||||
19,6 | 17,4 | ||||||
∑ =217,0 | ∑ = 26,46 | ∑ = 217,0 | ∑ = 79,34 | ||||
Для центра = 26,46, для окраины = 79,34
Таким образом, вариация доходов в центре ниже, чем на окраине.
Другая формула для расчета дисперсии выборки:
Пример расчета дисперсии: имеется выборка из четырех значений
2,3,6,9
∑ = 20 | ∑ = 130 |
= 10
Дисперсия для сгруппированных данных:
Пример расчета дисперсии
Стаж работы | F | x (середина интервала) | fx | fx2 |
2-4 | ||||
5-7 | ||||
8-10 | ||||
11-13 | ||||
14-16 | ||||
∑ = 23 | ∑ = 204 | ∑ =2034 |
= 10,2
Стандартное отклонение – квадратный корень из дисперсии
Стандартное отклонение интерпретируется как мера разброса, так как имеет те же единицы измерения, как и результаты наблюдений.
Дисперсия измеряется как первоначальные единицы измерения в квадрате.
Для целей сравнения вариации различных признаков в одной и той же совокупности или же при сравнении вариации одного и того же признака в нескольких совокупностях вычисляются относительные показатели вариации. Базой для сравнения служит средняя арифметическая. Эти показатели вычисляются как отношение размаха, или среднего линейного отклонения, или среднего квадратического отклонения к средней арифметической. Чаще всего они выражаются в процентах и характеризуют не только сравнительную оценку вариации, но и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). Различают следующие относительные показатели вариации
Коэффициент осцилляции: 100%
Линейный коэффициент вариации: 100%
Коэффициент вариации: 100%
Наиболее часто используется коэффициент вариации, например, в случаях, когда необходимо сравнить несколько совокупностей, измеряемых в разных величинах или сравнить несколько совокупностей, измеряемых в одинаковых величинах, но имеющие сильно отличающиеся средние.
Пример: по имеющимся данным для двух совокупностей, выявить, различие в вариации признака: δ1 = 3, , δ1 = 20, .
Пример расчета:
и
Вывод – коэффициенты вариации равны, поэтому вариация признака в сравниваемых совокупностях одинакова.
Пример:в городе N в 2008 г. средняя цена 1 м2 жилья составила 30,88 тыс. руб., а в 2009 г. – 50,82 тыс. руб. Известно, что среднее квадратическое отклонение в 2008 г. составило 7,6, а в 2009 г. – 9,8. Необходимо сделать выводы о вариации цен за жилье.
Пример расчета:
или 25%, или 19%.
Вывод –так как значение второго коэффициента меньше, чем первого, то вариация цен за жилье в 2009 г. снизилась по сравнению с 2008 г.
В социологических исследованиях часто возникает необходимость оценки вариации качественных признаков, эквивалентом которых будет служить бинарная переменная со значениями 0 и 1. Например, при изучении успеваемости студентов, их можно разделить на две группы – успевающих и неуспевающих, причем значение 1 присваивается успевающему студенту.
Пример:имеются данные для совокупности, число единиц которой равно n, а число единиц, обладающих признаком – f.
Значение переменной | Частота | Число студентов |
f | ||
n-f | ||
Итого | n |
Пример расчета средней арифметической предложенного ряда:
= p,
Таким образом, значениесредней арифметической равняется относительной частоте, т.е. p – доля единиц, обладающих этим признаком, а доля единиц, не обладающих этим признаком – q (как известно, p + q = 1).
Тогда дисперсия альтернативного (бинарного) признака:
Выяснение общего характера распределения предполагает не только оценку степени его однородности, но и оценку его симметричности островершинности или плосковершинности. Симметричным называется распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. В статистике дня характеристики асимметрии пользуются несколькими показателями.