Свойства средней арифметической
1. Средняя арифметическая постоянной равна самой постоянной.
2. Если все варианты увеличить (уменьшить) в одно и тоже число раз, то средняя арифметическая увеличится (уменьшится) во столько же раз:
.
3. Если все варианты увеличить (уменьшить) на одно и то же число, то средняя арифметическая увеличится (уменьшится) на то же число:
.
4. Средняя арифметическая отклонения вариантов от средней арифметической равна нулю:
.
5. Средняя арифметическая алгебраической суммы нескольких признаков равна такой же сумме средних арифметических этих признаков:
.
6. Если ряд состоит из нескольких групп, общая средняя равна средней арифметической групповых средних, причем, весами являются объемы групп:
где - общая средняя (средняя арифметическая всего ряда); - групповая средняя - ой группы, объем которой равен ; - число групп.
Кроме рассмотренных средних величин, называемых аналитическими, в статистическом анализе применяют структурные, или порядковые, средние. Из них наиболее широко применяются медиана и мода.
Опр. Медиана - это значение, которое делит упорядоченное множество данных пополам, или медиана – это центральное значение упорядоченного ряда вариант.
· Если данные содержат нечетное число значений, то медиана – это центральное значение в упорядоченном ряду.
· Если данные содержат четное число значений, то медиана равна полусумме двух серединных вариантов.
· Для интервального вариационного ряда находится медианный интервал, на который приходится середина ряда, а значение медианы на этом интервале находят с помощью линейного интерполирования.
Замечание. Медиана может быть приближенно найдена с помощью кумуляты как значение признака, для которого или .
Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда, если любой из них, меньший медианы, остается меньше ее, а любой, больший медианы, продолжает быть больше ее. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми.
Опр. Мода - это значение, которое встречается в выборке наиболее часто.
· В случае, когда все значения встречаются одинаково часто, принято считать, что выборка не имеет моды.
· Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значений.
· Если два не соседних (несмежных) значения в выборке имеют равные частоты, которые больше частот любого другого значения, то выделяют две моды. Говорят, что выборка бимодальная.
Замечание. Могут существовать и так называемые мультимодальные распределения, имеющие более двух вершин (мод).
· Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной.
· Для интервального ряда находится модальный интервал, имеющий наибольшую частоту, а значение моды на этом интервале определяют с помощью линейного интерполирования. Но проще найти графическим путем с помощью гистограммы.
Особенность моды как меры центральной тенденции заключается в том. Что она не изменяется при изменении крайних членов ряда, т.е. обладает определенной устойчивостью к вариации признака.
Показатели вариации
Заметим, что средние величины не отражают изменчивости (вариации) значений признака.
Простейшим показателем вариации является вариационный размах: , где - наибольшая варианта, - наименьшая варианта.
Опр. Средним линейным отклонением вариационного ряда называется средняя арифметическая абсолютных величин отклонений вариантов от их средней арифметической:
. (8)
Опр. Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:
, (9)
или
, (10)
где .
Если ряд не сгруппирован, т.е. , то
. (11)
Дисперсию часто называют эмпирической или выборочной, подчеркивая, что она находится по опытным или статистическим данным.
Опр. Среднее квадратическое отклонение - арифметическое значение корня квадратного из дисперсии:
. (12)
Среднее квадратическое отклонение является характеристикой, которая выражена в тех же единицах измерения, что и сам признак.
Опр. Коэффициент вариации – это безразмерная характеристика, вычисляемая по формуле:
(13)
Замечание. Если коэффициент вариации признака, принимающего только положительные значения, высок , то, как правило, это свидетельствует о неоднородности значений признака.
Свойства дисперсии
1. Дисперсия постоянной равна нулю.
2. Если все варианты увеличить (уменьшить) в одно и то же число раз, то дисперсия увеличится (уменьшится) в раз.
3. Если все варианты увеличить (уменьшить) на одно и то же число, то дисперсия не изменится.
4. Дисперсия равна разности между средней арифметической квадратов вариантов и квадратом средней арифметической:
, (14)
где
. (15)
5. Если ряд состоит из нескольких групп наблюдений, то общая дисперсия равна сумме средней арифметической групповых дисперсий и межгрупповой дисперсии:
, (16)
где - общая дисперсия (дисперсия всего ряда); (17) - средняя арифметическая групповых дисперсий; (18); (19) – межгрупповая дисперсия.
Формулу (16) называют «правилом сложения».