Основные характеристики вариационного ряда
Средняя арифметическая. Для несгруппированных данных средняя арифметическая рассчитывается по формуле:
, где n – число значений признака (вариантов)
и называется средней арифметической простой.
Для дискретного вариационного ряда (где данные уже сгруппированы) рассчитывается средняя арифметическая взвешенная:
, где m, f – веса.
Понятие «вес» не всегда связано с подсчётом частот вариантов, и, следовательно, с вариационными рядами.
Для интервального вариационного ряда для исчисления предварительно в каждом интервале определяется его середина, которая принимается за конкретное значение признака и умножается на соответствующую частоту. Середина интервала определяется как полусумма нижней и верхней границ интервала. Если у первого интервала нет нижней границы, а у последнего – верхней, то эти границы устанавливаются условно, полагая, что первый интервал по величине равен следующему за ним, а последний – предшествующему.
Важнейшее свойство средней арифметической: сумма отклонений вариантов от своей средней арифметической равна нулю
.
Средняя гармоническая.
Средняя гармоническая простая , где – обратные значения вариантов.
Средняя гармоническая взвешенная , где M – веса.
Применение средней арифметической или средней гармонической определяется наличием данных и исходным статистическим соотношением (ИСС).
Кроме вышеуказанных средних, рассчитываются и структурные средние:
Мода (Мо) – это наиболее часто встречающееся значение признака у единиц совокупности. Для дискретных рядов – это вариант, имеющий наибольшую частоту (для наших данных Мо=20 тыс. руб.).
В интервальных вариационных рядах вначале по наибольшей частоте определяют интервал, в котором находится мода – модальный интервал. Для рядов с равными интервалами мода определяется по следующей формуле:
,
где – нижняя граница модального интервала; i – величина модального интервала; – частота (частость) предмодального интервала; – частота модального интервала; – частота послемодального интервала.
.
В ряду с неравными интервалами Мо определяется в интервале, имеющем наибольшую плотность распределения, и в формуле вместо частот принимаются соответствующие плотности распределения. Плотность распределения рассчитывается делением количества единиц в интервале на величину интервала.
Медиана (Ме) – это значение признака у средней единицы ранжированного ряда. Ранжированным называется ряд, у которого значения признака расположены в порядке возрастания или убывания.
Для нахождения медианы в случае несгруппированных данных вначале определяют её порядковый номер: . Если n – нечётное число, то в центре ряда находится одно значение признака, и оно будет являться медианой; если же n – чётное число, то в центре ряда стоят два варианта, и медиану нужно определять как среднюю из величин этих вариантов.
№1 | №2 | №3 | №4 | №5 | №6 | №7 | №8 | №9 | №10 | №11 |
Для определения медианы в дискретном ряду также находят её порядковый номер: . Далее рассчитывают накопленные частоты (частости) S путём последовательного суммирования частот всех вариантов, начиная с первого и заканчивая данным. Медианой является тот вариант, накопленная частота которого впервые больше или равна медианного номера: .
x | Итого | |||||||
m | ||||||||
S | 1+2=3 | 1+2+1=4 | 1+2+1+4=8 | 1+2+1+4+1=9 | 1+2+1+4+1+1=10 | 1+2+1+4+1+1+1=11 | – |
8>6 Ме=20 тыс. руб.
В интервальном ряду, прежде всего, находят медианный интервал; им считается тот, накопленная частота которого впервые больше или равна половины всей суммы частот .
Медиана в этом случае находится по формуле:
,
где – нижняя граница медианного интервала; d – величина медианного интервала; – сумма частот (частостей) ряда; – накопленная частота до медианного интервала; – частота медианного интервала.