Рассчитаем квартили для ряда распределения рабочих участка
по стажу работы:
• нижний квартиль 1/ 4 Q – соответствует 13-ой единице, верхний
квартиль 3 / 4 Q – 38-ой. Это соответственно 2-ая и 4-ая группы.
Q 4 4 0,8 7,2
4 4 = + ⋅ ≈
−
= + ⋅ лет;
Q 12 4 16
3 50
12 4 = + ≈
−
⋅
= + ⋅ лет.
Следовательно, у четверти рабочих стаж менее 7 лет и у четверти –
Более 16 лет.
Таким образом, для характеристики положения центра ряда
распределения можно использовать 3 показателя: среднее значение
Признака, мода, медиана.
При выборе вида и формы конкретного показателя центра
распределения необходимо исходить из следующих рекомендаций:
• для устойчивых социально-экономических процессов в качестве
Показателя центра используют среднюю арифметическую. Такие процессы
Характеризуются симметричными распределениями, в которых
x = Me = Mo ;
• для неустойчивых процессов положение центра распределения
Характеризуется с помощью Mo или Me. Для асимметричных процессов
Предпочтительной характеристикой центра распределения является
Медиана, поскольку занимает положение между средней арифметической
И модой.
Показатели вариации
Вторая важнейшая задача при определении общего характера
распределения – это оценка степени его однородности. Однородность
Статистических совокупностей характеризуется величиной вариации
(рассеяния) признака, т.е. несовпадением его значений у разных
Статистических единиц.
Для измерения вариации в статистике используются абсолютные и
Относительные показатели.
К абсолютным показателям вариации относятся:
• размах вариации R,
• среднее линейное отклонение d ,
• средний квадрат отклонений (дисперсия) δ 2 ,
• среднее квадратическое отклонение δ ,
Размах вариации R является наиболее простым показателем
вариации, рассчитывается по формуле:
max min R = x − x .
Этот показатель представляет собой разность между максимальным
И минимальным значениями признаков и характеризует разброс элементов
Совокупности. Размах улавливает только крайние значения признака в
Совокупности, не учитывает повторяемость его промежуточных значений,
а также не отражает отклонений всех вариантов значений признака.
Размах часто используется в практической деятельности, например,
Различие между max и min пенсией, заработной платой в различных
Отраслях и т.д.
Среднее линейное отклонение d является более строгой
Характеристикой вариации признака, учитывающей различия всех единиц
Изучаемой совокупности. Среднее линейное отклонение представляет
Собой среднюю арифметическую абсолютных значений отклонений
отдельных вариантов от их средней арифметической. Этот показатель
Рассчитывается по формулам простой и взвешенной средней
арифметической:
N
X x
d
N
i
i Σ=
−
= 1 - для несгруппированных данных;
Σ
Σ
=
=
− ⋅
= m
i
i
m
i
I i
n
X x n
d
Для сгруппированных данных.
В практических расчетах среднее линейное отклонение
Используется для оценки ритмичности производства, равномерности
Поставок.
Формат: Список
Так как модули обладают плохими математическими свойствами, то
На практике часто применяют другие показатели среднего отклонения от
средней – дисперсию и среднее квадратическое отклонение.
Дисперсия признака σ 2 представляет собой средний квадрат
отклонений вариантов от их средней величины, является общепринятой
Мерой вариации. В зависимости от исходных данных дисперсия
вычисляется по формулам простой и взвешенной средней арифметической:
Для несгруппированных данных
N
X x
N
i
i Σ=
−
= 1
( )
σ ;
Для сгруппированных данных
Σ
Σ
=
=
− ⋅
= m
i
i
m
i
I i
n
X x n
( )
σ .
При использовании взвешенной средней для расчета дисперсии в
интервальных рядах распределения в качестве вариантов значений
Признака используются серединные значения b (середины интервалов), не
Являющиеся средним значением в группе. В результате получают
Приближенное значение дисперсии.
Существуют более простые подходы в вычислении дисперсии.