Структурные характеристики вариационного ряда
Мода (Мо) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой.
Медиана (Ме) - значение признака, приходящееся на середину ранжированной совокупности. Главное свойство медианы: сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины
Определение моды по сгруппированным данным: сначала находят номер модального интервала, а затем ,
где X - нижняя граница модального интервала;
I - величина модального интервала;
- частота модального интервала;
- частота предшествующего модальному интервала;
- частота следующего за модальным интервала.
Квантиль - это значение хq случайной величины, удовлетворяющей условию: F(xq) = q, где F(xq) - вероятность того, что Х<x.
Различают:
медиану при q=0,5,
квартели при q=0,25,
квинтели при q=0,2,
децили при q=0,1,
процентили при q=0,01.
Для дискретного ряда – это значение признака в той группе, где накопленная частность превышает , где - номер квантилей. Аналогично определяется квантильный интервал для интервального ряда. Значение квантилей внутри интервального ряда . Подставляя различные значения , получаем разные квантили.
Квантили используются для расчета показателей, концентрации и дифференциации доходов населения. По данным выборочных опросов получают интервальный ряд распределения населения по среднедушевому доходу.
Расчет коэффициента концентрации Джини производится на основании данных о распределении населения по уровню среднедушевого совокупного дохода. Вся совокупность получателей доходов делится на 5 равных групп и определяется, какой долей дохода владеет каждая группа населения. Затем по полученным накопленным итогам строится так называемая кривая Лоренца (графическое изображение уровня концентрации явления) (см. рисунок).
При равномерном распределении доходов каждая двадцатипроцентная группа населения имела бы пятую часть доходов общества. На графике это изображается диагональю квадрата и рассматривается как линия равномерного распределения. При неравномерном распределении "линия концентрации" представляет собой вогнутую вниз кривую. Чем больше отклонение кривой Лоренца от диагонали квадрата, тем выше поляризация доходов общества.
Кривая Лоренца
Коэффициент Джини рассчитывается по формуле , где - доля населения в интервале, - доля доходов у этой доли населения.
Децильные коэффициенты дифференциации доходов рассчитываются как соотношения уровней верхнего и нижнего децилей вариационных рядов соответствующих показателей.
Коэффициент фондов, рассчитанный по данным ряда распределения населения по уровню среднедушевого дохода, показывает, во сколько раз среднедушевой доход 10 % наиболее высокодоходного населения больше, чем у 10 % населения с наименьшими доходами.
Среднее значение дохода населения в пределах одного квантиля находится как средневзвешенное. Для этого в качестве параметров берется среднее значение в каждом интервале дохода (интервальный ряд распределения с шагом h), а в качестве весов берутся количество или процент населения, имеющего доход, попадающий в соответствующий интервал.
Показатели вариации
В статистической практике для изучения и измерения вариации используются различные абсолютные и относительные показатели (меры) вариаций в зависимости от поставленных перед исследователем задач. К абсолютным показателям относятся размах вариации, среднее линейное отклонение, средний квадрат отклонений (дисперсия), среднее квадратическое отклонение, квартильное отклонение.
Изучение вариации признаков общественных явлений находится в прямой связи с группировками, в частности, с рядами распределения.
Размах вариации является наиболее простым измерителем вариаций признака. Он представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: .
Среднее линейное отклонение представляет собой среднюю величину из отклонений вариантов признака от их средней
, где Xi - i-й вариант признака, - вес i-го варианта, n - объем совокупности.
Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины (s). Дисперсия вычисляется по формулам простой невзвешенной и взвешенной соответственно:
и .
Дисперсия обладает рядом свойств, некоторые из них позволяют упростить ее вычисления:
1) дисперсия постоянной величины равна нулю;
2) если все варианты значений признака уменьшить на одно и то же число, то дисперсия не уменьшится ;
3) если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k2 раз .
Среднеквадратическое отклонение представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней.
- невзвешенное,
- взвешенное.
Для характеристики вариации признаков в совокупности можно применить так называемое квартильное отклонение. Этот показатель также можно применить вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:
q = (Q3 – Q1) / 2.
Наряду с абсолютными показателями существуют и относительные, которые получают из абсолютных путем деления на :
- коэффициент осцилляции ;
- относительное линейное отклонение ;
- коэффициент вариации ;
- относительное квартильное отклонение .
Момент распределения
Порядок | Начальный | Центральный | Условный |
· · · · · · · · · · · |
Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса.
Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель AS:
.
При нормальном распределении коэффициент асимметрии равен 0. Величина показателя асимметрии может быть положительной и отрицательной.
Может быть также рассчитан показатель эксцесса (островершинности):
.
Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении и показатель эксцесса равен 0.
Наряду с изучением вариации признака по всей совокупности в целом бывает часто необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии при использовании аналитической группировкой.
Межгрупповая дисперсия , где - номер группы, а - число единиц в -й группе. Межгрупповая дисперсия характеризует вариации результативного признака за счет факторного признака .
Внутригрупповая дисперсия характеризует вариацию внутри группы.
Между дисперсиями существует связь - правило сложения дисперсий , где - общая дисперсия, а - средняя из внутригрупповых:
; .
Для оценки тесноты связи между результативным y и факторным х признаками используется эмпирическое корреляционное отношение , а также коэффициент детерминации , который показывает, какая часть вариации вызвана вариацией . Если данный коэффициент равен нулю, то результативные и факторные признаки не связаны между собой, если же равен единице, то между ними существует функциональная зависимость.
Задачи
k – номер варианта
Задача 1
Рассчитайте среднюю заработную плату.
Размер заработной платы, р | Численность, чел. |
10+k | |
15+ k | |
20+ k | |
5+ k |
Задача 2
Рассчитайте среднюю заработную плату.
Размер заработной платы, р | Численность, чел. |
до 200 | 10+k |
200-400 | 30+k |
10+k |
Задача 3
Рассчитайте среднюю заработную плату по предприятию.
№ цеха | Средняя заработная плата, р | Фонд заработной платы, тыс. р. |
30+k | ||
60+k |
Задача 4
Рассчитайте средний темп роста (в процентах).
Показатель | Год | |||
Товарная продукция, млн р. | 20+k | 24+k | 30+k | 40+k |
Задача 5
Даны остатки товаров на складе. Рассчитайте средний остаток на 1-й квартал.
На 01.01 | 20 000 + 1000k (тыс. р.) |
На 01.02 | 250 + 1000k (тыс. р.) |
На 01.03 | 300 + 1000k (тыс. р.) |
На 01.04 | 380 + 1000k (тыс. р.) |
Задача 6
Рассчитайте моду и медиану.
Группы предприятий по стоимости ОПФ, млн р. | Число предприятий |
14-16 | 2+k |
16-18 | 6+k |
18-20 | 10+k |
20-22 | 4+k |
22-24 | 3+ k |
Задача 7
По данным, приведенным в таблице, рассчитать: среднюю арифметическую взвешенную; размах вариации; среднее линейное отклонение; дисперсию; среднее квадратическое отклонение; коэффициент осцилляции, %; относительное линейное отклонение, %; коэффициент вариации, %.