Изучение формы распределения
Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму).
Для построения полигона распределения на оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, из них восстанавливаются перпендикуляры, длина которых соответствует их частоте (частности) этих вариантов по прямому масштабу на оси ординат. Вершины перпендикуляров в последовательном порядке соединяются отрезками прямых. Для замыкания полигона крайние вершины соединяются с точками на оси абсцисс, отстоящими на одно деление в принятом масштабе от Xmax и Xmin. Такое построение полигона облегчает восприятие его графического изображения.
Для графического изображения индивидуальных вариационных рядов применяется гистограмма. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частностям) интервала.
Число наблюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из исследуемой генеральной совокупности. Поэтому эмпирические данные в определенной степени связаны со случайными ошибками наблюдения, величина которых неизвестна. Влияние этих случайностей затемняет основную закономерность изменения величины признака. С увеличением число наблюдений и одновременным уменьшением величины интервала зигзаги полона начинают сглаживаться, и в пределе мы переходим к плавной кривой, которая называется кривой распределения.
Кривая распределения характеризует теоретическое распределение, которое получилось бы при полном погашении всех случайных причин, затемняющих основную закономерность. Исследование закономерности (или формы) распределения включает решение трех последовательных задач:
1) выяснение общего характера распределения;
2) выравнивание эмпирического распределения, которое состоит в том, что на основании эмпирического распределения строится кривая с заданной формой;
3) проверку соответствия найденного теоретического распределения эмпирическому.
Выяснение общего характера распределение предполагает оценку степени его однородности, а также вычисление показателей ассиметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений имеет место равенство средней арифметической, моды и медианы.
Для сравнительного анализа степени ассиметрии нескольких распределений рассчитывает относительный показатель :
(5.23)
Величина показателя ассиметрии может быть положительной и отрицательной. Положительная величина показателя ассиметрии указывает на наличие правосторонней ассиметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая, рис. 5.1.а). При правосторонный ассиметрии между показателями центра распределения существует соотношение: . Отрицательный знак показателя ассиметрии свидетельствует о наличии левосторонней ассиметрии (рис. 5.1.б). Между показателями центра распределения в этом случае имеется такое соотношение: .
Рис. 5.1. Ассиметричные ряды распределения:
а) с правосторонней ассиметрией б) с левосторонней ассиметрией
Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка (в симметричном распределении его величина равна нулю):
(5.24)
где – момент распределения третьего порядка.
Он рассчитывается по формулам:
а) для несгруппированных данных:
, (5.25)
б) для сгруппированных данных:
(5.26)
Применение этого показателя дает возможность не только определить степень ассиметрии, но и ответить на вопрос о наличии или отсутствии ассиметрии в распределении признака в генеральной совокупности.
Для симметричных распределений рассчитывается показатель эксцесса (островершинности). Наиболее точным является показатель, основанный на использовании центрального момента четвертого порядка:
, (5.27)
где – момент распределения четвертого порядка
Он определяется по формулам:
а) для несгруппированных данных:
, (5.28)
б) для сгруппированных данных:
(5.29)
На рис. 5.2 представлены два распределения: одно – островершинное (величина эксцесса положительная); второе – плосковершинное (величина эксцесса отрицательная). Эксцесс представляет собой выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения. В нормальном распределении отношение .
Рис. 5.2. Ряды распределения с положительным (а) и отрицательным (б) эксцессами
В заключение укажем особенности кривой нормального распределения:
1. Кривая симметрична относительно максимальной ординаты. Максимальная ордината соответствует значению .
2. Кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности. Следовательно, чем больше значение отклоняется от , то тем реже они встречаются. Одинаковые по абсолютному значению, но противоположные по знаку отклонения значений переменной x от равновероятны.
3. Кривая имеет две точки перегиба, находящиеся на расстоянии от .
4. При = const с увеличением кривая становится более пологой. При = const с изменением кривая не меняет свою форму, а лишь сдвигается вправо или влево по оси абсцисс.
5. В промежутке находится 68,3% всех значений признака. В промежутке находится 95,4% всех значений признака. В промежутке находится 99,7% всех значений признака.
Нормальное распределение возможно в том случае, когда на величину признака влияет большое число случайных причин. Действие этих причин независимо, и ни одна из причин не имеет преобладающего влияния над другими.
Пример.Определить коэффициент ассиметрии и эксцесса распределения магазинов по размеру товарооборота (табл. 5.3).
Таблица 5.3. Данные о распределении магазинов по размеру товарооборота
Группы магазинов по размеру товарооборота, млн. руб. | Число магазинов |
100 – 110 110 – 120 120 – 130 130 – 140 | |
Итого |
Для решения задачи составим вспомогательную таблицу (табл. 5.4).
Таблица 5.4. Информация для расчета коэффициентов ассиметрии и эксцесса
Группы магазинов по размеру товарооборота, млн. руб. x | Число магазинов | Середина интервала Xi | |||||
100 – 110 110 – 120 120 – 130 130 – 140 | -13,6 -3,6 6,4 16,4 | 554,88 64,8 163,84 537,92 | 7546,37 233,28 1048,58 8821,89 | 102630,6 839,81 6710,89 144678,96 | |||
Итого | – | – | 1321,44 | 17650,11 | 254860,26 |
1. Рассчитаем среднюю арифметическую по формуле (5.7):
2. Найдем дисперсию по формуле (5.11):
3. Найдем среднее квадратическое отклонение по формуле (5.13):
4. Определим центральный момент третьего порядка, используя формулу (5.26):
5. Определим нормированный момент третьего порядка, используя формулу (5.24):
6. Определим моду для того, чтобы найти коэффициент асимметрии, для этого будем использовать формулу (5.6).
7. Определим коэффициент ассиметрии, используя формулу (5.23):
В данном случае ассиметрия небольшая и скошенность правосторонняя.
8. Найдем центральный момент четвертого порядка, используя формулу (5.29):
9. Определим нормированный момент четвертого порядка
10. Определим эксцесс распределения, используя формулу (5.27)
Так как распределение низковершинное.
Контрольные вопросы
1. В чем состоят различия в построении рядов распределения с дискретным и непрерывным характером вариации признака?
2. Какие системы показателей используют для характеристики особенностей рядов распределения?
3. Какие показатели вариации вы знаете? Напишите их формулы.
4. Что характеризует межгрупповая дисперсия?
5. Напишите соотношение между показателями центра распределения при правосторонней и левосторонней ассиметрии.