Тема № 7. Ряды распределения

Ряд распределения или вариационный ряд – упорядоченное распределение единиц совокупности по возрастающим или по убывающим значениям признака и подсчет единиц с тем или иным значением признака. Построение рядов распределения (структурной группировки) является первым этапом изучения вариации и осуществляется с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают типы рядов распределения.

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).

Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.

Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.

Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.

Если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный вариационный ряд.

Величина интервала определяется по формуле Тема № 7. Ряды распределения - student2.ru Тема № 7. Ряды распределения - student2.ru , где

xmax, min - максимальное и минимальное значение признака, к – число групп.

Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается Тема № 7. Ряды распределения - student2.ru , где к – число вариантов значения признака.

Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.: Тема № 7. Ряды распределения - student2.ru , при этом Тема № 7. Ряды распределения - student2.ru

Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.

В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.

Нормальное распределение зависит от двух параметров: средней арифметической и среднего квадратического отклонения. Его кривая выражается уравнением Тема № 7. Ряды распределения - student2.ru

где у - ордината кривой нормального распределения; Тема № 7. Ряды распределения - student2.ru - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; Тема № 7. Ряды распределения - student2.ru - их средняя величина; Тема № 7. Ряды распределения - student2.ru - cреднее квадратическое отклонение.

Теоретические частоты при нормальном распределении определяются по формуле: Тема № 7. Ряды распределения - student2.ru , где N = Sf – сумма всех эмпирических частот вариационного ряда; h – величина интервала в группах.

При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.

Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии ( Тема № 7. Ряды распределения - student2.ru ), такой ряд выравнивается по кривой Пуассона.

Кривую Пуассона можно выразить отношением Тема № 7. Ряды распределения - student2.ru , где Px - вероятность наступления отдельных значений х; Тема № 7. Ряды распределения - student2.ru - средняя арифметическая ряда.

Теоретические частоты при распределении Пуассона определяют по формуле: f = N Px , где N – общее число единиц ряда.

Для расчета обобщающих показателей и для графического изображения вариационных рядов с неравными интервалами используют плотность распределения, которая определяется по формулам:

Тема № 7. Ряды распределения - student2.ru ,

где Тема № 7. Ряды распределения - student2.ru - абсолютная плотность распределения в j-м интервале, Тема № 7. Ряды распределения - student2.ru - относительная плотность распределения в j-м интервале; ij – величина интервала.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.

Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.

Наиболее распространенным является критерий согласия К. Пирсона, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам: Тема № 7. Ряды распределения - student2.ru

Вычисленное значение критерия c2расч необходимо сравнить с табличным (критическим) значением c2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n ³ 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.

Если c2расч £ c2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского (КРом), который, используя величину c2, предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения: Тема № 7. Ряды распределения - student2.ru , где m - число групп; k = (m - 3 ) - число степеней свободы при исчислении частот нормального распределения.

Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.

Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле: Тема № 7. Ряды распределения - student2.ru , где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; Sf - сумма эмпирических частот.

По таблицам значений вероятностей l-критерия можно найти величину l, соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.

Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).

При анализе вариационного ряда и его свойств используют графические методы. Интервальный ряд изображаю столбиковой диаграммой или гистограммой, в которой основания столбиков, расположенные на оси – абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты.

Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого ряда называют полигоном.

Преобразованной формой вариационного ряда является ряд накопленных частот. Это ряд значений числа единиц совокупности с меньшими или равными нижней границе соответствующего интервала значениями признака. Такой ряд называют кумулятивным. Можно построить кумулятивное распределение «не меньше, чем» – кумулята, и «больше, чем» – огива.

Наши рекомендации