Графический метод изучения рядов распределения

Характер и закономерности развития массового явления в пространстве и во времени складываются под влиянием множества существенных и несущественных, объективных и субъективных, реальных и случайных движущих сил, причин (т.е. факторов). В каждой конкретной единице статистической совокупности действие факторов проявляется по-разному. Поскольку зависимость между значениями признаков и единицами совокупности обнаруживаются, в общем и среднем на основе закона больших чисел, то важной задачей изучения рядов распределения является изучение характера распределения единиц совокупности по исследуемым признакам.

Важным приемом изучения рядов распределения является их графическое изображение.

Способы построения графиков различны для интервальных и дискретных рядов.

Графически дискретный вариационный ряд можно изобразить, используя прямоугольную систему координат и строя точки с координатами (х1, f1,),( x2, f2), … (xn, fn). Если затем соединить последовательно полученные точки отрезками прямой, а из первой и последней точек опустить перпендикуляр на ось Х, получим фигуру, которая называется полигоном и графически представляет распределение единиц совокупности по признаку Х (рис. 6.1а).

График дискретного ряда распределения можно так же построить следующим образом. На оси абсцисс в одинаковом масштабе откладываются слева направо в порядке возрастания значения вариант данного ряда. По оси ординат наносится шкала для значений величин частот. Из точек на оси Х абсцисс, соответствующих значению исходной варианты, восстанавливаются перпендикуляры (ординаты), причем длина ординаты (высота перпендикуляра) измеряется в единицах масштаба оси ординат. Вершины этих перпендикуляров соединяются в последовательном порядке отрезками прямой. К полученной ломанной линии присоединяются два крайних перпендикуляра (рис. 6.1 б).

Полученный график (полигон) четко отражает характер рассматриваемого распределения. Сумма частот (частостей), заключенных в полигоне, равна объему совокупности.

График интервального ряда, так же как и дискретного ряда, позволяет выявить характер (структуру) распределения изучаемого явления.

При построении графика интервального ряда на оси абсцисс откладываются интервалы ряда. Незакрытые интервалы принимаются равными или величине следующего (для открытого первого), или предыдущего (для открытого последнего интервала). Такой прием применяется, если действительные нижняя или верхняя границы этих интервалов неизвестны даже предположительно. Нередко для первого интервала началом принимают “0”.

 
  Графический метод изучения рядов распределения - student2.ru

Рис. 6.1. Полигон распределения

Приняв интервалы за основание, строим на них прямоугольники, равные по высоте частоте данного интервала. Полученное графическое представление интервального вариационного ряда называется гистограммой. Площадь гистограммы, как и полигона, равна объему совокупности.

При построении гистограммы для интервальных рядов с неравными интервалами используются величины плотностей распределения, а не частоты данного ряда. В этом случае частоты зависят не только от величины вариант, но и от размеров интервалов: чем больше взят интервал, тем больше единиц совокупности попадает в него. Если ряд с равными интервалами, то частоты (частости) дают четкое представление о том, как заполнены интервалы единицами совокупности, и соответственно, отражают характер распределения. Сравнивая частоты (частости) ряда с неравными интервалами, еще нельзя судить об относительной заполнености разных интервалов. Для этого нужно исключить влияние размера частоты (частости) на величину интервала. Это обеспечивается расчетом особого показателя, отражающего сколько единиц ( или сколько доле или процентов единиц) совокупности приходится на единицу изменения варианта.

Абсолютная плотность распределения (К) представляет собой величину частоты, приходящейся на единицу размера интервала отдельной группы ряда К=f /h., где h- величина интервала.

Относительна плотность распределения (K’) определяется как частное от деления частости (w) отдельной группы ряда на размер ее интервала
K’=w /h.

Итак, чтобы изучить характер распределения (или структуру) необходимо на оси абсцисс в прямоугольной системе координат откладывать значения исследуемого признака (варианты) Х, а на оси ординат – частоты (частости) или плотность распределения, и строят полигоны для дискретных рядов, а для интервальных – гистограммы. Вид полученного графика (полигона или гистограммы) указывает на характер распределения. Площадь полигона или гистограммы численно равна сумме частот или частостей единиц в совокупности.

 
  Графический метод изучения рядов распределения - student2.ru

Рис. 6.2. Гистограммы распределения

В гистограмме если середины прямоугольников соединить отрезками прямых, то можно получить полигон распределения. Непрерывную вариацию изучаемого признака можно графически изобразить сразу в виде полигона , когда значения вариант (или плотностей распределения) относят к середине интервала. При этом необходимо обеспечить равенство площадей полигона и гистограммы.

С помощью графического изображения ряда в виде полигонов или гистограмм можно сравнивать структуры распределения единиц совокупности по различным признакам или по различным явлениям.

В практике экономико-статистических работ нередко возникает потребность в преобразовании рядов распределения в ряды с накопленными частотами(частостями).или в кумулятивные ряды. Накопленная частота (частость) для данного варианта или для верхней границы данного интервала получается суммированием частот (частостей) всех предшествующих вариант, включая данный.

Любой вариационный ряд можно представить в виде кривой накопленных частот (или частостей). При этом на оси абсцисс откладывают варианты или верхние значения интервалов, а по оси ординат соответствующие накопленные частоты (частости). Полученные точки (вершины перпендикуляров) соединяются плавной кривой (отрезками прямой). Главная кривая (или ломаная линия) называется кумулятой или кумулятивной кривой (ломаной).

С помощью кумулятивных кривых можно иллюстрировать процесс концентрации.

Если на оси абсцисс отложить накопленные частоты (частости), а на оси ординат – значения вариантов, и выполнить операции, аналогичные для построения кумулят, то получим график, называемый огивой (график, обратный кумулят).

 
  Графический метод изучения рядов распределения - student2.ru

Рис. 6.3 Кумулят

Заканчивая рассмотрение вопроса о графическом методе изучения рядов распределения следует отметить, что при построении графиков большое значение имеет выбор соотношения между размерами оси абсцисс (горизонтальной оси) и оси ординат (вертикальной оси). При этом целесообразно руководствоваться так называемым правилом “Золотого сочетания”. По этому правилу, чертеж должен быть выполнен в прямоугольнике , в котором длина вертикальной оси (высота графика) должна соотноситься к длине всей горизонтальной оси (т.е. к ширине графика) приблизительно как 5:8.

Например, если общая длина горизонтальной оси равна 16см., то общая длина вертикальной оси должна составлять 165/8=10см.

Другие подходы к построению графиков смотрите в теме №11 “Графическое построение в статистике”.

6.3. Понятие о закономерностях статического распределения.
Теоретические кривые распределения

В процессе анализа статистических данных, представленных рядами распределения, кроме знания о характере распределения (или структуре совокупности) могут вычисляться различные статистические показатели (числовые характеристики), которые в обобщенном виде отражают особенности распределения изучаемых признаков. Наличие таких характеристик ( показателей) существенно облегчает сравнение различных распределений ( явлений) между собой.

Эти характеристики (показатели) могут быть разделены на 3 основные группы

1) характеристики центра распределения (средняя, мода, медиана);

2) характеристики степени вариации (вариационный размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации);

3) характеристики формы (типа) распределения (показатели эксцесса и асимметрии, ранговые характеристики, кривые распределения).

Первые две группы показателей будут рассмотрены в теме 8.В данном вопросе остановимся на знакомстве с основными понятиями и характеристиками третьей группы.

Полигоны и гистограммы в общем виде дают определенное представление о связи между частной (частностью) и величиной признака. Однако эмпирическое распределение признака, т.е. распределение в том виде, как оно получено в результате наблюдения, как правило, выявляет эту закономерность неясно. Ведь на значения признаков у единиц совокупности ( на индивидуальные значения) оказывают влияние различные случайные факторы. Более четкому выявлению закономерности распределения (т.е. закономерности изменения частот в вариационных рядах) способствует построение ряда с более крупными интервалами (или, что то же самое – с меньшим числом групп). Однако при слишком малом числе групп характерные особенности распределения также затушевываются.

Наиболее надежный путь выявления закономерности распределения состоит в следующем:

1) увеличить количество наблюдаемых случаев (в соответствии с законом больших чисел, в таких рядах случайные отклонения от общей закономерности у индивидуальных значений будут взаимно погашаться);

2) первоначально совокупность разбивается на максимально возможное число члены групп, а затем, постепенно сокращая число групп оптимизировать группировку с точки зрения выявления закономерности распределения. При реализации такого подхода, закономерность, характерная для данного распределения будет выступать все более и более ясно, а ломаная линия, изображающая полигон, будет приближаться к некоторой плавной линии и в пределе должна превратиться в кривую линию.

Кривая линия, которая отражает закономерность изменения частот (частностей) в чистом, исключающем влияние случайных факторов, виде, называют кривой распределения.

Кривая распределения, в отличие от полигона и гистограммы, отражает основной характер, закон данного распределения.

В идеальном случае зависимость частот (частостей, плотности распределения) от величины вариантов может быть предоставлена в виде некоторой кривой распределения определенного вида (типа).

Построение кривой распределения в сочетании с анализом сущности явления позволяют построить научную гипотезу о вероятном типе теоретической кривой распределения.

Под теоретической кривой распределения в статистике понимается предполагаемое графическое изображение в виде непрерывной линии изменения частот в вариационном ряду функционально связанного с изменением (величины признака) варианты.

В действительности встречаются самые различные типы распределения. В связи с этим различаются прежде всего одновершинные (одномодальные) и многовершинные (двух – трех – и т, д.) много модальные кривые распределения.

К одновершинным относятся те, в которых один вариант имеет наибольшую частоту (наибольшую плотность распределения), частоты же вариантов меньших и больших, чем это значение, убывают по мере удаления от него.

Если при этом частоты убывают одинаково и справа и слева от наибольшего центрального значения, то такие распределения называются симметричными. В них частоты вариантов, равностоящих от центрального, равны между собой.

Если частоты убывают слева и справа от центра распределения с разной скоростью, то такие распределения называются ассиметричными, выделяя при этом распределения, растянутые влево или вправо.

       
  Графический метод изучения рядов распределения - student2.ru
    Графический метод изучения рядов распределения - student2.ru
 

Рис. 6.4. Симметричное и ассиметричное распределение

Степень асимметрии может быть различной от совершенно незначительной до крайней, при которой наибольшая частота относится к одному из крайних значений вариантов – самому наименьшему или наибольшему.

Идеальное симметричное распределение крайне редко встречаются на практике. Достаточно близок к нему распределения мужчин и женщин по весу или росту (при достаточно большим количестве людей, включенных в совокупность).

Основная масса распределений, с которыми приходиться иметь дело экономисту – это асимметричные распределения с разной степенью асимметрий.

Многовершинные распределения – это такие распределения, в которых несколько максимумов частоты (центральных значений признака). В экономико – статистических исследованиях многовершинность распределения является часто следствием того, что совокупность состоит из неоднородных с точки зрения изучаемого признака единиц.

Например, при проверке качества и свойств продукции, полученной на двух разных станках, почти всегда получаются кривые распределения с двумя вершинами.

Убедившись в многовершинности распределения, исследователь должен тщательно проверить, можно ли считать однородными единицы, составляющие совокупности или следует для объективности выводов разбить совокупность на две или более однородные группы.

Эксцесс – характеристика островершинности и крутизны распределения.

Количественная оценка степени ассиметрии и эксцессы рассматривается в дисциплине «математическая статистика».

Наши рекомендации