Построение интервалов группировки
Важным этапом построения статистической группировки является определение интервалов.
Интервал — это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них.Нижней границей называется наименьшее значение признака в интервале. Верхней границей выступает наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки классифицируют по следующим признакам.
В зависимости от величины интервалы группировки бывают равные и неравные.
Равными называют интервалы, в которых ширина интервала от интервала к интервалу составляет одно и то же число. Они применяются в случае, если изменение количественного признака внутри изучаемой совокупности происходит равномерно и его вариация проявляется в сравнительно узких границах.
Ширину равного интервала определяют по следующей формуле:
где Я — размах вариации признака; п — число групп.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то необходимо использовать группировку с неравными интервалами.
Неравные интервалы могут быть получены следующим образом: в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов; путем построения прогрессивно-возрастающих или прогрессивно-убывающих интервалов.
Неравные интервалы подразделяют:
• на прогрессивно-возрастающие;
• прогрессивно-убывающие;
• специализированные;
• произвольные.
При построении прогрессивно-возрастающих и прогрессивно-убывающих интервалов используется принцип арифметической или геометрической прогрессии.
Величину интервалов, изменяющихся в арифметической прогрессии, определяют следующим образом:
а в геометрической прогрессии
где а — константа (для прогрессивно-возрастающих интервалов имеет знак "+", а для прогрессивно-убывающих -знак "-"); д — константа (для прогрессивно-возрастающих — больше 1; для прогрессивно-убывающих — меньше 1).
Специализированными называются интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях.
При изучении социально-экономических явлений на макроэкономическом уровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрессивно-убывающими. Такие интервалы называются произвольными.
Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях, как правило, имеет большое значение, а в последних группах эта разница не существенна.
Например, при построении группировки инвестиционно-финансовых компаний города по численности работающих, которая варьирует от 50 до 550 человек, нецелесообразно рассматривать равные интервалы, так как учитываются как малые, так и крупные инвестиционно-финансовые компании. Поэтому лучше образовывать неравные интервалы: 50-100, 100-200, 200-350, 350-550, т.е. ширина каждого последующего интервала больше предыдущего на 50 человек и увеличивается в арифметической прогрессии.
Если величина интервала существенна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае — объединять.
В зависимости от наличия границ интервалы группировки бывают закрытые и открытые.
Закрытыми называются интервалы, у которых имеются и верхняя, и нижняя границы. Например, группы стран СНГ по объему инвестиций в экономику России в 2011 г. (млн долл. США): 7-113, 113-219, 219-325.
Открытыми называются интервалы, у которых указана только одна граница: как правило, верхняя у первого интервала и нижняя у последнего. Например, распределение безработных по возрастным группам (лет): до 20, 20—24, 25-29,30-34,35-39,40-44,45-49,50-54,55-59,60 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупности встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями признака, которые в несколько раз отличаются от всех остальных его значений.
При группировке единиц совокупности по количественному признаку обозначение границ интервалов зависит от того, непрерывный или дискретный признак положен в основание группировки.
Если основанием группировки служит непрерывный признак (например, группы сотрудников строительных организаций по среднемесячной начисленной заработной плате (тыс. руб.): 25—40, 40—55, 55—70, 70—85), то одно и то же значение признака выступает и верхней, и нижней границами двух смежных интервалов. В данном случае среднемесячная начисленная заработная плата 40 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго; 55 тыс. руб. — верхнюю границу второго и нижнюю границу третьего интервалов; 70 тыс. руб. — соответственно, третьего и четвертого интервалов, т.е. верхняя граница 1-го интервала равна нижней границе (г + 1 )-го интервала.
При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы наблюдения, значения признака у которых совпадают с границами интервалов. Например, во вторую или третью группу должен войти сотрудник со среднемесячной заработной платой 55 тыс. руб.?
Для того чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно использовать открытые интервалы.
При атом возможны два варианта обозначения открытых интервалов. По приведенному выше примеру, группы сотрудников строительных организаций по среднемесячной начисленной заработной плате (тыс. руб.) могут быть преобразованы в следующие группы:
1-й вариант: до 40, 40—55, 55—70, 70 и более;
2-й вариант: 40 и менее, 40—55, 55—70, более 70.
При первом варианте сотрудники строительных организаций со среднемесячной заработной платой 40 тыс. руб. попадут во вторую группу; при втором варианте — в первую. Сотрудники строительных организаций со среднемесячной заработной платой 55 тыс. руб. попадут в третью группу в первом случае; при втором варианте — во вторую.
Если в основании группировки лежит дискретный признак, то нижняя граница /-го интервала равна верхней границе (г - 1)-го интервала, увеличенной на 1. Например, распределение телеграмм по числу слов в них: до 5, 6—10, 11-15 и т.д.
Если изменение количественного признака приводит к появлению нового качества, то граница интервала устанавливается там, где происходит переход от одного качества к другому. Строя такую группировку, следует дифференцированно устанавливать границы интервалов для различных видов экономической деятельности. Это достигается путем использования группировок со специализированными интервалами.
19. Вторичные группировки.
Вторичная группировка.Вторичной группировкой называется перегруппировка уже сгруппированного материала, без обращения к первичным данным.
К ней прибегают, когда из большого числа первоначально образованных групп надо получить меньшее число более крупных, когда в целях сравнения нужно привести в сопоставимый вид по–разному сгруппированный материал.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам, а также когда границы новых и старых интервалов совпадают.
Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.
20. Ряды распределения, их виды.
В результате сводки и группировки статистических данных получают ряды распределения.
Ряд распределения – это ряд чисел, характеризующий распределение единиц изучаемой совокупности по какому-либо признаку, причем значения признака расположены упорядоченно – в порядке возрастания либо убывания.
Ряды распределения подразделяются на следующие виды:
· атрибутивные ряды распределения;
· вариационные ряды распределения.
.
21. Атрибутивные ряды распределения.
Атрибутивные ряды распределения образованы по атрибутивным, то есть качественным, признакам. Например, распределение населения по полу, по образованию и т.д. Атрибутивные признаки мы рассмотрели в параграфе 1.4.2. В атрибутивном ряду образуется столько групп, сколько наименований имеет данный атрибутивный признак. Например, в распределении населения по полу возможны только два типа признака: мужской и женский пол.
22. Дискретные и интервальные вариационные ряды распределения
Вариационные ряды распределения образуются по количественному признаку. Количественные признаки мы также рассмотрели в параграфе 4.2.
В вариационном ряду различают два элемента: варианты и частоты. Варианта – это отдельное значение признака в вариационном ряду. Варианты показываются в первой графе таблицы. Частота – это число, показывающее, как часто повторяется та или иная варианта. Значений частот столько, сколько вариант в данном ряду. Каждой варианте соответствует своя частота.
Различают такие вариационные ряды распределения:
· дискретные;
· интервальные.
В дискретных вариационных рядах признак изменяется прерывно, принимает отдельные целые значения.
Интервальный ряд распределения – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот - fi), или долей этого числа в общей численности совокупностей (частостей - di).
23. Графическое изображение вариационных рядов распределения
Первым этапом изучения вариационного ряда является его графическое изображение.Дискретный вариационный ряд изображается в виде так называемого полигона, или многоугольника, распределения частот, являющегося разновидностью статистических ломаных. Для изображения интервального ряда применяются полигонраспределения частот и гистограмма частот.
Строятся графики в прямоугольной системе координат. При построении полигона частот на оси абсцисс в одинаковом масштабе откладываются направо в порядке возрастания значения признака (для дискретного характера) или центральные значения интервалов (для интервальных рядов); по оси ординат наносится шкала для выражения величин частот. Из точек на оси абсцисс, соответствующих величине признака, восстанавливаются перпендикуляры высотой, соответствующей частоте; вершины перпендикуляров соединяются отрезками прямой. Крайние точки полученной ломаной соединяются с лежащими на оси абсцисс следующими (меньшими и большими) возможными, но фактически не наблюдающимися значениями признака, частота которых, очевидно, равна 0. Замкнутая с осью абсцисс ломаная линия представляет полигон распределения частот. Построим полигон частот по табл. 4.4. (рис.4.1)
Рис. 4.1 – Полигон распределения рабочих по выполнению норм выработки
Для построения гистограммы по оси абсцисс откладывают величины интервалов, а частоты изображаются прямоугольниками, построенными на интервалах с высотой в масштабе оси ординат (рис. 4.2). В случае неравенства интервалов гистограмма строится не по частотам или частостям, а по плотности распределения.
Рис. 4.2 – Гистограмма распределения рабочих по выполнению норм выработки
В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята (рис.4.3), она особенно удобна для сравнения вариационных рядов. Накопленные частоты наносятся на чертеж в виде ординат; соединяя вершины отдельных ординат прямыми, получают ломаную линию, которая, начиная с нуля, непрерывно поднимается над осью абсцисс, до тех пор пока не достигнет высоты, соответствующей общей сумме частот.
Рис. 4.3 – Кумулята распределения рабочих по выполнению норм выработки
Если поменять местами оси координат в кумуляте, то получаем новый вид графического изображения - огиву.
При построении графических изображений вариационного ряда большое значение имеет соотношение масштабов по оси абсцисс (х) и оси ординат (f). В этом случае следует руководствоваться так называемым «правилом золотого сечения», в соответствии с которым высота графика должна быть примерно в два раза меньше его основания.
24. Элементы статистической таблицы
Таблица является наиболее рациональной, наглядной и компактной формой представления статистического материала.
Однако не всякая таблица является статистической. Таблица умножения, опросный лист социологического обследования и т. д. могут носить табличную форму, но еще не являются статистическими таблицами.
Статистическую таблицу от других табличных форм отличает следующее:
1. она должна содержать результаты подсчета эмпирических данных;
2. она является итогом сводки первоначальной информации.
Статистической называется таблица,которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа.
Название таблицы (общий заголовок)
Содержание строк | Наименование граф (верхние заголовки) | |||||
А | . . . | |||||
Наименование строк (боковые заголовки) | ||||||
Итоговая строка | Итоговая графа |
* примечание к таблице
Статистическая таблица содержит три вида заголовков:
1. общий заголовок отражает содержание всей таблицы и располагается над ее макетом;
2. верхние заголовки характеризуют содержание граф;
3. боковые заголовки характеризуют содержание строк.
В случае необходимости таблицы могут сопровождаться примечанием, используемым с целью пояснения заголовков методики расчета некоторых показателей, источников информации и т.д.
По логическому содержанию таблица представляет собой «статистическое предложение», основными элементами которого являются подлежащее и сказуемое.
Подлежащимстатистической таблицы называется объект, характеризующийся цифрами. Это могут быть отдельные единицы совокупности (фирмы, объединения) в порядке их перечня или сгруппированные по каким-либо признакам. Обычно подлежащее таблицы дается в левой части, в наименовании строк.
Сказуемоестатистической таблицы образует система показателей, которыми характеризуется объект изучения, т. е. подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.
Расположение подлежащего и сказуемого может меняться местами, что зависит от достижения каждым исследователем в отдельности наиболее полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.
25. Виды статистических таблиц.
Среди методов экономического анализа наиболее распространен табличный метод (способ) отображения исследуемых цифровых данных. Дело в том, что как исходные данные для проведения анализа, так и различные расчеты, а также результаты проведенного исследования оформляются в виде аналитических таблиц. Таблицы представляют собой весьма целесообразную и наглядную форму отображения числовой информации, используемой в анализе хозяйственной деятельности. В аналитических таблицах в определенном порядке располагается цифровая информация об изучаемых экономических явлениях. Табличный материал гораздо более информативен и нагляден по сравнению с текстовым изложением материала. Таблицы позволяют представить аналитические материалы в виде единой целостной системы.
Вид статистической таблицы определятеся характером разработки показателей ее полежащего.
Различают три вида статистических таблиц:
§ простые
§ групповые
§ комбинационные
Простые таблицы содержат перечень отдельных единиц, входящих в состав совокупности анализируемого экономического явления. В групповых таблицах цифровая информация в разрезе отдельных составных частей исследуемой совокупности данных объединяется в определенные группы в соответствии с каким-либо признаком.Комбинированные таблицы содержат отдельные группы и подгруппы, на которые подразделяются экономические показатели, характеризующие изучаемое экономическое явление. При этом такое подразделение осуществляется не по одному, а по нескольким признакам. в групповых таблицах осуществляется простая группировка показателей, а в комбинированных — комбинированная группировка. Простые таблицы вообще не содержат никакой группировки показателей. Последний вид таблиц содержит лишь несгруппированный набор сведений об анализируемом экономическом явлении.
Простые таблицы
Простые таблицы имеют в подлежащем перечень единиц совокупности, времени или территорий.
Добыча некоторых видов ископаемых в России в 2007 г. | |
Виды продукции | Произведено |
Нефть млн.т | |
Естественный газ млрд. куб.м | |
Уголь млн.т. |
Групповые таблицы
Групповыми называются таблицы, имеющие в подлежащем группировку единиц совокупности по одному признаку.