Понятие сводки и группировки данных статистического наблюдения. Виды группировок
Статистическая закономерность проявляется в обобщенных данных. Методами обобщения являются группировка и расчет сводных показателей по совокупности в целом и по выделенным группам.
Понятие статистической группировки охватывает целый комплекс статистических операций, направленных на объединение зарегистрированных при наблюдении единичных случаев в группы, сходные в том или ином отношении.
Статистическая группировка – это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединение изучаемых единиц в частные совокупности по существенным для них признакам, каждая из них характеризуется системой статистических показателей.
Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называются группировочнымипризнаками или основанием группировки. Группировки могут производиться по количественным и качественным признакам.
Количественные признаки имеют численное выражение (метры, килограммы, рубли).
Качественные признаки выражают состояние единицы совокупности (пол человека, его семейное положение, уровень образования и т.д.)
Если группировка проводится по одному признаку, она называется простой (одномерной), если по нескольким признакам – комбинационной (многомерной).
Комбинационная группировка представляет собой группировку данных по двум и более признакам. Группы, выделенные по одному признаку, делятся на подгруппы по другому признаку.
В зависимости от поставленных задач статистические группировки делятся на типологические, структурные и аналитические
Учитывая, что необходимость группировки обусловливается, прежде всего, наличием качественных различий между изучаемыми явлениями, первую задачу группировок можно сформулировать как задачу выделения в составе массового явления тех его частей, которые однородны по качеству и условиям развития, в которых действуют одни и те же закономерности влияния факторов. В результате выделяется типологическая группировка.
Структурная группировка – разделение уже однородной совокупности на группы, которые характеризуют её структуру по варьирующему признаку. С помощью таких группировок может изучаться состав населения по полу, возрасту, затратам времени на производство товаров, размеру среднедушевого дохода и т.п.
Аналитическая группировка – группировка, признанная выявить существующие взаимосвязи между изучаемыми явлениями и их признаками т.е. между результатом и действующими на него факторами.
Группировки по количественным признакам разнообразны. Например, группировки населения по возрасту, группировка рабочих по разрядам, по степени выполнения норм, предприятий – по численности работников, стоимости продукции и основных фондов, банков – по размеру активов и т.д.
Качественный признак отражает определённые свойства, качества данного явления и записывается в виде текста. Если качественный признак имеет мало разновидностей, то количество групп определяется числом этих разновидностей (например, группировки населения по полу, семейному положению, образованию, деление населения на городское и сельское и др.).
Если качественный признак имеет большое число разновидностей и перечислить их все не представляется целесообразным, то разрабатывается классификация разновидностей.
Классификация - это особый вид группировки.
Классификация – это устойчивая номенклатура классов и групп, образованных на основе сходства и различий единиц наблюдаемого объекта. Любая классификация может состоять из нескольких уровней, т.е. выделенная на первом этапе классификационная группа может в дальнейшем детализироваться. Необходимость и степень детализации классификационных групп определяется целью и задачами статистического исследования.
Всестороннее статистическое изучение социально-экономических процессов и явлений наиболее плодотворно в том случае, если в основе его лежит система группировок.
Система группировок – это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны изучаемых явлений.
Подытоживая вышеизложенное, можно перечислить те методологические проблемы, решение которых необходимо при практическом применении метода группировок:
1) выбор группировочного признака или их комбинации,
2) определение числа групп и величины интервалов группировки,
3) установление применительно к конкретной группировке состава тех показателей, которыми должны характеризоваться выделенные группы,
4) составление макета таблицы, в которой должны быть представлены результаты
Процесс получения показателей составляет сущность особого этапа статистического исследования – сводки.
Сводка – это характеристика выделенных групп с помощью статистических показателей. Статистические сводки различаются по ряду признаков:
-по сложности построения,
-месту проведения,
-способу разработки статистического наблюдения,
-технике выполнения.
По технике или способу выполнения сводка может быть ручной либо механизированной (с помощью ЭВМ).
Статистическая сводка должна проводиться по определенной программе и плану.
Программа статистической сводки устанавливает следующие этапы:
• выбор группировочных признаков; определение порядка формирования групп;
• разработка системы статистических показателей для характеристики групп и объекта в целом:
• разработка макетов статистических таблиц для представления результатов сводки. План статистической сводки содержит указания о последовательности и сроках выполнения отдельных частей сводки, ее исполнителях и порядке изложения и представления результатов.
В сводке статистического материала отдельные единицы статистической совокупности объединяются в группы при помощи метода группировок.
Принципы построения статистических группировок, вопросы техники выполнения группировок
Изучая количественную сторону массовых явлений, статистика должна в процессе группировки наметить точки перехода количества в новое качество, т.е. на основе анализа количественных изменений группировочных признаков обозначить точки перехода одного качества в другое.
В качестве группировочного используется дискретный признак. Это признак, способный принимать только некоторые определённые значения (например, целые), то число выделенных групп соответствует количеству вариантов значений признака, если их значение не так велико.
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.
Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т.е. он очерчивает количественные границы групп.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, исходя из целей исследования, значения изучаемого признака и т.д.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока оно не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики — выделить эти факты, изучить их.
Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления.
На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп. Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
где N- число единиц совокупности.
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному, и при этом применяются равные интервалы в группах.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100—200, 200—300, 300—500, 500—1000,1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50—100 человек имеет существенное значение для мелких предприятий, а для крупных — не имеет.
Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры — по урожайности).
Для группировок с равными интервалами величина интервала рассчитывается по формуле:
где xmax, xmin — наибольшее и наименьшее значения признака, т.е.размах вариации (R),
n — число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы рабочих, которая в 1995 г. колебалась в пределах от 600 до 750 тыс. руб., и необходимо при этом выделить 5 групп, то величина интервала, тыс. руб.:
Если в результате деления получится нецелое число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.
Прибавляя к минимальному значению признака (в данном случае 600 тыс. руб.) найденное значение интервала, получаем верхнюю границу первой группы, тыс. руб. 600 + 30 = 630.
Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы:
630 + 30 = 660, и т. д.
В результате получим такие группы рабочих по размеру заработной платы, тыс. руб.:
600—630; 630—660; 660—690; 690—720; 720—750.
В этом распределении имеет место неопределенность: к какой группе, например, отнести рабочего с заработком в 630 тыс. руб., к первой или второй? Для устранения неопределенности открывают один из крайних интервалов или используют принцип единообразия — левое число включает в себя обозначенное значение, а правое — не включает. Значит рабочий, получающий 630 тыс. руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп.
Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы (как в приведенном примере), открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «750 и выше». И наоборот, чтобы показать, что значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более».