Задачи сводки и группировки
Научно организованная обработка материалов статистического наблюдения по заранее разработанной программе содержит в себе, кроме контроля данных, систематизацию, группировку данных, составление таблиц, получение итогов и производных показателей (средних и относительных величин) и т. д. Собранный в процессе статистического наблюдения материал представляет собой разрозненные первичные сведения об отдельных единицах изучаемого явления. В таком виде материал еще не характеризует явление в целом: не дает представления ни о величине (численности) явления, ни о его составе, ни о размере характерных признаков, ни о существе связей ϶ᴛᴏго явления с другими явлениями и т. д. Возникает необходимость в специальной обработке статистических данных – ϲʙᴏдке материалов наблюдения.
Сводка материалов наблюдения представляет собой комплекс последовательных действий по обобщению конкретных единичных данных, образующих совокупность, с целью обнаружения типичных черт и закономерностей, присущих изучаемому явлению в целом.
Статистическая ϲʙᴏдка (простая ϲʙᴏдка) в узком смысле слова представляет собой операцию по подсчету общих итоговых (суммарных) данных по совокупности единиц наблюдения.
Правильная, научно организованная ϲʙᴏдка, опираясь на предварительный глубокий теоретический анализ, позволяет получить все статистические итоги, отражающие важнейшие, характерные черты объекта исследования, измерить влияние различных факторов на результат и учесть все ϶ᴛᴏ в практической работе при составлении текущих и перспективных планов.
Задача ϲʙᴏдки – дать характеристику объекту исследования с помощью систем статистических показателей, выявить и измерить таким путем его существенные черты и особенности.
На первом этапе осуществляется систематизация, группировка материалов, собранных при наблюдении. На втором этапе уточняется предусмотренная планом система показателей, с помощью кᴏᴛᴏᴩых количественно характеризуются ϲʙᴏйства и особенности изучаемого предмета. На третьем этапе исчисляются сами показатели, и обобщенные данные для наглядности и удобства представляются в таблицах, статистических рядах, графиках, диаграммах.
Программа статистической ϲʙᴏдки содержит перечень групп, на кᴏᴛᴏᴩые целесообразно разделить совокупность, их границы в ϲᴏᴏᴛʙᴇᴛϲᴛʙии с группировочными признаками; систему показателей, характеризующих совокупность, и методику их расчета; систему макетов разработочных таблиц, в кᴏᴛᴏᴩых будут представлены итоги расчетов.
Наряду с программой существует план проведения ϲʙᴏдки, кᴏᴛᴏᴩый предусматривает ее организацию. План проведения ϲʙᴏдки должен содержать указания о последовательности и сроках выполнения ее отдельных частей, об ответственных за ее выполнение, порядке изложения результатов, а также предусматривать координацию работы всех организаций, задействованных в ее проведении.
Группировка - это распределение единиц совокупности по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам.
Группировка лежит в основе дальнейшей работы с собранной информацией. На основе группировок рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучение взаимосвязей между признаками. Если рассчитывать сводные показатели только по совокупности в целом, то мы не сможем уловить её структуры, роли отдельных групп, их специфики.
Типологическая группировка решает задачу выявления и характеристики социально-экономических типов путем разделения качественно разнородной совокупности на классы, социально-экономические типы, однородные группы единиц в соответствии с правилами научной группировки. Примерами типологической группировки могут служить группировки по секторам экономики, предприятий по формам собственности.
значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном виде. Кроме того, группировка создает основу для последующей сводки и анализа данных.
Для построения группировки необходимо установить правила отнесения каждой единицы к той или иной группе. Эти правила включают в себя, во-первых, определение группировочных признаков - это характеристики (признаки), по которым происходит объединение отдельных единиц совокупности в однородные группы. Его часто называют основанием группировки. Во-вторых, определить интервалы группировки, т.е. значение характеристик, которые будут отделять одну группу от другой.
В качестве основания группировки следует использовать существенные признаки. В каждом конкретно исследовании он будет свой, в зависимости от целей исследования.
В основании группировки могут быть положены как количественные, так и качественные признаки. Количественные имеют численное выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т.д.), а качественные отражают состояние единицы совокупности (пол человека, его национальную принадлежность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т.д.)
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Виды группировок.
В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки.
Простой называется группировка, выполненная по одному признаку. Среди простых группировок особо выделяют ряды распределения.
Ряд распределения – это группировка, в которой для характеристики групп (упорядоченно расположенных по значению признака) применяется один показатель – численность группы. Ряды, построенные по атрибутивному признаку, называют атрибутивными рядами распределения. Ряды распределения, построенные по количественному признаку, называют вариационными рядами.
Статистические группировки по задачам, решаемым с их помощью делятся на: типологические, структурные и аналитические.
Типологическая группировка - служит для выделения социально-экономических типов. Примером такой группировки может служить группировка промышленных предприятий по формам собственности.
Есть два способа формирования типологических групп:
1. способ последовательных разбиений, когда формируются группы, все объекты которых имеют одинаковые значения классификационных признаков;
2. способ многомерной классификации, когда объекты, образующие группы могут иметь различные значения классификационных признаков.
Одна и та же совокупность может быть качественно однородной в одном статистическом исследовании и разнородной в другом. Так, совокупность промышленных предприятий является однородной в случае анализа показателей брака при производстве какой-либо продукции. Эта совокупность будет качественно неоднородной, если изучается налогообложение предприятий. При проведении типологической группировки основное внимание должно быть уделено идентификации типов социально-экономических явлений.
Структурной называется группировка, в которой происходит разделение однородной совокупности на группы, характеризующие её структуру по какому-либо варьирующему признаку. С помощью таких группировок могут изучаться: состав населения по полу, возрасту, месту проживания; состав предприятий по численности занятых, стоимости основных фондов. Примером такой группировки может служить следующая таблица:
Явления общественной жизни и отражающие их признаки тесно взаимосвязаны. Группировка, выявляющая взаимосвязи между явлениями и их признаками, называется аналитической группировкой.
Всю совокупность признаков можно разделить на две группы: факторные и результативные. Факторными называются признаки, под воздействием которых изменяются другие признаки, которые в свою очередь называют результативными. Взаимосвязь проявляется в том, что с возрастанием значения факторного признака увеличивается или уменьшается среднее значение признака результативного.
Аналитические группировки позволяют изучить многообразие связей и зависимости между варьирующими признаками. Преимущество метода аналитической группировки перед другими методами анализа (например, корреляционно-регрессивным) состоит в том, что он не требует соблюдения каких-либо условий для своего применения, кроме одного - качественной однородности исследуемой совокупности.
Группировка называется простой, если для её построения используется только один признак. Если группировка проводится по нескольким признакам, она называется сложной.
Сначала группы формируют по одному признаку, затем они делятся на подгруппы по другому признаку, которые в сою очередь могут подразделяться по третьему и т.д. Сложные группировки дают возможность изучать распределение единиц совокупности одновременно по нескольким признакам.
Правила группировок.
При группировке по количественным у признакам часто возникают вопросы о числе групп и величине интервала. Эти показатели взаимосвязаны: чем больше групп, тем меньше интервал.
При решении данного вопроса во внимание принимают размах варьирования, то есть разность между максимальным и минимальным значениями признака. Чем он больше, тем больше можно образовать групп.
Также должна быть принята во внимание численность изучаемой совокупности: если она невелика, то нельзя организовать большое число групп.
Интервал - разница между максимальным и минимальным значением признака в каждой группе.
Интервалы могут быть равными и неравными в зависимости от характера распределения единиц совокупности по данному признаку.
Если распределение носит более или менее равномерный характер, то устанавливают равные интервалы.
Неравные интервалы применяются в случае, если распределение единиц совокупности носит неравномерный характер. Тогда в пределах скопления единиц совокупности применяется более узкие интервалы, а рассеяния - более широкие.
Часто первоначальный материал делят на большое число групп, чтобы увидеть распределение единиц совокупности. Затем эти группы укрупняют, получая качественно однородные группы.
Следует также иметь в виду, что одинаковая количественная мера группировочного признака может иметь разное качественное значение в различных условиях. Так, различные отрасли промышленности имеют различную энергоемкость. Поэтому, группируя предприятия по уровню энерговооруженности, следует дифференцированно строить группировки по отраслям промышленности.
Для того, чтобы полнее и глубже изучить сложное общественное явление, необходимо сгруппировать данные по двум или более признакам. Такие группировки называют сложными.
Наиболее распространенным видом сложных группировок являются комбинированные группировка, когда группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам. Обычно в основание группировки кладется от 2 до 4 признаков.
Одновременное использование группировочных признаков позволяет выявить и сравнить такие различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков.
При изучении влияния большого числа признаков применение комбинированных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей и тем самым не позволяет выявить одновременное влияние всего комплекса факторных признаков на исследуемый показатель.
Данная задача может быть решена одним из методов статистической теории распознавания образов - кластерным анализом, разработанного в 60-х годах ХХ века.
Кластерный анализ позволяет решать задачи многомерной группировки. Весь набор признаков образует так называемое «признаковое пространство». Каждому из признаков придается смысл координаты. Задача многомерной группировки сводится к выделению сгущений точек (групп объектов) в этом пространстве.
Мерой близости (сходства) между объектами могут служить различные критерии. Самой распространенной мерой близости является евклидово расстояние между объектами.
Нахождение групп близких объектов производится методами кластерного анализа с использованием компьютеров.
Ряды распределения.
В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения.
Статистические ряды распределения представляют собой упорядоченное расположение единиц изучаемой совокупности на группы по группировочному признаку.
Различают атрибутивные и вариационные ряды распределения.
Атрибутивный – это ряд распределения, построенный по качественным признакам. Он характеризует состав совокупности по различным существенным признакам.
По количественному признаку строится вариационный ряд распределения. Он состоит из частоты (численности) отдельных вариантов или каждой группы вариационного ряда. Данные числа показывают, насколько часто встречаются различные варианты (значения признака) в ряду распределения. Сумма всех частот определяет численность всей совокупности.
Численности групп выражаются в абсолютных и относительных величинах . В абсолютных величинах выражается числом единиц совокупности в каждой выделенной группе, а в относительных величинах – в виде долей, удельных весов, представленных в процентах к итогу.
В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения. В дискретном вариационном ряде распределения группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.
В интервальном вариационном ряде распределения группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения.
Вариационные ряды состоят из двух элементов: частоты и варианты.
Вариантой называют отдельное значение варьируемого признака, которое он принимает в ряду распределения.
Частота– это численность отдельных вариант или каждой группы вариационного ряда. Если частоты выражены в долях единицы или в процентах к итогу.
Правила и принципы построения интервальных рядов распределения строятся по аналогичным правилам и принципам построения статистических группировок. Если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. Для проведения сравнительного анализа заполненности интервалов определяют показатель, который будет характеризовать плотность распределения.
Плотность распределения– это отношение числа единиц совокупности к ширине интервала.