Группировки и классификации в практике статистики

Система группировок представляет собой ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны изучаемых явлений. Если в основу группировки положено несколько признаков, такую группировку называют сложной. В зависимости от вида группировочных признаков различают группировки по количественным и качественным признакам. В статистической практике часто качественный признак имеет большое число разновидностей, и перечислять их все нецелесообразно. В этих случаях разрабатывают классификацию разновидностей, т. е. осуществляют систематизированное распределение наблюдаемых статистикой объектов на классы (группы).

Под классификацией понимается устойчивое разграничение единиц наблюдения, которое используется в течение длительного времени. Клас­сификации могут подвергаться более или менее существенным изменениям, когда возникает необходимость отразить произошедшие изменения в объекте наблюдения. Утверждают классификации, как правило, в качестве национального или международного стандарта.

Классификаторы - кодированные перечни множества качественных признаков, описывающих изучаемое явление. Важнейшие классификаторы:

1) ОКАТО - общероссийский классификатор объектов административно - территориального деления, предназначен для обеспечения достоверности, сопоставимости и автоматизированной обработки информации в сфере статистики;

2) ОКВЭД - общероссийский классификатор видов экономической деятельности, предназначен для классификации и кодирования видов экономиче­ской деятельности и информации о ник;

3) ОКОГУ - общероссийский классификатор органов государственной власти и управления, предназначен для упорядочения и систематизации информации об органах государственной власти и управления;

4) ОКФС - общероссийский классификатор форм собственности, предназначен для формирования информационных ресурсов, регистров, реестров и кадастров, содержащих сведения о субъектах гражданского права, решения аналитических за­дач в области статистики;

5) ОКОПФ - общероссийский классификатор организационно-правовых форм, также предназначен для решения аналитических задач в сфере статистики;

6) ОКСМ - общероссийский классификатор стран мира, предназначен для идентификации стран.

Принципы разработки основных классификаторов:

1) классификаторы входят в состав Единой системы классификации и кодирования технико-экономической и социальной информации Российской Федерации (ЕСКК),

2) классификаторы разрабатываются в соответствии с нормативно-правовой базой, действующей в РФ, и гармонизируются со Статистической классификацией, принятой в Европейском экономическом сообществе;

3) при разработке классификаторов используют иерархический метод классификации и последовательный метод кодирования.

Системы классификаций, принятые в государственной статистике, являются официальными стандартами Российской Федерации и используются для решения аналитических задач, на них основана методология сбора и обработки статистической информации для внутренних нужд и для сопоставления на международном уровне.

№12

Группировкойназывается разбиение общей совокупности единиц объекта наблю­дения по одному или нескольким существенным признакам на однородные группы, раз­личающиеся между собой в количественном и качественном отношении и позволяющие выделить социально-экономические типы, изучить структуру совокупности и проанализи­ровать связи между отдельными признаками. Группировки являются важнейшим стати­стическим методом обобщения статистических данных, основой для правильного исчис­ления статистических показателей.

С помощью метода группировок решаются следующие задачи:

• выделение социально-экономических типов явлений;

• изучение структуры явления и структурных сдвигов, происходящих в нем;

• выявление взаимосвязи и взаимозависимости между явлениями.

В соответствии с познавательными задачами, решаемыми в ходе построения стати­стических группировок, различают следующие их виды: типологические, структурные, аналитические.

^ Типологическая группировка- это разбиение разнородной совокупности единиц наблюдения на отдельные качественно однородные группы и выявление на этой основе социально-экономических типов явлений. При построении группировки этого вида ос­новное внимание должно быть уделено идентификации типов и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого социально-экономического явления.

Структурнойназывается группировка, которая предназначена для изучения соста­ва однородной совокупности по какому-либо варьирующему признаку, а также структуры и структурных сдвигов, происходящих в нем.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и призна­ками, их характеризующими, называетсяаналитическойгруппировкой.

В статистике при изучении связей социально-экономических явлений признаки не­обходимо делить на факторные и результативные.

Факторныминазываются признаки, под воздействием которых изменяются дру­гие результативныепризнаки. Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значе­ние признака результативного и наоборот.

Особенностями построения аналитической группировки являются:

• единицы статистической совокупности группируются по факторному признаку;

• каждая выделенная группа характеризуется средними величинами результативного признака.

По способу построения группировки бывают простые и комбинационные.

Простойназывается группировка, в которой группы образованы только по одному признаку.

Комбинационнойназывается группировка, в которой разбиение совокупности на группы производится по двум и более признакам, взятым в сочетании (комбинации).

Сначала группы формируются по одному признаку, затем группы делятся на под­группы по другому признаку, а эти в свою очередь делятся по третьему и так далее. Таким образом, комбинационные группировки дают возможность изучить единицы совокупно­сти одновременно по нескольким взаимосвязанным признакам.

При построении комбинационной группировки возникает вопрос о последователь­ности разбиения единиц объекта по признакам. Как правило, рекомендуется сначала про­изводить группировку по атрибутивным признакам, значения которых имеют ярко выра­женные качественные различия.

Принципы построения статистических группировок и классификаций
Построение статистических группировок осуществляется по следующим этапам:

1. Определение группировочного признака.

2. Определение числа групп.

3. Расчет ширины интервала группировки.

4. Определение признаков, которые в комбинации друг с другом будут характери­зовать каждую выделенную группу.

Построение группировки начинается с определения группировочного признака.

^ Группировочным признакомназывается признак, по которому проводится раз­биение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания груп­пировки необходимо использовать существенные, теоретически обоснованные признаки.

В основание группировки могут быть положены как количественные, так и качест­венные признаки. ^ Количественные признаки- это признаки, которые имеют числовое выражение (объем выпускаемой продукции, возраст человека, доход сотрудника фирмы и т. д.). Качественные признакиотражают состояние единицы совокупности (пол, отрас­левая принадлежность предприятия, форма собственности фирмы и т.д.).

После того, как определено основание группировки, следует решить вопрос о количе­стве групп, на которые необходимо разбить исследуемую совокупность единиц наблюдения.

Число групп зависит от задач исследования и вида показателя, положенного в ос­нование группировки, объема изучаемой совокупности и степени вариации признака. Вид показателя особенно существенен при анализе качественных признаков. Так, например, группировка сотрудников фирмы по полу учитывает только две градации: «мужской» и «женский».

В случае группировки единиц наблюдения по количественному признаку особое внимание необходимо обратить на число единиц исследуемого объекта, объем совокупно­сти и степень колеблемости группировочного признака.

При небольшом объеме совокупности (n<50) не следует образовывать большого количества групп, так как группы будут включать недостаточное число единиц объекта. Показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.

Часто группировка по количественному признаку имеет задачу отразить распреде­ление единиц совокупности по этому признаку. В этом случае количество групп зависит, в первую очередь, от степени колеблемости группировочного признака: чем больше его ко­леблемость, тем больше можно образовать групп. Поэтому при определении числа групп необходимо принять во внимание размах вариации признака (R), который позволяет оце­нить вариацию признака между крайними значениями признака - максимальным (Хmах) и минимальным (Xmin) и определяется по следующей формуле:

R= Хmах - Xmin

Чем больше размах вариации признака, положенного в основание группировки, тем, как правило, может быть образовано большее число групп. При этом может возникнуть проблема получения пустых групп, т.е. групп, не содержащих ни одной единицы на­блюдения.

Построение большого числа групп позволит, с одной стороны, точнее воспроизве­сти характер исследуемого объекта. Однако, с другой стороны, слишком большое число групп затрудняет выявление закономерностей при исследовании социально-экономиче­ских явлений и процессов. Поэтому в каждом конкретном случае при определении числа групп следует исходить не только из степени колеблемости признака, но и из особенно­стей объекта и показателей, его характеризующих, а также цели исследования.

Определение числа групп можно осуществить несколькими способами. Формаль­но-математический способ предполагает использование формулы Стерджесса:
n=1+3,322×lgN, (3.1)

где:

n – число групп;

N – число единиц совокупности.

Согласно этой формуле выбор числа групп зависит только от объема изучаемой совокупности.

Применение данной формулы дает хорошие результаты в том случае, если сово­купность состоит из большого числа единиц наблюдения (n>50).

Другой способ определения числа групп основан на применении показателя сред­него квадратического отклонения (σ). Если величина интервала равна 0,5σ, то совокуп­ность разбивается на 12 групп, а когда величина интервала равна 2/З σ и σ, то совокуп­ность делится, собственно, на 9 и 6 групп. Однако при определении групп данными мето­дами существует большая вероятность получения «пустых» или малочисленных групп, характеристики изучаемого явления на основе которых будут недостаточно типичными для выделенной группы и изучаемой совокупности в целом.

Когда определено число групп, то следует определить интервалы группировки.

Интервал- это значения варьирующего признака, лежащие в определенных гра­ницах. Каждый интервал имеет верхнюю и нижнюю границы или одну из них. Нижней границейинтервала называется наименьшее значение признака в интервале. Верхней границей интерваланазывается наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами интервала.

Интервалы группировки бывают:

• равные и неравные;

• открытые и закрытые.

В зависимости от величины интервалы группировки бывают: равные и неравные. В свою очередь, неравные интервалы подразделяются на прогрессивно возрастающие, про­грессивно убывающие, произвольные и специализированные.

Равные интервалы применяются в случае, если изменение количественного при­знака внутри изучаемой совокупности единиц наблюдения происходит равномерно и его вариация проявляется в сравнительно узких границах.

Ширина равного интервала определяется по следующей формуле:

h=R/n=Xmax – Xmin/n (3.2)

где:

Xmax, Xmin - максимальное и минимальное значения признака в совокупности;

n -число групп.

Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, то для определения величины интервала следует использовать не максимальное или мини­мальное значения, а значения, несколько превышающие минимум, и несколько меньше, чем максимум.

Полученную по формуле (3.2) величину округляют и она будет являться шириной интервала.

Существуют следующие правила определения ширины интервала.

Если величина интервала, рассчитанная по формуле (3.2) представляет собой вели­чину, которая имеет один знак до запятой (например: 0,67; 1,487; 3,82), то в этом случае полученные значения целесообразно округлить до десятых и их использовать в качестве ширины интервала. В приведенном выше примере это будут соответственно значения: 0,7; 1,5; 3,8.

Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой (например 14,876), то это значение необходимо округлить до це­лого числа (до 15).

В случае, когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, то эту величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.

Если размах вариации признака в совокупности велик и значения признака варьи­руют неравномерно, то надо использовать группировку с неравными интервалами. Нерав­ные интервалы могут быть получены в процессе объединения пустых, не содержащих ни одной единицы совокупности, равных интервалов. Это происходит в том случае, если по­сле построения равных интервалов по изучаемому признаку образуются группы, содер­жащие мало или не содержащие вообще ни одной единицы, т.е. группы, не отражающие определенных типов изучаемого явления по признаку. В этом случае возникает необхо­димость в увеличении интервалов группировки.

Также неравные интервалы могут быть прогрессивно-возрастающие или прогрес­сивно-убывающие в арифметической или геометрической прогрессии. Величина интерва­лов, изменяющихся в арифметической и геометрической прогрессии, определяется сле­дующим образом:

hi+1 = hi + a,

а в геометрической прогрессии:

hi+1 = hi x q,

где:

а - константа: для прогрессивно-возрастающих интервалов имеет знак «+», а при прогрессивно-убывающих - знак «-».

q - константа: для прогрессивно-возрастающих - больше «1»; для прогрессивно-убывающих - меньше «1».

Применение неравных интервалов обусловлено тем, что в первых группах неболь­шая разница в показателях имеет большое значение, а в последних группах эта разница не существенна.

Например, при построении группировки строительных компаний города по показа­телю численности работающих, который варьирует от 500 человек до 3500 человек, неце­лесообразно рассматривать равные интервалы, т. к. учитываются как малые, так и круп­нейшие строительные фирмы города. Поэтому следует образовывать неравные интервалы: 500-1000, 1000-2000, 2000-3500, т. е. величина каждого последующего интервала больше предыдущего на 500 человек и увеличивается в арифметической прогрессии. Выбор ис­следователя в построении равных или неравных интервалов зависит от степени заполне­ния каждой выделенной группы, т.е. от числа единиц в них. Если величина интервала су­щественна и содержит большое число единиц совокупности, то эти интервалы необходимо дробить, а в противном случае - объединять.

Интервалы группировок могут быть закрытыми и открытыми.

Закрытыми называются интервалы, у которых имеются обе границы: верхняя и нижняя границы.

Открытые - это интервалы, у которых указана только одна граница: как правило, верхняя - у первого интервала и нижняя - у последнего. Например, группы страховых компаний по числу работающих в них сотрудников (чел.): до 50, 50-100, 100-150, 150 и более. Применение открытых интервалов целесообразно в тех случаях, когда в совокупно­сти встречается незначительное число единиц наблюдения с очень малыми или очень большими значениями вариантов, которые резко, в несколько раз, отличаются от всех ос­тальных значений изучаемого признака.

При группировке единиц совокупности по количественному признаку границы ин­тервалов могут быть обозначены по-разному, в зависимости от того, непрерывный или дискретный признак положен в основание группировки.

Если основанием группировки служит непрерывный признак (например, группы строительных фирм по объему строительно-монтажных работ, выполненных собственны­ми силами (тыс. руб.): 1200-1400, 1400-1600, 1600-1800, 1800-2000), то одно ито же зна­чение признака выступает и верхней и нижней границами двух смежных интервалов. В данном случае объем работ 1400 тыс. руб. составляет верхнюю границу первого интервала и нижнюю границу второго, 1600 тыс. руб. - соответственно второго и третьего и т.д., т.е. верхняя граница i - го интервала равна нижней границе (i+1) - го интервала.

При таком обозначении границ может возникнуть вопрос, в какую группу вклю­чать единицы наблюдения, значения признака у которых совпадают с границами интерва­лов. Например, во вторую или третью группу должна войти строительная фирма с объе­мом строительно-монтажных работ 1600 тыс. рублей? Если верхняя граница формируется по принципу «исключительно», то фирма должна быть отнесена к третьей группе, в про­тивном случае - ко второй. Для того, чтобы правильно отнести к той или иной группе единицу совокупности, значение признака которой совпадает с границами интервалов, можно ориентироваться на открытые интервалы (по нашему примеру группы строитель­ных фирм по объему строительно-монтажных работ преобразуются в следующие: до 1400, 1400-1600, 1600-1800, 1800 и более). В данном случае, вопрос отнесения отдельных еди­ниц совокупности, значения которых являются граничными, к той или иной группе реша­ется на основе анализа последнего открытого интервала. Возможны два случая обозначе­ния последнего открытого интервала: 1) 1800 тыс. руб. и более; 2) более 1800 тыс. руб. В первом случае, строительные фирмы с объемом строительно-монтажных работ 1600 тыс. руб. попадут в третью группу; во втором случае - во вторую группу.

Если в основании группировки лежит дискретный признак, то нижняя граница i-ro интервала равна верхней границе i-1-го интервала, увеличенной на 1. Например, группы строительных фирм по числу занятого персонала (чел.) будут иметь вид: 100-150, 151-200, 201-300.

При определении границ интервалов статистических группировок иногда исходят из того, что изменение количественного признака приводит к появлению нового качества. В этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.

Строя такую группировку, следует дифференцированно устанавливать границы ин­тервалов для разных отраслей народного хозяйства. Это достигается путем использования группировок со специализированными интервалами.Специализированные интерва­лы- это такие интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных усло­виях.

При изучении социально-экономических явлений на макроуровне часто применяют группировки, интервалы которых не будут ни прогрессивно-возрастающими, ни прогрес­сивно-убывающими. Такие интервалы называютсяпроизвольнымии, как правило, ис­пользуются при группировке предприятий, например, по уровню рентабельности.

№13

В тех случаях, когда при группировке признак должен быть выражен не конкретным числом, а интервалом значений, необходимо определиться с длинной интервалов.

Длинна интервала – это разность между максимальным и минимальным значениями интервала.

Интервалы группировки могут быть равными и неравными.

Если вариация признака проявляется в сравнительно узких границах, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле:

Группировки и классификации в практике статистики - student2.ru

Пример: в результате исследования статистического наблюдения получены следующие данные о возрасте лиц, совершивших покупки в торговой точке за неделю:

      25            
      27            
      38            
      45            
      33            
      36            
      36            

Проведем группировку данных, выделив 5 групп с равными интервалами:

Группировки и классификации в практике статистики - student2.ru

Возраст покупателей, лет Число покупателей
25 - 29  
29 - 33  
33 - 37  
37 - 41  
41 - 45  

Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах, что характерно для большинства социально-экономических явлений, особенно при анализе макроэкономических показателей.

Неравные интервалы могут быть прогрессивно возрастающие и прогрессивно убывающие в арифметической или геометрической прогрессии. Величина интервалов, изменяющихся в арифметической прогрессии, определяется следующим образом:

Группировки и классификации в практике статистики - student2.ru

в геометрической прогрессии:

Группировки и классификации в практике статистики - student2.ru ,

где а – константа, число, которое будет постоянным и положительным при прогрессивно возрастающих интервалах или отрицательным при прогрессивно убывающих интервалах;

q – константа, положительное число, которое при прогрессивно возрастающих интервалах будет больше 1, а при прогрессивно убывающих – меньше 1.

Пример:

Необходимо построить группировку предприятий отрасли по показателю выручки от реализации продукции, которая меняется от Xmin =500 млн. руб. до Xmax =4000 млн. руб.

Построим прогрессивно возрастающую группировку, возьмем a = 200 млн. руб.

ГРУППА ИНТЕРВАЛ
I 500-700
II 700-900
III 900-1100
IV 1100-1300
V 1300-1500

При определении границ интервала на практике часто исходят из того, что количественные изменения должны приводить к качественным изменениям, поэтому величина интервала часто выбирается произвольно, руководствуясь экономическим смыслом задачи.

Причем интервалы могут быть закрытые и открытые. Закрытые интервалы характеризуются тем, что известны и верхняя (минимальное значение) и нижняя (максимальное значение признака) границы интервала. У открытых интервалов известна лишь одна граница.

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

· Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.

· Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

№14

Группировочная таблица и виды группировок.

Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию доступно для восприятия.

Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.

Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.

Пример 5.2. Основа группировочной таблицы

Название таблицы (общий заголовок)

Содержание строк Наименование граф (верхние заголовки)
А            
Наименование строк (боковые заголовки)            
Итоговая строка           Итоговая графа

Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.

Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т.е. подлежащее. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки.

Пример 5.3. Пример группировочной таблицы

Отношение студентов факультета ГиСЭО к понижению размера стипендии (по результатам исследования в январе 1999 г.)

Группы студентов Поддерживаю Не поддерживаю Безразлично
Студенты 1-го курса      
Студенты 2-го курса      
Студенты 3-го курса      
Студенты 4-го курса  
Студенты 5-го курса  
Итого      

Таким образом, группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают по:

· задачам систематизации данных;

· числу группировочных признаков;

· используемой информации.

Статистической группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы явлений, исследовать структуру совокупности или проанализировать взаимосвязи и зависимости между признаками. Группировки являются важнейшим инструментом формирования обобщающих статистических показателей. Группировка — важнейший компонент статистической сводки. В следующих главах мы увидим, что группировка играет весьма важную роль в формировании статистического ряда распределения, а правильное ее использование очень существенно для исчисления взвешенных средних.

По числу группировочных признаков (способу построения) различают простые (по одному признаку) и сложные (по нескольким признакам — комбинационные и многомерные) группировки. Комбинационные группировки строятся путем разбиения каждой группы на подгруппы в соответствии с дополнительными признаками. При построении комбинационных группировок сначала разделяют по атрибутивным признакам, а уже затем разбивают полученные группы на подгруппы по количественному признаку.

Многомерные группировки строятся с помощью специальных алгоритмов, когда ищутся скопления в N-мерном пространстве, где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек. Для решения таких сложных задач построения многомерной группировки успешно применяются методы прикладного искусственного интеллекта — методы распознавания образов. Также используется метод последовательного статистического анализа Вальда.

По задачам систематизации данных различают: типологические, структурные и аналитические.

Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.

Структурные группировки— это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные группировки — результат объединения или расщепления первичных группировок, они позволяют преодолевать несопоставимость исходных данных в первичных группировках и тем самым объединять их в одну общую и выполнять сравнение, сопоставление данных, представленных в них после проведения вторичной группировки.

При разработке первичной группировки существенное значение имеет выбор числа групп. Число групп зависит от типа признака, положенного в основу группировки (основания группировки), от объема совокупности, степени вариации признака.

При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможно два подхода: группировка с равными и неравными интервалами.

Для определения этих параметров в первом случае рекомендуется формула Стерджесса:

n = 1 + (3,322× lgN), (5.1)

где N — количество наблюдений.

В этом случае величина интервала:

I = (Хmax - Xmin)/n. (5.2)

Основные этапы построения статистических группировок включают:

· выбор группировочного признака;

· определение необходимого числа групп, на которые следует разбить изучаемую совокупность;

· установление границ интервалов группировки;

· установление для каждой группировки показателей или их системы, которыми должны характеризоваться выделенные группы.

Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует, по мере возможности, избегать таких группировок.

№17

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

§ Атрибутивными — называют ряды распределения, построенные по качественными признакам.

§ Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными.

Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются Группировки и классификации в практике статистики - student2.ru . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают Группировки и классификации в практике статистики - student2.ru . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости( Группировки и классификации в практике статистики - student2.ru ) — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Наши рекомендации