Типологические группировки

Типологическая группировкапредставляет собой расчленение статистической совокупности на однокачественных в существенном отношении типологические группы. Типологическую группировку наиболее часто проводят по атрибутивным существенным признакам. Систематизированное распределение явлений на определенные группы, разряды, классы на основании их сходства и различия принято называть статистической классификацией. Например, классификация отраслей АПК предусматривает выделение сельскохозяйственной сферы, переработки сырья и реализации конечной продукции. Сфера сельскохозяйственного производства классифицируется по отраслевому принципу на растениеводство и животноводство. В растениеводстве по группам и видам классифицируется земельный фонд, сельскохозяйственные культуры; в животноводстве – поголовье сельскохозяйственных животных по видам, половозрастным группам и т.д.

В качестве примера типологической группировки можно привести данные о наличии различных типов комбайнов в сельскохозяйственных организациях Республики Беларусь (табл. 3.2) .

Т а б л и ц а 3.2. Комбайновый парк в сельскохозяйственных организациях

(на начало года; тыс. штук)

Типы комбайнов 2005 г. 2006 г. 2007 г. 2008 г. 2009 г.
Зерноуборочные 12,6 12,8 13,3 13,0 12,9
Картофелеуборочные 1,8 1,6 1,5 1,3 1,2
Свеклоуборочные 0,8 1,0 1,0 1,0 1,0
Кормоуборочные 4,0 3,2 2,5 2,0 2,0
Льноуборочные 1,3 1,3 1,3 1,1 1,1

Как видно, комбайновый парк в сельскохозяйственных организациях Беларуси представлен различными типами комбайнов, которые соответствуют производственному профилю (специализации) хозяйства. Каждый тип комбайнов – (зерноуборочных, кормоуборочных и т.д.) представлен различными моделями машин, продолжительностью их эксплуатации, производительностью и другими характеристиками. Можно также отметить, что число каждого типа комбайнов в динамике за период 2005 – 2009 гг. имеет тенденцию к снижению.

При построении типологических группировок важно правильно выбрать групировочные признаки, на основе которых распределяются единицы статистической совокупности на однородные группы. Например, при изучении внутрипроизводственного потенциала сельскохозяйственной сферы АПК, куда входят все виды и формы сельскохозяйственных организаций и хозяйств, необходимо прежде всего выделить крупные организации (сельскохозяйственные производственные кооперативы, агрофирмы, акционерные общества и т.п.), затем фермерские крестьянские хозяйства и, наконец, – личные подсобные хозяйства. Каждый из этих типов хозяйств существенно отличается друг от друга своими размерами по площади сельскохозяйственных земель, наличию средств производства, рабочей силы, объёму продукции, уровню производительности труда и другими показателями. Поэтому в методологии построения типологических группировок важное значение имеет выделение качественно однородных групп, установление их количества и границ. Эти вопросы обычно решаются на основе предварительного глубокого анализа сущности изучаемого явления.

В некоторых случаях типологические группировки могут проводиться по количественным признакам. При этом важно установить интервалы группировки, количественно отделить друг от друга группы, которые затем становятся типами. Здесь не всегда можно обойтись без некоторой условности вследствие множества форм перехода одних типов в другие, разнообразия признаков, связывающих их друг с другом. Именно поэтому типологические группировки должны проводиться по наиболее существенным признакам.

Например, в условиях переходного периода в качестве важнейшего показателя работы сельскохозяйственных организаций выступает их общий уровень рентабельности. Положив в основу группировки этот показатель, можно выделить следующие типы хозяйств:

· глубоко убыточные (с уровнем убыточности ниже 25 %);

· убыточные (с уровнем убыточности до 25 %);

· низко рентабельные (с уровнем рентабельности от 0 до 5 %);

· рентабельные (с уровнем рентабельности от 5 до 25 %);

· высокорентабельные (с уровнем рентабельности выше 25%).

Выделяемые при группировке типы – это не абсолютное, раз навсегда заданное понятие. Во-первых, типы выявляются и формируются в соответствии с поставленной задачей и в зависимости от конкретных условий; во-вторых, типы развиваются как во времени, так и в пространстве. Поэтому из одной совокупности статистических единиц, обладающих многочисленными признаками, можно выделить различные типы. Например, из совокупности всех работников крупной перерабатывающей организации АПК могут быть определены и выделены типы работников высокой, средней и низкой квалификации, группы передовых и отстающих работников и т.д.

Типологические группировки, проводимые по какому-либо одному качественному или количественному признаку, принято называть простыми. В системе АПК простые типологические группировки используются для разграничения всех организаций и хозяйств по формам собственности, видам деятельности, специализации, размерам производства; земельного фонда – по видам земель, качеству почв; сельскохозяйственных культур – по видам, урожайности, качеству получаемой продукции; сельскохозяйственных животных – по видам, породам, половозрастным особенностям, продуктивности; средств производства – по назначению, продолжительности функционирования; сельскохозяйственной техники – по назначению, видам, моделям, производительности машин и орудий; работников производства – по полу, возрасту, профессиям, должностям, уровню образования; произведенной продукции – по видам, качеству, уровню товарности, уровню рентабельности и т.д.

Вследствие множества признаков, связывающих их друг с другом, форм перехода одних типов в другие при проведении типологических группировок нередко возникает необходимость в комбинировании признаков. При этом возможно одновременное сочетание двух, трех и более качественных и количественных группировочных признаков. Типологическая группировка, которая проводится по двум и более группировочным признакам, взятым в сочетании (комбинации), называется комбинированной. Например, если простую группировку комбайнового парка в сельскохозяйственных организациях Беларуси (табл. 3.1) дополнить группировкой по производительности комбайнов, выделив в каждой из этих групп подгруппы в зависимости от часовой производительности машин, то в результате получим комбинированную группировку, где сочетается два признака: качественный (типы комбайнов) и количественный (производительность машин).

Статистические классификации, т.е. группировки по качественным признакам, представляют собой базу для углубленного изучения внутреннего строения явления. В основу классификации могут быть положены международные стандарты и, таким образом, формируются международные классификации, что имеет значение, например, в межгосударственных таможенных вопросах, торгово-экономических отношениях и др.

Структурные группировки

Структурная группировка заключается в расчленении однородной в качественном отношении совокупности статистических единиц на группы, характеризующие состав сложного объекта. Посредством структурной группировки изучается внутреннее строение типов, статистических совокупностей. В связи с этим она может проводиться на основе типологической группировки. Вместе с тем нередко изучается структура общих совокупностей, включающих неоднородные явления. Например, исследуется структура всех организаций и хозяйств в системе АПК: сельскохозяйственных, вспомогательных, перерабатывающих, сбытовых и др.

Структурные группировки могут проводиться как по качественным, так и по количественным признакам. В зависимости от целей, задач, масштабности и сложности статистического объекта за основу группировки берут либо один, либо несколько существенных группировочных признаков. В связи с этим структурные группировки могут быть простыми или сложными (комбинированными).

Структурная группировка проводится в следующем порядке:

· выбирается один или несколько группировочных признаков, по которым намечено провести группировку;

· выделяются группы по качественным признакам или определяются интервалы по количественным признакам;

· статистические единицы группируются согласно выделенным группам; по каждой группе рассчитываются необходимые относительные и средние показатели;

· оцениваются результаты структурной группировки.

Выбор группировочных признаков определяется поставленной задачей структурной группировки. Так, если необходимо выявить структуру численности работников по уровню образования, то очевидно, что все работники будут распределены по качественному признаку. Если же поставлена задача определить структуру работников по возрасту, то их численность необходимо распределить по количественному признаку. При необходимости изучения совместной структуры численности работников по уровню образования и по возрасту возможно применение этих двух признаков в сочетании (комбинации).

Выделение групп по намеченным качественным признакам в структурной группировке ограничивается, как правило, характером признака. При этом количество групп, на которые делится изучаемая статистическая совокупность, нередко определяется числом разновидностей качественного признака. Так, группировка работников системы АПК по профессиям допускает формирование стольких групп, сколько различных профессий имеют работники этой отрасли экономики.

В качестве примера простой структурной группировки по качественному признаку можно привести данные о составе всей рабочей силы Республики Беларусь по уровню образования (табл. 3.3).

Т а б л и ц а 3. 3. Распределение численности работников по уровню образования(на начало года, в % к итогу)

Показатели
Всего работников 100,0 100,0 100,0
В т. ч. имеют образование высшее среднее специальное среднее общее базовое (неполное среднее)   18,8 22,4 50,6 8,2   22,8 22,8 31,2 4,3   23,8 22,7 29,8 3,4

Данные таблицы 3.3 показывают, что в структуре общей численности работников Беларуси за период 2001 – 2009 гг. значительная доля была представлена группой лиц, имевших среднее образование. Удельный вес этих групп имеет тенденцию к снижению. Сокращается также доля группы работников, имевших базовое (неполное среднее) образование. В структуре всех работников Беларуси значительный удельный вес занимали группы лиц, имевших среднее специальное и высшее образование. Доля каждой из этих групп за рассматриваемый период повысилась.

Структурные сдвиги в распределении численности работников свидетельствуют об улучшении качественного состава рабочей силы в Республике Беларусь по уровню образования.

Построение структурной группировки по количественным признакам обычно связано с определением рационального числа интервальных групп и расчётом величины интервалов. Возможное рациональное число групп может колебаться в различных приделах и зависит от объема статистического объекта (количества единиц) и однородности группировочных признаков.

При расчете величины интервалов, т.е. пределов колебания между наибольшими и наименьшими значениями признака в каждой группе, необходимо стремиться к тому, чтобы не исчезли особенности изучаемого явления. Например, при изучении структурных особенностей перерабатывающих организации АПК по числу работников необходимо, чтобы число групп было не слишком большим и не слишком малым. В настоящее время перерабатывающая сфера АПК представлена сочетанием небольших (20 – 30 работников), средних (100-200 человек) и крупных (700-800 и более работников) организаций.

При условии формирования малого числа интервальных групп возможно попадание в одну и ту же группу перерабатывающих организаций, существенно различающихся по их размеру. В то же время если образовать большое число групп, то в них могут сгладиться характерные особенности, выражающие различия по численности работников в организациях.

Одно из важнейших требований формирования групп заключается в том, чтобы в каждую вошло достаточно большое число статистических единиц для обеспечения представительности результатов структурной группировки. Это достигается регулированием величины интервалов в группах, т.е. путем использования равных и неравных интервалов. Применение приёма равных интервалов во всех группах может быть обеспечено только в условиях однородности группировочного признака, т.е. когда вариация этого признака не превышает 10 %. В условиях же неоднородности группировочного признака формирование интервальных групп чаще всего связано с неравными интервалами.

Примером простой структурной группировки, построенной по количественному признаку, могут быть данные о составе рабочей силы Республики Беларусь по возрасту (табл. 3.4).

Т а б л и ц а 3.4. Распределение численности работников по возрастным группам

(на начало года, в % к итогу)

Показатели 2001 г. 2006 г. 2009 г.
Всего работников 100,0 100,0 100,0
в т.ч. в возрасте, лет:      
до 25 10,6 11,4 11,6
– 25-29 12,0 12,1 12,4
– 30-39 27,5 24,4 23,4
– 40-49 28,7 28,8 26,6
– 50-54 11,8 12,5 13,6
– 55 и старше 9,6 10,8 12,4
средний возраст, лет 39,4 39,7 40,1

Из данных табл. 3.4. видно, что в структуре общей численности работников Беларуси за период 2001 – 2009 гг. основной удельный вес занимали группы лиц в возрасте 30–39 и 40–49 лет, которые составляли вместе не менее 55 % всего числа работников. В динамике доля групп работников в возрасте до 25 лет, 25–29 и 50–54 года, 55 лет и старше имела тенденцию повышения, доля работников в возрасте 30–39 лет – снижения. Структурные изменения, имевшие место в составе общей численности работников Беларуси за период 2001– 2009гг. привели к повышению среднего возраста работавшего населения с 39,4 до 40,1 года.

Содержание и значение аналитических группировок.

Группировочные признаки

Применение аналитических группировок отличается от других видов вторичной сводки повышенной сложностью, обусловленной не только овладением специальной методики проведения группировки, но и предопределяет обязательное освоение и использование многих вспомогательных методов: относительных, средних величин, вариационных рядов, показателей вариации, выборочного метода и др.

Полученная в результате сплошного или выборочного статистического наблюдения информация обычно содержит разнообразные данные о факторных и результативных признаках, которые характеризуют каждую статистическую единицу. Причинно-следственная вариация признаков в статистической совокупности может служить базой для определения характера и размера изменений результативных признаков в зависимости от колебания факторов.

В целях выявления взаимосвязи между факторными и результативными признаками в статистической совокупности могут быть использованы аналитические группировки. Область их применения очень широка. Аналитические группировки могут находить большое применение при выявлении взаимосвязи между двумя взаимозависимыми признаками и между комплексом взаимосвязанных признаков. Так, с помощью аналитической группировки можно выявить наличие или отсутствие зависимости урожайности культуры от какого-либо одного агротехмероприятия или от комплекса агротехнических мероприятий. Если по каждому хозяйству известна, допустим, урожайность пшеницы и использованные разнообразные агротехнические мероприятия, то группируя эти данные по величине какого-либо одного агротехмероприятия, можно проследить за изменением урожайности, связанной с вариацией этого мероприятия. Именно таким образом может быть выявлено влияние только одного агротехмероприятия.

Гораздо сложнее обстоит дело с выявлением влияния комплекса агротехнических мероприятий на урожайность пшеницы. Решение этого вопроса возможно на основе применения сложной (комбинированной) группировки, которая включает в одновременную разработку не одно, а несколько агротехмероприятий, совместно предопределяющих изменение урожайности.

Таким образом, аналитические группировки дают возможность выявить наличие или отсутствие связимежду факторными и результативными признаками в статистической совокупности. При этом целесообразно обратить внимание на то, что в статистике зависимые признаки принято называть результативными, а признаки, оказывающие влияние на них, – факторными. Например, во взаимосвязи доз удобрений и урожайности культур, безусловно, первый признак (дозы удобрений) – факторный, второй (урожайность) – результативный.

Применение аналитических группировок неизбежно связано с группировочным признаками, которые принимаются за основу формирования групп в процессе проведения статистической группировки. Группировочные признаки принято называть основанием группировки. В качестве основания группировки обычно принимают факторные признаки. Вместе с тем в некоторых случаях за основание могут быть взяты и результативные признаки, так как не всегда можно отчетливо разграничить между собой признаки-факторы и признаки-результаты. Например, во взаимосвязи производительности и оплаты труда сложно определить, какой из этих признаков факторный, а какой – результативный. С одной стороны производительность труда – определяющий признак, от которого непосредственно зависит оплата труда, т.е. только ее с ростом возможно повышение оплаты. Но с другой стороны, не следует забывать о том, что без роста оплаты труда невозможно достичь повышения уровня его производительности.

Выбор группировочных признаков в значительной степени определяет результаты аналитической группировки и выводы, которые могут быть сформулированы на основе этих результатов. Роль, значимость факторных и результативных признаков может меняться: в одной взаимосвязи какой-то признак может выступать в качестве результативного, в другой – факторного. Например, урожайность сельскохозяйственных культур, являясь результатом влияния на нее комплекса агротехмероприятий, в то же время во взаимосвязи с себестоимостью единицы продукции становится факторным признаком. Себестоимость, безусловно, признак-фактор по отношению, например, к уровню рентабельности продукции. Поэтому иногда в качестве группировочных могут быть использованы и результативные признаки.

Аналитические группировки в большинстве случаев проводятся по существенным количественным признакам. Вместе с тем нередко возникает необходимость применения такой аналитической группировки, основание которой может сочетать количественные признаки с качественными.

Метод аналитических группировок позволяет не только выявить наличие или отсутствие взаимосвязи между признаками, но и определить факторы, влияющие на эту связь. Это означает, что аналитическая группировка помогает установить причину изменения результативных признаков под воздействием признаков-факторов. Таким образом, достоверное знание причинно-следственной связи между признаками в статистической совокупности позволяет воздействовать на факторные признаки и тем самым управлять процессами формирования результативных признаков в нужном направлении.

Целесообразно обратить внимание на то, что при выборе признаков для проведения аналитической группировки необходим осторожный и критический подход. Это относится как к факторным, обычно группировочным, так и к результативным признакам. Неправильный выбор признаков для основания группировки и ее результатов может привести к грубым ошибкам и необоснованным выводам.

Важнейшее требование, которое предъявляется к аналитическим группировкам, заключается в достаточной представительности генеральной или выборочной совокупности. Как правило, аналитическая группировка по малой выборке не проводится, так как при этом статистические характеристики в некоторых группах с малой частотой, (менее 5 единиц) оказываются смещенными (несостоятельными, недействительными) и, следовательно, не репрезентативны.

Содержание и значение комбинированной группировки

При факторном анализе с помощью метода аналитических группировок можно использовать прием комбинированной (сложной) группировки, которая по существу является продолжением простой аналитической группировки.

Комбинированная группировка – прием проведения аналитической группировки, где в качестве основания принимается сочетание не менее двух существенных группировочных признаков. Комбинированные аналитические группировки могут проводиться, главным образом, по количественным признакам, хотя в некоторых случаях за основание группировки принимают сочетание качественных и количественных признаков. Например, при факторном анализе уровня жизни все население прежде всего подразделяется на группы по качественным признакам (полу, типу населенных пунктов, виду занятий, источникам средств существования), а затем – по количественным признакам (размеру зарплаты, социальных льгот, доходам от личного подсобного хозяйства, расходам на питание, жилье, социальное страхование, медицинское обслуживание и т.д.).

Основная цель комбинированной группировки заключается в выявлении взаимосвязи между несколькими существенными группировочным и результативными признаками. Кроме того, прием комбинированной группировки позволяет определить факторы, формирующие сложные причинно-следственные связи.

Последовательность проведения комбинированной аналитической группировки принципиально не отличается от приема построения простой группировки. Для этого в начале необходимо определить существенные группировочные признаки, которые будут служить основанием комбинированной группировки. Затем формирует интервальные группы по первому группировочному признаку, далее выделенные группы подразделяются на подгруппы по второму группировочному признаку. Выделенные подгруппы целесообразно разделить на подгруппы по следующему признаку и т.д.

Общее число групп и подгрупп, которое может быть сформировано в процессе проведения приема комбинированной группировки, ориентировочно рассчитывают по формуле

Типологические группировки - student2.ru , (3.1)

где N – общее число групп и подгрупп; К – число групп (подгрупп) по каждому группировочному признаку; m – число группировочных признаков в комбинированной группировке.

Из формулы 3.1 следует, что с увеличением количества группировочных признаков общая численность групп и подгрупп в комбинированной группировке прогрессивно возрастает. По каждой группе или подгруппе должен быть обеспечен надежный уровень представительности по числу входящих в нее статистических единиц. Если исходить из теории выборочного метода, то можно утверждать, что минимальный уровень представительности каждой подгруппы может быть достигнут при условии, если в подгруппу войдет не менее 5 статистических единиц. В этом случае точечная оценка основных статистических характеристик по результативным признакам группировки начинает приближаться к состоятельной.

Одна из важнейших особенностей применения приема комбинированной группировки – привлечение повышенного числа статистических единиц в составе генеральной или выборочной совокупности. Расчеты показывают, что если сформировать минимальное число групп (3) и подгрупп (3) по двум группировочным признакам, то общая численность групп и подгрупп в комбинированной группировке составит 9, а теоретически необходимое минимальное число статистических единиц равно 45; по трем группировочным признакам – 135, по четырем — 405 единиц. Это только минимум. С учетом же действия закона нормального распределения необходимое число статистических единиц для проведения комбинированной группировки существенно возрастает. Поэтому прием аналитической комбинированной группировки по 3 – 4 и более группировочным признакам сравнительно редкий.

Комбинированная группировка позволяет улучшить аналитичность взаимосвязей между признаками, способствует углубленному изучению массовых явлений. Это бесспорное преимущество приема комбинированных группировок по сравнения с простыми группировками может быть обеспечено при условии достаточно большой выборки единиц в статистической совокупности. Дело в том, что достаточная представительность каждой группы и подгруппы способствует выравниванию (нивелированию) количественных различий между статистическими единицами по многочисленным признакам. С помощью именно такого приема достигается элиминирование комплекса неучтенных факторов при проведении аналитических группировок.

Вариационные ряды

Вариационный ряд представляет собой расположение значений признака каждой статистической единицы в определенном порядке. При этом отдельно взятые значения признака принято называть вариантой (вариантом). . Каждый член вариационного ряда (варианта) называется порядковой статистикой, а номер варианты — рангом (порядком) статистики. Важнейшими характеристиками вариационного ряда являются его крайне варианты (х1min; хnmax) и размах вариации ( Rх = хn – х1 ).

Вариационные ряды широко применяются при первичной обработке статистической информации, полученной в результате статистического наблюдения. Они служат базой для построения эмпирической функции распределения статистических единиц в составе статистической совокупности. Поэтому вариационные ряды называют рядами распределения.

В статистике различает следующие виды вариационных рядов: ранжированный, дискретный, интервальный.

Ранжированный ( от латинского rang – чин) ряд – это такой ряд распределения единиц статистической совокупности, в котором варианты признака размещены в порядке возрастания или убывания. Любой ранжированный ряд состоит из ранговых номеров (от 1 до n) и соответствующих им вариант. Их число в ранжированном ряду, сформированному по существенному признаку, обычно равно числу единиц в статистической совокупности.

Для формирования ранжированного ряда по заданному признаку (например, по числу работников животноводства в 100 сельскохозяйственных организациях) можно воспользоваться макетом табл. 3.5.

Ранжированный ряд имеет как преимущества, так и недостатки. Основное его преимущество в том, что каждая варианта ряда занимает строго определенное место в статистической совокупности, а главный недостаток состоит в громоздкости ранжированного ряда, особенно в том случае, если совокупность включает многие тысячи статистических единиц.

Т а б л и ц а 3.5. Порядок формирования ранжированного ряда по числу работников животноводства

Ранговый номер (№) варианты Варианта, соответствующая ранговому номеру (№)
Символ Число работников животноводства
х1
х2
х3
хп

Формирование ранжированного ряда обычно вызвано необходимостью размещения каждой статистической единицы в строго определенном порядке по одному, двум, трем и более признакам. Например, ранжирование сельскохозяйственных, перерабатывающих организаций по размеру ирезультатам производства продукции; ранжирование стран мира по рейтингу экономического развития.

Характер изменения вариант по заданному признаку в статистической совокупности наглядно можно представить при графическом представлении ранжированного ряда с помощью линейной диаграммы. При этом в системе координат на оси абсцисс (ОХ) размещают независимую переменную – ранговые номера (№) ряда, на оси ординат – варианты, соответствующие каждому ранговому номеру ( №). Полученная кривая линия называется огивой Гальтона (рис. 3.1).

Типологические группировки - student2.ru

Рис. 3.1. Изменение средней живой массы свиней на свиноводческих фермах (огива Гальтона)

Характерная особенность огивы заключается в том, что начальная и конечная части кривой линии относительно невелики и выделяются повышенной крутизной подъема, середина же занимает основную часть диаграммы и отличается сравнительной плавностью перехода от варианты к варианте. Это указывает на то, что в достаточно большой статистической совокупности основная масса единиц обычно тяготеет к середине ранжированного ряда.

Ранжированный ряд используется при расчёте и оценке средних величин и показателей вариации. Использование ранжированного ряда и его огивы позволяет анализировать характер распределения. Для перехода к более совершенной форме описания вариации применяют другие виды рядов распределения.

Дискретный (разделенный) ряд – это такой вариационный ряд, в котором его группы сформированы по признаку, изменяющемуся прерывно, т.е. через определённое число единиц. Обычно его формируют по вариантам прерывного (дискретного) признака. В особых случаях, когда имеется целесообразность сформировать дискретный ряд по непрерывному признаку, варианты этого признака приходится округлять.

Общая схема дискретного ряда может быть следующей: некоторая переменная х (варьирующий признак) принимает различные значения х1, х2, х3,…..хп и имеет соответствующую локальную частоту f1, f 2, f3, … fn. Под ней понимается абсолютное число, показывающее, сколько раз (как часто) встречается в статистической совокупности то или иное значение (варианта) признака или, что то же самое, сколько единиц в совокупности соответствует тем или иным значением признака.

В некоторых случаях локальные частоты могут быть заменены локальными частостями. В отличие от частот это структурные относительные показатели, определяющие долю локальных частот по каждой варианте в общей сумме частот. При этом частости могут выражаться в долях единицы, либо в процентах.

В дискретном ряду распределения могут быть предусмотрены накопленныечастоты или частости, которые исчисляются путем последовательного суммирования к частоте (частости) первой варианты ряда частот (частостей) последующих вариант дискретного ряда. Накопленные частоты (частости) показывают, сколько единиц совокупности или какая их доля не превышает данную варианту в составе ряда. При формировании дискретного (разделенного) ряда рекомендуется воспользоваться макетом табл. 3.6.

Т а б л и ц а 3.6. Порядок формирования дискретного ряда по числу

Работников животноводства

№ варианты Варианта (значение признака), х Частотные знаки Локальные частоты, fл Накопленные частоты, fн
//
////
////
///
Σ - -

Основное преимущество дискретного ряда заключается в его компактности по сравнению с ранжированным рядом. Дискретный ряд распределения разрабатывается в тех случаях, когда варьирующий признак принимает сравнительно небольшое число значений, т.е. встречается в ограниченном количестве вариант. В таких случаях имеется возможность охарактеризовать вариацию признака в статистической совокупности довольно подробно и точно.

Для графического изображения дискретного вариационного ряда в системе прямоугольных координат необходимо на оси абсцисс разместить независимую переменную – значения признака (варианты), а на оси ординат – локальные частоты ряда. Полученную геометрическую фигуру – многоугольник – принято называть полигоном распределения (рис. 3.2).

Типологические группировки - student2.ru

Рис. 3.2. Распределение средних перерабатывающих организаций АПК по численности работников (полигон распределения)

При достаточно большой статистической совокупности, которая может насчитывать, например, несколько сот единиц, обычно получаем одновершинный, близкий к симметричному, полигон распределения. Если же статистическая совокупность ограничена несколькими десятками единиц, то полигон может иметь многовершинную, как правило, асимметричную форму.

Это еще раз подтверждает, что статистические закономерности проявляются в условиях достаточно высокой представительности совокупности.

Во многих случаях, когда статистическая совокупность включает большое или тем более бесконечное число вариант, что чаще всего встречается при непрерывной вариации, практически невозможно и нецелесообразно формировать группу единиц для каждой варианты. В таких случаях объединение статистических единиц в группы возможно лишь на базе интервала, т.е. такой группы, которая имеет определенные пределы значений варьирующего признака. Они обозначаются двумя числами, указывающими верхнюю и нижнюю границы каждой группы. Применение интервалов приводит к формированию интервального ряда распределения.

Интервальный рад – это вариационный ряд, варианты которого представлены в виде интервалов. Он может формироваться с равными инеравными интервалами, при этом выбор принципа построения этого ряда зависит главным образом от степени представительности и однородности статистической совокупности. Если совокупность достаточно велика (представительна) по числу единиц и вполне однородна по своему составу, то в основу формирования интервального ряда целесообразно положить принцип равенства интервалов. Обычно по этому принципу образуют интервальный ряд по тем совокупностям, где размах вариации сравнительно невелик, т.е. максимальная и минимальная варианты различаются между собой обычно в несколько раз. При этом величина равных интервалов рассчитывается отношением размаха вариации признака к заданному числу образуемых интервалов. Для определения равного интервала может быть использована формула Стерджесса [4] (обычно при небольшой вариации интервальных признаков и большом числе единиц в статистической совокупности):

Типологические группировки - student2.ru (3.2)

где iX – величина равного интервала; х max, х min— максимальная и минимальная варианты в статистической совокупности; n— число единиц в совокупности.

Пример. Целесообразно рассчитать размер равного интервала по плотности радиоактивного загрязнения цезием - 137 в 100 населенных пунктах Краснопольского района Могилевской области, если известно, что начальная (минимальная) варианта равна 1ки/км2, конечная (максимальная) – 65 ки/км2. Воспользовавшись формулой (3.2), получим:

Типологические группировки - student2.ru Типологические группировки - student2.ru

Следовательно, при формировании интервального ряда с равными интервалами по плотности загрязнения цезием - 137 населенных пунктов Краснопольского района размер равного интервала может составить 8 ки/км2.

В условиях неравномерного распределения, т.е. когда максимальная иминимальная варианты различаются в десятки или сотни раз, при формировании интервального ряда можно применить принцип неравных интервалов. Неравные интервалы обычно увеличиваются по мере перехода к большим значениям признака.

По форме интервалы могут быть закрытыми и открытыми. Закрытыми принято называть те, у которых обозначены нижняя и верхняя границы. Открытые имеют только одну границу: в первом интервале – верхняя, в последнем — нижняя граница.

Интервальные ряды, особенно с неравным интервалами, целесообразно оценивать с учетом плотности распределения, простейшим способом расчета которой является отношение локальной частоты (или частости) к размеру интервала. Для практического формирования интервального ряда можно воспользоваться макетом табл. 3.7.

Основное преимущество интервального ряда — его предельная компактность; в то же время в интервальном ряду распределения индивидуальные варианты признака скрыты в соответствующих интервалах.

При графическом изображении интервального ряда в системе прямоугольных координат на оси абсцисс откладывают нижние и верхние границы интервалов, на оси ординат – локальные частоты ряда.

Т а б л и ц а 3.7. Порядок формирования интервального ряда населённых пунктов Краснопольского района по плотности радиоактивного загрязнения цезием – 137

№ интервала Интервалы по плотности загрязнения, ки/км2 Частотные знаки Локальные частоты Накопленные частоты Срединные значения интервала Плотность распределения
      х П
1-9,0 ///// 5,0 0,625
9,1-17,0 /////////// 13,0 1,375
17,1-25,0 ////////////// 21,0 1,750
25,1-33,0 ///////////////////// 29,0 2,625
33,1-41,0 ////////////////////// 37,0 2,750
41,1-49,0 /////////////// 45,0 1,875
49,1-57,0 //////// 53,0 1,000
57,1-65,0 //// 61,0 0,500
Итого - - - -

Графическое построение интервального ряда отличается от построения полигона распределения тем, что каждый интервал имеет нижнюю и верхнюю границы, а одному какому - либо значению ординаты соответствуют две абсциссы. Поэтому на графике интервального ряда отмечается не точка, как в полигоне, а линия, соединяющая две точки. Эти горизонтальные линии соединяются друг с другом вертикальными отрезками и получается фигура ступенчатого многоугольника, который принято называть гистограммой распределения (рис.3.3).

Типологические группировки - student2.ru

Рис. 3.3. Распределение работников по стажу в сельскохозяйственных организациях (гистограмма распределения)

При графическом построении интервального ряда по достаточно большой статистической совокупности гистограмма приближается к симметричной форме распределения. В тех же случаях, где статистическая совокупность невелика, как правило, формируется асимметричная гистограмма.

В некоторых случаях целесообразно формировать ряд накопленных частот, т.е. кумулятивный. Его можно образовать на основе дискретного либо интервального ряда распределения. При графическом изображении кумулятивного ряда в системе прямоугольных координат на оси абсцисс откладывают варианты, на оси ординат — накопленные частоты (частости). Полученную при этом кривую линию принято называть кумулятой распределения (рис.3.4).

Типологические группировки - student2.ru

Рис. 3.4. Распределение тракторов по продолжительности эксплуатации в СПК «Нива» ( кумулята распределения)

Формирование и графическое изображение различных видов вариационных рядов способствует упрощенному расчету основных статистических характеристик, помогает лучше понять сущность законов распределения статистической совокупности. Анализ вариационного ряда приобретает особенное значение в тех случаях, когда необходимо выявить и проследить зависимость между вариантами и частотами (частостями). Эта зависимость проявляется в том, что число случаев, приходящихся на каждую варианту, определенным образом связано с величиной этой варианты, т.е. с возрастанием значений варьирующего признака частоты (частости) систематически изменяются. Это означает, что числа в столбце частот (частостей) подвержены не хаотическим колебаниям, а изменяются в определенном направлении, порядке и последовательности.

Если в изменении частот обнаруживается некая систематичность, то это означает, что мы находимся на пути к выявлению закономерности. Система, порядок, последовательность в изменении частот – это отражение общих причин, условий, характерных для всей совокупности.

Не следует считать, что закономерность распределения всегда дается в готовом виде. Встречается довольно много вариационных рядов, в которых частоты причудливо скачут, то возрастая, то уменьшаясь. В таких случаях целесообразно выяснить, с каким распределением имеет дело исследователь: то ли этому распределению вовсе не свойственны закономерности, то ли его характер еще не выявлен. Первый случай встречается редко, второй– явление довольно частое и распространенное.

Так, при формировании интервального ряда общее число статистических единиц может быть небольшим, и в каждый интервал попадает малое число вариант (например, 1–3 единицы). В таких случаях рассчитывать на проявление какой-либо закономерности не приходится. Для того чтобы на основе случайных наблюдений получился закономерный результат, необходимо вступление в силу закона больших чисел, т.е. чтобы на каждый интервал приходилось не несколько, а десятки и сотни статистических единиц. С этой целью надо стараться, по возможности, увеличивать число наблюдений. Это самый верный способ обнаружения закономерности в массовых процессах. Если же не представляется реальная возможность увеличить число наблюдений, то выявить закономерность можно уменьшением числа интервалов в ряду распределения, тем самым достигается увеличение численности частот в каждом интервале. Это означает, что случайные колебания каждой статистической единицы накладываются друг на друга, "сглаживается", превращаясь в закономерность.

Формирование и построение вариационных рядов позволяет получить лишь общую, приближенную картину распределения статистической совокупности. Например, гистограмма лишь в грубой форме выражает зависимость между значениями признака и его частотами (частостями) Поэтому вариационные ряды по существу являются лишь основой для дальнейшего, углубленного изучения внутренней закономерности статического распределения.

Наши рекомендации