Глава 9. средние величины и их применение в юридической статистике

Понятие средних величин

Следующие обобщающие показатели после абсолютных и от­носительных данных — это средние величины и связанные с ними показатели вариации. Они имеют исключительное значение в эко­номическом анализе и играют важную роль в юридической ста­тистике. Только с помощью средних можно охарактеризовать со­вокупности по количественному варьирующему признаку, по которому можно их сравнивать.

Предположим, нам необходимо сопоставить судебную практи­ку назначения уголовных наказаний в двух районах, схожих по уров­ню и структуре преступности. Эту задачу нельзя решить на основе сравнения мер наказаний, назначенным конкретным осужденным, хотя какие-то суждения и можно высказать, если за одинаковые по квалификации деяния были назначены существенно различающи­еся меры наказания. Нельзя этого сделать и на основе сопоставле­ния большого количества данных о назначенных наказаниях. Но если мы сложим все сроки наказания (варианты, обозначив их символа­ми дср х2, х3 и т. д.) и разделим на общее число осужденных (п), то по полученным средним данным можно сказать, какая практика назначения наказания в том и другом суде и сравнить ее на основе средних показателей. При обобщении наказаний, не связанных с лишением свободы, могут быть применены порядок, используе­мый при их сложении (ст. 71 УК РФ), и другие правила о которых говорилось при анализе индекса судимости.

В этом случае меры наказания, назначенные в том или ином суде, получают обобщенную характеристику в средних величи­нах, которые являются результатом абстрагирования от имею­щихся индивидуальных различий, но с сохранением их основ­ных свойств, в которых индивидуальные отклонения взаимопо-гашаются.

Таким образом, с помощью средних величин можно сравни­вать интересующие нас совокупности юридически значимых яв­лений по тем или иным количественным признакам и делать из этих сравнений необходимые выводы не только о сроках наказания, но о возрасте правонарушителей (осужденных, заключен­ных), сроках расследования и рассмотрения уголовных и граж­данских дел, о цене исков и т. д.

Средняя величина в статистике представляет собой обобщен­ную характеристику совокупности однородных явлений по како­му-либо одному количественно варьирующему признаку. Она все­гда обобщает количественную вариацию признака, к примеру, возраст правонарушителей от 14 до 60 лет, меры наказания от 1 месяца до 20 лет. Этот признак, хотя и в разной степени, но присущ всем единицам совокупности. Каждый правонарушитель имеет тот или иной возраст, а также каждый осужденный полу­чил ту или иную меру наказания, измеряемого непосредственно в годах (баллах). Поэтому за всякой средней скрывается ряд рас­пределения единиц совокупности по изучаемому признаку, т. е. вариационный ряд.

В связи с этим одно из важных условий расчета средних вели­чин это качественная однородность единиц совокупности в отно­шении осредняемого признака. Средние величины, исчисленные для явлений разного типа, представляют собой фикцию. Они мо­гут затушевывать и искажать различия разнородных совокупнос­тей. Классическая иллюстрация в этом отношении у статисти­ков — вычисление среднего дохода для бедных и богатых, объе­диняемых в одной совокупности — народ. Глеб Успенский в очерке «Четверть лошади» приводит множество примеров, когда сред­ние величины, рассчитанные на качественно разнородных еди­ницах совокупности, серьезно искажают действительность: «Это все равно, ежели бы я взял миллионщика Колотушкина, у кото­рого в кармане миллион, присоединил к нему просвирню Ку­кушкину, у которой грош, — так тогда в среднем выводе на каж­дого вышло по полумиллиону».

В подобных случаях средние величины рассчитываются по ка­чественно однородным группам. Применительно к нашему при­меру: средний доход для бедных и средний доход для богатых. Группировки статистических показателей, опирающиеся на на­учно обоснованные качественные группировочные признаки, иг­рают в этом отношении незаменимую роль. Поэтому и практи­чески, и теоретически в криминологии, социологии права и дру­гих юридических дисциплинах допустимы, главным образом, групповые средние, т. е. средние, вычисленные на основе адекватных статистических группировок.

При работе со средними, как общими, так и групповыми, не следует пренебрегать индивидуальными величинами. Средние показатели, основываясь на массовом обобщении фактов, отра­жают их типические уровни. Но за ними необходимо видеть кон­кретные сведения об изучаемом явлении, конкретные показате­ли работы и т. д. Не являясь типичными в количественном отно­шении, они могут быть таковыми на качественном уровне ана­лиза, например, остатками уходящего прошлого, или ростками возможных будущих изменений. Научное применение средних в статистике должно опираться на диалектическое соотношение об­щего и индивидуального, массового и единичного.

Вернемся к нашему примеру среднего срока наказания, назна­ченного осужденным в течение года в том или ином районном суде. В принципе (исходя из однородной совокупности) осреднение срока наказания возможно только в отношении лиц, которым назначено было однородное наказание, в данном случае — лишение свободы. Осужденные, которым было вынесено наказание, не связанное с лишением свободы (ограничение свободы, штраф, исправительные работы, обязательные работы и т. д.), образуют иные однородные совокупности. Но у нас есть законодательное правило определения сроков наказаний, не связанных с лишением свободы, при их сло­жении (ст. 71 УК) и обоснованная практика расчета всех уголовных наказаний в баллах (годах лишения свободы). В этом случае расчет средних вполне допустим.

Обобщающие средние величины заметно отличаются от обоб­щающих относительных величин. В относительных величинах со­относимые совокупности не являются варьирующими признака­ми по отношению друг к другу. Например, в коэффициенте чис­ла фактов на 100 тыс. населения число фактов (правонарушений, исков и т.д.) не является варьирующим признаком населения, как, скажем, возраст к числу правонарушителей. В связи с этим показатель интенсивности (5 тыс. преступлений на 100 тыс. насе­ления) не означает, что каждый житель — правонарушитель, тогда как в среднем (средний возраст правонарушителей) каж­дый правонарушитель имеет тот или иной возраст.

Средние величины основываются на массовом обобщении фак­тов. Только при этом условии они способны выявить те или иные тенденции, лежащие в основе наблюдаемого явления. Средние величины отражают самую общую тенденцию (закономерность), при­сущую всей массе изучаемых явлений. Она проявляется в типичной количественной характеристике, т. е. в средней величине всех име­ющихся (варьирующих) показателей. Вспомним размах колебаний (размах вариации) признака, величину отклонений всех вариант от средней и кривую нормального распределения (кривую Лапла­са—Гаусса), которых мы касались для обоснования выборочного наблюдения на основе теории вероятно­стей и закона больших чисел. Последний выражает классическое свойство статисти­ческих закономерностей формироваться и отчетливо отражаться лишь в массовом процессе и при достаточно большом числе единиц совокупности.

Там мы установили, что средняя ве­личина (f), от которой идет отсчет ве­личины отклонений индивидуальных показателей в нормальном распределе­нии по оси х, выполняет функцию те­оретической вероятности (рис. 1).

В данном случае очевидно, что средняя в связи с взаимопо­гашением в ней случайных индивидуальных различий единиц совокупности отражает общую и типическую характеристику всей совокупности.

Виды средних величин

Средние статистические величины имеют несколько видов, но все они относятся к классу степенных средних, т. е. средних, построенных из различных степеней вариантов: средняя арифме­тическая, средняя гармоническая, средняя квадратическая, сред­няя геометрическая и т. д.

Общий вид формулы степенной средней таков:

При расчете различных степенных средних все основные по­казатели, на основе которых осуществляется этот расчет (х, я), остаются неизменными. Меняется только величина т и соответ­ственно JC.

Если т = 2, то получается средняя квадратическая. Ее формула

Если т = 1, то получается средняя арифметическая. Ее формула

7 *арифм.

Если т = -1, то получается средняя гармоническая. Ее формула

*гармон.

Если т = О, то получается средняя геометрическая. Ее формула

,Х, Х2 • Х3: . .-Х„ .

Различные виды средних при одних и тех же исходных по­казателях (значении вариант х и их числе л) имеют в связи с разными значениями степени далеко не одинаковые числен­ные значения. Рассмотрим их на конкретных примерах.

Предположим, что в поселке N в 1995 г. было зарегистрирова­но 3 автотранспортных преступления, а в 1996 г. — 6. В этом случае jc,=3, х2=6, a n (число вариант, лет) в обоих случаях равно 2.

При значении степени т = 2 получаем среднюю квадрати-ческую величину:

= ,/22j = 4,75.

1 получаем среднюю арифмети-

При значении степени т ческую величину:

•*арифм. ~~

При значении степени т = 0 получаем среднюю геометри­ческую величину:

При значении степени т = - 1 получаем среднюю гармони­ческую величину:

Произведенные расчеты показали, что разные средние обра­зуют между собой следующую цепь неравенства:

Закономерность проста: чем меньше степень средней (2; 1; 0; - 1), тем меньше значение соответствующей средней. Таким об­разом, каждая средняя приведенного ряда мажорантна (мажор от фр. majeur — больший) в отношении средних, стоящих спра­ва от нее. И это называется правилом мажорантное™ средних.

В приведенных упрощенных примерах значения вариант (х) не повторялись: значение 3 встречалось один раз и значение 6 -тоже. Статистические реалии более сложны. Значения вариантов могут повторяться по нескольку раз. Вспомним обоснование вы­борочного метода на основе экспериментального извлечения кар­точек, пронумерованных от 1 до 10. Некоторые номера карточек извлекались по 2, 3, 5, 8 раз. При расчете среднего возраста осуж­денных, среднего срока наказания, среднего срока расследова­ния или рассмотрения уголовных дел одна и та же варианта (х), например возраст 20 лет или мера наказания 5 лет, может повто­ряться десятки и даже сотни раз, т. е. с той или иной частотой (/). В этом случае в общую и специальные формулы расчета сред­них вводится символ / — частота. Частоты при этом называют статистическими весами, или весами средней, а сама средняя называется взвешенной степенной средней. Это означает, что каж­дая варианта (возраст 25 лет) как бы взвешивается по частоте (40 человек), т. е. умножается на нее.

Итак, общая формула взвешенной степенной средней име­ет вид:

где х — взвешенная средняя степени т; х — варианты (меняющиеся значения признака); т — показатель степени средней; Z — знак суммирования (сигма боль­шая);/— частоты вариант.

Выбор обычной средней или взвешенной определяется ста­тистическим материалом, а выбор вида степенной (арифмети­ческой, геометрической и т. д.) — целью исследования. Вспом­ним, когда рассчитывался среднегодовой прирост абсолютных показателей мы прибегали к средней арифметической, а когда исчисляли среднегодовые темпы прироста (снижения), то вы­нуждены были обращаться к средней геометрической, посколь­ку средняя арифметическая эту задачу выполнить не могла, так как приводила к ошибочным выводам.

В юридической статистике самое широкое применение нахо­дит средняя арифметическая. Она используется при оценке на­грузки оперативных работников, следователей, прокуроров, су­дей, адвокатов, других сотрудников юридических учреждений; расчете абсолютного прироста (снижения) преступности, уго­ловных и гражданских дел и других единиц измерения; обо­сновании выборочного наблюдения и т. д.

Средняя геометрическая величина используется при вычис­лении среднегодовых темпов прироста (снижения) юридичес­ки значимых явлений.

Средний квадратичный показатель (средний квадрат откло­нения, средне квадратическое отклонение) играют важную роль при измерении связей между изучаемыми явлениями и их при­чинами, при обосновании корреляционной зависимости.

Некоторые из этих средних, широко применяемых в юри­дической статистике, а также мода и медиана будут более под­робно рассмотрены в последующих параграфах. Средняя гармо­ническая, средняя кубическая, средняя прогрессивная (изобре­тение советского времени) в юридической статистике практически не применяются. Средняя гармоническая, например, которая в предыдущих учебниках по судебной статистике подробно из­лагалась на абстрактных примерах, оспаривается видными эко­номическими статистиками. Они считают среднюю гармоничес­кую обратной величиной средней арифметической, и поэтому она, по их мнению, не имеет самостоятельного значения, хотя другие статистики видят в ней определенные преимущества . Не вникая в теоретические споры экономических статистиков, ска­жем, что средняя гармоническая нами подробно не излагается ввиду неприменения в юридическом анализе.

Кроме обычных и взвешенных степенных средних для харак­теристики среднего значения варианты в вариационном ряду мо­гут быть взяты не расчетные, а описательные средние: мода (наи­более часто встречающаяся варианта) и медиана (срединная ва­рианта в вариационном ряду). Они широко применяются в юри­дической статистике.

Средняя арифметическая

Средняя арифметическая — самый распространенный вид сред­ней величины. Неслучайно, когда речь заходит о средней вели­чине без указания ее вида, подразумевается именно средняя ариф­метическая. Она применяется в тех случаях, когда объем варьи­рующего признака для всей совокупности образуется как сумма значений признака у отдельных единиц совокупности. Ее расчет является наиболее простым: складывают величины всех вариан­тов и делят эту сумму на общее число единиц вариантов.

Предположим, что годовая нагрузка 15 судей городского суда, специализирующихся на рассмотрении гражданских дел различ­ной направленности, составила: 17, 42, 47, 47, 50, 50, 50, 63, 68, 68, 75, 78, 80, 80, 85. Необходимо исчислить среднюю годо­вую нагрузку на одного судью (х - средняя арифметическая) в целях сравнения со средней общефедеральной и краевой (облас­тной, республиканской). Для этого надо сложить значения всех индивидуальных нагрузок (которые обозначим: xv х2, хг ..., хп) и разделить на общее число судей («):

Хцрифн -

_ х1+х2+х3+...+х„

17 + 42 + 47+47

900 15

= 60.

Таким путем мы получили простую среднюю арифметичес­кую величину. В рассматриваемом примере 15 вариант (15 инди­видуальных нагрузок), но они имеют всего лишь 10 значений, так как у некоторых судей нагрузки были одинаковыми: 47 и 47; 50, 50 и 50; 68 и 68; 80 и 80. В этом случае исчислять сред­нюю арифметическую можно проще: перед суммированием ва­риант нужно умножить варианты (х,, хг х3, ...) на соответству­ющее число частот (/J, fv fy ...), затем полученные произведе­ния сложить (!х/) и разделить на общее число судей (If). На­гляднее всего это можно сделать в таблице (табл. 1), в которой число судей распределяется по числу рассмотренных дел, что и представляет собой дискретный (от лат. discretus — прерывис­тый) вариационный ряд.

Таблица 1 Вычисление средней нагрузки судей (по формуле средней арифметической)

Число дел (варианта х) Число судей (частота/) Произведение вариант на частоты (xf)
17 • 1 = 17
42 • 1 = 42
47 • 2 = 94
50 • 3 = 150
63 • 1 = 63
68 • 2 = 136
75 • 1 = 75
78 • 1 = 78
80 • 2 = 160
85 • 1 = 85
£х= 605 £/= 15 Ух = 900

Средняя арифметическая для дискретного вариационного ряда исчисляется по формуле средней арифметической взвешенной. Для нашего примера

Средняя арифметическая взвешенная не имеет принципиаль­ных отличий от простой средней арифметической. В ней сумми­рование одного и того же значения заменено умножением этого значения на его частоту, т. е. в этом случае каждое значение (ва­рианта) взвешивается по частоте встречаемости. Наш пример прост и технические выгоды от применения средней взвешен­ной не так очевидны. Но когда частоты исчисляются сотнями или тысячами, то применение средней взвешенной намного уп­рощает расчет.

При расчете простой средней арифметической часто вовсе не обязательно знать величину каждого индивидуального значения (варианты) или иметь в своем распоряжении построенный на основе этих вариант вариационный ряд. В официальной отчетно­сти юридических учреждений, как правило, уже имеются мно­гие суммарные величины. Это суммирование происходит после­довательно в районах (городах), субъектах Федерации и в центре при сводке и группировке данных, полученных из документов первичного учета.

Открываем отчет о работе прокурора (Ф. П) за 1996 г. В разде­ле 4 (участие прокурора в рассмотрении гражданских и арбитраж­ных дел в судах) в таблице Б (иски (заявления) прокурора) ука­зано, что в 1996 г. прокурорами было предъявлено 170 882 иска на сумму 1 553 749 млн рублей. На основе этих обобщенных данных мы можем сразу рассчитать среднюю арифметическую сумму, приходящуюся на один предъявленный иск (имуще­ственного и неимущественного характера):

Используя другие обобщенные данные, можно рассчитать, что средняя сумма по искам различных видов была:

- 16 270 728 руб. (в имущественных интересах граждан);

- 10 741 826 руб. (в имущественных интересах государства);

- 5 718 097 руб. (связанных с хищениями);

- 4 678 344 руб. (связанных с производственным травма­тизмом);

— 5 840 399 руб. (связанных с незаконными увольнениями); - 17 375 765 руб. (связанных с нарушениями законов об ох­ране природы).

Расчет средней на основе обобщенных в отчетах данных воз­можен и тогда, когда каждое отдельное значение варианты во­обще не фиксируется. Например, средняя урожайность на гектар может быть подсчитана путем деления валового сбора зерна на посевную площадь, хотя никто не подсчитывает урожай на каж­дом гектаре. Этим же способом можно подсчитать среднее число совершенных преступлений на 1 кв. километр или на 10 тыс., 100 тыс. жителей. Последний средний арифметический показатель смыкается с относительным показателем интенсивности преступ­ности (коэффициентом преступности).

В связи с этим можно сказать, что между средними (особен­но средней арифметической) и относительными величинами иногда не существует четких и однозначных границ. И те и дру­гие являются обобщающими. Более того, любая средняя величи­на — это своеобразное отношение двух абсолютных величин, т. е. она одновременно представляет собой и определенную относи­тельную величину (в нашем последнем примере — отношение общей суммы исков к их числу). С другой стороны, любая отно­сительная величина дает своеобразную усредненную характерис­тику явления. Например, отношения динамики дают усреднен­ную характеристику роста или снижения уровня изучаемого яв­ления за анализируемые годы; отношения распределения — ус­редненный удельный вес какого-то показателя в структуре всех показателей и т. д. Однако при этом нельзя не видеть их статис­тически значимых различий, о которых говорилось в понятии о средних.

Некоторые особенности и трудности при расчете средней арифметической имеются для интервального ряда статистичес­ких показателей, т.е., когда индивидуальные численные зна­чения (варианты) сгруппированы в интервалы (от — до). В юри­дической статистике интервальные ряды используются чаще, чем дискретные. Так учитываются сроки наказания, сроки след­ствия, сроки рассмотрения уголовных и гражданских дел, воз­раст правонарушителей и т. д.

В отчете Минюста РФ (Ф. 10) о числе привлеченных к уго­ловной ответственности и мерах уголовного наказания за 1996 г. меры наказания зафиксированы в виде интервального ряда. Попытаемся рассчитать средний срок лишения свободы на одного осужденного за умышленное убийство при отягчающих обстоя­тельствах (табл. 2).

Таблица 2 Вычисление срока наказания за умышленное убийство для интервального ряда

Сроки лишения свободы (х) Число осуж­денных (/) Середина интер­валов (/) Произведение сере­дины интервалов и частоты {/?)
До 1 года 0,5
Свыше 1 года до 2 лет 1,5 4,5
Свыше 2 до 3 лет 2,5
Свыше 3 до 5 лет
Свыше 5 до 8 лет 6,5
Свыше 8 до 10 лет 11 331
Свыше 10 до 15 лет 12,5 36 512,5
  J/= 4803   Ifl= 51 559

Если бы ряд был дискретный, то расчет средней можно было бы произвести по формуле средней арифметической взвешенной. Но этого сделать нельзя, так как точные сроки наказания убийц неизвестны. Они обобщены в интервалах «от— до». Это можно сде­лать при одном условии, если допустить, что внутри каждой груп­пы «от— до» сроки лишения свободы распределены равномерно и середина интервала — это среднее значение для данной груп­пы. Середина интервала рассчитывается по формуле средней ариф­метической путем деления на 2 суммы двух границ интервала. К примеру:

8 лет + 10 лет 18 лет .

В действительности средняя арифметическая середины ин­тервалов может и не отражать среднего значения сроков лише­ния свободы в том или ином интервале. Но другого выхода нет, так как отсутствует учет индивидуальных сроков лишения сво­боды в статистической отчетности судов. Поэтому условно при­няв середину интервалов за среднее значение варианты каждой группы «от— до» (см. графу 3 табл. 2), мы можем рассчитать средний срок лишения свободы для убийц по формуле средней взве­шенной:

При расчете средней арифметической для интервального ряда встречается и другая трудность, когда у первой группы может не быть нижней границы интервала (в нашем примере — до 1 года, а нижний предел не указан), у последней группы может, не быть верхней границы интервала (например, свыше 10 лет, а верхний предел также не указан). При таких неопределенных интервалах их границы либо устанавливают произвольно, либо определяют их на основе дополнительных изучений. В нашем примере можно обратиться к ст. 56 УК РФ, где установлен ми­нимальный (шесть месяцев) и максимальный (20 лет) сроки лишения свободы.

Мы живем во время, когда компьютер становится неотъем­лемым аппаратом любой аналитической деятельности. В этих ус­ловиях исчисление любых средних величин упрощается путем ис­пользования необходимых компьютерных программ. Тем не ме­нее, мы подробно излагаем технику вычисления, полагая, что любой юрист (практик или ученый) должен понимать сущность производимых расчетов и уметь их произвести любым доступным способом. С целью упрощения таких расчетов можно использо­вать некоторые свойства средней арифметической, которые мы приводим без доказательств.

1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты, т. е. xLf= Ixf. В первом нашем примере: 60 дел • 15 судей = 900.

2. Если от каждой варианты отнять (или прибавить к ней) одно и то же число, то новая средняя уменьшится (или увели­чится) на то же число. Это означает, что в целях упрощения рас­четов можно уменьшить на произвольное число все варианты, рассчитать среднюю и, прибавив к ней то самое произвольное число, получить ее реальную величину.

3. Если каждую варианту разделить (или умножить) на какое-либо произвольное число, то средняя арифметическая уменьшится (или увеличится) во столько же раз. Это правило также можно использовать для облегчения расчетов средней арифметической.

4. Если все частоты (веса) разделить или умножить на какое-либо число, то средняя арифметическая от этого не изменится. Это обусловлено тем, что частоты при исчислении средней ариф­метической имеют значение веса не как абсолютные данные, а как удельные веса вариант в вариационном ряду. Поэтому и при увеличении, и при уменьшении в одинаковой степени их доли в вариационном ряду не меняются.

5. Сумма отклонений вариант от средней арифметической все­гда равна нулю. Иначе это свойство формулируется следующим образом: сумма положительных отклонений от средней равна сум­ме отрицательных отклонений, т. е. в средней арифметической и положительные, и отрицательные отклонения от нее взаимопогашаются. Вспомним кривую Лапласа—Гаусса, кривую нормаль­ного распределения данных около средней.

6. Общая средняя равна средней из частных средних, взве­шенной по численности соответствующих частей совокупности. Если известно, что среднее число уголовных дел, приходящихся на одного следователя в год в одном субъекте Федерации, рав­но 68, в другом — 72, в третьем — 74, причем в первом числится 180 следователей, во втором — 160, а в третьем — 150, то общую среднюю для региона можно подсчитать таким образом:

_ 68-180 + 72-160 + 74 150 180 + 160 + 150

• = 71,1 дел.

Средняя геометрическая

При рассмотрении относительных величин динамики мы уже обращались к средней геометрической величине. В настоящем па­раграфе дается ее системное понимание и исчисление на при­мерах той же динамики, поскольку именно при анализе рядов динамики средняя геометрическая находит широкое примене­ние в юридической статистике. Рассматриваемая величина ис­пользуется для вычисления средних темпов роста и прироста (снижения) наблюдаемых явлений. Изучение этих параметров в динамике преступности, выявленных правонарушителей, рас­крываемости, судимости, общего числа заключенных, оправ­данных, освобожденных от уголовной ответственности, рассмот­ренных гражданских дел, удовлетворенных и неудовлетворенных исков и других меняющихся во времени юридически зна­чимых явлений и процессов имеет важное практическое и на­учное значение.

Динамика юридически значимых явлений характеризуется многими показателями, в том числе и средними арифметичес­кими и геометрическими. Средние арифметические показатели применяются для расчета среднегодового абсолютного прироста (снижения), выраженного в именованных числах. Они важны, но недостаточны, особенно в сравнительных целях, для дости­жения которых большую помощь оказывают темпы роста, при­роста и снижения, выраженные в процентах. Расчет этих пара­метров производится по формуле средней геометрической, но на основе тех же абсолютных показателей. Обратимся к табл. 3, в которой приведены и абсолютные, и относительные величины динамики.

Сопоставление полученного усредненного показателя с ре­альными годовыми абсолютными приростами (строка 2 табл. 3) показывает, что в течение пятилетия прирост был очень нерав­номерным. В уголовной статистике редко встречаются тенденции, когда уровень преступности или ее отдельных видов изменяется по законам, близким к геометрической прогрессии, т. е. когда

Таблица 3

Динамика взяточничества в России (1991—1996 гг.)

Показатели
Абсолютные показатели (1) учтенных деяний
Абсолютный годовой (2) прирост +797 + 1166 +392 + 32 +532
Темпы роста к 1991 г.: (3) в процентах (4) в коэффициентах 100,0 1,0 131,5 1,315 177,5 1,775 192,9 1,929 194,2 1,942 215,2 2,152
Темпы роста цепные: (5) в процентах (6) в коэффициентах 100,0 1,0 131,5 1,315 135,0 1,350 108,7 1,087 100,7 1,007 110,8 1,108
Годовые темпы роста (7) в процентах 31,5 35,0 *,7 0,7 10,8
Абсолютное значение 1%            
прироста (8) в единицах   25,3 33,3 45,1 45,7 49,3

каждый последующий уровень ряда примерно равен предыду­щему, умноженному на некоторое постоянное число, называе­мое в математике знаменателем прогрессии. Поэтому в чистом виде геометрическая прогрессия в динамике юридически значи­мых явлений наблюдается крайне редко.

При всей неравномерности общий абсолютный прирост взяточ­ничества за 5 лет (не считая базового 1991 г.) составил: 5453-2534= = 797 + 1166 + 392 + 32 + 532 = 2919 случаев учтенного взяточничества. Он представляет собой разность значений 1996 и 1991 г., или сумму ежегодных приростов зарегистрированных случаев взяточничества. Отсюда средний годовой абсолютный прирост определяется как сред­няя арифметическая величина из суммы ежегодных приростов пу­тем ее деления на число лет (без учета базового года):

*арифм —;— = 583,8 случаев взяточничества.

В табл. 3 (строка 7) приводятся погодовые темпы прироста учтенного взяточничества, выраженные в процентах: 31,5; 35,0; 8,7; 0,7; 10,8, которые соотносятся с абсолютными годовыми приростами. Но на их основе нельзя рассчитать среднегодовые темпы общего прироста (в %) по правилам средней арифмети­ческой, т. е. путем деления их суммы (86,7%) на 5. Полученное среднее арифметическое частное (17,34%) неоправданно завы­сит реальный среднегодовой прирост. Поэтому он рассчитыва­ется по правилам средней геометрической на основе цепных темпов роста (строки 5 и 6 табл. 3), выраженных в процентах или коэффициентах:

где х.

геом - V -Ч 2 3 • •

средняя геометрическая; х., х., х,,

хп — годовые темпы роста;

п — число лет в периоде, за который исчисляется средняя геометрическая, не считая базового года.

Подставим данные из таблицы (строка 6) в указанную фор­мулу расчета среднегодовых темпов прироста, выраженных в коэффициентах:

хгеом. = ^/1,315 1,350 1,087 1,007 1,108 = ^2,153 = 1,166 или 116,6%. Это и будет среднегодовой темп роста взяточничества. Отку­да среднегодовой темп прироста этого деяния будет равен 16,6% (116,6 - 100,0). Полученный средний геометрический показа­тель (16,6%) по правилам мажорантности средних заметно мень­ше среднего арифметического (17,34%).

Использование произведения годовых темпов роста для рас­чета среднегодовых темпов роста и прироста имеет серьезные недостатки. Данный прием пригоден для расчета названных по­казателей только тогда, когда все годовые (цепные) темпы ро­ста, если и не изменяются по возрастающей, но являются по­ложительными числами. Достаточно хоть одного значения, рав­ного нулю, как все произведение становится равным нулю. Се­рьезные трудности появляются и тогда, когда годовые показа­тели в какие-то годы не росли, а снижались, что встречается очень часто. В этом случае произведение годовых (цепных) тем­пов роста не будет равно общему темпу роста. Поэтому, если позволяют исходные данные, лучше обращаться к иной фор­муле расчета средней геометрической, которая строится на дан­ных общего темпа роста за весь период наблюдения независи­мо от годовых колебаний.

Темпы роста за весь период могут быть получены не только путем перемножения годовых темпов роста (в нашем примере за 5 лет, не считая данных 1991 г.), выраженных в коэффициен­тах— 1,315-1,350-1,087-1,007-1,108 = 2,153, или процентах -215,3%, но и через известные отношения динамики. Получен­ные значения по сути своей являются не чем иным, как темпом роста абсолютных показателей взяточничества за весь период к базовому 1991 г, (последняя графа строк 3 и 4 табл. 3). Если взять отношение абсолютных показателей взяточничества за 1996 г. (5453) к данным 1991 г. (2534) в процентах, то мы получим прак­тически те же самые значения — 215,2%, или 2,152 (коэффици­ент). Разница в 0,1%, или 0,001 коэффициента, между результа­тами первого и второго исчислений общих темпов роста обус­ловлена неизбежным округлением чисел при расчете годовых тем­пов роста при их перемножении, тогда как при расчете отноше­ния динамики абсолютных показателей последнего года к дан­ным базисного года таких округлений нет.

С учетом сказанного, средний геометрический показатель в данном случае может быть получен на основе следующей фор­мулы:

где УП — абсолютный уровень конечного (л-го) года; У6 — абсолютный уровень базового года; л — число лет (без учета базового года).

Подставляя в эту формулу числа из нашего примера, полу­чаем искомый результат:

= 5.

= 3/2,152 = 1,166, или 116,6%.

Таким образом, и в этом случае среднегодовой темп прироста оказался равным 16,6%.

Извлечение корня более чем второй степени (а средние темпы роста и прироста юридически значимых показателей приходится рассчитывать за 50 и более лет) требует сложных вычислений, особенно тогда, когда эта процедура производится не на ЭВМ. В этом случае можно пользоваться свойствами логарифмов (lg):

Обозначения символов прежние.

Наконец, есть более простой вариант расчета средней геомет­рической: использовать расчетные таблицы, подготовленные ста­тистиками'. Таблицы, разработанные A.M. Айрапетовым, напри­мер, позволяют получить показатели среднегодовых темпов роста за период от 2 до 55 лет и темпов снижения за период от 2 до 22 лет, если известны соответствующие исходные показатели.

Таблицы построены таким образом, что искомые средне­годовые темпы роста, прироста или снижения находятся в край­них левых колонках, а исходные показатели — справа (табл. 4).

Таблица 4

Таблица (фрагмент) среднегодовых темпов роста, прироста, %

Средний годовой темп Темпы роста
роста прироста за 2 года за 3 года за 4 года за 5 лет
116,50 16,50 135,72 158,12 184,21 214,60
116,55 16,55 135,84 158,32 184,51 215,06
116,60 16,60 135,96 158,52 184,84 215,52
116,65 16,65 136,07 158,73 185,16 215,99
116,70 16,70 136,19 158,90 185,47 216,45

Обратимся к нашему примеру. За 1991-1996 гг. учтенное взя­точничество увеличилось до 215,2% (графа последняя, строка 3 табл. 3). Этот рост произошел за 5 лет (так как 1991 г. взят за базу и его прирост в данных 1996 г. не представлен). В приведенном фрагменте табл. 4 в последней графе «за 5 лет» находим темп рос­та, равный (или близкий по значению) нашему 215,2—215,3. Бли­же всего к нашим данным стоит показатель 215,52. В первой гра­фе на этой же строке указан средний годовой темп роста — 116,60%, а во второй графе этой же строки — среднегодовой темп прироста 16,60% (оба показателя набраны полужирным шриф­том). Это и есть искомые результаты. Аналогичным образом нахо­дятся и средние темпы снижения.

Таким образом, для того чтобы рассчитать среднегодовые тем­пы роста и прироста, необходимы абсолютные показатели пер­вого (базового) и последнего годов, на основе которых рассчи­тывается относительная величина динамики в процентах, и ко­личество лет (без учета базового года). В статистических сборни­ках и официальной отчетности, как правило, уже имеются под­считанные общие итоги и даже проценты роста или снижения наблюдаемого явления. На основе их и числа лет мы легко мо­жем найти искомые среднегодовые темпы роста и прироста ин­тересующих нас явлений.

Мода и медиана

Средняя арифметическая, средняя геометрическая и другие средние — это своеобразная статистическая абстракция, посколь­ку они, отвлекаясь от истинных величин, отражают то общее, которое присуще всей совокупности изучаемых единиц в целом. Величина средних часто выражается дробными числами (22,6 пра­вонарушителей, 105,8 исков и т. д.), которых в жизни не бывает. Наряду с абстрактными средними в статистике используются кон­кретные средние, величины которых занимают в ранжирован­ном вариационном ряду, построенном в порядке возрастания или убывания значений вариант, определенное среднее поло­жение. К таким средним относятся мода и медиана. В одних и тех же совокупностях мода и медиана иногда совпадают между со­бой по значению, но чаше не совпадают, хотя друг от друга отстоят, как правило, недалеко.

Таблица 5

Распределение уголовных дел по срокам рассмотрения

Сроки рассмотрения в судебном заседании, Число уголовных
дни дел
3 Мо
4 Me
Всего 400

Модой в статистике называется значение признака (варианта), которое чаше всего встречается в данной совокупности. Обозначим ее символом «Мо» и определим в вариационном ряду юридически значимых показателей (табл. 5).

Модой в данном примере бу­дет варианта 3 дня, так как за этот срок было рассмотрено дел боль­ше (85), чем за другие сроки.

В реальной жизни могут быть распределения, где все вариан­ты встречаются примерно оди­наково часто. В таких случаях мода не определяется, так как она практически отсутствует. В

других распределениях мода может быть не одна. Изменим наш пример. Предположим, что за 5 дней было рассмотрено столько же дел (85), как и за 3 дня. В этом случае две моды, а само распределение будет называться бимодальным. Оно, как правило, свидетельствует о качественной неоднородно­сти совокупности по изучаемому признаку.

Мода применяется в тех изучениях, когда нужно охаракте­ризовать наиболее часто встречающуюся величину признака.

Определение моды для интервального ряда несколько слож­нее. Рассмотрим это на примере табл. 6.

Чтобы найти моду, надо определить модальный интервал дан­ных рядов. Из таблицы видно, что наибольшая частота по числу раненых (23 917) соответствует интервалу от 21 до 25 лет, а по числу погибших (4112) -- интервалу от 31 до 35 лет (в этих обоих случаях мода набрана полужирным шрифтом). Назван­ные интервалы и будут модальными.

Для расчета более точных значений модальных признаков, заключенных в этих интервалах, используют следующую фор­мулу:

= ° '77-----7Y7J7-----М '

(/Mo-/l) + (/Mo-/2)

где Мо — мода; Х0 — минимальная граница модального интервала (в нашем приме­ре это 21 — по раненым и 31 — по погибшим); /' — значение модального интервала

Таблица 6

Распределение числа пострадавших в ДТП по возрасту в 1995 г. (при разукрупнении некоторых интервалов данные рассчитывались)

Возраст жертв «от— до», лет Число раненых Кумулятивные частоты Число погибших Кумулятивные частоты
1-5
6-10
11-15 10 274 24 804 2262 Мг
16-20 22 334 47 138
21-25 71 055
26-30 18 899 13 157
31-35 19 187 109 141
36-40 19 186 128 327 20 537
41-45 13 000 141 327
46-50 11 000 152 327
51-55 161 327 27 337
56-60 168 327 29 137
61-65 173 321
Более 65 183 926
  £/= 183 926   £/= 32 791  

(в нашем примере 5 лет); fMo — частота модального интервала (23 917 — по раненым и 4112 — по погибшим);/, — частота интервала, предшествующего модальному (в нашем примере 22 334 — по раненым и 3675 —- по погибшим);^ — частота интерва­ла, следующего за модальным (18 899 — по раненым и 4110 — по погибшим).

Подставляя числовые значения, получаем:

23917-22 334

Мо (ран.) = 21+5

(23917-22 334)+ (23 917-18 899) = 21 + 5 • 0,24 = 21 +1,2 = 22,2 года.

= 21+5

1583 6601

Таким образом, мода для раненых равна 22 года и 2 месяца.

4112-3675 . 437

= 31+5- 0,995 = 31+ 4,97 = 35,97 года.

Мода для погибших оказалась равной 35 лет 11 месяцев. Ее значение расположено на крайней отметке максимальной гра­ницы модального интервала. Это неслучайно. Следующий за мо­дальным интервал (36—40 лет) имел варианту (4110), т.е. всего на 2 единицы меньше моды (4112).

Формула, используемая для нахождения модальной величи­ны в модальном интервале, пригодна лишь для вариационных рядов с равными интервалами. В нашем примере мы путем неко­торых среднеарифметических расчетов сделали их пятилетними. В реальной статистической отчетности ГАИ МВД РФ возрастные интервалы являются неравными. Для наглядности приведем фак­тическую таблицу распределения числа жертв ДТП по возрасту за тот же 1995 г., которая опубликована в официальном сбор*-нике (табл. 7).

Таблица 7 Распределение числя пострадавших в ДТП по возрасту в 1995 г.

Возраст жертв «от— до», лет Число раненых Кумулятивные частоты Число погибших Кумулятивные частоты
1-7
7-10
11-15
16-20 47 138
21-25 71 055
26-30 18 899
31-40 38 373 128 327
41-65 44 994 173 321
Более 65 183 926
  2/=183926   5/=32 791  

Вариационный ряд в данном случае является не только неравноинтервальным, но и статистически порочным, так как раз­личия в интервалах так велики, что серьезно искажают реаль­ную статистическую картину. От 11 до 30 лет интервал пятилет­ний (11-15; 16-20; 21-25; 26-30), от 7 до 10 лет — четырехлет­ний, от 1 до 7 — семилетний, от 31 до 40 лет — десятилетний и

от 41 до 65 лет — двадцатипятилетний. Согласно этой таблице (если пренебречь различием интервалов) модальным должен быть определен интервал от 41 до 65 лет, но он в 5 и более раз протя­женнее остальных интервалов и его модальность — результат не­профессионально разработанной статистической отчетности.

Медианой в статистике называется варианта, которая нахо­дится в середине ранжированного ряда. Медиана делит упорядо­ченный ряд пополам. По обе стороны от нее находится одина­ковое число единиц совокупности. Медиана обычно обознача­ется символом «Me». Упрощенным и условным примером на­хождения медианы может служить вариационный ряд осужден­ных по возрасту.

Таблица 8 Распределение осужденных по возрасту (14—26 лет)

Возраст 20 21 25 26
Число осуж­денных 150 160 Me 175 Mo 140 132

Медианой в этом дискретном ряду будет варианта «20 лет» с частотой 150 осужденных. По обе стороны от нее находится равное число единиц совокупности. Модой в этом ряду являет­ся варианта «22 года» с наибольшей частотой -- 175 осужден­ных. Если мы обратимся к таблице 5, то там медиана -- это срок рассмотрения дела в 4 дня с числом рассмотренных дел 80, а мода — срок в 3 дня и частотой 85 дел.

Если всем единицам любого ранжированного ряда придать порядковые номера, то номер медианы в ряду с нечетным чис-

п + 1 _

лом членов п определяется как -у-. В наших примерах: в первом

13 +1

случае (табл. 8), когда в ряду 13 членов, Me

• = 7, а во втором

7 + 1

случае (табл. 5) Me = —— = 4 . В последнем примере число членов в

ряду четное. Медианой будет средняя из двух центральных вари­ант, порядковые номера которых я:2 и я:2 + 1. Например, если в ряду 20 единиц, то в центре стоят единицы с порядковым номе­ром 10 и 11. Средняя из двух величин определяется по формуле средней арифметической. В подобных случаях в качестве медианы можно определить и одну варианту, если единиц в совокупности много и различия между ними незначительные.

В интервальном ранжированном ряду медиана, как и при на­хождении моды, определяется вначале в виде медианного интерва­ла, а затем в нем находится медиана по соответствующей формуле. Медианный интервал определяется по кумулятивным (накоплен­ным) частотам, которые являются последовательной суммой пре­дыдущих частот, начиная с интервала с меньшим значением при­знака. Кумулятивная частота для раненых (табл. 6) складывалась та­ким образом: для интервала от 1 до 5 лет она равна числу раненых этого возраста (4626), а для следующего интервала от 6 до 10 лет является суммой раненых (частот) в возрасте от 1 до 5 лет (4626) и от 6 до 10 лет (9904), т. е. 14 530. И так до конца ряда.

Общая сумма накопленных частот равна обшей сумме час­тот, в нашем примере — общему числу раненых (183 926). Меди­ана в таком ряду определяется путем деления общей суммы (всех накопленных) частот на 2. В нашем примере: 183 926: 2 = 91 963. Следовательно, медианным интервалом в анализируемом ряду раненых будет интервал от 31 до 35 лет, который включает в себя эту частоту. До этого интервала сумма накопленных частот составила 89 954. Чтобы получить конкретное значение медиа­ны, надо к 89954 прибавить еще 2009 (91 963-89 954 = 2009).

При определении значения медианы предполагают, что зна­чение признака в интервале распределяется равномерно, т. е. число раненых (19 187), находящихся в интервале от 31 до 35 лет, распределяется равномерно между этими пятью годами. Если это предположение верно, то разнице между накопленными частотами 91 963 и 89 954, равной 2009, будет соответствовать следующая возрастная величина:

5 лет 2009

19 187

• = 0,524 года.

Прибавив полученную величину к минимальной границе медианного интервала (от 31 до 35 лет), мы получим искомое значение медианы: 31 год+ 0,524 года = (округленно) 31,5 года или 31 год и 6 месяцев. Эти логические рассуждения укладыва­ются в соответствующую формулу для расчета медианы в вари­ационном интервальном ряду:

Me = Х„ +1

.1/: 2-

/Me

где Me — медиана (в нашем примере для ряда раненых); Х0 — минимальная граница медианного интервала (31 год); /' — значение медианного интервала

(5 лет); If— сумма частот ряда или численность ряда (183 926), отсюда If: 1 — номер медианы (183 926 : 2 = 91 963); SXa — сумма накопленных частот, предше­ствующих медианному интервалу (89 954); /Ме — частота медианного интервала (19187).

Подставляя в эту формулу значения из нашего примера, по­лучаем:

, 19 1 87

Итак, медиана для ряда раненых равна 31 году и 6 месяцам, т. е. тому же значению, которое мы получили перед рассмотре­нием формулы на основе л огико- математических операций. Те­перь по этой же формуле рассчитаем медиану для погибших от ДТП:

Ме = 31+5-' =34-5-0,8 = 35. 4112

Следовательно, медианный интервал для погибших от ДТП тот же самый, что и для раненых (от 31 до 35 лет), но значение медианы внутри интервала для раненых составило 31 год и 6 ме­сяцев, а для погибших — 35 лет.

Рассмотренная формула расчета медианы (в отличие от фор­мулы расчета моды) применима для любого интервального ряда, как с равными, так и с неравными интервалами. Проверим это на данных погибших от ДТП, приведенных в табл. 7, где значе­ния интервалов различаются в 5 и более раз.

Me = 21 + 4

= 21 + 4 • 3,7 = 21 + 14,7 = 35,7 лет.

Медиана, рассчитанная для вариационного ряда с существен­но различающими интервалами, несколько отличается от ме­дианы, исчисленной для того же ряда, но с равными интерва­лами (35,0 и 35,7), и это объяснимо.

В практике мода и медиана иногда используются вместо сред­ней арифметической или вместе с ней. При использовании вме­сте они дополняют друг друга, особенно когда в совокупности небольшое число единиц с очень большим или очень малым зна­чениями исследуемого признака. В дополнение к средней ариф­метической желательно также исчислять моду и особенно меди­ану, которая в отличие от средней не зависит от крайних и ха­рактерных для совокупности значений признака. Медиану можно использовать в качестве приближенной средней арифмети­ческой тогда, когда совокупность ранжирована и упорядочена. В этом случае медиана определяется по срединному значению ва­рианты. В связи с этим значения других вариант можно и не из­мерять.

Кроме медианного деления вариационного ряда на две рав­ные части, в статистике употребляются и более дробные деле­ния: квартили, которые делят вариационный ряд по сумме час­тот на 4 равные части, децили — на 10 равных частей и центили — на 100 равных частей. Они могут использоваться для более выразительных и компактных описаний исследуемого явления; в юридической статистике практически не применяются.

.

Наши рекомендации