Глава 9. средние величины и их применение в юридической статистике
Понятие средних величин
Следующие обобщающие показатели после абсолютных и относительных данных — это средние величины и связанные с ними показатели вариации. Они имеют исключительное значение в экономическом анализе и играют важную роль в юридической статистике. Только с помощью средних можно охарактеризовать совокупности по количественному варьирующему признаку, по которому можно их сравнивать.
Предположим, нам необходимо сопоставить судебную практику назначения уголовных наказаний в двух районах, схожих по уровню и структуре преступности. Эту задачу нельзя решить на основе сравнения мер наказаний, назначенным конкретным осужденным, хотя какие-то суждения и можно высказать, если за одинаковые по квалификации деяния были назначены существенно различающиеся меры наказания. Нельзя этого сделать и на основе сопоставления большого количества данных о назначенных наказаниях. Но если мы сложим все сроки наказания (варианты, обозначив их символами дср х2, х3 и т. д.) и разделим на общее число осужденных (п), то по полученным средним данным можно сказать, какая практика назначения наказания в том и другом суде и сравнить ее на основе средних показателей. При обобщении наказаний, не связанных с лишением свободы, могут быть применены порядок, используемый при их сложении (ст. 71 УК РФ), и другие правила о которых говорилось при анализе индекса судимости.
В этом случае меры наказания, назначенные в том или ином суде, получают обобщенную характеристику в средних величинах, которые являются результатом абстрагирования от имеющихся индивидуальных различий, но с сохранением их основных свойств, в которых индивидуальные отклонения взаимопо-гашаются.
Таким образом, с помощью средних величин можно сравнивать интересующие нас совокупности юридически значимых явлений по тем или иным количественным признакам и делать из этих сравнений необходимые выводы не только о сроках наказания, но о возрасте правонарушителей (осужденных, заключенных), сроках расследования и рассмотрения уголовных и гражданских дел, о цене исков и т. д.
Средняя величина в статистике представляет собой обобщенную характеристику совокупности однородных явлений по какому-либо одному количественно варьирующему признаку. Она всегда обобщает количественную вариацию признака, к примеру, возраст правонарушителей от 14 до 60 лет, меры наказания от 1 месяца до 20 лет. Этот признак, хотя и в разной степени, но присущ всем единицам совокупности. Каждый правонарушитель имеет тот или иной возраст, а также каждый осужденный получил ту или иную меру наказания, измеряемого непосредственно в годах (баллах). Поэтому за всякой средней скрывается ряд распределения единиц совокупности по изучаемому признаку, т. е. вариационный ряд.
В связи с этим одно из важных условий расчета средних величин это качественная однородность единиц совокупности в отношении осредняемого признака. Средние величины, исчисленные для явлений разного типа, представляют собой фикцию. Они могут затушевывать и искажать различия разнородных совокупностей. Классическая иллюстрация в этом отношении у статистиков — вычисление среднего дохода для бедных и богатых, объединяемых в одной совокупности — народ. Глеб Успенский в очерке «Четверть лошади» приводит множество примеров, когда средние величины, рассчитанные на качественно разнородных единицах совокупности, серьезно искажают действительность: «Это все равно, ежели бы я взял миллионщика Колотушкина, у которого в кармане миллион, присоединил к нему просвирню Кукушкину, у которой грош, — так тогда в среднем выводе на каждого вышло по полумиллиону».
В подобных случаях средние величины рассчитываются по качественно однородным группам. Применительно к нашему примеру: средний доход для бедных и средний доход для богатых. Группировки статистических показателей, опирающиеся на научно обоснованные качественные группировочные признаки, играют в этом отношении незаменимую роль. Поэтому и практически, и теоретически в криминологии, социологии права и других юридических дисциплинах допустимы, главным образом, групповые средние, т. е. средние, вычисленные на основе адекватных статистических группировок.
При работе со средними, как общими, так и групповыми, не следует пренебрегать индивидуальными величинами. Средние показатели, основываясь на массовом обобщении фактов, отражают их типические уровни. Но за ними необходимо видеть конкретные сведения об изучаемом явлении, конкретные показатели работы и т. д. Не являясь типичными в количественном отношении, они могут быть таковыми на качественном уровне анализа, например, остатками уходящего прошлого, или ростками возможных будущих изменений. Научное применение средних в статистике должно опираться на диалектическое соотношение общего и индивидуального, массового и единичного.
Вернемся к нашему примеру среднего срока наказания, назначенного осужденным в течение года в том или ином районном суде. В принципе (исходя из однородной совокупности) осреднение срока наказания возможно только в отношении лиц, которым назначено было однородное наказание, в данном случае — лишение свободы. Осужденные, которым было вынесено наказание, не связанное с лишением свободы (ограничение свободы, штраф, исправительные работы, обязательные работы и т. д.), образуют иные однородные совокупности. Но у нас есть законодательное правило определения сроков наказаний, не связанных с лишением свободы, при их сложении (ст. 71 УК) и обоснованная практика расчета всех уголовных наказаний в баллах (годах лишения свободы). В этом случае расчет средних вполне допустим.
Обобщающие средние величины заметно отличаются от обобщающих относительных величин. В относительных величинах соотносимые совокупности не являются варьирующими признаками по отношению друг к другу. Например, в коэффициенте числа фактов на 100 тыс. населения число фактов (правонарушений, исков и т.д.) не является варьирующим признаком населения, как, скажем, возраст к числу правонарушителей. В связи с этим показатель интенсивности (5 тыс. преступлений на 100 тыс. населения) не означает, что каждый житель — правонарушитель, тогда как в среднем (средний возраст правонарушителей) каждый правонарушитель имеет тот или иной возраст.
Средние величины основываются на массовом обобщении фактов. Только при этом условии они способны выявить те или иные тенденции, лежащие в основе наблюдаемого явления. Средние величины отражают самую общую тенденцию (закономерность), присущую всей массе изучаемых явлений. Она проявляется в типичной количественной характеристике, т. е. в средней величине всех имеющихся (варьирующих) показателей. Вспомним размах колебаний (размах вариации) признака, величину отклонений всех вариант от средней и кривую нормального распределения (кривую Лапласа—Гаусса), которых мы касались для обоснования выборочного наблюдения на основе теории вероятностей и закона больших чисел. Последний выражает классическое свойство статистических закономерностей формироваться и отчетливо отражаться лишь в массовом процессе и при достаточно большом числе единиц совокупности.
Там мы установили, что средняя величина (f), от которой идет отсчет величины отклонений индивидуальных показателей в нормальном распределении по оси х, выполняет функцию теоретической вероятности (рис. 1).
В данном случае очевидно, что средняя в связи с взаимопогашением в ней случайных индивидуальных различий единиц совокупности отражает общую и типическую характеристику всей совокупности.
Виды средних величин
Средние статистические величины имеют несколько видов, но все они относятся к классу степенных средних, т. е. средних, построенных из различных степеней вариантов: средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая и т. д.
Общий вид формулы степенной средней таков:
При расчете различных степенных средних все основные показатели, на основе которых осуществляется этот расчет (х, я), остаются неизменными. Меняется только величина т и соответственно JC.
Если т = 2, то получается средняя квадратическая. Ее формула
Если т = 1, то получается средняя арифметическая. Ее формула
7 *арифм.
Если т = -1, то получается средняя гармоническая. Ее формула
*гармон.
Если т = О, то получается средняя геометрическая. Ее формула
,Х, Х2 • Х3: . .-Х„ .
Различные виды средних при одних и тех же исходных показателях (значении вариант х и их числе л) имеют в связи с разными значениями степени далеко не одинаковые численные значения. Рассмотрим их на конкретных примерах.
Предположим, что в поселке N в 1995 г. было зарегистрировано 3 автотранспортных преступления, а в 1996 г. — 6. В этом случае jc,=3, х2=6, a n (число вариант, лет) в обоих случаях равно 2.
При значении степени т = 2 получаем среднюю квадрати-ческую величину:
= ,/22j = 4,75.
1 получаем среднюю арифмети-
При значении степени т ческую величину:
•*арифм. ~~
При значении степени т = 0 получаем среднюю геометрическую величину:
При значении степени т = - 1 получаем среднюю гармоническую величину:
Произведенные расчеты показали, что разные средние образуют между собой следующую цепь неравенства:
Закономерность проста: чем меньше степень средней (2; 1; 0; - 1), тем меньше значение соответствующей средней. Таким образом, каждая средняя приведенного ряда мажорантна (мажор от фр. majeur — больший) в отношении средних, стоящих справа от нее. И это называется правилом мажорантное™ средних.
В приведенных упрощенных примерах значения вариант (х) не повторялись: значение 3 встречалось один раз и значение 6 -тоже. Статистические реалии более сложны. Значения вариантов могут повторяться по нескольку раз. Вспомним обоснование выборочного метода на основе экспериментального извлечения карточек, пронумерованных от 1 до 10. Некоторые номера карточек извлекались по 2, 3, 5, 8 раз. При расчете среднего возраста осужденных, среднего срока наказания, среднего срока расследования или рассмотрения уголовных дел одна и та же варианта (х), например возраст 20 лет или мера наказания 5 лет, может повторяться десятки и даже сотни раз, т. е. с той или иной частотой (/). В этом случае в общую и специальные формулы расчета средних вводится символ / — частота. Частоты при этом называют статистическими весами, или весами средней, а сама средняя называется взвешенной степенной средней. Это означает, что каждая варианта (возраст 25 лет) как бы взвешивается по частоте (40 человек), т. е. умножается на нее.
Итак, общая формула взвешенной степенной средней имеет вид:
где х — взвешенная средняя степени т; х — варианты (меняющиеся значения признака); т — показатель степени средней; Z — знак суммирования (сигма большая);/— частоты вариант.
Выбор обычной средней или взвешенной определяется статистическим материалом, а выбор вида степенной (арифметической, геометрической и т. д.) — целью исследования. Вспомним, когда рассчитывался среднегодовой прирост абсолютных показателей мы прибегали к средней арифметической, а когда исчисляли среднегодовые темпы прироста (снижения), то вынуждены были обращаться к средней геометрической, поскольку средняя арифметическая эту задачу выполнить не могла, так как приводила к ошибочным выводам.
В юридической статистике самое широкое применение находит средняя арифметическая. Она используется при оценке нагрузки оперативных работников, следователей, прокуроров, судей, адвокатов, других сотрудников юридических учреждений; расчете абсолютного прироста (снижения) преступности, уголовных и гражданских дел и других единиц измерения; обосновании выборочного наблюдения и т. д.
Средняя геометрическая величина используется при вычислении среднегодовых темпов прироста (снижения) юридически значимых явлений.
Средний квадратичный показатель (средний квадрат отклонения, средне квадратическое отклонение) играют важную роль при измерении связей между изучаемыми явлениями и их причинами, при обосновании корреляционной зависимости.
Некоторые из этих средних, широко применяемых в юридической статистике, а также мода и медиана будут более подробно рассмотрены в последующих параграфах. Средняя гармоническая, средняя кубическая, средняя прогрессивная (изобретение советского времени) в юридической статистике практически не применяются. Средняя гармоническая, например, которая в предыдущих учебниках по судебной статистике подробно излагалась на абстрактных примерах, оспаривается видными экономическими статистиками. Они считают среднюю гармоническую обратной величиной средней арифметической, и поэтому она, по их мнению, не имеет самостоятельного значения, хотя другие статистики видят в ней определенные преимущества . Не вникая в теоретические споры экономических статистиков, скажем, что средняя гармоническая нами подробно не излагается ввиду неприменения в юридическом анализе.
Кроме обычных и взвешенных степенных средних для характеристики среднего значения варианты в вариационном ряду могут быть взяты не расчетные, а описательные средние: мода (наиболее часто встречающаяся варианта) и медиана (срединная варианта в вариационном ряду). Они широко применяются в юридической статистике.
Средняя арифметическая
Средняя арифметическая — самый распространенный вид средней величины. Неслучайно, когда речь заходит о средней величине без указания ее вида, подразумевается именно средняя арифметическая. Она применяется в тех случаях, когда объем варьирующего признака для всей совокупности образуется как сумма значений признака у отдельных единиц совокупности. Ее расчет является наиболее простым: складывают величины всех вариантов и делят эту сумму на общее число единиц вариантов.
Предположим, что годовая нагрузка 15 судей городского суда, специализирующихся на рассмотрении гражданских дел различной направленности, составила: 17, 42, 47, 47, 50, 50, 50, 63, 68, 68, 75, 78, 80, 80, 85. Необходимо исчислить среднюю годовую нагрузку на одного судью (х - средняя арифметическая) в целях сравнения со средней общефедеральной и краевой (областной, республиканской). Для этого надо сложить значения всех индивидуальных нагрузок (которые обозначим: xv х2, хг ..., хп) и разделить на общее число судей («):
Хцрифн -
_ х1+х2+х3+...+х„
17 + 42 + 47+47
900 15
= 60.
Таким путем мы получили простую среднюю арифметическую величину. В рассматриваемом примере 15 вариант (15 индивидуальных нагрузок), но они имеют всего лишь 10 значений, так как у некоторых судей нагрузки были одинаковыми: 47 и 47; 50, 50 и 50; 68 и 68; 80 и 80. В этом случае исчислять среднюю арифметическую можно проще: перед суммированием вариант нужно умножить варианты (х,, хг х3, ...) на соответствующее число частот (/J, fv fy ...), затем полученные произведения сложить (!х/) и разделить на общее число судей (If). Нагляднее всего это можно сделать в таблице (табл. 1), в которой число судей распределяется по числу рассмотренных дел, что и представляет собой дискретный (от лат. discretus — прерывистый) вариационный ряд.
Таблица 1 Вычисление средней нагрузки судей (по формуле средней арифметической)
Число дел (варианта х) | Число судей (частота/) | Произведение вариант на частоты (xf) |
17 • 1 = 17 | ||
42 • 1 = 42 | ||
47 • 2 = 94 | ||
50 • 3 = 150 | ||
63 • 1 = 63 | ||
68 • 2 = 136 | ||
75 • 1 = 75 | ||
78 • 1 = 78 | ||
80 • 2 = 160 | ||
85 • 1 = 85 | ||
£х= 605 | £/= 15 | Ух = 900 |
Средняя арифметическая для дискретного вариационного ряда исчисляется по формуле средней арифметической взвешенной. Для нашего примера
Средняя арифметическая взвешенная не имеет принципиальных отличий от простой средней арифметической. В ней суммирование одного и того же значения заменено умножением этого значения на его частоту, т. е. в этом случае каждое значение (варианта) взвешивается по частоте встречаемости. Наш пример прост и технические выгоды от применения средней взвешенной не так очевидны. Но когда частоты исчисляются сотнями или тысячами, то применение средней взвешенной намного упрощает расчет.
При расчете простой средней арифметической часто вовсе не обязательно знать величину каждого индивидуального значения (варианты) или иметь в своем распоряжении построенный на основе этих вариант вариационный ряд. В официальной отчетности юридических учреждений, как правило, уже имеются многие суммарные величины. Это суммирование происходит последовательно в районах (городах), субъектах Федерации и в центре при сводке и группировке данных, полученных из документов первичного учета.
Открываем отчет о работе прокурора (Ф. П) за 1996 г. В разделе 4 (участие прокурора в рассмотрении гражданских и арбитражных дел в судах) в таблице Б (иски (заявления) прокурора) указано, что в 1996 г. прокурорами было предъявлено 170 882 иска на сумму 1 553 749 млн рублей. На основе этих обобщенных данных мы можем сразу рассчитать среднюю арифметическую сумму, приходящуюся на один предъявленный иск (имущественного и неимущественного характера):
Используя другие обобщенные данные, можно рассчитать, что средняя сумма по искам различных видов была:
- 16 270 728 руб. (в имущественных интересах граждан);
- 10 741 826 руб. (в имущественных интересах государства);
- 5 718 097 руб. (связанных с хищениями);
- 4 678 344 руб. (связанных с производственным травматизмом);
— 5 840 399 руб. (связанных с незаконными увольнениями); - 17 375 765 руб. (связанных с нарушениями законов об охране природы).
Расчет средней на основе обобщенных в отчетах данных возможен и тогда, когда каждое отдельное значение варианты вообще не фиксируется. Например, средняя урожайность на гектар может быть подсчитана путем деления валового сбора зерна на посевную площадь, хотя никто не подсчитывает урожай на каждом гектаре. Этим же способом можно подсчитать среднее число совершенных преступлений на 1 кв. километр или на 10 тыс., 100 тыс. жителей. Последний средний арифметический показатель смыкается с относительным показателем интенсивности преступности (коэффициентом преступности).
В связи с этим можно сказать, что между средними (особенно средней арифметической) и относительными величинами иногда не существует четких и однозначных границ. И те и другие являются обобщающими. Более того, любая средняя величина — это своеобразное отношение двух абсолютных величин, т. е. она одновременно представляет собой и определенную относительную величину (в нашем последнем примере — отношение общей суммы исков к их числу). С другой стороны, любая относительная величина дает своеобразную усредненную характеристику явления. Например, отношения динамики дают усредненную характеристику роста или снижения уровня изучаемого явления за анализируемые годы; отношения распределения — усредненный удельный вес какого-то показателя в структуре всех показателей и т. д. Однако при этом нельзя не видеть их статистически значимых различий, о которых говорилось в понятии о средних.
Некоторые особенности и трудности при расчете средней арифметической имеются для интервального ряда статистических показателей, т.е., когда индивидуальные численные значения (варианты) сгруппированы в интервалы (от — до). В юридической статистике интервальные ряды используются чаще, чем дискретные. Так учитываются сроки наказания, сроки следствия, сроки рассмотрения уголовных и гражданских дел, возраст правонарушителей и т. д.
В отчете Минюста РФ (Ф. 10) о числе привлеченных к уголовной ответственности и мерах уголовного наказания за 1996 г. меры наказания зафиксированы в виде интервального ряда. Попытаемся рассчитать средний срок лишения свободы на одного осужденного за умышленное убийство при отягчающих обстоятельствах (табл. 2).
Таблица 2 Вычисление срока наказания за умышленное убийство для интервального ряда
Сроки лишения свободы (х) | Число осужденных (/) | Середина интервалов (/) | Произведение середины интервалов и частоты {/?) |
До 1 года | 0,5 | ||
Свыше 1 года до 2 лет | 1,5 | 4,5 | |
Свыше 2 до 3 лет | 2,5 | ||
Свыше 3 до 5 лет | |||
Свыше 5 до 8 лет | 6,5 | ||
Свыше 8 до 10 лет | 11 331 | ||
Свыше 10 до 15 лет | 12,5 | 36 512,5 | |
J/= 4803 | Ifl= 51 559 |
Если бы ряд был дискретный, то расчет средней можно было бы произвести по формуле средней арифметической взвешенной. Но этого сделать нельзя, так как точные сроки наказания убийц неизвестны. Они обобщены в интервалах «от— до». Это можно сделать при одном условии, если допустить, что внутри каждой группы «от— до» сроки лишения свободы распределены равномерно и середина интервала — это среднее значение для данной группы. Середина интервала рассчитывается по формуле средней арифметической путем деления на 2 суммы двух границ интервала. К примеру:
8 лет + 10 лет 18 лет .
В действительности средняя арифметическая середины интервалов может и не отражать среднего значения сроков лишения свободы в том или ином интервале. Но другого выхода нет, так как отсутствует учет индивидуальных сроков лишения свободы в статистической отчетности судов. Поэтому условно приняв середину интервалов за среднее значение варианты каждой группы «от— до» (см. графу 3 табл. 2), мы можем рассчитать средний срок лишения свободы для убийц по формуле средней взвешенной:
При расчете средней арифметической для интервального ряда встречается и другая трудность, когда у первой группы может не быть нижней границы интервала (в нашем примере — до 1 года, а нижний предел не указан), у последней группы может, не быть верхней границы интервала (например, свыше 10 лет, а верхний предел также не указан). При таких неопределенных интервалах их границы либо устанавливают произвольно, либо определяют их на основе дополнительных изучений. В нашем примере можно обратиться к ст. 56 УК РФ, где установлен минимальный (шесть месяцев) и максимальный (20 лет) сроки лишения свободы.
Мы живем во время, когда компьютер становится неотъемлемым аппаратом любой аналитической деятельности. В этих условиях исчисление любых средних величин упрощается путем использования необходимых компьютерных программ. Тем не менее, мы подробно излагаем технику вычисления, полагая, что любой юрист (практик или ученый) должен понимать сущность производимых расчетов и уметь их произвести любым доступным способом. С целью упрощения таких расчетов можно использовать некоторые свойства средней арифметической, которые мы приводим без доказательств.
1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты, т. е. xLf= Ixf. В первом нашем примере: 60 дел • 15 судей = 900.
2. Если от каждой варианты отнять (или прибавить к ней) одно и то же число, то новая средняя уменьшится (или увеличится) на то же число. Это означает, что в целях упрощения расчетов можно уменьшить на произвольное число все варианты, рассчитать среднюю и, прибавив к ней то самое произвольное число, получить ее реальную величину.
3. Если каждую варианту разделить (или умножить) на какое-либо произвольное число, то средняя арифметическая уменьшится (или увеличится) во столько же раз. Это правило также можно использовать для облегчения расчетов средней арифметической.
4. Если все частоты (веса) разделить или умножить на какое-либо число, то средняя арифметическая от этого не изменится. Это обусловлено тем, что частоты при исчислении средней арифметической имеют значение веса не как абсолютные данные, а как удельные веса вариант в вариационном ряду. Поэтому и при увеличении, и при уменьшении в одинаковой степени их доли в вариационном ряду не меняются.
5. Сумма отклонений вариант от средней арифметической всегда равна нулю. Иначе это свойство формулируется следующим образом: сумма положительных отклонений от средней равна сумме отрицательных отклонений, т. е. в средней арифметической и положительные, и отрицательные отклонения от нее взаимопогашаются. Вспомним кривую Лапласа—Гаусса, кривую нормального распределения данных около средней.
6. Общая средняя равна средней из частных средних, взвешенной по численности соответствующих частей совокупности. Если известно, что среднее число уголовных дел, приходящихся на одного следователя в год в одном субъекте Федерации, равно 68, в другом — 72, в третьем — 74, причем в первом числится 180 следователей, во втором — 160, а в третьем — 150, то общую среднюю для региона можно подсчитать таким образом:
_ 68-180 + 72-160 + 74 150 180 + 160 + 150
• = 71,1 дел.
Средняя геометрическая
При рассмотрении относительных величин динамики мы уже обращались к средней геометрической величине. В настоящем параграфе дается ее системное понимание и исчисление на примерах той же динамики, поскольку именно при анализе рядов динамики средняя геометрическая находит широкое применение в юридической статистике. Рассматриваемая величина используется для вычисления средних темпов роста и прироста (снижения) наблюдаемых явлений. Изучение этих параметров в динамике преступности, выявленных правонарушителей, раскрываемости, судимости, общего числа заключенных, оправданных, освобожденных от уголовной ответственности, рассмотренных гражданских дел, удовлетворенных и неудовлетворенных исков и других меняющихся во времени юридически значимых явлений и процессов имеет важное практическое и научное значение.
Динамика юридически значимых явлений характеризуется многими показателями, в том числе и средними арифметическими и геометрическими. Средние арифметические показатели применяются для расчета среднегодового абсолютного прироста (снижения), выраженного в именованных числах. Они важны, но недостаточны, особенно в сравнительных целях, для достижения которых большую помощь оказывают темпы роста, прироста и снижения, выраженные в процентах. Расчет этих параметров производится по формуле средней геометрической, но на основе тех же абсолютных показателей. Обратимся к табл. 3, в которой приведены и абсолютные, и относительные величины динамики.
Сопоставление полученного усредненного показателя с реальными годовыми абсолютными приростами (строка 2 табл. 3) показывает, что в течение пятилетия прирост был очень неравномерным. В уголовной статистике редко встречаются тенденции, когда уровень преступности или ее отдельных видов изменяется по законам, близким к геометрической прогрессии, т. е. когда
Таблица 3
Динамика взяточничества в России (1991—1996 гг.)
Показатели | ||||||
Абсолютные показатели (1) учтенных деяний | ||||||
Абсолютный годовой (2) прирост | — | +797 | + 1166 | +392 | + 32 | +532 |
Темпы роста к 1991 г.: (3) в процентах (4) в коэффициентах | 100,0 1,0 | 131,5 1,315 | 177,5 1,775 | 192,9 1,929 | 194,2 1,942 | 215,2 2,152 |
Темпы роста цепные: (5) в процентах (6) в коэффициентах | 100,0 1,0 | 131,5 1,315 | 135,0 1,350 | 108,7 1,087 | 100,7 1,007 | 110,8 1,108 |
Годовые темпы роста (7) в процентах | — | 31,5 | 35,0 | *,7 | 0,7 | 10,8 |
Абсолютное значение 1% | ||||||
прироста (8) в единицах | 25,3 | 33,3 | 45,1 | 45,7 | 49,3 |
каждый последующий уровень ряда примерно равен предыдущему, умноженному на некоторое постоянное число, называемое в математике знаменателем прогрессии. Поэтому в чистом виде геометрическая прогрессия в динамике юридически значимых явлений наблюдается крайне редко.
При всей неравномерности общий абсолютный прирост взяточничества за 5 лет (не считая базового 1991 г.) составил: 5453-2534= = 797 + 1166 + 392 + 32 + 532 = 2919 случаев учтенного взяточничества. Он представляет собой разность значений 1996 и 1991 г., или сумму ежегодных приростов зарегистрированных случаев взяточничества. Отсюда средний годовой абсолютный прирост определяется как средняя арифметическая величина из суммы ежегодных приростов путем ее деления на число лет (без учета базового года):
*арифм —;— = 583,8 случаев взяточничества.
В табл. 3 (строка 7) приводятся погодовые темпы прироста учтенного взяточничества, выраженные в процентах: 31,5; 35,0; 8,7; 0,7; 10,8, которые соотносятся с абсолютными годовыми приростами. Но на их основе нельзя рассчитать среднегодовые темпы общего прироста (в %) по правилам средней арифметической, т. е. путем деления их суммы (86,7%) на 5. Полученное среднее арифметическое частное (17,34%) неоправданно завысит реальный среднегодовой прирост. Поэтому он рассчитывается по правилам средней геометрической на основе цепных темпов роста (строки 5 и 6 табл. 3), выраженных в процентах или коэффициентах:
где х.
геом - V -Ч 2 3 • •
средняя геометрическая; х., х., х,,
хп — годовые темпы роста;
п — число лет в периоде, за который исчисляется средняя геометрическая, не считая базового года.
Подставим данные из таблицы (строка 6) в указанную формулу расчета среднегодовых темпов прироста, выраженных в коэффициентах:
хгеом. = ^/1,315 1,350 1,087 1,007 1,108 = ^2,153 = 1,166 или 116,6%. Это и будет среднегодовой темп роста взяточничества. Откуда среднегодовой темп прироста этого деяния будет равен 16,6% (116,6 - 100,0). Полученный средний геометрический показатель (16,6%) по правилам мажорантности средних заметно меньше среднего арифметического (17,34%).
Использование произведения годовых темпов роста для расчета среднегодовых темпов роста и прироста имеет серьезные недостатки. Данный прием пригоден для расчета названных показателей только тогда, когда все годовые (цепные) темпы роста, если и не изменяются по возрастающей, но являются положительными числами. Достаточно хоть одного значения, равного нулю, как все произведение становится равным нулю. Серьезные трудности появляются и тогда, когда годовые показатели в какие-то годы не росли, а снижались, что встречается очень часто. В этом случае произведение годовых (цепных) темпов роста не будет равно общему темпу роста. Поэтому, если позволяют исходные данные, лучше обращаться к иной формуле расчета средней геометрической, которая строится на данных общего темпа роста за весь период наблюдения независимо от годовых колебаний.
Темпы роста за весь период могут быть получены не только путем перемножения годовых темпов роста (в нашем примере за 5 лет, не считая данных 1991 г.), выраженных в коэффициентах— 1,315-1,350-1,087-1,007-1,108 = 2,153, или процентах -215,3%, но и через известные отношения динамики. Полученные значения по сути своей являются не чем иным, как темпом роста абсолютных показателей взяточничества за весь период к базовому 1991 г, (последняя графа строк 3 и 4 табл. 3). Если взять отношение абсолютных показателей взяточничества за 1996 г. (5453) к данным 1991 г. (2534) в процентах, то мы получим практически те же самые значения — 215,2%, или 2,152 (коэффициент). Разница в 0,1%, или 0,001 коэффициента, между результатами первого и второго исчислений общих темпов роста обусловлена неизбежным округлением чисел при расчете годовых темпов роста при их перемножении, тогда как при расчете отношения динамики абсолютных показателей последнего года к данным базисного года таких округлений нет.
С учетом сказанного, средний геометрический показатель в данном случае может быть получен на основе следующей формулы:
где УП — абсолютный уровень конечного (л-го) года; У6 — абсолютный уровень базового года; л — число лет (без учета базового года).
Подставляя в эту формулу числа из нашего примера, получаем искомый результат:
= 5.
= 3/2,152 = 1,166, или 116,6%.
Таким образом, и в этом случае среднегодовой темп прироста оказался равным 16,6%.
Извлечение корня более чем второй степени (а средние темпы роста и прироста юридически значимых показателей приходится рассчитывать за 50 и более лет) требует сложных вычислений, особенно тогда, когда эта процедура производится не на ЭВМ. В этом случае можно пользоваться свойствами логарифмов (lg):
Обозначения символов прежние.
Наконец, есть более простой вариант расчета средней геометрической: использовать расчетные таблицы, подготовленные статистиками'. Таблицы, разработанные A.M. Айрапетовым, например, позволяют получить показатели среднегодовых темпов роста за период от 2 до 55 лет и темпов снижения за период от 2 до 22 лет, если известны соответствующие исходные показатели.
Таблицы построены таким образом, что искомые среднегодовые темпы роста, прироста или снижения находятся в крайних левых колонках, а исходные показатели — справа (табл. 4).
Таблица 4
Таблица (фрагмент) среднегодовых темпов роста, прироста, %
Средний годовой темп | Темпы роста | ||||
роста | прироста | за 2 года | за 3 года | за 4 года | за 5 лет |
116,50 | 16,50 | 135,72 | 158,12 | 184,21 | 214,60 |
116,55 | 16,55 | 135,84 | 158,32 | 184,51 | 215,06 |
116,60 | 16,60 | 135,96 | 158,52 | 184,84 | 215,52 |
116,65 | 16,65 | 136,07 | 158,73 | 185,16 | 215,99 |
116,70 | 16,70 | 136,19 | 158,90 | 185,47 | 216,45 |
Обратимся к нашему примеру. За 1991-1996 гг. учтенное взяточничество увеличилось до 215,2% (графа последняя, строка 3 табл. 3). Этот рост произошел за 5 лет (так как 1991 г. взят за базу и его прирост в данных 1996 г. не представлен). В приведенном фрагменте табл. 4 в последней графе «за 5 лет» находим темп роста, равный (или близкий по значению) нашему 215,2—215,3. Ближе всего к нашим данным стоит показатель 215,52. В первой графе на этой же строке указан средний годовой темп роста — 116,60%, а во второй графе этой же строки — среднегодовой темп прироста 16,60% (оба показателя набраны полужирным шрифтом). Это и есть искомые результаты. Аналогичным образом находятся и средние темпы снижения.
Таким образом, для того чтобы рассчитать среднегодовые темпы роста и прироста, необходимы абсолютные показатели первого (базового) и последнего годов, на основе которых рассчитывается относительная величина динамики в процентах, и количество лет (без учета базового года). В статистических сборниках и официальной отчетности, как правило, уже имеются подсчитанные общие итоги и даже проценты роста или снижения наблюдаемого явления. На основе их и числа лет мы легко можем найти искомые среднегодовые темпы роста и прироста интересующих нас явлений.
Мода и медиана
Средняя арифметическая, средняя геометрическая и другие средние — это своеобразная статистическая абстракция, поскольку они, отвлекаясь от истинных величин, отражают то общее, которое присуще всей совокупности изучаемых единиц в целом. Величина средних часто выражается дробными числами (22,6 правонарушителей, 105,8 исков и т. д.), которых в жизни не бывает. Наряду с абстрактными средними в статистике используются конкретные средние, величины которых занимают в ранжированном вариационном ряду, построенном в порядке возрастания или убывания значений вариант, определенное среднее положение. К таким средним относятся мода и медиана. В одних и тех же совокупностях мода и медиана иногда совпадают между собой по значению, но чаше не совпадают, хотя друг от друга отстоят, как правило, недалеко.
Таблица 5
Распределение уголовных дел по срокам рассмотрения
Сроки рассмотрения в судебном заседании, | Число уголовных |
дни | дел |
3 Мо | |
4 Me | |
Всего 400 |
Модой в статистике называется значение признака (варианта), которое чаше всего встречается в данной совокупности. Обозначим ее символом «Мо» и определим в вариационном ряду юридически значимых показателей (табл. 5).
Модой в данном примере будет варианта 3 дня, так как за этот срок было рассмотрено дел больше (85), чем за другие сроки.
В реальной жизни могут быть распределения, где все варианты встречаются примерно одинаково часто. В таких случаях мода не определяется, так как она практически отсутствует. В
других распределениях мода может быть не одна. Изменим наш пример. Предположим, что за 5 дней было рассмотрено столько же дел (85), как и за 3 дня. В этом случае две моды, а само распределение будет называться бимодальным. Оно, как правило, свидетельствует о качественной неоднородности совокупности по изучаемому признаку.
Мода применяется в тех изучениях, когда нужно охарактеризовать наиболее часто встречающуюся величину признака.
Определение моды для интервального ряда несколько сложнее. Рассмотрим это на примере табл. 6.
Чтобы найти моду, надо определить модальный интервал данных рядов. Из таблицы видно, что наибольшая частота по числу раненых (23 917) соответствует интервалу от 21 до 25 лет, а по числу погибших (4112) -- интервалу от 31 до 35 лет (в этих обоих случаях мода набрана полужирным шрифтом). Названные интервалы и будут модальными.
Для расчета более точных значений модальных признаков, заключенных в этих интервалах, используют следующую формулу:
= ° '77-----7Y7J7-----М '
(/Mo-/l) + (/Mo-/2)
где Мо — мода; Х0 — минимальная граница модального интервала (в нашем примере это 21 — по раненым и 31 — по погибшим); /' — значение модального интервала
Таблица 6
Распределение числа пострадавших в ДТП по возрасту в 1995 г. (при разукрупнении некоторых интервалов данные рассчитывались)
Возраст жертв «от— до», лет | Число раненых | Кумулятивные частоты | Число погибших | Кумулятивные частоты |
1-5 | ||||
6-10 | ||||
11-15 | 10 274 | 24 804 | 2262 Мг | |
16-20 | 22 334 | 47 138 | ||
21-25 | 71 055 | |||
26-30 | 18 899 | 13 157 | ||
31-35 | 19 187 | 109 141 | ||
36-40 | 19 186 | 128 327 | 20 537 | |
41-45 | 13 000 | 141 327 | ||
46-50 | 11 000 | 152 327 | ||
51-55 | 161 327 | 27 337 | ||
56-60 | 168 327 | 29 137 | ||
61-65 | 173 321 | |||
Более 65 | 183 926 | |||
£/= 183 926 | £/= 32 791 |
(в нашем примере 5 лет); fMo — частота модального интервала (23 917 — по раненым и 4112 — по погибшим);/, — частота интервала, предшествующего модальному (в нашем примере 22 334 — по раненым и 3675 —- по погибшим);^ — частота интервала, следующего за модальным (18 899 — по раненым и 4110 — по погибшим).
Подставляя числовые значения, получаем:
23917-22 334
Мо (ран.) = 21+5
(23917-22 334)+ (23 917-18 899) = 21 + 5 • 0,24 = 21 +1,2 = 22,2 года.
= 21+5
1583 6601
Таким образом, мода для раненых равна 22 года и 2 месяца.
4112-3675 . 437
= 31+5- 0,995 = 31+ 4,97 = 35,97 года.
Мода для погибших оказалась равной 35 лет 11 месяцев. Ее значение расположено на крайней отметке максимальной границы модального интервала. Это неслучайно. Следующий за модальным интервал (36—40 лет) имел варианту (4110), т.е. всего на 2 единицы меньше моды (4112).
Формула, используемая для нахождения модальной величины в модальном интервале, пригодна лишь для вариационных рядов с равными интервалами. В нашем примере мы путем некоторых среднеарифметических расчетов сделали их пятилетними. В реальной статистической отчетности ГАИ МВД РФ возрастные интервалы являются неравными. Для наглядности приведем фактическую таблицу распределения числа жертв ДТП по возрасту за тот же 1995 г., которая опубликована в официальном сбор*-нике (табл. 7).
Таблица 7 Распределение числя пострадавших в ДТП по возрасту в 1995 г.
Возраст жертв «от— до», лет | Число раненых | Кумулятивные частоты | Число погибших | Кумулятивные частоты |
1-7 | ||||
7-10 | ||||
11-15 | ||||
16-20 | 47 138 | |||
21-25 | 71 055 | |||
26-30 | 18 899 | |||
31-40 | 38 373 | 128 327 | ||
41-65 | 44 994 | 173 321 | ||
Более 65 | 183 926 | |||
2/=183926 | 5/=32 791 |
Вариационный ряд в данном случае является не только неравноинтервальным, но и статистически порочным, так как различия в интервалах так велики, что серьезно искажают реальную статистическую картину. От 11 до 30 лет интервал пятилетний (11-15; 16-20; 21-25; 26-30), от 7 до 10 лет — четырехлетний, от 1 до 7 — семилетний, от 31 до 40 лет — десятилетний и
от 41 до 65 лет — двадцатипятилетний. Согласно этой таблице (если пренебречь различием интервалов) модальным должен быть определен интервал от 41 до 65 лет, но он в 5 и более раз протяженнее остальных интервалов и его модальность — результат непрофессионально разработанной статистической отчетности.
Медианой в статистике называется варианта, которая находится в середине ранжированного ряда. Медиана делит упорядоченный ряд пополам. По обе стороны от нее находится одинаковое число единиц совокупности. Медиана обычно обозначается символом «Me». Упрощенным и условным примером нахождения медианы может служить вариационный ряд осужденных по возрасту.
Таблица 8 Распределение осужденных по возрасту (14—26 лет)
Возраст | 20 21 | 25 26 | |||||||||
Число осужденных | 150 160 Me | 175 Mo | 140 132 |
Медианой в этом дискретном ряду будет варианта «20 лет» с частотой 150 осужденных. По обе стороны от нее находится равное число единиц совокупности. Модой в этом ряду является варианта «22 года» с наибольшей частотой -- 175 осужденных. Если мы обратимся к таблице 5, то там медиана -- это срок рассмотрения дела в 4 дня с числом рассмотренных дел 80, а мода — срок в 3 дня и частотой 85 дел.
Если всем единицам любого ранжированного ряда придать порядковые номера, то номер медианы в ряду с нечетным чис-
п + 1 _
лом членов п определяется как -у-. В наших примерах: в первом
13 +1
случае (табл. 8), когда в ряду 13 членов, Me
• = 7, а во втором
7 + 1
случае (табл. 5) Me = —— = 4 . В последнем примере число членов в
ряду четное. Медианой будет средняя из двух центральных вариант, порядковые номера которых я:2 и я:2 + 1. Например, если в ряду 20 единиц, то в центре стоят единицы с порядковым номером 10 и 11. Средняя из двух величин определяется по формуле средней арифметической. В подобных случаях в качестве медианы можно определить и одну варианту, если единиц в совокупности много и различия между ними незначительные.
В интервальном ранжированном ряду медиана, как и при нахождении моды, определяется вначале в виде медианного интервала, а затем в нем находится медиана по соответствующей формуле. Медианный интервал определяется по кумулятивным (накопленным) частотам, которые являются последовательной суммой предыдущих частот, начиная с интервала с меньшим значением признака. Кумулятивная частота для раненых (табл. 6) складывалась таким образом: для интервала от 1 до 5 лет она равна числу раненых этого возраста (4626), а для следующего интервала от 6 до 10 лет является суммой раненых (частот) в возрасте от 1 до 5 лет (4626) и от 6 до 10 лет (9904), т. е. 14 530. И так до конца ряда.
Общая сумма накопленных частот равна обшей сумме частот, в нашем примере — общему числу раненых (183 926). Медиана в таком ряду определяется путем деления общей суммы (всех накопленных) частот на 2. В нашем примере: 183 926: 2 = 91 963. Следовательно, медианным интервалом в анализируемом ряду раненых будет интервал от 31 до 35 лет, который включает в себя эту частоту. До этого интервала сумма накопленных частот составила 89 954. Чтобы получить конкретное значение медианы, надо к 89954 прибавить еще 2009 (91 963-89 954 = 2009).
При определении значения медианы предполагают, что значение признака в интервале распределяется равномерно, т. е. число раненых (19 187), находящихся в интервале от 31 до 35 лет, распределяется равномерно между этими пятью годами. Если это предположение верно, то разнице между накопленными частотами 91 963 и 89 954, равной 2009, будет соответствовать следующая возрастная величина:
5 лет 2009
19 187
• = 0,524 года.
Прибавив полученную величину к минимальной границе медианного интервала (от 31 до 35 лет), мы получим искомое значение медианы: 31 год+ 0,524 года = (округленно) 31,5 года или 31 год и 6 месяцев. Эти логические рассуждения укладываются в соответствующую формулу для расчета медианы в вариационном интервальном ряду:
Me = Х„ +1
.1/: 2-
/Me
где Me — медиана (в нашем примере для ряда раненых); Х0 — минимальная граница медианного интервала (31 год); /' — значение медианного интервала
(5 лет); If— сумма частот ряда или численность ряда (183 926), отсюда If: 1 — номер медианы (183 926 : 2 = 91 963); SXa — сумма накопленных частот, предшествующих медианному интервалу (89 954); /Ме — частота медианного интервала (19187).
Подставляя в эту формулу значения из нашего примера, получаем:
, 19 1 87
Итак, медиана для ряда раненых равна 31 году и 6 месяцам, т. е. тому же значению, которое мы получили перед рассмотрением формулы на основе л огико- математических операций. Теперь по этой же формуле рассчитаем медиану для погибших от ДТП:
Ме = 31+5-' =34-5-0,8 = 35. 4112
Следовательно, медианный интервал для погибших от ДТП тот же самый, что и для раненых (от 31 до 35 лет), но значение медианы внутри интервала для раненых составило 31 год и 6 месяцев, а для погибших — 35 лет.
Рассмотренная формула расчета медианы (в отличие от формулы расчета моды) применима для любого интервального ряда, как с равными, так и с неравными интервалами. Проверим это на данных погибших от ДТП, приведенных в табл. 7, где значения интервалов различаются в 5 и более раз.
Me = 21 + 4
= 21 + 4 • 3,7 = 21 + 14,7 = 35,7 лет.
Медиана, рассчитанная для вариационного ряда с существенно различающими интервалами, несколько отличается от медианы, исчисленной для того же ряда, но с равными интервалами (35,0 и 35,7), и это объяснимо.
В практике мода и медиана иногда используются вместо средней арифметической или вместе с ней. При использовании вместе они дополняют друг друга, особенно когда в совокупности небольшое число единиц с очень большим или очень малым значениями исследуемого признака. В дополнение к средней арифметической желательно также исчислять моду и особенно медиану, которая в отличие от средней не зависит от крайних и характерных для совокупности значений признака. Медиану можно использовать в качестве приближенной средней арифметической тогда, когда совокупность ранжирована и упорядочена. В этом случае медиана определяется по срединному значению варианты. В связи с этим значения других вариант можно и не измерять.
Кроме медианного деления вариационного ряда на две равные части, в статистике употребляются и более дробные деления: квартили, которые делят вариационный ряд по сумме частот на 4 равные части, децили — на 10 равных частей и центили — на 100 равных частей. Они могут использоваться для более выразительных и компактных описаний исследуемого явления; в юридической статистике практически не применяются.
.