ТЕМА 5. Средние величины в правовой статистике.
1. Понятие средней величины.
Средние величины и связанные с ними показатели вариации играют важную роль в правовой статистике. Средние показатели, характеризующие всю совокупность явлений, позволяют выявитьзакономерности, присущие массовым социально-правовым явлениям, выявить характерные, типичные уровни изучаемых явлений и их изменения во времени и пространстве. Только на основе средних как обобщающих характеристик можно проводить сравнение различных совокупностей по количественному варьирующему (изменяющемуся) признаку, проводить на основе этих сравнений анализ сроков наказания, возраста правонарушителей, сроках расследования и рассмотрения уголовных и гражданских дел и т.д.
Средняя величина в правовой статистике – это обобщенный показатель, характеризующий типичный уровень количественно варьирующих признаков (числа судимостей, возраста и т.д.) явленияв конкретных условиях места и времени. Средняя величина представляет собой именованную величину и выражается в тех же единицах измерения, что и признаки у отдельных единиц совокупности (например, размерностью при расчете среднего возраста осужденных будут годы).
Средняя величина отражает обобщенное, типичное для конкретной совокупности значение признака, присущее всем единицам совокупности, погашая при этом различия отдельных единиц. При вычислении средних в силу действия закона больших чисел количественные значения признака каждой конкретной единицы совокупности уравновешиваются, позволяя абстрагироваться от случайности отдельных значений и несущественных особенностей явления.
Для того чтобы средняя величина отражала основные и действительно типические черты изучаемой совокупности, она должна рассчитываться для совокупности, состоящей из достаточно большого числа единиц, так как только в этом случае согласно закону больших чисел случайные индивидуальные различия между отдельными единицами совокупности будут нивелироваться. Расчет средних показателей для небольшой группы данных может привести к ошибочным выводам, поскольку такие средние будут отражать значительное влияние индивидуальных особенностей, не характерных для изучаемой совокупности в целом.
Основное условие расчета средних величин – это качественная однородность единиц совокупности в отношении усредняемого признака, иначе средний показатель не будет действительно типизирующим. Средние, рассчитанные для неоднородных совокупностей,т.е. для явлений разного типа, будут искажать различия неоднородных совокупностей или будут бессмысленными. Так, если рассчитать средний срок лишения свободы заключенных какого-либо исправительного учреждения, то получится фиктивный показатель,так как его вычисление произведено на основе разнородной совокупности, включающей в себя преступников, осужденных за различные категории преступлений (и за убийство, и за хулиганство ит.д.). В подобных случаях метод средних используется в сочетании с методом группировок. Группировки статистических показателей на основе качественных группировочных признаков позволяют выделить однородные группы, по которым и рассчитываются типические групповые средние.
Однако в социально-правовом анализе нельзя ограничиваться только средними показателями. Наряду со средними показателями, как общими, так и групповыми, необходимо учитывать индивидуальные особенности отдельных единиц совокупности. Так, например, за общими средними могут скрываться и серьезные недостатки в деятельности отдельных правоохранительных органов и новыепрогрессивные формы борьбы с преступностью.
Расчет средних величин должен основываться на анализе социального содержания исследуемых показателей. Каждая средняя характеризует изучаемую совокупность по какому-либо одному признаку, поэтому для изучения социально-правовых явлений, выявления их типических черт и качественных особенностей, как правило, применяют систему средних показателей. Так, например, показатели средней заработной платы следователей должны анализироваться совместно с показателями средней следственной нагрузки на одного оперативного работника, средних сроков расследования и т.д.
3. Виды средних величин.
В статистике используют различные виды средних величин, которые делятся на два больших класса:
• степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
• структурные средние (мода, медиана).
Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.
Самый распространенный вид средней величины – средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй – 7, третий – 4, четвертый – 10, пятый– 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для опреде-
ления средней выработки одного рабочего следует применить формулу простой средней арифметической:
т. е. в нашем примере средняя выработка одного рабочего равна
Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек, возраст которых варьируется от 18 до 22 лет, где xi – варианты осредняемого признака, fi – частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).
Таблица 5.1
Средний возраст студентов
Применяя формулу средней арифметической взвешенной, получаем:
Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить
среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.
В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины – средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.
Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:
где xi – отдельные варианты; n – число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.
Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.
Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.
Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения
их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.
Таблица 5.2
Виды степенных средних
Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле
Формула средней геометрической взвешенной имеет следующий вид:
Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая – при абсолютных значениях уровней ряда.
Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле
Средняя квадратическая взвешенная рассчитывается по другой формуле:
Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле
средняя кубическая взвешенная:
Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:
где – средняя величина; – индивидуальное значение; n – число единиц изучаемой совокупности; k – показатель степени, определяющий вид средней.
При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:
Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние – мода (Мо) и медиана (Ме).
Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле
где х0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; fm_1 – частота предшествующего интервала; fm+1 – частота следующего интервала.
Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.
Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.
При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле
где X0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; f– число членов ряда;
?m-1 – сумма накопленных членов ряда, предшествующих данному.
Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили – на 10 равных частей. Квартилей насчитывается три, а децилей – девять.
Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.
4. Показатель вариации.
Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом,вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.
Для измерения вариации в статистике применяют несколько способов.
Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (Xmax) и минимальным (Xmin) наблюдаемыми значениями признака:
H=Xmax - Xmin.
Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.
Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа - среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:
При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:
Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики.