Группировка предприятий по числу рабочих, чел
Группировка предприятий по числу рабочих, чел. | Число предприятий | Сумма накопления частот |
100-200 | ||
200-300 | 4(1+3) | |
300-400 | 11 (4 + 7) | |
400-500 | 41 (11 +30) | |
500-600 | - | |
600-700 | - | |
700-800 | - | |
Итого | - |
Определим медианный интервал. Он соответствует интервалу 400 - 500, так как сумма накопленных частот (41) превышает половину всех значений (80).
Значит: ХMe = 400; iме = 100; Σf= 80; SMe-1 = 11; fMe = 30,
Отсюда
Средние величины не являются безукоризненной характеристикой изучаемых совокупностей. За ними скрывается колеблемость, вариация индивидуальных значений вокруг средней. Вариацией признаков называется различие численных значений у отдельных единиц совокупности.
В одних случаях отдельные значения признака могут незначительно отличаться друг от друга и от средней; в других, наоборот, - эти различия значительны.Для характеристики размера вариации используются специальные показатели колеблемости: I) размах вариации (R); 2) среднее линейное отклонение (d); 3) средний квадрат отклонения (дисперсия ); 4) среднее квадратическое отклонение ( ); 5) коэффициент вариации (V).
Показатели d, , , как и средние величины, могут быть простыми и взвешенными, чем меньше d и , тем однороднее совокупность.
Размах вариации (R) - величина разности между максимальным и минимальным значениями признака (R = Хmах - Хmin).
Если, например, изучаются лица, совершившие хулиганство, а в их совокупности самому старшему правонарушителю 36 лет и самому младшему 16 лет, то размах вариации возрастного признака в этом случае составит 20 лет. Если при изучении лиц, совершивших убийство, аналогичные показатели будут 65 и 15 лет, то размах вариации составит 50 лет. Естественно, что в первом случае изучаемая совокупность более однородна по возрасту, хотя вовсе не исключено, что и в том и в другом случае средний возраст преступников будет одинаков. Однако этот показатель (средний возраст) в первом случае более точно характеризует изучаемую совокупность преступников.
Среднее линейное отклонение (d)- средняя арифметическая из абсолютных отклонений индивидуальных значений признака от среднего значения.
Формула среднего линейного отклонения такова:
Для первичного ряда для ряда распределения - (прямые скобки означают, что разности в числителе берутся по модулю, то есть суммирование ведется без учета знаков). Среднее линейное отклонение показывает, насколько в среднем отличаются индивидуальные значения признака от среднего их значения.
Из данных уголовно-правовой статистики известна колеблемость, например, убийств, причинении вреда здоровью, хулиганств и других преступлений, совершенных в разных регионах в состоянии опьянения или с применением оружия. Аналогичные колебания отмечаются в показателях мотивов совершения этих преступлений и т.д. Такие различия должны учитываться при выяснении причин и условий, способствующих совершению этих преступлений. Особенно важно выявить колеблемость, изменяемость отдельных величин, из которых вычислены средние, при одинаковости или близости этих средних для нескольких совокупностей.
В известной мере помощь в этом деле может оказать специальный показатель — среднее квадратическое отклонение. Он служит наилучшей мерой колеблемости вариантов, из которых выводится средняя, наилучшим способом проверки однородности совокупности.
Среднее квадратическое отклонение ( - сигма) равно квадратному корню из среднего квадрата отклонений индивидуальных значений признака от средней арифметической, т. е. его формула следующая:
для первичного ряда ; для ряда распределения-
Среднее квадратическое отклонение также как и среднее линейное показывает насколько в среднем отличаются индивидуальные значения признака от среднего значения. По величине среднее квадратическое отклонение превышает среднее линейное. В статистике для измерения вариации используют среднее квадратическое отклонение. Размах колебаний, среднее линейное отклонение и среднее квадратическое отклонение выражают в именованных числах, в которых выражены значения признака, то есть характеризуют абсолютную меру вариации.
Возьмем следующие два ряда цифр о сроках лишения свободы в годах: 1, 4, 6, 9, 15 и 4, 6, 7, 8, 10.
I ряд (годы): 1, 4, 6, 9, 15. Средняя арифметическая = 7 лет.
Отклонения от средней (х - ) равны соответственно - 6; - 3; -1;+2;+8.
Квадраты отклонений (х - )2 равны соответственно 9;1;0;1;9 тогда
II ряд (годы): 4, 6, 7, 8, 10. Средняя арифметическая = 7 лет. Отклонения от средней (х - ) равны соответственно - 3; - 1;0;+1;+3.
Квадраты отклонений (х - )2 равны соответственно 9; 1; 0; 1; 9. тогда
Из этого видно, что среднеквадратическое отклонение в первом ряду в 2,5 раза больше, чем во втором, т.е. колеблемость (пестрота, дисперсия) второго ряда в 2,25 раза меньше, чем первого.
Квадрат среднего квадратического отклонения дает величину дисперсии, на которой основаны практически все методы математической статистики. В ее арсенале есть и другие меры вариации, которые, однако, выходят за пределы курса правовой статистики. В ней они не находят широкого практического применения.
Возводим в квадрат и получаем сумму квадратов отклонений: 4+1+1+4=10.
Результат делим на число членов ряда 10:5=2. Из полученного среднего квадрата извлекаем корень
Формула среднеквадратического отклонения выражается:
где: — среднеквадратическое отклонение; —величина варианта ряда; x—среднеарифметическая ряда; — знак, обозначающий сумму; n—число вариантов ряда.
Среднеквадратическое отклонение выражается в тех же единицах, что и среднеарифметическая ряда. Для сравнения меры однородности разных совокупностей используют коэффициент вариации, представляющий собой процентное отношение среднего квадратического отклонения к средней арифметической:
где: V—коэффициент вариации; —среднеквадратическое отклонение; —среднеарифметическая ряда.
В нашем примере
Чем больше коэффициент вариации, тем разнообразнее совокупность. Он показывает на сколько процентов в среднем индивидуальные значения отличаются от средней арифметической. В известной степени коэффициент является критерием надежности средней: если он велик (превышает 40%), то это свидетельствует о большой колеблемости в величине признака у отдельных единиц данной группы, а следовательно, средняя недостаточно надежна.
Таблица 5.3.4