Средняя квадратическая и средняя кубическая
В экономической практике иногда необходимо делать расчет среднего размера признака, выраженного в квадратных или кубических единицах измерения. В этих случаях применяется средняя квадратическая (например, для вычисления средней величины стороны п квадратных участков, средних диаметров труб, стволов и т.п.) и средняя кубическая (например, при определении средней длины стороны п кубов).
Средняя квадратическая простая является квадратным корнем из частного от деления суммы квадратов отдельных значений признака на их число:
Средние квадратическая и кубическая имеют ограниченное применение в практике статистики.
Структурные средние
Мода.
Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.
Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.
Пример
Распределение проданной обуви по размерам характеризуется следующими При изучении вариации применяются такие характеристики вариационного ряда, которые описывают количественно его структуру, строение. Такова, например, медиана - величина варьирующего признака, которое находится в середине вариационного ряда и делит совокупность на две равные части. Чтобы найти медиану необходимо найти значение признака, которое находится в середине упорядоченного ряда (медианой является собственный капитал третьего банка из пяти в табл. 5.5, т.е. 196 млрд руб.).
показателями:
Размер обуви | ||||||||||
Число проданных пар | - |
В этом ряду распределения мода равна 41. Именно этот размер обуви пользуется наибольшим спросом у покупателей.
В интервальном вариационном ряду модой приближенно считается центральный вариант так называемого модального интервала т.е. того интервала, который имеет наибольшую частоту. В пределах интервала можно найти то значение признака, которое является модой.
Для интервальных рядов распределения с равными интервалами мода определяется по формуле:
где - начальное значение интервала, содержащего моду;
- величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным.
Мода применяется в статистической практике при изучении покупательного спроса, регистрации цен и т.д.
Медиана распределения
Таблица 5.5
Крупные банки Санкт-Петербурга, ранжированные по размерам
Собственного капитала
Название банка | Собственный капитал, млрд. руб. |
Петроагропромбанк | |
Петровский | |
Балтийский | |
Альфа | |
Промстройбанк |
На примере табл. 5.5 видно принципиальное различие между медианой и средней величиной. Медиана не зависит от значений признака на краях ранжированного ряда. Если бы даже капитал крупнейшего банка Санкт-Петербурга был вдесятеро больше, величина медианы не изменилась бы. Поэтому часто медиану используют как более надежный показатель типичного значения признака, нежели арифметическая средняя, если ряд значений неоднороден, включает резкие отклонения от средней. В данном ряду средняя величина собственного капитала, равная 269 млрд руб., сложилась под большим влиянием наибольшей варианты. 80% банков имеют капитал меньше среднего и лишь 20% - больше. Вряд ли такую среднюю можно считать типичной величиной. При четном числе единиц совокупности за медиану принимают арифметическую среднюю величину из двух центральных вариант, например при десяти значениях признака - среднюю из пятого и шестого значений в ранжированном ряду. Номер медианы для нечетного числа совокупности вычисляется по формуле
N=(n+1) \ 2
В интервальном вариационном ряду для нахождения медианы применяется формула (5.14).
где Me - медиана;
х0 - нижняя граница интервала, в котором находится медиана;
f’ Mе-1 - накопленная частота в интервале, предшествующем медианному;
fMe - частота в медианном интервале;
i - величина интервала;
k - число групп.
В дискретном вариационном ряду медианой следует считать значение признака в той группе, в которой накопленная частота; превышает половину численности совокупности.
Пример
Распределение предприятий по численности промышленно-производственного персонала характеризуется следующими данными:
Группы предприятий по числу работающих | Число предприятий | Накопленная частота |
100-200 | ||
200-300 | ||
300-400 | ||
400-500 | ||
500-600 | ||
600-700 | ||
700-800 | ||
Итого: | - |
Определите среднюю численность предприятий, моду и медиану.
В этой задаче наибольшее число предприятий (30) имеет численность работающих от 300 до 400. Следовательно, этот интервал является модальным интервалом ряда распределения.
Мо= 300+100∙ 30-3_______ = 354чел.
(30-3)+(30-7)
Следовательно, наиболее часто встречаются предприятия со средней численностью 354 человека.
Ме = 400+100∙40-34 = 486
7
Следовательно, половина предприятий имеет численность работающих меньше 486 человек, а другая половина имеет численность больше данного показателя.
ар.вз. =150∙1+250∙3+350∙30+450∙7+550∙19+650∙15+750∙5 =481,25
Средняя численность работающих составляет 481,25 человек.
Показатели вариации
Вариация — это колеблемость, изменчивость величины признака у разных единиц данной совокупности в один и тот же период или момент времени. Например, сотрудники НИИ
различаются по доходам, затратам времени на работу, любимому занятию в свободное время и т.д. Появление вариации обуславливает то, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов по-разному сочетающихся в каждом отдельном случае. Следовательно, величина каждого варианта объективна.
Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики.
Исследование вариации помогает выявлять ее причины, влияния отдельных факторов на различные процессы, дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно-
обоснованных управленческих решений.
Средняя же величина дает обобщающую характеристику признака изучаемой совокупности, но не раскрывает строения совокупности. Она не раскрывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом - эти отличия велики, т.е. в одном случае вариация признака мала, а в другом – велика. Это имеет весьма важное значение для характеристики надежности средней величины.
Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот, - тем меньше варианты отличаются друг от друга, тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Недостаточность средней величины для полной характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) осредняемого признака. Поэтому нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней.
Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая — из трех человек. Пусть количество деталей, шт., изготовленных за
смену отдельными рабочими составляло:
Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет 1= 2= 100шт., однако колеблемость выработки отдельных рабочих в первой бригаде значительно
меньше, чем во второй. Следовательно, необходимо измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей.
К показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, коэффициент вариации.
Самым элементарным показателем вариации признака является размах вариации, представляющий собой разность между максимальным и минимальным значениями признака:
R= x тах – x min
В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде —
R1 =10 шт. (т.е. 105 - 95); во второй бригаде - R2= 50 шт. (т.е. 125 — 75), что в 5 раз больше.
Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более "устойчива".
Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими
максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3x125), а в первой — только 315 шт., т.е. (3 х 105).
Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и даёт обобщённую характеристику. Простейший показатель такого типа - среднее линейное отклонение.
Среднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом
всегда предполагают, что среднюю вычитают из варианта: ( х - ).
Среднее линейное отклонение:
для несгрупированных данных d=∑| х - |
n , где .n - число членов ряда;
для сгруппированных данных d=∑| х - |∙f
∑f
где ∑f – сумма частот вариационного ряда.
В данных формулах разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль — алгебраическая сумма отклонений вариантов от их средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.
Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется по формулам простой и взвешенной дисперсий ( в зависимости от исходных данных):
простая дисперсия для несгруппированных членов ∂2 ==∑_( х - )2
.n , где n - число членов ряда;
для сгруппированных данных ∂2=∑( х - )2f
∑f
где ∑f – сумма частот вариационного ряда.
Техника вычисления дисперсии по данным формулам достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой. Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике).
Приведем два из них:
первое — если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;
второе — если все значения признака уменьшить или увеличить в одно и то же число раз (I раз), то дисперсия соответственно уменьшится или увеличится в i2 раз.
Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия.
Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака;
использование дисперсии для построения показателей тесноты корреляционной связи при оценке результатов выборочных наблюдений.
Среднее квадратическое отклонение ∂ равно корню квадратному из дисперсии:
___________
для несгруппированных членов ∂ ==√∑_( х - )2
n , где n - число членов ряда;
______________
для сгруппированных данных ∂=√∑( х - )2f
∑f
где ∑f – сумма частот вариационного ряда.
Среднее квадратическое отклонение — это обобщающая характеристика размеров вариации признака в совокупности; оно показывает на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в
тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.
Чем меньше значение дисперсии и среднего квадратичного отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.
В статистической практике часто возникает необходимость сравнения вариаций различных признаков. Например, большой интерес представляет сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы, себестоимости и прибыли, стажа работы и производительности труда и т.д. Для подобных сопоставлений показатели абсолютной колеблемости признаков непригодны, нельзя сравнивать колеблемость стажа работы, выраженного в годах, с вариацией заработной платы, выраженной в рублях.
Для осуществления такого рода сравнений, а также сравнений колеблемости одного и того же признака в нескольких совокупностях с различным средним арифметическим используют относительный показатель вариации — коэффициент вариации.
Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической: V∂= ∂/
Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33 %.
И так, для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в различных совокупностях, при различных средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляется как отношение абсолютного показателя рассеивания к средней арифметической умноженное на 100%.
Коэффициент осцилляции отражает относительную колеблемость крайних значений признака вокруг средней.
VR = R ∙ 100%
Относительное линейное отклонение характеризует долю усредненных значений абсолютных отклонений от средней величины.
Vd = d ∙ 100%
Коэффициент равномерности Vр = 100 - V∂ Данный коэффициент характеризует равномерность совокупности. Если коэффициент равномерности больше 50%, то совокупность равномерная.