Показатели колеблемости (вариации) значений признаков

Для характеристики рядов распределения оказывается недостаточным указание только средней величины данного признака, поскольку два ряда могут иметь, к примеру, одинаковые средние арифметические, но степень концентрации (или, наоборот, разброса) значений признаков вокруг средней будет совершенно различной. Характери­стикой такого разброса служат показатели колеблемости — разность между максимальным и минимальным значениями признака в не­которой совокупности (вариационный размах), а также другие по­казатели: среднее абсолютное (линейное) отклонение, среднее квадратическое отклонение и т. п.

Дисперсия. Дисперсией называется величина, равная среднему значению квадрата отклонений отдельных значений признаков от средней арифметической. Обозначается дисперсия s2 и вычисляется но формуле,

Показатели колеблемости (вариации) значений признаков - student2.ru

Корень квадратный из дисперсии называется средним квадратическим отклонением и обозначается s.

Геометрически среднее квадратическое отклонение является по­казателем того, насколько в среднем кривая распределения размы­та относительно ее среднего арифметического. Измеряется в тех же единицах, что и изучаемый признак.

При ручном счете для упрощения вычислений дисперсию Ы рассчитывают по формуле методом отсчета от условного нуля. Для интервального ряда с равными интервалами процедура следующая. Сначала вычисляются центры интервалов. Относительно какого-либо отобранного серединного интервала ряда, например А, вверх и вниз выписывается натуральный ряд чисел (аi) соответственно со знаком «плюс» и «минус»: 0, +1, +2 и т. д.; —1, —2 и т, д. (табл. 4).

В качестве проме­жуточного результата по формуле (7) получаем среднее арифметическое. Величина дисперсии получается подстановкой промежуточных величин из табл. 4 в формулу (8).

Среднее арифметическое находится по формуле19

Показатели колеблемости (вариации) значений признаков - student2.ru

Приведенные вычисления показывают, что при среднем возрасте» 40 лет все остальные члены совокупности имеют возраст, который в среднем отклоняется от 40 лет на 7,8 лет, т. е. примерно на 20%.

Показатели колеблемости (вариации) значений признаков - student2.ru

Среднее абсолютное отклонение. Эта мера вариации представля­ет собой среднее арифметическое из абсолютных величин откло­нений отдельных значений признака от их среднего арифметического, нения часто выражаются через соотнесение в процентах к среднему арифметическому, т. е. в виде относительных величин.

Отношение среднего линейного или среднего квадратического отклонения к среднему арифметическому называется коэффициен­том, вариации (V):

Показатели колеблемости (вариации) значений признаков - student2.ru

Очевидно, что тот из рядов имеет большее рассеяние, у которого коэффициент вариации больше.

Рассмотренные выше показатели вариации применимы лишь к количественным признакам, а точнее к признакам, измеренным не ниже чем по интервальной шкале. Применение этих мер для низ­ших уровней, строго говоря, некорректно и требует тщательной ин­терпретации полученных результатов.

Вариации качественных признаков. Если признак имеет k взаи­моисключающих градаций, то для вычисления индекса качествен­ной вариации применяется процедура, поясняемая следующим примером.

Пусть получено следующее распределение ответов (взаимоис­ключающих) па вопросы А, В и С(колонка 1):

Показатели колеблемости (вариации) значений признаков - student2.ru

Во вторую колонку запишем такие частоты, которые получились бы при равномерном заполнении всех трех вопросов, т. е. 120/3 = 40. Теперь вычислим величину

Показатели колеблемости (вариации) значений признаков - student2.ru

Этот показатель называется индексом качественной вариации и указывает на степень неоднородности полученных ответов. Если бы все ответы попали лишь в одну градацию, то j = 0, что означа­ло бы полное единство в ответах, хотя, конечно, индекс совершенно не учитывает того, в какую именно градацию попали все эти ответы.

Совершенно аналогично индекс вычисляется при любом числе градаций. Но для альтернативных признаков вариация обычно подсчитывается по формуле (14). Она отличается от J на константу, называется дисперсией, выражается в абсолютных числах и обо­значается s2:

Показатели колеблемости (вариации) значений признаков - student2.ru

Другой мерой вариации признака (независимо от уровня изме­рения) может служить так называемая энтропия — мера неопределенности, вычисляемая по формуле

Показатели колеблемости (вариации) значений признаков - student2.ru

Логарифм в этой формуле может быть взят по любому основанию. Энтропия обладает следующими свойствами:

а) энтропия равна нулю лишь в том случае, если вероятность полу­чения одного из значения xi признака х равна единице (вероятность остальных значений при этом равна нулю). Такой признак не обла­дает неопределенностью, так как достоверно известно одно един­ственно возможное его значение. Во всех остальных случаях, когда имеется та или иная неопределенность в значениях xi, энтропия является положительной величиной;

б) наибольшей энтропией обладает признак, когда все значения xi равновероятны. Для признака с k градациями

Показатели колеблемости (вариации) значений признаков - student2.ru

Отсюда видно, что максимальная энтропия увеличивается с ростом числа градаций в признаке.

Наши рекомендации