Вариация признака в совокупности и значение ее изучения
Ряды распределения, построенные по количественному признаку, называют вариационным. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие в величине признака носит название вариации.
Вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени.
Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Часто эти факторы могут оказывать разнонаправленное воздействие на уровень анализируемого показателя. Например, снижение цен на строительные материалы должен привести к уменьшению цен на 1 м2 жилья, а увеличение спроса на жилье может повысить эту цену и т.д. В результате совместного влияния различных факторов и складывается цена 1 м2 муниципального жилья в определенное время. Но есть еще одна группа факторов – экологическая обстановка в разных районах, обуславливающая вариацию рассматриваемых цен в разных районах города. Поэтому при изучении вариации различных показателей можно выделить две группы факторов, формирующих уровень признаков в исследуемой совокупности единиц и обуславливающих наличие различий в величине признака у отдельных единиц. Первую группу составляют факторы, общие для всех единиц изучаемой совокупности. Во вторую группу входят факторы, свойственные конкретным единицам совокупности и определяющие их индивидуальные особенности.
Первым этапом статистического изучения вариации является построение вариационного ряда – упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.
Существует три формы вариационного ряда – ранжированный, дискретный и интервальный.
Ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака. Ранжированный ряд данных позволяет сразу увидеть наименьшее и наибольшее значение признака в совокупности, определить расстояние между крайними значениями признака, а также выделить наиболее часто повторяющиеся значения в обследуемой совокупности. Использование ранжированного ряда также позволяет легко разделить все данные по группам.
Дискретный вариационный ряд – это таблица, состоящая из двух граф (или строк) – конкретных значений варьирующего признака xi и числа единиц совокупности с данным значением признака fi.
По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга не некоторую конечную величину, т.е. даны в виде прерывных чисел. Например, тарифный разряд рабочих, число детей в семье, число рабочих на предприятии и т.д. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определенных границах принимать любые значения. Например, заработная плата рабочих, размер среднедушевого денежного дохода, стоимость основных фондов предприятия и т.д.
Интервальный вариационный ряд представляет собой таблицу, состоящую из двух граф (или строк) – интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа от общей численности совокупности (частостей).
При построении интервального вариационного ряда необходимо выбрать оптимальное число групп (интервалов признака) и установить длину интервала. Поскольку при анализе вариационного ряда сравниваются частоты, необходимо, чтобы величина интервала была постоянной. Оптимальное число групп выбирается так, чтобы в достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.
Чаще всего число групп в вариационном ряду устанавливают, придерживаясь формулы, рекомендованной американским статистиком Стерджессом:
, (5.1)
где k – число групп; n – численность совокупности.
Пример.Необходимо построить вариационный ряд распределения предприятий общественного питания области по объему розничного товарооборота за 2005 год. Число предприятий общественного питания, функционирующих в 2005 году, составило 65; наименьшее значение товарооборота равно 100 млн. руб., наибольшее 590 млн. руб.
Используя формулу (5.1) рассчитаем число групп:
Так как число групп целое, следовательно рекомендуется построить 7 или 8 групп.
Далее, зная число групп, рассчитывают величину интервала по формуле:
. (5.2)
Пример.В нашем случае величина интервала составляет:
а) при 7 группах
б) при 8 группах
Для построения ряда и анализа вариации значительно лучше иметь по возможности округленные значения величины интервала и его границ. Поэтому наилучшим решением будет построение вариационного ряда с 7 группами с интервалом, равным 70 млн. руб.
Значение величины интервала позволяет определить границы всех интервалов ряда распределения. Нижнюю границу целесообразно принимать равной минимальному значению признака.