Измерение центральной тенденции и вариации признака.
В социальных исследованиях важное место занимает измерение центральной тенденции, состоящее в выборе такого показателя, который наилучшим образом описывает все значения признака из набора данных.
Наиболее распространенной формой показателей, используемой в социальных исследованиях, является средняя величина,представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени.Показатель в форме средней величины выражает типичные черты изучаемого явления и дает обобщающую характеристику однотипных явлений по одному из варьирующих признаков. Широкое применение средних объясняется тем, что они имеют ряд положительных свойств, делающих их незаменимыми в анализе явлений и процессов общественной жизни. Важнейшим из этих свойств является то, что средняя величина отражает общее, присущее всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности варьируют под влиянием множества факторов, среди которых могут быть как основные, так и случайные. В средней взаимно погашаются те отклонения значений признака, которые обусловлены действием случайных факторов, и учитываются изменения, вызванные действием факторов основных, что позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.
Для каждого показателя, используемого в социальном анализе, можно составить только одно истинное исходное соотношение средней. Однако от того, в каком виде представлены исходные данные, зависит, каким именно образом исходное соотношение средней будет реализовано. Средние показатели могут рассчитываться по дискретным и интервальным вариационным рядам. Рассмотрим расчет средней на конкретных примерах.
Среднее, определяемое как отношение суммы всех значений выборки к ее объему:
Задача: представлены данные для выборки из семи значений 2,2,4,5,10,6,1
Пример расчета:
Среднее для сгруппированных данных, определяемое как сумма произведений значений признака на частоту, отнесенная к объему выборки
Задача: представлены данные об оценках, полученных студентами на экзамене:
Оценка | Число студентов | |
xi | fi | xi fi |
итого |
Пример расчета:
Среднее для интервального распределения, определяемое как сумма произведений частот на величину середины интервала, отнесенная к объему выборки:
Задача: представлены данные о доходах населения города N:
Доход, руб. | Численность населения, % | Середина интервала | |
xi | fi | mi | fimi |
до 4000 | |||
4000-6000 | |||
6000-8000 | |||
8000-10000 | |||
свыше10000 | |||
Пример расчета:
Взвешенное среднее значение, получаемое при объединении нескольких групп наблюдений:
Группа | Среднее по группе, Вес, кг | Объем группы, чел. |
x | n | |
A | ||
B | ||
C | ||
D | ||
E | ||
Итого |
Пример расчета:
Среднее для дихотомической шкалы определяется как частное от числа единиц к числу элементов выборки:
Задача: представлены данные для выборки из десяти значений 1,0,0,0,1,1, 1,1,1,0
Пример расчета:
Вывод: 60% значений выборки принимают значение, равное единице, а 40% – значение ноль.
Описание центральной тенденции возможно при помощи таких понятий, как мода и медиана.