Меры центральной тенденции
Меры центральной тенденции (МЦТ) –это число, характеризующее выборку по уровню выраженности измеренного признака; это величины, вокруг которых группируются остальные данные.
Среднее арифметическое (выборочное среднее, М) –это частное от деления всех значений (Х) на их количество (N):
М=ΣХ/N.
Свойства среднего:
а) если к каждому значению переменной прибавить одно и то же число С, то среднее увеличится на это число (уменьшится на это число, если оно отрицательное): М(xj+c) = Мx +с
б) если каждое значение переменной умножить на одно и то же число С, то среднее
увеличится в С раз: М(xj·c) = Мx ×с
в) отклонение от среднего – сумма всех отклонений от среднего равна нулю: Σ(xj-
Mx)=0.
Медиана (Ме) –это значение, которое делит упорядоченное (ранжированное) множе-
ство данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая больше. При этом количество отличающихся значений ниже и выше медианы одина- ково. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию (убыванию). Далее медиана определяется следующим образом:
а) если данные содержат нечетное число значений (8, 9, 10, 13, 15), то медиана есть центральное значение, т.е. Ме=10;
б) если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посредине между двумя центральными значениями, т. е. Ме=(8+9)/2=8,5.
Медиана не обязательно совпадает с имеющимся замером, это точка на шкале. Совпа- дение происходит в случае нечетного числа значений (ответов) на шкале, совпадение – при четном их числе.
Мода (Мо) –это значение, наиболее часто встречающееся в выборке, т.е. значение с наибольшей частотой. Мода – это значение признака, а не его частота. Особенности:
а) если график распределения частот имеет одну вершину, то такое распределение называют унимодальным; например: среди 8 значений признака (3, 7, 3. 5, 7, 8, 7, 6) Мо=7 как наиболее часто встречающееся значение;
б) если два соседних значения имеют одинаковую частоту и они больше частоты лю- бого другого значения, мода есть среднее этих двух значений; например: в ряду значений (1, 2, 2, 2, 4, 4, 4, 5, 5, 7) Мо=3;
в) если то же самое относится к двум не смежным значениям, то существует две мо- ды, а группа оценок является бимодальной; например: в ряду значений (0, 1, 1, 1, 2, 3, 4, 4, 4,
5, 7) Мо=1 и 4;
г) если все значения встречаются в группе одинаково часто, то считается, что моды нет; например: 1, 1, 3, 3, 7, 7.
Правила выбора мер центральной тенденции.
1. Для номинативных данных единственной подходящей мерой ЦТ является Мо, или модальная категория – та градация номинативной переменной, которая встречается наиболее часто.
2. Для порядковых метрических переменных, распределение которых унимодальное и симметричное, мода, медиана и среднее совпадают. Чем больше отклонение от симметрич- ности, тем больше расхождение между значениями этих МЦТ. По этому расхождению мож- но судить о том, насколько симметрично или асимметрично распределение.
3. Наиболее очевидной и часто используемой МЦТ является среднее значение. Оно применяется при стремлении к наибольшей точности, и когда впоследствии нужно будет вы- числять стандартное отклонение. Но его использование ограничивается тем, что на величину среднего влияет каждое отдельное значение. Таким образом, среднее значение весьма чув- ствительно к «выбросам» - экстремально малым или большим значениям переменной.
4. На величину моды или медианы величина каждого отдельного значения не влияет. Иначе говоря, мода и медиана не чувствительны к «выбросам». Например: если 9 человек имеют месячный доход от 5000 до 6000 рублей, со средним 5600 рублей, а доход 10 человека составляет 15000 рублей, то средний доход для этих 10 человек составит 6540 рублей. Эта цифра не позволяет судить обо всей группе, и в качестве меры центральной тенденции сле- дует избрать медиану или моду.
5. Медиана используется, когда в серии есть «нетипичные» данные, резко влияющие на среднее, например: 1, 3, 5, 7, 9, 24, 6.
6. Мода используется тогда, когда не нужна высокая точность, но важна быстрота распределения МЦТ.
Помимо МЦТ в психологии широко используются меры положения, которые называ- ются квантилями распределения.
Квантиль –это точка на числовой оси измеренного признака, которая делит всю со- вокупность упорядоченных измерений на две группы с известным соотношением их числен- ности.
Виды квантилей:
Медиана (Ме)– значение признака, которое делит всю совокупность измерений на две группы с равной численностью;
Процентиль– (Р) – это 99 точек значений признака (Р1, …….Р99), которые делят упо- рядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Определение конкретного значения процентиля аналогично определению медианы. Напри- мер: при определении 1- процентиля, Р10, сначала все значения признака упорядочиваются по возрастанию. Затем отсчитывается 10% испытуемых, имеющих наименьшую выражен- ность признака. Р10 будет соответствовать тому значению признака, который отделяет эти 10% испытуемых от остальных 90%;
Квартиль –это 3 точки – значения признака (Р25, Р50, Р75), которые делят упорядо- ченное (по возрастанию) множество наблюдений на 4 равные по численности части. Первый квартиль соответствует 25-му процентилю, второй – 50-му процентилю или медиане, третий квартиль – 75-му процентилю.
Процентили и квартили используются для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака или для выделения подгрупп и отдель- ных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.
Меры изменчивости
Меры изменчивости– статистические показатели, характеризующие различия меж- ду отдельными значениями выборки. Они позволяют судить о степени однородности полу- ченного множества, о его компактности, а косвенно – и о надежности полученных данных и вытекающих из них результатов. Если меры центральной тенденции отражают уровень вы- раженности измеренного признака, то меры изменчивости, отражающие индивидуальные различия испытуемых по измеренному признаку, применяются в психологии для численного выражения величины межиндивидуальной вариации признака.
Наиболее используемые в психологических исследованиях результаты: размах, сред- нее отклонение, дисперсия, стандартное отклонение, полуквартильное отклонение.
Размах (R) –интервал между максимальным и минимальным значениями признака. Определяется легко и быстро, но чувствителен к случайностям, особенно при малом числе данных.
R= Xmax-Xmin
Среднее отклонение (МД) –это среднеарифметическое разницы (по абсолютной ве- личине) между каждым значением в выборке и её средним. МД показывает скученность дан- ных вокруг среднего:
МД= Σd/N,
где d= (Х-М); М – среднее выборки, Х – конкретное значение, N – число значений.
Дисперсия (Д) –(от лат. рассыпанный) – мера изменчивости для метрических дан- ных, пропорциональная сумме квадратов отклонений измеренных значений от их арифмети- ческого среднего. Дисперсия – величина, название которой в науке является синонимом из- менчивости:
D=Σd2/N, для больших выборок; где d= (Х-М); D=Σd2/(N-1), для малых выборок; где d= (Х-М);
Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии.
Свойства дисперсии:
а) если значения измеренного признака не отличаются друг от друга (равны между собой) – дисперсия равна нулю;
б) прибавление одного и того же числа к каждому значению переменной не меняет дисперсию;
в) прибавление константы к каждому значению переменной изменяет среднее (М), но дисперсия при этом остается неизменной;
г) умножение каждого значения переменной на константу С изменяет дисперсию в С2 раз: Dх×c = Dх С2
Стандартное отклонение (σ) –положительное значение квадратного корня из дис- персии.
Из-за возведения в квадрат отдельных отклонений d при вычислении дисперсии полу- чается величина, далекая от самих отклонений. Чтобы этого избежать и получить характери- стику, сопоставимую со средним отклонением, проделывают обратную математическую операцию – из дисперсии извлекают квадратный корень. Его положительное значение и при- нимается за меру изменчивости, именуемую среднеквадратическим или стандартным откло- нением.
(1.1)