Измерение в психологии: виды статистических распределений, шкалы измерения, сущность корреляционного, регрессионного, кластерного, факторного анализов
Измерение - это приписывание числовых форм объектам или событиям в соответствии с определенными правилами (С. Стивенс). Стивенсоном предложена классификация из 4 типов шкал измерения:
1) Номинативная, или номинальная, или шкала наименований - это шкала, классифицирующая по названию и устанавливающая соответствие признака тому или иному классу. Название не измеряется количественно, оно лишь позволяет отличить один объект от другого или одного субъекта от другого.
2) Порядковая, или ординальная, шкала - это шкала, классифицирующая по принципу «больше-меньше». Здесь субъекты могут быть ранжированы, например, по весу или росту.
3) Интервальная, или шкала равных интервалов - это шкала классифицирующая по принципу «больше на определенное количество единиц - меньше на определенное количество единиц».
4) Шкала равных отношений - это шкала, классифицирующая объекты или субъектов пропорционально степени выраженности измеряемого свойства.
Распределение числовой случайной величины - это функция, которая однозначно определяет вероятность того, что случайная величина принимает заданное значение или принадлежит к некоторому заданному интервалу.
Виды распределения:
1. Равномерное распределение - непрерывная случайная величина Х имеет равномерное распределение на отрезке [а, в], если на этом отрезке плотность распределения вероятности случайной величины постоянна, т. е. если дифференциальная функция распределения f(х) имеет следующий вид:
Иногда это распределение называют законом равномерной плотности. Про величину, которая имеет равномерное распределение на некотором отрезке, будем говорить, что она распределена равномерно на этом отрезке.
2. Нормальное распределение - непрерывная случайная величина Х имеет нормальное распределение (распределена по нормальному закону), если плотность распределения вероятности f(x) имеет вид
где а и s—некоторые постоянные, называемые параметрами нормального распределения.
Функция распределения F(x) в рассматриваемом случае принимает вид
Параметр а- есть математическое ожидание НСВХ (непрерывной случайной величины Х), имеющей нормальное распределение, s - среднее квадратическое отклонение, тогда дисперсия равна
3. Показательное (экспоненциальное) распределение. Непрерывная случайная величина X, функция плотности которой задается выражением
называется случайной величиной, имеющей показательное, или экспоненциальное, распределение.
Сущность основных видов анализов в психологии:
1. Корреляционный анализ – это проверка гипотез о связях между переменными с использованием коэффициентов корреляции. Коэффициент корреляции – двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных. Таким образом, корреляционный анализ это совокупность методов обнаружения корреляционной зависимости между случайными величинами или признаками. Корреляционный анализ для двух случайных величин заключает в себе:
1. построение корреляционного поля и составление корреляционной таблицы;
2. вычисление выборочных коэффициентов корреляции и корреляционных отношений;
3. проверка статистической гипотезы значимости связи.
Основное назначение корреляционного анализа – выявление корреляционной связи между двумя или более изучаемыми переменными. Корреляционная связь это совместное согласованное изменение двух изучаемых характеристик. Данная изменчивость обладает тремя основными характеристиками: формой, направлением и силой.
По форме связь может быть линейной или нелинейной. Более удобной для выявления и интерпретации корреляционной связи является линейная форма.
Для линейной корреляционной связи можно выделить два основных направления: положительное («прямая связь») и отрицательное («обратная связь»). Сила связи напрямую указывает, насколько ярко проявляется совместная изменчивость изучаемых переменных. В психологии функциональная взаимосвязь явлений эмпирически может быть выявлена только как вероятностная связь соответствующих признаков. Наглядное представление о характере вероятностной связи дает диаграмма рассеивания – график, оси которого соответствует значениям двух переменных, а каждый испытуемый представляет собой точку.
Коэффициент корреляции — это величина, которая может варьировать в пределах от +1 до -1. В случае полной положительной корреляции этот коэффициент равен плюс 1, а при полной отрицательной — минус 1.;
2. Регрессионный анализ представляет собой вычисления на основе статистической информации с целью математической оценки усредненной связи между зависимой переменной и некоторой независимой переменной или переменными. Простая регрессия предполагает одну независимую переменную, множественная же регрессия предполагает две и более переменных. Регрессионный анализ описывает или оценивает величину какой-либо переменной (зависимой переменной на основе изменения одной или более других переменных - независимых или каузальных).
Регрессионный анализ может быть использован при попытке предсказания или оценки величины зависимой переменной. По следующей формуле рассчитывается простая линейная регрессия: у = а + bx, где:
у - зависимая переменная;
х - независимая переменная;
а - постоянная величина или точка пересечения постоянной линии регрессии переменной у, отражающая величину у при Ъ = 0;
b - наклон линии регрессии (коэффициент пропорциональности изменений у при изменении х);
3. Кластерный анализ - широкий класс процедур многомерного статистического анализа, позволяющих произвести автоматизированную группировку наблюдений в однородные классы — кластеры. Входным материалом для него служат попарные показатели различия или сходства классифицируемых объектов. В частности, это могут быть коэффициенты корреляции между переменными. В результате такого анализа исследователь получает разбиение объектов на классы. Среди множества различных алгоритмов кластерного анализа наибольшей популярностью до сих пор пользуются алгоритмы иерархической кластеризации. Эти алгоритмы дают не одно, а несколько разбиений на разных уровнях сходства (различия) между объектами. При этом строится дерево кластеризации, позволяющее наглядно увидеть, какие классы объектов являются более внутренне однородными, а какие — более общими, внутренне разнородными, а также увидеть, на каких уровнях более мелкие однородные классы объединяются в более крупные. Кластерный анализ позволяет выявить группы испытуемых, обладающих близкими психодиагностическими профилями (соотношением выявленных и измеренных психических свойств).
При конструировании тестов кластерный анализ позволяет сгруппировать родственные тестовые пункты (задания) и перепроверить тем самым результаты другого метода построения факторных шкал — результаты факторного анализа;
4. Факторный анализ – его методы направлены на выделение из заданного множества переменных подмножеств переменных, тесно связанных (коррелирующих) между собой. Переменные, входящие в одно подмножество и коррелирующие между собой, но в значительной степени независимые от переменных из других подмножеств, образуют факторы.
Цель факторного анализа - идентифицировать явно не наблюдаемые факторы с помощью множества наблюдаемых переменных.
В основе парадигмы использования факторного анализа лежит предположение о том, что выделяемые факторы отражают глубинные процессы (латентные, не наблюдаемые, не измеряемые), являющиеся причиной корреляций первичных (наблюдаемых, измеряемых) переменных. Другими словами, факторы (глубинные параметры) детерминируют (определяют) первичные наблюдаемые переменные и могут быть использованы для объяснения комплексных явлений. Наблюдаемые корреляции между первичными переменными возникают из-за того, что их детерминируют одни и те же факторы.