Корреляция дихотомических переменных
При сравнении двух переменных, измеренных в дихотомической шкале, мерой корреляционной связи служит так называемый коэффициент φ. Коэффициент фи представляет собой коэффициент корреляции для дихотомических данных.
Величина коэффициента φ лежит в интервале между +1 и -1. Он может быть как положительным, так и отрицательным, характеризуя направление связи двух дихотомически измеренных признаков. Однако интерпретация φ может выдвигать специфические проблемы. Дихотомические данные, входящие в схему вычисления φ непохожи на двумерную нормальную поверхность, следовательно, неправильно считать, что интерпретируемые значения rxy=0,60 и φ=0,60 одинаковы. Коэффициент φ можно вычислить методом кодирования, а также используя так называемую четырехпольную таблицу, или таблицу сопряженности.
Для применения коэффициента корреляции φ необходимо соблюдать следующие условия:
1. Сравниваемые признаки должны быть измерены в дихотомической шкале.
2. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
Данный вид корреляции рассчитываются в компьютерной программе SPSS на основании определения мер расстояния и мер сходства. Некоторые статистические процедуры, такие как факторный анализ, кластерный анализ, многомерное масштабирование, построены на применении этих мер, а иногда сами представляют добавочные возможности для вычисления мер подобия.
В тех случаях, когда одна переменная измеряется в дихотомической шкале (переменная X),а другая в шкале интервалов или отношений (переменная Y),используется бисериальный коэффициент корреляции. Например, при проверке гипотез о влиянии пола ребенка на показатель роста и веса.
Коэффициент изменяется в диапазоне от - 1 до +1, но его знак для интерпретации результатов не имеет значения. Для применения бисериального коэффициента корреляции необходимо соблюдать следующие условия:
1. Сравниваемые признаки должны быть измерены в разных шкалах: одна X – в дихотомической шкале; другая Y – в шкале интервалов или отношений.
2. Переменная Y имеет нормальный закон распределения.
3. Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
Если же переменная X измерена в дихотомической шкале, а переменная Y в ранговой шкале (переменная Y), то можноиспользовать рангово-бисериальный коэффициент корреляции. Этот коэффициент тесно связан с τ-Кендалла и использует в своем определении понятия совпадения и инверсии. Интерпретация результатов та же, что и для бисериального коэффициента корреляции.
Внутриклассовый коэффициент корреляции (ICC)со значениями, находящимися в диапазоне между -1 и +1. Он применяется в качестве меры связанности в том случае, когда согласованность двух признаков должна быть проверена не так, как при расчете рассмотренных выше корреляционных коэффициентов, относительно её общей направленности ("чем больше одна переменная, тем больше вторая"), а также и относительно средних уровней обеих переменных. Таким образом, расчёт ICC считается уместным только тогда, когда обе переменные имеют приблизительно одинаковый уровень значений. Подобная ситуация вероятнее всего возникнет в случае, когда одной и той же величине дается двоякая оценка.
ICC играет также важную роль при анализе достоверности, где он применяется в качестве меры достоверности. При его расчёте используется более двух переменных, называемых в данном случае
объектами.
Итак подведем итоги. Основное назначение корреляционного анализа это выявление связи между переменными. Мерой связи являются коэффициенты корреляции. Выбор коэффициента корреляции напрямую зависит от типа шкалы, в которой измерены переменные, числа варьирующих признаков в сравниваемых переменных и распределения переменных. Наличие корреляции двух переменных еще не означает что между ними существует причинная связь. Хотя корреляция прямо не указывает на причинную связь, она может быть ключом к разгадке причин. На ее основе можно сформировать гипотезы. В некоторых случаях отсутствие корреляции имеет более глубокое воздействие на гипотезу о причинной связи. Нулевая корреляция двух переменных может свидетельствовать о том, что никакого влияния одной переменной на другую не существует.
Библиография
1. Ермолаев, О.Ю. Математическая статистика для психологов / О.Ю. Ермолаев. - М.: МПСИ: Флинта. - 2002. – 325с.
2. Наследов, А.Д. Математические методы в психологическом исследовании. Анализ и интерпретация данных / А.Д. Наследов. - СПб.: Речь. - 2004.
3. Сидоренко, Е.В. Методы математической обработки в психологии. – СПб.: ООО «Речь» - 2004. – 350с.
4. Бурлачук, Л.Ф., Морозов С.М. Словарь – справочник по психодиагностике / Л.Ф. Бурлачук, С.М. Морозов – СПб: Питер Ком. - 1999. – 528с.
5. Суходольский, Г. В. Математические методы в психологии / Г.В. Суходольский. - Харьков: Изд-во Гуманитарный Центр. - 2006. – 512с.
6. Тарасов, С.Г. Основы применения математических методов в психологии. / С.Г. Тарасов. - СПб.: Изд-во: Санкт - Петербург. ун-та. - 1999. – 326с.
7. Глинский, В. В., Ионин, В. Г. Статистический анализ данных / В.В. Глинский, В.Г. Ионин. - М.: Филин. - 2008. – 265с
Лекция 19.
Регрессионный анализ
1. Понятие о регрессионном анализе.
2. Множественный регрессионный анализ.
3. Нелинейная регрессия.