Вычисление коэффициента ассоциации Пирсона при сравнении параллельных форм опросника
Примечание: 0 — несовпадение с «ключом»; 1 — совпадение с «ключом».
В случае, если данные представлены в виде частот совпадений событий в четырех возможных вариантах сочетания переменных (табл. 8), коэффициент φ будет иметь вид:
Коэффициент φ удобен при расчете надежности ретестовой, а также анализа устойчивости ответов на пункты (задания) и степени их трудности, что особенно ценно при конструировании тестов. Применяя коэффициент φ и определив соответствие данных в сравниваемых сериях (тест—ретест), можно одновременно оценить степень оптимальности задания по силе (трудности) (см. Трудность заданий теста). Значение φ обратно пропорционально отношению частоты правильных и неправильных ответов! Пограничные варианты (задачи, решаемые всеми, и задачи чрезмерно сложные, решаемые относительно небольшим числом обследованных) обычно исключаются из теста как неинформативные и неустойчивые. Пороговой величиной неустойчивости пункта теста является превышение значения
Таблица 8
Вычисление четырехпольного коэффициента ассоциации Пирсона (ф)*
При анализе опросников личностных с дихотомической формой ответов («да»— «нет», «верно»—«неверно» и т. д.) составляемая в ходе расчета коэффициента φ четырехклеточная матрица позволяет установить несимметричное распределение утвердительных и отрицательных ответов.
При анализе четырехклеточных ассоциаций используется также коэффициент Юла:
Этот коэффициент, в отличие от φ, выражает одностороннюю связь, т. е. влияние одного признака на другой (в примере из табл. 7 — влияние тестового результата на вывод об уровне развития). Значение Q варьирует от -1 до +1. При Q = 0 признаки независимы, Q = 1 свидетельствует о положительной зависимости (всем Х= 1 соответствует У= 1); При Q = -1 — связь отрицательная. В силу того что Q выражает одностороннюю связь, его значения обычно превышают значения φ (в примере φ = 0,36; Q - 0,67). В настоящем разделе рассмотрены случаи определения корреляции двух дихотомических переменных. Когда одна из переменных дихотомическая, а другая выражена в шкале интервалов или отношений (см. Шкалы измерительные), используются коэффициенты корреляции бисериальные (см. Корреляция бисериальная).
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ -комплекс методов статистического исследования взаимозависимости между переменными, связанными корреляционными отношениями. Корреляционными (лат. correlatio — соотношение, связь, зависимость) считаются такие отношения между переменными, при которых выступает преимущественно нелинейная их зависимость, т. е. значению любой произвольно взятой переменной одного ряда может соответствовать некоторое количество значений переменной другого ряда, отклоняющихся в ту или иную сторону от среднего.
К. а. выступает в качестве одного из вспомогательных методов решения теоретических задач психодиагностики и включает в себя комплекс наиболее широко применяемых статистических процедур при разработке тестовых и других психодиагностических методик, определения их надежности, валидности. К. а. является одним из основных методов статистической обработки эмпирического материала в прикладных психодиагностических исследованиях.
Существующие процедуры К. а. позволяют определить степень значимости связи, установить меру и направление влияния одного из признаков (X) на результирующий признак (Y) при фиксированном значении отдельных переменных (корреляция частная), выявить степень и направленность связи результирующего признака (Y) с совокупностью переменных x1, x2, ... , xk (корреляция множественная). К. а. подлежат как количественные, так и качественные признаки (к первым относятся переменные, измеряемые в интервальной шкале и шкале отношений, ко вторым — не имеющие единиц измерения, оцениваемые шкалами наименований и порядковыми шкалами) (см. Шкалы измерительные). Может быть также установлена корреляция и для признаков, один из которых является качественным, а другие количественными (корреляция бисериальная, корреляция качественных признаков).
Одним из основных принципов определения количественных критериев корреляционной связи — коэффициентов корреляции — является сравнение величин отклонений от среднего значения по каждой группе в сопряженных парах сравниваемых рядов переменных. Другими словами, определяется частота соответствия между шкалами X и Y. Предположим, один и тот же испытуемый получил высокие оценки по тесту вербальных способностей (Х1) и показателям успеваемости по литературе (Y1). Тогда произведения отклонений и принимают высокие положительные значения. Если же большому х,1 у другого испытуемого будет соответствовать малое y1 то это произведение будет отрицательным. Абсолютная величина произведения отклонений зависит от степени отклонения переменных от среднего значения в сравниваемых парах. Если X и У не имеют систематической связи (большие х сочетаются с малыми у и наоборот), различные произведения будут принимать положительные или отрицательные значения. Сумма произведений во всех сравниваемых парах
будет приближаться к нулю. Сумма произведений в сравниваемых рядах переменных будет иметь большую величину по модулю и положительный знак, если X и У связаны между собой выраженной прямой зависимостью, и большую величину и отрицательный знак при связи X и У сильной обратной зависимости.
С целью достижения независимости меры корреляционной связи от числа сравниваемых пар и величин стандартных отклонений в двух группах произведение отклонений делится на число сравниваемых пар и стандартные отклонения в сопоставимых рядах. Такая мера носит название коэффициента корреляции — произведения моментов Пирсона:
где xt и y1, — сравниваемые количественные признаки, п — число сравниваемых наблюдений, σх и σу — стандартные отклонения в сопоставимых рядах. Расчетная формула rху имеет следующий вид:
При вычислении коэффициента Пирсона, особенно при большом количестве наблюдений, целесообразно упрощение за счет различных приемов, сокращающих объем вычислений. В качестве примера приводим расчет результатов двух тестов в группе из 10 обследованных (табл. 9).
Таблица9
Вычисление коэффициента корреляции произведения моментов Пирсона (rху)
Определение статистической зависимости коэффициента rху проводится с помощью критерия Стьюдента (t):
где п' — число степеней свободы (n' = п - 2). По таблице распределения Стьюдента для п' = 8 находим t = 2,896 при α = 0,02 и t = 2,306 при α = 0,05. Отсюда статистическая значимость установленного значения корреляции признаков на уровне α > 0,02.
При возведении коэффициента корреляции Пирсона в квадрат получаем коэффициент детерминации r2ху , выражающий степень вариации переменных. В нашем примере r2ху = 0,48, что свидетельствует о том, что 48% измерений признаков объясняются их совместным распределением (взаимовлиянием).
КОРРЕЛЯЦИЯ БИСЕРИАЛЬНАЯ(лат. bis series — два ряда, две серии) — метод корреляционного анализа отношения переменных, одна из которых измерена в дихотомической шкале наименований, а другая — в интервальной шкале отношений или порядковой шкале. Название метода связано с тем, что сравниваются две альтернативные серии объектов X, имеющие условные значения 0 или 1 по У.
Наиболее характерно применение коэффициентов К. б. в психологической диагностике при анализе дискриминативности заданий теста, а также при определении валидности критериальной путем коррелирования значений тестовых оценок с независимыми характеристиками критерия, выраженными в дихотомической шкале (см. Шкалы измерительные).
Для описания связи между перечисленными видами переменных используется точечный бисериальный коэффициент корреляции Пирсона:
где — среднее по X объектов со значением единицы по У; — среднее по X объектов со значением нуль по Y; Sx — стандартное отклонение всех значений по X; n1 — число объектов, с единицей по Y: n0 — число объектов с нулем по Y, т. е. п = п1 + n0. Уравнение для вычисления rpb представляет собой алгебраическое упрощение формулы коэффициента rху (см. Корреляционный анализ) для случая, когда Y — дихотомическая переменная. Можно привести ряд других эквивалентных выражений, удобных для практического применения:
где х — общее среднее по X.
Значение rpb варьирует от -1 до +1. В том случае, когда переменные с единицей по У имеют среднее по X, равное среднему переменных с нулем по У, rрb обращается в нуль.
В качестве примера можно привести вычисление rpь при анализе дискриминативности отдельных пунктов опросника личностного, т. е. корреляции между типичным ответом на отдельный пункт (утверждение—отрицание) с общим результатом по тесту (табл. 10).
Вычисленное таким образом значение rpb показывает, что проверяемый пункт опросника имеет среднюю диагностическую значимость и слабо коррелирует с общим результатом теста.
Достоверность (α) связи, рассчитанной с помощью коэффициента rpb, может определяться с помощью критерия χ2 для числа степеней свободы df = 2.
Другим распространенным методом расчета является определение бисериального коэффициента корреляции (rbis), который применяется в тех случаях, когда есть основания полагать, что дихотомическое распределение близко к нормальному:
Элементы уравнения идентичны используемым при вычислении rpb, за исключением величины U — ординаты нормированного нормального распределения в точке, за которой лежит площади под кривой (см. Нормальное распределение). Из данных табл. 9 = = 0,61; ордината нормированного (единичного) нормального распределения (U), за которой лежит 61% площади под кривой, равна 0,3836.
Таблица 10
Вычисление точечного бисериального коэффициента корреляции Пирсона
Примечание: 1 — совпадение с «ключом»; 0 — несовпадение с «ключом».
В отличие от других коэффициентов корреляции, rbis может принимать значения ниже -1 и выше +1. В случае попадания значения в эти области делается вывод о некорректности предположения о нормальном законе распределения X или о распределении значений X в выборке с эксцессом значительно ниже нормального. Следует обратить внимание на то обстоятельство, что при распределении переменных X с эксцессом больше нормального границы rbis будут соответственно меньше пределов -1 и +1, что приведет к переоценке степени связи. Это требует тщательной проверки свойств распределения при использовании бисериального коэффициента корреляции.
При вычислении rpb и rbis оперируют одинаковыми исходными данными, однако эти коэффициенты не тождественны. Коэффициент rpb более строг при характеристике степени связи между X и Y (rbis > rpb). Случаи, когда одна из переменных представлена в дихотомической шкале, а другая — в порядковой, требуют применения коэффициента рангово-бисериальной корреляции
где — средний ранг объектов, имеющих 1 по X; — средний ранг объектов с 0 по X. Пример вычислений приведен в табл. 11. Коэффициент rrb тесно связан с коэффициентом τ Кендалла. Особенно четко эта связь прослеживается при анализе корреляционной связи с помощью близкого к rrb коэффициента rpb в случае использования для его определения понятия совпадения и инверсии (см. Корреляция ранговая):
где n0 — число объектов с нулевой дихотомией; п1 — число объектов с единичной дихотомией; Р — сумма совпадений; Q — сумма инверсий.
Таблица 11
Вычисление рангово-бисериальной корреляции rrb при сопоставлении результатов теста у девочек(1) и мальчиков(О)
При оценке значимости связи можно использовать критерий Стьюдента:
При количестве степеней свободы п' = п - 2 = 8tкp = 2,306, при α = 0,05; t > tкp, следовательно, при α < 0,05 выявленная связь является статистически значимой.
КОРРЕЛЯЦИЯ КАЧЕСТВЕННЫХ ПРИЗНАКОВ— метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. Шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов корреляции ранговой, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона (см. Критерий χ2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона:
Значение Р всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше +1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k ´ k)
Так, в таблице размером (5 х 5) Pmах = = 0,894; в таблице (10 х 10) Pmах = 0,949. Поэтому окончательной формой выражения связи между переменными с помощью коэффициента Пирсона является его отношение к величине Рmах для данного случая (Р/Рmах).
При расчете сопряженности находит применение также коэффициент Чупрова:
где t — число столбцов таблицы, k — число строк таблицы.
В психологической диагностике описанные коэффициенты используются относительно редко.
КОРРЕЛЯЦИЯ РАНГОВАЯ —метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто К. р. применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. Шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов К. р. является возможность их использования независимо от характера распределения коррелирующих признаков.
В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты К. р. Спирмена и Кендалла. Первым этапом расчета коэффициентов К. р. является ранжирование рядов переменных. Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречаются несколько равных по значению переменных, им присваивается усредненный ранг (табл. 12).
Таблица 12
Ранжирование распределения показателей теста (л = 18)
В табл. 13 приведены данные для расчета коэффициентов К. р. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе — соответствующие им данные теста зрительной памяти).
Таблица 13