Определение р-уровня значимости для коэффициента корреляции Кендалла
Природа данного коэффициента иная, чем у Пирсона и Спирмена, поэтому р-уровень значимости определяется следующим образом: применяется Z-критерий и единичное нор- мальное распределение:
(2.5)
Затем по таблице «Стандартные нормальные вероятности» (Приложение 1) определя- ется теоретическое значение Z, ближайшее меньшее к эмпирическому значению Zэ. Далее определяется площадь Р под кривой справа от Zr. Затем вычисляется р-уровень по формуле р<2Р
Корреляционные матрицы и плеяды
Корреляционная матрица –результат вычисления корреляций одного типа для каж- дой пары из множества Р переменных, измеренных в количественной шкале на одной выбор- ке (рис.6).
Рис. 6 Шаблон корреляционной матрицы
Корреляционная матрица является квадратной: число строк и столбцов равно числу переменных. Она симметрична относительно главной диагонали, т.к. корреляция Х с Y равна корреляции Y с Х. На её главной диагонали располагаются единицы, т.к. корреляция призна- ка с самим собой равна 1. Следовательно, анализу подлежат те элементы матрицы, которые находятся выше или ниже главной диагонали. Основная задача анализа корреляционной матрицы – выявление структуры взаимосвязей множества признаков.
При вычислении большого количества коэффициентов корреляции (например, матри- ца для 15 переменных составляет 105 коэффициентов), можно гарантированно (α×к, 5 раз) получить подтверждение статистической гипотезы независимо от того, существует ли связь на самом деле. В таком случае нельзя с уверенностью говорить о том, какие коэффициенты корреляции были получены обоснованно, а какие – случайно.
В таком случае можно предложить следующее: разделить выборку случайным обра- зом на 2 части и принимать во внимание только те корреляции, которые статистически зна- чимы в обеих частях выборки. Альтернативой может являться многомерный метод (фактор- ный, кластерный или множественный регрессионный анализ).
Корреляционная плеяда –фигура, состоящая из вершин и соединяющих их линий. Вершины соответствуют признакам и обозначаются обычно цифрами – номерами перемен- ных. Линии соответствуют статистически достоверным связям и графически выражают знак, а иногда и р-уровень значимости связи.
Построение корреляционной плеяды начинают с выделения в матрице статистически значимых корреляций (*- 0,05; **-0,01; ***-0,001). Затем для строк (столбцов) матрицы, со- держащих статистически значимые корреляции, подсчитывается их количество. Построение плеяды начинается с переменной, имеющей наибольшее число значимых связей, постепенно добавляя в рисунок другие переменные – по мере убывания числа связей и связывая их ли- ниями, соответствующими связям между ними.
Примерные фразы для интерпретации коэффициентов корреляции:
1. Анализ корреляционных зависимостей показал следующие результаты…..
2. На наличие данного дефекта указывают корреляционные зависимости меж- ду……Это значит, ……
3. С помощью корреляционного анализа выявлена обратная взаимосвязь …….
4. Статистически значимой взаимосвязи между ….. не выявлено, что свидетельствует о том, что ….
5. Чем выше показатели по шкале…., тем выше (ниже) …… Это подтверждается по- ложительной (отрицательной) взаимосвязью между ……
6. Применение двумерной описательной статистики (мер совместной изменчивости, взаимосвязи) к переменным….. показало, что….
Методы анализа номинативных данных
Анализ классификаций
Методы анализа номинативных данных –методы, касающиеся проверки самого широкого класса гипотез – в отношении тех явлений, измерения тех явлений, измерения ко- торых доступны в номинативной шкале.
Несмотря на достаточно широкую представленность номинативных ситуаций в пси- хологических исследованиях, все их можно свести к трем типичным случаям:
1. Сравнение наблюдаемого (эмпирического) распределения частот с ожидаемым (теоретическим) распределением.
2. Сравнение двух или более наблюдаемых распределений частот.
3. Сравнение наблюдаемого распределения событий Х среди событий Y (серий Х, Y) со случайным распределением.
Ситуация 1.
Кто чаще обращается в службу знакомств: мужчины или женщины? Для ответа на этот вопрос необходимо:
а) подсчитать количество женщин и мужчин, обратившихся в службу знакомств;
б) воспользовавшись методом статистической проверки, сопоставить полученное эм- пирическое соотношение мужчин и женщин с ожидаемым (теоретическим) равномерным распределением.
Ситуация 2.
Зависит ли предпочтение одного из пяти кандидатов на выборах от пола потенциаль- ного избирателя? Для проверки этого предположения необходимо для каждого респондента определить пол (первая номинативная переменная, две градации – мужчина и женщина) и предпочитаемого кандидата, одного из пяти (вторая номинативная переменная, пять градаций).
Ситуация 3.
Наблюдается ли некоторая закономерность в чередовании быстрых и медленных ре- акций на некоторый стимул: имеют ли они тенденцию к группированию или после медлен- ной реакции следует быстрая (и наоборот)?
Для решения 1 и 2 ситуаций (анализ классификаций и таблицы сопряженности) ис- пользуется один и тот же критерий - χ2-Пирсона,хотя в каждом случае его применение об- ладает своей спецификой. Таблица «Критические значения критерия χ2-Пирсона» представ- лена в Приложении 3.
Для решения задач 3 типа необходимо упорядочить события во времени и подсчитать число серий. Серия– это последовательность однотипных событий, непосредственно перед и после которой произошли события другого типа. В соответствии с этим применяется кри- терий серий,позволяющий определить вероятность случайного появления наблюдаемого числа серий при условии хаотичного распределения событий Х среди событий Y.
Очень часто при анализе номинативных данных нет необходимости в построении таблиц первичных данных, таблиц типа «объект-признак»: результаты наблюдения сразу за- носятся в таблицу распределения (сопряженности) или составляют последовательность. В этом случае нет необходимости в использовании специальных статистических программ, и все расчеты можно провести «вручную», тем более, что они не составляют особого труда.