Корреляция и статистические решения

Основная цель использования мер связи в экспериментальном исследовании – проверка статистической нуль-гипотезы о том, что переменные Х и Y не связаны, т.е. имеют нулевой коэффициент корреляции в совокупности [15, с. 287]. В логике экспериментального вывода соответствующие статистические решения занимают вполне определенное место: от количественной оценки значимости выявленной ковариации переменных зависит содержательный вывод об обоснованности экспериментальной или контргипотезы (или необходимости поиска других конкурирующих гипотез). Если в соответствии с полученными эмпирическими данными нуль-гипотеза не может быть отвергнута, то следует отвергнуть экспериментальную гипотезу, т.е. признать изменения переменных не связанными друг с другом. В этой логике отвержения экспериментальных гипотез коэффициент корреляции выполняет ту же роль, что и меры различий: t-критерий Стьюдента и др. Более строго следовало бы говорить об отвержении гипотезы о значимости коэффициента корреляции.

Обычно в учебных пособиях по статистике специально выделяется случай доказательства того, что коэффициент корреляции для двух выборок равен нулю. Роль этого частного случая заключается в том, что при отсутствии ковариации не выполняется существенное условие причинного вывода. Однако реально цель доказать, что связь между переменными равна именно нулю, а не просто является незначимой, ставится чрезвычайно редко. Научное познание направлено на выявление не того, что что-то от чего-то не зависит, а на установление закономерных зависимостей одних переменных от других (при проверке содержательных гипотез).

Специальный случай доказательства равенства коэффициента корреляции нулю важен в основном при желании исследователя обосновать конкурирующую гипотезу о зависимости измеряемого показателя от какого-то другого (третьего) фактора. Следует при этом помнить, что проверка статистической гипотезы о равенстве коэффициента связи нулю не тождественна проверке гипотезы о не значимости связи между переменными. В первом случае речь идет о точке на числовой оси, а точечное оценивание требует иных (больших) затрат, чем интервальное оценивание.

При корреляционном подходе, не предполагающем управление независимыми переменными, равноправными с точки зрения логики последующего содержательного вывода являются статистические решения о равенстве коэффициента корреляции какому-то числу, одинаковой корреляции переменной Х с другими переменными (Y и Z), значимости множественной корреляции. Традиционный подсчет коэффициента корреляции предполагает указание уровня значимости при определенном количестве наблюдений, т.е. числа измерений. Не сама по себе подсчитанная на основе эмпирических данных величина коэффициента корреляции служит основанием для оценки приемлемости психологической гипотезы о связи между переменными, а статистическое решение о том, следует ли считать вычисленное значение коэффициента корреляции значимым. Иными словами, установление факта незначимости корреляции между переменными служит основанием для принятия решения отвергнуть гипотезу о связи между переменными. Интерпретация установленной связи полностью подчинена не следующему из самого эмпирического материала обоснованию ее направленности или опосредования ее тем или иным базисным процессом.

Это же ограничение касается и многомерного анализа данных, в частности множественно-регрессионного анализа. Так, нуль-гипотеза при таком анализе утверждает, что нет связи между предсказываемой переменной и данным набором предсказывающих переменных. Если нуль-гипотеза, согласно полученным результатам, не может быть отвергнута, то это означает, что предсказываемая переменная не имеет значимых связей ни с одной из переменных набора. Если принятие содержательной гипотезы исследования предполагает отвержение нуль-гипотезы как отсутствия линейных количественных связей между двумя наборами переменных, то установление этой линейной комбинации по полученным данным все же может оказаться недостаточным для подтверждения исходных априорных положений. Как подчеркивается в современных обзорах основных направлений многомерного анализа данных, самая существенная трудность состоит в том, что в случае отвержения общей нуль-гипотезы «позитивные» результаты могут не поддаваться разумной интерпретации.

Выбор коэффициента корреляции в зависимости от типа шкал и плана обработки данных

Дж. Гласc и Дж. Стэнли [15] приводят сводную таблицу для демонстрации возможных сочетаний типов шкал для измеряемых переменных, между которыми подсчитывается коэффициент корреляции. Выбор меры связи определяется двумя моментами: 1) обоснованием типа шкал для каждой из переменных; 2) обоснованием соответствия способа определения коэффициента тем или иным допущениям теоретического плана. Не все коэффициенты корреляции, как r Пирсона, предполагают вычисление отклонений значений переменной от среднего показателя, (φ-коэффициент, разработанный для случая двух дихотомических переменных (шкала наименований), может быть интерпретирован различным образом. Помимо соответствия его коэффициенту Пирсона, указывают возможности рассмотрения его как процента изменчивости и как меры степени воздействия, если одна из переменных подвержена функциональному контролю, например, на уровне подбора групп (так, переменные «наличие или отсутствие лечения», «новый или старый метод обучения» могут задаваться исследователем).

Вычисление (φ-коэффициента предполагает указание доли людей (или задач, или других случаев, отличия между которыми измерены в дихотомической шкале), получивших одно из двух значений по Х- и Υ-показателю.

Подсчет коэффициентов корреляции при обработке данных в экспериментальных, квазиэкспериментальных и собственно корреляционных исследованиях включен в разные планы обработки данных. В зависимости от конкретизации способов обработки данных количественная оценка взаимосвязи может характеризовать полученные эффекты как достаточно четко установленные или, напротив, недостаточно явные, не удовлетворяющие по величине той их роли, которая предполагалась в гипотезе исследования.

Контрольные вопросы

В данной главе контрольные вопросы предполагают возможность выбора правильных утверждений из ряда предложенных, т.е. построены как средство самопроверки.

Инструкция: «Вам предлагаются высказывания, которые могут быть завершены различным образом. Среди заданных альтернатив есть правильные, неправильные и спорные, т.е. такие, правильность которых зависит от вводимого контекста объяснений.

Ваша задача: в каждом заданном утверждении оценить каждую альтернативу. Для примера приводятся пояснения к утверждению 1. По следующим утверждениям пояснения не приводятся. Предполагается, что Вы сделаете их сами, учитывая не только материал данного пособия, но и пройденные Вами соответствующие темы в разделе».

Требуется выбрать правильные утверждения из заданных:

Утверждение I

Корреляционные, или «пассивно-наблюдающие», исследования проводятся для проверки гипотез:

1) о связях между переменными, измеренными как сопутствующие во времени или измеренными последовательно одна за другой для одних и тех же «психологических объектов»;

2) о связях между независимой и зависимой переменными;

3) об общих причинных факторах, лежащих в основе множественных показателей одних и тех же базисных процессов;

4) о ненаблюдаемых связях между латентными переменными;

5) об эмпирических зависимостях между наблюдаемыми (и измеряемыми) переменными при невозможности контролировать направленность влияния одной переменной на другую;

6) о возможностях снижения размерности данных.

Пояснения

С точки зрения широкой трактовки, что такое гипотезы о связях (без уточнения разницы в формулировках психологической и статистической гипотез), утверждения 1 и 5 должны быть признаны верными ответами. В утверждении 2 подразумевается необходимость отличать использование мер связей (т.е. проверку статистических гипотез о коэффициентах корреляции) в экспериментальном исследовании от корреляционного исследования как способа сбора данных, в котором не могут быть осуществлены формы экспериментального контроля.

Утверждение 4 предполагает знания о том, что такое латентные переменные (это непосредственно не измеряемые психологические конструкты, хотя они могут быть реконструированы посредством двух и более реально измеряемых переменных).

Утверждения 3 и 6 включают разные формулировки возможностей сведения множества переменных в корреляционном по типу сбора данных исследовании к меньшему числу шкал, фокусирующих на себе возможности объяснений эмпирически установленных связей. Оба утверждения остаются верными лишь в той степени, в какой осознается отличие подразумеваемых в них факторов в качестве постулируемых (или мифологичных) «причин» связей между переменными от понятия каузальных факторов как условий, которыми исследователь может управлять (в различных вариантах экспериментального или квазиэкспериментального контроля).

Утверждение 2

Корреляционные исследования могут проводиться с целью:

1) построения прогноза изменений одной переменной по значениям другой;

2) проверки каузальной гипотезы при невозможности выполнения первого условия причинного вывода (по Кэмпбеллу);

3) проверки психологических гипотез по отношению к событиям, имевшим место до момента осуществления исследования;

4) выявления оснований для теоретической интерпретации направленности связей между переменными;

5) статистического контроля показателей, репрезентирующих изучаемый базисный процесс;

6) выявления эффектов взаимодействий двух и более переменных.

Утверждение 3

Корреляционные исследования относятся к «пассивно-наблюдающим» потому, что:

1) в них используются отличные от активного экспериментирования способы организации психологических воздействий;

2) переменные рассматриваются в них как существующие до момента их измерения;

3) в них используется статистический контроль переменных;

4) в них отсутствует стратегия рандомизации (как способ подбора групп, способ отбора испытуемых из популяции, способ задания последовательностей при контроле факторов времени и задач);

5) эффект воздействия (одной переменной на другую) в них не связывается с манипуляцией переменной;

6) переменные представлены в них как результаты использования методик (или «техник») наблюдения.

Утверждение 4

Корреляционное исследование отличается от истинного эксперимента тем, что:

1) в нем применяются отличные от экспериментальных формы контроля смешений с побочными переменными;

2) в нем отсутствует функциональный контроль независимой переменной;

3) в нем отсутствует планирование как определение способов сбора данных;

4) в нем реализуется индуктивная логика вывода при обобщении эмпирически полученных результатов;

5) в нем операционализация переменных зависит от исследователя;

6) в нем используется подсчет коэффициентов корреляции.

Утверждение 5

Валидность корреляционного исследования тем выше:

1) чем выше величина установленной корреляционной связи;

2) чем больше оно приближено к безупречному эксперименту;

3) чем лучше решены проблемы соответствия переменных;

4) чем меньше источников конкурирующих гипотез остается вне контролируемых исследователем условий;

5) чем больше переменных было подвергнуто статистическому контролю;

6) чем выше надежность измерения переменных (качество данных).

Утверждение 6

Установление корреляций между измеренными переменными:

1) обеспечивает каузальный вывод из результатов корреляционного исследования;

2) является одним из условий каузального вывода при проведении истинного эксперимента;

3) позволяет осуществлять статистические решения применительно к данным, собранным как в корреляционных, так и в экспериментальных исследованиях;

4) позволяет оценить эффект детерминации одной переменной со стороны другой;

5) служит основанием многомерного анализа данных;

6) позволяет проверять модели связей между переменными, включающие каузальные предположения.

Утверждение 7

В корреляционных исследованиях применяются следующие формы контроля:

1) индивидуальный подбор пар испытуемых;

2) подбор групп, отличающихся по уровням переменной;

3) контроль ex post factum;

4) контроль латентных переменных;

5) отбор испытуемых из популяции в эквивалентные группы;

6) преобразования шкал, в которых измерены вариаты.

Утверждение 8

Коэффициент корреляции является:

1) отношением подсчитанной ковариации к максимально возможной;

2) способом выявления статистической взаимосвязи между переменными, каждая из которых должна иметь распределение, приближенное к нормальному;

3) способом определения величины воздействия независимой переменной на зависимую;

4) мерой связи переменных, измеренных в единицах стандартного отклонения;

5) подсчитанной суммой произведений моментов – отклонений значений каждой переменной от среднего.

Утверждение 9

Коэффициент ковариации характеризуется тем, что:

1) дает количественную характеристику диаграммы рассеивания;

2) является мерой связи двух переменных;

3) зависит от единиц измерения переменных;

4) отличается от коэффициента корреляции по величине;

5) отличается от коэффициента корреляции по отношению к месту, занимаемому в логике вывода (при переходе от статистических решений к выводам об исследуемой зависимости);

6) является дисперсией.

Утверждение 10

Укажите способы представления результатов, используемые в корреляционном исследовании:

1) диаграммы;

2) аналитическое и графическое представление ОРД (основных результатов действий) и взаимодействий переменных;

3) коэффициенты корреляции;

4) матрицы интеркорреляций;

5) коэффициенты регрессии.

Глава 13

Наши рекомендации