Возможности использования критерия
1. Сопоставление выборок по качественно определяемому признаку.
2. Сопоставление выборок по количественно измеряемому признаку.
3. Сопоставление выборок и по уровню, и по распределению признака.
Корреляционный анализ.
1. Корреляция – мера согласованности одного признака с другим, с несколькими, либо взаимная согласованность группы признаков.
2. Корреляционная связьотражает тот факт, что изменения одного признака находятся в некотором соответствии с изменениями другого признака. Корреляционнаяжезависимость указывает на причинно-следственную связь изменений двух признаков, что, строго говоря, не всегда соответствует действительности, так как корреляционные методы не выявляют этой причинности, а лишь указывают на наличие некоторого соответствия. Признаки могут находиться не только во взаимной зависимости друг от друга, но и оба в зависимости от какого-либо третьего воздействия, не включенного в область рассмотрения. Таким образом, более корректно употреблять понятие корреляционная связь.
3. Корреляционная связь носит характер вероятностной.Важно отличать такую зависимость (даже если мы рискуем пользоваться этим термином) от функциональной зависимости. Функция, во-первых, непрерывна, тогда как при корреляционной зависимости значения, принимаемые признаком, дискретны. Во-вторых, функциональная зависимость предполагает взаимно однозначное соответствие аргумента х и функции f(х), вероятностная же зависимость допускает некий условный диапазон, в который предположительно (с такой-то долей вероятности) попадает значение признака уi при значении хi признака х.
Рисунок 14.
4. Применение термина «корреляционная зависимость» уместно в тех случаях, когда мы сами контролируем воздействие одного признака на другой или так организуем эксперимент, что имеем возможность точно определить интенсивность не зависящих от нас воздействий (независимые переменные). Признаки, которые мы измеряем, и которые, по нашему предположению, могут меняться под заданным воздействием, называются зависимыми переменными. Иными словами, при принятом нами постоянстве одних переменных (независимых), фиксировано изменив их, мы предполагаем некоторое (неизвестное заранее) изменение исследуемых переменных (зависимых). Это деление, как уже было сказано, условно, так как не известно доподлинно, какой именно из признаков влияет на другой.
5. Корреляционные связи различаются по следующим характеристикам:
По форме – зависимость может быть линейной и нелинейной. (Пример1: покупаемость товара в зависимости от количества предъявлений его рекламы.)
Рисунок 15.
По направлению – усилению одного признака соответствует усиление другого припрямом направлении корреляции и ослабление - при обратном. (Важно: есть опасность ошибочного понимания того, что направление корреляции якобы указывает на то, какой признак на какой влияет. Направление указывает только на уменьшение-увеличение одного при изменении другого, но не более!)
По силе – сила связи не зависит от направления и определяется абсолютной величиной коэффициента корреляцииr. При r = 1 наблюдается жесткая положительная связь, то есть при увеличении признака а обязательно увеличится признак в; при значении r =-1– гарантированно уменьшится; при значении r = 0– изменение а гарантированно никоим образом не повлечет за собой изменения в.
6. Классификация корреляционных связей по степени силы.
А) общая:
Сильная или тесная | более 0,70 |
Средняя | от 0,50 до 0,69 |
Умеренная | от 0,30 до 0,49 |
Слабая | от 0,20 до 0,29 |
Очень слабая | меньше 0,19 |
Б) частная:
Высокая значимая корреляция | при r соответствующем уровню статистической значимости р меньше или равно 0,01 |
Значимая корреляция | р меньше или равно 0,05 |
Тенденция достоверной связи | р меньше или равно 0,10 |
Незначимая корреляция | при r, не достигающем уровня статистической значимости. |
Первая из классификаций ориентирована только на величину коэффициента корреляции, а вторая определяет, какого уровня значимости достигает данная величина коэффициента корреляции при данном объеме выборки. Чем больше объем выборки, тем меньшей величины коэффициента корреляции оказывается достаточно для того, чтобы корреляция была признана достоверной. В результате, при малом объеме выборки и сильная корреляция может оказаться недостоверной. (Это объясняется большой возможностью обнаружения случайных связей, поскольку число всех сочетаний в малых выборках также мало.) В то же время, при больших объемах выборки даже слабая корреляция между какими либо признаками может оказаться достоверной.
Пример: "отношение числа новорожденных мальчиков к числу новорожденных девочек" Рассмотрим следующий пример, заимствованный из Nisbett, et al., 1987. Имеются 2 больницы. Предположим, что в первой из них ежедневно рождается 120 детей, во второй только 12. В среднем отношение числа мальчиков, рождающихся в каждой больнице, к числу девочек 50/50. Однажды девочек родилось вдвое больше, чем мальчиков. Спрашивается, для какой больницы данное событие более вероятно? Ответ очевиден для статистика, однако, он не столь очевиден неискушенному. Конечно, такое событие гораздо более вероятно для маленькой больницы. Объяснение этого факта состоит в том, что вероятность случайного отклонения (от среднего) возрастает с уменьшением объема выборки.
7. Линейная и ранговая корреляция. Метод линейной корреляции (корреляции Пирсона) применяется для определения меры соответствия двух признаков, выраженных количественно, иными словами, - для численных величин. Это параметрический метод, который (как и прочие параметрические) требует соответствия распределения данного исследуемого признака закону нормального распределения. В отличие от этого метода, метод ранговой корреляции (корреляция Спирмена) применим к любым количественно измеренным или ранжированным данным. Этот метод способен, в отличие от других, измерять согласованность изменения разных признаков у одного испытуемого или выявлять совпадения индивидуальных ранговых показателей у двух испытуемых; или у испытуемого и усредненный показатель некой группы; или какие-либо показатели в сравнении двух групп.
8. Метод ранговой корреляции Спирмена позволяет определить силу и направление корреляционной связи между двумя признаками или двумя иерархиями признаков.
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами могут быть:
А) Два признака, измеренные в одной и той же группе переменных (наиболее часто в этом качестве выступает группа людей, которых принято тогда именовать испытуемыми или респондентами. Естественно, под переменными подразумеваются не сами люди, а данные ими ответы на те или иные вопросы.)
Б) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (скажем, по ответам на пункты анкеты или теста).
В) Две групповые иерархии признаков (например, соответствие каких-либо выборов, сделанных одной группой людей выборам другой группы).
Г) Индивидуальная и групповая иерархии признаков (например, сопоставление индивидуальной иерархии жизненных ценностей сотрудника усредненному мнению группы на этот же счет; сопоставление последовательности товаров, которые приобрели бы (в среднем) жители города А и города Б при условии получения премии, на которую заранее не рассчитывали.)
9. Ограничения метода ранговой корреляции. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки – меньше или равна 40. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае несоблюдения такого условия вносится поправка на одинаковые ранги (будет дано ниже). Помимо этих ограничений, следует так же помнить об ограничениях корреляционного метода вообще – невозможность обнаружения причинной связи между явлениями.
10. Графическое представление корреляции.
Рисунок 16.
На рисунке (16 – А) показана жесткая связь с коэффициентом корреляции, равным +1. Увеличению признака А сопутствует увеличение признака В на ту же величину. Рисунок (16 – Б) – нет взаимосвязи между изменениями А и В. При увеличении А, В может меняться как в сторону увеличения, так и в сторону уменьшения. Рисунок (16 – В) – пример сильной корреляции с коэффициентом -1. Увеличение признака А сопровождается пропорциональным уменьшением признака В.
Линейная корреляция.
Предположим, что мы располагаем выборкой данных о какой-то группе объектов. Пусть эти объекты обладают общими родовыми особенностями (примерно одинаковы). Пусть, к тому же, у каждого из объектов можно количественно измерить, как минимум, два каких-либо параметра. При этих обстоятельствах открывается возможность для подсчета линейной корреляции между двумя (или более) признаками, присущими этим объектам.
Например, такими выборками данных могут служить сведения о:
- группе людей, рост и вес тела которых мы измеряем;
- длине и ширине лепестка какого-нибудь цветка;
- длине ствола оружия и начальной скорости пули;
- величине IQ и времени решения учебной задачи;
- длине тела и длине хвоста крокодила или тигра (если найдется желающий их измерять),
и т.д.
Во всех этих примерах имеется возможность определить корреляцию, то есть – степень согласованности в изменении двух признаков. «Чем больше крокодил, тем длиннее ли его хвост?» «Решают ли люди с высоким коэффициентом интеллекта задачи такого-то типа быстрее, чем с низким и средним?»