Коэффициент ассоциации:

A B A+B
C D C+D
A+C B+D A+B+C+D

Коэффициент ассоциации: - student2.ru

а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков

Kaс.кр=|0.5|. Если Kaс>Ккр –то подтв.гипотеза Н1, если наоборот-Н0.

Коэффициент контингенции:

Коэффициент ассоциации: - student2.ru

Если Kk>=0.3 подтверждается гип.Н1, если наоборот-Н0.

для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации. |Ka|>=Kk

Эти коэф-ты используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.

Коэффициент сопряженности Чупрова

Коэффициент ассоциации: - student2.ru

N1-число вариантов значений первого признака

N2-число вариантов знач.2-го признака

Коэф-т корреляции Пирсона:

 
  Коэффициент ассоциации: - student2.ru

Интерпретация Пирсона:Отклонение признака-фактора от его среднего на величину стандартного отклонения в среднем приводит к отклонению признака-результата от своего среднего на величину r его стандартного отклонения.

Коэффициент корреляции Пирсона -1 ≤ Rxy ≤ 1. Rxy = -1Строгая отрицательная корреляция, Rxy = 1Строгая положительная корреляция, Rxy = 0Отсутствие корреляции

0,7 ≤ | Rxy | ≤ 1 Сильная корреляция, 0,5 ≤ | Rxy | ≤ 0,7 Средняя корреляция, 0,3 ≤ | Rxy | ≤ 0,5 Слабая корреляция, 0 ≤ | Rxy | ≤ 0,3 Незначимая корреляция

Меры тесноты парной связи:

Коэф-т Фехнера:мера тесноты связи виде отклонения разности числа пар совпадений и несовпадений признаков отклон. от среднего.

 
  Коэффициент ассоциации: - student2.ru

C – количество совпадающих знаков отклонений от средних

H – количество несовпадающих знаков отклонений от средних

C + H = n

Алгоритм расчета:

-расчет среднего для X и Y

-сравнение индивид.значений xi и yi со средними значениями с обязат.указаниями знака (+ или -). Если совпад., то относим к «С», если не совпад.,то к «Н».

-считаем кол-во совпад.или несовпад.

Коэффициент Спирмена:

Коэффициент ассоциации: - student2.ru Не параметр.показатель, с помощью кот.пытаемся выявить связи между рангами соответ.величин.

где di – разность рангов по обоим признакам для каждого объекта.

Регрессионный анализ.

Простейшим видом уравнения регрессии является парная линейная зависимость.

Коэффициент ассоциации: - student2.ru

где y – зависимая переменная (признак-результат),

x – независимая переменная (признак-фактор).

В качестве уравнения регрессии могут быть выбраны различные математические функции: чаще всего исследуется линейная зависимость, парабола, гипербола, степная функция. Но исследование начинается с линейной зависимости, так как результаты поддаются содержательной интерпретации.

При нанесении на поле корреляции точек, координаты которых соответствуют значениям зависимых и независимых переменных выявляется тенденция связи между ними.

Смысл построения уравнения регрессии состоит в описании тенденции зависимости признака-результата от признака-фактора.

Если линия регрессии проходит через все точки поля корреляции, то эта функциональная связь. Так как всегда присутствует ошибка, поэтому нет функциональной связи.

Наличие ошибки связано с тем что:

§ не все факторы, влияющие на результат, учитываются в уравнении регрессии;

§ может быть неправильно выбрано уравнение регрессии или форма связи.

Уравнение регрессии описывает изменения условного среднего значения признака-результата под влиянием конкретных значений признака-фактора, то есть это аналитическая форма тенденции зависимости между изучаемыми признаками. Уравнение регрессии строится на основе фактических значений признаков, и для его использования нужно рассчитать параметры уравнения а и b. Определение значений параметров, как правило, выполняется с использованием методов наименьших квадратов (МНК).

Суть метода состоит в том, что удается минимизировать сумму квадратов отклонений фактических значений признака-результата от теоретических, рассчитанных на основе уравнения регрессии, что оценивает степень аппроксимации поля корреляции уравнением регрессии.

Коэффициент ассоциации: - student2.ru

Задача состоит в решении задачи на экстремум, то есть найти при каких значениях параметров а и в функции S достигает минимума.

Коэффициент ассоциации: - student2.ru

Проводя дифференцирование, приравниваем частные производные к нулю Коэффициент ассоциации: - student2.ru и Коэффициент ассоциации: - student2.ru , получаем систему уравнений. Решая ее, находим значения параметров а и в.

Коэффициент ассоциации: - student2.ru Коэффициент ассоциации: - student2.ru

Параметр в в уравнении регрессии называется коэффициентом регрессии и характеризует на сколько единиц своего измерения изменится признак-результат при изменении признака-фактора на единицу своего измерения. Знак при коэффициенте регрессии характеризует направленность зависимости (прямая или обратная). Параметр а в уравнении регрессии содержательно не интерпретируется, а характеризует лишь расположение линии на графике.

Пример.

Коэффициент ассоциации: - student2.ru

Данное уравнение показывает тенденцию зависимости заработной платы (у) от прожиточного минимума (х). Коэффициент в (в данном случае равный 0,92) характеризует следующее: при увеличении на 1 рубль потребительской корзины заработная плата возрастает на 92 копейки

38. Множественная регрессия.

Уравнение множественной регрессии – аналитическая форма зависимости признака-результата от двух или более признаков-факторов.

Коэффициент ассоциации: - student2.ru

в - коэффициент регрессии

В уравнении множественной регрессии их называют условно чистыми коэффициентами. Их можно назвать чистыми коэффициентами, если бы в уравнении регрессии удалось включить все факторы определяющие результат..

Это невозможно пор нескольким причинам:

§ Ограниченный объем совокупности (число факторов должно 5-6 раз, идеально в 10 раз, меньше объема совокупности).

§ Не по всем факторам имеются данные.

§ Не все факторы имеют количественную оценку.

§ Не знаем о факторах, которые реально влияют на результат.

Интерпретация коэффициентов множественной регрессии аналогична интерпретации коэффициентов парной регрессии.

Коэффициент регрессии во множественном уравнении регрессии не равен коэффициенту регрессии в парном уравнении регрессии (при оценке влияния одного итого же фактора), так как в уравнении множественной регрессии величина коэффициента рассчитывается в условиях элиминирования влияния ряда факторов, включенных в уравнение.

Цели, виды.

При использовании методов корреляционно-регрессионного анализа можно выделить три группы решаемых практических задач.

4. Задачи, связанные с установлением наличия или отсутствия корреляционной зависимости. Решение этих задач предполагает расчет показателей корреляции.

5. Группа задач диктуется желанием управлять тем или иным объектом, или признаком через воздействие на факторы его определяющие. При этом строиться уравнение связи, называемое регрессионным, и производится ранжирование факторов по степени их влияния на результат.

6. Прогнозирование изменения того или иного явления или признака в условиях изменения соответствующих признаков-факторов. В основе решения данных задач лежат уравнения регрессии, которые в данном случае не являются самоцелью. Основное – это расчет прогнозируемых значений результативного признака с расчетом доверительных интервалов и указанием уровня доверительной вероятности.

Для решения всех задач используют методы корреляции и регрессии, но так как у них много общих вычислительных процедур, то принято говорить о корреляционно-регрессионном анализе.

Условия применения методов корреляционно-регрессионного анализа

6. Наличие статистической совокупности достаточно большого объема. Объем совокупности должен превышать в 5-6 раз (идеально в10 раз) число факторов, включенных в анализ.

7. Изучаемая совокупность должна быть однородна.

8. Независимость наблюдений и отсутствие мультиколлинеальности факторов.

9. Признаки, участвующие в анализе должны иметь количественное выражение.

10. Распределение единиц совокупности должно соответствовать нормальному закону распределения.

Наши рекомендации