Измерение тесноты связи между признаками.
Пок-ли тесноты связи хар-т завис-ть вариации рез-го признака от вариации факторного. Зная пок-ли тесноты связи, мы можем реш след вопросы:
1)о целесообр-ти изуч-я дан связи между признаками
2)сопоставляя пок-ли тесноты связи рез-го признака с различными факторами, можно выявить наиболее значимые из них. Для изучения тесноты связи прим ряд пок-лей и приёмов:
1)коэф корр-ции Фехнера, или знаков – оценивает связь на основе сравнений знаков, отклон знач призн от ср-х арифм-х “+” – согласованная вариация, ”-” – нарушение согласов-ти.
Любой коэф корр-ции может приним знач от 0 до 1. Чем ближе к 1, тем связь теснее.
2)более точным пок-лем явл коэф корр-ции рангов, исчисляемый на основе параллельных рядов. Коэф корр-ции Спирмена: ρ=1 - 6Σd2 / n(n2-1), где d – разность между рангами признаков. Ранг – номер места величины признака в ранжированном ряду.
3)коэф корр-ции рангов Кендэла: τ =(2S) / (n(n-1)) Коэф Кендэла: от -1 до +1 и =0 при отсутствии связи между рядами рангов.
При достат большом наблюдении между коэф кор рангов Спирмена и Кендэла сущ след соотнош: ρ≈3/2 τ.
4)линейный коэф корр-ции. Для его расчета необходимо учесть размер отклонений признаков x и y от средней арифметич. Необходимо превратить абсол отклонения в относит и исчислить нормированные отклонения:
tx= (x – x с чертой)/Gx ; ty= (y – y с чертой)/Gy ;
r =Σtxty / n; r= (Σdxdy) / (√Σdx2Σdy2), т к dx = x- x с чертой. dy = y- y с чертой.
5)при наличии криволин связи рекоменд исп эмпирическое корр-ное отношение η – его расчёт основан на исп теоремы сложения дисперсий. Gобщ2=δ2 + G2 с чертой; η=√( δ2/ Gобщ2 )
6)коэф эластичности Э=а1* (x с чертой / y с чертой). Показывает на сколько % в средней измен велич y с изменением велич x на 1%
7)коэф корр-ции или контингенции. Их расчёт основан на наблюдении частоты совместного появления атрибутивных признаков. Связь между ними счит-ся тем сильнее, чем выше относит частота такого появления. Ка=(ad-bd)/(ad+bd); Кк=(ad-bd)/√(a+b)(b+d)(a+c)(c+d). Связь существенна, если эти коэф-ты соотв-но не ниже 0,5 и 0,3.
Сама по себе величина коэф корр-ции не явл док-вом наличия причинно – следственной связи между признаками, а явл оценкой степени взаимной согласов-ти в изменениях признаков.
Выявление влияния отд-х факторов на изучаемый.
Применение метода корр-го анализа даёт возм-ть выражать связь между признаками аналитически и придавать ей колич значение. Связь между признаками м б описана ур-ем прямой. Yx c чертой=a0+a1x. В ур-нии x всегда известен, для опред-я Yx c чертой надо найти a0 и a1, представляющ собой среднее значение некот-х пок-лей, принимаемыми в ур-нии постоянными. Известно, что с т зр мат содержания a0 явл отрезком ординаты при x = 0, а a1 – tg угла наклона прямой. Нахождение этих параметров пр-ся по способу выравнивания наименьших квадратов. Теоретичнски линия регрессии д обладать осн св-ми ср арифметич.1)Σd=0 (сумма отклонений от ср арифметич = 0) 2) Σd2 = min. Если обозначить ординаты фактических точек поля корр-ции через y , а ординаты теоретич лин через yx c чертой, то второе условие можно представить следующим образом Σот 1 до n (y; yx c чертой)2 = min. Это условие лежит в основе способа наименьших квадратов. Т к Yx c чертой=a0+a1x, мы можем переписать: √ (Σот 1 до n ( yi - a0- a1x)2 )=min. Исчисляя первую производную по a0 и a1 от ф-ии и приравнивая каждую из производных к 0, мы сможем определить те значения a0 и a1, при кот Σот 1 до n (yi – yx с чертой) , будет минимальной. Из равенства нулю первой производной по aо, мы получим систему: Σy = nao + a1Σx и Σxy =a1 Σx + a1 Σx2 . Σy = Σyx с чертой – контроль правильности расчётов. Завис-ть между признаками м б прямая, криволинейная. Кроме парной корр-ции возможно исчислить зависимость одного признака от нескольких, т е будет иметь место Ур-ние множественной корр-ции.
Множественная корр-ция.
Обществ явления склад-ся под возд многих причин, т е мы имеем множественную корр-цию. Методология решения задач множественной корр-ции таже, что и парной, т е устан-ся наличие связи, тесноту, форму и влиян отд факт на общий рез-т. Но есть ряд особенностей: 1)иногда приход-ся укрупнять ед-цы наблюдения (изучать не отд-х рабочих, а целые бригады, или не СУ, а тресты) 2)численность исследуемой сов-ти д превосходить число факторов в 6 – 7 раз 3)д б тщат отбор факт и содержательный их а-з для выбора Ур-ния связи.
Существенным при составлении ур-ния множ регрессии явл выбор типа ф-ии. Модель д иметь математич решение, а для этого её нужно выразить в форме одной из известных функций. Как и при парной корр-ции, указание на ф-цию можно получить из логического анализа, предыдущего опыта, экспертных оценок. Множ корр-ция связи в большинстве случаев изображ-ся ф-ми линейного типа, либо степенного. Затем параметры Ур-ния связи нах путём реш системы норм-х Ур-ний. Для опред тесноты связи польз коэф множествен корр-ции (совокупной), предварительно исчислив коэф парной корр-ции. Если y зависит от x и z, то парный коэф корр-ции м рассчитать:
rxy = (nΣxy – ΣxΣy) / (√([nΣx2 – (Σx)2] [nΣy2 – (Σy)2]); rzy ; rxz; Ry(x,z) = √( rxy 2 + rzy 2 - 2rxy rxz rxy rzy) (1 - rxy2); Ry измен-ся от 0 до 1.