Понятие функциональной зависимости

Будем говорить, что между двумя признаками X и Y существует функциональная зависимость (взаимосвязь), при которой каждому значению одного из них соответствует одно или несколько строго определенных значений другого. Например, в функции у = 2 * х каждому значению х соответствует в два раза большее значение у . В функции Понятие функциональной зависимости - student2.ru каждому значению у соответствует 2 определенных значения х . Графически это выглядит так (рис. 6, 7 соответственно):

Понятие функциональной зависимости - student2.ru

Понятие корреляционной зависимости и ее направленности

Будем говорить, что между двумя признаками Х и У существует корреляционная зависимость (взаимосвязь), при которой с изменением одного признака изменяется и другой, но каждому значению признака Х могут соответствовать разные, заранее непредсказуемые значения признака У, и наоборот.

Для различия направленности влияния одного признака на другой введены понятия положительной отрицательной связи.

Если с увеличением (уменьшением) одного признака в основном увеличиваются (уменьшаются) значения другого, то такая корреляционная связь называется прямой или положительной.

Если с увеличением (уменьшением) одного признака в основном уменьшаются (увеличиваются) значения другого, то такая корреляционная связь называется обратной или отрицательной.

41) Построение корреляционной таблицы начинают с группировки значений фактического и результативного признаков. В первый столбик следует вписать значения факторного признака (x), а первую строку заполнить значениями результативного признака (y). Числа, полученные на пересечении строк и столбцов, означают частоту повторения данного сочетания значений x и y.

Корреляционная таблица зависимости заработной платы от стажа

Примечание: В таблице используются следующие обозначения:

yj – среднее значение результативного признака для j-той группы значений факторного признака;

fx – частота повторения данного варианта значения факторного признака во всей совокупности;

fy – частота повторения результативного признака во всей совокупности.

Данная корреляционная таблица уже при общем знакомстве даёт возможность выдвинуть предположение о наличии или отсутствии связи, а также выяснить её направление, Если частоты расположены по диагонали из верхнего левого угла в правый нижний, то связь между признаками прямая. Если же частоты расположены по диагонали справа налево, - то связь обратная. В данном случае можно предположить наличие прямой связи.

Корреляционная зависимость чётко обнаруживается только при рассмотрении средних значений результативного признака, соответствующих определённым значениям факторного признака, т.к. при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов будет взаимопогашаться, и чётче выступит зависимость результирующего признака от фактора, положенного в основу группировки.

42) При изучении корреляционной связи важным направлением анализа является оценка степени тесноты связи.
Понятие степени тесноты связи между двумя признаками возникает вследствие того, что в реальной действительности на изменение результативного признака влияют несколько факторов. При этом влияние одного из факторов может выражаться более заметно и четко, чем влияние других факторов. С изменением условий в качестве главного, решающего фактора может выступать другой.
При статистическом изучении взаимосвязей, как правило, учитываются только основные факторы. А вопрос необходимо ли вообще изучать более подробно данную связь и практически ее использовать, решается с учетом степени тесноты связи.
Зная количественную оценку тесноты корреляционной связи, таким образом, можно решить следующую группу вопросов:

1) необходимо ли глубокое изучение данной связи между признаками и целесообразно ли ее практическое применение;

2) сопоставляя оценки тесноты связи для различных условий, можно судить о степени различий в ее проявлении в конкретных условиях;

3) последовательное рассмотрение и сравнение признака у с различными факторами (х1, х21, …) позволяет выявить, какие из этих факторов в данных конкретных условиях являются главными, решающими факторами, а какие второстепенными, незначительными факторами;

Показатели тесноты связи должны удовлетворять ряду основных требований:

1) величина показателя степени тесноты связи должна быть равна или близка к нулю, если связь между изучаемыми признаками (процессами, явлениями) отсутствует;

2) при наличии между изучаемыми признаками (х и у) функциональной связи величина степень тесноты связи равна единице;

3) при наличии между признаками (х и у) корреляционной связи показатель тесноты связи выражается правильной дробью, которая по величине тем больше, чем теснее связь между изучаемыми признаками (стремится к единице);

4) при прямолинейной корреляционной связи показатели тесноты связи отражают и направление связи: знак (+) означает наличие прямой (положительной) связи; а знак (-) – обратной (отрицательной).
Для характеристики степени тесноты корреляционной связи могут применяться различные статистические показатели: коэффициент Фехнера (КФ), коэффициент линейной (парной) корреляции (r’), коэффициент детерминации, корреляционное отношение ( ), индекс корреляции, коэффициент множественной корреляции (R), коэффициент частной корреляции (r’) и др.
В данном вопросе рассмотрим коэффициент линейной корреляции (r) и корреляционное отношение ( ).
Более совершенным статистических показателем степени тесноты корреляционной связи является линейный коэффициент корреляции (r), предложенный в конце XIX в.
При расчете коэффициента корреляции сопоставляются абсолютные значения отклонений индивидуальных величин факториального признака х и результативного признака у от их средних, т.е. и .
Однако непосредственно сопоставлять между собой эти полученные результаты нельзя, т.к. признаки, как правило, выражены в различных единицах и даже при наличии одинаковых единиц измерения будут иметь различные по величине средние и различные вариации. В этой связи сравнению подлежат отклонения, выраженные в относительных величинах, т.е. в долях среднего квадратического отклонения (их называют нормированными отклонениями).

Xi Yi Знаки отклонений значений признака от средней Совпадение (а) или несовпадение (в) знаков
Для Xi Для Yi
- - А
- + В
- + В
- + В
+ - В
+ - В
+ - В

Коэффициент Фехнера. Пример решения

Коэффициент корреляции знаков, или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

Понятие функциональной зависимости - student2.ru ,

где na - число совпадений знаков отклонений индивидуальных величин от средней; nb - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:

Для примера: Понятие функциональной зависимости - student2.ru .

Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Расчет коэффициента Фехнера состоит из следующих этапов:

Определяют средние значения для каждого признака (X и Y).

Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.

Если знаки совпадают, присваивают значение А, иначе В.

Считают количество А и В, вычисляя коэффициент Фехнера по формуле:

Kф = (na - nb)/(na + nb)

где na - число совпадений знаков отклонений индивидуальных величин от средней; nb - число несовпадений.

Графическое представление коэффициента Фехнера

Понятие функциональной зависимости - student2.ru

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).

2) Определить разности рангов каждой пары сопоставляемых значений.

3) Возвести в квадрат каждую разность и суммировать полученные результаты.

4) Вычислить коэффициент корреляции рангов по формуле:.

Понятие функциональной зависимости - student2.ru

где Понятие функциональной зависимости - student2.ru - сумма квадратов разностей рангов, а Понятие функциональной зависимости - student2.ru - число парных наблюдений.

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.

Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных , но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности

44) Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции r, для расчета которого можно использовать, например, две следующие формулы:

Понятие функциональной зависимости - student2.ru Понятие функциональной зависимости - student2.ru

Линейный коэффициент корреляции может принимать значения в пределах от -1 до + 1 или по модулю от 0 до 1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак указывает направление связи: «+» - прямая зависимость, «-» имеет место при обратной зависимости.

В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.

Наши рекомендации