Понятие о корреляционныхсвязях
Во многих отраслях экономики невозможно корректное решение многих проблем без применения статистических зависимостей между исследуемыми
факторами. Это вызвано тем, что подавляющее число взаимосвязей между величинами имеет не функциональный (детерминированный) характер, а стохастический (случайный).
Так, например, объем продаж продукции невозможно точно прогнозиро- вать с изменением цены, производительность обработки заготовок на станках вероятностно зависит от режимов резания, качество шлифованных поверх- ностей так же с какой-то долей вероятности определяется величиной зерни- стости абразивного инструмента и т. д. Практически вся эконометрия зиж- дется на статистических зависимостях.
В математике для описания связей между переменными величинами ис- пользуют понятие функции F, которая ставит в соответствие каждому опре- деленному значению независимой переменной X определенное значение за- висимой переменной Y. Поэтому полученная зависимость Y = F(X) называ- етсяфункциональной. Эта зависимость однозначна, т.е. для данного значе- нияX будет существовать единственное значение Y.
В тоже время для стохастических процессов связь между переменными может быть выявлена чаще всего только после соответствующей обработки данных.
Допустим, например, что производится механическая обработка загото- вок типа тел вращения на токарном станке с разной глубиной резания s при постоянной подаче. Очевидно, что объем снятого материала Q при увеличе- нии глубины резания будет пропорционально расти. Функциональная зави- симость объема от глубины резания выразится уравнением Q = k·s, где k – постоянный множитель. В действительности при изменении глубины резания прирост объема снятого материала не будет точно подчиняться приведенно- му уравнению, так как в процессе резания на резец и деталь действуют слу- чайные факторы в виде динамических возмущений, изменяющие значения
показателей процесса, рассчитанных в приведенном уравнении на какие-то постоянные условия обработки. Эти постоянные условия заложены в посто- янный множитель k. К динамическим факторам резания относятся темпера- тура резания, износ режущей кромки резца, вибрации элементов технологи- ческой системы и др. Возможный график стохастической зависимости объе- ма материала от глубины резания имеет вид, отраженный на рис. 2.15.
Q, см3
Рис. 2. 15. Стохастическая зависимость переменных Q
и s. 1 – линия регрессии
Такого рода статистическая зависимость между переменными величина- ми называются корреляционной.Корреляционная зависимость возникает тогда, когда один из признаков зависит не только от второго, но и от ряда случайных факторов или условий, от которых зависят оба фактора. Корреля- ционные связи не могут рассматриваться как свидетельство причинно- следственной зависимости. Они свидетельствуют лишь о том, что изменения одного признака, как правило, соответствуют определенному изменению другого. При этом неизвестно, находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков [17].
Виды корреляционных связей между измеренными признаками могут быть линейными и нелинейными, положительными или отрицательными. Варианты корреляционных связей отражены на рис. 2.16 (а - г). Возможна также ситуация, когда между переменными невозможно установить какую- либо зависимость (рис. 2.16 г). В этом случае говорят об отсутствии корреля- ционной связи. С целью выявления характеристик корреляционных зависи- мостей применяют корреляционный анализ.
Прежде чем начать исследование парной стохастической зависимости, необходимо убедиться, что массив данных характеризует наличие только двух переменных, корреляционные связи которых надо раскрыть. То есть на- до проанализировать собранную информацию на предмет расслоениядан- ных измерения, проверить возможность вмешательства в одну из перемен- ных дополнительного стратифицирующего фактора.
n =30 r ¸- 0,9 |
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 1 2 3 4 5 6 7 x
a
у n =30 r¸0,0
0 1 2 3 4 5 6 7 x
б
n =30 |
Выбросы |
7 7
6 6
5 5
4 4
3 3
2 2
1 1
0 1 2 3 4 5 6 7 х
0 1 2 3 4 5 6 7 х
в г
Рис. 2. 16. Диаграммы рассеяния: а) положительная корреляция, б) отрицательная корреляция, в) корреляция отсутствует,
г) выбросы измерений из поля корреляции
В задачи корреляционного анализа входит:
- установление направления (положительное или отрицательное) и формы (линейная или нелинейная) связи между варьирующимипризнаками,
- измерение тесноты связи (значения коэффициентовкорреляции),
- проверка уровня значимости коэффициентовкорреляции.