Определение тесноты связи между случайными величинами
Определив уравнение теоретической линии регрессии, необходимо дать количественную оценку тесноты связи между двумя рядами наблюдений. Линии регрессии, проведенные на рис. 4.1, б, в, одинаковы, однако на рис. 4.1, б точки значительно ближе (теснее) расположены к линии регрессии, чем на рис. 4.1, в.
При корреляционном анализе предполагается, что факторы и отклики носят случайный характер и подчиняются нормальному закону распределения.
Тесноту связи между случайными величинами характеризуют корреляционным отношением рху. Остановимся подробнее на физическом смысле данного показателя. Для этого введем новые понятия.
Остаточная дисперсия 5^ост характеризует разброс экспериментально
наблюдаемых точек относительно линии регрессии и представляет собой показатель ошибки предсказания параметра у по уравнению регрессии (рис. 4.6):
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА...
s2 =f[y.-yT
у ост -, / X г i\
п -1
п-\-к
^[_у. - f {х1,Ъй,Ъ1,...,Ък)\г,
(-1
(4.9)
где /=/с+1 - число коэффициентов уравнения модели.
Рис.4.6.К определению дисперсий
Общая дисперсия (дисперсия выходного параметра) S y характеризует
разброс экспериментально наблюдаемых точек относительно среднего значения у, т.е. линии С (см. рис. 4.6):
2 1
!S —--------
у п-1
2>, -у]
1=1
(4.10)
где у = !>;.
Шi-i
Средний квадрат отклонения линии регрессии от среднего значения линии у = С (см. рис. 4.6):
1 а |
1 а |
П-1 |
i=l |
11 /Л 11 Г)
XLy i~yJ =----- Zlj(xbbo,bi,...,b k )-yj .
i=l |
П-1
(4.11)
Очевидно, что общая дисперсия S2y (сумма квадратов относительно среднего значения у) равна остаточной дисперсии S y0CT (сумме квадратов относительно линии регрессии) плюс средний квадрат отклонения линии регрессии Sy*2 (сумма квадратов, обусловленная регрессией).
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА...
У ~ у ОСТ +^у ■
(4.11а)
Разброс экспериментально наблюдаемых точек относительно линии регрессии характеризуется безразмерной величиной - выборочным корреляционным отношением, которое определяет долю, которую привносит величина X в общую изменчивость случайной величины Y.
* Рху
у ~ йу ост
'У
=
>У
Т
=
Оу S y
(4.12)
Проанализируем свойства этого показателя.
1. В том случае, когда связь является не стохастической, а функциональной, корреляционное отношение равно 1, так как все точки корреляционного
поля оказываются на линии регрессии, остаточная дисперсия равна S
у ост
О,
a S y = S y (рис. 4.7, а).
2. Равенство нулю корреляционного отношения указывает на отсутствие какой-либо тесноты связи между величинами х и у для данного уравнения регрессии, поскольку разброс экспериментальных точек относительно среднего
значения и линии регрессии одинаков, т.е. S y =S y0CT (рис. 4.7, б).
Рис. 4.7. Значения выборочного корреляционного отношения рху:
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА...
а - функциональная связь; б - отсутствие связи
3. Чем ближе расположены экспериментальные данные к линии регрессии, тем теснее связь, тем меньше остаточная дисперсия и тем больше корреляционное отношение.
Следовательно, корреляционное отношение может изменяться в пределах от 0 до 1.
Учитывая, что для компьютеров имеются пакеты программ для статистической обработки результатов исследований, рассмотрим методологию этого подхода на примере простейших линейных и одномерных задач (см. уравнение (4.5)). Идеология решения более сложных задач принципиально не отличается. Более того, как мы увидим в дальнейшем, многие нелинейные зависимости можно свести к линейным.