Падает только один год (1992), где при возрастании факторного
признака х признак следствия у убывает. Если между рядами
х и у существует прямолинейная корреляционная зависимость,
То все имеющиеся отклонения обусловлены влиянием случай-
Ных факторов. Конечно наши ряды наблюдений слишком ко-
Роткие для того, чтобы делать какие-то глобальные выводы. По
данным табл. 10.1 построим поле корреляции для нашего при-
мера (рис. 10.2).
Из рисунка видно, что полученную ломанную можно ап-
Роксимировать прямой линией, т. е. в качестве регрессионной
Модели примем уравнение прямой вида (10.5). Для нахождения
параметров a и b используем оба рассмотренных способа. Сна-
чала найдем параметры a и b по МНК (обозначим их a1 и b1). Ис-
пользуя исходные данные табл. 10.1, определяем
(количество наблюдений в нашем примере равно 6, т. е. n = 6);
;
;
;
;
0 200 400 600 800 1000 1200 1400 1600 1800 2000
y
x
Исходный ряд
Выравненный ряд
Рис. 10.2. Поле корреляции
;
;
.
Далее по формуле (10.12) находим искомый параметр a1:
.
Теперь по формуле (10.10) вычисляем искомый параметр b1:
.
Теперь используем второй способ определения параметров
a и b через предварительное нахождение коэффициента кор-
реляции (обозначим искомые параметры a2 и b2). Вычисляем:
;
;
;
;
;
.
Исходя из полученной точечной оценки коэффициента
Корреляции, имеем достаточно близкую линейную прямую за-
висимость между рядами наблюдений x и y.
При количестве наблюдений n ≥ 50 В. И. Романовский ре-
Комендует для среднего квадратического отклонения коэффи-
Циента корреляции использовать формулу
. (10.21)
Связь считается установленной, если выполняется нера-
Венство
. (10.22)
При количестве наблюдений менее тридцати (n < 30) не-
Обходимо проверить полученный коэффициент корреляции на
значимость (существенность). Для этого используют t-крите-
Рий Стьюдента. Выдвигают гипотезу H0 о том, что вычисленное
Нами значение коэффициента корреляции получилось случай-
Но, а на самом деле он равен нулю. Сначала находим расчетное
(фактическое) значение t-критерия по формуле
. (10.23)
Для нашего примера имеем:
.
Затем определяем табличное значение t-критерия Стью-
дента (см. приложение 10) по числу степеней свободы v = n − 2
(для нашего примера v = 4) и по заданному уровню значимости
(ошибки первого рода) α, который обычно задают равным 0,05
(α = 0,05).
Для нашего примера получаем: tтабл = 2,78.
Так как tрасч > tтабл, то гипотеза H0 отвергается, а это озна-
Чает, что полученный нами коэффициент корреляции можно
считать значимым с ошибкой первого рода 5%.
Но, строго говоря, при малой выборке (а выборка разби-
Раемого нами примера является малой) точечной оценкой ко-
Эффициента корреляции пользоваться некорректно и необ-
Ходимо интервальное оценивание. Построим доверительные
Интервальные оценки для истинного значения коэффициента
Корреляции. Это возможно сделать, если основываться на нор-
Мальном распределении точечной оценки коэффициента кор-
Реляции. Верхнюю и нижнюю границы интервала можно найти
Из формулы
, (10.24)
Где — квантиль нормального распределения уровня .
Для нахождения квантиля используется таблица значе-
ний нормированной функции Лапласа Ф0(x) (приложение 5). Но
Применение выражения (10.24) возможно при ряде ограниче-
ний, выполнение которых не всегда реально, а именно: значе-
ние должно быть близко к ±1; число наблюдений (n) должно
Быть достаточно велико.
Отбросить эти ограничения позволяет следующее преоб-
разование:
, (10.25)
которое предложил Р. Фишер. Он доказал, что z в формуле
(10.25) даже при малых n достаточно близко к нормальному за-
Кону распределения. Это позволило Фишеру создать следую-
щий доверительный интервал:
(10.26)
.
Из формулы (10.26) следует, что истинное значение коэф-
фициента корреляции с доверительной вероятностью (1 − α)
заключено в следующем интервале:
thzн < rxy < thzв, (10.27)
где thzн — гиперболический тангенс аргумента z.
Из курса математического анализа известно, что
, (10.28)