Найдем интервальную оценку коэффициента корреляции
для рассматриваемого примера. Уровень значимости α возьмем
равным 0,05 (α = 0,05). Тогда получаем . По прило-
жению 3 учебника [8] находим X0,475 = 1,96. Далее используем
формулу (10.26) и получаем:
;
.
Применяем формулу (10.28) и получаем:
;
.
Для нашего случая неравенство (10.27) имеет вид: 0,246 <
< < 0,987, т. е. истинное значение коэффициента корреляции
при α = 0,05 лежит между 0,246 и 0,987. Конечно, разрыв этот
Великоват, но не надо забывать, что пример наш учебный и ко-
Личество наблюдений мало. Значение коэффициента детерми-
нации в нашем примере равно , или 81%. Иначе говоря,
Количество преступлений, совершенных с применением огне-
стрельного оружия на 81% зависят от хищений огнестрельного
Оружия. Но нужно очень осторожно относиться к такого рода
Выводам, так как вряд ли полученное значение в чистом виде
Отражает зависимость хищений оружия от вооруженных пре-
Ступлений. Наверное, здесь сказывается и влияние других
Неучтенных нами факторов. Теперь, используя вычисленные
Нами значения , найдем по формуле (10.14),
учитывая формулу (10.19), искомые параметры a2 и b2:
.
Сравнивая с параметром a1, полученным по МНК, видим,
что a1 = a2. Поэтому принимаем a = a1 = a2 = 21,9. Затем по фор-
муле (10.20) находим искомый параметр b2:
b2 = 12046 − 21,9 ⋅ 1187,5 ≈ -13960,3.
Сравнивая найденный параметр b2 с параметром b1, полу-
Ченным с помощью МНК, видим, что они равны. Поэтому при-
нимаем b = b1 = b2 = 13960,3. Следовательно, уравнение парной
линейной регрессии для нашего примера имеет вид:
. (10.29)
Теперь, используя уравнение регрессии (10.29) и табл. 10.1,
Вычисляем теоретические (выровненные по прямой) значения
признака следствия y. Получаем:
Значение округляем до целых, так как количество во-
Оруженных преступлений не может быть дробным. Делаем
Арифметический контроль. Если нет арифметических ошибок,
то должно соблюдаться равенство:
. (10.30)
Находим
.
Видим, что равенство (10.30) соблюдается, значит, вычис-
ления выполнены верно. На рис. 10.2 наносим теоретические
Значения . Они лежат точно на прямой линии, поэтому на
рис. 10.2 нанесем два крайних значения и и соединим их
пунктирной линией (см. рис. 10.2).
Теперь находим среднюю ошибку аппроксимации по фор-
Муле
. (10.31)
Для нашего примера она будет равна:
, или 17,9%.
Сумма есть составляющая общей колеблемос-
Ти, которая в регрессионном анализе записывается следующим
образом:
, (10.32)
Где — общая колеблемость;
— остаточная колеблемость;
— колеблемость результативного признака y,
Объясненная уравнением регрессии.
Приведенное нами разложение зависимой переменной
Y лежит в основе оценки качества полученного уравнения
регрессии: чем большая часть вариации результативно-
го признака y объясняется регрессией, тем лучше качество
Последней, т. е. правильно выбрана математическая модель
Зависимости между признаком-фактором и признаком-
Следствием и правильно выбран факторный признак. Соот-
Ношение объясненной колеблемости и общей колеблемости
Позволяет найти степень детерминации регрессией вариа-
ции результативного признака y, т. е. вычислить коэффици-
ент детерминации:
. (10.33)
Если взять арифметический квадратный корень из коэф-
Фициента детерминации, то получим теоретическое корреля-
ционное отношение:
. (10.34)
Оно применяется для измерения тесноты связи при линей-
Ной и криволинейной зависимостях между результативным и
Факторным признаками, а значит, оно более универсально, чем
Коэффициент корреляции. При криволинейных зависимостях
Теоретическое корреляционное отношение, вычисляемое по
Формуле (10.34), часто называют индексом корреляции. По дан-
Ным нашего примера по формуле (10.33) найдем коэффициент
детерминации (вернее его оценку):
.
Такой же результат мы получили ранее с помощью коэф-
Фициента корреляции. Используя найденное значение коэф-
Фициента детерминации и формулу (10.34), определяем оценку
теоретического корреляционного отношения: ≈ 0,8992 = 0,9.
Установлено, что если , то гипотеза о линейной за-
Висимости может считаться подтвержденной. Для нашего при-
Мера имеем
.
Поэтому можно считать, что между признаком фактором x
и результативным признаком y есть линейная корреляционная
зависимость. В противном случае (при несовпадении ηT и )