Найдем интервальную оценку коэффициента корреляции

для рассматриваемого примера. Уровень значимости α возьмем

равным 0,05 (α = 0,05). Тогда получаем . По прило-

жению 3 учебника [8] находим X0,475 = 1,96. Далее используем

формулу (10.26) и получаем:

;

.

Применяем формулу (10.28) и получаем:

;

.

Для нашего случая неравенство (10.27) имеет вид: 0,246 <

< < 0,987, т. е. истинное значение коэффициента корреляции

при α = 0,05 лежит между 0,246 и 0,987. Конечно, разрыв этот

Великоват, но не надо забывать, что пример наш учебный и ко-

Личество наблюдений мало. Значение коэффициента детерми-

нации в нашем примере равно , или 81%. Иначе говоря,

Количество преступлений, совершенных с применением огне-

стрельного оружия на 81% зависят от хищений огнестрельного

Оружия. Но нужно очень осторожно относиться к такого рода

Выводам, так как вряд ли полученное значение в чистом виде

Отражает зависимость хищений оружия от вооруженных пре-

Ступлений. Наверное, здесь сказывается и влияние других

Неучтенных нами факторов. Теперь, используя вычисленные

Нами значения , найдем по формуле (10.14),

учитывая формулу (10.19), искомые параметры a2 и b2:

.

Сравнивая с параметром a1, полученным по МНК, видим,

что a1 = a2. Поэтому принимаем a = a1 = a2 = 21,9. Затем по фор-

муле (10.20) находим искомый параметр b2:

b2 = 12046 − 21,9 ⋅ 1187,5 ≈ -13960,3.

Сравнивая найденный параметр b2 с параметром b1, полу-

Ченным с помощью МНК, видим, что они равны. Поэтому при-

нимаем b = b1 = b2 = 13960,3. Следовательно, уравнение парной

линейной регрессии для нашего примера имеет вид:

. (10.29)

Теперь, используя уравнение регрессии (10.29) и табл. 10.1,

Вычисляем теоретические (выровненные по прямой) значения

признака следствия y. Получаем:

Значение округляем до целых, так как количество во-

Оруженных преступлений не может быть дробным. Делаем

Арифметический контроль. Если нет арифметических ошибок,

то должно соблюдаться равенство:

. (10.30)

Находим

.

Видим, что равенство (10.30) соблюдается, значит, вычис-

ления выполнены верно. На рис. 10.2 наносим теоретические

Значения . Они лежат точно на прямой линии, поэтому на

рис. 10.2 нанесем два крайних значения и и соединим их

пунктирной линией (см. рис. 10.2).

Теперь находим среднюю ошибку аппроксимации по фор-

Муле

. (10.31)

Для нашего примера она будет равна:

, или 17,9%.

Сумма есть составляющая общей колеблемос-

Ти, которая в регрессионном анализе записывается следующим

образом:

, (10.32)

Где — общая колеблемость;

— остаточная колеблемость;

— колеблемость результативного признака y,

Объясненная уравнением регрессии.

Приведенное нами разложение зависимой переменной

Y лежит в основе оценки качества полученного уравнения

регрессии: чем большая часть вариации результативно-

го признака y объясняется регрессией, тем лучше качество

Последней, т. е. правильно выбрана математическая модель

Зависимости между признаком-фактором и признаком-

Следствием и правильно выбран факторный признак. Соот-

Ношение объясненной колеблемости и общей колеблемости

Позволяет найти степень детерминации регрессией вариа-

ции результативного признака y, т. е. вычислить коэффици-

ент детерминации:

. (10.33)

Если взять арифметический квадратный корень из коэф-

Фициента детерминации, то получим теоретическое корреля-

ционное отношение:

. (10.34)

Оно применяется для измерения тесноты связи при линей-

Ной и криволинейной зависимостях между результативным и

Факторным признаками, а значит, оно более универсально, чем

Коэффициент корреляции. При криволинейных зависимостях

Теоретическое корреляционное отношение, вычисляемое по

Формуле (10.34), часто называют индексом корреляции. По дан-

Ным нашего примера по формуле (10.33) найдем коэффициент

детерминации (вернее его оценку):

.

Такой же результат мы получили ранее с помощью коэф-

Фициента корреляции. Используя найденное значение коэф-

Фициента детерминации и формулу (10.34), определяем оценку

теоретического корреляционного отношения: ≈ 0,8992 = 0,9.

Установлено, что если , то гипотеза о линейной за-

Висимости может считаться подтвержденной. Для нашего при-

Мера имеем

.

Поэтому можно считать, что между признаком фактором x

и результативным признаком y есть линейная корреляционная

зависимость. В противном случае (при несовпадении ηT и )

Наши рекомендации