Выборочное уравнение прямой линии регрессии по сгруппированным данным. Выборочный коэффициент корреляции
Для отыскания параметров прямой линии регрессии по несгруппированным данным по методу наименьших квадратов получена система:
(1)
где – коэффициент регрессии.
Пусть получено большое число данных (для удовлетворительной оценки искомых параметров количество наблюдений должно быть не менее 50). Среди них есть повторяющиеся, и они сгруппированы в виде корреляционной таблицы. Запишем соотношение (1) так, чтобы оно отражало данные корреляционной таблицы.
; ; ; ; ;
; .
Учтено, что пара чисел наблюдалась раз. Поставив все это в систему (1) будем иметь
(2)
Решив эту систему, найдем параметры и и тем самым найдем уравнение регрессии .
Однако целесообразно, введя новую величину – коэффициент корреляции, найти уравнение регрессии в ином виде.
Из 2-го уравнения системы выразим : . Подставив правую часть этого уравнения в уравнение получим
;
. (3)
Найдем из системы (2) коэффициент корреляции :
, (4)
где – среднее квадратическое отклонение СВ .
Умножая обе части равенства на дробь , получим выборочный коэффициент корреляции
(5)
Выборочный коэффициент корреляции служит для оценки тесноты линейной корреляционной зависимости.
Отсюда выборочное уравнение прямой линии регрессии на имеет вид
. (6)
Аналогично находят второе уравнение прямой линии регрессии
. (7)
Свойства выборочного коэффициента корреляции
1. Абсолютная величина выборочного коэффициента корреляции не превосходит 1 ( ).
2. Если выборочный коэффициент корреляции равен 0 и выборочные линии регрессии – прямые линии, то и не связаны линейной корреляционной зависимостью и , .
В этом случае прямые линии регрессии параллельны соответственно координатным осям.
Замечание. Если выборочный коэффициент корреляции , то признаки и могут быть связаны нелинейной корреляционной или даже функциональной зависимостью.
3. Если абсолютная величина , то наблюдаемые значения признаков связаны линейной функциональной зависимостью.
4. С возрастанием абсолютной величины выборочного коэффициента корреляции линейная корреляционная зависимость становится более тесной и при переходит в функциональную.
Величина коэффициента корреляции характеризует силу линейной связи между признаками ( ):
если – связь слабая;
если – связь умеренная;
если – связь заметная;
если – связь высокая;
если – связь весьма высокая;
если – связь функциональная.
5. Знак выборочного коэффициента корреляции совпадает со знаком выборочного коэффициента регрессии: , и определяет направление связи. Если – связь прямая, – связь обратная.
Перемножим первое и второе равенства ; .
Знак при радикале должен совпадать со знаком коэффициента регрессии, т.е. , если ; , если .
Выборочный коэффициент корреляции равен среднему геометрическому выборочных коэффициентов регрессий.