Выборочный коэффициент корреляции.
Статистическая и корреляционная зависимости.
Одной из основных задач математической статистики является нахождение зависимости между двумя или несколькими случайными величинами.
Две случайные величины и могут быть связаны функциональной зависимостью, когда каждому значению одной переменной соответствует вполне определенное значение другой. Однако строгая функциональная зависимость реализуется редко, т. к. случайные величины подвержены действию случайных факторов. В этом случае возникает статистическая зависимость.
Статистической называют зависимость, при которой изменение одной из величин влечет изменение распределения другой.
Корреляционной называется статистическая зависимость, при которой изменение одной величины влечет изменение среднего значения другой.
Условным средним называют среднее арифметическое значений , соответствующих значению .
Пример1 . Пусть при величина приняла значения , , , . Найдем условное среднее .
Корреляционной зависимостью от называется функциональная зависимость условной средней от : .
Уравнение называется уравнением регрессии на . График называется линией регрессии на .
Аналогично определяется условное среднее и корреляционная зависимость от .
Основные задачи теории корреляции.
1) Установление формы корреляционной связи, т. е. вида функции регрессии ( линейная, квадратичная, показательная и т. д.). Если обе функции регрессии и линейные, то корреляцию называют линейной, в противном случае - нелинейной.
2) Оценка тесноты корреляционной связи от , которая оценивается величиной рассеяния значений около . Большое рассеяние означает слабую зависимость от , либо вообще отсутствие таковой. Малое рассеяние указывает на наличие достаточно сильной зависимости от .
Выборочный коэффициент корреляции.
Произведение - выборочный коэффициент корреляции.
, - выборочные дисперсии,
, - выборочные средние квадратические отклонения.
Выборочный коэффициент корреляции является мерой линейной зависимости между двумя наблюдаемыми величинами, характеризует тесноту связи между СВ и .
определяется равенством:
1. Коэффициент корреляции принимает значения на отрезке , т. е. .
2. Чем ближе к 1, тем связь сильнее. Чем ближе к 0, тем связь слабее.
3. Если все значения переменных увеличить (уменьшить) на одно и то же число или в одно и то же число раз, то величина выборочного коэффициента корреляции не измениться.
4. При корреляционная связь представляет линейную функциональную зависимость. При этом линии регрессии на и на совпадают, все наблюдаемые значения распределяются на общей прямой.
5. Если с ростом одной СВ значения второй возрастают, то , если убывают, то .
6. При линейная корреляционная связь отсутствует, групповые средние переменных совпадают с их общими средними, линии регрессии на и на параллельны осям координат.
Оценка тесноты связи
Таблица 3
0-0,1 | 0,1-0,3 | 0,3-0,5 | 0,5-0,7 | 0,7-0,9 | 0,9-0,99 | ||
Теснота связи | нет | слабая | умеренная | заметная | высокая | очень высокая | функц-я |
Корреляционная таблица.
При большом числе наблюдений одно и то же значение СВ может повторяться раз, а СВ - раз. Одна и та же пара чисел может наблюдаться раз. Поэтому данные наблюдений группируют, подсчитывая частоты , , . Все данные записывают в корреляционную таблицу.