Тема: Элементы теории корреляции

Объекты ряда генеральных совокупностей обладают несколькими подлежащими изучению признаками Х, У, ..., которые можно интерпретировать как систему взаимосвязанных величин. Примерами могут служить: масса животного и количество гемоглабина в крови, рост мужчины и объем грудной клетки, увеличение рабочих мест в помещении и уровень заболеваемости вирусными инфекциями, количество вводимого препарата и концентрация его в крови и т.д.

Очевидно, что между этими величинами существует связь, но она не может быть строгой фукциональной зависимостью, так как на изменение одной из величин влияет не только изменение второй величины, но и другие факторы. В таких случаях говорят, что две величины связаны стохастической (т.е. случайной) зависимостью. Мы будем изучать частный случай стохастической зависимости – корреляционную зависимость.

ОПРЕДЕЛЕНИЕ: Зависимость случайных величин называют стохастической, если на изменение одной из них влияет не только изменение второй величины, но и другие факторы.

ОПРЕДЕЛЕНИЕ: Зависимость случайных величин называют статистической, если изменения одной из них приводит к изменению закона распределения другой.

ОПРЕДЕЛЕНИЕ:Если изменение одной из случайных величин влечет изменение среднего другой случайной величины, то статистическую зависимость называют корреляционной.

Примерами корреляционной зависимостиявляются связи между:

- массой тела и ростом;

- дозой ионизирующего излучения и числом мутаций;

- пигментом волос человека и цветом глаз;

- показателями уровня жизни населения и процентом смертности;

- количеством пропущенных студентами лекций и оценкой на экзамене и т.д.

Именно корреляционные зависимости наиболее часто встречаются в природе в силу взаимовлияния и тесного переплетения огромного множества самых различных факторов, определяющих значения изучаемых показателей.

Результаты наблюдения, проведенные над тем или иным биологическим объктом по корреляционно связанным признакам У и Х можно изобразить точками на плоскости, построив систему прямоугольных координат. В результате получается некая диаграмма рассеяния, позволяющая судить о форме и тесноте связи между варьирующими признаками.

Если эту связь можно будет апроксимировать некоторой кривой, то можно будет прогнозировать изменение одного из параметров при целенаправленном изменении другого параметра.

Корреляционную зависимость Тема: Элементы теории корреляции - student2.ruот Тема: Элементы теории корреляции - student2.ru можно описать с помощью уравнения вида

Тема: Элементы теории корреляции - student2.ru (1)

 
  Тема: Элементы теории корреляции - student2.ru

где Тема: Элементы теории корреляции - student2.ru условное среднее величины Тема: Элементы теории корреляции - student2.ru , соответствующее значению Тема: Элементы теории корреляции - student2.ru величины Тема: Элементы теории корреляции - student2.ru , а Тема: Элементы теории корреляции - student2.ru некоторая функция. Уравнение (1) называется выборочным уравнением регрессии Тема: Элементы теории корреляции - student2.ruна Тема: Элементы теории корреляции - student2.ru .

Рис.1. Линейная регрессия значима. Модель Тема: Элементы теории корреляции - student2.ru .

Функцию Тема: Элементы теории корреляции - student2.ru называют выборочной регрессией Тема: Элементы теории корреляции - student2.ru на Тема: Элементы теории корреляции - student2.ru , а ее график – выборочной линией регрессии Тема: Элементы теории корреляции - student2.ru на Тема: Элементы теории корреляции - student2.ru .

Совершенно аналогично выборочным уравнением регрессии Тема: Элементы теории корреляции - student2.ruна Тема: Элементы теории корреляции - student2.ru является уравнение Тема: Элементы теории корреляции - student2.ru .

В зависимости от вида уравнения регрессии и формы соответствующей линии регрессии определяют форму корреляционной зависимости между рассматриваемыми величинами – линейной, квадратической, показательной, экспоненциальной.

Важнейшим является вопрос выбора вида функции регрессии Тема: Элементы теории корреляции - student2.ru [или Тема: Элементы теории корреляции - student2.ru ], например линейная или нелинейная (показательная, логарифмическая и т.д.)

На практике вид функции регрессии можно определить построив на координатной плоскости множество точек, соответствующих всем имеющимся парам наблюдений ( Тема: Элементы теории корреляции - student2.ru ).

 
  Тема: Элементы теории корреляции - student2.ru

Рис. 2. Линейная регрессия незначима. Модель Тема: Элементы теории корреляции - student2.ru .

 
  Тема: Элементы теории корреляции - student2.ru

Рис. 3. Нелинейная модель Тема: Элементы теории корреляции - student2.ru .

Например, на рис.1. видна тенденция роста значений Тема: Элементы теории корреляции - student2.ru с ростом Тема: Элементы теории корреляции - student2.ru , при этом средние значения Тема: Элементы теории корреляции - student2.ru располагается визуально на прямой. Имеет смысл использовать линейную модель (вид зависимости Тема: Элементы теории корреляции - student2.ru от Тема: Элементы теории корреляции - student2.ru принято называть моделью) зависимости Тема: Элементы теории корреляции - student2.ru от Тема: Элементы теории корреляции - student2.ru .

На рис.2. средние значения Тема: Элементы теории корреляции - student2.ru не зависят от Тема: Элементы теории корреляции - student2.ru , следовательно линейная регрессия незначима (функция регрессии постоянна и равна Тема: Элементы теории корреляции - student2.ru ).

На рис. 3. прослеживается тенденция нелинейности модели.

Примеры прямолинейной зависимости:

- увеличение количество потребляемого йода и снижение показателя заболеваемости зобом,

- увеличение стажа рабочего и повышение производительности.

Примеры криволинейной зависимости:

- с увеличением осадков – увеличивается урожай, но это происходит до определенного предела осадков. После критической точки осадки уже оказываются излишними, почва заболачивается и урожай снижается,

- связь между дозой хлора, примененной для обеззараживания воды и количеством бактерий в 1 мл. воды. С увеличением дозы хлора количество бактерий в воде снижается, но по достижению критической точки количество бактерий будет оставаться постоянным (или совсем отсутствовать), как бы мы не увеличивали дозу хлора.

Линейная регрессия

Выбрав вид функции регрессии, т.е. вид рассматриваемой модели зависимости Тема: Элементы теории корреляции - student2.ru от Х (или Х от У), например, линейную модель Тема: Элементы теории корреляции - student2.ru , необходимо определить конкретные значения коэффициентов модели.

При различных значениях а и Тема: Элементы теории корреляции - student2.ru можно построить бесконечное число зависимостей вида Тема: Элементы теории корреляции - student2.ru т.е на координатной плоскости имеется бесконечное количество прямых, нам же необходима такая зависимость, которая соответствует наблюдаемым значениям наилучшим образом. Таким образом, задача сводится к подбору наилучших коэффициентов.

Метод наименьших квадратов (МНК)

Линейную функцию Тема: Элементы теории корреляции - student2.ru ищем, исходя лишь из некоторого количества имеющихся наблюдений. Для нахождения функции с наилучшим соответствием наблюдаемым значениям используем метод наименьших квадратов.

 
  Тема: Элементы теории корреляции - student2.ru

 
  Тема: Элементы теории корреляции - student2.ru

Рис.4. Пояснение к оценке коэффициентов методом наименьших квадратов

Обозначим: Тема: Элементы теории корреляции - student2.ru - значение, вычисленное по уравнению Тема: Элементы теории корреляции - student2.ru

Тема: Элементы теории корреляции - student2.ru - измеренное значение,

Тема: Элементы теории корреляции - student2.ru - разность между измеренными и вычисленными по уравнению значениям,

Тема: Элементы теории корреляции - student2.ru .

Вметоде наименьших квадратов требуется, чтобы Тема: Элементы теории корреляции - student2.ru , разность между измеренными Тема: Элементы теории корреляции - student2.ru и вычисленными по уравнению значениям Тема: Элементы теории корреляции - student2.ru , была минимальной. Следовательно, находимо подобрать коэффициенты а и Тема: Элементы теории корреляции - student2.ru так, чтобы сумма квадратов отклонений наблюдаемых значений от значений на прямой линии регрессии оказалась наименьшей:

Тема: Элементы теории корреляции - student2.ru .

Это условие достигается если параметры а и Тема: Элементы теории корреляции - student2.ru будут вычислены по формулам :

 
  Тема: Элементы теории корреляции - student2.ru

(2)

Тема: Элементы теории корреляции - student2.ru

(3)

Тема: Элементы теории корреляции - student2.ru называют коэффициентом регрессии; Тема: Элементы теории корреляции - student2.ru называют свободным членомуравнения регрессии.

Полученная прямая является оценкой для теоретической линии регрессии. Имеем

Тема: Элементы теории корреляции - student2.ru .

Итак, Тема: Элементы теории корреляции - student2.ru является уравнением линейной регрессии.

Регрессия может быть прямой Тема: Элементы теории корреляции - student2.ru и обратной Тема: Элементы теории корреляции - student2.ru .

ОПРЕДЕЛЕНИЕ: Обратная регрессия означает, что при росте одного параметра, значения другого параметра уменьшаются.

ОПРЕДЕЛЕНИЕ: Прямая регрессия означает, что при росте одного параметра, значения другого параметра тоже увеличиваются.

Пример 1.Заданному уровню потребления пресной воды на санитарно – бытовые нужды Тема: Элементы теории корреляции - student2.ru в л/чел. сутки в n населенных пунктах соответствует множество значений уровня общей заболеваемости Тема: Элементы теории корреляции - student2.ru в %. При этом отмечается, что с ростом Тема: Элементы теории корреляции - student2.ru наблюдается уменьшение Тема: Элементы теории корреляции - student2.ru . Это – обратная, отрицательнаякорреляционная связь. (Рис. 5)

Пример 2.Возрастание уровня инфекционной заболеваемости Тема: Элементы теории корреляции - student2.ru в % при увеличении плотности рабочих мест в производственном помещении Тема: Элементы теории корреляции - student2.ru , чел. – является примером прямой, положительной корреляционной связи. (Рис. 6)

 
  Тема: Элементы теории корреляции - student2.ru

Рис. 5. Поле наблюдений Тема: Элементы теории корреляции - student2.ru при обратной корреляционной

связи между фактором Тема: Элементы теории корреляции - student2.ru и параметром Тема: Элементы теории корреляции - student2.ru

 
  Тема: Элементы теории корреляции - student2.ru

Рис. 6. Поле наблюдений Тема: Элементы теории корреляции - student2.ru при прямой корреляционной

связи между фактором Тема: Элементы теории корреляции - student2.ru и параметром Тема: Элементы теории корреляции - student2.ru

Наши рекомендации