Парной корреляции) и между результативным и несколькими

Факторными признаками (при множественной корреляции),

Так же решаются задачи об определении неизвестных причин-

Ных связей и об оценке факторов, которые оказывают наиболь-

Шее влияние на результативный признак.

Регрессионный анализ заключается в нахождении анали-

Тического выражения связи (уравнения), в котором изменение

Результативного признака обусловлено влиянием одного или не-

Скольких факторных признаков, а множество всех других факто-

Ров принимается за постоянные средние величины. Кроме этого,

Устанавливается степень влияния факторного признака (при-

Знаков) на зависимую переменную (результативный признак) и

Находятся расчетные значения признака следствия. С помощью

Непараметрических методов устанавливается связь между качес-

Твенными (атрибутивными) признаками. Их сфера применения

Шире, чем параметрических, так как не требуется соблюдения

Условия нормальности распределения результативного призна-

Ка, но при этом снижается глубина исследования связей.

Однофакторный линейный корреляционный

И регрессионный анализ

Методология парной линейной корреляции является на-

Иболее разработанной в статистике. Она рассматривает влияние

Одного факторного признака на признак-следствие. Зная теорию

И практику построения и анализа двумерной модели корреля-

Ционного и регрессионного анализа легче оставить многофактор-

Ную модель. Чаще встречаются криволинейные однофакторные

Модели, но их иногда удается свести к линейной модели путем

Логарифмирования или замены переменной. Как правило, перед

Построением модели убеждаются, существует ли линейная за-

Висимость между изучаемыми факторами (иногда это уже из-

Вестно на основе предыдущих исследований).

Для этого используют метод параллельных рядов, вы-

Числяют коэффициент корреляции (точнее его оценку), а

Также строят график — поле корреляции. Поле корреляции

Представляет собой совокупность точек в прямоугольной

Системе координат. Координаты каждой точки определяются

Значениями признака-фактора и результативного признака

(рис. 10.1).

0 1 2 3 4 5 x

y

Рис. 10.1

По характеру расположения точек на поле корреляции

Можно судить о наличии, направлении линейной зависимости

(можно судить и о характере связи: линейная, криволинейная).

Предположим, что в наше распоряжение поступил ста-

Тистический материал наблюдений двух некоторых явлений.

Также установлено, что между ними должна существовать ли-

Нейная стохастическая зависимость. По результатам этих на-

Блюдений надо построить линейную однофакторную модель и

Установить количественно степень тесноты связи между изу-

Чаемыми явлениями. Исходные ряды наблюдений можно пред-

Ставить как значения, принимаемые двумя случайными вели-

Чинами Х (факторный признак) и Y (результативный признак),

т. е. X = (x1, x2, …, xn); Y = (y1, y2, …, yn).

Уравнение парной линейной регрессии имеет вид:

, (10.5)

где xi — данные наблюдений факторного признака;

— вычисленные (теоретические) значения результатив-

Ного признака;

a, b — параметры регрессии, подлежащие определению.

Причем b — свободный параметр уравнения регрессии,

Который показывает, на сколько единиц в среднем изменится

Результативный признак при изменении признака фактора на

одну единицу его измерения. Если a > 0, то зависимость будет

прямой, а если a < 0, то она будет обратной.

Параметры a и b можно найти либо с помощью МНК, либо

Через коэффициент корреляции, который надо вычислить в

Любом случае, так как он показывает меру близость между

случайными величинами x и y.

Рассмотрим оба эти способа. Условие МНК (о нем мы гово-

рили в главе 8) в данном случае имеет вид:

. (10.6)

Подставляем в (10.6) уравнение регрессии (10.5) и полу-

чаем:

. (10.7)

Записываем необходимые условия экстремума для функ-

ции (10.7):

.

Наши рекомендации