Парной корреляции) и между результативным и несколькими
Факторными признаками (при множественной корреляции),
Так же решаются задачи об определении неизвестных причин-
Ных связей и об оценке факторов, которые оказывают наиболь-
Шее влияние на результативный признак.
Регрессионный анализ заключается в нахождении анали-
Тического выражения связи (уравнения), в котором изменение
Результативного признака обусловлено влиянием одного или не-
Скольких факторных признаков, а множество всех других факто-
Ров принимается за постоянные средние величины. Кроме этого,
Устанавливается степень влияния факторного признака (при-
Знаков) на зависимую переменную (результативный признак) и
Находятся расчетные значения признака следствия. С помощью
Непараметрических методов устанавливается связь между качес-
Твенными (атрибутивными) признаками. Их сфера применения
Шире, чем параметрических, так как не требуется соблюдения
Условия нормальности распределения результативного призна-
Ка, но при этом снижается глубина исследования связей.
Однофакторный линейный корреляционный
И регрессионный анализ
Методология парной линейной корреляции является на-
Иболее разработанной в статистике. Она рассматривает влияние
Одного факторного признака на признак-следствие. Зная теорию
И практику построения и анализа двумерной модели корреля-
Ционного и регрессионного анализа легче оставить многофактор-
Ную модель. Чаще встречаются криволинейные однофакторные
Модели, но их иногда удается свести к линейной модели путем
Логарифмирования или замены переменной. Как правило, перед
Построением модели убеждаются, существует ли линейная за-
Висимость между изучаемыми факторами (иногда это уже из-
Вестно на основе предыдущих исследований).
Для этого используют метод параллельных рядов, вы-
Числяют коэффициент корреляции (точнее его оценку), а
Также строят график — поле корреляции. Поле корреляции
Представляет собой совокупность точек в прямоугольной
Системе координат. Координаты каждой точки определяются
Значениями признака-фактора и результативного признака
(рис. 10.1).
0 1 2 3 4 5 x
y
Рис. 10.1
По характеру расположения точек на поле корреляции
Можно судить о наличии, направлении линейной зависимости
(можно судить и о характере связи: линейная, криволинейная).
Предположим, что в наше распоряжение поступил ста-
Тистический материал наблюдений двух некоторых явлений.
Также установлено, что между ними должна существовать ли-
Нейная стохастическая зависимость. По результатам этих на-
Блюдений надо построить линейную однофакторную модель и
Установить количественно степень тесноты связи между изу-
Чаемыми явлениями. Исходные ряды наблюдений можно пред-
Ставить как значения, принимаемые двумя случайными вели-
Чинами Х (факторный признак) и Y (результативный признак),
т. е. X = (x1, x2, …, xn); Y = (y1, y2, …, yn).
Уравнение парной линейной регрессии имеет вид:
, (10.5)
где xi — данные наблюдений факторного признака;
— вычисленные (теоретические) значения результатив-
Ного признака;
a, b — параметры регрессии, подлежащие определению.
Причем b — свободный параметр уравнения регрессии,
Который показывает, на сколько единиц в среднем изменится
Результативный признак при изменении признака фактора на
одну единицу его измерения. Если a > 0, то зависимость будет
прямой, а если a < 0, то она будет обратной.
Параметры a и b можно найти либо с помощью МНК, либо
Через коэффициент корреляции, который надо вычислить в
Любом случае, так как он показывает меру близость между
случайными величинами x и y.
Рассмотрим оба эти способа. Условие МНК (о нем мы гово-
рили в главе 8) в данном случае имеет вид:
. (10.6)
Подставляем в (10.6) уравнение регрессии (10.5) и полу-
чаем:
. (10.7)
Записываем необходимые условия экстремума для функ-
ции (10.7):
.