Использовать следующие пять функций, так как они описывают все
Реально существующие зависимости между социально-экономическими
явлениями:
1. линейная k k yˆ = a + a x + a x + ..... + a b 0 1 1 2 2 ;
2. степенная k k yˆ = a ⋅ x a ⋅ x a ⋅.....⋅ x a 0 1 1 2 2 ;
3. показательная (экспотенциональная) e a a X a x aK X K y ˆ 0 1 1 2 2 ...... + + + = ;
Параболическая 2 2
1 2 2
0 1 ˆ ..... k k y = a + a x + a x + + a b ;
Гиперболическая
k
k
x
a
x
a
x
yˆ = a + a + + .... +
0 .
Работать с нелинейными функциями сложно, поэтому основное
Значение имеют линейные модели в силу их простоты и логичности
Экономической интерпретации. Нелинейные формы всегда можно
привести к линейной, используя известный в математике приём
Линеаризации функций.
Величина каждого параметра в уравнении прямой может быть
Определена по методу наименьших квадратов. Для этого в функционал
( ˆ) min 2 S =Σ y − y → подставим выражение прямолинейной функции. В
результате подстановки получаем:
( ..... ) min 2
K K y a a x a x a x
Продифференцировав полученное выражение по каждому из
параметров, получаем систему нормальных уравнений вида:
⎪ ⎪ ⎪
⎩
⎪ ⎪ ⎪
⎨
⎧
⋅ = ⋅ + ⋅ + ⋅ ⋅ + +
⋅ = ⋅ + + ⋅ ⋅ + +
⋅ = ⋅ + ⋅ + ⋅ ⋅ + + ⋅
= ⋅ + ⋅ + ⋅ + + ⋅
Σ Σ Σ Σ Σ
Σ Σ Σ Σ Σ
Σ Σ Σ Σ Σ
Σ Σ Σ Σ
0 1 1 2 2
2 0 2 1 1 2 2 2
2 1 2
1 0 1 1 1
0 1 1 2 2
...
.................................................................................................
...
...
...
K k k k k k
K k k
K k
K k
Y x a x a x x a x x a x
Y x a x a x x a x x a x
Y x a x a x a x x a x
Y a n a x a x a x
Число уравнений в системе равно числу параметров, поэтому задача
Их нахождения является разрешимой.
При выборе формы уравнения множественной регрессии
необходимо иметь в виду:
Чем сложнее функция, тем хуже интерпретируются параметры
Модели.
Сложные функции (полиномы) с большим количеством
Факторов требуют большого числа наблюдений (на каждый параметр не
Менее 6 наблюдений)
Окончательный отбор факторов
Окончательный отбор факторов, то есть уточнение корреляционной
Модели проводится на основе анализа корреляционной матрицы.
Корреляционная матрица состоит из парных линейных коэффициентов
Корреляции yx r , отражающих тесноту связи результативного и факторного
Признака и коэффициентов интеркорреляции xixj r , отражающих тесноту
Связи между i-м и j-м факторными признаками, рассчитываемых по
известной формуле:
rij =
( ) ( )
⎥ ⎥
⎦
⎤
⎢ ⎢
⎣
⎡
⎥ ⎥
⎦
⎤
⎢ ⎢
⎣
⎡
− −
⋅
−
Σ Σ
Σ Σ Σ
n
x
n
x
n
X y
Xy
X y
; rij r ji = .
Общий вид корреляционной матрицы приведен в таблице 7.8.
Таблица 7.8.
Общий вид корреляционной матрицы
y x1 x2 ………. xj ………. xK
Y 1 rYX1
RYX2
R YX j r YXK
X1 rYX1
RX X1 2
R j X1X
R X1X K
X2 rYX2
RX X1 2
R j X2X
R X2X K
……
….
Xj r YX j rX X j 1
RX X j 2
R X j X K
……
……
XK r YXK rX X K 1
RX X2 2
R X K X j 1
Факторы, теснота связи между которыми оценивается как высокая,
Считаются коллинеарными. Окончательный отбор факторов
Заключается во включении в модель независимых (неколлинеарных)
Факторов. Процедура отбора осуществляется способом шаговой
Регрессии.
Формат: Список
Применение шаговой регрессии рассмотрим на следующем
примере: в процессе предварительного отбора были выявлены 5 факторов,
Влияющих на результат. Значения линейных коэффициентов корреляции
Приведено в таблице 7.9. Необходимо построить двухфакторную
Корреляционную модель.
Корреляционная матрица имеет вид:
Таблица 7.9.
Y x1 x2 x3 x4 x5
Y 1 -0,43 0,50 0,55 0,7 0,31
X1 -0,3 1 0,65 -0,44 0,5 0,38
X2 0,50 0,62 1 0,85 0,79 0,7
X3 0,55 -0,44 0,85 1 -0,95 0,50
X4 0,70 0,5 0,79 -0,95 1 0,78
X5 0,1 0,38 0,70 0,50 0,78 1
Для обоснования включения факторов в модель оценивается первая
Строка матрицы, отражающая связь факторов с результатом. В модель
Включаются факторы, оказывающие наибольшее влияние на результат (с
Максимальными линейными коэффициентами корреляции). Такими
Являются факторы 3 x и 4 x .
Оценивается теснота межфакторной связи. Если она высока, то
Между данными факторами существует тесная зависимость, то есть
Факторы коллинеарны, а коллинеарность (тесная зависимость между
Факторами) существенно искажает результаты исследования. Связь
относится к коллинеарной, если: rij ≥ 0.8 . 0.95 3 5 = − x x r , - факторы
Коллинеарны. Один из них необходимо исключить из модели.
Исключается фактор с меньшим значением линейного коэффициента
Корреляции - 3 x .
Для включения недостающего вошедшие в модель на первом
Этапе. Это факторы 1 x , 2 x , 5 x . Выбирается фактор с максимальным
значением линейного коэффициента корреляции. Это 2 x с 0.50 2 = yx r .
Проверяем тесноту межфакторной связи 2 4 x , x , У нее 0.79 2 4 = x x r - факторы
Не коллинеарны. Таким образом, в модель включаются факторы 2 x и 4 x .
Она имеет вид: ˆ ( , ) 2 4 y = F x x .
Оценка тесноты связи