Алгоритм проверки однородности двух многомерных нормальных генеральных совокупностей
1. На уровне значимости α проверить нулевую гипотезу о равенстве кова-
риационных матриц:
S x = S y , при конкурирующей гипотезе
S x ≠ S y . Для
этого найти наблюдаемое значение критерия W : Wнабл. = a ⋅b , где
a = (nx
+ n y
− 2) ln | Sˆxy
| −((n
− 1) ln | Sˆx
| +(n y
− 1) ln | Sˆ y
|),
⎛ 1 1
|
1 ⎞ 2 p 2
|
+3 p −1
b = − ⎜
⎝ x
+
− 1 ny
−
|
+ ny
− 2 ⎟
,
6( p +1)
Sˆxy
= 1
nx + n y − 2
((n
−1)Sˆx
+ (n y
−1)Sˆ y ),
где
Sˆx ,
Sˆ y
– «исправленные» ковариационные матрицы,
Sˆxy
– «исправ-
ленная» объединенная ковариационная матрица. Сравнить найденное зна-
чение
Wнабл.
|
Wкр. = χ
2 (α; p( p +1) / 2)
(см. прило-
жение 5). При этом если
Wнабл. <Wкр. , то гипотезу о равенстве ковариаци-
онных матриц принять, в противном же случае – отвергнуть.
2. Если гипотеза о равенстве ковариационных матриц отвергнута, то гене-
ральные совокупности не однородны и проверку следует завершить.
3. Если же установлено равенство ковариационных матриц, то на уровне зна-
чимости α проверить нулевую гипотезу о равенстве генеральных средних:
µx = µy , при конкурирующей гипотезе
даемое значение критерия T 2 :
µx ≠ µy . Для этого найти наблю-
|
набл.
= nx ny
nx + ny
⋅( X −Y )T Sˆ −1 ( X −Y ) ,
где X , Y – векторы выборочных средних.
4. Найденное значение
|
сравнить с критическим значением
2 (nx + ny −2) p 2 2
Tкр. =
nx + ny − p −1
⋅F (α; p; nx + ny − p −1) . При этом если
Tнабл. <Tкр. , то
гипотезу о равенстве генеральных средних, а значит, и гипотезу об одно- родности генеральных совокупностей принять, в противном случае – отвергнуть.
Теоретические вопросы и задания
1. Как по выборке найти точечные оценки математического ожидания и ко-
вариационной матрицы многомерной случайной величины?
2. Что называется доверительной областью параметра многомерной случай-
ной величины?
3. Как по выборке найти доверительную область для вектора генеральных средних многомерной случайной величины?
4. Сформулируйте алгоритм проверки однородности двух многомерных ге-
неральных совокупностей.
Задачи и упражнения
1. Среди нескольких промышленных предприятий города случайным обра-
зом для анализа были отобраны 10, для которых получены данные о рабо-
те:
X 1 – объём валовой продукции (млн руб.);
X 2 – производительность
труда (тыс. руб. / чел.);
X 3 – фонд заработной платы (млн руб.).
№ | ||||||||||
x1 | 8,1 | 8,0 | 7,9 | 7,9 | 9,0 | 8,1 | 7,5 | 7,6 | 8,1 | 8,5 |
x2 | 1,0 | 1,1 | 1,1 | 1,5 | 1,2 | 1,3 | 1,2 | 1,1 | 1,0 | 1,5 |
x3 | 3,1 | 3,5 | 5,1 | 4,6 | 3,0 | 4,8 | 4,2 | 5,0 | 4,3 | 6,0 |
Найдите выборочные вектор средних, ковариационную и корреляционную матрицы.
2. Определите по выборке с надёжностью
γ = 0,95
доверительную область
для вектора генеральных средних двумерной нормальной случайной вели-
чины. Результаты выборки представлены в таблице.
№ | ||||||||
x1 | 10,0 | 10,2 | 10,4 | 10,6 | 10,8 | 11,0 | 11,2 | 11,4 |
x2 | 15,2 | 13,4 | 16,2 | 17,3 | 16,0 | 15,6 | 14,7 | 12,0 |
3. На пяти предприятиях, влияние на окружающую среду которых в основ-
ном характеризуется двумя показателями:
X 1 – объём вредных выбросов в
атмосферу (кг);
X 2 – объём вредных выбросов в водоёмы (кг), внедрили
новую технологию. Значения показателей для старой и новой технологий приведены в таблицах.
Старая технология:
№ | |||||
x1 | 10,5 | 11,2 | 9,5 | 10,2 | 10,8 |
x2 | 15,1 | 13,4 | 14,5 | 12,4 | 13,5 |
Новая технология:
№ | |||||
y1 | 10,0 | 9,5 | 7,9 | 8,2 | 8,2 |
y2 | 15,4 | 13,5 | 10,0 | 9,5 | 11,8 |
Считая, что рассматриваемая двумерная генеральная совокупность имеет нормальное распределение, проверьте, повлияла ли новая технология на
величины вредных выбросов предприятий. Уровень значимости α = 0,05 .
Домашнее задание
1. В таблице приведены оценки по математическому анализу ( X 1 ) и инфор- мационным технологиям ( X 2 ) десяти студентов специальности «Приклад- ная информатика в менеджменте».
№ | ||||||||||
x1 | ||||||||||
x2 |
а) Найдите выборочные вектор средних, ковариационную и корреляцион- ную матрицы. б) Предполагая, что рассматриваемая двумерная генераль- ная совокупность имеет нормальное распределение, определите по выбор-
ке с надёжностью
ных средних.
γ = 0,95
доверительную область для вектора генераль-
2. Проверьте на уровне значимости α = 0,05 гипотезу об однородности выбо-
рок из трехмерных нормальных генеральных совокупностей, для каждой
из которых получены следующие векторы средних и ковариационные матрицы (объём каждой выборки равен 10):
⎛2,3⎞
⎛ 1,8
1,6
− 0,7 ⎞
⎛2,5 ⎞
⎛ 2,1
1,8
− 0.2 ⎞
⎜ ⎟ ⎜
⎟ ⎜ ⎟ ⎜ ⎟
x = ⎜4,8⎟,
S x =⎜
1,6
2,6
2,9 ⎟,
y = ⎜4,7 ⎟,
S x =⎜
1,8
2,5
2,4 ⎟ .
⎜ ⎟ ⎜
⎟ ⎜ ⎟ ⎜ ⎟
⎝1,1 ⎠
⎝− 0,7
2,9
1,5 ⎠
⎝1,2 ⎠
⎝− 0.2
2,4
1,9 ⎠
Занятие 12. Множественный корреляционно-регрессионный анализ
На практике часто возникает задача исследования зависимости одной
(результирующей) переменной Y от нескольких объясняющих (факторных)
переменных
X 1 ,
X 2 , …,
X p . Для решения таких задач используется регрес-
сионный анализ.
Множественная регрессия представляет собой регрессию результативно-
го признака
y = ϕˆ (x1 , x2 , ..., x p )+ε ,
где ε – случайная переменная, зависящая от ряда неучтенных факторов.
Определение 12.1. Функция
функцией.
yˆ = ϕˆ (x1, x2 ,..., x p )называется модельной
Будем рассматривать линейную множественную регрессию. Тогда для
каждого i -го наблюдения значение
yi результирующего признака определя-
ется через
xi1 ,
xi 2 , …,
xip
по формуле
yi =β0 +β1xi1 +β2 xi 2 +... +βp xip +εi ,
или в матричной форме
i =1,
2, ..., n ,
где приняты обозначения
Y = X ⋅β + ε ,
⎛1 x11
x12
...
x1 p ⎞
⎛ y1 ⎞
⎛β0 ⎞
⎛ε1 ⎞
⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟
⎜1 x21
x22
...
x2 p ⎟
⎜ y2 ⎟
⎜β1 ⎟
⎜ε2 ⎟
X = ⎜...
|
...
...
... ⎟,
Y = ⎜ ... ⎟,
β = ⎜ ... ⎟,
ε = ⎜ ... ⎟.
|
⎜
⎝ n1
xn 2
|
⎟
⎟
np ⎠
⎜ ⎟
|
⎜ ⎟
|
⎝ p ⎠
⎜ ⎟
|
Поскольку модельная функция ищется исходя из данных выборки, то оценкой этой модели является выборочное уравнение регрессии
Y = X ⋅r + e ,
где
r = (r , r , K, r )T
– вектор выборочных коэффициентов регрессии,
|
e = (e0
, e1, K, e p )
– вектор случайных факторов.
Рассмотрим следующую задачу множественной регрессии. Требуется:
1) найти функцию
yˆ = r0 +r1x1 +r2 x2 +... + rp x p ;
2) оценить значимость модельной функции, полученной по выборке;
3) оценить значимость коэффициентов регрессии;
4) оценить неизвестное значение зависимой переменной
y0 (прогноз значе-
ния), а также построить для него доверительный интервал.