Порядок выполнения работы. регрессионный анализ экспериментальных данных

РЕГРЕССИОННЫЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Часть 2. Однофакторный регрессионный анализ на базе

программы "Stadia"

Методические указания к выполнению лабораторной работы

по дисциплине "Математическая статистика"

Составители: Егорова Ю.Б.

Мамонов И.М.

МОСКВА 2005

ВВЕДЕНИЕ

Методические указания предназначены для студентов дневного отделения факультета № 14 специальности 230102.

Цель лабораторной работы - изучить порядок проведения однофакторного регрессионного анализа. Лабораторная работа выполняется на ПК с помощью учебной программы «Stadia6.0».

Основная задача регрессионного анализа заключается в нахождении математической зависимости (уравнения регрессии) y=f(x) между исследуемыми факторами y и x. В общем случае регрессионный анализ позволяет:

а) рассчитать коэффициенты регрессионной модели (коэффициенты регрессии) и проверить их значимость;

б) проверить адекватность регрессионной модели экспериментальным данным;

в) построить доверительные интервалы для уравнения регрессии;

г) выбрать из нескольких математических моделей ту, которая с большей точностью описывает экспериментальную зависимость;

д) использовать модель для прогнозирования.

ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ

1. Ввести исходные данные в электронную таблицу. Столбцы отвечают переменным (случайным величинам), а строки – значениям переменных. В задании даны значения двух случайных величин х1 и х2. Числа записывают в научной нотации, когда очень большие и очень малые значения представлены с десятичным множителем, показатель которого следует за символом Е.

Например: 18000=18×103=18Е3; 0,003 = 3×10-3=3Е-3.

2. В блоке «Статистические методы» выбрать процедуру «Простая регрессия».

3. В меню "Переменные регрессии" выбрать для анализа переменные Х и У из электронной таблицы.

4. В меню "Регрессия" необходимо выбрать регрессионную модель. В правой части меню выбора приведены формулы различных регрессионных моделей, в левой части - их названия.

5. Стандартная выдача результатов регрессионного анализа включает следующие характеристики:

5.1. регрессионную модель, записанную в общем виде;

5.2. таблицу, в которой приведены значения коэффициентов регрессии, стандартные ошибки вычисления каждого коэффициента, проверка значимости каждого коэффициента:

Коэффициент а0 а1 аi
Значение коэффициента      
Стандартная ошибка коэффициента      
Значимость Р коэффициента      

Проверяется нулевая гипотеза "Коэффициент регрессии равен нулю", что означает его незначимость. Если Р>0,05, то нулевая гипотеза принимается, следовательно, коэффициент незначим. Если Р<0,05, то нулевая гипотеза отвергается и принимается альтернативная гипотеза "Коэффициент регрессии не равен нулю", что означает его значимость.

5.3. таблицу дисперсионного анализа, предназначенную для анализа точности и адекватности модели:

Источники отклонений Сумма квадратов отклонений Степень свободы Средн. сумма квадратов (дисперсия)
Регрессионные Qрегр k1 =p S2регр= Qрегр. /k1
Остаточные Qост k2 =n-p-1 S2ост= Qост /k2
Общие Qобщ= Q2регр.+ Q2ост k1 + k2 S2общ

5.4. таблицу проверки нулевой гипотезы"Коэффициент корреляции равен нулю":

МножествR R2 ПривR2 Ст. ошиб. F Значим
           

Проверка адекватности регрессионной модели осуществляется в автоматическом режиме несколькими способами, но на экран монитора выводятся для наглядности результаты дисперсионного анализа и различные статистические характеристики:

- коэффициент корреляции R,

- коэффициент детерминации R2,

- приведенный коэффициент детерминации R2,

- стандартная ошибка уравнения регрессии,

- расчетное значение критерия Фишера F,

- уровень значимости Р нулевой гипотезы.

Принятие нулевой гипотезы (при Р>0,05) означает, что между исходными данными и выбранной регрессионной моделью нет соответствия, иными словами - модель неадекватно описывает экпериментальные данные. При Р<0,05 - модель адекватна.

6. Графическая выдача результата регрессионного анализа содержит экспериментальные точки, регрессионную кривую, нижнюю и верхнюю границы доверительного интервала линии регрессии.

7. После выдачи результатов анализа следующим появляется меню "Что дальше?", предназначенное для выбора дальнейшего направления анализа из четырех пунктов: анализ остатков, прогнозирование, выбрать новую модель, закончить анализ.

7.1. Анализ остатков предназначен для нахождения доверительных интервалов уравнения регрессии. В ходе анализа остатков на экран монитора выводится таблица:

Хэксп Уэксп У регр остаток Ст. остат. Ст.ошиб. Довер. Инт.
             

В таблице приводятся экспериментальные значения Хэксп и Уэксп; значения Урегр, определенные по регрессионной модели; остаток Уэксп - Урегр; остаток в единицах стандартного отклонения; стандартная ошибка предсказания среднего значения; величина доверительного интервала при уровне надежности 0,95.

7.2. При выборе прогноза в правое поле меню дальнейшего анализа нужно ввести число точек прогноза, величину шага прогноза и нажать клавишу прогноза. На экран монитора выдается таблица:

Хпрогн Упрогн Ст. ошиб. Довер.инт
       

Таблица содержит прогнозируемое значение Хпрогн; прогнозируемое значение Упрогн, определенное по регрессионной модели; стандартную ошибку прогноза, доверительный интервал прогноза при уровне надежности 0,95.

7.3. При выборе новой модели на экране монитора опять появляется меню "Регрессия" (см.п.4). Целесообразно рассчитать несколько моделей и среди моделей, адекватных экспериментальным данным, выбрать ту, для которой минимальна стандартная ошибка или максимален коэффициент корреляции.

7.4. Закончить анализ.

ОФОРМЛЕНИЕ ОТЧЕТА

Отчет должен содержать таблицу исходных данных, результаты процедур "Простая регрессия", "Анализ остатков", "Прогноз", два графика (линию регрессии с зоной доверительного интервала и график прогноза) и выводы.

ЗАДАНИЕ. Провести регрессионный анализ между сроком службы самолета (Х, лет) и стоимостью его эксплуатации (У, млн руб.). Результаты измерений приведены в табл. 1.

I. Исходные данные:

Стоимость эксплуатации самолета в зависимости от срока службы:

Х, лет
У, млн руб.

Наши рекомендации