Определение вида регрессионной зависимости и коэффициента корреляции
В научных исследованиях необходимо знать вид зависимости искомой величины от условий проведения эксперимента . На практике такая зависимость определяется методами регрессионного и корреляционного анализов. Регрессия - это зависимость условного среднего от случайной величины. Уравнение называется уравнением регрессии. Знание конкретного вида зависимости и позволяет значительно упростить последующие расчеты, прогнозы и т. п. Вид приближающей функции F можно определил, следующим образом. По значениям и строится точечный график функции F, а затем проводится плавная кривая, по возможности наилучшим образом отражающая характер расположения точек. По полученной кривой устанавливается вид приближающей функции (обычно из числа простых аналитических функций).
Однако строгая функциональная зависимость для экспериментально полученной таблицы наблюдается редко, так как каждая из участвующих величин может зависеть от многих случайных факторов. Формула (эмпирическая формула или уравнение регрессии на х) интересна тем, что позволяет находить значение функции для нетабличных значений х и сглаживания результатов измерений величины. Оправданность такого подхода определяется в конечном счете практической полезностью полученной формулы. После того, как выбран вид зависимости от , необходимо определить коэффициенты этого уравнения.
В качестве приближающих функций в зависимости от характера точечного графика функции часто используют следующие функции:
где A, B, C, m - параметры.
Параметры уравнений определяются из условий, чтобы сумма была минимальной. Здесь -табличное значение, а , - значение функции в точке xl при cоответствующих коэффициентах уравнения. Такая задача носит название приближения функции методом наименьших квадратов.
Формулы для определения коэффициентов уравнения методом наименьших квадратов зависимости вида имеют следующий вид:
Чтобы найти коэффициенты других уравнений, их необходимо привести к линейному виду:
- степенная функция
- показательная функция
- дробно-линейная функция
- логарифмическая функция
- гипербола
- дробно-рациональная
Анализ экспериментальных данных методом определения вида и коэффициентов уравнения регрессии обычно сопровождался вычислением коэффициента корреляции - величины, показывающей, насколько близко экспериментальные точки ложатся к прямой линии.
Коэффициент корреляции вычисляют по формуле:
Значение коэффициента корреляции всегда удовлетворяет соотношению . Если , то между и существует прямая линейная зависимость. При величины и практически независимы.
ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ ЛИНЕЙНОЙ МОДЕЛИ С ПОМОЩЬЮ ПЛАНОВОГО ЭКСПЕРИМЕНТА
11.1 Составление матрицы планирования эксперимента
Необходимость проведения такого рода экспериментов продиктована тем, что в большинстве случаев в исследованиях мы имеем дело с влиянием многих факторов. Наиболее часто это используется при определении оптимальных условий эксперимента или оптимального состава композиции или смесей веществ и т. п. Процедура оптимизации начинается с определения параметров модели или зависимости искомой величины Y от некоторых факторов x1....xn. В простейшем случае модель имеет линейный вид, например, при двух факторах
где - коэффициенты уравнения регрессии; x1 , х2 - факторы (условия эксперимента).
Факторы x1....xn имеют в данном случае кодированное значение х, которое определяют по формуле:
,
где хi - натуральное значение фактора; х0 - натуральное значение базового уровня фактора; - интервал варьирования фактора.
Величина х принимает значение либо -1, либо +1, т.е. имеет два уровня -верхний и нижний.
Пусть процесс определяется двумя факторами. Тогда условия проведения эксперимента при отсутствии повторений могут быть представлены в виде таблице 11.1.
Таблица 11.1 – Матрица планирования эксперимента с двумя факторами
№ опыта | Y | ||
+1 +1 -1 -1 | +1 -1 +1 -1 |
Коэффициенты представленной выше модели вычисляются по формулам:
После определения и по их абсолютной величине можно оценить, какой из факторов оказывает наибольшее влияние. Знак при каждом коэффициенте показывает, увеличивает или уменьшает величину изменение того или иного фактора.
При изучении свойств, зависящих только от соотношения компонентов в смеси, план эксперимента представляет собой правильный симплекс, количество граней которого будет зависеть от количества компонентов. В этом случае должно выполняться условие
где - концентрация компонента; q - количество компонентов. При q=3 правильный симплекс - равносторонний треугольник, каждая точка которого отвечает одному определенному составу тройной системы.
Наиболее полное описание планового эксперимента при изучении диаграмм состав-свойство можно найти в специальной литературе.
Пример обработки экспериментальных данных
Оценить среднее значение толщины композиционного покрытии, исключить «грубые» измерения и определить погрешность измерения.
При измерении толщины композиционного покрытия микрометром с ценой деления 0,01 мм были получены значения (таблица 11.2).
Таблица 11.2. Результаты измерений
i | Hi, мм |
14,85 14,80 14,84 15,32 14,81 |
Найдем среднее значение толщины покрытия
Для определения среднего квадратичного отклонения S - составим таблицу 11.3.
Таблица 11.3 – Результаты вычислений
14,85 14,80 14,84 15,32 14,81 | 220,5225 219,0400 220,2256 234,7024 210,3361 | 74,62 | 1113,8266 |
Среднее квадратичное отклонение определим по уравнению:
Проверим результат при i=4, подозреваемый как "грубый", для чего вычислим
Для и п = 5 определим по табл. 2 . Сравним и , следовательно результат 15,32 является следствием только статистического разброса и не является грубым. Из табл. 1 определим для п=5 и . Он равен . Вычислим доверительный интервал
Учитывая правила численного выражения результата эксперимента, принимаем
Относительная погрешность