Постановка задачи регрессионного анализа
Прежде всего следует выбрать показатели функционирования процесса, анализ которого выполняется (остаточные напряжения в поверхностном слое деталей, удельный вес продукции высшего качества, процент брака и др.).
Показатели функционирования процесса (предприятия, отрасли, хозяйства), как правило, представляются таблицами статистических данных. Обычно один из показателей выделяется в качестве результирующего и изучается влияние на него других показателей как факторов.
После выбора результирующего показателя определяются наиболее значимые факторы на него влияющие:
- каждый из факторов должен непосредственно влиять на результат. После построения уравнения регрессии применительно к каждому фактору должна быть возможность сказать: «Изменение его на величину А приводит к изменению результата на величину В»;
- каждый фактор должен быть управляем, должен быть первичным и не должен быть действием других производственных причин, и быть независимым от других факторов;
- факторы должны быть численно определены;
- не следует включать в число факторов одновременно такие, которые при подстановке в известную формулу дают точное значение результата. Например,
.
После определения результирующего показателя и факторов собираются статистические данные по ним. Данные могут получены путем временной и пространственной выборки. Для обеспечения достаточной устойчивости получаемых результатов желательно иметь число наблюдений порядка 25. Это требование становится необходимым в случае 4 – 5 факторов регрессии.
Виды уравнений регрессии
Простейший случай представляет собой простая линейная регрессия (парная корреляция), где рассматривается зависимость между двумя показателями: показателем результатов (у) и одним фактором (х), от которого зависит этот показатель. Такие модели называются однофакторными. Форма зависимости может быть линейной и нелинейной.
В исследованиях наиболее часто встречаются шесть следующих видов уравнений регрессии:
1) – линейная;
2) – гиперболическая;
3) – квадратичная, – полиномиальная;
4) – степенная;
5) – показательная;
6) – экспоненциальная.
Для измерения совместного влияния ряда показателей-факторов на исследуемую величину строятся модели множественной корреляции. Функция регрессии в общем случае запишется y = f (x1, x2, … , xn).
Замена корреляционной зависимости на функциональную может привести к искажению отображения влияния факторов на результат. Поэтому общая задача регрессионного анализа состоит в определении такого вида и параметров уравнения регрессии, при которых наиболее точно представляется корреляционная зависимость.
При проведении регрессионного анализа необходимо выполнить, по крайней мере, следующие этапы работ:
1) определить показатели результатов производства и набор факторов, на них влияющих;
2) собрать статистические данные по этим показателям;
3) выбрать функцию для построения уравнения регрессии;
4) рассчитать значения коэффициентов (параметров) уравнения регрессии;
5) оценить надежность рассчитанных коэффициентов уравнения регрессии;
6) определить надежность оценок, полученных в результате использования уравнения регрессии;
7) провести анализ показателей, вытекающих из полученных расчетов.
Надежность оценок результирующего показателя , полученных в результате использования уравнения регрессии y = f (x1, x2, … , xn), показывает, насколько эти оценки точнее, чем среднее значение случайной величины результирующего показателя. Надежность указанных оценок зависит от качества исходной информации и от качества уравнений регрессии.