Характеристика видов связей между рядами наблюдений
На практике сама необходимость измерений большинства величин вызывается тем, что они не остаются постоянными, а изменяются в функции от изменения других величин. В этом случае целью проведения эксперимента является установление вида функциональной зависимости j=f(X). Для этого
должны одновременно определяться как значения X, так и соответствующие им значения у, а задачей эксперимента является установление математической модели исследуемой зависимости. Фактически речь идет об установлении свя-зи между двумя рядами наблюдений (измерений).
Определение связи включает в себя указание вида модели и определение ее параметров. В теории экспериментов независимые параметры X=(х-|, ..., хк) принято называть факторами, а зависимые переменные у - откликами. Координатное пространство с координатами x-i, х2, ..., х, ..., хк называется Факторным пространством. Эксперимент по определению вида функции
у =f(x), (4.1)
где х - скаляр, называется однофакторным. Эксперимент по определению функции вида
у =f(X), (4.1а)
где X=(х-|, х2, ..., Xi, ..., xk) - вектор - многофакторным.
Геометрическим представлением функции отклика в факторном пространстве является поверхность отклика. При однофакторном эксперименте (к=1) поверхность отклика представляет собой линию на плоскости, при двух-факторном (к=2) - поверхность в трехмерном пространстве.
Связи в общем случае являются достаточно многообразными и сложными. Обычно выделяют следующие виды связей.
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА...
Функциональные связи (или зависимости) - это такие связи, когда при изменении величины Xдругая величина у изменяется так, что каждому значению Xj соответствует совершенно определенное (однозначное) значение у (рис.4.1,а). Таким образом, если выбрать все условия эксперимента абсолютно одинаковыми, то, повторяя испытания, получим одну и ту же зависимость, т.е. кривые идеально совпадут для всех испытаний.
К сожалению, такие условия в реальности не встречаются. На практике не удается поддерживать постоянство условий (например, физико-химические свойства шихты при моделировании процессов тепломассопереноса в металлургических печах). При этом влияние каждого случайного фактора в отдельности может быть мало, однако в совокупности они существенно могут повлиять на результаты эксперимента. В этом случае говорят о стохастической (вероятностной) связи между переменными.
a
б
в
Рис.4.1. Виды связей: а - функциональная связь, все точки лежат на линии; б - связь достаточно тесная, точки группируются возле линии регрессии, но не все они лежат на ней; в - связь слабая
Стохастичность связи состоит в том, что одна случайная переменная у реагирует на изменение другой Xизменением своего закона распределения (см. рис. 4.1, б). Таким образом, зависимая переменная принимает не одно конкретное значение, а некоторое из множества значений. Повторяя испытания, мы будем получать другие значения функции отклика, и одному и тому же значению X в различных реализациях будут соответствовать различные значения
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…
у в интервале [xmin; xmax]- Искомая зависимость у =f(X) может быть найдена лишь в результате совместной обработки полученных значений Xи у.
На рис. 4.1, б - это кривая зависимости, проходящая по центру полосы экспериментальных точек (математическому ожиданию), которые могут и не лежать на искомой кривой у =f(X), а занимают некоторую полосу вокруг нее. Эти отклонения вызваны погрешностями измерений, неполнотой модели и учитываемых факторов, случайным характером самих исследуемых процессов и другими причинами.
Анализ стохастических связей приводит к различным постановкам задач статистического исследования зависимостей, которые упрощенно можно классифицировать следующим образом:
1) задачи корреляционного анализа - задачи исследования наличия взаимосвязей между отдельными группами переменных ;
2) задачи регрессионного анализа - задачи, связанные с установлением аналитических зависимостей между переменным у и одним или несколькими переменными x-i, х2, ..., Xi, ..., xk, которые носят количественный характер;
3) задачи дисперсионного анализа - задачи, в которых переменные х-i, х2, ..., Xi, ..., xk имеют качественный характер, а исследуется и устанавливается степень их влияния на переменное у.
Стохастические зависимости характеризуются формой, теснотой связи и численными значениями коэффициентов уравнения регрессии.
Форма связи устанавливает вид функциональной зависимости y=f(X) и характеризуется уравнением регрессии. Если уравнение связи линейное, то имеем линейную многомерную регрессию, в этом случае зависимость у от Xописывается линейной зависимостью в k-мерном пространстве:
к
у = Ь0+^Ь:х:, (4.2)
/=1
где bo, ..., bj, ..., bk - коэффициенты уравнения. Для пояснения существа используемых методов ограничимся сначала случаем, когда х - скаляр. В общем
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…
случае виды функциональных зависимостей в технике достаточно многообразны: показательные у = brjx 1 , логарифмические y = t>olg(x) и т.д.
Заметим, что задача выбора вида функциональной зависимости - задача неформализуемая, так как одна и та же кривая на данном участке примерно с одинаковой точностью может быть описана самыми различными аналитическими выражениями. Отсюда следует важный практический вывод. Даже в наш век компьютеров принятие решения о выборе той или иной математической модели остается за исследователем. Только экспериментатор знает, для чего будет в дальнейшем использоваться эта модель, на основе каких понятий будут интерпретироваться ее параметры.
Крайне желательно при обработке результатов эксперимента вид функции y=f(X) выбирать, исходя из условия ее соответствия физической природе
изучаемых явлений или имеющимся представлениям об особенностях поведения исследуемой величины. К сожалению, такая возможность не всегда имеется, так как эксперименты чаще всего проводятся для исследования недостаточно или неполно изученных явлений.
При изучении зависимости y=f(x)
от одного фактора при заранее неизвестном виде функции отклика для приближенного определения вида уравнения регрессии полезно предварительно построить эмпирическую линию регрессии (рис.4.2). Для этого весь диапазон
изменения х разбивают на равные ин-
Рис.4.2. К построению
тервалы Ах. Все точки, попавшие в дан-
эмпирической линии регрессии
ный интервал Axj, относят к его середине ^j . Для этого подсчитывают частные
средние для каждого интервала:
П;
Eyji
у; = ——. (4.3)
J п;
4. АНАЛИЗ РЕЗУЛЬТАТОВ ПАССИВНОГО ЭКСПЕРИМЕНТА…
к* Здесь nj - число точек в интервале Axj, причем Znj = п - гДе к* - число интер-
j=l
валов разбиения; п - объем выборки.
Затем последовательно соединяют точки (х,;у,) отрезками прямой. Полученная ломаная называется эмпирической линией регрессии. По виду эмпирической линии регрессии можно в первом приближении подобрать вид уравнения регрессии y=f(x).
Под теснотой связи понимается степень близости стохастической зависимости к функциональной, т.е. показатель тесноты группирования экспериментальных данных относительно принятого уравнения модели (см. рис. 4.1,6,в). В дальнейшем уточним это положение.