Анализ линейной зависимости методом наименьших квадратов

Зависимость типа y = a + bx называется линейной. Для математического описания этой формы зависимости достаточно определить величину коэффициента b и свободного члена a в координатах y = f (x).

Анализ линейной зависимости методом наименьших квадратов - student2.ru Анализ линейной зависимости методом наименьших квадратов - student2.ru

Рис. 9.2. Параметры линейной зависимости (объяснение в тексте)

В данном случае b – тангенс угла наклона функции b > 0, если функция возрастает и b < 0 в случае убывающей функции. Если же функция параллельна оси абсцисс, т.е. значения yi не зависят от аргумента, то b = 0.

a = y0 – ордината точки при x = 0. Величина свободного члена а положительна(a > 0), если точка пересечения функции с осью ординат лежит выше нуля; a < 0, если точка пересечения лежит ниже начала координат.

Метод наименьших квадратов основан на одном из свойств среднего арифметического значения: сумма квадратов отклонений от среднего меньше суммы квадратов отклонений от любой другой точки (см. 4. 3). Таким образом, вычисляя параметры a и b линейной функции, мы задаем такое положение линии, при котором сумма квадратов отклонений (расстояний) эмпирических (экспериментальных) точек от теоретически рассчитанной прямой минимальна.

Вычисление тангенса угла наклона функции (b)

Анализ линейной зависимости методом наименьших квадратов - student2.ru где Анализ линейной зависимости методом наименьших квадратов - student2.ru и Анализ линейной зависимости методом наименьших квадратов - student2.ru Анализ линейной зависимости методом наименьших квадратов - student2.ru . (9.1)

Таким образом, Анализ линейной зависимости методом наименьших квадратов - student2.ru (9.2)

Другими словами, для вычисления тангенса угла наклона достаточно рассчитать две уже знакомые нам величины – дисперсию значений аргумента (Sxx) и ковариацию (Sxy).

Вычисление свободного члена (а) в уравнении линейной регрессии:

Анализ линейной зависимости методом наименьших квадратов - student2.ru (9.3)

Кроме двух вышеуказанных показателей, при использовании метода наименьших квадратов часто вычисляют величину ошибки регрессии (s ). Ошибка регрессии по сути является аналогом стандартного отклонения. Она отражает степень точности определения положения линейной функции в данной системе координат.

Вычисление ошибки регрессии:

Анализ линейной зависимости методом наименьших квадратов - student2.ru где Анализ линейной зависимости методом наименьших квадратов - student2.ru Анализ линейной зависимости методом наименьших квадратов - student2.ru . (9.4)

Величина ошибки регрессии может отражать:

а) величину разброса экспериментальных точек относительно теоретических значений функции, т.е. она тем больше, чем больше сумма квадратов отклонений от теоретической функции (при полном совпадении экспериментальных и теоретических значений s = 0);

б) нелинейность функции в данной системе координат (для определения нелинейности функции не следует пренебрегать ее графическим изображением и не следует пытаться описать уравнением линейной регрессии функцию, которая явно не является линейной).

Ошибка коэффициента уравнения линейной регрессии (тангенса угла наклона) определяется по формуле:

Анализ линейной зависимости методом наименьших квадратов - student2.ru

(9.5)

где σ – величина ошибки регрессии, m - число измерений для каждого y (при условии повторения эксперимента).

В тех случаях, когда возникает необходимость сравнить между собой две индивидуальные или усредненные функции на предмет достоверности их различий, можно использовать величины тангенса угла наклона с соответствующим доверительным интервалом: b1 ± t×sbи b2 ± t×sb. Вывод о достоверности различий делается в том случае, когда доверительные интервалы для двух испытуемых (или двух выборок) не перекрываются между собой (так же как и в случае определения достоверности различий между выборками по критерию Стьюдента (см. подраздел 7.4.)).

Для того чтобы приобрести определенный навык в расчетах подобного рода, рассмотрим задачу из области психофизики.

Условие задачи

В психофизических исследованиях субъективной оценки громкости (R) тонального звука, проведенных на 50 испытуемых, были получены следующие данные (табл. 9.1):

Таблица 9.1

I, дБ
R 1,4 2,9 6,8 10,5 17,4 27,5 66,1 107,2 158,5

Задание

Принимая, что усредненные оценки громкости описываются степенной функцией Стивенса, с помощью метода наименьших квадратов рассчитать основные параметры психофизической функции субъективной оценки громкости.

Решение

1. Учитывая тот факт, что степенная функция Стивенса y = k·S n есть в то же время двойная логарифмическая функция типа log y = n·log S + C, и то, что шкала децибелов представляет собой логарифмическую шкалу (20 дБ = 1 лог. ед.), проводим следующие преобразования:

а) преобразуем физическую шкалу сенсорного стимула в логарифмические единицы по десятичному основанию по принципу х = I / 20.

б) логарифмируем значения субъективной шкалы по принципу y = lg R (табл. 9.2).

Таблица 9.2

x 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5
y 0,15 0,46 0,83 1,02 1,24 1,44 1,82 2,03 2,20

2. Вычисляем предварительные (рабочие) параметры:

Анализ линейной зависимости методом наименьших квадратов - student2.ru Анализ линейной зависимости методом наименьших квадратов - student2.ru

Анализ линейной зависимости методом наименьших квадратов - student2.ru

3. Вычисляем основные параметры психофизической функции:

Анализ линейной зависимости методом наименьших квадратов - student2.ru Анализ линейной зависимости методом наименьших квадратов - student2.ru

Анализ линейной зависимости методом наименьших квадратов - student2.ru Анализ линейной зависимости методом наименьших квадратов - student2.ru

Вывод

Субъективная оценка громкости тонального звука для данной группы испытуемых описывается степенной функцией Стивенса следующего типа:

у = 0,51х – 0,032, или R = 1,076 I0,51 + C (антилогарифм 0,032 равен –1,076).

В некоторых случаях возникает задача сравнения между собой психофизических функций у двух или более испытуемых на предмет достоверности их различий. Попарное сравнение можно сделать, определяя тангенс угла наклона функции с доверительным интервалом. Так, различия можно считать статистически достоверными, если интервалы b1 ± tn-1·σb1 и b2 ± tn-1·σb2 не имеют области перекрытия.

Множественная регрессия

Предположим, что на величину исследуемого признака (y) оказывает влияние большое число разнообразных факторов:

y = a + b1x1 + b2x2 + ... + bmxm. (9.3)

где x1, x2, … xm – факторы, оказывающие влияние на переменную величину. Коэффиценты при факторах по сути представляют собой коэффициенты корреляции факторов с результирующим признаком. Для определения коэффициентов b1, b2, ..., bm (т. е. степени влияния факторов x1, x2, ..., xm на параметры функции), а также свободного члена уравнения а существуют специальные алгоритмы и компьютерные программы. Расчет множественной регрессии на калькуляторе чрезвычайно громоздок, поэтому, как правило, вычисления ведутся на компьютере.

По сути дела задача множественного регрессионного анализа сводится к выявлению тех факторов, которые оказывают наиболее существенное влияние на величину исследуемого признака, и исключению тех факторов, влияние которых незначительно.

Задачи по теме

Задача 9. 1

Условие задачи

5 испытуемых оценивали субъективную тяжесть предлагаемых им грузов массой от 20 до 1280 г. Использовался метод категориального шкалирования (группировки), причем тяжесть каждого груза предлагалось оценить одной из пяти категорий: 1 – очень легкий, 2 – легкий груз, 3 – груз средней тяжести, 4 – тяжелый и 5 – очень тяжелый. Получены следующие результаты:

Испытуемый Масса груза в граммах

Задание

По данным, усредненным по 5 испытуемых, построить психофизическую функцию категориальной оценки. Определить форму зависимости и рассчитать основные параметры функции.

Задача 9. 2

Условие задачи

Двое испытуемых визуально оценивали площадь круга в относительных единицах. Получены следующие данные:

Площадь круга, см2 S
Оценки 1-го испытуемого R1 1,0 1,2 1,5 2,5 3,6
Оценки 2-го испытуемого R2 1,5 2,5

Задание

1. Методом подбора координат определить форму психофизической функции для обоих испытуемых (использовать полулогарифмические и двойные логарифмические координаты).

2. Методом наименьших квадратов рассчитать основные параметры психофизических функций (b, a, sиsb) для обоих испытуемых.

3. Используя величины b1и b2, определить достоверность различий между психофизическими функциями двух испытуемых (для 1-го уровня значимости tст. = 2,31).

З а д а ч а 9. 3

Условие задачи

Шкалирование яркости светового сигнала, проведенное 50 испытуемыми, обнаружило следующие соотношения между физической яркостью (B) и ее субъективной оценкой (RB):

B, кд/м2 2,5
Rв 1,0 1,5 2,2 3,2 4,7
B, кд/м2
Rв 6,8 10,1 14,8 21,7 32,0

Задание

Принимая, что субъективная оценка яркости описывается степенной функцией Стивенса, построить психофизическую функцию в координатах lg R = f (lg B) и определить ее основные параметры (b, a, sиsb).

З а д а ч а 9. 4

Условие задачи

10 испытуемых оценивали длительность тонального звука методом кросс-модального подбора, рисуя линии соответствующей длины на экране дисплея. Получены следующие результаты:

Испытуемый Длительность звука в секундах
0,25 0,5 1,0 2,0 4,0 8,0 16,0
Ю. П. Ю. М. Л. Г. И. Т. Т. З. Е. К. Н. У. М. Х. Л. К. Н. А.

Примечание: цифры в таблице соответствуют длине подбираемых линий в миллиметрах.

Задание

1. Методом подбора координат определить форму психофизической функции L = f (T) для данных, усредненных по 10 испытуемым.

2. Методом наименьших квадратов вычислить основные параметры психофизической функции для кросс-модального подбора длины линий к длительности звукового сигнала.

РАЗДЕЛ 10.
Меры влияния

Сущность проблемы

В различных областях психологии часто приходится иметь дело с влиянием на исследуемый признак тех или иных факторов. Понятие фактора в данном случае трактуется чрезвычайно широко: по сути, это любое воздействие, которое может изменять величину исследуемого признака. Так, в клинической практике это может быть действие психотропных препаратов или психотерапевтического воздействия. В педагогической психологии в качестве факторов могут выступать те или иные учебно-воспитательные методики. При исследовании какого-либо психологического признака в разных возрастных группах в качестве фактора может рассматриваться возраст испытуемых и т. д. При влиянии определенных факторов или их совокупности величина исследуемого признака может меняться в ту или иную сторону. Задача состоит в том, чтобы на основании изменения исследуемого признака определить статистическую достоверность (значимость) влияния данного фактора. Для анализа достоверности влияния того или иного фактора, а также для сравнения между собой силы влияния разных факторов используются как параметрические (дисперсионный анализ), так и непараметрические меры влияния (критерий знаков, критерий Т Вилкоксона и др.).

Наши рекомендации