Систематическая ошибка свободного члена регрессии
Предположим, что регрессионный анализ внутри групп показывает, что и в группе мужчин, и в группе женщин наклон линии регрессии совпадает с общим регрессионным уравнением, но значения свободного члена расходятся со значением, данным в общем регрессионном уравнении. В этом случае можно предположить, что тест подвержен систематической ошибке свободного члена регрессии.
Например, представьте, что в рассматриваемом примере с тестом технических способностей регрессионный анализ проводится отдельно для 50 мужчин и для 50 женщин. Обнаруживается, что для обеих групп наклон линии регрессии b составляет 0.58, что совпадает с наклоном линии регрессии в общем регрессионном уравнении. Однако обнаруживается также, что значение свободного члена регрессии в группе мужчин a = 58.03, а в группе женщин a = 54.03. Следует заметить, что данные внутригрупповые значения свободного члена регрессии расходятся со значением свободного члена в общем регрессионном уравнении. Следовательно, тест, вероятно, подвержен систематической ошибке свободного члена регрессии.
Каковы же следствия наличия этой ошибки? Тот факт, что значение свободного члена регрессии в группе мужчин выше, чем в группе женщин, указывает на то, что при любом одинаковом уровне способностей экспертная оценка руководителей для мужчин будет выше, чем для женщин. Чтобы проиллюстрировать это, рассчитаем прогнозируемые значения критериальной переменной для мужчин с тестовым баллом, равным 70, и для женщин с таким же тестовым баллом:
Прогнозируемое значение критериальной переменной для мужчин = 58.03 + 0.58(70),
Прогнозируемое значение критериальной переменной для мужчин = 98.63,
Прогнозируемое значение критериальной переменной для женщин = 54.03 + 0.58(70),
Прогнозируемое значение критериальной переменной для женщин = 94.63.
Данные расчеты показывают, что при одинаковом уровне способностей у мужчин и у женщин прогнозируемая экспертная оценка руководителя в группе мужчин будет на 4 пункта выше. Если предположить, что критериальная переменная сама по себе не подвержена систематической ошибке (это предположение будет рассмотрено ниже в данной главе), данное расхождение в значениях показывает, что тест технических способностей для мужчин и для женщин «работает» по-разному. Как было показано ранее, прогнозируемое значение критериальной переменной в общем регрессионном уравнении при тестовом балле, равном 70, составляло 96.63. Сравнивая данный результат с внутригрупповыми результатами, приходим к выводу, что общее регрессионное уравнение преуменьшает экспертную оценку руководителя для мужчин и преувеличивает - для женщин. Таким образом, тест оказывается подверженным прогностической систематической ошибке.
Если тест подвержен только лишь систематической ошибке свободного члена регрессии, величина расхождения между группами будет оставаться постоянной при всех значениях тестового балла. Выше было показано, что расхождение по прогнозируемому значению критериальной переменной между мужчиной и женщиной, тестовые баллы которых равны 70, составило 4 пункта. Если тест способностей подвержен систематической ошибке только лишь свободного члена регрессии, такое же расхождение будет наблюдаться при любом из возможных тестовых баллов. Это проиллюстрировано на Рисунке 11.5, где изображена как общая линия регрессии (пунктиром), так и линии регрессии отдельно для двух групп. Как показано на рисунке, эти линии параллельны, что означает, что прогнозируемая экспертная оценка руководителя для респондента-мужчины с определенным уровнем технических способностей всегда будет на 4 балла превышать такую оценку для респондента-женщины с таким же уровнем технических способностей.
Рисунок 11.5. Графики линейной регрессии в группах мужчин и женщин по сравнению с графиком общего регрессионного уравнения (иллюстрация систематической ошибки свободного члена регрессии)
Систематическая ошибка наклона линии регрессии (вариант: систематическая ошибка углового коэффициента регрессии)
Прогностическая систематическая ошибка теста может проявляться также через ошибку наклона линии регрессии. Предположим, что регрессионный анализ показал, что значение свободного члена регрессии для группы мужчин и для группы женщин является сходным с аналогичным значением в общем регрессионном уравнении, однако показатель наклона линии регрессии в этих группах отличается от общего. Это означает, что связь между тестовыми баллами и значениями критериальной переменной в двух группах различается.
Например, предположим, что значение свободного члена регрессии а для обеих групп составляет 56.03, что сходится со значением свободного члена в общем регрессионном уравнении. Однако значение наклона линии регрессии для мужчин составляет b = 0.53, а для женщин b = 0.63. Следует заметить, что данные значения наклона линии регрессии отдельно для двух групп респондентов отличаются от наклона, общего для двух групп (0.58).
Наклон линии регрессии значительным образом отражается на степени расхождения между прогнозируемыми значениями критериальной переменной для двух групп. Тот факт, что наклон линии регрессии в группе мужчин меньше, чем наклон линии регрессии в группе женщин, показывает, что систематическая ошибка варьирует в зависимости от полученного тестового балла. Чтобы проиллюстрировать это, следует рассчитать прогнозируемые значения критериальной переменной для мужчины с тестовым баллом, равным 70, и для женщины с таким же тестовым баллом:
Прогнозируемое значение критериальной переменной для мужчин = 56.03 + 0.53(70),
Прогнозируемое значение критериальной переменной для мужчин = 93.13,
Прогнозируемое значение критериальной переменной для женщин = 56.03 + 0.63(70),
Прогнозируемое значение критериальной переменной для женщин = 100.13.
Результаты показывают, что при тестовом балле, равном (как у мужчины, так и у женщины) 70, прогнозируемое значение критериальной переменной для женщины будет на 7 баллов выше, чем для мужчины. Рассчитаем теперь прогнозируемое значение критериальной переменной для мужчины и для женщины, тестовый балл которых (по тесту технических способностей) составляет 60.
Прогнозируемое значение критериальной переменной для мужчин = 56.03 + 0.53(60),
Прогнозируемое значение критериальной переменной для мужчин = 87.83
Прогнозируемое значение критериальной переменной для женщин = 56.03 + 0.63(60)
Прогнозируемое значение критериальной переменной для женщин = 93.83
В данном случае прогнозируемое значение критериальной переменной для женщины превышает «мужское» уже на 6 баллов. Таким образом, систематическая ошибка (т.е. степень, в которой прогнозируемые значения критериальной переменной различаются у мужчин и женщин, имеющих одинаковые тестовые баллы) является относительно незначительной для относительно низких уровней выраженности технических способностей, но с повышением уровня выраженности способностей увеличивается. Другими словами, расхождение между прогнозируемыми значениями критериальной переменной будет увеличиваться по мере увеличения полученных респондентами тестовых баллов. Такого рода «чистая» систематическая ошибка наклона линии регрессии изображена на Рисунке 11.6, который показывает, что линии регрессии для мужчин и для женщин уже не параллельны друг другу, а расходятся.
Рисунок 11.6. Графики линейной регрессии в группах мужчин и женщин по сравнению с графиком общего регрессионного уравнения (иллюстрация систематической ошибки наклона линии регрессии)