Данные по производительности работников
Оценка производительности | Данные теста способностей | Пол 0 – женский; 1 - мужской |
Уравнение регрессии будем искать в виде:
, (3.1)
где х1 – переменная теста способностей;
х2 – фиктивная переменная «пол»:
Уравнение (3.1) эквивалентно следующим уравнениям:
- для женщин;
- для мужчин.
Коэффициент b2 представляет влияние мужского пола на производительность труда, b1 - влияние разницы в результатах теста способностей. Переменную х2 можно рассматривать как переключающую переменную, которая включена, когда рассматриваются данные для мужчины и выключена, когда данные относятся к женщине.
Введем данные в таблицу Excel и построим уравнение с помощью Пакета анализа. Результаты представлены на рис. 3.1.
Рис. 3.1. Вывод итогов
Как видно из рис. 3.1 получено уравнение регрессии:
. (3.2)
Коэффициент при х1 показывает, что при увеличении оценки теста на 1 балл, производительность труда увеличивается в среднем на 0,125 оценки.
Коэффициент при переменной х2 применим только для мужчин. Он свидетельствует, что оценка производительности труда для мужчин на 2,3 балла ниже по сравнению с женщинами, при условии, что значение теста способностей у них одинаково.
Коэффициенты уравнения при переменных х1 и х2 значимы. Следовательно, на оценку производительности значения теста и пол опрашиваемого оказывают значимое влияние.
Можно записать уравнение отдельно для мужчин и женщин:
- для женщин;
- для мужчин.
Эти уравнения можно использовать для прогноза.
Рассчитаем производительность труда при прохождении теста на 70 баллов:
- для женщин;
- для мужчин.
Тест Чоу
Пусть совокупность состоит из двух подвыборок. Допустим, что число наблюдений в первой подвыборке равно nA, во второй nB. У нас есть альтернатива: объединить подвыборки и оценивать одну объединенную регрессию или строить отдельные регрессии для каждой подвыборки.
Запишем уравнения регрессии для каждой из частей совокупности:
Если коэффициенты регрессии в обеих частях достаточно близки, то их можно считать регрессионно однородными и рассматривать не два отдельных уравнения, а одно общее уравнение, рассчитанное по совокупности в целом.
Проверяемая гипотеза имеет вид:
.
Г. Чоу (Chow) предложил тест для проверки гипотезы Но. Рассчитываются суммы квадратов остатков для регрессий подвыборок , и по объединенной выборке .
Равенство между будет иметь место только при совпадении коэффициентов регрессии для объединенной регрессии и регрессий подвыборок. В общем случае при разделении выборки будет наблюдаться улучшение качества уравнения, что можно представить, как . Это имеет свою цену: используются (k+1) дополнительных степеней свободы, так как вместо (k + 1) параметров для одной объединенной регрессии мы теперь должны оценить в сумме (2k+2) параметров (k — число объясняющих переменных, единица соответствует постоянному члену). После разделения выборки, однако, остается необъясненная сумма квадратов остатков и, кроме того (n — 2k — 2) степеней свободы.
Для того, чтобы определить, является ли значимым улучшение качества уравнения после разделения выборки, используется F-статистика:
, (4.1)
которая имеет распределение Фишера с (k+1) и (n—2k—2) степенями свободы.
Задача 4
По данным задачи 3.1 с помощью теста Чоу проверьте, что коэффициенты регрессионных уравнений для мужчин и женщин одинаковы.
Решение
Построим уравнение регрессии зависимости производительности труда от результатов теста отдельно для мужчин и женщин (рис. 4.1 и 4.2).
Рис. 4.1. Вывод уравнения зависимости производительности труда от результатов теста для женщин
Как видно из рис. 4.1 значение Q остаточное для этого уравнения равно 10,8281.
Рис. 4.2. Вывод уравнения зависимости производительности труда от результатов теста для мужчин
Для мужчин значение Q остаточное равно 4,09.
Построим уравнение регрессии для всей выборки и мужчин и женщин (рис. 4.3).
Рис. 4.2. Вывод уравнения зависимости производительности труда от результатов теста для всей выборки
Как видно Q остаточное для всей выборки равно 32,345.
Проверим гипотезу , то есть коэффициенты при переменной «Результаты теста» одинаковы для мужчин и женщин.
Воспользуемся формулой (4.1).
.
Найдем Fкрит для числа степеней свободы n1=k+1=1+1=2 и n2=n—2k—2=15-2-2=11 по таблице распределения Фишера или используя функцию Excel FРАСПОБР(0,05; 2; 11) = 3,98.
Так как Fнабл=6,4>Fкрит=6.4, то гипотеза о равенстве коэффициентов регрессии отвергается.