Internet и использование компьютера
Существует несколько компьютерных программ для выполнения корреляционного анализа. В программе SPSS можно использовать CORRELATIONS для вычисления коэффициента корреляции Пирсона, PARTIAL CORR— для вычисления частных корреляций и NONPAR CORR— для вычислений коэффициентов ранговой корреляции Спирмена р и Кендалла т. В программе SAS можно использовать CORR для вычисления коэффициентов корреляций Пирсона, Спирмена, Кендалла и коэффициентов частных корреляций. В BMDP с помощью P8D вычисляют коэффициент корреляции Пирсона, с помощью P3S — коэффициенты корреляции Спирмена и Кендалла, с помощью P6R — частные корреляции. В Minitab можно вычислить корреляцию, используя функцию Stat>Basic>Correlation. С ее помощью вычисляют коэффициент корреляции Пирсона.
В Excel для определения корреляции обращаются к функции Tools>Data analysis>Correlation. Используйте функцию Correlation Worksheet Function, чтобы определить коэффициент корреляции для двух рядов ячеек.
Компьютерные программы для анализа корреляции и регрессии
SPSS
С помощью программы REGRESSION вычисляют уравнения парной и множественно] регрессий, соответствующие статистики и графики. Она также позволяет легко проверит значения остаточных членов. Можно выполнить и ступенчатую регрессию. Регрессионны статистики также можно вычислить с помощью программы PLOT, которая строит диаграм мы рассеяния и другие виды диаграмм.
SAS
Программа REG является общей процедурой для выполнения регрессионного анализа которая подходит для парных и множественных регрессионных моделей при использованш метода наименьших квадратов. Она позволяет вычислить все соответствующие статистики i построить график расположения остаточных членов. Могут быть реализованы ступенчаты методы. Метод ORTHOREG рекомендуют для регрессии в случае некорректных данны> Программа GLM использует метод наименьших квадратов для подгонки общих линейны моделей, ее также можно использовать для регрессионного анализа. С помощью программ! NLIN вычисляют параметры нелинейных моделей, используя методы наименьших квадра тов или взвешенных наименьших квадратов.
BMDP
Программа P1R вычисляет парные и множественные линейные регрессии. Также можн вычислить соответствующие статистики и построить диаграммы остаточных членов. P2R -программа для вычисления ступенчатой регрессии с помощью разных подходов. Можн предопределить порядок ввода или вывода переменных, определить ввод или вывод пере менных по частям, исходя из значения критерия. P9R выполняет все возможные подмноже ства регрессии. Эта программа идентифицирует "наилучшие" подмножества предикторов, е можно использовать для множественной регрессии без выбора подмножеств. Программ P4R вычисляет регрессионный анализ по набору главных компонентов, полученных из не зависимых переменных.
Minitab
Регрессионный анализ с помощью функции Stats>Regression может выполнять простой полиномиальный и множественный анализ. Результат включает линейное уравнение per рессии, таблицу коэффициентов R2, скорректированный R2, таблицу AN OVA, таблицу соот ветствий и остатков, которые дали необычные наблюдения. Другие доступные характери стики включают: ступенчатую регрессию, наилучшие подмножества, график подогнанно линии регрессии и диаграммы остатков.
Excel
Регрессию можно вычислить с помощью меню Tools>Data analysis. В зависимости от вы бранных характеристик можно получить таблицу выходных данных, включая таблиц ANOVA, стандартной ошибки у, коэффициенты регрессии, стандартную ошибку коэффи циентов, значения R2 и количество наблюдений. Также с помощью данной функции вы числяют таблицу выходных данных остаточных членов, строят график остатков, аппрокси мированную прямую линейной зависимости, график нормального распределения вероятно сти и таблицу выходных данных, состоящую из двух колонок значений вероятностей.
Как описано во "Вставке 17.Г*, компьютерные программы содержат несколько програг для выполнения регрессионного анализа, вычисления соответствующих статистик, выпс нения проверок значимости и построения графиков остаточных членов. В SPSS главная щ грамма— REGRESSION. В SAS наиболее часто используемая программа— REG. Так доступны и другие специализированные программы, такие как RSREG, ORTHOREG, GL
РЕЗЮМЕ
Парный коэффициент корреляции г является мерой линейной связи между двумя метрическими (измеренными интервальной или относительной шкалой) переменными. Его квадрат г2 измеряет долю вариации одной из переменных, обусловленную вариацией другой. Частный коэффициент корреляции — мера зависимости между двумя переменными после исключения эффекта от влияния одной или нескольких дополнительных переменных. Порядок частной корреляции указывает на количество переменных, на которые необходимо внести поправку или которые следует исключить. Коэффициенты частной корреляции могут оказаться полезными для выявления ложных связей.
С помощью парной регрессии устанавливается математическая зависимость (в виде уравнения) между метрической зависимой (критериальной) переменной и метрической независимой переменной (предиктором). Уравнение описывает прямую линиию, и для его вывода используют метод наименьших квадратов. В случае построения регрессии с нормированными данными отрезок, отсекаемый на оси OY, принимает значение, равное 0, и коэффициенты регрессии называют взвешенными "бета"-коэффициентами. Силу тесноты связи измеряют коэффициентом детерминации г2, который получают, вычисляя отношение SS^^ к SSy. Стандартную ошибку уравнения регрессии используют для оценки точности предсказания, и ее можно интерпретировать как род средней ошибки, сделанной при теоретическом предсказании У, исходя из уравнения регрессии.
Множественная регрессия включает одну зависимую и две (или больше) независимых переменных. Частный коэффициент регрессии bj представляет ожидаемое изменение У, когда Х1 меняется на одну единицу, а переменные от Х2 до Xk остаются постоянными. Силу тесноты связи измеряют коэффициентом множественной детерминации R2. Значимость общего уравнения регрессии проверяется общим /^"-критерием. Отдельные частные коэффициенты регрессии можно проверить на значимость, используя /"-критерий приращений. Диаграммы рассеяния остаточных членов, когда их значения представлены графически в зависимости от предсказанных теоретических значений Yi , времени или предикторов, полезны для проверки
соответствия основным допущениям и подобранной регрессионной модели.
При пошаговой регрессии предикторы вводят или выводят из уравнения регрессии один за другим с целью выбора меньшего их числа, которые объясняют большую часть вариации критериальной переменной. Мультиколлинеарность или очень высокая взаимная корреляция между предикторами может вызвать некоторые проблемы. Из-за того, что предикторы взаимосвязаны (коррелируют), регрессионный анализ не обеспечивает однозначного свидетельства об относительной важности предикторов. Перекрестная проверка может установить, верна ли регрессионная модель для сопоставимых данных, не использованных при ее вычислении. Она является полезным методом при оценке регрессионной модели.
Можно использовать категориальные переменные как предикторы путем их кодирования как фиктивных переменных. Множественная регрессия с фиктивными переменными предоставляет общий метод для выполнения дисперсионного и ковариационного анализа.