Раздел 3. Математическая обработка исходной информации
Факторный анализ. Расчет уравнения множественной регрессии
Основой факторного анализа является системный подход к анализируемым процессам. Сущность этого метода состоит в установлении связей между результативными и факториальными показателями, степени влияния факторов на результативный признак с целью ранжирования факторов. Основными параметрами факторного анализа являются: объем выборки; коэффициент вариации; коэффициент парной и множественной корреляции; коэффициент множественной детерминации; коэффициент ассиметрии.
Математически корреляционная зависимость результативной переменной от нескольких факторных (объясняющих) переменных описывается уравнением множественной регрессии.
Уравнение множественной регрессии характеризует среднее изменение с применением признаков – факторов.
При построении уравнения множественной регрессии нужно решить две задачи:
1) выбрать признаки факторы, включенные в регрессию;
2) выбрать тип уравнения регрессии.
Решение первой задачи основывается на рассмотрении ттесноты и направления парной линейной корреляционной зависимости переменных X и Y, определяющихся коэффициентом корреляции (линейная статистическая зависимость между двумя величинами). Он принимает значения от -1 до +1. При |r| >= 0,75 связь тесная, фактор, оказывающий влияние на результирующий показатель и является достоверным. При |r| <= 0,25 связь практически отсутствует, и рассматриваемый фактор следует исключить.
Решение второй задачи основывается на соотношении простоты и интерпретируемости результатов многофакторного регрессионного анализа: чем проще тип уравнения множественной регрессии, тем очевиднее интерпретация его параметров, тем лучше для использования регрессии с целью анализа и прогноза.
Студенту выдаются исходные данные, в которых приведены значения результирующего фактора (урожайность естественных сенокосов) и факторов, влияющих на него (балл бонитета почв, количество внесенных удобрений и др.). Связь между результирующим и влияющими факторами отражается уравнением множественной линейной регрессии:
Y=Aо + A1X1 +A2X2 + … + AnXn, (37)
где Ао — свободный член уравнения, экономической интерпретации не имеет; А1, А2, …Аn — коэффициенты уравнения, показывающие на сколько изменится результирующий фактор при изменении влияющего на единицу; Х1, Х2, …Хn — значения влияющих факторов.
Работа производится с использованием пакетов программных средств: «Regma» и «Coreg».
Пакет программных средств «Regma» позволяет отбраковать факторы, не влияющие или мало влияющие на результирующий фактор.
Первоначально при расчете используются все факторы, которые могут влиять на результирующий. Для этого составляется числовая матрица из значений всех факторов, которая обрабатывается при помощи данного пакета. В полученных результатах отражается теснота связи между результирующим фактором и факторами, влияющими на него (I матрица результатов), а также связь между самими влияющими факторами (II матрица результатов).
В I матрице отбраковываются факторы, не влияющие или мало влияющие на результирующий (|r| <= 0,25), а во II матрице исключается мультикоррелярность, означающая, что факторы являются результатом друг друга (|r| >= 0,75). Для исключения одного из двух влияющих факторов необходимо определить, какой из них имеет меньшую тесноту связи с результирующим (рассматривается при этом матрица I).
После исключения малозначащих и мультикоррелярных факторов, снова производится обработка исходной числовой матрицы. По ее результатам определяется фактор, имеющий наибольшее влияние на результирующий (величина коэффициента корреляции близка к 1).
Пакет программных средств «Coreg» позволяет наглядно отразить связь между результирующим фактором и фактором в наибольшей степени на него влияющим.
Анализ статистической нечисловой информации
Ранговая корреляция
Порядковая переменная позволяет упорядочивать статистически исследуемые объекты по степени появления в низ анализируемого свойства. К порядковым переменным обращаются в ситуациях, когда количественно измерить степень проявления этого свойства невозможно или когда измерения рассматриваются как вспомогательное средство для последующего ранжирования рассматриваемых объектов.
Ранговый коэффициент корреляции характеризует степень статистической связи между порядковыми переменными.
Ранжировка – это расположение объектов в порядке убывания степени проявления в них k – изучаемого свойства. В этом случае называют рангом i– го объекта по k– му признаку. Он характеризует порядковое место (ранг), которое занимает объект в ряду nобъектов.
Два эксперта - оценщика проранжировали с точки зрения эффективности 10 конкурсных проектов размещения объектов недвижимости.
Ранжировка 1 эксперта-оценщика: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10.
Ранжировка 2 эксперта-оценщика: 2; 3; 1; 4; 6; 5; 9; 7; 8; 10.
Вычисления проводим по формуле К. Спирмена:
где - ранговый коэффициент корреляции степени тесноты между рангами; s– сумма отклонений рангов; - значение ранжировок.
.
Полученный результат свидетельствует о положительной степени статистической ранговой связи между переменными, т.е. определена тесная связь между результатами субъективных оценок (статистических гипотез) экспертов – оценщиков по 10 конкурсным проектам.
Индексный метод
Индексный метод применяется при изучении сложных явлений, отдельные элементы которых несоизмеримы. Как относительные показатели индексы необходимы для оценки выполнения плановых показателей (например, поступления земельных платежей в бюджеты всех уровней); для определения динамики затрат и доходов от деятельности земельной службы в субъектах РФ, которые всегда имеют отличия в экономических и иных условиях (например, различия в условиях финансирования, в правовом обеспечении земельного кадастра).
Индексы могут рассчитываться по следующей формуле:
I = Пр/Пбаз, (39)
где: I – индекс анализируемого объекта; Пр – показатель анализируемого объекта; Пбаз – показатель, являющийся базой сравнения.
Индексный метод позволяет провести разложение по факторам относительных и абсолютных отклонений обобщающего показателя. В последнем случае число факторов должно быть равно двум, а анализируемый показатель представлен как их произведение.
Индексный метод может использоваться в сочетании с методом ранжирования. В табл.3.1 приведен пример использования совместного использования двух методов для оценки вариантов капиталовложений в земельно-кадастровое производство.
Таблица 3.1