Метод регрессионного анализа
4.5.1. Регрессионный анализ – статистический метод исследования влияния одной или нескольких независимых переменных на зависимую переменную (применительно к оценочной деятельности – влияния ценообразующих параметров на стоимость).
где: | С – | стоимость объекта оценки, ден. ед.; |
ЦОПi – | i-ый ценообразующий параметр, единица измерения может быть различной (кв.м, км, наличие / отсутствие конкретного вида инженерных коммуникаций). |
4.5.2. Основные понятия теории вероятностей и математической статистики [9]:
Таблица 14.
№ п/п | Понятие | Определение и комментарий | ||||||||||||
Математическое ожидание | Сумма произведений всех значений дискретной̆ случайной величины на соответствующие им вероятности:
В оценочной практике, как правило, случайные величины являются равновероятными:
| |||||||||||||
Дисперсия | Математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:
В оценочной практике, как правило, случайные величины являются равновероятными: | |||||||||||||
Среднеквадратическое отклонение | Квадратный корень из дисперсии
| |||||||||||||
Корреляция | Статистическая взаимосвязь двух или более случайных величин. При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. | |||||||||||||
Коэффициент корреляции | Безразмерная величина, характеризующая тесноту линейной зависимости между случайными величинами:
| |||||||||||||
Репрезентативность | Соответствие характеристик выборки характеристикам генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана. | |||||||||||||
Мультиколлинеарность | Высокая взаимная коррелированность объясняющих переменных. Использование в регрессионной модели мультиколлинеарных переменных приводит к ошибочной статистической незначимости коэффициентов модели и неустойчивости модели в целом (сильной зависимости от набора исходных данных). | |||||||||||||
Минимальное количество аналогов | В общем виде, количество аналогов в модели должно быть на единицу больше, чем количество независимых переменных (n+1). В зависимости от количества существенных ценообразующих параметров и однородности исходной выборки выдвигаются различные требования к достаточности исходных данных – [10], [11]. |
4.5.3. Этапы построения регрессионной модели:
· сбор рыночной информации;
· проверка исходных данных на наличие грубых ошибок;
· проверка исходных данных на соответствие принципу достаточности;
· внесение поправок (корректировок);
· выбор ценообразующих параметров (например, с помощью анализа матрицы корреляций);
· выбор вида зависимости (линейная, степенная, экспоненциальная и пр.);
· калибровка модели (непосредственно определение коэффициентов уравнения модели);
· проверка качества модели;
· проверка модели на устойчивость;
· вывод о целесообразности применения полученной модели.
4.5.4. В практической деятельности следует обратить внимание на показатели качества регрессионной модели:
Таблица 14.
№ п/п | Понятие | Определение и комментарий | |||||||||
Коэффициент детерминации | Определяет долю разброса исходных данных, объясняемых построенной моделью:
Приемлемым уровнем значений коэффициента детерминации принято считать . | ||||||||||
Средняя ошибка аппроксимации | Определяет относительное отклонение модельных данных от рыночных:
Приемлемым уровнем значений принято считать . | ||||||||||
Среднеквадратичная ошибка регрессии | Характеризует разброс/рассеивание модельных данных относительно рыночных:
| ||||||||||
Критерий Фишера (т.н. F-критерий) | Заключается в проверке базовой гипотезы о статистической незначимости построенной модели. На практике эта проверка сводится к сравнению выборочной статистики (основанной на значении коэффициента детерминации) с критическим значением статистики на определенном уровне значимости:
Модель принято считать статистически значимой, если значение выборочной статистики превышает критический порог на уровне значимости . | ||||||||||
Критерий Стьюдента | Заключается в проверке базовой гипотезы о статистической незначимости коэффициента при ценообразующем факторе (критерий проверяется для всех коэффициентов модели). Если выполняется неравенство: , ,
то базовая гипотеза отвергается и коэффициент (а, следовательно, и сам фактор) признается статистически значимым (то есть существенным). |