Парный, частный и множественный коэффициент корреляции
Выполним корреляционный анализ множественной модели. Для этого рассчитаем матрицу выборочных парных коэффициентов корреляции, используя формулу (12). Для модели, в которой используются две факторные переменные, матрица выборочных коэффициентов имеет вид:
. (34)
Во множественных моделях необходимо проверить модель на мультиколлинеарность. Под мультиколлинеарностью понимается высокая взаимная коррелированность объясняющих переменных. Один из подходов выявления мультиколлинеарности является анализ матрицы парных коэффициентов корреляции и выявление пар факторов, имеющих высокие коэффициенты корреляции.
Показатели парной корреляции – ryx характеризуют тесноту связи результата и фактора, не принимая во внимание возможного влияния на результат других факторных признаков. Поэтому во множественном регрессионном анализе возникает проблема определения тесноты связи между двумя признаками в чистом виде, т.е. при устранении воздействия других факторов. Нам под силу исключить влияние только учтенных в модели факторов.
Показателем «чистого» влияния фактора на результат при устранении влияния прочих факторов, включенных в модель регрессии, является частный коэффициент корреляции или частный индекс корреляции (в зависимости от формы связи).
Частные коэффициенты корреляции для двухфакторной модели рассчитываются по формуле.
; (35)
. (36)
Коэффициент множественной корреляции вычисляют по формуле:
(37)
Оценку адекватности множественной модели производим по формулам (18), (21).
Моделирование одномерных временных рядов
Основные понятия и определения
В современной экономике и в бизнесе без прогноза не обойтись. Любое серьезное решение, в особенности связанное с вложением денег, требует прогноза, предвидения развития экономической ситуации.
Имеется два подхода к прогнозированию. Первый – использование методов качественного прогнозирования. Эти методы применимы в тех ситуациях, когда данные за прошедшие периоды времени недоступны и/или ненадежны, например, при прогнозировании объема продаж совершенно нового товара, не существовавшего ранее на рынке. Второй подход – использование количественных методов. В этом случае данные за прошедшие периоды времени доступны для исследователя.
Информационной базой для анализа экономических процессов являются динамические и временные ряды. Совокупность наблюдений некоторого явления (показателя), упорядоченная в зависимости от последовательности значений другого явления (признака), называют динамическим рядом. Динамические ряды, у которых в качестве признака упорядочения используется время, называют временными.
В экономике и бизнесе временные ряды – это очень распространенный тип данных. Во временном ряде содержится информация об особенностях и закономерностях протекания процесса, а статистический анализ позволяет выявить закономерности и использовать их для оценки характеристик процесса в будущем, т.е. для прогнозирования.
Временной ряд – это набор чисел, привязанный к последовательным, обычно равноотстоящим моментам времени. Числа, составляющие временной ряд и получающиеся в результате наблюдения за ходом некоторого процесса, называются уровнями временного ряда, или элементами. Интервал между двумя последовательными моментами времени называют тактом (шагом, квантом). Под длиной временного ряда понимают количество входящих в него уровней n. Временной ряд обычно обозначают Y(t), или yt, где t = 1, 2, … n.
Формально задача прогнозирования сводится к получению оценок значений ряда для некоторого периода будущего, т.е. к получению значения Yпрогноз(t), где t = n + 1, n + 2, … При использовании методов экстраполяции исходят из предположения о сохранении закономерностей прошлого развития на период прогнозирования. Во многих случаях (но не всегда!) при разработке оперативного (до года) и краткосрочного (до 2 лет) прогноза эти предположения являются справедливыми.
Статистические методы исследования исходят из предположения возможности представлять уровни временного ряда в виде суммы нескольких компонент, отражающих закономерность и случайность развития, в частности, в виде суммы четырех компонент:
Y(t) = f(t) + S(t) + U(t) + E(t), (38)
где f(t) – тренд (долговременная тенденция) развития;
S(t) – сезонная компонента;
U(t) – циклическая компонента;
E(t) – остаточная компонента.
В модели временного ряда принято выделять две основные составляющие: детерминированную (систематическую) и случайную. Под детерминированной составляющей временного ряда у1, у2, …, yn понимают числовую последовательность, элементы которой вычисляются по определенному правилу как функция времени t. Исключив детерминированную составляющую из данных, мы получим колеблющийся вокруг нуля ряд, который может в одном предельном случае представлять случайные скачки, а в другом – плавное колебательное движение.
Детерминированная составляющая может содержать следующие структурные компоненты.
1. Тренд, или тенденция f(t), представляет собой устойчивую закономерность, наблюдаемую в течение длительного периода времени. В качестве примера таких факторов в экономике можно назвать:
а) изменение демографических характеристик популяции (численности, возрастной структуры);
б) технологическое и экономическое развитие;
в) рост потребления.
Обычно тренд (тенденция) описывается с помощью той или иной неслучайной функции Fтр(t) (аргументом которой является время), как правило, монотонной. Эту функцию называют функцией тренда, или просто – трендом.
2. Сезонная компонента S(t) связана с наличием факторов, действующих с заранее известной периодичностью. Это регулярные колебания, которые носят периодический или близкий к нему характер и заканчиваются в течение года. Типичные примеры сезонного эффекта: изменение загруженности автотрассы в течение суток, по дням недели, временам года, пик продаж товаров для школьников в конце августа – начале сентября. Сезонная компонента со временем может меняться либо иметь плавающий характер.
3. Циклическая компонента U(t) – неслучайная функция, описывающая длительные периоды (более одного года) относительного подъема и спада и состоящая из циклов переменной длительности и амплитуды. Примером циклической (конъюнктурной) компоненты являются волны Кондратьева, демографические «ямы» и т.п. Подобная компонента весьма характерна для рядов макроэкономических показателей. Здесь циклические изменения обусловлены взаимодействием спроса и предложения, а также наложением таких факторов, как истощение ресурсов, погодные условия, изменения в налоговой политике и т.п. Отметим, что циклическую компоненту крайне трудно идентифицировать формальными методами, исходя • только из данных изучаемого ряда,
4. Случайная составляющая E(t) ряда отражает воздействие многочисленных факторов случайного характера и может иметь разнообразную структуру, начиная от простейшей в виде «белого шума» до весьма сложных, описываемых моделями авторегрессии и скользящего среднего.
Основная цель статистического анализа временных рядов - изучение соотношения между закономерностью и случайностью в формировании значений уровней ряда, оценка количественной меры их влияния. Закономерности, объясняющие динамику показателя в прошлом, используются для прогнозирования его значений в будущем, а учет случайности позволяет определить вероятность отклонения от закономерного развития и его возможную величину.