Оценка статистической значимости уравнения регрессии его параметров.

В социально-экономических исследованиях часто приходится работать в условиях ограниченной совокупности, либо с выборочными данными. Поэтому после математических параметров уравнение регрессии необходимо оценить их и уравнение в целом на статистическую значимость, т.е. необходимо убедиться, что полученное уравнение и его параметры сформированы под влиянием неслучайных факторов.

Прежде всего, оценивается статистическая значимость уравнения в целом. Оценка, как правило, проводится с использованием F-критерия Фишера. Расчет F-критерия базируется на правиле сложения дисперсий. А именно, общего дисперсионного признака-результата = дисперсия факторная + дисперсия остаточная.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru
Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru
Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - фактическая цена

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - теоретическая цена
Построив уравнение регрессии можно рассчитать теоретическое значение признака-результата, т.е. рассчитанные по уравнению регрессии с учетом его параметров.

Эти значения будут характеризовать признак-результат, сформировавшийся под влиянием факторов включенных в анализ.

Между фактическими значениями признака-результата и рассчитанными на основе уравнения регрессии всегда существуют расхождения (остатки), обусловленные влиянием прочих факторов, не включенных в анализ.

Разность между теоретическими и фактическими значениями признака-результата называется остатками. Общая вариация признака-результата:

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Вариация по признаку-результату, обусловленная вариацией признаков факторов, включенных в анализ оценивается через сопоставления теоретических значений резул. признака и его средних значений. Остаточная вариация через сопоставление теоретических и фактических значений результатирующего признака. Общая дисперсия Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , остаточная и фактическая имеют разное число степеней свободы.

Общая Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , п- число единиц в изучаемой совокупности

Фактическая Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , п- число факторов, включенных в анализ

Остаточная Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

F-критерий Фишера рассчитывается как отношение Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru к Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , причем Оценка статистической значимости уравнения регрессии его параметров. - student2.ru рассчитаны на одну степень свободы.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Использование F-критерия Фишера в качестве оценки статистической значимости уравнения регрессии очень логично. Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - это Оценка статистической значимости уравнения регрессии его параметров. - student2.ru результат. признака, обусловленная факторами включенными в анализ, т.е. это доля объясненной Оценка статистической значимости уравнения регрессии его параметров. - student2.ru результат. признака. Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - это Оценка статистической значимости уравнения регрессии его параметров. - student2.ru (вариация) признака результата обусловленная факторами влияние которых не учитывается, т.е. не включенными в анализ.

Т.о. F-критерий призван оценить значимое превышение Оценка статистической значимости уравнения регрессии его параметров. - student2.ru над Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Если Оценка статистической значимости уравнения регрессии его параметров. - student2.ru несущественно ниже Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , а тем более, если оно превышает Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , следовательно, в анализ включены не те факторы, которые действительно влияют на признак-результат.

F-критерий Фишера табулирован, фактическое значение сравнивается с табличным. Если Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , то уравнение регрессии признается статистически значимым. Если наоборот – уравнение статистически не значимо и не может использоваться на практике, значимость уравнения в целом говорит о статистической значимости показателей корелляции.

После оценки уравнения в целом необходимо оценить статистическую значимость параметров уравнения. Эта оценка осуществляется с использованием t-статистики Стьюдента. t-статистика рассчитывается как отношение параметров уравнения (по модулю) к их стандартной средней квадратической ошибке. Если оценивается однофакторная модель, то рассчитывается 2 статистики.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Во всех компьютерных программах расчет стандартной ошибки и t-статистики для параметров проводится с расчетом самих параметров. T-статистика табулирована. Если значение Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , то параметр признается статистически значимым, т.е. сформированным под влиянием неслучайных факторов.

Расчет t-статистики по существу означает проверку нулевой гипотезы о незначимости параметра, т.е. равенстве его нулю. При однофакторной модели оценивается 2 гипотезы: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru и Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Уровень значимости принятия нулевой гипотезы зависит от уровня принятой доверительной вероятности. Так если исследователь задает уровень вероятности 95%, уровень значимости принятия Оценка статистической значимости уравнения регрессии его параметров. - student2.ru будет рассчитываться Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , следовательно, если уровень значимости ≥ 0,05, то Оценка статистической значимости уравнения регрессии его параметров. - student2.ru принимается и параметры считаются статистически незначимыми. Если Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , то Оценка статистической значимости уравнения регрессии его параметров. - student2.ru отвергается и принимается альтернатива: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru и Оценка статистической значимости уравнения регрессии его параметров. - student2.ru .

В пакетах прикладных программ по статистике также приводится уровень значимости принятия нулевых гипотез. Оценка значимости уравнения регрессии и его параметров может дать следующие результаты:

Во-первых, уравнение в целом значимо(по F-критерию) и также статистически значимы все параметры уравнения. Это означает, что полученное уравнение может быть использовано как для принятия управленческих решений, так и для прогнозирования.

Во-вторых, по F-критерию уравнение статистически значимо, но не значим хотя бы один из параметров уравнения. Уравнение может быть использовано для принятия управленческих решений относительно анализируемых факторов, но не может быть использовано для прогнозирования.

В-третьих, уравнение статистически не значимо, либо по F- критерию уравнение значимо, но не значимы все параметры полученного уравнения. Уравнение не может быть использовано не для каких целей.

Чтобы уравнение регрессии можно было признать моделью связи между признаком-результатом и признаками-факторами необходимо чтобы в него были включены все важнейшие факторы, определяющие результат, чтобы содержательная интерпретация параметров уравнения соответствовала теоретически обоснованным связям в изучаемом явлении. Коэффициент детерминации R2 должен быть > 0,5.

При построении множественного уравнения регрессии целесообразно осуществить оценку по так называемому скорректированному коэффициенту детерминации (R2). Величина R2 (как и корелляции) возрастает при увеличение числа факторов включенных в анализ. Особенно завышается значение коэф-в в условиях небольших совокупностей. С целью погасить отрицательное влияние R2 и корелляции корректируют с учетом числа степеней свободы, т.е. числа свободно варьирующих элементов при включении определенных факторов.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - скорректированный коэф-т детерминации

п –объем совокупности/число наблюдений

k – число факторов включенных в анализ

п-1 – число степеней свободы

(1-R2) - величина остатка/ необъясненной дисперсии результативного признака

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru всегда меньше R2 . на основе Оценка статистической значимости уравнения регрессии его параметров. - student2.ru можно сравнивать оценки уравнений с разным числом анализируемых факторов.

34. Задачи изучения динамических рядов.

Ряды динамики называют временными рядами или динамическими рядами. Динамический ряд – это упорядоченная во времени последовательность показателей, характеризующих то или иное явление (объем ВВП с 90 по 98 гг). Целью изучения рядов динамики является выявление закономерности развития изучаемого явления (основной тенденции) и прогнозирование на этой основе. Из определения РД следует, что любой ряд состоит из двух элементов: время t и уровень ряда (те конкретные значения показателя, на основе которого построен ДРяд). ДРяды могут быть 1)моментными – ряды, показатели которых фиксируются на момент времени, на определенную дату, 2)интервальными – ряды, показатели которого получают за какой-то период времени (1.численность населения СПб, 2.объем ВВП за период). Разделение рядов на моментные и интервальные необходимо, поскольку это определяет специфику расчета некоторых показателей ДРядов. Суммирование уровней интервальных рядов дает содержательно интерпретируемый результат, что нельзя сказать о суммировании уровней моментных рядов, поскольку последние содержат повторный счет. Важнейшей проблемой в анализе рядов динамики является проблема сопоставимости уровней ряда. Это понятие очень разноплановое. Уровни должны быть сопоставимы по методам расчета и по территории и охвату единиц совокупности. Если ДРяд строится в стоимостных показателях, то все уровни должны быть представлены или рассчитаны в сопоставимых ценах. При построении интервальных рядов уровни должны характеризовать одинаковые отрезки времени. При построении моментных РядовД уровни должны фиксироваться на одну и ту же дату. ДРяды могут быть полными и неполными. Неполные ряды используются в официальных изданиях (1980,1985,1990,1995,1996,1997,1998,1999…). Комплексный анализ РД включает изучение следующих моментов:

1. расчет показателей изменения уровней РД

2. расчет средних показателей РД

3. выявление основной тенденции ряда, построение трендовых моделей

4. оценка автокорреляции в РД, построение авторегрессионных моделей

5. корреляция РД (изучение связей м/у ДРядами)

6. прогнозирование РД.

35. Показателей изменения уровней временных рядов.

В общем виде РядД может быть представлен: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

у – уровень ДР, t – момент или период времени к которому относится уровень (показатель), n – длина ДРяда (число периодов). при изучении ряда динамики рассчитывают следующие показатели: 1. абсолютный прирост, 2. коэффициент роста (темп роста), 3. ускорение, 4. коэффициент прироста (темп прироста), 5. абсолютное значение 1 % прироста. Рассчитываемые показатели могут быть: 1. цепные – получают путем сопоставления каждого уровня ряда с непосредственно предшествующим, 2. базисные – получают путем сопоставления с уровнем, выбранным за базу сравнения (если специально не оговаривается, за базу берется 1ый уровень ряда). 1. Цепные абсолютные приросты: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Показывает на сколько Оценка статистической значимости уравнения регрессии его параметров. - student2.ru больше или меньше Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Цепные абсолютные приросты называют показателями скорости изменения уровней динамического ряда. Базисный абсолютный прирост: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Если уровни ряда представляют собой относительные показатели, выраженные в %-ах, то абсолютный прирост выражается в пунктах изменения. 2. коэффициент роста (темпы роста): Рассчитывается как отношение уровней ряда к непосредственно предшествующим (цепные коэффициенты роста), либо к уровню, принятому за базу сравнения (базисные коэффициенты роста): Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Характеризует во сколько раз каждый уровень ряда > или < предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru 3. на основе абсолютных приростов рассчитывают показатель – ускорение абсолютных приростов: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Ускорение – абсолютный прирост абсолютных приростов. Оценивает как изменяются сами приросты, они стабильны или принимают ускорение (возрастают). 4. темп прироста – это отношение прироста к базе сравнения. Выражается в %-ах: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru ; Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Темп прироста – это темп роста минус 100%. Показывает на сколько % данный уровень ряда > или < предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Расчет средних показателей РД Рассчитывают средние уровни рядов, средние абсолютные приросты, средние темпы роста и средние темпы прироста. Средние показатели рассчитываются с целью обобщения информации и возможности сравнивать уровни и показатели их изменения по различным рядам. 1. средний уровень ряда а) для интервальных временных рядов рассчитывается по средней арифметической простой: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , где n – число уровней во временном ряду; б) для моментных рядов средний уровень рассчитывается по специфической формуле, которая называется средней хронологической: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . 2. средний абсолютный прирост рассчитывается на основе цепных абсолютных приростов по средней арифметической простой:

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . 3. Средний коэффициент роста рассчитывается на основе цепных коэффициентов роста по формуле средней геометрической: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . При комментарии средних показателей ДРядов необходимо указывать 2 момента: период, который характеризует анализируемый показатель и временной интервал, за который построен ДРяд. 4. Средний темп роста: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . 5. средний темп прироста: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru .

Компоненты временного ряда.

Это понятие не путать с элементами ДРяда. Уровни временных рядов формируются под влиянием множества факторов. Одни (основные) из них действуют на протяжении длительного периода времени и определяют основную тенденцию изучаемого ряда. Совокупность этих факторов составляет так называемую трендовую компоненту. Часть факторов оказывает влияние на изменение уровней с определенной периодичностью. Совокупность этих факторов составляет циклическую компоненту. На динамику многих экономических процессов оказывают влияние также факторы, действующие сезонно. Они могут быть изучены на основе ДРядов, построенных по внутрегодичным данным, т.е. данным, взятым по кварталам/месяцам. Совокупность этих факторов представляет собой сезонную компоненту. Наряду с перечисленными факторами, уровни ряда изменяются под влиянием случайных факторов, действующих без определенной закономерности, поэтому их влияние невозможно измерить. Это случайная компонента. Таким образом, уровень ряда можно представить как функцию 4-х компонент: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru .Основной задачей в изучении динамических рядов является выявление и оценка тренда, т.е. основной тенденции изменения уровней изучаемого динамического ряда. Частой практической задачей является изучение сезонной компоненты. А также комплексное прогнозирование на основе тренда и сезонных колебаний. Чем больше влияние не трендовых компонент на формирование уровней динамического ряда, тем сложнее выделить основную тенденцию изучаемого ряда. Чтобы абстрагироваться от влияния не трендовых компонент, применяют выравнивание (сглаживание) временных рядов. Выравнивание может быть: механическим и аналитическим. Суть выравнивания заключается в замене фактических значений уровней выровненными, т.е. очищенными от случайных колебаний.

Сглаживание рядов динамики.

Механическое выравниваниепроводится в основном путем укрупнения временных интервалов или с использованием скользящей средней: по исходному ряду включая, например, 3 первых уровня рассчитывается средняя величина, и полученная величина относится к середине интервала. Далее рассчитывается среднее значение по трем уровням, но начиная со второго. Полученное средне значение относится к середине интервала, но к 3-му уровню. Если для определения скользящей средней используется четно число уровней (например 4), то получаемая средняя величина попадает в интервал м/у 2-ым и 3-им уровнем. Следующее среднее значение попадает в интервал м/у 3-им и 4-ым уровнями. В этих условиях необходимо применить так называемое центрирование – когда выровненный уровень будет рассчитываться как средняя арифметическая м/у 2-мя скользящими средними: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Чем > период скольжения, тем более отчетливо выявляется основная тенденция. Однако, с увеличением периода скольжения более существенно сокращается анализируемый ДРяд, что отрицательно сказывается на построении моделей. Аналитическое выравнивание в отличие от механического, позволяет не только более отчетливо увидеть основную тенденцию развития изучаемого явления, но и получить аналитическую форму изучаемого временного ряда, точнее его основной тенденции.

Эта аналитическая форма получила название трендовой модели. Трендовая модель представляет собой уравнение регрессии, в котором в качестве признака результата выступает уровень изучаемого ряда, а в качестве фактора – время. Уравнение тренда: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , где , где y –уровень ряда, t-время. Т.е. уровень ряда есть функция времени. Однако следует понимать, что изменение уровней временного ряда (конкретных экономических показателей) происходит не потому что год сменяется годом, а потому что меняется проявление конкретных внутренних и внешних факторов. Время в трендовой модели выступает совокупным фактором, за изменением которого следует видеть изменение конкретных экономических и других факторов. Построение трендовой модели предполагает выбор формы модели и расчет параметров уравнения. Ошибка в выборе формы тренда более существенно сказывается на прогнозе, чем ошибка в расчете параметров. Прежде чем приступить к определению формы трендовой модели, т.е. модели, описывающей основную тенденцию изучаемого явления, следует убедиться в наличии самого тренда, т.е. тенденции развития. Ряд, в котором отсутствует тенденция называется стационарным. Уровни таких рядов колеблются вокруг средних значений, отклонения от которых есть случайные колебания. Стационарные ряды чаще всего можно видеть в рядах, построенных по относительным и средним показателям. Для того, чтобы определить наличие тенденции в изучаемом ДРяду, ряд разбивают на 2 ~ равных периода и рассчитывают значение среднего уровня по каждому из них. Затем с использованием t-статистики проверяется о несущественности различий м/у полученными средними: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . T-статистика рассчитывается: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru ,где сигма – среднее квадратическое отклонение разности средних (стандартная ошибка). Стандартная ошибка рассчитывается исходя из дисперсий по каждому временному отрезку и рассчитывается как средняя арифметическая взвешенная: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru . Поскольку временные ряды не очень длинные, то стандартная ошибка считается по правилу малой выборки, т.е. учитывается не только n, а (n-1). Полученное значение t статистики сравнивается с табличным значением, и если tф≥tтабл, то нулевая гипотеза отвергается и принимается альтернативная о существенности различий в средних величинах, полученных по двум временным отрезкам. Что будет свидетельствовать о наличии тенденции в изучаемом временном ряду.

Понятие тренда.

В отличие от механического, позволяет не только более отчетливо увидеть основную тенденцию развития изучаемого явления, но и получить аналитическую форму изучаемого временного ряда, точнее его основной тенденции.

Эта аналитическая форма получила название трендовой модели. Трендовая модель представляет собой уравнение регрессии, в котором в качестве признака результата выступает уровень изучаемого ряда, а в качестве фактора – время. Уравнение тренда: Оценка статистической значимости уравнения регрессии его параметров. - student2.ru , где , где y –уровень ряда, t-время. Т.е. уровень ряда есть функция времени.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

1. Графический.

При отображении временного ряда на графике по оси абсцисс – время, по OY значение уровней.

2. Анализ показателей изменения уровней ДР.

Анализ показателей изменения уровней ДР с учетом свойств известных математических функций. Широко распространен метод конечных разностей. Например, если примерно построенными являются абсолютные приросты (первые разности), а вторые разности равны 0 (ускорение), то в качестве тренда может быть использовано линейное уравнение. Если приблизительно одинаковые вторые разности, а третьи равны 0, то можно использовать полином 2-ой степени, и т.д. Т.е. порядок приблизительно построенных разностей определяет степень полинома.

3. Формальный выбор тренда с использованием формальных критериев (формул).

Минимальное значение квадрата разности между фактическими и выровненными уровнями.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - выровненные уровни.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru - фактические уровни.

Минимальное значение стандартной ошибки или среднеквадратического отклонения.

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

n – длина ряда

m – число параметров уравнения тренда.

3.3. Минимальное значение средней ошибки аппроксимации

Оценка статистической значимости уравнения регрессии его параметров. - student2.ru

Наши рекомендации