Системы нормальных уравнений для разных форм связи
Форма и уравнения связи | Система нормальных уравнений | Макет вспомогательной таблицы для определения параметров уравнения | ||
линейная | ||||
гиперболическая | ||||
степенная или , где | ||||
параболическая | ||||
или , где , | ; |
По таблицам -распределения (приложение 1) определяется таб-личное значение критерия ( ) по заданному уровню статистической достоверности ( ) и числу степеней свободы (n - 2); и если > , то соответствующая характеристика является статистически существенной или достоверной, т.е. надежной характеристикой.
Для оценки достоверности уравнения связи используется критерий Фишера-Снедскора ( - критерий) и относительная ошибка аппроксимации ( ).
Расчетное значение - критерий определяется:
,
где - количество параметров в уравнении связи.
По таблицам - критерия (приложение 2) находим теоретическое значение критерия: , при заданном уровне статистической достоверности ( ) и числам степеней свободы:
Тогда, если F расч > Fтабл, то уравнение связи является статистически достоверным.
Дополнительно может рассчитываться относительная ошибка аппроксимации (εотн.):
Если εотн ≤ 15 %, то полученное уравнение связи считается статистически точным, т.е. достаточно хорошо отображает изучаемую зависимость.
Множественные корреляционные зависимости.Основными формами связи выступают линейные:
степенные:
гиперболические:
квадратические:
Параметры каждого из уравнений определяются по МНК. Для степенной зависимости вначале путем логарифмирования уравнения приводится к линейному виду: , а затем уже для него строится система нормальных уравнений.
Для гиперболической и квадратической зависимостей строится система нормальных уравнений аналогичная приведенной выше, но вместо берут или (для гиперболической), или же (для квадра-тической) зависимостей.
Параметры ) оценивают меру зависимости между факторными и результативным признаками в натурально-вещественной форме, т.е. несравнимы друг с другом. В частности аі показывает, на сколько единиц своего измерения изменится у, если хі увеличится на единицу своего измерения, при условии, что остальные факторы, включенные в уравнение, также влияют на изменения у, но не варьируют, т.е. зафиксированы на уровне своего среднего значения. Поэтому, обязательно рассчитываются стандартизированные коэффициенты регрессии или -коэффициенты, - для линейных зависимостей:
,
где - параметры натурального уравнения связи.
Стандартизованное уравнение регрессии будет иметь следующий вид: ,
где , - стандартные отклонения, соответственно, результативного и факторных признаков.
; .
Соотношения -коэффициентов дают возможность сопоставить силу влияния факторных признаков на результативный; они показывают, на сколько среднеквадратических отклонений изменится результативный фактор, если факторный признак увеличится на одно среднеквадратическое отклонение, при оговоренных выше условиях.
Если факторные признаки имеют примерно равную вариацию, то для этой же цели можно использовать и частные коэффициенты эластичности: , которые характеризуют, на сколько % в среднем изменится результативный признак, если i-тый фактор увеличится на 1%, - при условии, что остальные факторы, включенные в множественное уравнение, не варьируют, т.е. зафиксированы на уровне своего среднего значения.
Показателями тесноты связи для множественных зависимостей являются: множественный коэффициент корреляции (Rухi) и детерминации (Духi), частные коэффициенты корреляции ( /…) и детерминации ( /…): ,
где - параметры стандартизованного уравнения регрессии; -пар-ные коэффициенты корреляции с ; ; = .
Содержательная характеристика показателей аналогична, как и при парных зависимостях.
При небольшом числе наблюдений ( ) проводится корректировка , тогда скорректированный множественный коэффициент корреляции будет равен:
.
Частные коэффициенты корреляции ( /…) характеризуют меру тесноты связи между двумя признаками ( и ) при фиксированном значении других факторных признаков:
/…= ,
где - множественный коэффициент детерминации с учетом всех факторных признаков; - множественный коэффициент детерминации без учета i-того фактора.
Его величина изменяется от – 1 до +1, а знак определяется знаком при соответствующем параметре уравнения регрессии.
Частные коэффициенты детерминации рассчитываются по соотношению: =
Статистическую достоверность Ryxi можно проверить с помощью его среднеквадратической ошибки ( ), т.е. если > 3, то с вероятностью 0,99 можно считать множественный коэффициент корреляции значимым, при этом .
Проверка статистической достоверности уравнения множественной регрессии осуществляется на основе -критерия Фишера-Снедскора; при этом расчетное значение критерия определяется по формуле: .
Табличное значение ( ) находится по таблицам (приложение 2) аналогично рассматриваемому ранее, тогда, если > , то уравнение множественной регрессии является статистически значимым или достоверным.
Построение регрессионных моделей по рядам динамики.При построении регрессионных моделей по рядам динамики, т.е. когда и зависимая переменная и факторные признаки представлены в виде временных рядов, объектами наблюдения выступает время. Для выполнения требования независимости по объектам наблюдения необходимо исключить из рядов динамики автокорреляцию или тенденцию (если они присутствуют в рядах).
Для этой цели используются два методических подхода:
1. Включение фактора времени в уравнение связи. В уравнении регрессии включается фактор времени (t) как дополнительная зависимая переменная. В этом случае уравнение регрессии рассчитывается в следующем виде: .
Какая бы форма множественного уравнения не использовалась, время всегда вводится в линейной форме.
Методика определения параметров уравнения и оценка степени тесноты и достоверности связи аналогична общепринятой методике множественного корреляционно-регрессионного анализа.
2. Построение регрессии по отклонениям. В случае наличия автокорреляции в рядах динамики вначале она исключается методом последовательных разниц, т.е. рассчитываются:
;
где ; ; - число временных периодов, m - число факторных признаков.
Уравнение регрессии строится не по фактическим значениям признаков, а по последовательным разностям следующим образом:
.
Если же в рядах динамики существует достоверная тенденция, то уравнение связи строится по отклонениям фактических уровней от теоретических, полученных на основе аналитического выравнивания соответствующего ряда динамики. Общий вид уравнения связи аналогичен, но при этом отклонения рассматриваются как следующие разности: ; = ; = и т. д.
где , - теоретические значения соответствующих признаков, , .
Непараметрические методы анализа взаимосвязей.Непараметрические показатели тесноты связи включают: коэффициент Фехнера, коэффициент корреляции рангов, - парный и множественный. Они рассчитываются путем сравнения параллельных рядов, связанных между собой причинно-следственной зависимостью. Коэффициент Фехнера (КФ ): ,
где С, Н - количество совпадений и, соответственно, несовпадений знаков отклонений индивидуальных значений факторного признака х и результативного у от их среднего значения, – если отклонение равно 0, то это принимается как совпадение знаков.
Коэффициент меняется в пределах от - 1 до + 1 и является приблизительной мерой оценки связи, применяется при незначительном числе наблюдений.
Коэффициент ранговой корреляции Спирмена ( ) может использоваться для оценки связи как между количественными, так и между качественными (атрибутивными признаками), если их можно проранжировать.
Последовательность определения парного коэффициента ранговой корреляции следующая:
1) ранжируются факторный (х) и результативный признаки и определяются их ранги, т.е. и . Ранг - это порядковый номер значений признака, расположенного в порядке возрастания или убывания. Если значения признака имеют одинаковую величину, то им присваивают одинаковый ранг, равный средней арифметической от соответствующих номеров мест, которые они занимают. Такие ранги называются связными;
2) определяются разности между рангами факторного и результативного признаков: ;
3) рассчитывается коэффициент ранговой корреляции Спирмена ( ): ;
4) оценивается статистическая достоверность коэффициента с помощью t–критерия, аналогично для парного коэффициента корреляции.
Для определения тесноты связи между произвольным числом ранжированных признаков рассчитывается множественный коэффициент ранговой корреляции или коэффициент конкордации (W) по следующей формуле:
для несвязных рангов: ,
где m - число факторов; S - отклонение суммы квадратов рангов от средней квадратов рангов; n - число наблюдений;
для связных рангов: ,
где , а t - количество связнных рангов по определенным показателям.
Значимость коэффициента проверяется на основе - критерия Пирсона: ;
определяется по заданному уровню вероятности (р) и числе степеней свободы: , при условии > коэффициент конкордации является статистически достоверным (приложение 4).
Оценка тесноты связи между альтернативными и атрибутивными признаками.Оценка тесноты связи между альтернативными признаками осуществляется на основе тетрахорических таблиц или таблиц взаимной сопряженности (табл. 10.4)
На основе таблицы сопряженности рассчитывается коэффициенты:
- ассоциация ( ): ;
контингенции( ): .
Они меняются в пределах от - 1 до + 1 и всегда < .
Связи считаются подтвержденными, если ≥ 0,5 и ≥ 0,3.
Таблица 10.4
Распределение частот по сочетанию альтернативных признаков
Факторный признак | Результативный признак | Итого | |
наличие | отсутствие | ||
наличие | а | в | а + в |
отсутствие | с | d | в + d |
Итого | а + с | в + d | n |
где а, в, с, d - частота взаимного сочетания соответствующих альтернатив, n - общая сумма частот.
Если факторный и результативный признак имеют разновидностей больше 2-х, т.е. являются атрибутивными, то для оценки тесноты связей между ними применяются: коэффициент взаимной сопряженности К. Пирсона (С) и коэффициент взаимной сопряженности А.А. Чупрова (Т ).
Для их определения первичная статистическая информация представляется в форме таблицы сопряженности (табл.10.5).
Коэффициент взаимной сопряженности К. Пирсона определяется по формуле:
, где .
Коэффициент взаимной сопряженности А.А. Чупрова рассчитывается так:
.
Таблица 10.5
Таблица сопряженности между атрибутивными признаками
Группы по фактор ному признаку | Группы по результативному признаку | Итого | |||
В1 | В2 | … | В m | ||
А1 | f11 | f12 | … | f1 m | А1 |
А2 | f21 | f22 | … | F2 m | А2 |
… | … | … | … | … | … |
Аk | fk 1 | fk 2 | … | fk m | Аk |
Итого | В1 | В2 | … | В m | n |
где - частоты взаимного соответствия двух атрибутивных признаков, i - номер группы факторного признака, , k - число разновидностей факторного признака, - номер группы результативного признака; , m - число разновидностей результативного признака; Аi - итоговые частоты по строкам; Вj - итоговые частоты по столбцам.
Коэффициенты меняются от 0 до 1, но коэффициент Чупрова яв-ляется более точным показателем, т.к. учитывает число групп по каждому признаку.
Тесты