Статистические методы изучения связей
Для ответа на вопрос о наличии или отсутствии корреляционной связи используется ряд специфических методов:
а) Простейший прием обнаружения связей – это сопоставление двух параллельных рядов (ряда значений факторного признака и соответствующих ему значений результативного признака).
Значения факторного признака располагают в возрастающем порядке, а затем прослеживают направление изменения величины результативного признака.
Если возрастание величины факторного признака влечет за собой возрастание величины результативного признака, говорят о возможном наличии прямой корреляционной связи. Если же с увеличением факторного признака величина результативного признака имеет тенденцию к снижению, то можно предположить обратную связь между признаками.
б) Балансовая связь – характеризует зависимость между источниками формирования ресурсов и их использование.
Источники – это пассив баланса.
Использование – это актив баланса.
Актив баланса равен его пассиву.
в) Для предварительного выявления наличия связи и раскрытия ее характера применяют графический метод, используют данные об индивидуальных значениях признака – фактора и соответствующих ему значениях результативного признака в прямоугольных координатах, строят точечный график, его называют «полем корреляции».
Точки корреляционного поля не лежат на одной линии, они вытянуты определенной полосой слева направо или наоборот.
Рисунок 11.1 Корреляционное поле зависимости числа клиентов фирмы (у) от ее затрат на рекламу (х)
Положение каждой точки на графике определяется величиной двух признаков: уровнем затрат на рекламу и соответствующим ему числом клиентов, пользующихся услугами данной фирмы.
Здесь связь прямая, линейная.
Если одному и тому же значению признака – фактора соответствуют различные значения результативного признака, восприятие затрудняется, особенно при большом числе единиц совокупности. В таком случае для установления факта наличия связи можно воспользоваться статистическими таблицами – корреляционными или групповыми.
г) Корреляционная таблица.
Для ее построения сначала группируют значения результативного, затем – факторного признака. Факторный признак располагается в строках, результативный – в графах. Например, зависимость производительности труда от потерь рабочего времени можно показать в корреляционной таблице:
Группы предприятий по потерям рабочего времени | Группы предприятий по производительности труда | Всего | ||||
4 – 10 | 10 - 16 | 16 - 22 | 22 - 28 | 28 - 30 | ||
8 - 10 | - | - | - | |||
10 - 12 | ||||||
12 - 14 | - | |||||
14-16 | - | - | - | |||
16-18 | - | - | - | - | - | - |
Итого |
Концентрация численности единиц совокупности по диагонали таблицы говорит о наличии корреляционной связи между изучаемыми признаками.
д) Метод аналитических группировок.
Строится групповая таблица (аналитическая группировка). Все наблюдения разбиваются на группы в зависимости от величины признак–фактора и по каждой группе вычисляются средние значения результативного признака.
е) Дисперсионный анализ – для характеристики тесноты связи между признаками в аналитических группировках рассчитывают эмпирическое корреляционное отношение и коэффициент детерминации.
Эмпирическое корреляционное отношение – характеризует тесноту корреляционной связи, т.е. степень ее приближения к функциональной.
, (11.2)
где – общая дисперсия; – средняя из внутригрупповых дисперсий; – межгрупповая дисперсия.
Коэффициент детерминации:
(11.3)
Он показывает долю вариации результативного признака, вызванную действием факторного признака, положенного в основание группировки.
ж) Корреляционный анализ.
Итак, корреляция – связь, соотношение между объективно существующими явлениями и процессами. Частный случай корреляции – это регрессия. В корреляционном анализе оценивается сила стохастической связи; в регрессионном анализе исследуется форма связи, т.е. находится уравнение корреляционной связи (уравнение регрессии).
Этапы построения корреляционно-регрессионной модели:
1.Установление факта наличия связи между признаками и определение набора факторов для модели.
2.Подготовка исходной информации для проведения анализа. К формированию исходной статистической информации предъявляется ряд требований, обеспечивающих теоретическую обоснованность проведения корреляционно-регрессионного анализа:
а) выборочная совокупность исходных данных должна быть репрезентативной. Обычно считается, что число наблюдений должно превышать число факторов;
б) выборка должна состоять из статистически независимых наблюдений;
в) результаты наблюдений должны быть однородными, следовательно, из рассмотрения нужно убрать те наблюдения, которые резко отличаются от типичного уровня;
г) в анализ должны включаться показатели, имеющие нормальное или близкое к нормальному распределение;
д) если строится многофакторная модель, то в регрессионную модель не должны включаться факторы, которые связаны между собой функционально, т. к. в этом случае не могут быть получены правильные оценки параметров модели.
3.Выбор формы связи и построение уравнения регрессии.
4.Вычисление показателей, характеризующих качество построенной модели.
5.Экономическая интерпретация коэффициентов регрессии и других характеристик.
6.Вычисление показателей тесноты связи.
7.Оценка существенности корреляции.