Статистические методы выявления корреляционной связи

Для ответа на вопрос, существует или нет корреляционная связь между признаками, используют ряд специфических методов: параллельное сопоставление рядов, построение групповой и корреляционной таблиц, графическое изображение корреляционного поля.

Простейшим способом обнаружения связи является параллельное сопоставление двух рядов– ряда значений факторного признака и соответствующих ему значений результативного признака. Значения факторного признака Статистические методы выявления корреляционной связи - student2.ru располагаются в возрастающем порядке, прослеживая тенденцию изменения соответствующих значений результативного признака Статистические методы выявления корреляционной связи - student2.ru . В случае, когда возрастание величины факторного признака явно влечёт за собой рост величины результативного, говорят о возможном наличии прямой корреляционной связи. Если с увеличением Статистические методы выявления корреляционной связи - student2.ru значение Статистические методы выявления корреляционной связи - student2.ru уменьшается, то можно предполагать обратную корреляционную связь между признаками.

В качестве примера рассмотрим данные о выпуске продукции (результативный признак) и среднегодовой стоимости основных производственных фондов (факторный признак) по 20 предприятиям. В табл.1.12 предприятия ранжированы по среднегодовой стоимости основных производственных фондов.

Табл.1.12

№ предприятия Среднегодовая стоимость основных производственных фондов, млн. руб. Выпуск продукции, млн. руб. № предприятия Среднегодовая стоимость основных производственных фондов, млн. руб. Выпуск продукции, млн. руб.

В целом для всей совокупности предприятий можно видеть, что с увеличением стоимости основных производственных фондов увеличивается выпуск продукции. Это позволяет говорить о возможном наличии прямой корреляционной связи.

С помощью метода параллельного сопоставления двух рядов можно дать лишь самую общую характеристику связи, используя относительно небольшое имеющееся число наблюдений. Иногда наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие параллельного сопоставления рядов. В таких случаях проводится построение корреляционной или групповой таблицы.

Рассмотрим построение корреляционной таблицына примере данных табл.1.20. Вначале проводится группировка значений факторного и результативного признаков: по формуле Стерджесса определяется число групп Статистические методы выявления корреляционной связи - student2.ru рассчитываются величины интервалов для факторного и результативного признаков ( Статистические методы выявления корреляционной связи - student2.ru , Статистические методы выявления корреляционной связи - student2.ru ); данные по количеству единиц совокупности, отвечающих определённому сочетанию значений признаков Статистические методы выявления корреляционной связи - student2.ru и Статистические методы выявления корреляционной связи - student2.ru заносятся в корреляционную таблицу. В корреляционной таблице факторный признак Статистические методы выявления корреляционной связи - student2.ru обычно располагают в строках, а результативный признак Статистические методы выявления корреляционной связи - student2.ru – в столбцах. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного сочетания значений Статистические методы выявления корреляционной связи - student2.ru и Статистические методы выявления корреляционной связи - student2.ru (табл.1.13).

Табл.1.13

Группы (интервалы) Статистические методы выявления корреляционной связи - student2.ru Группы (интервалы) Статистические методы выявления корреляционной связи - student2.ru
59,0–89,2 89,2–119,4 119,4-149,6 149,6-179,8 179,8-210,0
40 – 56      
56 - 72    
72 - 88      
88 - 104      
104 - 120        

Корреляционная таблица даёт возможность выдвинуть предположение о наличии или отсутствии связи, а также выяснить её направление. Если частоты в таблице расположены по диагонали из левого верхнего угла в правый нижний, то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали из правого верхнего угла в левый нижний, то предполагают наличие обратной связи между признаками.

Табл.1.14

Интервалы среднегодовой стоимости основных производственных фондов в группах, млн. руб. Среднее значение выпуска продукции в группах предприятий, млн. руб.
40 - 56
56 - 72 114,3
72 - 88 129,7
88 - 104 129,3
104 - 120

При построении групповой таблицывсе наблюдения разбиваются на группы по факторному признаку, и по каждой группе вычисляют средние значения результативного признака. Групповая табл.1.14 построена по данным табл.1.12.

В групповой таблице сравниваются средние групповые значения результативного признака. Если они увеличиваются с ростом признака-фактора, то можно предположить наличие прямой корреляционной зависимости.

Для предварительного выявления наличия связи и её характера применяют графический метод. Для этого на графике в координатах Статистические методы выявления корреляционной связи - student2.ru строят точки, соответствующие индивидуальным значениям признака-фактора и результативного признака. Совокупность полученных точек называют «полем корреляции». Далее различными способами в пределах «поля корреляции» проводят график, интерпретирующий эмпирическую линию связи между факторным и результативным признаком. Если эмпирическая линия связи по своему виду приближается к прямолинейной, то предполагается наличие линейной зависимости между признаками. Если же она по виду ближе к какой-либо кривой, то может предполагаться наличие соответствующей криволинейной связи между признаками.

Контрольные вопросы

1. Что такое корреляционная связь?

2. Какие значения может принимать линейный коэффициент корреляции?

3. Какие виды корреляционных связей различают в зависимости от числа факторных признаков?

4. С помощью каких эмпирических приемов можно выявить форму корреляционной связи?

5. Что такое прямолинейная парная корреляция? Каким образом она может быть выявлена и что она характеризует?

6. Что собой представляют однофакторные и многофакторные связи?

7. Какими возможными показателями можно охарактеризовать корреляционные связи между признаками?

8. Назовите основные статистические методы выявления корреляционной связи.

9. Что собой представляет метод параллельного сопоставления рядов?

10. Что собой представляет графический метод?

Задачи

1. Произведите по данным таблицы расчет эмпирического и теоретического коэффициентов эластичности между душевым доходом и душевым потреблением для совокупности семей, если установлено, что связь между факторами линейная.

Доход и потребление мясопродуктов в расчете на душу населения

Номер семьи Душевой доход X, ден. ед. Душевое потребление Y, кг
Базисный период Отчетн. период Базисн.. период Отчетный период
Итого
Среднее 1113,3 29,7 31,5

2. По 10 районам области известны значения следующих признаков:

Номер района Внесено органических удобрений, m/га (х) Урожайность зерновых, ц/га (у) Номер района Внесено органических удобрений м/га (х) Урожайность зерновых, ц/га (у)

Для характеристики связи между количеством внесенных органических удобрений уровнем урожайности зерновых необходимо рассчитать (см. тему 1.12):

- парный коэффициент корреляции и проверить его значимость по t-критерию Стьюдента;

- по методу наименьших квадратов параметры для двух видов регрессии (прямой и параболы).

3. По данным таблицы постройте уравнения регрессии для продуктивности коров в зависимости от уровня кормления, а также от удельного веса чистопородных коров. Определите показатели тесноты связи и сделайте выводы (см. тему 1.12).

Наши рекомендации