Тема № 6. Статистическое изучение взаимосвязей.

Методические указания.

Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики. Формы проявления взаимосвязей весьма разнообразны (рис…).

В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. Ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ (рис. …).

Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парной зависимости) или нескольких (при изучении множественных зависимостей) факторных признаков. Показатели тесноты связи между признаками называют коэффициентами корреляции. Их выбор зависит от того, в каких шкалах измеряются признаки. Основные шкалы представлены на рис…..

Если в качестве исходной информации используется вся генеральная совокупность, а не данные выборки, то для оценки тесноты связи рассчитывают коэффициент парной линейной корреляции (рис….).

Рис…. Классификация статистических взаимосвязей (зависимостей).

Рис…. Методы корреляционно-регрессионного анализа.

Рис. Расчет коэффициентов тесноты связи.

В случае наличия линейной и нелинейной зависимости между двумя признаками для измерения тесноты связи применяют корреляционное отношение (рис. Предыдущий номер).

Рис. Расчет коэффициентов тесноты связи – количественная шкала.

Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили названиенепараметрических.

Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности и рассчитывают коэффициенты ассоциации и контингенции. Обобщающие показатели, характеризующие тесноту связи между признаками и позволяющий сравнить проявление связи в разных совокупностях это коэффициенты взаимной сопряженностиПирсона и Чупрова (рис…..).

Рис. Расчет коэффициентов тесноты связи – номинальная шкала.

В социально-экономических исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. При ранжировании каждой единице совокупности присваивается ранг, т.е. порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер.

Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляцииСпирмена (r) и Кендэлла (t) (рис….). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.

Рис. Расчет коэффициентов тесноты связи – порядковая шкала.

После выбора зависимой переменной и факторных признаков, сбора и подготовки информации, идентификации регрессионной модели рассчитываются параметры исследуемой зависимости при помощи ряда способов.

Наибольшее распространение получил способ наименьших квадратов, который был предложен немецким ученым К. Ф. Гауссом и французскими математиками А. М. Лежандром и П. С. Лапласом в первой четверти XIX в. Сущность этого способа заключается в том, что величина параметров уравнения регрессии должна быть такой, чтобы достигался минимум суммы квадратов отклонений между теоретическими (ух) и фактическими (у) значениями зависимого показателя.

Применение метода наименьших квадратов (МНК) для линейной зависимости – если моделью выбрано уравнение прямой представлено на рис….

Рис. Расчет параметров уравнения регрессии методом МНК.

Примеры решения задач.

Задание1.На основе опроса 400 работников коммерческих структур и 400 работников бюджетной сферы получены результаты, представленные в табл. Определить тесноту связи возможными методами.

Таблица

Результаты опроса

Работающие Довольные своей заработной платой Недовольные своей заработной платой Итого
В коммерческих структурах
В бюджетных организациях
Итого

Решение

Коэффициент ассоциации:

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Коэффициент контингенции:

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Основываясь на том, что коэффициенты ассоциации и контингенции превышают 0,50, можно сделать вывод о наличии связи между количеством довольных заработной платой и видом учреждений.

Коэффициент Пирсона:

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru ; Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Коэффициент Чупрова:

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Обычно коэффициенты Пирсона и Чупрова для дихотомических признаков не рассчитывают, но в данном случае они свидетельствуют также о наличии связи между исследуемыми признаками, так как оба больше 0,50.

Задание 2. Имеются данные о распределении 200 молочных ферм области по производительности труда и себестоимости продукции – табл….. Определить тесноту связи возможными методами.

Таблица

Распределение молочных ферм

Производительность Высокая Средняя Низкая Итого
Себестоимость
Высокая
Средняя
Низкая
Итого

Решение

Коэффициент Пирсона:

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru ; Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Коэффициент Чупрова:

Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Основываясь на том, что коэффициенты Пирсона и Чупрова меньше 0,50, можно сделать вывод об отсутствии связи между исследуемыми показателями.

Задание 3. Имеются следующие данные по 8 сахарным заводам о стоимости основных производственных фондов (x), млн. руб., и суточной переработке свеклы (y), тыс. т. (табл….).

Найти уравнение регрессии и определить значимость его параметров.

Таблица

Стоимость основных производственных фондов

x 2,0 2,3 2,4 2,9 2,9 3,7 3,7 4,1
y 8,9 10,0 9,9 10,3 10,0 13,0 12,8 13,1

Решение

Рассчитаем промежуточные значения и представим их в таблице.

Таблица

Промежуточные значения для решения задачи

Номер серии Средневзвешенная цена, x Объем продаж, y xy x2 y2 yx
2,00 8,90 17,80 4,00 79,21 8,88
2,30 10,00 23,00 5,29 100,00 9,52
2,40 9,90 23,76 5,76 98,01 9,73
2,90 10,30 29,87 8,41 106,09 10,79
2,90 10,00 29,00 8,41 100,00 10,79
3,70 13,00 48,10 13,69 169,00 12,48
3,70 12,80 47,36 13,69 163,84 12,48
4,10 13,10 53,71 16,81 171,61 13,33
сумма 24,00 88,00 272,60 76,06 987,76  
среднее 3,00 11,00 34,07 9,50 123,47  

Рассчитаем показатели корреляционно-регрессионного анализа совокупности – табл….

Таблица

Показатели

Коэффициент корреляции Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Определение параметров уравнения регрессии Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Уравнение регрессии Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Средняя эффективность ресурса Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Предельная эффективность ресурса Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Эластичность Тема № 6. Статистическое изучение взаимосвязей. - student2.ru ; Тема № 6. Статистическое изучение взаимосвязей. - student2.ru
Стандартная ошибка коэффициента корреляции Тема № 6. Статистическое изучение взаимосвязей. - student2.ru

Оценка: Признаки в представленной совокупности обладают сильной прямой зависимостью – коэффициент регрессии 0,96 (близок к 1 и положительный). Построенная регрессионная модель в виде прямой линии имеете незначительной отклонение – ошибка 0,12, т.е. достаточно точная и может использоваться для целей планирования и прогнозирования.

Наши рекомендации