Корреляционно-регрессионный анализ связи
9.1. Виды взаимосвязей между явлениями
Обратить внимание!
Связи между явлениями делят на:
1. Функциональные связи – каждому возможному значению факторного признака Х соответствует четко выраженное значение результативного признака У.
2. Стохастические связи – каждому значению признака Х соответствует определенный множитель признака У, которые варьируют и создают ряд распределения, который называется условным.
Разновидностью стохастической связи является корреляционная зависимость, которая обуславливает корреляционную связь между признаками.
Корреляционная связь между признаками Х и У записывается в виде уравнения корреляционной связи или уравнения регрессии:
Ух = ƒ(х), где
ƒ(х) – определенный вид функции корреляционной связи, который описывает линию регрессии.
Корреляция – это соотношение, соответствие между переменными в уравнении регрессии.
9.2. Регрессионный анализ
Обратить внимание!
В регрессионном анализе различают уравнения:
- парной (простой) регрессии – это когда связь с результативным признаком осуществляется с одним видом факторного признака Х;
- множительной (многофакторной) регрессии – это если результативный признак У связан с несколькими видами факторных признаков Хj.
Наиболее часто для характеристики корреляционной связи между признаками используют такие виды уравнений парной регрессии, или корреляционных уравнений:
- линейное уравнение: ;
- уравнение параболы:
- уравнение гиперболы:
Для оценки влияния факторного признака на результативный может рассчитываться коэффициент эластичности в среднем для всей совокупности:
где Х, У – средние величины фактических данных в соответствии с факторным и результативным признаками в целом для совокупности.
Коэффициент эластичности показывает, на сколько % в среднем изменяется результативный признак при изменении факторного признака на 1 %.
9.3. Корреляционный анализ
Обратить внимание!
Корреляционная связь – это связь, при которой каждому значению аргумента соответствует несколько значений функций и проявляющаяся при достаточно большом числе наблюдения.
Этапы проведения корреляционного анализа:
1. Постановка задачи и выбор факторного и результативного признака.
2. Сбор статистического материала.
3. Предварительное изучение взаимосвязей с помощью корреляционных полей и аналитических группировок.
4. Изучение парных зависимостей.
5. Исследование многофакторной зависимости.
6. Оценка результатов исследований, пояснения и их анализ.
Предварительное заключение о наличии или отсутствия связи делается по аналитической группировке и корреляционным полям.
Корреляционное поле – это нанесенное на график множество точек с координатами ХiУi, образующих облако.
Для определения тесноты связи между признаками используют коэффициент парной корреляции (ryx).
, где
; ; ;
;
.
Если ryx = +1 – связь функциональная положительная.
Если ryx = -1 – связь функциональная отрицательная.
Если ryx = 0 – связь отсутствует. Это значит, что отсутствует линейная связь, но может иметь место криволинейная.
Знак при ryx указывает на направление связей:
«+» - связь прямая;
«-» - связь обратная.
Оценка тесноты связей производится по следующей шкале:
ryx = (0,1 – 0,3) – связь слабая;
ryx = (0,3 – 0,7) – связь средняя;
ryx = (0,7 – 0,99) – связь тесная.
Также тесноту связи между признаками оценивают с помощью коэффициента детерминации. Он показывает, какая доля вариации (изменчивость) результативного признака связана с действием факторного, измеряется в %:
После установления тесноты связи дают оценку значимости связи между признаками. Под термином «значимость связи» понимают оценку отклонения выборочных изменений от своих значений в генеральной совокупности с помощью статистических критериев. Оценку значимости связи осуществляют с использованием F – критерия Фишера и t – критерия Стьюдента.
Для парной регрессии (линейной и нелинейной) F – критерий Фишера рассчитывается по формуле:
;
где 1, (n–2) – число степеней свободности (свободы) числителя и знаменателя зависимости.
Степень свободности – это целое число, которое показывает, сколько независимых элементов информации в переменных У нужно для суммы квадратов.
Для парной линейной регрессии при r = R расчетные значения t-критерия Стьюдента вычисляются по формуле:
где (n-2) – число степени свободности.
Задание 20.
Зависимость между урожайностью зерновых и качеством почв описывается уравнением регрессии: Ух = 5,3 + 0,9х. Рассчитайте коэффициент эластичности, если среднее значение качества почв по данной совокупности составляет 56 балла, а средняя урожайность 45,8 ц/га. На основании рассчитанного коэффициента эластичности сделать вывод.
Задание 21.
Зависимость между уровнем урожайности овощных культур и уровнем их полива описывается уравнением регрессии: У = 3,5 + 5,76х. Теснота связи ( ) между признаками составляет 0,4. Раскройте содержание параметров а0 и а1 и рассчитайте коэффициент детерминации. Сделайте вывод.
ВОПРОСЫ И ЗАДАНИЯ КОНТРОЛЬНОЙ РАБОТЫ
1. Предмет статистики и ее категории.
2. Методология статистики.
3. Организация статистики в РФ.
4. Сущность статистического наблюдения и требования к нему.
5. Программно-методологическое и организационное обеспечение статистического наблюдения.
6. Формы, виды и способы наблюдения.
7. Ошибки наблюдения и методы их контроля.
8. Сущность и организация статистической сводки.
9. Группировка статистических данных.
10. Ряды распределения.
11. Статистические таблицы.
12. Абсолютные статистические величины, их сущность, виды, единицы измерения.
13. Относительные величины, их сущность, виды и формы выражения.
14. Сущность средних величин, их значение и условия применения.
15. Средняя арифметическая, ее свойства и методы вычисления.
16. Средняя гармоническая и другие виды средних.
17. Структурные средние: мода и медиана.
18. Показатели вариации.
19. Понятия рядов динамики и их виды.
20. Анализ устойчивых динамических рядов.
21. Анализ неустойчивых динамических рядов.
22 Дисперсионный анализ в рядах динамики.
23. Изучение сезонных колебаний.
24. Сущность индексов, их классификация и роль в статистико-экономическом анализе.
25. Методологические принципы строения агрегатных индексов.
26. Средние индексы.
27. Индексы переменного состава, постоянного состава и структурных сдвигов.
28. Понятие о выборочном наблюдении.
29. Способы выбора единиц для выборочного наблюдения.
30. Ошибки выборочного наблюдения.
31. Определение необходимой численности выборки.
32. Виды взаимосвязей между явлениями.
33. Регрессионный анализ.
34. Корреляционный анализ.
35.Тема 3.2 – задание 1.
36. Тема 4.1 – задание 2.
37. Тема 4.2 – задание 3.
38. Тема 4.2 – задание 4.
39. Тема 4.3 – задание 5.
40. Тема 4.2 – задание 6.
41. Тема 4.2 – задание 7.
42. Тема 4.2 – задание 8.
43. Тема 5.2 – задание 9.
44. Тема 5.2 – задание 10.
45. Тема 5.3 – задание 11.
46. Тема 5.3 – задание 12.
47. Тема 5.3 – задание 13.
48. Тема 5.3 – задание 14.
49. Тема 5.3 – задание 15.
50. Тема 6.2 – задание 16.
51. Тема 7.4 – задание 17.
52. Тема 7.4 – задание 18.
53. Тема 7.4 – задание 19.
54. Тема 9.3 – задание 20.
55. Тема 9.4 – задание 21.
ТАБЛИЦА РАСПРЕДЕЛЕНИЯ ВОПРОСОВ И ЗАДАЧ КОНТРОЛЬНОЙ РАБОТЫ ПО ВАРИАНТАМ
Предпоследняя цифра шифра | Последняя цифра шифра | |||||||||
СПИСОК ЛИТЕРАТУРЫ
1. Федеральный закон «Об официальном статистическом учете и системе государственной статистики в Российской Федерации» от 29 ноября 2007 г. N 282-ФЗ, С изменениями и дополнениями от: 19 октября 2011 г., 16 октября 2012 г., 2 июля 2013 г.
2. Статистика: Учебник / А.М. Годин. – 9-е изд., перераб. и испр. М.: Издательско-торговая корпорация «Дашков и К», 2011. – 460 с.
3. Михтарян В.С. Статистика Серия: Среднее профессиональное образование – М.: Академия, 2010
4. Палий И.А. Прикладная статистика - М.: Дашков и К (ИТК), 2010
5. Харченко Н.М. Статистика – М:, Дашков и К (ИТК), 2011
6. Социально-экономическая статистика Серия: Основы науки – М.: Юрайт, 2011
7. Замедлина Е.А. Статистика Серия: Профессиональное образование - М.: РИОР, 2012
8. Салин В.Н. Статистика – М.: ИТК Дашков и К, 2011