Проанализировать взаимосвязь между доходами и возрастом респондента с помощью коэффициента Пирсона
Домашняя работа: 5- е Найти интервальную оценку среднего значения дохода с надёжностью 99%. Средний доход подчинтан. Дисперсию нужно посчитать, сложность в нахождении t.В дз пользуемся приложение 3.
Техника нахождения t значения:
1. Если объём выборки большой больше 30. То t находят по таблице функции лапаласа.
Ф(х) | Х |
. | . |
0,49 | . |
. | . |
1. Задаём гамма уровень надёжности = 98%.
2. Вычисляем гаама/2=49%=0,49
3. В колонке Ф(х) находим значение = гамма/2, и соответственно значение х. Это и будет t.
2. Если объём выборки маленький то t находят по таблице student.
3. Приложение 3:
N | 0,95 | 0,98 | 0,99 |
. | |||
. | |||
. | |||
Для нахождения t задают гамма надёжность и находят число на пересечение с нужным объёмом выборки.
Существуют более точные и более сложные формулы для определения доверительных интервалов, но на практике аще всего используют дельта =t*(кореньS2/n)
Корреляционный анализ(Анализ взаимосвязи признаков).
1. Общие принципы анализа взаимосвязи признаков:
1. Для того, чтобы проанализировать связь двух показателей рассчитывают коэффициенты корреляции. Каждый коэффициент позволяет оценить :а) силу связи. б) направление связи.
А) Анализ силы связи. Любой коэффициент изменяется в диапазоне от 0 до 1. И чем ближе к 1, тем сильнее связь между признаками. Принято считать, если коэффициент до 0,3 то вязь слабая. 0,3-0,6 средняя или умеренная. 0,7 выше – сильная или тесная.
Б) Различают связи прямые и обратные. Прямая связь означает, что с ростом одного показателя второй показатель также растёт. Чем выше производительность труда тем больше оплата – прямая связь . Обратная связь означает, что с ростом одного показателя второй показатель уменьшается.
Если коэффициент корреляции больше 0, то связь прямая, если он со знаком минус, то значит связь обратная.
Например: Пусть х – расходы фирмы на рекламу, у-объём продаж фирмы, коэффициент корреляции R=-0,93.
Связь между показателями сильная и чем выше расходы на рекламу, тем меньше объём продаж.
2. Связи различаю прямолинейные и нелинейные. Коэффициенты корреляции не могут оценить силу нелинейной связи, если связь не линейная, то можно поступить двумя способами.
1. Оценивать взаимосвязь на кусочно-линейных моделях.
2. Для анализа нелинейных связей можно использовать специальный показатель Эмпирическо-корреляционное отношение.
3. Никакой коэффициент корреляции не показывает зависимость, он фиксирует только взаимосвязь.
4. Связь между показателями может быть обусловлена влияние третьего фактора и тогда эта связь оказывается ложной.
Статистический инструментарий не позволяет обнаружить этот фактор, но если мы знаем о его существовании, то можно рассчитать частный коэффициент корреляции (Rxy.z) он измеряет связь между ху, исключая фактора z.
5. Любой коэффициент корреляции нужно проверять на статистическую значимость, то есть на возможность переноса результатов корреляционного анализа с выборки на генеральную совокупность.
6. Выбор коэффициента корреляции для анализа зависит от типа признаков, которые мы изучаем:
А) если изучается взаимосвязь двух количественных признаков(возраст и з.п, цена и объём продаж), то рассчитывают коэффициенты Пирсона(R), Спирмена(ро).
Б) Если изучается взаимосвязь двух порядковых признаков (оценки на зачётах, экзаменам, рейтинги фирм и т.д.), то считают коэффициенты Спирмена, Кэндала(Тау).
В) Если изучается взаимосвязь двух атрибутивных признаков(пол, профессия, ВУЗ и т.д.), то используют коэффициенты Крамера(), Чупрова, Коэффициент ассоциации, контингенция считаются для таблиц 2 на 2.
ПРАКТИКА
Кучербаева Кристина и402.
Относительные величины:
1. Динамики оказывают как изменился показатель в данном периоде по сравнению с предъидущем.Хн/хн-1.
2. Относительные величины динамики. Часть/часть.
3. Удельный вес. (Часть/целое).
4. Интенсивности уровни экономического развития(сколько благ на человека. )
5. Относительная величина планового задания = План текущего года/план отчётного года*100%.
6. Выполнение плана = Факт текущего/ План текущего*100%.
Величины сравнения тоже самое что и величины координации.
ДЗ : Задача 7-8.
Анализ взаимосвязи дух количественных признаков.
Для количественные признаков анализ осуществляют в 3 этапа.
1. Построение поля корреляции. Поле корреляции - это график, который визуализирует характер связи. Как правило используют точечный график. Анализ графика позволяет:
А) выдвинуть гипотезу о форме связи.
Б) Диагностировать наличие выбросов.
Например: Изучается взаимосвязь Х – время на дорогу в ВУЗ. У – количество опозданий на занятие в неделю.
х | У |
По характеру расположения точек на графике можно предположить, наличие прямой связи между признаками. Т.е. чем дольше студент добирается до универа, тем чаще он опаздывает.
Также по графику диагностируется выброс или нетипичное значение. Для проведения конкретного анализа выброс исключаем из совокупности, поэтому дальнейший анализ изучаем по 5-ти студентам
Второй этам Вычисление и интерпритаци коэффициента кореляции
Коэффициент Пирсена R(xy) считать его в экселе,
Для наших данных коэффициент пирсона получился 0,904, было обнаружена сильная или тесная связь, т.е. временные затраты на дорогу и частота опозданий существенно взаимосвязаны. Обнаруженная связь прямая, т.к. коэффициент больше 0, следовательно наша гипотеза подтвердилась, следовательно наша гипотеза подтвердилась чем дольше студент добирается до вуза, тем чаще опаздывает.
Проверка коэффициента кореляции на статистическую значимость, выполняется по этапам:
А) Расчитывается наблюдаемое значение tнаблюдаемое=Корень ((r2/ 1-r2)* (n-2))=Корень((0,9042)/1-0,9042)*(5-2)) = 3,660.
По таблице стбюдента находят t табличное, при этом необходимо задать следующие параметры :
Б)
1. tтабличное Альфа=0,01
2. Число степеней свободы df=n-2=3
3. В таблице находим число на пересечении альфа и df. Т табичное = 3,182
В) Сравнивают табличное и наблюдаемое значение. Если т табличное больше т наблюдаемое то делаем вывод, что коэффициент статистический не значим, Данная связь получилась случайным образом и в генеральной совокупности может не обнаружится. А если наоборот, то коэффициент статистический значим и в генеральной совокупность значим.
В нашем случае наблюдаемое значение больше табличного следовательно связь между временными затратами на дорогу в вуз и частотой опозданий может быть обнаружена.
Если из выборочной совокупности по каким то причинам нельзя исключить выбросы, то для анализа взаимосвязи коэффициент Пирсона использовать нельзя и нужно использовать коэффициент Спирмона. Он также используется для анализа взаимосвязи пордковых признаков
ДЗ 6:
Проанализировать взаимосвязь между доходами и возрастом респондента с помощью коэффициента Пирсона.
Анализ связи порядковых признаков.
Этапы анализа те же самые что и для количественных признаков.
5 потребителей проставляли ранги 2-м товарам:
Результат аранжирования представлены в таблице:
Потребитель | Ранг товара А | Ранг товара Б | Разница в рангах Di | (Di)2 |
Иванов | ||||
Петров | -1 | |||
Сидоров | -1 | |||
Путин | ||||
Мирославкий | ||||
Сумма 36 |
1-й этап Построение поля корреляции. Связь обратная.
2-этап – расчёт коэффициента Спирмена.
РО =1-(6*сумма d2i)/n(n2-1)
Di – разница в рангах
РО = 1-(6*36/5*(52-1))=-0,8
Между аранжируемыми товарами обнаруживается тесная взаимосвязь, причём эта связь обратная.
Проверка коэффициента на статистическую значимость.
А) tнабл.= Корень (ро2/ 1-ро2)* (n-2))=Корень((-0,82)/1-0,82)*(5-2)) = 2,31
Б) tтабичное= альфа=0,05, DF= n-2=3. Т табличное=3,182
В) сравниваем табличное и наблюдаемое значения. КОЭФФИЦИЕНТ статистический не значим/
Расчёт коэффициента Спирмена количественных данных в которых ранги ещё не проставлены.
Студенты | Время на дорогу | Опоздание | Di | D2 | ||
Значение 40 | Ранг 3 | Значение 4 | Ранг 4 | -1 | ||
РО = 1-(6*2/6(62-1))= 0,943 - связь сильная и прямая.
Связанные ранги.
Хi= 10,15,15,20,25,25,25,30 одинаковые ранги – связанные рангиприсваивается средний изрангов.
Ранг: 1 2,5;2,5 4 6 6 6 8
Для даных о Доходе и возрасте расчитать и интерпретировать коэффициент Спиремеа.
Анализ связи двух качественных признаков.
Примеры: Пол и курение. Пол и студенческая группа.
Этапы анализа:
1. Построение таблицы сопряжённости.
2. Проверка гипотезы о наличии связи.
3. Если гипотеза подтвердилась, то расчёт коэффициента который оценивает силу взаимосвязи.
1. Таблица сопряжённости – это таблица в которой показаны частоты (%) одновременно по двум признакам.
Пример:
Исследуется взаимосвязь частоты покупок продукции фирмы А с полом потребителя т.е. изучается вопрос мужчины или женщины являются наиболее типичными потребителями данной продукции.
Пол | Постоянно покупают | Покупают изредка | Никогда не покупают | Всего |
Мужчина | 25/31,1 | 35/42,7 | 65/51,2 | |
Женщина | 66/59,9 | 90/82,3 | 85/98,8 | |
Всего |
По исходным данным нельзя выдвинуть гипотезу о наличии связи поскольку группы различаются по численности. Для корректного анализа требуется уравнять группы т.е. принять за 100% отдельно каждую группу.
Пол | Постоянно покупают% | Покупают изредка% | Никогда не покупают % | Всего |
Мужчина | 100% | |||
Женщина | 100% |
На основании представленных данным можно выдвинуть гипотезу женщины чаше покупают данную продукцию. Их больше и в категории постоянных покупателей (27% против 20%) они преобладают и среди непостоянных покупателей (38% против 28%), таким образом можно выдвинуть гипотезу, что пол определяет потребительское поведение в отношении товара А.
В домашней работе в если даже нет взаимосвязи всё равно в учебных целях продолжаем анализ.
2. Проверка гипотезы о наличии связи.
Проверку осуществляют с помощью критерия (Хи)2 .
Техника проверки осуществляется в 3 этапа:
А) По формуле расчитывается значение (хи)2.
Б) по таблице находится значение (Хи)2.
В) сравнивается наблюдаемое и табличное значение. Если (хи)2 наблюдаемое будет меньше (Хи)2 табличного, то связь не подтверждается, а если наоборот, то гипотеза подтвердилась.
Формула: (Хи)2= Сумма(нi-нiштрих)/нiштрих. нi – наблюдаемое значение или наблюдаемая частота то количество наблюдений которое находится в клетках таблицы. Нiштрих – теоретическая частота – то количество наблюдений, которое было бы в каждой клетке таблицы, если бы признаки были независимы. Для её расчёта необходим инструментарий теории вероятности.
Нiштрих=рi*н. Н-объём выборки. Рi- вероятность попадания в каждую клетку таблицы.
Рм+=Рм*Р+.= 125/366*91/366=0,08.
Нштрихм+=0,08*366=31,1.
Рм+-=Рм*Р+-=125/366*125/366=0,11
Нштрихм+-=0,11*366=42,7.
Рж+=241/366*91/366=0,16
Нштрих=0,16*366=59,9.
(Хи)2=(25-31,1)2/31,1 + (35-42,7)2/42,7 + ….=9,57
Найдём табличное значение критерия, для этого зададим параметры:
1. Альфа=0,05
2. Df- число степеней свободы = (m-1)(p-1) m и p – число строк и столбцов в таблице.= (2-1)*(3-1)=2. В таблице критерии (хи)2 находят число на пересечении df и альфа. (хи)2 табличное = 5,99. Наблюдаемое значение критерия больше табличного, следовательно гипотеза о наличии связи подтвердилась, пол определяет потребительское поведение в отношении данного товара.
3-й этап . Оценим силу обнаруженной взаимосвязи, для этого рассчитывают специальные коэффициенты, чаще всего рассчитывают коэффициент Крамера. Vкрамера=Корень Хи2/н*М.= корень 9,57/366*1=0,162
М- меньшее из двух чисел. М-1=1, р-1=2. Н объём выборки.
Связь между признаками слабая, т.е. пол в незначительной степени определяет потребительское поведение.
Тема: Экономические индексы.
Вопросы:
1. Индивидуальные индексы: особенности расчёта и интерпретации.
I – они оценивают изменение какого либо показателя во времени или пространстве. И по сути представляют собой показатели динамики.
Обозначения: р- цена.q – количество, z- себестоимость единицы продукции, t – затраты времени на производство единицы продукции, p*q = общие затраты , z*q=затраты на производство всей продукции, t*q= общие временные затраты на производство всей продукции.
Индивидуальные индексы строят как отношение показателей текущего периода к показателю базисного периода.
Iр = P1/Р0. = 1350/1280=1,055,1) Цена выросла в 1,055 раз.2)105,5% - цена выросла на 5,5%. 3)Цена выросла на 70 рублей.
Ро=1280
Р1=1350.
Iq – индивидуальный индекс физического объёма.
Q0=24
Q1=18.
IQ=18/24=0,75( если индекс меньше 1, то принято интерпретировать только процентное изменение.) Объёмы выпуска упали на 25%.
IZ=Z1/Z0.
Взаимосвязь цепных и базисных индексов.
Цепные показатели отображают изменение исследуемого исследования от периода к периоду. Р1/р0;р2/р3;р3/р2…..
Рн/Рн-1.
Базисные индексы отражают изменение по отношению к одному и тому же периоду, принятому за базу. Рн/р0
Правила связи:
1. Если перемножить цепне показатели то получим базисный показатель.
Р1/Р0*Р2/р1=Р2/р0.
Пример. За первый год инфляция составила 14%, за второй год 18,5%, и за 3-й год 16%. Как изменились цены за все 3 года.
Р1/р0=1,14. Р2/р1=1,185. Р3/р2=1,16.
Р3/р0=1,14*1,185*1,16=1,567. Интерпретация. За 3 года цены выросли на 56,7 процента.
Пример:
За 1-й год объём экспорта увеличился на 10%.
За 2-й год остался без изменений.
За 3-й год упал на 6%.
За 4-й год упал на 12%.
Проанализировать изменение объёмов экспорта за 4 года.
Q1/q0=1,1
Q2/q1=1
Q3/q2=0,94
Q4/q3=0,88
Найти Q4/q0=нужно всё умножить = 0,909. За 4 года объём экспорта сократился на 9,1%.
ДЗ последнее: проанализировать взаимосвязь между полом и курение. 3 этапа.
Формализуем условие задачи, предоставим её в виде индекса.
Q2/q0=1?12
Q1/Q0=1,3
Q2/Q1- ?
По правилу связи индексов Q2/Q1=0,86
За второй год рекламные расход сократились на 14 %%
Агрегатные индексы:
Они характеризуют изменения сложного многосоставного явления, отдельные части которого несопоставимы (I)
Продукция | Объём реализации (q) | Цена продукции(р) | ||
Сыр | ||||
Молоко |
Проанализировать как изменился товарооборот выручка в том числе определить, какие изменения произошли только за счёт роста цен и только за счёт изменения объёма продаж.
Шаг 1.
Определим показатель выручки.
р*q – 2008
р1q1 – 2009.
Шаг 2 .
Проанализируем динамику выручки.
Расчитаем агрегатный индекс выручки Ipq= Сумма p1q1/ сумму p0q0= 3*120+4*140/2*110+3*110=920/530=1,736 Выручка выросла на 73,6%.
Дельта pq = Сумма p1q1-сумма p0q0=390.
Шаг 3.
Проанализируем как изменилась выручка только за счёт того, что изменились объёмы продаж. Для этого рассчитывается агрегатный индекс физического объёма Iq= = Сумма p0q1/ сумму p0q0= 2*120+3*140/530=660/530=1,245
Дельта q= 660-530=130
Объёмы продаж выросли на 24,5% , и за счёт этого выручка увеличилась (дельта q) на 130 денежных единиц.
Индекс q показывает изменение объёмов а дельта q показывает изменение выручки за счёт изменения объёма.
Шаг4.
Проанализируем как изменилась выручка только за счёт того, что изменились цены. Для этого строят агрегатный индекс цены. Ip== Сумма p1q1/ сумму p0q1= 920/660=1,394.
Дельта p = 920-660=260.
Цена выросла на 39,4% и за счёт этого выручка увеличилась на 260 денежных единиц.
Правило связки индексов.
1) Ipq=Ip*Iq. Между индексами действует та же самая система связей, что и между показателями по которым рассчитываются индексы. 1,736=1,394*1,245.
Продукция | ||||
Q0 | Z0 | Q1 | Z1 | |
1.A | ||||
2.B | ||||
3.C |
Проанализировать динамику издержек производства в целом по 3-м товарам в том числе посмотреть как изменились издержки только за счёт себестоимости единицы продукции и только за счёт объёмов выпуска.
Шаг 1.
1. Показатель издержек производства zq.
2. Izq=сумма z1q1/сумма z0q0=( 5*8+4*11+4*5)/(3*10+4*12+3*8)=104/102=1,0196
Дельта zq = 104-102=2 Издержки производства выросли на 1,96% и составила 2 денежных единицы.
Шаг 2.
Проанализируем как изменились издержки только за счёт себестоимости.
Агрегатный индекс себестоимости продукции Iz=сумма z1q1/сумма z0q1= 104/(3*8+4*11+3*5)= 1,253. Дельта z = 21.
Себестоимость единицы продукции выросла на 25,3%. За счёт этого затраты выросли на 21 денежную единицу.
Шаг3.
Проанализируем как изменились издержки только за счёт изменения объёмов.
Построим агрегатный индекс физического объёма Iq= суммаz0q1/сумма z0q0 = 83/102=0,814
Дельта q=-19. Объёмы выпуска снизились на 18,6% и за счёт этого экономия издержек составила 19 денежных единиц.
Правило связки: Izq=Iz*Iq= 1,0196=1,253*0,814.
Типичные задачи на правило связки индексов.
Задача.
В 2009 году предприятие снизило объёмы производства на 40 процентов, а цены на свою продукцию повысила на 8 процентов. Как изменилась выручка предприятия?
Iq=0,6. Ip=1,08. Ipq=Ip*Iq=0,6*1,08=06,48. Выручка предприятия упала на 32,2%
Задача 2.
Затраты на производство продукции на предприятии выросли на 10 %. Объёмы выпускаемой продукции снизились на 15 %. Как изменилась себестоимость единицы продукции?
Izq=1,1. Iq=0,85. Iz=1,1/0,85=1,294. Себестоимость выросла на 29,4%.
Задача3.
Средняя выработка продукции в расчёте на одного рабоче выросла на 12%. Объём выпуска продукции увеличился с 50 до 60 тысяч единиц. Как изменилась численность работников на предприятии?
V- выработка продукции.
q- объём выпускаемой продукции.
Т- численность.
Q=V*T
Iq=Iv*Iт
Iт=Iq/Iv=1,2/1,112=1,071
Iq=60/50=1,2
Численность работников на предприятии выросла на 7,1 %