Изучение взаимосвязи между несколькими переменными

Основные положения совпадают с требованиями к билету №43,увеличится лишь размерность таблицы и надо после раскрытия основных положений, сходных с билетом 43, -перечислить основные методики анализа связи между несколькими переменными- а именно- метод хи квадрат(билет 45), регрессионный анализ, корреляционный анализ, кластерный, анализ, сетевой анализ, факторный анализ.

45.Статистика хи-квадрат (х2)

Статистический анализ полученных с помощью массового опроса данных, как и анализ наблюдений изучаемого явления или статисти­ческих данных, включает несколько уровней сложности и возможно­стей получения дополнительной (скрытой) информации. В социальных и политических исследованиях результат наблюде­ний, подтверждающий справедливость выдвинутой гипотезы, крайне редко выступает основанием для ее принятия как истинной, поскольку он может также сочетаться и с рядом других объяснительных гипотез.

Тест хи-квадрат используется для двухвходовых таблиц сопряжен­ности. Схема проведения:

1. Строится таблица сопряженности

2. Затем формулируют нулевую и альтернативную гипо­тезы. Нулевая гипотеза (Hf) — утверждение, отрицающее зависимость между радами переменных. Альтернативная гипотеза (HJ — гипотеза о наличии связи между при­знаками.

3. Заполняется альтернатиная таблица по формуле: произведение соответ­ствующих маргинальных частот (значения строки и столбца) делят на общее число респондентов

4. Вычесление величины x-квадрат по формуле

Х2=Σ х (n-n1)2/n1

Уровень х-квадрат определяет вероятность отклонения исследуемого показателя.

46. Корреляционный анализ

Основные понятия корреляционного анализа

Выделяют несколько видов связи между переменными: Корреляционная зависимостьпредполагает взаимную согласован­ность изменений переменных величин, а также то, что эти изменения можно измерить однократно или многократно.

Функциональное воздействие предполагает, что изменения не­зависимой переменной сопровождаются все более ускоряющимися изменениями зависимой переменной. Функциональная зависимость — связь переменных, означающая, что изменение одной переменной оказывает воздействие на изменение другой, которая в свою очередь воздействует на первую переменную.

Корреляция — наличие статистической взаимосвязи признаков, когда каждому определенному значению одного признака X соответ­ствует определенное значение У.

Корреляционный анализ выясняет функциональную за­висимость между переменными величинами, которая характеризуется тем, что каждому значению одной из них соответствует вполне опреде- тенпое значение другой.

Различают парную и множественную корреляции. Парная корреля­ция характеризует тип, форму и плотность связи между двумя призна­ками, множественная — между несколькими.

Корреляционная зависимость возникает чаще всего там, где одно явление находится под воздействием большого числа факторов, дей­ствующих с разной силой, поэтому существуют специальные меры корреляционной связи, называемые коэффициентами корреляции.

Корреляционный анализ последовательно решает три практиче­ские задачи:

1) определение корреляционного поля и составление корреляци­онной таблицы;

2) вычисление выборочных корреляционных отношений или ко­эффициентов корреляции;

3) проверка статистической гипотезы значимости связи.

Коэффициент корреляции не содержит информации о том, явля­ется ли данная связь между ними причинно-следственной или сопут­ствующей.

Для установления корреляционной связи между двумя призна­ками необходимо доказать, что все другие переменные не оказывают воздействия на отношения двух переменных, являющихся предметом изучения.

Регрессионный анализ.

Регрессионный анализ — один из методов многомерного статисти­ческого анализа данных, объединяющий совокупность статистических приемов, предназначенных для изучения или моделирования связей между одной зависимой и несколькими (или одной) независимыми переменными.

Множественный регрессионный анализ – это метод установления зависимости одной переменной от двух или более независимых переменных. В то время как зависимая переменная (та переменная, которую Вы хотите предсказать) должна быть непрерывной (за исключением логистической регрессии), независимые переменные могут быть как прерывными, так и категориальными, такими как «пол» или «тип применяемого препарата». В случае категориальных независимых переменных необходимо будет создавать переменные «пустышки», а не использовать соответствующие значения.

Процедура:

возможно выполнение в 2 вариантах:

· стандарт­ном (когда одновременно учитываются все независимые переменные)

· пошаговом (прямом и обратном) вариантах.

С помощью прямого пошагового действия в регрессионном анализе последовательно включаются переменные — начиная с той, ко­торая наиболее тесно коррелирует с зависимой переменной. Процедура продолжается, пока включение новых независимых переменных обеспе­чивает прирост коэффициента множественной корреляции, тем самым определяется оптимальный максимальный набор переменных. При ис­пользовании обратного пошагового метода машина последовательно от­брасывает независимые переменные, которые наиболее слабо коррели­руют с зависимой переменной (т.е. обладают наименьшей объясняющей способностью), оставляя оптимальный минимум.

Современные статистические программы (например SPSS) позволяют рассчитывать не только различные варианты линейной регрессии, но и нелинейные регрессии. Однако при анализе данных, полученных с помощью опросов (и мас­совых, и экспертных), чаще всего используется модель линейной ре­грессии.

Наши рекомендации