Изучение взаимосвязи между несколькими переменными
Основные положения совпадают с требованиями к билету №43,увеличится лишь размерность таблицы и надо после раскрытия основных положений, сходных с билетом 43, -перечислить основные методики анализа связи между несколькими переменными- а именно- метод хи квадрат(билет 45), регрессионный анализ, корреляционный анализ, кластерный, анализ, сетевой анализ, факторный анализ.
45.Статистика хи-квадрат (х2)
Статистический анализ полученных с помощью массового опроса данных, как и анализ наблюдений изучаемого явления или статистических данных, включает несколько уровней сложности и возможностей получения дополнительной (скрытой) информации. В социальных и политических исследованиях результат наблюдений, подтверждающий справедливость выдвинутой гипотезы, крайне редко выступает основанием для ее принятия как истинной, поскольку он может также сочетаться и с рядом других объяснительных гипотез.
Тест хи-квадрат используется для двухвходовых таблиц сопряженности. Схема проведения:
1. Строится таблица сопряженности
2. Затем формулируют нулевую и альтернативную гипотезы. Нулевая гипотеза (Hf) — утверждение, отрицающее зависимость между радами переменных. Альтернативная гипотеза (HJ — гипотеза о наличии связи между признаками.
3. Заполняется альтернатиная таблица по формуле: произведение соответствующих маргинальных частот (значения строки и столбца) делят на общее число респондентов
4. Вычесление величины x-квадрат по формуле
Х2=Σ х (n-n1)2/n1
Уровень х-квадрат определяет вероятность отклонения исследуемого показателя.
46. Корреляционный анализ
Основные понятия корреляционного анализа
Выделяют несколько видов связи между переменными: Корреляционная зависимостьпредполагает взаимную согласованность изменений переменных величин, а также то, что эти изменения можно измерить однократно или многократно.
Функциональное воздействие предполагает, что изменения независимой переменной сопровождаются все более ускоряющимися изменениями зависимой переменной. Функциональная зависимость — связь переменных, означающая, что изменение одной переменной оказывает воздействие на изменение другой, которая в свою очередь воздействует на первую переменную.
Корреляция — наличие статистической взаимосвязи признаков, когда каждому определенному значению одного признака X соответствует определенное значение У.
Корреляционный анализ выясняет функциональную зависимость между переменными величинами, которая характеризуется тем, что каждому значению одной из них соответствует вполне опреде- тенпое значение другой.
Различают парную и множественную корреляции. Парная корреляция характеризует тип, форму и плотность связи между двумя признаками, множественная — между несколькими.
Корреляционная зависимость возникает чаще всего там, где одно явление находится под воздействием большого числа факторов, действующих с разной силой, поэтому существуют специальные меры корреляционной связи, называемые коэффициентами корреляции.
Корреляционный анализ последовательно решает три практические задачи:
1) определение корреляционного поля и составление корреляционной таблицы;
2) вычисление выборочных корреляционных отношений или коэффициентов корреляции;
3) проверка статистической гипотезы значимости связи.
Коэффициент корреляции не содержит информации о том, является ли данная связь между ними причинно-следственной или сопутствующей.
Для установления корреляционной связи между двумя признаками необходимо доказать, что все другие переменные не оказывают воздействия на отношения двух переменных, являющихся предметом изучения.
Регрессионный анализ.
Регрессионный анализ — один из методов многомерного статистического анализа данных, объединяющий совокупность статистических приемов, предназначенных для изучения или моделирования связей между одной зависимой и несколькими (или одной) независимыми переменными.
Множественный регрессионный анализ – это метод установления зависимости одной переменной от двух или более независимых переменных. В то время как зависимая переменная (та переменная, которую Вы хотите предсказать) должна быть непрерывной (за исключением логистической регрессии), независимые переменные могут быть как прерывными, так и категориальными, такими как «пол» или «тип применяемого препарата». В случае категориальных независимых переменных необходимо будет создавать переменные «пустышки», а не использовать соответствующие значения.
Процедура:
возможно выполнение в 2 вариантах:
· стандартном (когда одновременно учитываются все независимые переменные)
· пошаговом (прямом и обратном) вариантах.
С помощью прямого пошагового действия в регрессионном анализе последовательно включаются переменные — начиная с той, которая наиболее тесно коррелирует с зависимой переменной. Процедура продолжается, пока включение новых независимых переменных обеспечивает прирост коэффициента множественной корреляции, тем самым определяется оптимальный максимальный набор переменных. При использовании обратного пошагового метода машина последовательно отбрасывает независимые переменные, которые наиболее слабо коррелируют с зависимой переменной (т.е. обладают наименьшей объясняющей способностью), оставляя оптимальный минимум.
Современные статистические программы (например SPSS) позволяют рассчитывать не только различные варианты линейной регрессии, но и нелинейные регрессии. Однако при анализе данных, полученных с помощью опросов (и массовых, и экспертных), чаще всего используется модель линейной регрессии.