Интервальная оценка коэффициента корреляции
корреляционная регрессия уравнение математический
При построении доверительного интервала для неизвестного коэффициента корреляции используется специальная функция -
-преобразование Фишера (гиперболический арктангенс) выборочного коэффициента корреляции r:
.
- возрастающая нечетная функция: z(-r) = -z(r).
Распределение вероятностей значений приближается (тем более точно, чем больше объем выборки n) нормальным распределением вероятностей
с параметрами:
и
.
Статистика имеет асимптотическое стандартное нормальное распределение
.
Асимптотически точный доверительный интервал надежности для нормированного отклонения z:
,
где - квантиль уровня
распределения
, т.е. корень уравнения
.
Доверительный интервал для математического ожидания :
.
Величиной в выражении
можно пренебречь, принимая во внимание, что она при
есть бесконечно малая более высокого порядка в сравнении с
.
Доверительный интервал для гиперболического арктангенса коэффициента корреляции :
.
14.Связь номинальных признаков. Таблицы сопряженности. Коэффициент ассоциации Пирсона.
Коэффициент сопряженности признаков (Пирсона)Его величина всегда находится в пределах от 0 до 1 и вычисляется (как и значения критериев Фишера (<р) и Крамера (V)) с использованием значения критерия хи-квадрат:
Таблицы сопряженности
l В статистическом анализе существуют различные методы, позволяющие изучать взаимосвязи номинальных признаков.
l Наиболее популярным из них является метод построения таблиц сопряженности (кросс-табуляция).
l Таблицей сопряженности называется прямоугольная таблица, по строкам которой указываются категории одного признака, а по столбцам – категории другого.
l Каждый объект совокупности попадает в какую-либо из клеток этой таблицы в соответствии с тем, к какой категории он относится по каждому из двух признаков.
l Таким образом, в клетках таблицы стоят числа, представляющие собой частоты совместной встречаемости категорий двух признаков (например, число людей, принадлежащих конкретной социальной группе и при этом входящих в определенную партию).
l В зависимости от характера распределения этих частот внутри таблицы можно судить о том, существует ли связь между признаками.
l Что означает связь между признаками?
l В данном примере: что означает связь между социальным статусом и партийной принадлежностью?
l Видимо, в этом случае о существовании связи свидетельствовало бы наличие определенных политических пристрастий у членов разных социальных групп.
l Формально говоря, связь номинальных признаков понимается как более частая (или наоборот, более редкая) совместная встречаемость отдельных комбинаций категорий по сравнению с ожидаемой встречаемостью – ситуацией чисто случайного распределения объектов по категориям двух признаков.
l Например, о связи между социальным статусом и партийной принадлежностью может свидетельствовать более высокая доля крестьян в партии трудовиков по сравнению с долей крестьян среди всех депутатов Думы (или же более высокая доля трудовиков среди крестьян по сравнению с долей трудовиков во всей Думе).
l Аналогично: о связи между социальным статусом и партийной принадлежностью может свидетельствовать более высокая доля дворян в партии кадетов по сравнению с долей дворян среди всех депутатов Думы (или же более высокая доля кадетов среди дворян по сравнению с долей кадетов во всей Думе).
15.Связь порядковых признаков. Коэффициент корреляции рангов Спирмена.
Коэффициент ранговой корреляции Спирмена
Расчет коэффициента ранговой корреляции Спирмена
Таблица критических значений коэффициента ранговой корреляции Спирмена