Данные экзамена по статистике

Количество часов подготовки Балл на экзамене (правильные ответы из 100 вопросов)

Решение:

Очевидно, что количество часов напрямую отражается на финальной оценке. Переменная «Часы подготовки» (х) является независимой переменной, т.к. она приводит к наблюдаемой вариации переменной «Балл на экзамене» (у). Причинная связь между зависимыми и независимыми переменными существует только в одном направлении: Независимая переменная (х)→ Зависимая переменная (у). В обратном направлении эта связь не работает.

Коэффициент корреляции Пирсона (r)вычисляется при помощи следующего уравнения

Данные экзамена по статистике - student2.ru

Таблица, приведенная ниже, поможет разбить это уравнение на несколько несложных вычислений.

Часы изучения х Балл на экзамене у Расчеты
ху х2 у2
Данные экзамена по статистике - student2.ru Данные экзамена по статистике - student2.ru Данные экзамена по статистике - student2.ru Данные экзамена по статистике - student2.ru =79 Данные экзамена по статистике - student2.ru

Используя эти значения и n=6 (общее количество студентов), получаем:

Данные экзамена по статистике - student2.ru

Данные экзамена по статистике - student2.ru

Теперь рассчитаем среднюю ошибку коэффициента корреляции

Данные экзамена по статистике - student2.ru

Установим, надежной, ли является установленная нами связь

Данные экзамена по статистике - student2.ru

Т.к.tr≥3, то коэффициент корреляции является статистически значимым.

Таким образом, между числом часов, посвященных изучению предмета, и экзаменационной оценкой существует статистически значимая сильная положительная (прямая)корреляция. Отсюда следует, что экзаменационные результаты можно предугадать на основе определенного количества часов, посвященных изучению предмета.

Коэффициент корреляции Спирмэна

Ранговый коэффициент корреляции Спирмэна (rs)– непараметрический аналог корреляционного коэффициента Пирсона.

Применение этого коэффициента корреляции может быть рекомендовано в случаях:

• когда необходимо быстро ориентировочно определить связь между какими-то признаками;

• если необходимо оценить связь между качественными (ранговыми)и количественными признаками или только между качественными признаками;

• когда распределение значений учетных признаков (в том числе и количественных)не соответствует нормальному распределению или распределение неизвестно.

Вычисление:

1. Располагают величины х в возрастающем порядке, начиная с наименьшей величины, и придают им последовательные ранги (номера 1, 2, 3, .., n). Равные варианты получают среднее значение из суммы их порядковых номеров.

2. Подобным образом ранжируют у.

3. Рассчитывается rs — коэффициент корреляции между рангами х и у по формуле:

Данные экзамена по статистике - student2.ru

где Данные экзамена по статистике - student2.ru – разности между рангами соответствующих пар yи x;

n – число сопоставляемых пар.

Пример расчета коэффициента корреляции Спирмэна.

Необходимо определить по Таблице 2, существует ли связь между количеством часов, посвященных студентом подготовке к тестовому экзамену по статистике, и итоговым количеством правильных ответов (и, соответственно, итоговой оценкой). Тестирование включает в себя 100 вопросов из банка тестовых заданий.

Решение:

Составляем вариационный ряд xи ранжируем:

x
Rx 2.5 2.5 4.5 4.5

Составляем вариационный ряд yи ранжируем:

y
Ry

Для удобства расчета заполняем следующую таблицу:

x
y
Rx 2.5 4.5 4.5 2.5
Ry
Ry- Rx 1.5 0.5 -1.5 -0.5
(Ry- Rx)2 2.25 0.25 2.25 0.25

Данные экзамена по статистике - student2.ru

Данные экзамена по статистике - student2.ru

Таким образом, получено, что исследуемая корреляционная связь является прямой и сильной.

В ходе корреляционного анализа или анализа корреляционной связи решается целая группа взаимосвязанных задач:

1) Установление направления (прямая или обратная) и формы (линейная или нелинейная) корреляционной связи.

2) Оценка тесноты (силы, плотности) корреляционной связи.

3) Оценка репрезентативности статистических оценок взаимосвязей, полученных по выборочным данным (величина ошибки, доверительный интервал, уровень значимости).

4) Установление величины детерминации (доли взаимовлияния) коррелируемых факторов.

Таким образом, статистические методы изучения связи между переменными зависят от:

· характера переменных (качественные, количественные)

· характера распределения количественных переменных (нормальное, ненормальное, неизвестное)

· числанаблюдений (большое, малое)

· взаимоотношения между наблюдениями (зависимые, независимые).

Статистические методы изучения связи между переменными могут быть:

· однофакторными, т.е. принимающими во внимание только взаимоотношения между двумя анализируемыми переменными

· многофакторными, т.е. учитывающими влияние на изучаемую связь между двумя переменными со стороны некоторых других переменных.

Наши рекомендации