Использование критерия хи-квадрат для сравнения показателей внутри одной выборки

Критерий хи-квадрат может быть применен и для выявления сходства или различия внутри одной, но численно достаточно большой выборки. В этом случае вычленяются показатели (а их может быть два и больше), по которым и осуществляется сравнение. Этот аспект применения критерия xи-квадрат сближает его с коэффициентом корреляции, который также находит степень связи между двумя или большим числом признаков. Различие между этими двумя методами, прежде всего в том, что для подсчета коэффициента корреляции необходимо знать все величины сравниваемых признаков, а для использования критерия хи-квадрат важно знать только уровни (градации) сравниваемых признаков.

При сравнении показателей с помощью критерия хи-квадрат нулевая гипотеза Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru звучит так: сравниваемые признаки не влияют друг на друга. В терминах корреляционных отношений: между признаками связи нет, корреляция не отличается от нуля.

Соответственно альтернативная гипотеза Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru звучит следующим образом: сравниваемые признаки влияют друг на друга. В терминах корреляционных отношений: между признаками связь есть, корреляция значимо отличается от нуля.

В этих случаях применение критерия хи-квадрат основывается на использовании так называемых многопольных таблиц или, как их еще называют, таблиц сопряженности, т.е. таких таблиц, эмпирические данные в которых представлены размерностью большей, чем 2 ´ 2.

В этом случае расчет эмпирического значения критерия хи-квадрат может осуществляться по следующим двум формулам:

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

где Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru разность между эмпирическими и «теоретическими» частотами;

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru есть вычисленная, или «теоретическая» частота.

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

где k - число строк многопольной таблицы

т - число столбцов многопольной таблицы

N - общее число значений (элементов) в многопольной таблице, оно всегда является произведением N = k · т

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru - элементы многопольной таблицы

C_i - суммарные значения по строкам многопольной таблицы

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru - суммарные значения по столбцам многопольной таблицы

3адача 7. Влияет ли уровень интеллекта на профессиональные достижения?

Решение. (Первый способ решения по формуле 8.10). Для решения этой задачи 90 человек оценили по степени их профессиональных достижений и по уровню интеллекта. При разбиении на уровни (градации признака) по обоим признакам было взято три уровня. Для показателя профессиональных достижений были получены следующие частоты признака: 20 человек с высоким уровнем профессиональных достижений, 40 со средним и 30 с низким. Первая группа составляет 22,2% выборки, вторая – 44,4% и третья – 33,3% от всей выборки. При разбиении по уровню интеллекта было взято три равных по численности группы, в каждой по 30 человек: уровень интеллекта ниже среднего, средний и выше среднего. В процентах каждая группа составляет 33,3% от всей выборки. Все эмпирические данные (частоты) представлены ниже в таблице 8.14:

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Для удобства каждая ячейка таблицы обозначена соответствующей латинской буквой: А, В, С ит.д. Таблица 8.14 устроена следующим образом: в ячейку, обозначенную символом А, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают следующей характеристикой: ниже среднего по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось 20. В ячейку, обозначаемую символом В, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают характеристикой: средние по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось 5. В ячейку, обозначенную символом С, заносятся эмпирические частоты (или число) тех испытуемых, которые одновременно обладают характеристикой: выше среднего по уровню профессиональных достижений и ниже среднего по интеллекту. Таких испытуемых (эмпирических частот) оказалось также 5. Заметим, что 20 + 5 + 5 = 30, т.е. числу испытуемых, имеющих уровень интеллекта ниже среднего. Подобные «разбиения» были проделаны для каждой ячейки таблицы 8.14. Подчеркнем, что в круглых скобках в каждой ячейке таблицы представлены вычисленные для этой ячейки «теоретические» частоты.

Покажем, как для каждой ячейки таблицы 8.14 найти соответствующую «теоретическую» частоту. Для каждого столбца таблицы подсчитываются так называемые «частости» в процентах:

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Полученные величины «частостей» дают возможность подсчитать «теоретические» частоты для каждой ячейки таблицы 8.14. Они служат основой для подсчета «гипотетических» (а по сути теоретических) частот, т.е. таких частот, которые при заданном соотношении экспериментальных данных должны были бы быть расположены в соответствующих ячейках таблицы 8.14. (Вспомним решение задачи 8.5).

Согласно этому положению «теоретическая» частота для ячейки А подсчитывается следующим образом. 30 человек имеют уровень интеллекта ниже среднего, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями ниже среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru .

Аналогично «теоретическая» частота для ячейки D считается следующим образом: 30 человек имеют средний уровень интеллекта, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru .

Аналогично «теоретическая» частота для ячейки G считается следующим образом: 30 человек имеют высокий уровень интеллекта, поэтому 33,3% от этого числа должны были бы попасть в группу с профессиональными достижениями выше среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru .

Рассмотрим, как производится подсчет для ячейки В: 30 человек имеют низкий уровень интеллекта, поэтому 44,4% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru .

Аналогично, производится подсчет для ячейки Е: 30 человек имеют средний уровень интеллекта, поэтому 44,4% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Аналогично, производится подсчет для ячейки Н: 30 человек имеют уровень интеллекта выше среднего, поэтому 44,4% от этого числа должны были бы попасть в группу с профессиональными достижениями среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Рассмотрим, наконец, как производится подсчет для ячейки С: 30 человек имеют низкий уровень интеллекта, поэтому 22,2% от этого числа должны были бы попасть в группу с профессиональными достижениями выше среднего уровня. Находим эту «гипотетическую» величину так: Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Расчет «теоретических гипотетических» частот для оставшихся ячеек проведите самостоятельно.

Проверим правильность расчета «теоретических» частот для всех столбцов таблицы 8.14: 10 + 10 + 10 = 30; 13,3 + 13,3 + 13,3 = 39,9 ≈ 40; 6,7 + 6,7 + 6,7 = 20,1 ≈ 20.

Теперь все готово для использования формулы (8.1).

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Для проверки правильности расчета «теоретических» частот в случае сравнения двух эмпирических наблюдений (см. раздел 8.2) или для сравнения показателей внутри одной выборки может использоваться следующая формула (8.12):

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Проверим по этой формуле правильность наших расчетов:

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Число степеней свободы подсчитаем по знакомой формуле: v = (k - 1) · (с – 1) = (3 – 1) · (3–1) = 4, где k - число строк, а с - число столбцов и в соответствии с таблицей 12 Приложения 1 находим:

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Полученные эмпирическая величина критерия хи-квадрат попала в зону значимости. Иными словами, следует принять гипотезу Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru о том, что уровень интеллекта влияет на успешность профессиональной деятельности.

Решение. (Второй способ решения по формуле 8.11).

Подставим данные таблицы 8.14 в формулу (8.11) получим:

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки - student2.ru

Как и следовало ожидать, эмпирическое значение xи-квадрат получено то же самое, что и при первом способе решения. Все дальнейшие операции уже проделаны выше при первом способе решения данной задачи, поэтому не будем их повторять. Безусловно, что второй способ существенно проще первого, однако, при расчетах по формуле (8.11) можно легко допустить ошибки. Подчеркнем, что как первый, так и второй способы расчета эмпирического значения хи-квадрат позволяют работать с таблицами практически любой размерности: 3 ´ 4, 4 ´ 4, 5 ´ 3, 5 ´ 6 и т.п.

Наши рекомендации

Вычисление критерия хи-квадрат

Пример (используем те же выборки, что и для сравнения дисперсий)

После изучения материала этой главы вы должны уметь... 1. Показать отличие выборки от генеральной совокупности и определить критерии, определяющие целесообразность использование выборки или генеральной

Проверка нормальности эмпирического распределения с помощью критерия Пирсона (хи-квадрат) и коэффициентов асимметрии и эксцесса.

Проверка статистической гипотезы требует выбора статистического критерия, адекватного методике измерений и особенностям выборки

Понятие статистического критерия. Экспериментальное и теоретическое значение критерия. Критическая область. Использование p-value в статистических программах, истолкование его значений.

Условия и ограничения применения критерия хи-квадрат Пирсона

Как интерпретировать значение критерия хи-квадрат Пирсона?

Использование критерия хи-квадрат для сравнения показателей внутри одной выборки

Описание показателей и критерия оценивания компетенций

← Предыдущая страница | Следующая страница →