Возможности и ограничения параметрических и непараметрических критериев

Параметрические критерии Непараметрические критерии
1. Позволяют прямо оценить различия в средних, полученных в двух выборках (Меритерий Стьюдента) 1. Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а выборке Б — более низкие значения признака (критерии Q, U, j и др.)
2. Позволяют прямо оценить различия в дисперсиях (критерий Фишера) 2. Позволяют оценить лишь различия в диапазонах вариативности признака (критерий j)
3. Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака 3. Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S)
4. Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ) 4. Эта возможность отсутствует
5. Экспериментальные данные должны отвечать двум, а иногда трем условиям: а) значения признака измеряны по интервальной шкале; б) распределение признака является нормальным; в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса 5. Экспериментальные данные могут не отвечать ни одному из этих условий: а) значения признака могут быть представлены в любой шкале, начиная от шкалы наименований; б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке; в) требование равенства дисперсий отсутствует
6. Математические расчеты довольно сложны 6. Математические расчеты по большей части просты и занимают мало времени (за исключением критериев %~ и X)
7. Если условия, перечисленные в п. 5, выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические 7. Если условия, перечисленные в п. 5, не выполняются, непараметрические критерии оказываются более мощными, чем параметрические, т. к. они менее чувствительны к «засорениям»

Из табл. 27 мы видим, что параметрические критерии могут оказаться несколько более мощными, чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. С интервальной шкалой есть определенные проблемы. Лишь с некоторой натяжкой мы можем считать данные, представленные не в стандартизованных оценках, как интервальные. Кроме того, проверка распределения «на нормальность» требует достаточно сложных расчетов, результат которых заранее не известен. Может оказаться, что распределение признака отличается от нормального, и нам так или иначе все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном — с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.

Оценка достоверности различий

Одной из наиболее часто встречающихся задач при обработке данных является оценка достоверности различий между двумя или более рядами значений. В математической статистике существует ряд способов для этого. Для использования большинства мощных критериев требуются дополнительные вычисления, обычно весьма развернутые.

Обсуждая обработку данных, я ориентируюсь на компьютерный ее вариант, который стал в настоящее время наиболее распространенным. Во многих прикладных статистических программах есть процедуры оценки различий между параметрами одной выборки или разных выборок. При полностью компьютеризованной обработке материала нетрудно в нужный момент использовать соответствующую процедуру и оценить интересующие различия. Однако большинство психологов не имеют свободного и неограниченного доступа для работы с компьютером — либо недостаточен парк ЭВМ, либо психолог как пользователь ЭВМ неподготовлен и может проводить обработку только с помощью квалифицированного персонала. И в том, и в другом случае типичный сеанс работы с компьютером заканчивается тем, что психолог получает принтерные распечатки, содержащие подсчитанные первичные статистики, результаты корреляционного- анализа, иногда и факторного (компонентного), который представляются в таблицах.

Пример. Изучение достоверности различий показателей между медсестрами со средним и высоким уровнями посреднического потенциала по U критерию Mann-Whitney при Р < 0,05 и Р < 0,01 показало, что существуют статистически значимые различия по следующим показателям (табл. 28).

Таблица 28

Достоверность различий показателей в группах медсестер с высоким и средним уровнями посреднического потенциала

Номер переменной « Показатели Средний показатель Критерии достоверности
I гр. м/с СПП 2 гр, м/с ВПП U Р
Фактор А: добросердечность-отчужденность (16 PF) 2,6 6,9 19,5 0,01
Фактор Е: доминантность-подчиненность (16 PF) 5,28 6,9 0,05
Фактор Н: смелость-робость (16 PF) 2,1 3,9 31,5 0,05
Фактор J: мягкость-твердость (16 PF) 2,6 5,7 0,01
Фактор Q1: радикализм-консерватизм 2,5 5,6 24,5 0,01
Авторитарный тип отношения к окружающим 4,7 6,3 0,05
Социально-психологические характеристики (ППР) 4,98 5,55 0,01
Операциональные характеристики 5,35 6,0 0,01

Таким образом, для медсестер с высоким уровнем посреднического потенциала характерны общительность и добродушие. Им свойственны естественность и непринужденность поведения (А = 6,9), они охотно работают с людьми, активны в устранении конфликтов (А - 6,9).

Для медсестер со средним уровнем посреднического потенциала характерны формальность в контактах, некоторая ригидность и излишняя строгость в оценке людей (А - 2,6).

Все эти манипуляции позволяют, во-первых, обнаружить и ликвидировать ошибки, совершенные при фиксации данных и, во-вторых, выявить и изъять из общего массива нелепые данные, полученные в результате нарушения процедуры обследования, несоблюдения испытуемыми инструкции и т. п. Кроме того, первично обработанные данные, представая в удобной для обозрения форме, дают исследователю в первом приближении представление о характере всей совокупности данных в целом: об их однородности — неоднородности, компактности — разбросанности, четкости — размытости и т. д. Эта информация хорошо читается на наглядных формах представления данных и связана с понятиями «распределение данных».

К основным методам первичной обработки относятся: табулирование,то есть представление количественной информации в табличной форме, и построение диаграмм, гистограмм, полигонов распределенияи кривых распределения.Диаграммы отражают распределение дискретных данных, остальные графические формы используются для представления распределения непрерывных данных.

От гистограммы легко перейти к построению частотного полигона распределения,а от последнего — к кривой распределения.Частотный полигон строят, соединяя прямыми отрезками верхние точки центральных осей всех участков гистограммы. Если же вершины участков соединить с помощью плавных кривых линий, то получится кривая распределения первичных результатов. Переход от гистограммы к кривой распределения позволяет путем интерполяции находить те величины исследуемой переменной, которые в опыте не были получены.

Вопросы для обсуждения

1. Назовите основные методы первичной обработки.

2. Определите отличия параметрических и непараметрических методов статистики.

3. В чем смысл проведения оценки достоверности различия показателей испытуемых?

Литература

1. Куликов Л. В. Психологическое исследование. — СПб., 2001.

2. Никандров В. В. Неэмпирические методы психологии. — СПб., 2003.

3. Математические методы анализа и интерпретация социологических данных. — М., 1989.

4. Сидоренко Е. В. Методы математической обработки в психологии. - СПб., 1996.

5. Тютюнник В. И. Основы психологических исследований. — М., 2002.

Наши рекомендации