Глава 3. Психологическое измерение и статистический анализ экспериментальных данных.

Основные понятия: измерение, шкала, типы шкал, тесты и их виды: интеллектуальные, личностные и тесты межличностных отношений; тесты практические, образные и словесно-логические; тесты бланковые и аппаратурные; процессуальные тесты, тесты достижений, состояний и свойств; проективные тесты; социокультурная адаптация теста; стандартизированность теста; тестовая норма; валидность: теоретическая, эмпирическая, внутренняя, внешняя; надежность теста; коэффициенты надежности правила тестирования; социально-этические требования к тестированию.

3.1. Понятие о психологическом измерении и его специфика

Измерениевключается в контекст эксперимента как метод регистрации состояния объекта исследования и изменения этого состояния в ответ на экспериментальное воздействие. Внешне процедура психологического измерения не отличается от процедуры психологического эксперимента. Однако при проведении эксперимента выявляются причинные связи между переменными, а при психологическом измерении испытуемого или оцениваемый им объект относят к той или иной точке шкалы или пространству признаков. Измерение позволяет представить психические явления в количественных понятиях. Количественные понятия позволяют формулировать количественные законы.

Проблема измерений имеет общенаучное значение. Но измерение в физике отличается от измерения в психологии. В физике взаимодействие исследователя и предмета измерения опосредовано прибором, а в психологии таким «прибором» является организация психологического эксперимента. Раздражители (стимулы) отражаются человеческой психикой и психологическое измерение заключается в том, чтобы получить количественные соотношения между психическими образами, возникающими в ответ на эти стимулы. Таким образом, спецификой психологического измерения является отсутствие общепринятых моделей объясняющих механизм психологической оценки.

Использование метода измерения позволяет понять мир в совокупности качественных и количественных характеристик. Количественное описание психических явлений обеспечивает точность вывода и возможность формулировки законов, отражающих существенные отношения между явлениями. Наука создает модель реального мира, а измерение служит инструментом проверки и коррекции созданных моделей. Выводы из этих моделей служат основой для предсказания событий в реальном мире.

Именно статистический подход явился средством преобразования психологии в точную науку. Логические основания психологического измерения не изучались до конца 19 –начала 20 века, когда Г. Гельмгольц изложил основные идеи теории измерения. В это же время Д. Кеттелл говорил о том, что психология станет прочной и точной наукой, если будет основываться на эксперименте и измерении. С этого времени математика стала активно внедряться в психологическое исследование.

В психологии используются параметрические и непараметрические математические методы.

Сравнение двух выборок по признаку, измеренному в метрической шкале обычно предполагает сравнение средних значений с использованием параметрического критерия t-Стъюдента. Следует различать три ситуации по соотношению выборок между собой: случай независимых и зависимых выборок (измерений признака) и дополнительно — случай сравнения одного среднего значения с заданной величиной (критерий r-Стьюдента для одной выборки).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера. Иногда этот метод приводит к ценным содержательным выводам, а в случае сравнения средних для независимых выборов сравнение дисперсий является обязательной процедурой.

При сравнении средних или дисперсии двух выборок проверяется ненаправленная статистическая гипотеза о равенстве средних (дисперсий) генеральной совокупности. Соответственно, при ее отклонении допустимо принятие двусторонней альтернативы о конкретном направлении различий в соответствии с соотношением выборочных средних (дисперсий). Для принятия статистического решения в таких случаях применяются двусторонни критерии и, соответственно, критические значения для проверки ненаправленных альтернатив.

К методам сравнения выборок при проверки статистических гипотез о различии выборок по уровню выраженности признака, измеренного в количественной шкале относятся непараметрические методы. Непараметрические методы сравнения выборок являются аналогами параметрических методов сравнения средних значений. И почти каждый параметрический метод сравнения средних быть при необходимости заменен своим непараметрическим аналогом либо сочетанием непараметрических методов.

Непараметрические методы заметно проще в вычислительном отношении, чем их параметрические аналоги. До недавнего прошлого простота вычислений имела существенное значение при обработке данных «вручную». Компьютерная обработка снимает эту проблему. Поэтому при выборе между параметрическими и непараметрическими методами следует исходить из свойств самих данных.

Непараметрические аналоги параметрических методов сравнения выборок применяются в случаях, когда не выполняются основные предположения лежащие в основе параметрических методов сравнения средних значений.

При решении вопроса о выборе параметрического или непараметрического метода сравнения необходимо иметь в виду, что параметрические методы обладают заведомо большей чувствительностью, чем их непараметрические аналоги. Поэтому исходной ситуацией является выбор параметрического метода. И решение о применении непараметрического метода становится оправданным, если не выполняются исходные предположения, лежащие в основе применения параметрического метода.

Условия, когда применение непараметрических методов является оправданным:

1. есть основания считать, что распределение значений признака в генеральной совокупности не соответствует нормальному закону;

2. есть сомнения в нормальности распределения признака в генеральной совокупности, но выборка слишком мала, чтобы по выборочному распределению судить о распределении в генеральной совокупности;

3. не выполняется требование гомогенности дисперсии при сравнении средних значений для независимых выборок.

На практике преимущество непараметрических методов наиболее заметно, когда в данных имеются выбросы (экстремально большие или малые значения).

Если размер выборки очень велик (больше 100), то непараметрические методы сравнения использовать нецелесообразно, даже если не выполняются некоторые исходные предположения применения параметрических методов. С другой стороны, если объемы сравниваемых выборок очень малы (10 и меньше), то результаты применения непараметрических методов можно рассматривать лишь как предварительные.

Структура исходных данных и интерпретация результатов применения для параметрических методов и их непараметрических аналогов являются идентичными.

При сравнении выборок с использованием непараметрических критериев, как и в случае параметрических критериев, обычно проверяются ненаправленные статистические гипотезы. Основная (нулевая) статистическая гипотеза при этом содержит утверждение об идентичности генеральных совокупностей (из которых извлечены выборки) по уровню выраженности изучаемого признака. Соответственно, при ее отклонении допустимо принятие двусторонней альтернативы о конкретном направлении различий в соответствии с выборочными данными. Для принятия статистического решения в таких случаях применяются двусторонние критерии и, соответственно, критические значения для проверки ненаправленных альтернатив.

Как уже было сказано выше, понятия психологический эксперимент и психологическое измерение во многом совпадают. Стимульный материал провоцирует работу психики. Критерий оценки определяет формирование соответствующей психической системы и построение субъективной модели объекта измерения. Инструкция диктует испытуемому выбор стратегии поведения, на основе которой он принимает решение. На множестве зарегистрированных и формализованных решений строится собственно психологическая шкала. Процесс измерения включает три этапа:

- определение предмета психологического измерения;

- отображение результата психического отражения в формальное множество. Этим множеством может быть: множество действительных чисел – количественная оценка; множество качественных признаков – метод категорий; множество дихотомических реакций – метод парных сравнений.

Построение психологической шкалы, называемый шкалированием. Стивенсоном предложено четыре типа измерительных шкал, которые разграничивают наборы допустимых статистических операций, применяемых для обработки результатов. С математической точки зрения измерением называется операция установления взаимно однозначного соответствия множества объектов и символов. Символы (числа) приписываются объектам по определенным правилам. Правила, на основании которых числа приписываются объектам, определяют шкалу измерения. Шкала в свою очередь характеризуется видом преобразований, которые могут быть отнесены к результатам измерения. Если не соблюдать эти правила, то структура шкалы нарушится, а данные измерения нельзя будет осмысленно интерпретировать.

Шкала в буквальном значении есть измерительный инструмент. Существуют следующие основные типы шкал: наименований, порядка, интервалов, отношений.

Шкала наименований получается путем присвоения отличительных «имен», «знаков» объектам. Множество объектов делится на непересекающиеся подмножества (классы). Объекты одного класса эквивалентны друг другу и отличны от объектов других классов. Эквивалентным объектам присваиваются одинаковые имена. В шкале наименований не применяются арифметические операции.

Шкала порядка (ординарная, ранговая) образуется, если на подмножестве объектов реализовано одно бинарное отношение-порядок (отношение не больше и не меньше). На шкале порядка объект может находиться между двумя другими и соблюдается правило транзитивности: если «А» больше «В», а «В» больше «С», то «А» больше «С». В шкале порядка можно применять операции больше, меньше, равно.

Шкала интервалов определяет величину различий между объектами в проявлении свойства. С помощью шкалы можно сравнивать два объекта. При этом выясняется, насколько интенсивно выражено определенное свойство у одного объекта по сравнению с другим. В данной шкале применимы все статистики, основанные на вычислении среднего, оценке среднеквадратичного отклонения, расчете коэффициента корреляции.

Шкала отношений - это шкала, классифицирующая объекты или субъекты пропорционально степени выраженности измеряемого свойства. Классы обозначаются числами, которые пропорциональны друг другу. Эта шкала отличается от шкалы интервалов тем, что в ней определено положение «естественного» нуля.

Кроме этих типов шкал существуют и другие. Об этих шкалах и о возможных вариантах шкальных преобразований можно прочитать в специальной литературе.

2.3. Психометрия как метод измерения. Тесты, их виды

Психологическое тестирование - это метод измерения и оценки психологических характеристик носителей психики с помощью специальных методик, называемых тестами. Тестами в психологии называют стандартизированные методики, позволяющие получить сопоставимые качественные и количественные показатели степени развитости изучаемых свойств. Под стандартизированностью методик понимают то, что они всегда и везде должны применяться одинаковым образом, начиная от ситуации и инструкции, стимульного материала, кончая способами вычисления и интерпретации получаемых показателей.

Существует много разновидностей тестов, которые разделяются на группы по нескольким основаниям:

· по предмету тестирования различают: интеллектуальные (уровень развития мышления и отдельных когнитивных процессов), личностные (тесты темперамента, характера, мотивации, эмоций, способностей) и межличностные (тесты оценки человеческих отношений в различных социальных группах);

· по особенностям используемых задач выделяют: практические (задачи и упражнения, которые испытуемый должен выполнить в наглядно-действенном плане, манипулируя реальными предметами или их заменителями), образные (упражнения с образами, картинками, рисунками, схемами) и словесно-вербальные тесты (задания на оперирование словами);

· по характеру тестового материала различают: бланковые и аппаратурные тесты;

· по объекту оценки выделяют: процессуальные (исследуется какой-либо психологический или поведенческий процесс и дается его качественная или количественная характеристика), тесты достижений (оцениваются успехи человека в том или ином виде деятельности, сфере познания, например, продуктивность памяти, устойчивость внимания и т.д.), тесты состояний и свойств (диагностика стабильных качеств человека, например, черты личности, свойства темперамента и т.п.).

Среди тестов встречаются такие, которые дают разностороннюю, комплексную оценку состояния личности (тест Кеттела). В особую группу выделяются проективные тесты. Они основаны не на прямой, а на косвенной оценке психологических качеств человека. Человеку предлагается интерпретировать некоторые многозначные объекты: сюжетно-неопределенные картинки, бесформенные пятна, незавершенные предложения и т.д. В интерпретацию человек «проецирует» самого себя.

К тестам и процедуре тестирования предъявляются следующие требования:

·Социокультурная адаптация теста, то есть соответствие тестовых заданий особенностям культуры, сложившимся в обществе.

·Простота формулировок и однозначность тестовых заданий. В задании не должно быть таких моментов, которые могут по разному восприниматься людьми.

·Ограниченное время выполнения тестового задания. Полное время работы не должно превышать 1.5-2 часов.

·Наличие тестовых нормдля данного теста. Норма теста - это средний уровень развития какого-либо свойства у большой совокупности людей, похожих на данного испытуемого. Всякая норма со временем изменяется, поэтому каждые пять лет их необходимо пересматривать. В каждом тесте должно быть указано где, как, на ком и когда была рассчитана норма.

· Методика должна обладать валидностью,т. е.быть пригодной для оценивания именно того психологического качества, для которого она предназначена по замыслу. Различают несколько видов валидности.

Валидность теоретическая определяется по соответствию показателей исследуемого качества, получаемых с помощью данной методики, показателям, получаемым посредством других методик. Данный вид валидности проверяют по корреляциям показателей одного и того же свойства, полученных при тестировании разными тестами.

Валидность эмпирическая (практическая) проверяется по соответствию диагностических показателей реальному поведению, наблюдаемым действиям испытуемого.

Валидность внутренняя означает соответствие содержащихся в методике заданий общей ее цели и замыслу.

Валидность внешняя означает соответствие показателей методики наиболее важным внешним признакам поведения испытуемых.

·Надежность методики характеризует возможность получения с ее помощью устойчивых показателей (устойчивость зависимую от измерительного инструмента, а не от испытуемого или экспериментатора). Смысл этого понятия заложен в трех видах коэффициентов: коэффициент надежности – определяется путем корреляции результатов частей теста; коэффициент стабильности – определяется путем корреляции результатов первичного повторного тестирования одних и тех же испытуемых; коэффициент константности – определяется корреляцией двух результатов измерения одним и тем же тестом одних и тех же испытуемых разными психодиагностами.

Прежде чем применять какой-либо тест исследователь должен познакомиться с ним и апробировать его на себе или другом человеке, чтобы избежать ошибок в процедуре тестирования. Перед началом работы необходимо убедиться в том, что испытуемые хорошо поняли задание и инструкцию. Перед началом тестирования испытуемым необходимо объяснить, для чего предназначен тест, с какой целью проводится тестирование, какие данные получатся в результате и каким образом они могут быть использованы в жизни. Результаты тестирования обязательно выдаются и предоставляются испытуемому в доступной форме.

Во время проведения тестирования необходимо следить, чтобы все испытуемые работали самостоятельно и не оказывали друг на друга влияния, способного изменить результаты тестирования.

При обработке и интерпретации результатов необходимо использовать строго установленные приемы математико-статистической обработки данных.

К психодиагностике и психодиагностам предъявляется ряд социально-этических требований.

·Принцип соблюдения тайны- неразглашение результатов без персонального согласия испытуемого. Исключение составляют случаи использования психодиагностики в научных целях. В этом случае не указываются имена испытуемых.

·Принцип научной обоснованности. Методика должна быть валидной и надежной.

·Принцип не нанесения ущерба. Результаты нельзя использовать во вред человеку.

·Принцип объективности выводов. Выводы не должны зависеть от субъективных установок исследователя.

Контрольные вопросы:

1. Что такое психологическое измерение? Каково значение измерения в психологии?

2. Чем существенно отличается измерение в физике от психологического измерения?

3. В чем состоит различие между параметрическими и непараметрическими методами статистики?

4. Перечислите типы шкал, используемых в психологическом измерении.

5. Что такое тест? Назовите виды тестов.

6. Охарактеризуйте требования, предъявляемые к современным методам психодиагностики.

7. Что такое валидность методики и какие виды валидности вы знаете?

8. Что такое надежность методики? Назовите коэффициенты, характеризующие надежность теста.

9. Какие социально-этические требования предъявляются к психодиагностике и психодиагностам?

10. Перечислите этапы процесса измерения.

Наши рекомендации

Анализ экспериментальных данных

Статистический анализ экспериментальных данных

Статистический анализ данных.

Анализ экспериментальных данных

Статистический анализ данных

Анализ экспериментальных данных

Глава 3. Статистический анализ экспериментальных данных

Статистический анализ данных.

Статистический анализ данных

← Предыдущая страница | Следующая страница →