Критерии качества измерения.

Достоверность результатов исследования зависит, в основном, от качества первичного измерения социальных характеристик. Качество отдельных индикаторов, суммарных показателей (индексов) и шкал определяются их надежностью и валидностью.

2.

Надежность измерения – его устойчивость и воспроизводимость.

Повторяемость (диахронная, ретестовая надёжность)

Отражает результаты повторного применения одного и того же показателя для одной и той же выборки случаев в разные моменты времени.

Повторное измерение

Согласованность

Отражает меру согласованности результатов измерения одного показателя несколькими индикаторами

Расщепление шкалы

Проверка корреляции с суммарным баллом

Факторный анализ

Путевой анализ

Повторное измерение: Один и тот же объект измеряется дважды с двух-трехнедельным временным интервалом с помощью одинаковой процедуры. Шкала считается устойчивой, если совпадения между первой и второй сериями измерений будут достаточно высокими (коэффициент корреляции должен быть не ниже 0,8).

Недостатки повторного измерения:

1. Сложность проведения повторных замеров на больших выборках.

2. Не учитывается тот факт, что истинное значение переменной с течением времени может изменяться.

3. Влияние на ответы респондентов психологической установки, возникшей после предыдущего замера (стремление дать исследователю “новые данные”).

Расщепление шкалы: Индикаторы - вопросы, предположительно измеряющие ту или иную характеристику, в случайном порядке разбиваются на два равных списка и предъявляется группе испытуемых. Далее подсчитывается коэффициент корреляции между результатами одних и тех же испытуемых по разным "половинам" теста: чем выше его значение, тем согласованнее оценки истинного значения интересующей социолога переменной. В случае необходимости "выпадающие" индикаторы следует заменить, чтобы получить приемлемую корреляцию.

Проверка корреляции с суммарным баллом: определяется величина коэффициента корреляции каждого из индикаторов с суммарным значением индекса, высокое значение коэффициента говорит о пригодности конкретного индикатора.

Валидность (обоснованность) измерения, - соответствие измерения его цели.

Таким образом, валидность инструмента измерения состоит в однозначности и правильности получаемых результатов относительно измеряемого свойства объектов, т.е. относительно предмета измерения.

Валидность по содержанию

Определяет полноту операционализации теоретического понятия

1. Экспертная оценка

2. Метод параллельных панелей

3. Метод нескольких судей

Критериальная валидность

Показывает, насколько хорошо результаты по одному тесту или индикатору согласуются с результатами другого показателя, называемого критерием

1. Тест по "эталонной группе"

2. Поиск независимого критерия

3. Конструктная валидность

Метод параллельных панелей: Используется две или три группы специалистов, которые проводят всю процедуру валидации по содержанию, т.е. сравнивают существующие дефиниции, составляют список возможных индикаторов и оценивают их репрезентативность по отношению к исследуемой концептуально области. Если сравнение индикаторов, независимо отобранных в двух и более группах экспертов обнаруживает много совпадений, можно говорить о высокой содержательной валидности.

Метод нескольких судей: Используется в случаях, когда переменная-признак, которую предполагается измерить имеет многомерную структуру, т.е. относится сразу к нескольким предметным областям. Использование экспертов в каждой из этих областей позволяет выявить существенные факторы, входящие в шкалу, оценить их сравнительную значимость и найти релевантные эмпирические показатели.

Тест по "эталонной группе": Состоит в сопоставлении данных, полученных путем измерения по шкале, с достоверными сведениями об объекте измерения (переменная-предиктор). В качестве показателя критериальной валидности используется точность, с которой значения переменной, полученные по проверяемой шкале, могут быть предсказаны на основании текущих значений переменной-предиктора. Поэтому другое название процедуры валидации - прогностическая критериальная валидность. Например, шкала измеряющая отношение к соблюдению норм права может быть обоснована опросом осужденных правонарушителей (они рассматриваются как "эталон" негативного полюса шкалы), в сравнении с "эталонной" группой законопослушных граждан. Дихотомизация полярных групп по шкале должна совпадать с фактической поляризацией эталонной группы.

Поиск независимого критерия: Определяется степень соответствия между значениями измеряемой переменной и индикатором, имеющим доказанную обоснованность (сравнение ответов респондентов с данными статистики, и т.п). В качестве критерия могут быть использованы и результаты измерения интересующей социолога характеристики, полученные по другой шкале, поэтому этот способ называют также конкурентной валидностью.

Конструктная валидность: Оценка индикатора основана на том, насколько хорошо его результаты соответствуют "теоретическим ожиданиям". Так, при проверке валидности шкалы групповой сплоченности, основываясь на существующих теоретических представлениях, социолог предполагает, что большей сплоченности соответствует меньшая частота открытых конфликтов и большая интенсивность коммуникаций. Сравнив различные по уровню сплоченности группы и определив для них значения других двух переменных (частота конфликтов и коммуникаций), исследователь может сделать вывод о том, насколько хорошо его шкала отражает интересующую социальную характеристику. Если связи переменных соответствуют предсказаниям теории, считается, что шкала валидна, т.е. измеряет именно интересующую теоретическую переменную.

4.

Понятие качества измерения тесно связано с так называемыми случайными и систематическими ошибками измерения.

Случайные ошибки - ошибки, которые никаким систематическим образом не связаны друг с другом или какими-то систематически действующими внешними переменными (пол, возраст и т.д.). Типичные источники таких ошибок - колебание внимания респондента, неоднозначность формулировки вопроса, ведущей к различию к его восприятию в разных случаях; несистематические отличия в проведении интервью; различия в кодировании открытых вопросов; ошибки ввода данных.

Систематические ошибки обычно связывают с понятиями правильности измерения и дифференцирующей способности шкалы (это относится к качеству инструментария).

Свидетельством и проявлением систематических ошибок служат показатели:

· Отсутствие разброса ответов по значениям шкалы. Попадание ответов в один пункт свидетельствует о полной непригодности измерительного инструмента—шкалы. Такая ситуация может возникнуть или из-за “нормативного” давления в сторону общепринятого мнения, или из-за того, что градации (значения) шкалы не имеют отношения к распределению данного свойства у рассматриваемых объектов (нерелевантны).

· Использование части шкалы. Довольно часто обнаруживается, что практически работает лишь какая-то часть шкалы, какой-то один из ее полюсов с прилегающей более или менее обширной зоной. Для вопросов, имеющих качественные градации ответов, каждая из градаций должна набирать не менее 5% ответов, в противном случае считаем этот пункт шкалы неработающим. Требование 5%-ного уровня наполнения каждой градации шкалы не следует рассматривать как строго обязательное в зависимости от задач исследования могут быть выдвинуты большие или меньшие значения этих уровней.

· Неравномерное использование отдельных пунктов шкалы. Случается, особенно при использовании упорядоченных шкал, что некоторое значение переменной (признака) систематически выпадает из поля зрения респондентов, хотя соседние градации, характеризующие более низкую и более высокую степень выраженности признака, имеют существенное наполнение.

5,

Определение грубых ошибок

В процессе измерения иногда возникают грубые ошибки, причиной которых могут быть неправильные записи исходных данных, плохие расчеты, неквалифицированное использование измерительных средств и т. п. Это обнаруживается в том, что в рядах измерений попадаются данные, резко отличающиеся от совокупности всех остальных значений. Чтобы выяснить, нужно ли эти значения признать грубыми ошибками, устанавливают критическую границу, так чтобы вероятность того, что крайние значения превысят ее, была бы достаточно малой и соответствовала бы некоторому уровню значимости а. Это правило основано на том, что появление в выборке чрезмерно больших значений хотя и возможно как следствие естественной вариабельности значений, но маловероятно.

Если окажется, что какие-то крайние значения совокупности принадлежат ей с очень малой вероятностью, то такие значения признаются грубыми ошибками и исключаются из дальнейшего рассмотрения. Выявление грубых ошибок особенно важно проводить для выборок малых объемов: не будучи исключенными из анализа, они существенно искажают параметры выборки.

Наши рекомендации