Понятие валидности и надежности теста. Виды валидности. способы оценки валидности.
Матметоды
Кривая Гаусса и правило "3 сигм" для нормального распределения.
Нормальное распределение (гауссовским распределением)- модель варьирования некоторой случайной величины, значения которой определяются множеством случайных одновременно действующих независимых факторов, каждый из которых играет в общей сумме примерно одинаковую и малую ролью.
Такой характер взаимовлияний весьма характерен для психических явлений, поэтому исследователь в области психологии чаще всего выявляет нормальное распределение. Однако так бывает не всегда, поэтому в каждом случае форма распределения должна быть проверена. ПРОВЕРЯЕТСЯ С ПОМОЩЬЮ ФОРМУЛЫ Колмогорова-Смирнова.
Характер распределения выявляется главным образом для того, чтобы определиться в методах математико-статистической обработки данных.
Если характер распределения показателей психологического признака является нормальным или близким к нормальной форме, то можно использовать параметрические методы математической статистики как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками (по критерию Стьюдента, F-критерию Фишера, коэффициенту корреляции Пирсона и др).
Если кривая распределения показателей психологического признака далека от нормальной, то используют методы непараметрической статистики: по критерию U Манна-Уитни, коэффициенту ранговой корреляции Спирмена, по факторному, многофакторному, кластерному и другим методам анализа.
ПРАВИЛО 3 СИГМ: 99,7% значений лежат в рамках М+/-3 сигмы. (Сигма(среднеквадрати́ческое отклоне́ние)— наиболее распространённый показатель рассеивания значений случайной величины относительно её математического ожидания, это у.е., Сигма-это корень квадратный из Дисперсии(разброс индив. пок-лей от средней)
Правило трёх сигм ( ) — практически все значения нормально распределённой случайной величины лежат в интервале . Более строго — приблизительно с 99,7 % вероятностью значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).
Понятие валидности и надежности теста. Виды валидности. способы оценки валидности.
Валидность (достоверность)– соответствие конкретного исследования принятым стандартам (безупречному эксперименту). Валидностьтеста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает (А. Анастази). В. - степень, в которой тест действительно измеряет то, для чего он предназначен.
виды валидности: - теоретическая(та, кот. заложена самими создателями). самые старые -самые лучшие; - практическая; - очевидная( это валидность с точки зрения испытуемого. Она означает то впечатление о предмете измерения, которое формируется у испытуемого при знакомстве с инструкцией и материалом теста).
Существуют четыре основных способа установления валидности теста.
I. Оценка очевидной валидности. Очевидная валидность – валидность, при которой оценивается общее соответствие теста его назначению.
II. Оценка содержательной валидности. Содержательная валидность предполагает, что тест обнаруживает в себе полный набор заданий для измерения определенной черты.
III. Оценка конструктной валидности. Этот способ проверки заключается в проведении продуманных экспериментов.
IV. Оценка прогностической валидности. Прогностическая валидность заключается в том, что психологический тест часто используется для прогноза поведения. Соответственно, если прогноз оправдывается с течением времени, это говорит о том, что тест был валидным. Но для характеристики многих видов деятельности этого метода не достаточно.
Надёжность методики – это критерий, который говорит о точности психологических измерений, то есть позволяет судить о том, насколько внушают доверие полученные результаты. Это согласованность результатов тестирования испытуемых в разные моменты времени, при первичном и вторичном тестировании и с использованием разных по эквивалентности, по содержанию заданий. НАДЕЖНОСТЬ- ЭТО ВРЕМЕННАЯ УСТОЙЧИВОСТЬ. Свойства:
- Воспроизводимость рез-тов исследования.
- Точность измерения.
- Устойчивость результатов.