Обнаружение интересующего исследователя эффекта в одной или разных выборках испытуемых
7.12.1.Биномиальный критерий m. Это самый простой из всех статистических критериев, который позволяет оценить, насколько эмпирическая частота какого-либо признака в одной выборке (от 5 до 300 наблюдений) отличается от заданной теоретической, среднестатистической и т.д. Эмпирическая частота и является эмпирическим значением биномиального критерия m, которое сравнивается с табличным для соответствующего числа наблюдений при заданной вероятности проявления интресующего исследователя эффекта.
Например, если в некотором эксперименте испытуемые решают анаграммы слов с двумя равновероятными исходами (типа ''борза'' – анаграмма слов ''образ'' и ''забор''), но, при этом, один вариант решения встречается гораздо чаще и его частота статистически отличается от теоретической, то можно предположить, что здесь проявляется эффект связанный с влиянием некоторого фактора (например, дефицита времени или опыта решения предыдущих задач).
7.12.2. -критерий Фишера с угловым преобразованием. Данный критерий является многофункциональным критерием, т.е. он применим по отношению к самым разнообразным задачам и самым различным типам данных. Он вычисляется по формуле:
,
где – угол, соответствующей большей процентной доле, выраженный в радианах
– угол, соответствующей меньшей процентной доле, выраженный в радианах
n1 – количество наблюдений в выборке 1
n2 – количество наблюдений в выборке 2
Он имеет следующие особенности:
1. Позволяет сравнивать две выборки или одну и ту же выборку в разных условиях по степени выраженности интересующего исследователя эффекта;
2. Позволяет определить сдвиг значений признака под влиянием фактора;
3. Позволяет сопоставить выборки как по качественному, так и по количественно определяемому признаку;
4. Минимальный объем одной из выборок может быть равен 2, но максимальный – не ограничен, хотя в тех случаях когда выборки очень малы, достоверные различия обнаружить скорее всего не удастся.
Группы | Есть эффект | Нет эффекта | ||
Количество испытуемых | Процентная д доля | Количество испытуемых | Процентная д доля | |
1 группа | 54.2 % | 45.8 % | ||
2 группа | 75.0 % | 25.0 % |
, n1= 12
, n2= 24
=1.242, = 1.64
Вывод: группы испытуемых не различаются достоверно по проявлению эффекта, т.к. <
Перечисленные выше статистические критерии предназначены только для сопоставления двух распределений, вне зависимости от решаемой исследователем задачи. Помимо этих критериев существует еще и те, которые позволяют сопоставлять три, четыре и большее количество распределений, а также решать более сложные задачи. Многие ответы на вопросы могут быть получены и при комбинированном применении статистических критериев, а также в совокупности с другими методами математической статистики, что, как правило, рассматривается в специальных руководствах.
7.13. Единицы измерения статистических мер.При описании результатов своих исследований любому специалисту важно понимать не только в какой шкале и в каких единицах измерялся признак, но и в каких единицах измеряются статистические меры, чтобы перевести полученные результаты с языка математической статистики на язык своей науки. Ниже приводится таблица единиц измерения описанных в пособии статистических мер.
Таблица 7.2. Единицы измерения статистических мер
Статистические меры | Единицы измерения |
Среднее арифметическое | Единицы признака |
Медиана | Единицы признака |
Мода | Единицы признака |
Квантили распределения | Единицы признака |
Размах | Единицы признака |
Среднее отклонение | Единицы признака |
Дисперсия | Квадрат единицы признака |
Стандартное отклонение | Единицы признака |
Стандартная оценка | Условные единицы |
Асимметрия | Условные единицы |
Эксцесс | Условные единицы |
Коэффициенты корреляции | Все в условных единицах |
Коэффициент регрессии | Условные единицы |
Статистические критерии | Все в условных единицах |
8. ДИСПЕРСИОННЫЙ АНАЛИЗ
Общие сведения. Дисперсионный анализ был разработан английским биологом и математиком Рональдом Фишером (1890-1962). Дисперсионный анализ (далее - ДА) – это статистический метод изучения влияния отдельных контролируемых факторов на изменчивость изучаемого признака. Необходимость в применении ДА возникает тогда, когда производится серия измерений какой-либо одной переменной в разных условиях, причем число условий должно быть больше двух (в противном случае данную задачу можно решить иными методами). Например, это могут быть несколько экспериментальных групп, различающихся по каким-либо признакам (возрасту, уровню образования, социальному положению и т.д.) участвующих в качестве испытуемых в одних и тех же условиях эксперимента. Это может быть одна и та же экспериментальная группа принимающая участие в эксперименте в разных экспериментальных условиях, например, простых, усложненных и очень сложных. Наконец, это могут быть несколько эксперименальных групп, принимающих участие в эксперименте с разными экспериментальными условиями, но при этом экспериментатор должен придерживаться гипотезы, что интериндивидуальные различия не оказывают влияния на вариативность результатов, которые, в свою очередь, могут зависеть только от условий эксперимента.
Виды переменных в ДА. Все переменные в ДА принято делить на два вида – независимые и зависимые переменные. Независимой переменной (фактором) называется контролируемая экспериментатором переменная. Независимыми переменными могут быть пол испытуемых, возраст, национальность, принадлежность к какой-либо социальной группе и т.д., поскольку именно по каким-либо различиям между испытуемыми будут сформированы экспериментальные группы. В качестве независимых переменных могут выступать и психологические переменные, такие как уровень развития интеллекта, свойства темперамента или характера, особенности эмоциональной сферы и т.д. Независимой переменной могут быть действия других людей, которым подвергаются испытуемые или условия проведения эксперимента. Независимую переменную принято делить на уровни. Уровни независимой переменной могут различаться как количественно, так и качественно. Уровнями независимой переменной может быть, например, уровень мотивации испытуемых (высокий, средний, низкий), уровень шума и его влияние на результативность деятельности и т.д, которые различаются лишь количественно. Уровни независимой переменной могут представлять собой не только градации какого-либо фактора. Уровнями независимой переменной могут быть, например, цвет стимулов, виды заболеваний, виды рекламы и т.д., которые различаются прежде всего качественно. В таком случае их правильнее будет называть условиями действия фактора или условиями эксперимента.
Зависимой переменной называется переменная, которая при ее измерении во время эксперимента подвергается влиянию независимой. Например, возраст испытуемых может влиять на уровень цветовой чувствительности (зависимая переменная), уровень интеллекта на скорость решения творческих задач, социальное положение на ценностные ориентации и т.д.
Виды ДА. Дисперсионный анализ принято делить на несколько видов согласно количеству независимых переменных: однофакторный ДА (одна независимая переменная), двухфакторный ДА (две независимых переменных), трехфакторный ДА (три независимых переменных) и мультифакторный ДА (больше трех независимых переменных). Обычно исследования ограничиваются применением только двух первых видов ДА, поскольку уже в трехфакторном ДА вычисления являются довольно громоздкими и часто требуют большого эмпирического материала. Но во всех видах ДА зависимая переменная остается только одна.
Структура данных в однофакторном и двухфакторном ДА. Обычная структура данных в однофакторном ДА может быть представлена в виде таблицы с J-количеством столбцов (см. рис.8.1) и n-количеством наблюдений в каждом столбце (причем их количество может быть разным), где столбцами являются условия эксперимента или уровни независимой переменной (в данном случае их четыре), а зависимая переменная представляет собой результаты измерения признака, где каждое отдельное значение обозначается как xi,j.
Рис.8.1. Структура данных в однофакторном дисперсионном анализе
Независимая переменная (фактор) | |||
1 уровень | 2 уровень | 3 уровень | 4 уровень |
X1,1 | X1,2 | X1,3 | X1,4 |
X,2,1 | X,2,2 | X,2,3 | X,2,4 |
X3,1 | X3,2 | X3,3 | X3,4 |
X4,1 | X4,2 | X4,3 | X4,4 |
X5,1 | X5,2 | X5,3 | X5,4 |
. | . | . | . |
. | . | . | . |
. | . | . | . |
. | . | . | . |
Xn,1 | Xn,2 | Xn,3 | Xn,4 |
Структура данных в двухфакторном ДА отличается тем, что добавляется вторая независимая переменная со своими уровнями, которых также должно быть не менее двух. На рис.8.2. представлена таблица данных для двухфакторного дисперсионного анализа с I-количеством уровней фактора А (в данном случае их три), J-количеством уровней фактора Б (в данном случае их два) и k-наблюдениями в каждой ячейке, образованном сочетанием уровней переменных А и Б, причем количество наблюдений в каждой ячейке может быть различным.
Рис.8.2. Структура данных в двухфакторном дисперсионном анализе
ФАКТОР ''Б’’ | ||||||
1 УРОВЕНЬ | 2 УРОВЕНЬ | |||||
X1,1,1 | . | X1,2,1 | . | |||
X1,1,2 | . | X1,2,2 | . | |||
1 УРОВЕНЬ | X1,1,3 | . | X1,2,3 | . | ||
Ф | X1,1,4 | . | X1,2,4 | . | ||
А | X1,1,5 | X1,1,k | X1,2,5 | X1,2,k | ||
К | X2,1,1 | . | X2,2,1 | . | ||
Т | X2,1,2 | . | X2,2,2 | . | ||
О | 2 УРОВЕНЬ | X2,1,3 | . | X2,2,3 | . | |
Р | X2,1,4 | . | X2,2,4 | . | ||
X2,1,5 | X2,1,k | X2,2,5 | X2,2,k | |||
''А'' | X3,1,1 | . | X3,2,1 | . | ||
X3,1,2 | . | X3,2,2 | . | |||
3 УРОВЕНЬ | X3,1,3 | . | X3,2,3 | . | ||
X3,1,4 | . | X3,2,4 | . | |||
X3,1,5 | X3,1,k | X3,2,5 | X3,2,k |
Задачи ДА. Главной задачей в однофакторном ДА является определение отношения вариативности (дисперсии), обусловленной действием независимой переменной (фактора) к случайной вариативности, обусловленной влиянием всех неизвестных факторов (т.н. F-отношение или F-критерий). Если это отношение превышает критическое значение, то тогда признается достоверным влияние независимой переменной на зависимую.
В двухфакторном ДА экспериментатор решает уже три задачи:
1. Определение отношение вариативности обусловленной действием переменной А к случайной вариативности (Fэмп А);
2. Определение отношение вариативности обусловленной действием переменной Б к случайной вариативности (Fэмп Б);
3. Определение отношение вариативности обусловленной действием переменных А и Б к случайной вариативности (Fэмп АБ).
При этом может оказаться что:
1. На вариативность результатов влияет только одна независимая переменная (т.е. либо Fэмп А, либо Fэмп Б превышает критическое значение, но Fэмп АБ не превышает);
2. На вариативность результатов влияют обе независимые переменные, но взаимодействие переменных влияния не оказывает (т.е. они как бы ''нейтрализуют'' друг друга и следовательно: Fэмп А и Fэмп Б превышают критические значения, но Fэмп АБ не превышает);
3. На вариативность результатов независимые переменные по отдельности не влияют, но их взаимодействие оказывает влияние (т.е. они как бы ''катализируют'' друг друга и следовательно: Fэмп А и Fэмп Б не превышают, а Fэмп АБ превышает критическое значение);
4. На вариативность результатов влияет одна из переменных, и кроме того, обнаруживается влияние взаимодействия обеих переменных (либо Fэмп А, либо Fэмп Б превышает критическое значение, и Fэмп АБ также превышает);
5. На вариативность результатов влияют как обе переменные, так и их взаимодействие (все три F-критерия превышают критическое значение);
6. На вариативность результатов не влияет ни одна из переменных, и их взаимодействие также не оказывает никакого влияния (ни один из трех F-критериев не превышает критического значения).
Ограничения применения ДА. ДА можно применять только в том случае, когда переменная измерена в шкале интервалов или отношений, т.е. когда можно вычислить основные параметры распределения (средние и дисперсии). Кроме того, должно быть либо известно, либо доказано, что зависимая переменная подвержена нормальному распределению (в противном случае полученные выводы могут оказаться ложными). В двухфакторном ДА помимо перечисленнных требований обязательным условием является то, что факторы должны быть независимы друг от друга и количество их градаций также должно быть не меньше двух.
Модель для данных в ДА. Обычная линейная модель для данных в однофакторном ДА выглядит следующим образом:
, где
x – конкретное значение переменной,
– (греч. “мю”) генеральное среднее
A – доля отклонения переменной, обусловленная влиянием фактора А
e – ошибка наблюдения (случайное отклонение).
Для двухфакторного ДА эта модель будет:
, где
x – конкретное значение переменной,
– (греч. “мю”) генеральное среднее
A – доля отклонения переменной, обусловленная влиянием фактора А
B – доля отклонения переменной, обусловленная влиянием фактора B
AB – доля отклонения переменной, обусловленная взаимодействием факторов А и B
e – ошибка наблюдения (случайное отклонение)
Гипотезы в ДА. Нулевая гипотеза в однофакторном ДА будет утверждать, что средние значения исследуемого признака на всех уровнях независимой переменной одинаковы. Иначе говоря, независимая переменная не оказывает никакого влияния на зависимую и, следовательно, средние значения признака от уровня к уровню независимой переменной не меняются. Альтернативная гипотеза будет утверждать, что средние значения признака от уровня к уровню независимой переменной меняются (увеличиваются или уменьшаются), т.е. независимая переменная влияет на зависимую. Что касается двухфакторного дисперсионного анализа, то таких гипотез будет уже три: относительно влияния фактора А, фактора Б и взаимодействия факторов А и Б на зависимую переменную.
Порядок расчетов в однофакторном ДА. В однофакторном ДА необходимо найти F-критерий, который определяется по формуле:
, где
MSфакт – дисперсия, обусловленная влиянием фактора (“сумма квадратов между группами” (см. ниже) деленная на число степеней свободы между группами)
MSслуч – случайная дисперсия (“сумма квадратов внутри групп” деленная на число степеней свободы внутри групп)
и
, где
SSфакт – сумма квадратов отклонений случайной величины от общей средней (“сумма квадратов между группами”)
SSслуч – остаточная сумма квадратов (“сумма квадратов внутри групп”)
dfфакт – число степеней свободы между группами
dfслуч – число степеней свободы внутри групп
и
Из изложенного выше видно, что сумма квадратов между группами и сумма квадратов внутри групп составляют общую или полную сумму квадратов, которая определяется по формуле:
, т.е.
.
Однофакторный ДА, таким образом, представляет собой разложение общей суммы квадратов на две составляющие: обусловленную влиянием фактора и обусловленную случайными влияниями.
Пример вычисления F-критерия в однофакторном ДА:
Независимая переменная (фактор) | |||
1 уровень | 2 уровень | 3 уровень | 4 уровень |
Вывод: Fэмп > Fкрит : влияние фактора достоверно
Порядок расчетов в двухфакторном ДА.В двухфакторном ДА необходимо подсчитать три F-критерия:
, , , где
MSA – дисперсия, обусловленная влиянием фактора A,
MSB – дисперсия, обусловленная влиянием фактора B,
MSAB – дисперсия, обусловленная влиянием взаимодействия факторов AB,
MSслуч – случайная дисперсия,
которые расчитываются следующим образом:
, , и , где:
SSA – сумма квадратов отклонений обусловленная фактором A,
SSB – сумма квадратов отклонений обусловленная фактором B,
SSAB – сумма квадратов отклонений обусловленная взаимодействием факторов A и B,
SSслуч – остаточная сумма квадратов.
Суммы квадратов вычисляются по следующим формулам:
Степени свободы подсчитываются по формулам:
, , ,
Пример вычисления F-критериев в двухфакторном ДА:
ФАКТОР ''Б’’ | ||||||
1 УРОВЕНЬ | 2 УРОВЕНЬ | |||||
1 УРОВЕНЬ | ||||||
Ф | ||||||
А | ||||||
К | ||||||
Т | ||||||
О | 2 УРОВЕНЬ | |||||
Р | ||||||
''А'' | ||||||
3 УРОВЕНЬ | ||||||
Суммы по строкам
Суммы по столбцам
Критические значения:
Вывод: Поскольку из всех F-критериев только FB превышает критическое значение, то, следовательно, на вариативность результатов достоверно влияние только фактора ''Б''.
9. РЕГРЕССИОННЫЙ АНАЛИЗ
Общие сведения. Регрессионный анализ (далее - РА) - это статистический метод изучения изменения значений одной переменной от изменения значений другой переменной на единицу измерения. В широком смысле РА изучает связь между переменными, зависимость одной переменной от другой и влияние одной переменной на другую. Однако, в отличии от коэффициента корреляции и дисперсионного анализа РА дает ответ на один очень важный вопрос: как изменится значение одной переменной, если значение другой переменной изменилось на некоторое количество единиц ее измерения. Такого рода задача может возникнуть в том случае, если необходимо знать какой тестовый балл окажется у испытуемого по тесту А, если нам известен его тестовый балл по тесту Б и насколько возрастет (уменьшится) тестовый балл данного испытуемого по одному тесту, если изменится тестовый балл по другому. В качестве еще одного примера применения РА можно привести следующие задачи:
1. Как изменится мотивация персонала фирмы, если зарплата будет увеличена на определенное количество денежных единиц.
2. Насколько изменится спрос на товар, если общее время показа рекламы по телевидению увеличится на определенное количество минут.
3. Насколько точно можно оценить успеваемость по интеллекту.
4. Как изменится самооценка подростка, если его социометрический статус возрастет.
5. Как зависит оценка студента на экзамене от успеваемости в течение семестра.
Правда, нужно отметить, что для решения такого рода задач необходима предварительная статистика, т.е. исследователь должен располагать данными измерений двух случайных величин, зависимость одной из которых от другой он исследует.
Задачи и вычислительные процедуры РА. Основные задачи РА - решение уравнений регрессии и построение линии регрессии. Основное уравнение линейной регрессии выглядит следующим образом:
, где:
Y - изучаемый признак, переменная, которая испытывает на себе влияние другой переменной;
X - переменная, оказывающая влияние на переменную Y;
a - коэффициент регрессии, определяющий наклон линии регрессии по отношению к осям X иY;
b - константа, определяющая высоту линии регрессии над осью X.
По сути - это уравнение прямой в декартовой системе координат и решение уравнения регрессии сводится к нахождению коэффицента регрессии и свободного члена в уравнении регрессии, которые определяются по формулам:
;
.
Аналогичным образом можно построить уравнение зависимости не только Y от X, но и X от Y, что требует замены переменных местами. Однако, статистика не может заменить собой логики, и поэтому математически такая перестановка осуществима, но логически может быть совершенно не оправдана. Можно, например, изучать зависимость успеваемости от интеллекта у школьников первого класса, но вряд ли целесообразно будет изучение зависимости интеллекта от успеваемости у тех же школьников, если интеллект у них формировался задолго до того, как появилась успеваемость. Вопрос о причинно-следственных связях в таких случаях всегда остается на совести исследователя.
Следующей задачей РА является построение линии регрессии, которая отражает изменение значения одной переменной от изменения значения другой. Здесь необходимо сказать, что линия регрессии показывает не действительные, а только наиболее вероятные значения Y, что нисколько не умаляет достоинств РА. Во-первых, дело в том, что эмпирические данные при одном значении X могут содержать некоторый разброс значений Y, что естественно для случайных величин. РА покажет, в таком случае, как раз те значения, которые следует ожидать при увеличении количества наблюдений. Во-вторых, по уравнению регрессии можно определить наиболее вероятные значения Y по гипотетическим значениям X, т.е. тем, которые не встречаются в эмпирических данных, поэтому довольно часто в статистике линию регрессии называют еще линией предсказания.
Эмпирическая задача. Необходимо установить зависимость между успеваемостью студентов факультета психологии ДГУ по математическим методам в психологии в течении семестра, определенной по 18-бальной рейтинговой системе (min=0; max=18) и итоговой оценкой на экзамене (по привычной 5-бальной системе). Исходные данные и расчеты представлены в таблице 1. Достаточно беглого вгляда, чтобы заметить, что между двумя случайными величинами существует достоверная связь. Однако коэффициента корреляции (rx,y = 0.825) недостаточно, чтобы определить какую оценку студента на экзамене можно прогнозировать при 6-ти или 13-ти баллах, т.е. при тех значениях X, которые отсутствуют в эмпирических данных.
Таблица 9.1. Данные для регрессионного анализа
№ | Испытуемые | Семестр (X) | Экзамен (Y) | XY | X*X |
И.М. | |||||
А.С. | |||||
С.О. | |||||
М.В. | |||||
Ф.О. | |||||
М.Б. | |||||
О.С. | |||||
П.Г. | |||||
Ч.А. | |||||
Б.Б. | |||||
Б.А. | |||||
Н.О. | |||||
Х.С. | |||||
Г.Е. | |||||
Г.Ж. | |||||
Р.Г. | |||||
Д.О. | |||||
З.В. | |||||
В.Л. | |||||
Ф.А. | |||||
К.Е. | |||||
Л.А. | |||||
М.Л. | |||||
П.О. | |||||
Е.Д. | |||||
К.Д. | |||||
Л.Е. | |||||
Б.Е. | |||||
М.М. | |||||
О.М. | |||||
Р.С. | |||||
Д.Е. | |||||
З.И. | |||||
Х.И. | |||||
Ч.Е. | |||||
Суммы | |||||
Средние | 11,57 | 3,97 |
Уравнение регрессии:
Сейчас по полученному уравнению можно рассчитать наиболее вероятные значения оценки на экзамене, зная оценку в течении семестра. Так при 6-ти баллах в семестре оценка студента на экзамене будет равна 2.92 (т.е. не выше тройки), при 13-ти баллах – 4.24 (достаточно твердая четверка), а для получения отличной оценки вполне достаточно 17-ти баллов, т.к. .
Построение линии регрессии. На рис 9.1. видна построенная по эмпирическим данным (точки) и результатам вычислений линия регрессии. Линия регрессии проходит через точки, которые соответствуют наиболее вероятным значениям одной переменной при соответствующих значениях другой и, при этом, она всегда проходит через точку с координатами, соответствующим средним арифметическим двух переменных.
Рис. 9.1. Диаграмма рассеивания X (полученные в семестре баллы) и Y (оценка на экзамене) с построенной эмпирической линией регрессии.
Построенная таким образом линия в общем виде определяет зависимость одной переменной от другой и при интерпретации результатов регрессионного анализа необходимо учитывать, что в них не отражены отдельные случаи, как например, очень низкое значение одной переменной при высоком значении другой, хотя если и появится такой случай, то он обязательно повлияет как на уравнение, так и на линию регрессии.
Достоверность линии регрессии и уравнения регрессии. После того, как вычислен коэффициент регрессии, его достоверность может быть определена по формуле:
, где
В нашем примере tэмп = 8.39. Полученное значение сравнивается с критическими значениями t-критерия Стьюдента с n-2 числом степеней свободы. Если tэмп превышает t0.01, то коэффициент регрессии и линия регрессии могут быть признаны достоверными. Что касается данного примера, то t0.01 = 2.75, и, следовательно, коэффициент регрессии и линия регрессии достоверны.
Ограничения в применении РА. РА применим только по отношению к переменным, которые выражены в шкале интервалов или отношений. И, хотя в приведенном выше примере использовалась шкала оценки на экзамене, которая не является шкалой равных интервалов, тем не менее в ней можно подсчитать средние и дисперсию, что является обязательным требованием к шкалам используемым в РА. Вторым ограничением в применении РА является то, что обе переменные должны находится по отношению друг к другу либо в функциональной, либо в статистической зависимости. Если одна из случайных величин является константой, то РА теряет смысл: коэффициент регрессии окажется равен нулю, а на графике линия регрессии будет выражаться прямой, параллельной оси X.
10. ФАКТОРНЫЙ АНАЛИЗ