Ранговой корреляции Rs
Качества | Ранги, присвоенные экспертом | Разность рангов D | Квадрат разности рангов D2 | |
1-м | 2-м | |||
–1 –2 –1 –1 –1 | ||||
Сумма квадратов разностей рангов Di = 22 |
Подставим данные примера в формулу для коэффициента Смирмена:
Результаты вычисления позволяют утверждать о наличии достаточно выраженной связи между рассматриваемыми переменными.
Статистическая проверка научной гипотезы.Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер: статистические доказательства не являются столь строгими и окончательными – в них всегда допускается риск ошибиться в выводах и потому статистическими методами не доказывается окончательно правомерность того или иного вывода, а показывается мера правдоподобности принятия той или иной гипотезы.
Педагогическая гипотеза (научное предположение о преимуществе того или иного метода и т. п.) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез. Первая (основная) называется нулевой гипотезой (Н0), в которой исследователь говорит о своей исходной позиции. Он (априори) как бы декларирует, что новый (предполагаемый им, его коллегами или оппонентами) метод не обладает какими-либо преимуществами, и потому с самого начала исследователь психологически готов занять честную научную позицию: различия между новым и старым методами объявляются равными нулю. В другой, альтернативной гипотезе (Н1) делается предположение о преимуществе нового метода. Иногда выдвигается несколько альтернативных гипотез с соответствующими обозначениями.
Например, гипотеза о преимуществе старого метода (H2). Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:
– первый уровень – 5% (в научных текстах пишут иногда р = 5% или а≤0,05, если представлено в долях), где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;
– второй уровень – 1%, т. е. соответственно допускается риск ошибиться только в одном случае из ста (а≤0,01, при тех же требованиях);
– третий уровень – 0,1%, т. е. допускается риск ошибиться только в одном случае из тысячи (а≤0,001). Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.
При сравнении средних арифметических экспериментальной и контрольной групп важно не только определить, какая средняя больше, но и насколько больше. Чем меньше разница между ними, тем более приемлемой окажется нулевая гипотеза об отсутствии статистически значимых (достоверных) различий. В отличие от мышления на уровне обыденного сознания, склонного воспринимать полученную в результате опыта разность средних как факт и основание для вывода, педагог-исследователь, знакомый с логикой статистического вывода, не будет торопиться в таких случаях. Он скорее всего сделает предположение о случайности различий, выдвинет нулевую гипотезу об отсутствии достоверных различий в результатах экспериментальной и контрольной групп и лишь после опровержения нулевой гипотезы примет альтернативную.
Таким образом, вопрос о различиях в рамках научного мышления переводится в другую плоскость. Дело не только в различиях (они почти всегда есть), а в величине этих различий и отсюда – в определении той разницы и границы, после которого можно сказать: да, различия неслучайны, они статистически достоверны, а значит, испытуемые этих двух групп принадлежат после эксперимента уже не к одной (как раньше), а к двум различным генеральным совокупностям и что уровень подготовленности учащихся, потенциально принадлежащих этим совокупностям, будет существенно отличаться. Для того чтобы показать границы этих различий, используются так называемые оценки генеральных параметров.
Рассмотрим на конкретном примере (см. табл. 6.6), как с помощью математической статистики можно опровергнуть или подтвердить нулевую гипотезу.
Допустим, необходимо определить зависит ли эффективность групповой деятельности студентов от уровня развития в учебной группе межличностных отношений. В качестве нулевой гипотезы выдвигается предположение, что такой зависимости не существует, а в качестве альтернативной – зависимость существует. Для этих целей сравниваются результаты эффективности деятельности в двух группах, одна из которых в этом случае выступает в качестве экспериментальной, а вторая – контрольной. Чтобы определить, является ли разность между средними значениями показателей эффективности в первой и во второй группе существенной (значимой), необходимо вычислить статистическую достоверность этой разницы. Для этого можно использовать t – критерий Стьюдента. Он вычисляется по формуле:
; (5)
где X1 и X2 – среднее арифметическое значение переменных в группах 1 и 2; М1 и М2 – величины средних ошибок, которые вычисляются по формуле:
; (6)
где s - средняя квадратическая, вычисляемая по формуле (2).
Определим ошибки для первого ряда (экспериментальная группа) и второго ряда (контрольная группа):
,
.
Находим значение t – критерия по формуле:
.
Вычислив величину t – критерия, требуется по специальной таблице определить уровень статистической значимости различий между средними показателями эффективности деятельности в экспериментальной и контрольной группах. Чем выше значение t – критерия, тем выше значимость различий.
Для этого t расчетное сравниваем с t табличным. Табличное значение выбирается с учетом выбранного уровня достоверности (p = 0,05 или p = 0,01), а также в зависимости от числа степеней свободы, которое находится по формуле:
; (7)
где U – число степеней свободы; N1 и N2 – число замеров в первом и во втором рядах. В нашем примере U = 7 + 7 –2 = 12.
Таблица 6.6
Данные и промежуточные результаты вычисления значимости статистических различий средних значений
№ п/п | Экспериментальная группа | Контрольная группа | ||||
Значение эффек-тивности деятельности | Значение эффек-тивности деятельности | |||||
–3 –1 | –2 –1 –1 | |||||
Для таблицы t – критерия находим, что значение t табл. = 3,055 для однопроцентного уровня (p < 0,01) при 12 степенях свободы. Таким образом, величина t табл. < t расч. Таким образом, можно сделать статистически обоснованный вывод о том, что эффективность деятельности в экспериментальной группе выше, чем в контрольной, при уровне значимости 0,01 (риск ошибки составляет одна из ста теоретически возможных).
Однако педагогу-исследователю следует помнить, что существование статистической значимости разности средних значений является важным, но не единственным аргументом в пользу наличия или отсутствия связи (зависимости) между явлениями или переменными. Поэтому необходимо привлекать и другие аргументы количественного или содержательного обоснования возможной связи.
Многомерные методы анализа данных.Анализ взаимосвязи между большим количеством переменных осуществляется путем использования многомерных методов статистической обработки. Цель применения подобных методов – сделать наглядными скрытые закономерности, выделить наиболее существенные взаимосвязи между переменными. Примерами таких многомерных статистических методов являются:
– – факторный анализ;
– – кластерный анализ;
– – дисперсионный анализ;
– – регрессионный анализ;
– – латентно-структурный анализ;
– – многомерное шкалирование и другие.
Факторный анализ заключается в выявлении и интерпретации факторов. Фактор – обобщенная переменная, которая позволяет свернуть часть информации, т. е. представить ее в удобообозримом виде. Например, факторная теория личности выделяет ряд обобщенных характеристик поведения, которые в данном случае называются чертами личности.
Кластерный анализ позволяет выделить ведущий признак и иерархию взаимосвязей признаков.
Дисперсионный анализ – статистический метод, используемый для изучения одной или нескольких одновременно действующих и независимых переменных на изменчивость наблюдаемого признака. Его особенность состоит в том, что наблюдаемый признак может быть только количественным, в тоже время объясняющие признаки могут быть как количественными, так и качественными.
Регрессионный анализ позволяет выявить количественную (численную) зависимость среднего значения изменений результативного признака (объясняемой) от изменений одного или нескольких признаков (объясняющих переменных). Как правило данный вид анализа применяется тогда, когда требуется выяснить насколько изменяется средняя величина одного признака при изменении на единицу другого признака.
Латентно-структурный анализ представляет совокупность аналитико-статистических процедур выявления скрытых переменных (признаков), а также внутренней структуры связей между ними. Он дает возможность исследовать проявления сложных взаимосвязей непосредственно ненаблюдаемых характеристик социально-психологических и педагогических явлений. Латентный анализ может являться основой для моделирования указанных взаимосвязей.
Многомерное шкалирование обеспечивает наглядную оценку сходства или различия между некоторыми объектами, описываемыми большим количеством разнообразных переменных. Эти различия представляются в виде расстояния между оцениваемыми объектами в многомерном пространстве.