Кнопки основных операций, доступных при создании переменных
Арифметические операции | Операции сравнения | Логические операции | |||
+ | Сложение | < | Меньше | & | И |
- | Вычитание | > | Больше | | | Или |
* | Умножение | <= | Меньше или равно | ~ | Не |
/ | Деление | >= | Больше или равно | ||
** | Возведение в степень | = | равно | ||
() | Очередность операций | ~ = | Не равно |
Основные функции, доступные при создании переменных.
ABS( numexpr)
Вычисляет модуль аргумента. Если zpositiv — целевая переменная, то выражение ABS(zscore) создаст переменную zpositiv, чьи значения будут равны модулям соответствующих значений переменной zscore.
RND{numexpr)
Возвращает значение аргумента, округленное до ближайшего целого. Если simple — целевая переменная, то выражение RND(oтметка1) создаст переменную simple, чьи значения будут равны значениям переменной отметка1, округленным до ближайшего целого.
TRUNC(numexpr)
Возвращает целую часть аргумента. Если easy — целевая переменная, то выражение TRUNC(oтметка1) создаст переменную easy, чьи значения будут равны значениям переменной отметка1 с отсеченной дробной частью.
MODinumexpr, modulus)
Возвращает остаток от деления аргумента numexpr па число modulus (обычно равное 10). Если remain — целевая переменная, то выражение MOD(N, 10) создаст переменную remain, чьи значения будут равны последней цифре числа N. Если N = 86, то remain = 6.
SQRT(numexpr)
Возвращает квадратный корень аргумента. Если тест1rt — целевая переменная, то выражение SQRT(Tecтl) создаст переменную тecт1rt, чьи значения будут равны корню квадратному от каждого значения тест1.
Е№ (numexpr)
Возвращает число е (экспонента), возведенное в степень аргумента. Если confuse — целевая переменная, то выражение ЕХР(отметка1) создаст переменную confuse, чьи значения будут равны числу е в степени отметка 1. е ≈ 2,721...; ЕХР(3,49) = (2,721...)349 ≈ 32,900506.
LG10(питехрг)
Возвращает десятичный логарифм аргумента. Если rhythm — целевая переменная, то выражение LGIO(Tecт1) создаст переменную rhythm, чьи значения будут равны десятичным логарифмам переменной тест1.
LH(питехрг)
Возвращает натуральный логарифм аргумента. Если natural — целевая переменная, то выражение LGIO(Tecт1i) создаст переменную rhythm, чьи значения будут равны натуральным логарифмам переменной тест1.
NORMAL(stddev)
Возвращает массив нормально распределенных случайных чисел с нулевым средним значением и стандартным отклонением, равным stddev. Если randnorm — целевая переменная, то выражение NORMAL(3) создаст переменную randnorm, значениями которой будут случайные числа, распределенные нормально с нулевым средним значением и стандартным отклонением, равным 3.
UNIFORM (mах)
Возвращает массив случайных чисел, полученных в результате равновероятной выборки из целочисленного диапазона от 1 до max. Если random — целевая переменная, то выражение UNIFORM(IOO) создаст переменную random, чьи значения будут являться случайными целыми числами от 1 до 100.
Команда Compute (Вычислить) позволяет создать новую переменную, значения которой вычисляются при помощи выражения, содержащего другие переменные. Команда Transform ► Rank Cases (Преобразование ► Ранжировать объекты) тоже позволяет создать новую переменную, значения которой ранговые места объектов но заданной переменной. Эта процедура применяется, когда необходимо перейти от исходных значений переменной к рангам.
Команда ранжирования (перехода к рангам) выполняется при помощи диалогового окна,. Для перехода к рангам достаточно задать имя переменной в этом окне и щелкнуть на кнопке ОК. Появится новая переменная с заданным по умолчанию именем, содержащая ранги значений исходной переменной.
1.Сравнить успеваемость юношей и девушек в 11 классе, т.е. две независимые выборки с помощью Критерия МаннаУитни (MannWhitney), или U-критерия (ориентированый на распределения, отличные от нормальных).По назначению аналогичен t-критерию для независимых выборок (ориентированый на нормальные и близкие к ним распределения).
При реализации метода программа сначала ранжирует все объекты без учета принадлежности к сравниваемым группам, а затем вычисляет средние ранги для каждой из двух групп Чем выше средний ранг группы, тем выше ее успеваемость После определения средних рангов определяется р-уровень.
В меню Analyze (Анализ) выберите команду Nonparametric Tests ► 2 Independent Samples (Непараметрические методы ►Две независимые выборки), чтобы открыть диалоговое окно Two-Independent Samples Test (Критерий для двух независимых выборок) (рис. 3) ► Для применения метода :переместите переменную отметка2 в списокTest Variable List (Список тестируемых переменных) ► Переместите переменную пол в полоGrouping Variable (Группирующая переменная) ► В диалоговом окне Define Groups (Определение групп), В поле Group 1 (Группа 1) введите значение 1, в поле Group 2 (Группа 2), введите значение 2 и щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Two-Independent Samples Test (Критерий для двух независимых выборок). ►О К.
2.Сравненить две зависимые выборки. С помощью методов критерия знаков (sign test - сравнивает два измерения переменной на одной выборке (например, «до» и «после») но уровню ее выраженности путем сопоставления количества положительных и отрицательных разностей (сдвигов) значений) и критерий Вилкоксона (Wilcoxon test - критерий основан на подсчете абсолютных разностей между парами значений с последующим их ранжированием. Затем вычисляются средние значения рангов для положительных и отрицательных разностей (сдвигов). Уровень значимости подсчитывается на основе стандартизованного значения).
Сравнить результаты учащихся по второму (тест2) и четвертому (тест4) тестам. Для каждого объекта сначала определяется знак разности значений. Так, для первого объекта значение тест2 равно 7, а значение тест4 10. Сравнение этих значений даст отрицательный знак (7 - 10 - 3 < 0). Для четвертого объекта значения переменных тест2 и тест4 составляют, соответственно, 9 и 6, и знак разности будет положительным (9 - 6 > 0). Подсчитывается число положительных, отрицательных и нулевых разностей, а затем вычисляется нормализованное z-значение и р-уровень значимости.
В меню Analyze (Анализ) выберите команду Nonparametric Tests ► 2 Related Samples (Непараметрические критерии ►Две зависимые выборки), чтобы открыть диалоговое окно Two-Related Samples Test (Критерий для двух зависимых выборок) (рис.4). ►В группе Test Type (Тип критерия) установите флажок Sign (Знаков) и сбросьте флажок Wilcoxon (Вилкоксона). ►Переместить тест2 и тест4. Variable 1 и 2 (Переменная 1 и 2) в области Current Selections (Текущие выделения). ►Переместить выбранную пару переменных в список Test Pair(s) List (Список тестируемых пар). ►О К.
. Проверим гипотезу о неслучайном чередовании юношей и девушек (переменная пол) в списке испытуемых в файле exOI .sav. с помощью критерия серий (применяется для анализа последовательности объектов (явлений, событий), упорядоченных во времени или в порядке возрастания (убывания) значений измеренного признака. Кроме того, критерий требует представления последовательности в виде бинарной переменной, то есть как чередования событий 0 и 1. Серия это последовательность однотипных событий, непосредственно перед и после которой произошли события другого типа. Гипотеза о случайном распределении событий 1 среди событий 0 может быть отклонена, если количество серий либо слишком мало (однотипные события имеют тенденцию к группированию), либо слишком велико (события 0 и 1 имеют тенденцию к чередованию).
Analyze (Анализ) выберите команду Nonparametric Tests ► Runs (Непараметрические критерии ► Серии), чтобы открыть диалоговое окно Runs Test (Критерий серий) рис.5►Переменную пол переместить в поле Test VariableList (Список тестируемых переменных) ►В группе Cut Point (Точка раздела) установите флажок Custom (Настройка), введите в расположенное рядом поле значение 2 и сбросьте флажокMedian (Медиана). ► ОК
5. Сравнить распределение переменной отметка 1 с нормальным распределением с помощью Критерия Колмогорова-Смирнова для одной выборки (позволяющего определить, отличается ли заданное распределение от нормального (эксцесс и асимметрия распределения равны 0), равномерного (значения распределены с одинаковой плотностью, например, как у целых чисел от 1 до 1000), Пуассона (среднее значение и дисперсия равны Х\ при больших значениях А, распределение Пуассона приближается к нормальному) или экспоненциального. Суть метода заключается в сравнении эмпирического (наблюдаемого) распределения накопленных частот выборки с теоретическим (ожидаемым) распределением накопленных частот (нормальным, Пуассона и т. д.).
В меню Analyze (Анализ) выберите команду Nonparametric Tests ► 1-Sample K-S (Непараметрические критерии ► Критерий К-С для одной выборки), чтобы открыть диалоговое окно One-Sample KolmogorovSmirnov Test (Критерий КолмогороваСмирнова для одной выборки) рис.7 ►Переместить переменнуюОтметка1 в список TestVariable List (Список тестируемых переменных). ► О К.
Применить критерий хи-квадрат для одной выборки к переменной ВУЗ. Рассматриваемый в данном разделе критерий x2 для одной выборки несколько отличается от рассмотренного ранее критерия x2 для таблиц сопряженности. В данном случае в качестве ожидаемого (теоретического) распределения обычно выступает равномерное распределение объектов по градациям переменной, в отношении которой применяется критерий. Поскольку число объектов (N) в файле exOi.sav равно 100, а переменная вуз имеет 4 градации, ожидаемые частоты для каждой градации равны 100/4 = 25. Применение рассматриваемого критерия допускает задание не только равномерного ожидаемого распределения, но и любого другого. Например, можно проверить гипотезу о том, что соотношение учащихся, предпочитающих 4 категории специализаций, соотносятся как 20:20:30:30. Для этого в группе Expected Values (Ожидаемые значения) следует установить переключатель Values (Значения), а затем при помощи поля и кнопки Add (Добавление) последовательно ввести в список значения 20, 20, 30, 30. После этих действий ожидаемые частоты изменятся в соответствии с заданными пропорциями.
В меню Analyze (Анализ) выберите команду Nonparametric Tests ► Chi-Square (Непараметрические критерии ► Хи-квадрат), чтобы открыть диалоговое окно Chi-Square Test (Критерий хи-квадрат) рис.8 ►Переместить переменную ВУЗв список Test VariableList (Список тестируемых переменных) ► ОК.
Сравнить три групп учащихся, отличающихся внешкольными увлечениями (переменная хобби) и успеваемостью в 11 классе (переменная отметка2). Для сравнения более двух независимых выборок по уровню выраженности переменной применяется несколько критериев: Н-критерий КраскалаУоллеса (KruskalWallis Я), критерий медианы (median), критерий ДжонкираТерпстра (JonckheereTerpstra). Из них наибольшей чувствительностью к различиям обладает Я-критерий КраскалаУоллеса. Этот критерий является пеиараметрическим аналогом одиофакторпого дисперсионного анализа, отличаясь от него в двух отношениях. Во-первых, критерий КраскалаУоллеса основан не на сравнении средних значений и дисперсий переменных, а па сравнении средних рангов. go-вторых, вместо вычисления F-критерия на основе сравнения средних рангов с ожидаемыми значениями вычисляется критерий хи-квадрат. Для нормальных распределений однофакториый дисперсионный анализ обеспечивает более точные результаты, чем критерий КраскалаУоллеса, однако применение последнего рекомендуется для распределений, отличающихся от нормального. Н-критерий КраскелаУоллеса «по идее» сходен с [/-критерием МаннаУитии. Как и последний, он оценивает степень пересечения (совпадения) нескольких рядов значений измеренного признака. Чем меньше совпадений, тем больше различаются ряды, соответствующие сравниваемым выборкам. Основная идея Я-критерия КраскелаУоллеса основана на представлении всех значений сравниваемых выборок в виде одной общей последовательности упорядоченных (ранжированных) значений с последующим вычислением среднего ранга для каждой из выборок. Если выполняется статистическая гипотеза об отсутствии различий, то можно ожидать, что все средние ранги примерно равны и близки к общему среднему рангу.
В меню Analyze (Анализ) выберите команду Nonparametric Tests ► К Independent Samples (Непараметрические критерии ► К независимых выборок), чтобы открыть диалоговое окно Test for Several Independent Samples (Критерии для нескольких независимых выборок рис.9 ►(флажок KruskalWallis Н (критерий КраскалаУоллеса) установлен но умолчанию) Переместить переменную Отметка 2 в списокTest Variable List (Список тестируемых переменных) ►Переместить переменную Хобби в полеGrouping Variable Группирующая переменная) ►В окне Define Range (Определение диапазона) в поле Minimum (Минимум) введите значение 1, в поле Maximum (Максимум) введите значение 3 ► Continue (Продолжить) ►вернуться диалоговое окно Test for Several Independent Samples (Критерии для нескольких независимых выборок) ► ОК
Сравнить результаты тестов тест1, тест2, тестЗ, тест4 и тест5 для всех учащихся с помощью Критерия Фридмана, это непараметрическим аналогом однофакторного дисперсионного анализа для повторных измерений. Он позволяет проверять гипотезы о различии более двух зависимых выборок (повторных измерений) по уровню выраженности изучаемой переменной. Критерий Фридмана может быть более эффективен, чем его метрический аналог однофакторный дисперсионный анализ в случаях повторных измерений изучаемого признака па небольших выборках и при отличии распределений от нормального. Критерий Фридмана весьма сходен с критерием Краскала Уоллеса и основан па ранжировании ряда повторных измерений для каждого объекта выборки. Затем вычисляется сумма рангов для каждого из условий (повторных измерений). Если выполняется статистическая гипотеза об отсутствии различий между повторными измерениями, то можно ожидать примерного равенства сумм рангов для этих условий. Чем больше различаются зависимые выборки по изучаемому признаку, тем больше эмпирическое значение вычисляемого значения критерия X2, по которому определяется р-уровень значимости.
В меню Analyze (Анализ) выберите команду Nonparametric Tests ► К. Related Samples (Непараметрические критерии ► К зависимых выборок), чтобы открыть диалоговое окно Test for Several Related Samples (Критерий для нескольких зависимых выборок) рис.10 ►Переместить переменную Тест1 в список TestVariables (Тестовые переменные). ►Повторите предыдущее действие для переменных тест2, тестЗ, тест4 и тест5►ОК.
Справочный материал: Параметрический критерий это метод статистического вывода, который применяется в отношении параметров генеральной совокупности. Главным параметром для параметрических методов является нормальное распределение переменных и, как следствие, правомерность применения таких статистик, как среднее значение и стандартное отклонение. Непараметрические методы позволяют исследовать данные без каких-либо допущений о характере распределения переменных, в том числе при нарушении требования нормальности распределения. Так как эти методы предназначены для номинативных и ранговых переменных, в отношении которых недопустимо применение арифметических операций, они основаны на различных Дополнительных вычислениях, среди которых можно отметить: ранжирование переменных; подсчет числа значений одного распределения, которые превышают значения другого распределения; применение весовых сравнений; определение степени отклонения распределения от случайного или биномиального распределения; проверка нормальности выборочного распределения; сравнения частот; сравнение групп путем вычисления частот значений, лежащих выше или иже главной медианы. Помимо всего прочего непараметрические критерии позволяют вычислять статистические показатели для одной выборки и сравнивать две выборки между собой.
Ø Сравнение двух независимых выборок (критерий МаннаУитни) позволяет установить различия между двумя независимыми выборками по уровню выраженности порядковой переменной.
Ø Сравнение двух зависимых выборок может проводиться по двум критериям. Критерий знаков основан па подсчете числа отрицательных и положительных разностей между повторными измерениями; критерий Вилкоксона в дополнение к знакам разностей учитывает их величину.
Ø Критерий серий определяет, является ли последовательность бинарных величии (событий) случайной или упорядоченной.
Ø Биномиальный критерий определяет, отличается ли распределение дихотомической величины от заданного соотношения.
Ø Критерий Колмогорова-Смирнова для одной выборки определяет отличие распределения переменной от нормального (равномерного, Пуассона и т. д.)
Ø Критерий хи-квадрат для одной выборки определяет степень отличия наблюдаемого распределения частот по градациям переменной от ожидаемого распределения.
Ø Сравнение К независимых выборок (критерий КраскалаУоллеса) позволяет установить степень различия между тремя и более независимыми выборками но уровню выраженности порядковой переменной.
Ø Сравнение К зависимых выборок (критерий Фридмана) позволяет установить степень различия между тремя и более зависимыми выборками но уровню выраженности порядковой переменной.