Компьютерные технологии анализа категориальных переменных в SPSS.
Категориальные переменные –это данные с ограниченным числом уникальных значений или категорий (например, пол или религия). Категориальные переменные могут быть текстовыми или числовыми, в которых категории закодированы числовыми кодами (например, 0 = Женский , а 1 = Мужской ). Категориальные переменные могут быть либо номинальные, либо порядковые.
Анализ:Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы (Анализ-Описат.статистики-Частоты-Статистика-Галочка «Медиана»). В некоторых случаях возможно вычисление среднего значения(Там же).
Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции.Корреляция – это связь между двумя переменными.
1) Если в качестве примера мы возьмём данные об уровне холестерина для первых двух моментов времени из исследования гипертонии, то в данном случае следует ожидать довольно сильную связь. Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным.Такой график, называемый «диаграммой рассеяния» для двух зависимых переменных можно построить путём вызова меню (Графики) (Диаграммы рассеяния)
2) Переменные с интервальной и с номинальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений).
3) Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.
Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные.
-Переменные с интервальной и с номинальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений).
- По меньшей мере, одна из двух переменных имеет порядковую шкалу либо не является нормально распределённой: ранговая корреляция по Спирмену или т (тау) Кендала.
Создание и редактирование графических изображений одномерного распределения.
Результаты частотного распределения можно представить графически. Для примера мы создадим столбчатую диаграмму для частотного распределения основных специальностей. Поступите следующим образом:
Выберите в меню команды (Анализ) (опис. статистики) (Частоты) - Перенесите переменную в список выходных переменных.- Щелкните на кнопке (Диаграммы). Откроется диалоговое окно (Частоты: Диаграммы).Также можно выбрать гистограмму, круговую диаграмму и столбиками.
Выберите в группе (Тип диаграммы) пункт (Столбчатая диаграмма), а в группе (Значения диаграммы) — пункт (Проценты). Подтвердите выбор кнопкой (Продолжить).
В диалоговом окне Частоты снимите флажок (Показывать частотные таблицы). — Щелкните на кнопке ОК. Диаграмма будет показана в окне просмотра.
Щелкнув на диаграмму откроется окно редактирования диаграммы. В редакторе диаграмм (Элементы-Показать мекти данных) можно выбрать отображение процентов.
4. Компьютерные технологии анализа количественных переменных в SPSS. Использование процентилей при обработке количественных переменных в SPSS.
1)Анализ- описательные статистики- частоты (выбрать возраст или другое(среднее, медиана, квартили)
2) файл расщепления – сравнить группы(выбрать б12) – частоты(выбрать возраст)
Сортировка и расщепление наблюдений на группы в SPSS.
Файл разбиения
Файл разбиения "расщепляет" данные файла на отдельные группы для анализа, в соответствии со значениями одной или нескольких группирующих переменных. Если задано несколько группирующих переменных, то наблюдения будут группироваться по значениям каждой переменной внутри групп, образованных значениями предыдущей переменной в списке Группы образуются по. Если, например, вы выберете пол, а затем национальность , то наблюдения будут отсортированы сначала по значениям переменной пол, а затем внутри каждой полученной категории - по значениям переменной национальность.
- Можно задать до 8-ми группирующих переменных.
- Каждые 8 байтов длинной текстовой переменной (с длиной более 8 байтов) считаются отдельной переменной, вплоть до достижения предела восьми группирующих переменных.
- Наблюдения должны быть отсортированы по значениям группирующих переменных и в том же порядке, что и переменные в списке Группы образуются по. Если файл данных еще не отсортирован, выберите альтернативу Сортировать по группирующим переменным .
Сравнить группы. Группы разбиения представляются вместе для сравнения. В случае сводных таблиц - создается одна таблица, в которую включаются группирующие переменные, причем после построения их можно свободно перемещать между строками, столбцами и слоями таблицы. В случае диаграмм - для каждой группы в файле разбиения создается отдельная диаграмма, и эти диаграммы выводятся вместе в средстве просмотра.
Организовать вывод по группам. Все результаты каждой процедуры выводятся отдельно для каждой группы разбиения.
Как расщепить файл
- Выберите в меню:
Данные> Расщепить файл...
- Выберите Сравнить группы или Организовать вывод по группам .
- Выберите одну или несколько группирующих переменных.
Если файл данных еще не отсортирован по значениям группирующих переменных, выберите Сортировать по группирующим переменным .
6. Технология отбора данных в SPSS с помощью задания условий.
. Чтобы применить фильтрацию (отбор) наблюдений, необходимо выбрать:
Данные
Отобрать наблюдения
Команда Отобрать наблюдения выбирает из всей совокупности наблюдений подмножество (подвыборку) разными способами –
Ø это может быть случайная выборка (Random sample of cases), когда случайным образом выбирается определенное число наблюдений. Это бывает полезно, если обрабатывается не весь файл, а только его часть с целью сокращения времени предварительного анализа.
Ø а может быть выборка по условию (If condition is satistfied).Из файла данных выбираются только те наблюдения, которыее удовлетворяют некоторому условию. В качестве условия следует задать логическое выражение. Для каждого наблюдения оно принимает либо истинное, либо ложное значение, либо не принимает никакого значения. Если условие истинно, то наблюдение выбирается, в противном случае — отбрасывается.
Ø Нажимаем кнопку __if__ , чтобы задать условия отбора наблюдений.
Ø Наблюдения, не попавшие в указанное подмножество, не используются в дальнейшем анализе. Их как будто нет, однако они сохраняются в исходном файле данных. Визуально их легко выделить, так как соответствующий им номер строки перечеркнут. Данная операция действует только в пределах текущего сеанса работы. При повторной загрузке файла данных снова доступна вся совокупность. Если же в течение того же сеанса вы хотите вернуться к полной выборке, то надо снять фильтр, снова выполнив команду Отобрать наблюдения , но ужевыбравопцию Все наблюдения..