Компьютерные технологии анализа категориальных переменных в SPSS.

Категориальные переменные –это данные с ограниченным числом уникальных значений или категорий (например, пол или религия). Категориальные переменные могут быть текстовыми или числовыми, в которых категории закодированы числовыми кодами (например, 0 = Женский , а 1 = Мужской ). Категориальные переменные могут быть либо номинальные, либо порядковые.

Анализ:Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы (Анализ-Описат.статистики-Частоты-Статистика-Галочка «Медиана»). В некоторых случаях возможно вычисление среднего значения(Там же).

Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции.Корреляция – это связь между двумя переменными.

1) Если в качестве примера мы возьмём данные об уровне холестерина для первых двух моментов времени из исследования гипертонии, то в данном случае следует ожидать довольно сильную связь. Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным.Такой график, называемый «диаграммой рассеяния» для двух зависимых переменных можно построить путём вызова меню (Графики) (Диаграммы рассеяния)

2) Переменные с интервальной и с номинальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений).

3) Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные.

-Переменные с интервальной и с номинальной шкалой: коэффициент корреляции Пирсона (корреляция моментов произведений).

- По меньшей мере, одна из двух переменных имеет порядковую шкалу либо не является нормально распределённой: ранговая корреляция по Спирмену или т (тау) Кендала.

Создание и редактирование графических изображений одномерного распределения.

Результаты частотного распределения можно представить графически. Для примера мы создадим столбчатую диаграмму для частотного распределения основных специальностей. Поступите следующим образом:

Выберите в меню команды (Анализ) (опис. статистики) (Частоты) - Перенесите переменную в список выходных переменных.- Щелкните на кнопке (Диаграммы). Откроется диалоговое окно (Частоты: Диаграммы).Также можно выбрать гистограмму, круговую диаграмму и столбиками.

Выберите в группе (Тип диаграммы) пункт (Столбчатая диаграмма), а в группе (Значения диаграммы) — пункт (Проценты). Подтвердите выбор кнопкой (Продолжить).

В диалоговом окне Частоты снимите флажок (Показывать частотные таблицы). — Щелкните на кнопке ОК. Диаграмма будет показана в окне просмотра.

Щелкнув на диаграмму откроется окно редактирования диаграммы. В редакторе диаграмм (Элементы-Показать мекти данных) можно выбрать отображение процентов.

4. Компьютерные технологии анализа количественных переменных в SPSS. Использование процентилей при обработке количественных переменных в SPSS.

1)Анализ- описательные статистики- частоты (выбрать возраст или другое(среднее, медиана, квартили)

2) файл расщепления – сравнить группы(выбрать б12) – частоты(выбрать возраст)

Сортировка и расщепление наблюдений на группы в SPSS.

Файл разбиения

Файл разбиения "расщепляет" данные файла на отдельные группы для анализа, в соответствии со значениями одной или нескольких группирующих переменных. Если задано несколько группирующих переменных, то наблюдения будут группироваться по значениям каждой переменной внутри групп, образованных значениями предыдущей переменной в списке Группы образуются по. Если, например, вы выберете пол, а затем национальность , то наблюдения будут отсортированы сначала по значениям переменной пол, а затем внутри каждой полученной категории - по значениям переменной национальность.

  • Можно задать до 8-ми группирующих переменных.
  • Каждые 8 байтов длинной текстовой переменной (с длиной более 8 байтов) считаются отдельной переменной, вплоть до достижения предела восьми группирующих переменных.
  • Наблюдения должны быть отсортированы по значениям группирующих переменных и в том же порядке, что и переменные в списке Группы образуются по. Если файл данных еще не отсортирован, выберите альтернативу Сортировать по группирующим переменным .

Сравнить группы. Группы разбиения представляются вместе для сравнения. В случае сводных таблиц - создается одна таблица, в которую включаются группирующие переменные, причем после построения их можно свободно перемещать между строками, столбцами и слоями таблицы. В случае диаграмм - для каждой группы в файле разбиения создается отдельная диаграмма, и эти диаграммы выводятся вместе в средстве просмотра.

Организовать вывод по группам. Все результаты каждой процедуры выводятся отдельно для каждой группы разбиения.

Как расщепить файл

  1. Выберите в меню:

Данные> Расщепить файл...

  1. Выберите Сравнить группы или Организовать вывод по группам .
  2. Выберите одну или несколько группирующих переменных.

Если файл данных еще не отсортирован по значениям группирующих переменных, выберите Сортировать по группирующим переменным .

6. Технология отбора данных в SPSS с помощью задания условий.

. Чтобы применить фильтрацию (отбор) наблюдений, необходимо выбрать:

Данные

Отобрать наблюдения
Команда Отобрать наблюдения выбирает из всей совокупности наблюдений подмножество (подвыборку) разными способами –

Ø это может быть случайная выборка (Random sample of cases), когда случайным образом выбирается определенное число наблюдений. Это бывает полезно, если обрабатывается не весь файл, а только его часть с целью сокращения времени предварительного анализа.

Ø а может быть выборка по условию (If condition is satistfied).Из файла данных выбираются только те наблюдения, которыее удовлетворяют некоторому условию. В качестве условия следует задать логическое выражение. Для каждого наблюдения оно принимает либо истинное, либо ложное значение, либо не принимает никакого значения. Если условие истинно, то наблюдение выбирается, в противном случае — отбрасывается.

Компьютерные технологии анализа категориальных переменных в SPSS. - student2.ru Компьютерные технологии анализа категориальных переменных в SPSS. - student2.ru

Ø Нажимаем кнопку __if__ , чтобы задать условия отбора наблюдений. Компьютерные технологии анализа категориальных переменных в SPSS. - student2.ru

Ø Наблюдения, не попавшие в указанное подмножество, не используются в дальнейшем анализе. Их как будто нет, однако они сохраняются в исходном файле данных. Визуально их легко выделить, так как соответствующий им номер строки перечеркнут. Данная операция действует только в пределах текущего сеанса работы. При повторной загрузке файла данных снова доступна вся совокупность. Если же в течение того же сеанса вы хотите вернуться к полной выборке, то надо снять фильтр, снова выполнив команду Отобрать наблюдения , но ужевыбравопцию Все наблюдения..

Наши рекомендации