Определение типов и значений переменных
Имя | Тип | Ширина | Метка | Значения | Пропуски | Шкала |
id | Числовая | Код сотрудника | Нет | Нет | Количест. | |
gender | Текстовая | Пол сотрудника | Ж-женский М-мужской | Нет | Номинал. | |
bdate | Дата | Дата рождения | Нет | Количест. | ||
job | Числовая | Должность | 0-пропущено 1-секретарь 2-среднее звено 3-менеджер | Порядков. | ||
salary | Доллар | Зарплата | 0-пропущено | Количест. | ||
jobtime | Числовая | Время работы (месяцы) | 0-пропущено | Количест. |
Лекция 15 (07.11)
Частотный анализ и относительная статистика
1. Меры средней тенденции:
• Среднее арифмитическое
• Медиана
• Квартили
• Сумма
• Мода
2. Меры разбросы:
• Размах
• Стандартное (среднее квадратическое отклонение)
Стандартна ошибка среднего (SE) - насколько значение среднего может варьироваться от выборки к выборке из одного распределения.
Считается различным значение средних, если SE меньше -2 или больше 2.
Доверительный интервал позволяет определить вероятность того, что истинное значение среднего находится в диапазоне x = ± 1.96 от стандартной ошибки.
Дисперсия – мера рассеяния, сумма квадратов отклонения значений среднего, делённая на число случаев минус 1.
3. Меры несимметричности распределения:
• Коэффициент асимметрии – мера асимметрии распределения; показывает, насколько симметричным является распределение. Варьируется от -3 до 3.
• Коэффициент вариации (эксцесс) – мера степени сгруппированности значений вокруг среднего. У нормального распределения – 0, положительные значения – сильная концентрация, более длинные хвосты, отрицательные значения – слабая концентрация, короткие хвосты.
Параметр – Оценка = Ошибка оценки.
Ошибкой оценки называют доверительный интервал.
Вывод описательных статистик определяется через пункт меню Анализ – Описательные статистики – Частоты.
Диалоговое окно Статистики позволяет вывести такие меры вариации, как доверительный интервал, медиана, мода, квартили, минимум, максимум и т.д.
Есть возможность выводить частотные таблицы.
Результаты анализа отображаются в окне Вывод, позволяющем сохранить результаты в отдельный файл.
Процентили:
25 - 24000$ - означает, что 25% опрошенных имеют зарплату меньше 24000$.
50 - 28875$ - от 25% до 50% получают от 24 до 28 тыс.
75 - 32162$ - от 50% до 75% получают от 28 до 32 тыс.
Диалоговое окно Частоты предоставляет возможность построения диаграмм. «Диаграмма» - выбор типа: столбиковая, круговая и т.д.
Кнопка «Формат» позволяет ранжировать значения по возрастанию/убыванию.
Диалоговое окно Частоты – Формат позволяет вывести данные по двум переменным по начальной заработной плате и в настоящее время.
Анализ – Описательные статистики – Описательные. Предоставляет возможность расчёта мер вариации, а также вывода переменных в алфавитном порядке.
Таблицы сопряжённости
Пункт меню Анализ – Описательные статистики – Таблицы сопряжённости.
Пункт Ячейки позволяет отобразить процент по строкам/столбцам.
Процент по строке интерпретирует построчное представление данных, то есть, например, относительно получающих данную зарплату.
Процент по столбцам – относительно групп респондентов (М/Ж).
Существует возможность создавать трёхмерные таблицы, использовать при этом поле Слои.
Лекция 16 (13.11)
Частотный анализ
Для определения количества используется функция СЧЁТЕСЛИ и задаётся соответствующий критерий.
Вывод 1: согласно полученным данным 35,7% респондентов очень счастливы, такое же количество респондентов счастливы. Чувствуют себя не слишком счастливыми 14,3%; 14,3% - не счастливы.
71,4% респондентов считают себя счастливыми. 85,7% респондентов считают себя вполне счастливыми.
Рекомендуемые статистические характеристики для переменных, относящихся к различным типам шкал.
Отношение переменных к шкале | Статистические характеристики |
Переменные, относящиеся к интервальной шкале и подчиняющиеся нормальному распределению | Среднее арифметическое, стандартное отклонение, стандартная ошибка, коэффициент асимметрии, эксцесс, размах |
Переменные, относящиеся к порядковой шкале и интервальным переменным, подчиняющимся нормальному распределению | Медиана, квартили, наибольшее и наименьшее значение |
Переменные, относящиеся к номинальной шкале | Мода |
75% счастливых людей имеют высокий доход.
Вывод 2: чем выше доход, тем счастливее люди.
Считают себя в принципе счастливыми людьми со средним и низким доходом по 40% соответственно. 100% респондентов, имеющих средний доход, считают себя не слишком счастливыми. 100% несчастных людей имеют низкий доход.
Лекция 17 (14.11)