Использование статистические методы для обработки, анализа и визуализации данных.
Параметры генеральной совокупности оцениваются по статистикам – характеристикам выборки. Проверка гипотез осуществляется относительно значений параметров или связей между двумя или несколькими переменными.
Переменные могут быть зависимыми – их значения могут изменятся в зависимости от значений какой-либо другой переменной.
Пример независимых переменных: уровень образования не зависит от размера среднегодового дохода.
Пример зависимых переменных: уровень образования зависит от места проживания (например, для населения города или села).
Выявление зависимости одной переменной от другой зачастую представляется удобным, если исследователь использует таблицы сопряженности,которые отображают связи или отношения между качественными признаками. Пример таблицы сопряженности приведен ниже.
Таблица 1. Вид деятельности и удовлетворенность оплатой труда.
УДОВЛЕТВОРЕННОСТЬ РАЗМЕРОМ ОПЛАТЫ ТРУДА | ВИД ДЕЯТЕЛЬНОСТИ | ВСЕГО | |
РАБОЧИЙ | СЛУЖАЩИЙ | ||
Низкая | |||
Высокая | |||
ВСЕГО |
Если изучается связь между независимой и зависимой переменной, то зависимая чаще размещается в строках (удовлетворенность оплатой труда), а независимая (вид деятельности) в столбцах. Если в таблице рассчитываются проценты, то они размещаются по направлению независимой переменной.
Таблица 2 показывает связь между местом проживания и предпочитаемой формой досуга. Тело таблицы показывает измерения выборки 469 респондентов из четырех различных городов. Место проживания рассматривается как независимая переменная, и считается, что форма досуга зависит от места проживания. Проценты рассчитаны для независимой переменной (в столбце), чтобы показать процент людей, предпочитающих ту или иную форму досуга, в зависимости от места проживания. Если сложить проценты в любом столбце, получим 100%.
Таблица 2. Форма досуга и место жительства,
% от опрошенных.
ФОРМА ДОСУГА | МЕСТО ЖИТЕЛЬСТВА | ||
МОСКВА | ПИТЕР | КРАСНОДАР | |
спорт | 13,2 | 28,4 | 32,4 |
автомобили | 64,1 | 43,3 | 12,4 |
компьютер | 22,7 | 28,3 | 56,2 |
итого |
Тема 2. Измерения. Шкалы.
В социологии измерения вызывают определенные трудности, так как в большинстве случаев исследователю приходится иметь дело с объектами, так называемой, нечисловой природы. Однако эти объекты могут быть описаны количественно, с помощью характеристик, то есть изучаемым объектам или явлениям присваиваются числовые значения.
Измерение – присвоение чисел характеристикам изучаемых объектов или явлений.
Измеряется не сам объект, а его отдельные характеристики.
Шкала – это алгоритм, в соответствии с которым изучаемым объектам или явлениям присваиваются числа.
Собранные в ходе наблюдения данные подлежат автоматической обработке на компьютере, поэтому логично каждому зафиксированному признаку поставить в соответствие определенно число. Например, для признака «пол» присваиваем «мужчина»=1, «женщина»=2 или для признака «брачное положение»: «состоит в браке»=1, «никогда не состоял в браке»=2, «разведен»=3, «вдов»=4. Числовые данные могут быть дискретными как в случае, описанном выше, так и непрерывными. Например, возраст респондента может быть дискретной величиной, по числу прожитых лет или непрерывной, если использовать, например, пятилетние интервалы.
Итак, дискретные значения признака выражают конкретным натуральным числом, непрерывные могут принимать любое значение в некотором интервале. В социальных исследованиях чаще имеют дело с дискретными данными.
Для проведения измерения в социологии необходимо выбрать один из пяти типов шкал в соответствии с имеющимися типами данных:
Шкала | Особенности шкалы | Примеры данных, измеряемых шкалой | Операции, применимые к результатам шкалирования и допустимые статистики |
Номинальная (дискретна) | Содержит категории для классификации объектов, явлений по некоторому признаку. Результаты измерений, полученных с помощью этой шкалы, не могут быть упорядочены или подвергнуты математическим операциям. | Пол, профессия, брачное состояние, увлечения. Объектам присваивают числовые значения: «м» = 1, «ж» = 2 | Ранжирование качественных признаков. Число случаев, мода, корреляция качественных переменных. |
Порядковая (дискретна) | Содержит упорядоченные категории, позволяющие сравнивать единицы выборки по некоторому признаку. К результатам шкалирования неприменима операция разности. | Занятое в ходе спортивного соревнования место. | Сравнение значений признаков («лучше-хуже», «выше-ниже»). Медиана, ранговая корреляция. |
Интервальная (непрерывна) | Позволяет указать количественное значение измеряемого признака, с которым можно проводить операции сложения, вычитания, умножения и деления. | Измерение возраста, температуры, времени. | Количественное сравнение значений признаков («больше/меньше на столько-то или во столько-то раз»). Среднее арифметическое, корреляция количественных переменных. |
Относи-тельная (непрерывна) | Отличается от интервальной только наличием точки отсчета, что позволяет строить отношение значения признака к этой точке. | Измерение роста. | Количественное сравнение значений признаков («больше/меньше на столько-то или во столько-то раз»). Все операции математической статистики. |
Дихото-мическая | Является номинальной шкалой, содержащей только две категории. К результатам шкалирования могут быть применены некоторые арифметические операции, например, деления. | «да»=1, «нет»=0. | Количественное сравнение значений признаков (доля носителей признака в общем числе выборки) |
Итак, измерения необходимы для определения характеристик и выявления закономерностей и взаимозависимостей изучаемых социальных явлений. Измерения должны быть надежны, т.е. должны позволить получить тот же результат для изучаемого объекта в тех же условиях, они должны быть достоверными, т.е. адекватно отображать действительность, используемая шкала должна содержать все возможные значения признака.
Номинальные шкалы позволяют описывать наблюдения в терминах качественных признаков. Порядковые шкалы позволяют упорядочить объекты по некоторой характеристике от меньшего к большему. Номинальные и порядковые шкалы являются дискретными. Интервальные шкалы и шкалы отношений содержат равные интервалы, позволяющие определить количественное значение признака. Дихотомические шкалы являются уникальными номинальными, с которыми можно осуществлять те же действия, что и с интервальными.