Шкалы представления данных
Определение надлежащей шкалы представления данных позволяет выбрать адекватный метод статистического анализа. Общепринятыми и широко используемыми являются следующие четыре шкалы измерения: номинальная, порядковая, интервальная и отношений. Номинальная и порядковая шкалы являются качественными, а интервальная и отношений – количественными.
Более сложные виды анализа (параметрические), например, проверка по F-критерию или t-критерию, применяются для количественных данных, тогда как другие, менее мощные (непараметрические) виды анализа данных, подобные проверке по критерию χ2 и ранговой корреляции Спирмена (Spearman), применяются для категориальных данных.
Пример порядковой шкалы для обозначения уровня спортивного мастерства: 0 – мсмк 1 – мс 2 – кмс 3 – 1-й разряд 4 – 2-й разряд 5 – 3-й разряд |
Номинальные данные используются также для идентификации отдельных представителей какого-то класса. Так, каждому участнику исследований часто присваиваются свой уникальный номер (например, идентификационный номер испытуемого – №).
Анализ числовых величин номинального уровня ограничен операциями, подобными проверке по критерию χ2, и описательными статистическими характеристиками, такими как частота и мода. Мы можем лишь определить, сколько элементов относится к каждому классу. Номинальные данные часто используются в качестве независимой переменной для сортировки представителей по классу при сравнении результатов тестов или других зависимых (выходных) переменных.
Порядковая шкала.Когда данные носят категориальный характер, но ранжированы внутри категорий, их называют порядковыми. Рассмотрим, например, случай присвоения номеров братьям и сестрам в соответствии с их порядком рождения. Старший ребенок получает номер 1, следующий за ним – номер 2 и т. д. Глядя на эти величины, мы получаем представление о порядке появления детей на свет, однако нельзя ничего сказать о том, насколько один ребенок старше другого. Если в семье три ребенка, нельзя утверждать, что самый старший в два раза старше самого младшего.
Так же проводится ранжирование спортсменов на соревнованиях. Лучший спортсмен получает 1-е место, следующий за ним – 2-е место и т. д. Но нельзя ничего сказать о том, насколько один спортсмен лучше другого. Если в рейтинге указаны несколько спортсменов, то это не значит что спортсмен с рейтингом 1 лучше спортсмена с рейтингом 2 также как спортсмен с рейтингом 2 лучше спортсмена с рейтингом 3 и т. д. Для порядковых данных можно использовать те же описательные статистические показатели, что и для номинальных; однако можно также использовать ранговые (порядковые) статистические характеристики, подобные корреляции Спирмена и проверке по критерию Манна-Уитни (Mann-Whitney).
Интервальная (относительная) шкала.Если данные ранжированы и интервалы между всеми последовательными величинами равны, уровень оценки называют интервальной шкалой. Примечательной особенностью интервальных данных является то, что они обходятся без такой величины, как «истинный» нуль. Примерами интервальных данных являются температурная шкала Цельсия, возраст, календарная хронология. Так нулевой отметке термометра соответствует определенная температура; когда мы появляемся на свет, наш возраст не равен нулю; а настоящее учебное пособие написано в 2008 г. от Рождества Христова, в 7516 г. от сотворения мира и примерно через 12 млрд. лет после образования Солнечной Системы. Интервальные данные являются количественными, и к ним применимы практически все виды статистического анализа и описательной статистики, если только метод не требует наличия «истинного» нуля, который не является свойством интервальных данных.
Шкала отношений (абсолютная).Измерения на шкале отношений включают в себя «истинный» нуль и обладают всеми свойствами других шкал измерения, а также при желании могут быть преобразованы в интервальные, порядковые и номинальные данные. Примерами измерений на шкале отношений являются расстояние, высота и промежуток времени. Отметка «нуль сантиметров» указывает на отсутствие расстояния или высоты, а нулевая отметка времени – на то, что еще ничего не произошло. Данные этого уровня позволяют произвести относительные сравнения. Четыре сантиметра – это половина от восьми сантиметров, а 300 млс. – это удвоение промежутка времени, равного 150 млс. Относительные числа обладают всеми свойствами действительных чисел, поэтому к ним применимы все виды описательной статистики и статистического анализа.