Теоретические сведения
Федеральное государственное бюджетное образовательное учреждение
Высшего профессионального образования
«Тульский государственный университет»
Кафедра информационной безопасности
Системный анализ
ЛАБОРАТОРНАЯ РАБОТА № 7
Основы теории измерений: шкалы измерений
Методические указания
для студентов направления 230100
«Информатика и вычислительная техника»
специальности 230101 «Вычислительные машины,
комплексы, системы и сети», специальности 090105 «Комплексное обеспечение информационной безопасности АС»
Тула 2013
ЦЕЛЬ РАБОТЫ
Цель работы: знакомство с понятием шкалы, знакомство с типами шкал и их свойствами, изучение принципов представления измерений в различных шкалах и способов преобразования измерений из одной шкалы в другую.
ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ
Теория измерений – это теория о классификации переменных величин по природе информации. В ходе эксперимента, как правило, осуществляется наблюдение за свойствами изучаемой системы, другими словами, производятся измерения. Важно знать не только, как и что измерять, но и как обрабатывать результаты измерений. Если результаты измерений обработаны неадекватными методами, существует опасность, что полученные выводы о свойствах системы будут неверны. Типы допустимых измерений и типы допустимых преобразований результатов измерений изучает теория измерений.
Современные измерения характеризуются следующими свойствами:
· могут носить как количественный, так и качественный характер (например, анкетирование);
· измерения всегда производятся с погрешностью;
· погрешность измерений может иметь принципиальную природу, так как состояния исследуемой системы определены нечетко;
· часто состояния системы характеризуются скрытым, внутренним свойство, недоступным для измерения.
В процессе исследования могут возникать следующие проблемы:
· проблема измеримости;
· проблема единственности;
· проблема адекватности преобразований измерений.
1. Понятие шкалы
Пусть объекты измерения образуют эмпирическое множество . Пусть на множестве определено отношение , например, в любой паре указан более предпочтительный объект. Тогда множество объектов и отношение образуют эмпирическую систему с отношением предпочтения (предшествования) отношение .
В процессе измерения, как правило, каждому объекту ставится в соответствие некоторая численная оценка его свойства. Измерение эмпирической системы с отношением состоит в определении соответствующей числовой системы . Числовую систему образуют множество чисел и отношение , определенное на множестве .
Соответствие между и устанавливается с помощью гомоморфного отображения эмпирической системы с отношением в числовую систему с отношением . Гомоморфным называется отображение, если для всякой пары выполняется условие .
Шкалой, таким образом, называют тройку .
2. Основные типы шкал
Шкалы измерений принято классифицировать по типам измеряемых данных, которые определяют допустимые для данной шкалы математические преобразования, а также типы отношений, отображаемых соответствующей шкалой.
Тип шкалы определяется типом преобразований, с помощью которых одна числовая система, соответствующая данной эмпирической системе, переводится в другую числовую систему, также соответствующую данной эмпирической системе.
К числу преобразований, характеризующих основные типы шкал, относятся: тождественное, подобия, сдвига, линейное, монотонное и взаимно-однозначное. Чем меньше множество числовых систем, в которые гомоморфно отображается данная эмпирическая система, тем мощнее шкала по набору доступных операций над ее числовыми значениями.
Наименее мощным типом шкалы является номинальная шкала (шкала наименований). Эмпирическая система с отношением эквивалентности измерима в номинальной шкале. Измерение признака в номинальной шкале состоит в разбиении объектов на классы эквивалентности, где объектам одного класса соответствует одно число. В номинальной шкале значения числовой системы определены с точностью до взаимно-однозначного преобразования , где – исходное числовое значение. Это значит, что различным значения некоторого признака можно поставить в соответствие произвольных различных значений .
Примером измерений параметров в номинальной шкале может быть измерение, разделяющее предметы на классы по форме: круглые, прямоугольные, квадратные, треугольные. Таким образом, например, стол может относиться к одному из классов в зависимости от формы: круглый стол относится к классу круглых предметов, прямоугольный – к классу прямоугольных предметов и так далее.
Более мощной является порядковая (ранговая) шкала. Эмпирическая система с отношением линейного порядка измерима в порядковой шкале. Числовые системы, в которые гомоморфно отображается эмпирическая система с отношением линейного порядка, должны сохранять порядок на множестве объектов, соответствующий их ранжированию. В порядковой шкале значения числовой системы определены с точностью до монотонных преобразований.
Примером измерений в шкале порядка может быть измерение параметров, такое, что в зависимости от результатов измерения параметра можно сказать, какой из объектов является более предпочтительным, какой – менее, а также возможно установить, что два объекта являются одинакового предпочтительными согласно измерениям в данной шкале. Например, IT-эксперт может оценивать удобность работы с конкретной моделью компьютера, присваивая каждой модели ранг удобства от 1 до 10. Тогда если ранг первой модели больше ранга второй модели, то по удобству использования первый компьютер будет более предпочтителен, и наоборот. В случае же если ранги (оценки) двух моделей одинаковы, невозможно сказать какая из них предпочтительнее.
Указанные шкалы (номинальная и порядковая) являются качественными шкалами. Более мощными являются количественные шкалы, к которым относят шкалы интервалов, отношений и абсолютную шкалу.
В шкале интервалов значения числовой системы измеряются с точностью до линейного преобразования вида , . В шкале отношений сохраняются отношения разностей численных значений. Примером измерений в шкале интервалов является значение температуры по шкалам Цельсия, Кельвина, Фаренгейта.
В шкале отношений значения числовой системы измеряются с точностью до преобразования подобии вида , . В такой шкале сохраняется отношения численных значений. Измерениями в шкале отношений являются измерения веса, длины и прочих именованных величин, характеризующихся масштабом.
Наиболее мощной является абсолютная шкала. В ней численные значения определяются с точностью до тождественного преобразования . Результаты измерения в абсолютной шкале определяются однозначно, например, число стульев, количество рабочих и т.д. Любое преобразование кроме тождественного исказит эти измерения.
3. Мера различия в номинальной и ранговой шкалах
Во всех номинальных шкалах отношения между объектами характеризуются как принадлежность к одному классу ( ) или к разным классам ( ). Если имеется объектов, то каждый из них характеризуется относительно остальных тем, что он совпадает с ними по классу или нет. Для таких объектов можно ввести меру расстояния между ними.
Пример 1.Пусть даны 6 объектов: , , , , , . Рассмотрим матрицу отличий объектов друг относительно друга, элемент которой указывает на принадлежность объектов в строках и к одному классу ( ) либо к разным классам ( ).
Рассмотрим два объекта в строках и и столбец . Будем считать, что мера различия объектов в строках и относительно объекта равна нулю , если . Будем считать, что мера различия объектов в строках и относительно объекта равна единице , если .
Класс | a | b | a | a | c | b |
a | ||||||
b | ||||||
a | ||||||
a | ||||||
c | ||||||
b |
Тогда различие объектов в строках и в целом оценивается величиной .
Для заданных в примере объектов матрица отличий объектов друг относительно друга примет следующий вид (см. табл.)
Вычислим расстояния между объектами.
;
;
и т. д.
В итоге можно построить матрицу расстояний между объектами исходного множества:
Класс | a | b | a | a | c | b |
a | 0,84 | 0,67 | 0,84 | |||
b | 0,84 | 0,84 | 0,84 | 0,5 | ||
a | 0,84 | 0,67 | 0,84 | |||
a | 0,84 | 0,67 | 0,84 | |||
c | 0,67 | 0,5 | 0,67 | 0,67 | 0,5 | |
b | 0,84 | 0,84 | 0,84 | 0,5 |
Расстояние между объектами, измеренными в номинальной шкале, позволяет работать с такими объекта так же, как если бы их параметры были измерены в количественных шкалах. Это свойство расстояния используется в интеллектуальном анализе данных, а также в случае, если появление объектов того или иного класса имеет вероятностный характер. Действительно, если объекты некоторого класса встречаются редко относительно объектов другого класса, то расстояние между объектами этих классов будет меньше, чем расстояние между объектами, относящихся к двум, встречающихся одинаково часто классам. Таким образом, на основании этого свойства можно моделировать появление объектов классов в системе, если известно лишь то, к какому классу они относятся, то есть имею лишь измерение некоторого их параметра в номинальной шкале.
В шкалах рангового типа объекты связаны отношениями предшествования ( ). Это значит, что количественная характеристика упорядоченных объектов (ранг ) рассматривается только с точки зрения упорядоченности значений: , или , или .Тогда ранги упорядоченных объектов связаны отношениями ( ).
Пример 2.Пусть снова даны 6 объектов с рангами 11, 6, 9, 11, 4, 109. Рассмотрим матрицу отличий объектов друг относительно друга, элемент которой указывает результат сравнения рангов объектов и .
Рассмотрим два объекта в строках и и столбец . Будем считать, что мера различия объектов в строках и относительно объекта равна нулю , если . . Будем считать, что мера различия объектов в строках и относительно объекта равна единице , если , где и , или и . Будем считать, что мера различия объектов в строках и относительно объекта меньше единицы , если , причем возможны два варианта. В первом случае , а или . Во втором случае или , а .
Тогда различие объектов в строках и можно оценить величиной .
Класс | ||||||
= | > | > | = | > | < | |
< | = | < | < | > | < | |
< | > | = | < | > | < | |
= | > | > | = | > | < | |
< | < | < | < | = | < | |
> | > | > | > | > | = |
Для заданных в примере объектов матрица отличий объектов друг относительно друга примет следующий вид:
Вычислим расстояния между объектами.
;
и т.д.
В итоге можно построить матрицу расстояний между объектами исходного множества:
Класс | ||||||
0,42 | 0,47 | 0,58 | 0,25 | |||
0,42 | 0,167 | 0,42 | 0,167 | |||
0,25 | 0,167 | 0,25 | 0,33 | 0,5 | ||
0,42 | 0,25 | 0,58 | 0,25 | |||
0,58 | 0,167 | 0,33 | 0,58 | 0,83 | ||
0,25 | 0,67 | 0,5 | 0,25 | 0,83 |
Если матрица данных образована разнотипными данными, то есть признаками, то каждый ее столбец представляет собой значения -ой характеристики объектов, измеренной в своей шкале, то расстояние между объектами и можно определить как , где – количественная мера различия в соответствующей -ой шкале, то есть это , или , или – обычная разность значений в количественной шкале.
Итак, нахождение расстояния между объектами, измеренными в ранговой шкале, тоже позволяет оперировать объектами так же, как если бы они их характеристики были измерены в количественных шкалах.