Комплексное вычисление статистик

По стандартным программам производится вычисление как основ­ных совокупностей статистик, представленных нами выше, так и до­полнительных, не включенных в наш обзор. Иногда получением этих характеристик исследователь и ограничивается, но чаще совокупность этих статистик представляет собой лишь блок, входящий в более ши­рокое множество показателей изучаемой выборки, получаемых по бо­лее сложным программам. В том числе по программам, реализующим приводимые ниже методы статистического анализа.

Корреляционный анализ

Сводится к вычислению коэффициентов корреляции в самых раз­нообразных соотношениях между переменными. Соотношения задаются исследователем, а переменные равнозначны, т. е., что является причи­ной, а что следствием, установить через корреляцию невозможно. Кро­ме тесноты и направленности связей метод позволяет установить фор­му связи (линейность, нелинейность) [6, 27]. Надо заметить, что нели­нейные связи не поддаются анализу общепринятыми математическими и статистическими методами. Данные, относящиеся [25] к нелинейным зонам (например, в точках разрыва связей, в местах скач­кообразных изменений), характеризуют через содержательные описа­ния, воздерживаясь от формально-количественного их представления [17, с. 17-23]. Иногда для описания нелинейных явлений удается применить непараметрические математико-статистические ме­тоды и модели. Например, используется математическая теория катаст­роф [62, с. 523-525].


Дисперсионный анализ

В отличие от корреляционного анализа этот метод позволяет вы­являть не только взаимосвязь, но и зависимости между переменными, т. е. влияние различных факторов на исследуемый признак. Это влия­ние оценивается через дисперсионные отношения. Изменения изучае­мого признака (вариативность) могут быть вызваны действием отдель­ных известных исследователю факторов, их взаимодействием и воз­действиями неизвестных факторов. Дисперсионный анализ позволяет обнаружить и оценить вклад каждого из этих влияний на общую вари­ативность исследуемого признака. Метод позволяет быстро сузить поле влияющих на изучаемое явление условий, выделив наиболее существен­ные из них. Таким образом, дисперсионный анализ — это «исследова­ние влияния переменных факторов на изучаемую переменную по дис­персиям» [80, с. 340]. В зависимости от числа влияющих переменных различают одно-, двух-, многофакторный анализ, а в зависимости от характера этих переменных — анализ с постоянными, случайными или смешанными эффектами [18, 80, 87]. Дисперсионный анализ широко применяется при планировании эксперимента.

Факторный анализ

Метод позволяет снизить размерность пространства данных, т. е. обоснованно уменьшить количество измеряемых признаков (перемен­ных) за счет их объединения в некоторые совокупности, выступаю­щие как целостные единицы, характеризующие изучаемый объект. Эти составные единицы и называют в данном случае факторами, от кото­рых надо отличать факторы дисперсионного анализа, представляющие [26] собой отдельные признаки (переменные). Считается, что именно совокупность признаков в определенных комбинациях может харак­теризовать многие явления или закономерность их развития, тогда как по отдельности или в других комбинациях эти признаки не дают информации. Как правило, факторы не видны «на глаз», скрыты от непосредственного наблюдения. Особенно продуктивен факторный анализ в предварительных исследованиях, когда необходимо выделить в первом приближении скрытые закономерности в исследуемой обла­сти. Основой анализа является матрица корреляций, т. е. таблицы ко­эффициентов корреляции каждого признака со всеми остальными (принцип «все со всеми»). В зависимости от числа факторов в корре­ляционной матрице различают однофакторный (по Спирмену), би­факторный (по Холзингеру) и многофакторный (по Терстону) ана­лизы. По характеру связи между факторами метод делится на анализ с ортогональными (независимыми) и с облическими (зависимыми) факторами. Существуют и иные разновидности метода [9, 31, 46, 57, 85]. Весьма сложный математический и логический аппараты фактор­ного анализа часто затрудняют выбор адекватного задачам исследо­вания варианта метода. Тем не менее популярность его в научном мире растет с каждым годом.

Регрессионный анализ

Метод позволяет изучать зависимость среднего значения одной ве­личины от вариаций другой (других) величины. Специфика метода зак­лючается в том, что рассматриваемые величины (или хотя бы одна из них) носят случайный характер. Тогда описание зависимости распадает­ся на две задачи: 1) выявление общего вида зависимости и 2) уточнение этого вида путем вычисления оценок параметров зависимости. Для ре­шения первой задачи стандартных методов не существует, и здесь произ­водится визуальный анализ корреляционной матрицы в сочетании с ка­чественным анализом природы исследуемых величин (переменных). Это требует от исследователя высокой квалификации и эрудиции. Вторая за­дача по сути есть нахождение аппроксимирующей кривой. Чаще всего эта аппроксимация осуществляется с помощью математического метода наименьших квадратов [11, 23, 27].

Таксономический анализ

Метод представляет собой математический прием группировки данных в классы (таксоны, кластеры) таким образом, чтобы объекты, входящие в один класс, были более однородны по какому-либо призна­ку по сравнению с объектами, входящими в другие классы. В итоге по­является возможность определить в той или иной метрике расстояние между изучаемыми объектами и дать упорядоченное описание их взаи­моотношений на количественном уровне [26, 52, 84]. В силу недоста­точной проработанности критерия эффективности и допустимости кла­стерных процедур данный метод применяется обычно в сочетании с другими способами количественного анализа данных. С другой сторо­ны, и сам таксономический анализ используется как дополнительная страховка надежности результатов, полученных с использованием дру­гих количественных методов, в частности, факторного анализа. Суть кластерного анализа позволяет рассматривать его как метод, явно со­вмещающий количественную обработку данных с их качественным анализом. Поэтому причислить его однозначно к разряду количествен­ных методов, видимо, не правомерно. Но поскольку процедура метода по преимуществу математическая и результаты могут быть представле­ны численно, то и метод в целом будем относить к категории количе­ственных.

Шкалирование

Шкалирование в еще большей степени, чем таксономический ана­лиз, совмещает в себе черты количественного и качественного изуче­ния реальности. Количественный аспект шкалирования состоит в том, что в его процедуру в подавляющем большинстве случаев входят изме­рение и числовое представление данных. Качественный аспект шка­лирования выражается в том, что, во-первых, оно позволяет манипули­ровать не только количественными данными, но и данными, не имею-[28]щими единиц измерения, а во-вторых, включает в себя элементы каче­ственных методов (классификации, типологизации, систематизации).

Еще одной принципиальной особенностью шкалирования, затруд­няющей определение его места в общей системе научных методов, яв­ляется совмещение в нем процедур сбора данных и их обработки. Мож­но даже говорить о единстве эмпирических и аналитических процедур при шкалировании. Не только в конкретном исследовании трудно ука­зать на последовательность и разнесенность этих процедур (они часто совершаются одновременно и совместно), но и в теоретическом плане не удается обнаружить стадиальную иерархию (невозможно сказать, что первично, а что вторично).

Третий момент, не позволяющий однозначно отнести шкалирова­ние к той или иной группе методов, — это его органическое «враста­ние» в специфические области знания и приобретение им наряду с при­знаками общенаучного метода признаков узкоспецифических. Если другие методы общенаучного значения (например, наблюдение или эк­сперимент) можно довольно легко представить как в общем виде, так и в конкретных модификациях, то шкалирование на уровне всеобщего без потери необходимой информации охарактеризовать весьма непрос­то. Причина этого очевидна: совмещение в шкалировании эмпиричес­ких процедур с обработкой данных. Эмпирика конкретна, математика абстрактна, поэтому срастание общих принципов математического ана­лиза со специфическими приемами сбора данных дает указанный эф­фект.

Осознав все эти факторы, мы все же помещаем шкалирование в разряд количественных методов обработки данных, поскольку на прак­тике шкалирование встречается в двух ситуациях. Первая — это построение шкал, а вторая — их использова­ние. В случае с построением все упомянутые особенности шкалирова­ния проявляются в полной мере. В случае же использования они отхо­дят на второй план, поскольку применение готовых шкал (например, «стандартных» шкал при тестировании) предполагает просто сравнение-[29] с ними показателей, полученных на этапе сбора данных. Кроме того, формальное построение шкал, как правило, выносится за пределы непосредственных измерений и сбора данных об объекте, т. е. основные шкалообразующие действия математического характера проводятся после сбора данных, что сопос­тавимо с этапом их обработки.

В самом общем смысле шкалирование есть способ познания мира через моделирование реальности с помощью формальных (в первую очередь, числовых) систем. Применяется этот способ практически во всех сферах научного познания (в естественных, точных, гуманитар­ных, социальных, технических науках) и имеет широкое прикладное значение.

Наиболее строгим определением представляется следующее: шка­лирование — это процесс отображения по заданным правилам эм­пирических множеств в формальные.Под эмпирическим множе­ством понимается любая совокупность реальных объектов (людей, животных, явлений, свойств, процессов, событий), находящихся в оп­ределенных отношениях друг с другом. Эти отношения могут быть пред­ставлены четырьмя типами (эмпирическими операциями): 1) равенство (равно — не равно); 2) ранговый порядок (больше — меньше); 3) ра­венство интервалов; 4) равенство отношений.

Под формальным множеством понимается произвольная совокуп­ность символов (знаков, чисел), связанных между собой определенны­ми отношениями, которые соответственно эмпирическим отношениям описываются четырьмя видами формальных (математических) опера­ций: 1) «равно — не равно» (= ≠); 2) «больше — меньше» (> <); 3) «сло­жение — вычитание» (+ -); 4) «умножение — деление» (* :).

При шкалировании обязательным условием является взаимооднозначное соответствие между элементами эмпирического и формаль­ного множеств. Это означает, что каждому элементу первого множе-[30]ства должен соответствовать только один элемент второго, и наоборот. При этом взаимооднозначное соответствие типов отношений между элементами обоих множеств (изоморфизм структур) не обязательно. В случае изоморфности этих структур производится так называемое пря­мое (субъективное) шкалирование, при отсутствии изоморфизма про­изводится косвенное (объективное) шкалирование.

Итогом шкалирования является построение шкал(лат. scala — 'лестница'), т. е. некоторых знаковых (числовых) моделей исследуемой реальности, с помощью которых можно эту реальность измерить. Та­ким образом, шкалы являются измерительными инструментами. Об­щее представление обо всем многообразии шкал можно получить из работ [21, 22], где приведена их классификационная система и даны краткие описания каждого вида шкал.

Отношения между элементами эмпирического множества и соот­ветствующие допустимые математические операции (допустимые пре­образования) обуславливают уровень шкалирования и тип получаемой шкалы (по классификации С. Стивенса). Первому, наиболее простому типу отношений (= ≠) соответствуют наименее информативные шка­лы наименований,второму (> <) — шкалы порядка,третьему (+ -) — шкалы интервалов,четвертому (* :) — самые информативные шка­лы отношений.

Одномерное шкалирование— это про­цесс отображения эмпирического множества в формальное по одному критерию. Получаемые одномерные шкалы отображают либо отноше­ния между одномерными эмпирическими объектами (или одними и теми же свойствами многомерных объектов), либо изменения одного свой­ства многомерного объекта. Реализуется одномерное шкалирование с помощью методов и прямого (субъективного), и косвенного (объектив­ного) шкалирования. [32]

Под многомерным шкалированиемпонимается процесс отобра­жения эмпирического множества в формальное одновременно по не­скольким критериям. Многомерные шкалы отражают либо отношения между многомерными объектами, либо одновременные изменения не­скольких признаков одного объекта. Процесс многомерного шкалиро­вания в отличие от одномерного характеризуется большей трудоемкос­тью второго этапа, т. е. формализации данных. В связи с этим привле­кается мощный статистико-математический аппарат, например, кластерный или факторный анализы, входящие неотъемлемой частью в методы многомерного шкалирования.

Исследование проблем многомерного шкалирования связано сименами Ричардсона и Торгерсона, предложивших его первые модели. Начало разработкам методов неметрического многомерного шкалиро­вания положил Шепард. Наиболее распространенный и впервые теоре­тически обоснованный алгоритм многомерного шкалирования предло­жил Краскал. Обобщение сведений по многомерному шкалированию провел М. Дейвисон [25].

Косвенное,или объективное, шкалирование— это процесс отображения эмпирического множества в формальное при вза­имном несоответствии (отсутствие изоморфизма) между структурами этих множеств.Прямое,или субъективное, шкалированиепредставляет собой процесс отображения эмпирического множества в формальное при вза­имооднозначном соответствии (изоморфизм) структур этих множеств.

В заключение обзора метода шкалирования надо указать на про­блему его соотношения с измерением. На наш взгляд, эта проблема обус­ловлена отмеченными выше особенностями шкалирования: 1) совме-[34]щением в нем эмпирических процедур сбора данных и аналитических процедур обработки данных; 2) единством количественного и качествен­ного аспекта процесса шкалирования; 3) сочетанием общенаучности и узкопрофильности, т. е. «срастанием» общих принципов шкалирова­ния со специфическими процедурами конкретных методик.

Часть исследователей в явном или неявном виде отождествляет понятия «шкалирование» и «измерение» [24, 32, 35, 58, 90, 92, 95]. На эту точку зрения особенно сильно «работает» авторитет С. Стивенса, который измерение определял как «приписывание числовых форм объектам или событиям в соответствии с определенными правилами» и тут же указывал, что подобная процедура ведет к построению шкал [77, с. 20, с. 51]. Но поскольку процесс разработки шкалы есть процесс шкалирования, то в итоге получаем, что измерение и шкалирование — одно и то же. Противоположная позиция состоит в том, что с измерени­ем сопоставляется только метрическое шкалирование, связанное с по­строением интервальных и пропорциональных шкал [79, 88, 91].

Представляется, что вторая позиция строже, поскольку измерение предполагает количественное выражение измеряемого, а следователь­но, наличие метрики. Острота дискуссии может быть снята, если изме­рение понимать не как исследовательский метод [24, 35], а как инстру­ментальное сопровождение того или иного метода, в том числе шкали­рования.

Кстати, метрология (наука об измерениях) в понятие «измерение» включает как его обязательный атрибут средства измерения [12, 48]. Для шкалирования же (по крайней мере, для неметрического шкалиро­вания) измерительные средства необязательны.

Наши рекомендации