Два подхода к классификации как методу
В логике выделяется два подхода к классификации.
- Классификация как установление родо-видовых отношений. В результате получается система понятий последовательно снижающегося ранга. В географии чаще всего это выражается в соотношении территориальных таксономических единиц: зона, район, подрайон, микрорайон.
- Классификация как разбиение множества объектов на подмножества в зависимости от сходства и различия их в определенном отношении. Это, например, выделение качественно различных (типологических) районов на одном таксономическом уровне. Большой опыт в этом отношении имеется в природном районировании стран и районов.
Таким образом, в первом определении классификация понимается как система понятий,во втором— как система множеств. В первом случае классификация рассматривается с точки зрения содержания понятий, во втором — с точки зрения объемов понятий. Д. Л. Арманд первый вид классификации называл «вертикальным» разделением, или «таксономией в районировании», а второй — «горизонтальным» делением объектов, равных по рангам (как уже отмечалось, деление на одном уровне таксономии — это выделение типов районов).
Районирование как познавательная процедура — это частный случай классификации. Оно включает два больших класса:
- первый из них — классификация по сходству признаков, в результате чего выделяются однородные географические районы;
- второй — классификации по связям, в результате чего проводится узловое географическое районирование.
В логике установлены строгие правила классификации, т.е. операция деления объема понятия занормирована специально разработанными и словесно сформулированными правилами еще со времен Аристотеля. Все классификации подчиняются четырем основным правилам деления объема понятия. Понятие, объем которого делится, называется родовым, а новые понятия, полученные в результате деления, — видовыми.
Правило 1.На одном и том же уровне деления нужно применять одно и то же основание.
При многоступенчатых классификациях, которые нередко встречаются в географии, выдерживается на каждой ступени свое (и только одно!) основание деления.
В географии встречается немало трудностей, связанных с несопоставимостью оснований классификации и типологии. Например, типология территориальных структур стран затрудняется несопоставимостью сеток их территориального деления, сеток экономического районирования, что, в свою очередь, может быть связано с различиями в размерах территории и конфигурации.
Правило2. Соразмерности деления. Сумма выделенных видов (классов) должна быть равна объему классифицируемого родового понятия. Другими словами, после классификации (как деления объема понятия) ничего не должно оставаться «лишнего» или добавляться. Например, родовое понятие — земельные сельскохозяйственные угодья — включают пять видовых понятий: 1) пашня; 2) залежи; 3) многолетние насаждения; 4) сенокосы; 5) пастбища. Остальные земли — несельскохозяйственные.
Правило 3.Непересекаемости классов. Выделенные виды (классы) должны исключать друг друга, чтобы ни один из классифицируемых объектов нельзя было отнести к двум видам.
Правило 4.Непрерывности деления. Классификация («вертикальное» деление) должна быть непрерывной, т.е. при делении нельзя пропускать логические ступени. Поэтому сложные классификации строятся в виде дерева («корнем» вверх). Этот графический прием называется деревом логических возможностей. Он применяется к качественным классификациям.
В полевых условиях работы географа-страноведа дерево логических возможностей, созданное в кабинетных условиях, проверяется и превращается в дерево фактических (региональных) возможностей, или, что точнее, в региональное классификационное дерево. В нем точки означают понятия, а линии — связи между ними. Использование «деревьев» помогает составлять сложные, но логически выдержанные легенды карт, делает классификации обозримыми.
Комплексные классификацииГеография всегда стремилась к комплексным классификациям, т.е. к классификациям по более или менее значительному числу признаков. Делалось это таким образом: проводилась классификация по какому-нибудь одному признаку (например, по валовому внутреннему продукту на душу населения), а остальные признаки факультативно приписывались как сопутствующие ведущему. Правда, хотя сторонники комплексных классификаций так практически всегда поступают, но чаще всего они же умалчивают о наличии ведущего признака, что мистифицирует и затемняет метод. Почему можно об этом так прямо заявлять? Дело в том, что человеческий мозг в состоянии сопоставить до семи факторов. На помощь приходят математика и ЭВМ, для которых число сопоставляемых факторов равно бесконечности.
Для классификации используются чаще всего математико-статистические методы, с помощью которых первоначальное большое число признаков (переменных) сокращается до значительно меньшего (обозримого) числа комплексных характеристик. На основе этих интегрированных характеристик проводится типология исходных территориальных единиц. Один из самых простых методов — метод «вроцлавской таксономии», с которым можно начать знакомство с сутью многомерных количественных классификаций. Гораздо более сложные методы типологии разработаны в 1990-е годы.
Конечно, применение количественных классификаций с использованием ЭВМ прогрессивно и неизбежно. Это углубляет наши познания. Однако есть и некоторые ограничения. Этот метод не так объективен, как это может показаться неискушенному исследователю. Уже на первоначальном этапе отбор характеристик зависит от интуиции исследователя, от накопленных знаний и наличия соответствующих знаний, т.е. от априорной схемы классификации. С субъективными суждениями связан и выбор приемлемого числа признаков.
Но самая главная трудность — это анализ и интерпретация результатов машинной обработки, т.е. анализ коэффициентов нагрузки для данного ряда показателей корреляции. «... Интерпретация (если она возможна) в значительной степени зависит от предпочтения, оказываемого исследователем определенной теории или схеме понятий».
Еще больший недостаток машинной классификации состоит в том, что правила математики заставляют переводить качественные характеристики на количественный язык, в результате чего на выходе увеличивается неопределенность информации. Полученные типы могут вовсе не приближать, а отдалять от реальных структур. Потеря качества — слишком дорогая цена за простоту алгоритма и многомерность полученных типов.