Система классификации и кодирования геоэкологической информации
Организация любой машинной обработки геоэкологической информации не возможна без решения вопросов классификации и кодирования объектов и характеризующих их показателей. В проблеме создания АИПС ГЭМ эти вопросы еще более актуальны. Это обусловлено тем, что для нормального функционирования АИПС ГЭМ, в отличие от многих других информационных систем, необходима информационная база, содержащая показатели не только текущего состояния геоэкологической среды, но и большой объем данных ретроспективного характера. Чем больше ретроспективной информации хранится в ГЕОБАНКЕ, тем больше вероятность правильного диагноза текущего состояния геоэкологической среды и разработки модели, позволяющей уверенно прогнозировать будущие ее изменения. Однако, в течение длительного периода геоэкологических исследований на изучаемой территории интересующие нас данные получались многими организациями, разными методами. Менялись представления об условиях залегания и образования пород, способы документации геологических выработок. Все это говорит о том, что система классификации объектов предметной области АИПС ГЭМ должна быть очень гибкой и позволять вводить и хранить в ГЕОБАНКЕ практически любую информацию о геоэкологической среде, получавшуюся на пунктах наблюдений в разные годы.
Система классификации и кодирования объектов должна быть достаточно полной и обеспечивать решение всех комплексов задач АИПС ГЭМ. Структура системы АИПС ГЭМ предполагает, что большинство задач решается на нескольких уровнях детальности. При этом, как известно, требуется различный уровень генерализации информации о состоянии геоэкологической среды и воздействующих на нее факторах, получаемой на пунктах наблюдений. Следовательно, система классификации и кодирования информации должна обеспечивать ввод и хранение данных в том виде, в каком они приведены в первоисточнике, а также в генерализованном представлении, необходимом для решения задач определенного типа.
Для решения большинства задач, связанных с диагностикой и прогнозированием состояния геоэкологической среды, необходимо установление однозначного соответствия между наборами показателей, свойств и состояния среды, координатным пространством и исследованием этих показателей. В связи с этим система АИПС ГЭМ должна иметь развитую систему классификации и кодирования объектов территориального деления, позволяющую осуществлять поиск, систематизацию и обработку характеризующих их данных применительно к различным масштабам исследований. При этом, необходимым условием автоматизации решения различных комплексов задач является наличие четких и однозначных правил классификации объектов, их композиции и декомпозиции.
Система классификации и кодирования должна удовлетворять и ряду других требований, имеющих общий характер. Таким образом, по степени сложности, задача создания эффективной словарной системы приближается к задаче создания всей системы организации структуры базы данных. Поэтому на стадии проектирования банка данных этой задаче должно уделяться соответствующее внимание.
В предлагаемой концепции ГЕОБАНКА используется иерархическая и многоаспектная системы классификации. Иерархическая система классификации применяется в тех случаях, когда множество объектов одного типа последовательно подразделяется на более простые объекты по разработанным правилам.
Многоаспектная система классификации предполагает деление множества объектов одновременно по нескольким независимым признакам.
Процесс создания словарной системы проходит в несколько стадий. Сначала определяются общие контуры этой системы, предварительный перечень классификаторов, осуществляется поиск приемов кодирования информации. По мере отработки перечня показателей, хранимых в базе данных, работы с реальными массивами данных, извлекаемых из первоисточников, неизбежны изменения и дополнения словарной системы. При этом важно, чтобы это не приводило к необходимости повторного ввода данных в новой форме.
Одно из главных назначений словарной системы состоит в документировании данных. Так как базы данных обслуживают многих пользователей, крайне необходимо, чтобы они правильно понимали, что представляет собой каждый показатель, и придерживались выработанных соглашений о системах их классификации и кодирования. Эти соглашения в виде определений, описаний, инструкций должны быть точными, недвусмысленными и согласованными.
Словарная система АИПС ГЭМ является проблемно-ориентированной, т.е. учитывает особенности решаемых задач, применяемых математических моделей природных объектов, методов получения информации в разные годы. Поэтому значительная часть классификаторов предназначена для использования в пределах системы. Это значительно упрощает, например, ввод в систему ретроспективной информации, представленной в первоисточниках в нетрадиционной форме. Кроме того, применение локальных классификаторов позволяет, как правило, сократить длину записей значений показателей и упростить их кодовые обозначения. Обмен информации с другими информационными системами в этом случае возможен через специальный интерфейс.
Требования к ГИС
Геоинформационная технология зародилась в начале 60-х годов для автоматизации ряда операций по обработке географических данных. Первые системы создавались при отсутствии программного обеспечения, наличии примитивной вычислительной техники и устройств ввода-вывода графических данных.
Развитие информационных систем шло как по пути увеличения обрабатываемых объемов данных, так и усложнения структуры хранящейся информации. Поэтому информационные массивы, предназначенные для обработки на ЭВМ, организуются в базы данных (БД). Для обеспечения достаточно сложных операций по поиску и выборке данных в БД, их объединению в информационные массивы требуемой структуры разрабатываются системы управления базами данных.
В настоящий момент ГИС представляют собой сложную информационную систему, включающую мощную операционную систему, интерфейс пользователя, системы ведения без данных, отображения графической информации.
Наряду с ГИС широкое распространение получила организация проблемно-ориентированных БД, предназначенных для картографирования природных и социально-экономических явлений. Такие БД называются картографическими банками данных (КБД).
Важнейшая функция КБД заключается в автоматизированном картопостроении, выполняемой автоматизированной картографической системой (АКС), которая является неотъемлемой частью также ГИС.
В последние годы при создании информационных систем (ИС) в географии повышенное внимание уделяется построению экспертных систем (ЭС). Под ЭС понимается система логического вывода, основывающаяся на фактах (знаниях) и эвристических приемах (эмпирических правилах) обработки данных. Основные составляющие части ЭС: 1) база знаний (БЗ) - организованные наборы фактов и 2) механизм логического решения поставленной задачи.
Появление в последние годы массового интереса к построению ГИС требует выработки принципов оценки создаваемых информационных систем, их классификации, определения потенциальных возможностей. В определенной мере это возможно при выработке требований к идеальной ГИС:
1. Возможность обработки массивов покомпонентной гетерогенной пространственно-координированной информации.
2. Способность поддерживать базы данных для широкого класса географических объектов.
3. Возможность диалогового режима работы пользователя.
4. Гибкая конфигурация системы, возможность быстрой настройки системы на решение разнообразных задач.
5. Способность «воспринимать» и обрабатывать пространственные особенности геоэкологических ситуаций.
Разработка ГИС включает этап проектирования структуры, определения целей и задач, потенциальных пользователей. Проектирование ГИС, как сложной информационной системы, требует использования методов системного анализа, с помощью которых решаются следующие задачи:
- построение концептуальной модели ГИС, определение ее подсистем, характера взаимосвязи между ними;
- структуризация географической информации с учетом специфики обработки, хранения и представления на ЭВМ и автоматических устройствах;
- определение этапов преобразования и обработки поступающей природной и социально-экономической информации;
- создание человеко-машинных систем для математического моделирования природных и социально-экономических процессов в структуре ГИС.
Использование информационной технологии в геоэкологии предполагает автоматизацию процессов сбора и анализа параметров геосистем. Получение и обработка информации рассматриваются как единый процесс, включающий ряд последовательных этапов (табл. 1).Этапы информационной технологии в создании и эксплуатации ГИС включают следующие стадии: сбор первичных данных, ввод и хранение данных, анализ данных, анализ сценариев и принятие решений. Необходимо отметить, что выделенные этапы являются наиболее общими и повторяются при создании конкретных ГИС, различаясь в деталях, связанных с целями и задачами ГИС, а также техническими возможностями системы.
Очевидно, что источники информации, процедура ее получения, методы анализа должны рассматриваться как этапы единого технологического процесса, объединяемого общностью целей и задач построения и эксплуатации ГИС. Это означает, что в основу проектирования и создания ГИС должна быть положена единая методология. Поскольку ГИС можно рассматривать как средство машинного представления данных и знаний комплекса наук о Земле, то в качестве методологической основы ГИС должно быть выбрано направление их построения как инструментария познания закономерностей структуры и организации геосистем при помощи средств информатики, включающего математическое моделирование и машинную графику.