Применение экспертно-информационных систем для оценки воздействия на окружающую среду
Проведение любой экологической экспертизы основывается на использовании информации о состоянии окружающей среды и знаний о процессах, в ней происходящих. Информация — это любые сведения о состоянии окружающей среды. Знание — это проверенное практикой, приводящее к правильным предсказаниям отражение действительности. Информация, фиксированная в определенной форме, пригодной для последующей обработки, хранения и передачи, называется данными'. Организованный определенным образом массив данных, хранимый в вычислительной системе, называют базой данных. Комплекс баз данных и специальных методов и средств (программных, организационных и т. п.), позволяющих работать с информацией о состоянии окружающей среды широкому кругу пользователей, называют информационной системой.
Благодаря развитию технологий мультимедиа с помощью компьютеров стало возможным обрабатывать практически любые типы информации об окружающей среде — зарисовки, звуки, видео, и термин «информация» стал часто использоваться как синоним термина «данные». В то же время термин «данные» часто используют для обозначения первичной, цифровой информации о состоянии окружающей среды.
Экспертной системой принято называть систему искусственного интеллекта, которая ведет себя подобно эксперту при решении задач в конкретной проблемной области. Структура экспертной системы определяется следующими модулями:
1) временные базы данных, предназначенные для хранения исходных и промежуточных данных текущей задачи;
2) базы знаний, предназначенные для хранения долгосрочных сведений (фактов) и правил манипулирования данными;
3) базы программ, реализующих последовательность правил для решения конкретной задачи на основе информации, хранящейся в базах знаний и базах данных;
4) компонент приобретения знаний, автоматизирующий процесс наполнения базы знаний;
5) объяснительный компонент, формирующий пояснения о том, как система решала поставленную задачу.
В проблемной области «экологическая безопасность» основной задачей является поддержка принятия решений. Поэтому любые информационные системы, ориентированные на поддержку принятия решений, будем называть экспертно-информационными системами (ЭИС).
6.2.1. Структура экспертно-информационной системы
Считается, что информационные системы, ориентированные на задачи охраны окружающей среды и устойчивое развитие, включают системы экологического мониторинга и служат функциональной основой процесса управления экологически безопасным развитием на различных иерархических уровнях территориального деления. Соответственно, такие системы должны обеспечивать решение множества задач:
• обработку и накопление в базах данных результатов локального и дистанционного мониторинга и выявление параметров окружающей среды, наиболее чувствительных к антропогенным воздействиям;
• анализ результатов экологического мониторинга и подготовку интегрированной информации и электронных карт, отражающих состояние окружающей среды региона;
• накопление информации по временным трендам параметров окружающей среды с целью экологического прогнозирования;
• имитационное моделирование процессов, происходящих в окружающей среде, с учетом существующих уровней антропогенной нагрузки и возможных результатов принимаемых управленческих решений;
• оценку риска для существующих и проектируемых предприятий, отдельных территорий с целью управления безопасностью техногенных воздействий;
• разработку прогнозов вероятных последствий хозяйственной деятельности и рекомендаций по выбору вариантов безопасного развития региона для систем поддержки принятия решения;
• предоставление информации для экологического образования, для средств массовой информации и т.д.
Экспертно-информационные системы должны быть ориентированы на комплексное использование результатов экологического мониторинга, обеспечивая преобразование первичных результатов измерений в форму, пригодную для поддержки принятия решений. При этом по мере перехода от первичных результатов экологического мониторинга к знаниям о состоянии окружающей среды меняются методы работы с информацией. Таким образом, в такой информационной системе можно выделить три уровня, ориентированных на решение различных задач экологического мониторинга и отличающихся по методам работы с экологической информацией:
1) знания для поддержки принятия решений;
2) информация о состоянии окружающей среды;
3) данные экологического мониторинга.
Поддержка принятия решений основывается на знаниях, при этом в идеале каждое утверждение верхнего уровня (рис. 6.3) должно подтверждаться информацией, хранящейся на среднем уровне, а при необходимости — и первичными данными нижнего уровня.
Рис . 6.3. Иерархические уровни экспертно-информационной системы
На нижнем уровне ЭИС для хранения данных о состоянии окружающей среды используют различные системы управления базами данных, а для обработки результатов наблюдений используют различные программные продукты: электронные таблицы, пакеты прикладных программ типа MathCAD и многие другие. Такое разнообразие программного обеспечения обусловлено громадным числом разноплановых задач обработки результатов наблюдений за состоянием окружающей среды, полученных с помощью локальных и дистанционных методов экологического мониторинга.
На среднем уровне ЭИС для анализа информации о состоянии окружающей среды используют географические информационные системы (ГИС), а также системы типа MATLAB, в которых реализованы различные методы интеллектуального анализа данных. Подобные системы, обеспечивая ввод, хранение, обновление, обработку, анализ и визуализацию всех видов экологической информации, позволяют систематизировать выдачу такой информации для управления природными ресурсами, реализуя опыт, накопленный специалистами в этой области.
В будущем системы поддержки принятия решений в области экологической безопасности неизбежно будут основываться на математическом моделировании процессов, происходящих в природе. Это неудивительно, так как схема «модель —гипотеза —» эксперимент -э установленный факт» составляет основу процесса познания практически в любой из многочисленных областей современной науки. В рамках математических моделей станет возможно и сопоставление между собой сведений из разных источников, и свертывание результатов мониторинга, и прогнозирование последствий того или иного хозяйственного решения.
В настоящее время накопление знаний, необходимых для поддержки принятия решений, основывается на различных реализациях системного подхода, таких как методология оценки воздействия на окружающую среду, индикаторы окружающей среды и устойчивого развития и т. п.
Оптимальной средой для размещения подобной информационной системы является Интернет. На языках программирования HTML, JavaScript, Java сравнительно легко реализовать иерархическую модель мультимедийных данных, установив при необходимости гипертекстовые связи и обеспечив удобный доступ ко всей или к части имеющейся информации для широкого круга пользователей.
Данные экологического мониторинга, используемые для поддержки принятия решений в области природоохранной деятельности, чрезвычайно разнообразны и, как правило, включают:
• результаты дистанционного (спутникового) мониторинга;
• подспутниковые наблюдения, выполненные с помощью локальных методов мониторинга с борта исследовательского судна и т. п.;
• официальную статистическую отчетность и архивные материалы.
Такая сложная структура данных вынуждает в настоящее время разделить стадии анализа данных и представления результатов, так как средства для анализа данных, в том числе и средства интеллектуального анализа данных, — это большие пакеты прикладных программ, которые нет никакого смысла размещать в сети Интернет.
Этапы интеграции данных экологического мониторинга в ЭИС представлены на рис. 6.4.
Рис. 6.4. Этапы интеграции данных экологического мониторинга в экспертно-информационной системе
На первом этапе первичные данные экологического мониторинга интегрируют в хранилища данных. Затем их анализируют с помощью стандартных пакетов, реализующих те или иные методы интеллектуального анализа данных (см. подразд. 6.2.2), а результаты анализа представляют в сети Интернет.
Схема интеграции данных экологического мониторинга в хранилище данных представлена на рис. 6.5.
Рис. 6.5. Интеграция данных экологического мониторинга в хранилище данных
При интеграции данных экологического мониторинга в хранилище данных часто возникает проблема оценки достоверности исходных данных (в соответствии с требуемым уровнем метрологического обеспечения). Это порождает трудноразрешимые проблемы. Один из возможных путей проверки достоверности данных экологического мониторинга может быть основан на сопоставлении их с данными, полученными из других источников.
6.2.2. Программное обеспечение экспертно-информационной системы
Системы управления базами данных. Для манипулирования данными (вводом, поиском и т. п.) в информационных системах используют специальное программное обеспечение, называемое системами управления базами данных (СУБД). Этот вид программного обеспечения в последние годы очень быстро совершенствуется. С одной стороны, СУБД все шире используют для манипулирования новыми типами информации (мультимедиа, географические информационные системы и т. п.), с другой — созданы новые технологии (архитектура «клиент—сервер», распределенные базы данных, гипертекст и т. п.), которые позволяют обеспечить доступ к информации широкому кругу пользователей в рамках сети Интернет, открывая тем самым принципиально новые возможности для изучения окружающей среды.
В настоящее время фактическим стандартом систем управления базами данных для персональных компьютеров является СУБД Microsoft Access. Пакет Microsoft Access for Windows является мощным средством управления базами данных, которое поддерживает реляционную модель данных и позволяет создавать сложные приложения на особом диалекте Visual BASIC (VBA). Microsoft Access можно применять для поиска и обработки всевозможных данных, а также для подготовки отчетных документов. Пользовательский интерфейс достаточно прост и предоставляет пользователю удобные возможности для манипулирования базами данных, так что освоение пакета обычно не вызывает сложностей.
В связи с бурным развитием сети Интернет, которая является гигантской распределенной базой данных, возрос интерес к таким СУБД, как Oracle. В настоящее время эта система управления базами данных установлена на многих серверах Сети.
В подавляющем большинстве СУБД для персональных компьютеров информация организуется в виде двумерных таблиц, и их часто, хотя и не всегда корректно, называют реляционными базами данных. Файлы .DBF стандарта dBASE представляют собой отображение двумерной таблицы со столбцами — полями и строками — записями. При поиске информации в этих файлах часто приходится использовать сведения о положении данных в файле (номер строки таблицы, номер записи файла .DBF) и в этом отношении стандарт dBASE не удовлетворяет требованиям, предъявляемым к реляционным базам данных. Пока базы данных на компьютерах были относительно невелики и их можно было разместить в одном файле .DBF, это обстоятельство не играло существенной роли, а привычная простота таблицы привлекала к этому способу организации информации многочисленных пользователей. Но при увеличении размеров баз данных хранить их в одной таблице становится невозможным и возникает необходимость выполнения других требований реляционной модели. В связи с этим важное значение имеет понятие нормализации.
Нормализация не является жестко фиксированным понятием или установленной раз и навсегда процедурой. Нормализация — скорее, набор правил, которыми стоит руководствоваться при проектировании реляционных баз данных. Одно из таких правил гласит: «В таблице не должно быть повторяющихся полей и дублирования информации». Например, если к фрагменту подобной таблицы добавить информацию об авторах книг, то в стандарте dBASE фрагмент станет выглядеть как в табл. 6.6.
Таблица 6.6
Пример ненормализованной таблицы
Номер записи | Название | Автор 1 | Автор 2 | Автор 3 | Год | Страницы |
Анализ вероятностных алгоритмов прогнозирования | Иванов И.И. | |||||
Корреляция прогнозов, основанных на различных методических подходах | Петров П.П. | Сидоров С.Сю |
У первой книги один автор, и для хранения его имени доо«ста- точно одного поля. Но у второй книги уже два автора, а моогут быть книги и с большим числом авторов. Поэтому возникает пттер- вый вопрос: сколько полей следует предусмотреть для хране эния в таблице информации о фамилиях авторов книги? При этасэм в таблице появится несколько однотипных полей для хранехсния имен авторов книг. Некоторые из этих полей будут пустыми, езесли число авторов книги меньше числа зарезервированных полей ■. Во многих полях будет значиться одна и та же фамилия, если о„один человек является автором более чем одной книги, т.е. инфорсэма- ция будет дублироваться. Такую таблицу обычно называют негт*гор- мализованной, и ее не следует включать в реляционную базу доданных.
Как следует организовывать информацию в реляционной О базе данных, можно проиллюстрировать на простейшем примере бйЗазы BOOKS.MDB, созданной с помощью СУБД Microsoft Access г 7.0. База BOOKS.MDB предназначена для хранения информациями о книгах.
В 90-е гг. XX в. реляционная модель данных превратилась в в основное средство организации информации в базах данных не то оль- ко на персональных компьютерах (ПК), но и на больших 3BVIVL
Язык структурированных запросов SQL (Structured Quruery Language) был разработан корпорацией IBM в 70-е гг. XX в.._, но всеобщее распространение получил существенно позднее, коогда после появления компьютерных сетей, связывающих компькхгге- ры различных типов, потребовались стандартные языки для обмена информацией. Благодаря своей независимости от специ»жфи- ки компьютера, а также поддержке лидерами в области технсдоло- гии реляционных баз данных, SQL стал и в ближайшем обозЕзри- мом будущем останется таким стандартным языком. Синтавхсис SQL похож на синтаксис английского языка и позволяет копнет - руировать достаточно сложные запросы. Этот язык является непроцедурным, в нем отсутствуют многие стандартные для прсхше- дурных языков конструкции — функции, циклы, условные схше- раторы. Язык SQL состоит из инструкций, которые передаюотся СУБД, обеспечивая выполнение определенных действий. Эти инструкции называют предложениями, но чаще используют терн мин «команда SQL».
Интерпретаторы команд SQL встраивают во многие ггпро- цедурные языки программирования, такие как Visual BAS3IC, C/C++. В этом случае команда обычно формируется в виде стгро- ковой переменной.
Всеобщее распространение компьютерных сетей породило • еще одну проблему, возникающую, когда несколько нользователоей с разных компьютеров начинают изменять одну и ту же базу данных. До тех пор пока база данных открыта «только для чтения», особых трудностей не возникает, но как только нескольким пользователям позволяется ее модифицировать, возникают трудноразрешимые конфликты. Эти проблемы преодолевают в рамках модели базы данных типа «клиент —сервер». При реализации этой модели система управления базами данных разделяется на две части — «клиент» и «сервер».
Программа «клиент» размещается на пользовательской машине и позволяет формировать запросы (как правило, на языке SQL), которые по сети передают на специализированную машину (часто называемую «сервером»), где работает программа «сервер». Таким образом, термин «сервер» иногда относится к компьютеру, а иногда к программному обеспечению. Программа-сервер обрабатывает запрос, формирует из базы данных требуемую выборку записей и отсылает ее программе-клиенту. Если пользователь предполагает изменять информацию в запрошенной выборке, доступ любого другого пользователя для модификации выбранных записей блокируется (монопольный захват). Если пользователь запрашивает информацию «только для чтения», то доступ к выбранным записям не ограничивается (коллективный захват).
Основной механизм, который позволяет избежать конфликтов между пользователями, заключается в разбиении процесса обработки информации на элементарные события — группы команд SQL, которые могут выполняться (или не выполняться) только все вместе. Такие группы команд называют транзакциями. Транзакция начинается всякий раз, когда на вход «сервера» начинают поступать команды SQL, если никакая другая транзакция не является активной. Транзакция заканчивается либо командой внести изменения в базу данных, либо отказом от внесения изменений (откат). Если в процессе выполнения команд возникает какая-либо ошибка, автоматически выполняется откат и база данных остается в исходном состоянии.
Успехи модели баз данных типа «клиент —сервер» привели к очевидной идее, что не только обработку информации можно распределить между несколькими компьютерами, но и саму информацию хранить в разных местах. Поэтому в начале 90-х гг. XX в. все большую привлекательность для пользователей ПК стали приобретать распределенные базы данных и соответственно СУБД, разработанные для больших ЭВМ. Современные информационные системы очень редко реализуют на одном персональном компьютере, поэтому возникают проблемы использования данных, хранящихся на разных ЭВМ, с обеспечением при этом высокой надежности работы и защиты данных. Многолетний опыт решения таких проблем, накопленный при разработке СУБД для больших машин, широко используется при создании сетей из ПК. Под распределенной базой данных понимают логически единую базу данных, которая размещается на нескольких ЭВМ. Гигантской распределенной базой данных является Интернет. Для пользователя любого из компьютеров, объединенных в Сеть, в узлах которой распределена такая база данных, эта база выглядит как единое целое и одинаково доступна. При этом возникает много проблем с обеспечением целостности и непротиворечивости хранимых данных и одновременно — приемлемого быстродействия прикладных программ, работающих с распределенной базой данных. Лишь в очень немногих системах управления базами данных (Sybase, Ingres, Informix) эти проблемы решены в достаточном объеме, и самой известной из них является СУБД Oracle. Система управления базами данных Oracle является одним из лидеров рынка многоплатформенных СУБД. Она может работать на более чем двухстах типах ЭВМ, включая ПК типа IBM PC и Apple Macintosh. В программное обеспечение этой СУБД входит одна из наиболее полных реализаций языка структурированных запросов SQL, а также генераторы меню, отчетов и других экранных форм. Кроме того, программное обеспечение позволяет на основании информации, хранящейся в СУБД, строить более 50 типов графиков и диаграмм. Система Oracle содержит очень надежную систему защиты данных, их целостности и непротиворечивости.
Термином «мультимедиа» (multimedia) обозначают интерактивные компьютерные системы, обеспечивающие работу с разнообразными типами данных — неподвижными и движущимися изображениями (включая видео), а также с текстом, речью и высококачественным звуком. В соответствующих базах данных хранится не только текстовая информация, но и оцифрованные фильмы, звуки и музыка, факсимильные изображения и многое другое. Современные системы управления мультимедийными базами данных поддерживают технологию «клиент —сервер», описанную выше, а сами базы данных оказываются распределенными по узлам всемирной компьютерной сети. При этом возникает новая ситуация, которая в ближайшие годы будет определять развитие цивилизации: большинство знаний, накопленных человечеством, оказывается интегрированным в глобальную информационную систему, а доступ к этим знаниям открыт для каждого члена общества.
Технология мультимедиа широко используется в образовании — для создания обучающих программ, тренажеров, различных энциклопедий и справочников. На одном компакт-диске (CD-ROM) можно разместить тексты, составляющие библиотеку средних размеров или фильм, но чаще на таких дисках размешают тексты, движущиеся изображения, звуки и видеоклипы, связанные в единую интерактивную систему, последовательность событий в которой определяет пользователь.
Хранилища данных. Следует отметить, что в последние годы не только появляются новые технологии, но и несколько меняется подход к формированию баз данных. Базы данных, из которых извлекают знания, должны отвечать определенным требованиям. Чтобы подчеркнуть это, используют специальный термин «хранилище данных» (Data Warehouse), означающий предметноориентированный, интегрированный, поддерживающий хронологию, неизменяемый набор данных, организованный для целей поддержки принятия решений. Можно выделить две основные трудности при создании хранилищ данных, ориентированных на поддержку принятия решений:
• неопределенность задачи — какая именно информация может понадобиться для поддержки принятия решений в постоянно и быстро меняющемся мире, какие цели и задачи будут актуальными завтра и т. п.;
• неоднородность информации — разные и зачастую плохо описанные форматы файлов данных, полученные на разных приборах и не стыкующиеся между собой результаты измерений и многое другое.
Во многих случаях легче повторить дорогостоящий эксперимент, чем пытаться извлечь результаты из архивных данных предыдущего аналогичного эксперимента. Поэтому первым этапом создания хранилища данных является их интеграция. При интеграции исходных данных в хранилище необходимо обеспечить единые правила наименования, унифицированные единицы измерения для однотипных объектов, единую систему представления (атрибуты) для таких объектов и т. п. Кроме того, для интеграции данных о состоянии окружающей среды важна единая система географических координат.
Другой важной особенностью данных, включаемых в хранилище данных, является поддержка хронологии. В настоящее время в датировке данных о состоянии окружающей среды царит полная неразбериха. Например, трудно сказать, какая дата — 7 марта или 3 июля — имеется в виду в записи 99/03/07. Однотипная датировка данных с учетом смены тысячелетия должна решить все эти проблемы. В результате конечный пользователь будет иметь единое представление о временной привязке всех данных. Сформированное хранилище данных должно представлять собой неизменяемый набор данных, т. е. конечным пользователям данные будут доступны в режиме «только для чтения». Это простейший способ обеспечения целостности данных при одновременном обеспечении высокой скорости доступа к ним. При необходимости изменять данные пользователь может воспользоваться витриной данных (Data Mart). Это сравнительно небольшой набор данных, чаще всего являющийся выборкой из хранилища данных, свободно изменяемый и дополняемый пользователем. Обычно витрины данных используют для агрегирования данных из хранилища, с тем чтобы повысить скорость анализа данных.
Геоинформационные системы. Результаты экологического мониторинга всегда имеют географическую привязку, поэтому оптимальным способом организации анализа сведений о состоянии окружающей среды будет тот, который основывается на ГИС. Географические информационные системы предназначены для создания цифровых карт и анализа событий, происходящих на планете. Во многих отношениях географическая информационная система — это типичная СУБД, примеры которых рассмотрены выше.
Термин «географическая информационная система» означает организованный набор аппаратуры, программного обеспечения, географических данных и персонала, предназначенный для эффективного ввода, хранения, обновления, обработки, анализа и визуализации всех видов географически привязанной информации. Особое значение для успешной работы ГИС имеет персонал: операторы, программисты, системные аналитики и т.д. Технические специалисты, проектирующие и поддерживающие систему, во многом определяют ее свойства и эффективность последующего использования. Аппаратные средства включают компьютеры (платформы), на которых работает ГИС. Такие ГИС, как ARC/INFO, функционируют на достаточно большом числе платформ — на мощных серверах, обслуживающих клиентские машины в локальных сетях и Интернете, на рабочих станциях и отдельных ПК. Кроме того, ГИС используют разнообразное периферийное оборудование: дигитайзеры для оцифровки карт, лазерные принтеры, плоттеры для печати карт и т. п. Программное обеспечение позволяет вводить, сохранять, анализировать и отображать географическую информацию. Ключевыми компонентами программного обеспечения являются:
• средства для ввода и манипулирования географическими данными;
• система управления базой данных;
• программные средства, обеспечивающие поддержку запросов, географический анализ и визуализацию информации;
• графический интерфейс пользователя, облегчающий использование программных средств.
Данные — возможно, наиболее важный компонент ГИС. Географические информационные системы работают с данными двух основных типов:
1) пространственные (синонимы — картографические, векторные) данные, описывающие положение и форму географических объектов и их пространственные связи с другими объектами;
2) описательные (синонимы — атрибутивные, табличные) данные о географических объектах, состоящие из наборов чисел, текстов и т. п.
Описательная информация организуется в реляционную базу данных — отдельные таблицы связывают между собой по ключевым полям, для них могут быть определены индексы, отношения и т. п. Кроме того, в ГИС описательная информация связывается с пространственными данными. Отличие ГИС от стандартных систем управления базами данных (dBASE, Access и т. п.) состоит как раз в том, что ГИС позволяют работать с пространственными данными.
Пространственные данные в ГИС представляют в двух основных формах — векторной и растровой. Векторная модель данных основывается на представлении карты в виде точек, линий и плоских замкнутых фигур. Растровая модель данных основывается на представлении карты с помощью регулярной сетки одинаковых по форме и площади элементов. Различия между этими моделями данных поясняет рис. 6.6.
Рис. 6.6. Растровая (а) и векторная (б) модели пространственных данных:
1 — точка; 2 — полигон; 3 — дуга; 4 — узел
Здесь показано, как объекты местности: озеро, речка, поле — отображают с помощью векторной модели — линиями и полигонами, а с помощью растровой модели — по-разному окрашенными квадратиками.
Упрощая ситуацию, можно сказать, что растровая модель данных — это набор одинаковых по размеру, но по-разному окрашенных квадратиков. В векторной модели данных озеро изображают окрашенным многоугольником, который в ARC/INFO называют полигоном (polygon), а речку — ломаной линией, которую называют дугой (arc). Начало и конец этой ломаной линии называют узлами (node).
Другой пример растрового и векторного способов отображения пространственных данных представлен на рис. 6.7, 6.8, где показано, как изменяются фрагменты изображения при его увеличении.
Рис. 6.7. Растровый способ представления пространственных данных:
а — увеличенное изображение острова Котлин (г. Кронштадт); б — растровое изображение района Ладожского озера (прибор AVHRR, 2-й канал, спутник
Рис. 6.8. Векторный способ представления пространственных данных:
а — увеличенное изображение острова Котлин (г. Кронштадт); б — векторное изображение района Ладожского озера (карта DCW, покрытия PONET и DNNET)
На обоих рисунках на верхних фрагментах представлено Ладожское озеро. На рис. 6.7 это изображение, полученное прибором AVHRR спутника NOAAA и визуализированное с помощью растровой ГИС IDRISI. Его форма несколько искажена, что объясняется особенностями орбиты спутника. На рис. 6.8 представлена карта в проекции Меркатора, сформированная из покрытий PONET и DNNET карты DCW с помощью ГИС ARC/ INFO и визуализированная с помощью ГИС ArcView. При увеличении изображения в первом случае увеличивается размер прямоугольных ячеек — элементов изображения (пикселей), из которых состоит растровое изображение. При этом ни форма, ни цвет прямоугольников (величина сигналов) не изменяются. На нижнем фрагменте рис. 6.7 хорошо видны прямоугольники, из которых составлено изображение острова Котлин.
Изменение цвета пикселей на границах острова объясняется тем, что эти сигналы определяются отражением и от поверхности острова, и от поверхности Финского залива.
При увеличении изображения на рис. 6.8, б полигон, соответствующий острову Котлин, преобразуется в подобный полигон большей площади. Для большего полигона увеличивается длина отрезков замкнутой ломаной линии, определяющей его границу: при этом ширина этой линии не изменяется.
Рис. 6.9. Объединение отдельных слоев в цифровую карту: а — PONET; б — DNNET, в - DCW
На рис. 6.9 показан процесс объединения в простейшую цифровую карту двух слоев цифровой карты DCW:
1) PONET — границы государств, морей, океанов;
Например, цифровая карта DCW была сформирована на основе карт масштаба 1:1 000 000, и именно это обстоятельство определяет, какой объект на этой карте будет изображаться полигоном, а какой — ломаной линией.
2) DNNET — гидрографические объекты: реки, каналы, озера, острова.
Например, цифровая карта DCW была сформирована на основе карт масштаба 1:1 000 000, и именно это обстоятельство определяет, какой объект на этой карте будет изображаться полигоном, а какой — ломаной линией.
Рис. 6.10. Организация пространственной информации на числовой карте (цифры обозначают станции мониторных наблюдений)
На рис. 6.10, представляющем фрагмент карты DCW, р. Нева имеет определенную ширину и показана в виде полигона, а речки, впадающие в нее и в Финский залив, изображены ломаными линиями.
В цифровых картах пространственная информация об объектах хранится в виде координат (X, Y). Точка описывается одной парой координат. Отрезок прямой линии представляется двумя парами координат (X, У), соответствующими началу и концу отрезка. Ломаные линии описывают упорядоченной последовательностью координат (X, Y). Если ломаная линия начинается и заканчивается в одной и той же точке, она ограничивает замкнутую фигуру — полигон. Соответственно первая и последняя пары координат ломаной линии (или первой и последней из ломаных линий, когда полигон ограничивается несколькими дугами) должны совпадать.
Картографическая информация об объектах включает не только их координаты, но и отношения типа «Нева впадает в Балтийское море». На цифровых картах такие отношения описывают с помощью топологической модели, определяющей пространственные связи. В ГИС ARC/INFO приняты три основных топологических условия:
1) дуги соединяются между собой в узлах;
2) дуги, ограничивающие фигуру, определяют полигон;
3) дуги имеют направление, а также левую и правую стороны.
Географический анализ экологической информации позволяет изучать процессы, происходящие в окружающей среде, путем проведения различных логических операций над векторными и атрибутивными данными (пространственного и табличного анализа). Для отображения результатов пространственного анализа обычно используют карты, а для отображения результатов табличного анализа — отчеты. Пример отображения результатов простейшего пространственного анализа приведен на рис. 6.11. На этом примере обсуждаются некоторые особенности проведения географического анализа и открывающиеся при этом возможности.
Цель проведения географического анализа, результаты которого представлены на рис. 6.11, состояла в определении зон возможного загрязнения почв свинцом по критерию, использованному в «Экологической карте Ленинградской области», — преимущественное нахождение свинца вдоль автодорог с интенсивным движением в двухсотметровой полосе. Дополнительное условие анализа заключалось в исключении из рассмотрения районов жилой застройки — городов и поселков городского типа, где загрязнение почв свинцом наблюдается повсеместно. Решение задачи проходило в несколько этапов. Во-первых, была подготовлена карта района Санкт-Петербурга (см. рис. 6.11) в проекции Меркатора, на которой были совмещены четыре покрытия карты DCW:
• PONET: океаны, моря, страны;
• DNNET: озера, реки;
• PPPOLY: районы жилой застройки;
• RDLINE: автомобильные дороги.
Далее средствами ARC/INFO было сформировано покрытие RDLINEM1, включающее области, лежащие вблизи автомобильных дорог (в пределах ±200 м). Затем из этого покрытия были вырезаны области, соответствующие жилой застройке. При этом было сформировано покрытие RDLINEM2. Полигоны этого покрытия, соответствующие внутренним областям буферных зон, показаны белой заливкой. Эти полигоны представляют решение поставленной задачи по определению зон возможного загрязнения почв свинцом. Первое, что следует отметить в связи с этой задачей, — это легкость, с которой она решается средствами ARC/INFO. Так же легко решаются и другие задачи пространственного анализа:
• формирование областей, лежащих вне полигонов вырезающего покрытия;
• создание новых покрытий при помощи «вырезания и склеивания»;
• расщепление покрытий на несколько меньших покрытий;
• наложение полигонов и сохранение всех областей обоих покрытий;
• наложение точек, линий или полигонов на полигоны и сохранение всех объектов входных покрытий;
• наложение точек, линий или полигонов, но сохранение только части объектов входного покрытия, попадающей внутрь полигонов формирующего покрытия.
В перечисленных выше операциях создают таблицы, описывающие полигоны, дуги, границы покрытия и реперные точки. Эти таблицы изначально пригодны для проведения анализа, и для них можно формировать разнообразные запросы, аналогичные запросу на выбор полигонов покрытия RDLINEM2 на рис. 6.11, для которых выполняется условие «атрибут Inside = 100 в таблице PAT.DBF», что соответствует внутренним областям буферных зон. При проведении табличного анализа, используя логические операции AND, OR и формируя другие, более сложные структурированные запросы, можно выбрать информацию из нескольких полей одной или разных таблиц.
Рис. 6.11. Зона загрязнения вокруг шоссейных дорог вне населенных пунктов
Возможность проведения географического анализа — это то главное, что отличает географическую информационную систему. Географический анализ позволяет сопоставить между собой разнообразную пространственно привязанную информацию и представить результаты анализа в форме, удобной для восприятия. Рутинные операции географического анализа легко автоматизируются. Для этого в каждую полнофункциональную ГИС встраивается внутренний язык программирования — SML в ГИС PC ARC/INFO, MapBasic в ГИС Maplnfo и т. п. Все это делает ГИС незаменимым инструментом для проведения анализа информации о состоянии окружающей среды.
Интеллектуальный анализ данных. Географические информационные системы предоставляют мощные средства для анализа экологической информации. Однако сами по себе они не порождают новых знаний о состоянии окружающей среды, а являются только инструментом для естествоиспытателя. В то же время, особенно в по