Базы данных ГИС и система управления базами данных
В простых ГИС растрового типа обычно отсутствуют специальные средства организации хранения, доступа и манипулирования данными, или эти функции реализуются средствами операционной системы в рамках ее файловой организации.
Большинство современных ГИС использует для этих целей достаточно изощренные и эффективные подходы, основанные на организации данных в виде баз данных (БД), управляемых программными средствами, получившими название систем управления базами данных (СУБД).
Базу данных можно определить как совокупность взаимосвязанных хранящихся вместе данных при наличии такой минимальной избыточности, которая допускает их использование оптимальным образом для одного или нескольких приложений; данные запоминаются так, чтобы они были не зависимы от программ, использующих эти данные. Для добавления новых или модификации существующих данных, а также для поиска данных в БД применяется общий управляемый способ. Данные структурируются таким образом, чтобы была обеспечена возможность дальнейшего наращивания приложений. Комплекс программ и языковых средств, предназначенных для создания, ведения и использования баз данных, называется системой управления базами данных.
Эффективное использование цифровых данных предполагает наличие программных средств, обеспечивающих функции их хранения, описания, обновления, а также прикладной обработки (анализа, моделирования). В зависимости от типов и форматов их представления, от уровня программных средств ГИС, некоторых характеристик среды и условий использования существуют различные варианты организации хранения и доступа к пространственным данным, причем способы организации различаются для позиционной и семантической их части.
При разработке программного обеспечения ГИС нашли широкое применение СУБД реляционного типа, позволяющие представить данные о пространственных объектах (точках, линиях, полигонах) и их характеристиках (атрибутах) в виде отношения или таблицы, строки которой - индексированные записи - соответствуют набору значений атрибутов объекта, а столбцы в шапке таблицы - поля - устанавливают тип атрибута (бинарный, числовой, символьный), его размер и имя атрибута. В большинстве ГИС в число атрибутов не входят геометрические атрибуты, описывающие их геометрию и, возможно, топологию. Обычно векторные записи координат объектов упорядочиваются и организуются с использованием особых средств, поскольку стандартные СУБД оказываются для этих целей неэффективными. Связь между геометрическим описанием объектов и их содержательными непозиционными атрибутами в реляционной таблице устанавливается через уникальные номера - идентификаторы.
Важным элементом пространственных баз данных, наряду с БД, описывающими позиционные и содержательные свойства пространственных объектов, являются базы данных географических названий. Создание, поддержание и ведение национальных баз данных географических названий - трудоемкий и дорогостоящий процесс. В качестве основных элементов (полей) записи каждого названия используются собственно название, категория и код административной территории (штат, графство), географические координаты точки объекта, статус объекта (официальное, историческое), варианты названия, код библиографического описания источника и т.д. Полезным оказывается также хранение сведений об источниках данных, их достоверности, времени поступления и некоторых других характеристиках.
Любая БД должна обладать возможностями поиска. Его быстрота зависит от организации данных. Поиск в базе осуществляется при помощи запросов: его можно производить, задав параметр или группу параметров поиска. Например, найти все города с численностью населения выше 1 млн. человек. В запросе может присутствовать целое арифметическое выражение, которое составляется по маске или вручную.
Удобство манипулирования данными в БД существенно зависит от языковых средств СУБД. Широкие возможности предоставляются пользователю СУБД, в которых реализован язык обработки запросов SQL, и его расширения, адаптированные к описанию пространственных запросов к БД ГИС и содержащие конструкции, включающие пространственные переменные и условия.
В базах данных реляционного типа обычно реализуются следующие операции, применяемые также в их комбинациях:
установка текущих (одной или более - в зависимости от структурного представления) логических позиций в базе данных;
выборка (получение данных из базы данных или обеспечение пользователю доступности выбранных данных);
включение (добавление новых данных в базу данных);
удаление данных из базы данных;
обновление (модификация существующих данных в базе данных).
Большинство операций применимо к колонкам (столбцам таблицы), записям (строкам таблицы), к отдельным элементам записи (клеткам таблицы), к таблицам в целом.
Над множеством совместимых таблиц, имеющих идентичные шапки, допустимы операции:
объединения (генерации новой таблицы с записями, имеющимися либо в одной, либо в другой, либо в обеих таблицах);
пересечения (содержащего только те записи, которые есть как в одной, так и в другой таблице);
разности (содержащей только те записи, которые присутствуют в одной, но отсутствуют в другой таблице).
Над множеством таблиц, имеющих общие поля, допустимы операции соединения ("склеивания") по некоторым условиям.
Одним из главных мотивов, определяющих необходимость использования
технологии баз данных при создании ГИС в настоящее время, является поддержка современными СУБД сетевых возможностей хранения и использования данных с применением технологий локальных сетей(LAN) и удаленных сетей в так называемых распределенных БД, отдельные части которых рассредоточены по множеству вычислительных центров в пределах одной организации, либо по территории. Тем самым достигается оптимальное использование вычислительных ресурсов и возможность коллективного доступа пользователей к запрашиваемым БД.
Вопросы для самоконтроля:
1). Формальное определение ГИС.
2). Вопросы, на которые могут ответить ГИС, и области их применения.
3). Основные компоненты ГИС.