Форматы хранения позиционной информации
Существуют два типа форматов хранения позиционных данных: растровый и векторный. В первом слой электронной карты представляется при помощи системы ячеек, которые являются неделимыми «квантами пространства». Сами ячейки являются объектами. Термин «растр» обозначает решётку экрана, состоящую из отдельных пикселов. На уровне вывода на экран любое изображение является растровым. Все различия форматов существуют на уровне хранения данных на диске и в памяти компьютера. В большинстве случаев система ячеек является прямоугольной матрицей,состоящей из равновеликих квадратных ячеек. Всем известный пример растрового формата: игра «морской бой». Растровый формат подразделяется на собственно растровый и регулярно-ячеистый. В первом случае каким-либо техническим устройством выполняется разбиение на ячейки получаемого изображения. В качестве этих устройств выступают сканеры и спутниковые системы дистанционного зондирования. Здесь размеры ячеек определяются параметрами устройств. Так, сканер в соответствии со своим разрешением разбивает освещаемую поверхность на систему ячеек с равными размерами. Интенсивность отраженного ячейкой света в определенном диапазоне спектра преобразуется в числовую величину, характеризующую данную ячейку. Эта величина записывается в матрицу файла отсканированного изображения. Разумеется, когда сканируется карта, то равными по площади являются участки самой карты, относящиеся к разным ячейкам. Соответствующие им участки земной поверхности из-за изменчивости масштаба в пределах листа карты могут иметь разные площади. Аналогично для космической системы равными являются телесные углы, в пределах которых суммируется излучение, но отнюдь не участки поверхности Земли, от которых это излучение получено. Матрица регулярно-ячеистого формата получается путём разбиения бумажной карты на отдельные квадратные ячейки человеком при помощи карандаша и линейки. В зависимости от того, объекты какого типа внутри данной ячейки преобладают по площади, ей присваивается определённый класс (лес, водный объект, агроценоз и т.д.). Вариант: класс ячейки определяется в соответствии с типом объекта карты, находящегося в центре ячейки. Кроме квадратов ячейки могут иметь другую правильную геометрическую форму (треугольник, шестиугольник). В некоторых случаях ячейки могут быть неравновеликими и вложенными друг в друга. Размеры ячеек и число вложений определяются размерами и формой отображаемых объектов карты, которые различны в разных её частях. Если требуется увеличить детализацию изображения, ячейка подразделяется на четыре равновеликие ячейки более низкого уровня (подход квадротомического дерева). Существуют также нерегулярные мозаики, ячейки которых различаются между собой. Чаще всего используют системы неравносторонних треугольников - Triangulated Irregular Network (TIN). Сети TIN особенно удобны для цифрового моделирования рельефа, который представляется многогранной поверхностью. Каждый треугольник имеет своё направление наклона (экспозицию) и его угол. Треугольники соединяются своими сторонами. TIN-модель позволяет использовать в качестве элементов более сложные многоугольники, которые можно разбить на треугольники. Эта модель может использоваться как при растровом, так и векторном представлении пространственных объектов.
Главный недостаток растровых форматов – их пространственное разрешение определяется размерами ячеек. Невозможна работа с объектами, имеющими меньшие размеры. Поскольку каждая ячейка является отдельным объектом, то при использовании равновеликих ячеек для представления объекта большой площади требуется много ячеек, т.е. много памяти компьютера. Если матрица на плоскости определенной картографической проекции состоит из одинаковых ячеек известного размера, то достаточно знать координаты центра или угла одной ячейки, чтобы определить координаты всех остальных ячеек. Поэтому регулярно-ячеистый формат позволяет в принципе хранить позиционную и семантическую информацию в одной реляционной таблице: каждой ячейке отводится одна запись, в двух полях записываются номер строки и столбца, определяющие положение ячейки как элемента матрицы. В остальных полях записывается семантическая информация.
Сначала в ГИС использовались преимущественно ячеистые форматы из-за недостаточного развития алгоритмических процедур работы с векторными структурами и отсутствия средств векторного цифрования. Однако последующее развитие векторных форматов отнюдь не привело к прекращению использования растровых, поскольку именно в них поступают для обработки результаты спутникового зондирования.
В векторных форматах записываются непосредственно координаты объектов с любой необходимой степенью точности. Векторный формат предоставляет произвольный доступ к данным, здесь легче осуществляются операции с линейными и точечными объектами, замена условных обозначений. Растровая модель дает информацию о том, что расположено в той или иной ячейке, векторная - где расположен тот или иной объект. Сначала линии в ГИС хранились в виде последовательностей единичных отрезков, имеющих одно из 8 направлений. Отсюда и произошёл термин «векторный формат». Двумерное местоположение точечного объекта однозначно определяется парой координат x и y. Ими могут быть как географические, так и декартовы координаты конкретной картографической проекции. Линейный объект хранится как последовательность пар координат точек, аппроксимирующих линию ломаной, состоящей из прямых отрезков – сегментов. Точки являются началами и концами отрезков, они имеют название вертексы. Линейный объект состоит из последовательности сегментов, он называется дуга. Точки начала и конца дуги – узлы. Здесь линейный объект может соединяться с другим объектом. Сегмент – это объект типа Line. Соответственно линейный объект – Polyline, он является последовательностью Line-объектов, в предельном случае может состоять из одного Line-объекта. Местоположение площадного объекта (типа Polygon) определяется последовательностью координат вертексов его границы. Полигоны могут быть простыми и составными, односвязными и многосвязными. Характеристика полигона «простой» означает, что он представляет собой единое целое, не подразделяется на отдельные отстоящие друг от друга части и не содержит внутренних полигонов («дырок» и «островов»). В противном случае полигон является составным. Термин «односвязный» применим к полигонам, не имеющим отдельных частей, из любой точки такого полигона в любую его другую точку можно попасть, не пересекая его границу. Для многосвязного полигона наоборот, чтобы попасть из одной его части в другую, необходимо пересечь границу полигона. Так, пруд в Летнем саду является примером простого полигона. Ладожское озеро и Новгородская область – полигоны составные, но односвязные. В них есть внутренние полигоны: острова Ладоги (Валаам и др.), озеро Ильмень. Однако из любой их точки можно попасть в другую, не пересекая границ полигонов. Сахалинская область – полигон составной и многосвязный: он состоит из о.Сахалин и Курильских островов. Многосвязными и составными могут также быть линейные объекты. Например, несколько дренажных канав составляют вместе один объект, но они пространственно не соединяются между собой.
В файловых структурах необходимо фиксировать не только координаты, но и форму объектов, т.е. их размерность и особенности (точки, линии, полигоны и т.д.). Например, объекты «озеро» и его «береговая черта» имеют абсолютно совпадающие координаты.
Векторные форматы могут быть топологическими и нетопологическими. Топология - раздел математики, имеющий своим назначением выяснение и исследование в рамках математики идеи непрерывности.Топологические свойства фигур не изменяются при любых деформациях, производимых без разрывов или соединений. В ГИС термин «топологический»означает, что в модели объекта хранятся взаимосвязи между объектами, что расширяет использование данных для различных видов пространственного анализа. Нетопологический формат не содержит никаких взаимосвязей между объектами, каждый из которых «сам по себе». При использовании этого формата данные хранятся в шейпфайлах – файловых структурах, содержащих форму и координаты объектов. Координаты каждого объекта записываются индивидуально, поэтому абсолютно совпадающие координаты границы двух смежных полигонов записываются дважды. Полигоны одного слоя не должны перекрываться и иметь между собой «зазоры». Реки не должны пересекать друг друга, приток не должен заканчиваться раньше водного объекта, в который он впадает. Однако выявление таких ошибок здесь очень трудоёмко. Перевод информации с бумажной карты сразу в компьютерный векторный формат выполняется при помощи дигитайзера – устройства, состоящего из планшета и курсора. Этот процесс имеет название дигитализации (цифрования). Планшет имеет собственную систему координат, курсор напоминает манипулятор мышь, но у него есть прозрачное окошечко с перекрестьем. При нажатии кнопки курсора координаты перекрестья фиксируются в памяти компьютера, а по окончании сеанса работы – в файлах. Естественно, что записывать координаты нужно не в системе планшета, а в географических или декартовых координатах конкретной проекции. Для этого после закрепления на планшете бумажной карты определяются координаты нескольких регистрационных (установочных) точек, для которых известны географические (или декартовы проекции) координаты. На основании этих данных компьютер осуществляет пересчет координат из планшетных в географические или декартовы. Оператор последовательно фиксирует вертексы линейных объектов или границ полигонов, заносит в память идентификаторы объектов. Качество работы сильно зависит от квалификации и физического состояния оператора. Более застрахован от ошибок другой метод получения векторных компьютерных карт: векторизация (цифрование) растрового изображения. Производится географическая привязка растрового слоя компьютерной карты, чаще всего также по регистрационным точкам. Затем в случае векторизации по подложке оператор поверх растрового слоя рисует и редактирует объекты нового векторного слоя. Существуют специальные компьютерные программы – векторизаторы, выполняющие автоматическую и интерактивную векторизацию. Ячейки растрового слоя в зависимости от значений характеристик (т.е. их цвета) относятся к определённым классам. Если ряд ячеек одного класса занимает непрерывную область, то выделяются границы классов, они сглаживаются и по ним строятся границы полигонов.
Топологический формат отличается от нетопологического хранением исчерпывающего списка взаимоотношений связанных между собой пространственных объектов. Здесь для хранения данных используются покрытия – файловые структуры, содержащие форму, координаты и взаимосвязи между объектами. Покрытия содержат объекты первичного, составного и вторичного типов. Первичные объектыпокрытия - точки меток, дуги и полигоны. Составныеобъекты - маршруты/секции и регионы. Они строятся из объектов первичных типов. Покрытия могут также содержать вторичныеобъекты: регистрационные точки, связи и аннотации. Регистрационные точки и связи используются для управления покрытиями. Аннотации позволяют поместить на карту текст. Точки меток могут, как и в нетопологическом формате, представлять отдельные точечные объекты. Также они используются для идентификации полигонов: точка ставится около центра полигона, к ней привязываются семантические характеристики полигона. В нетопологическом формате записываются координаты каждого полигона, поэтому, например, в полигонах Ленинградской и Новгородской областей координаты их границы записываются дважды, линейный объект - граница никак с полигонами не связан и находится в другом слое. В покрытии полигон определяется последовательностью дуг, образующих его границу. Для дуг фиксируются направление обхода и указатели расположения полигонов справа и слева. Поэтому все координаты в покрытиях записываются только один раз. Такой подход имеет название линейно-узлового представления объектов. Полигоны покрытия могут иметь общие дуги, но они не могут налагаться. Также они должны быть непрерывными. Узлы - это точки окончания или соединения дуг, они важны для соединения объектов покрытия. Маршруты - это линейные объекты, составленные из дуг и их частей (секций). Регионы - это площадные объекты, составленные из полигонов. В отличие от полигонов они могут и не быть непрерывными. Так, Сахалинская обл. может быть представлена регионом, состоящим из полигонов отдельных островов. Регионы одного покрытия могут налагаться друг на друга. Например, в покрытии полигонов лесов регионы двух лесных пожаров могут налагаться, если выгоревший в одном году участок повторно выгорал в другом. Аннотации - это текстовые строки, описывающие объект при отображении на карте. Аннотации могут быть размещены в одной точке, между двумя точками иливдоль набора точек. Регистрационные точки (тики) соответствуют известным точкам на земной поверхности и используются для регистрации и преобразования координат покрытия. При оцифровке групп объектов карты в разные покрытия следует использовать одни и те же тики, чтобы покрытия правильно налагались. Связи - это векторы смещения, используемые для уточнения покрытия, например, чтобы оно соответствовало границам соседних покрытий. Связи состоят из «точки-от» и «точки-до».
К регулярно-ячеистым форматам относятся также гриды - прямоугольные матрицы, состоящие из квадратных ячеек. Они могут быть результатами интерполяции значений числовых полей точечных объектов или преобразования из матриц растровых изображений. Также возможно преобразование в грид слоёв площадных и линейных объектов. Гриды служат для представления непрерывных числовых полей, в каждой ячейке – одно значение.
АНАЛИЗ ДАННЫХ
Спецификой ГИС является пространственный анализ, обработка семантических данных аналогична применяемой в СУБД. Пространственные операции подразделяются на ряд групп: 1) Переструктуризация данных – преобразования растр/вектор и наоборот; 2) Трансформация проекций и изменение систем координат - пересчет координат пространственных объектов (поворот, сдвиг, изменение масштаба), "укладка" объектов в систему опорных точек (привязка спутникового снимка), трансформация картографических проекций; 3) Картометричекие операции - расчет площадей объектов, длин линий, периметров, площадей склонов, объемов, заключенных между поверхностями и т.д.; 4) Оверлейные операции – наложение двух или более слоев с генерацией новых слоёв производных объектов, наследующих семантику «родителей». Это создание нового слоя перекрытий объектов, принадлежащих разным слоям, например, слоя ландшафтных таксонов в пределах водосборных бассейнов в результате совмещения слоёв ландшафтов и водосборов и объединение площадных объектов (возможно, разных слоев), например, объединение зон негативного воздействия различных предприятий; 5) Зонирование – создание площадных объектов, однородных по определенному критерию или группе критериев. Границы зон могут совпадать с границами существующих объектов или строится в результате различных видов моделирования: зоны градостроительной ценности, экологического риска, транспортной доступности, обслуживания поликлиник и т.д. Выделяется создание буферных зон – площадных объектов, границы которых проводятся на задаваемом расстоянии от других объектов, например, водоохранные зоны; 6) Сетевой анализпозволяет исследовать сети связных линейных объектов (гидрографическая сеть, дороги, водо-, нефте-, газопроводы, линии электропередач). С его помощью можно проследить распространение загрязняющего вещества по речной сети, оптимизировать перевозки. В качестве разновидности сетевого анализа можно рассматривать геокодирование – пространственную локализацию объекта не по координатам, а его почтовому адресу; 7) Операции с трехмерными объектами -создание и анализ моделей рельефа и трехмерных визуализаций,например,панорамы города, а также воображаемых поверхностей, строящихся по одному или ряду показателей; 8) Анализ растровых изображений -преимущественно космических снимков: выявление временной динамики изменений, кластерный анализ – выделение однородных областей, картометрические вычисления (map algebra).
У ч е б н о е и з д а н и е
Третьяков Виктор Юрьевич