Организация данных в гис
2.1 ОРГАНИЗАЦИЯ ПРОСТРАНСТВЕННЫХ ДАННЫХ
ГИС как системы обработки пространственно-временной информа-
ции относятся к классу информационных систем. Они имеют общие,
присущие всему классу, и индивидуальные, присущие только ГИС, свой-
ства. К особенностям ГИС следует отнести наличие больших объемов
хранимой в них информации.
Рис. 2.1
Кроме того, они отличаются специфичностью организации и структурирования моделей данных (Рис. 2.1).
ГИС характеризуются разнообразием графических данных со спе-
цифическими их частями и связями. В частности, карта может быть рас-
смотрена как двухмерная аналоговая модель, отображающая трехмер-
ную поверхность (Рис.2.2).
Рис. 2.2
Используя процедуры абстракции, определим более общую модель
геоинформационных данных как абстракцию данных, которые содержатся на земной поверхности. Такой подход требует выделения основных типов данных и их многочисленных связей.
Одной из основных моделей в первых ГИС был набор имен и характеристик в сочетании с множеством именованных данных, местонахождение которых задается координатами. Эта простая модель не содержала каких-либо семантических данных, помогающих пользователю при работе с базами данных. Дальнейшие исследования привели к необходимости развития и усложнения такой модели. Другими словами, возникла потребность создания общей модели данных ГИС и ее основных частей для оптимальной обработки в базах данных и эффективного описания объектов.
Данные реального мира, отображаемые в ГИС, можно рассматривать с учетом трех аспектов: пространственного, временного и тематического.
Пространственный аспект связан с определением местоположения,временной - с изменениями объекта или процесса с течением времени, в частности от одного временного среза до другого. Примером временных данных служат результаты переписи населения.Тематический аспект обусловлен выделением одних признаков объекта и исключением из рассмотрения других.
Все измеримые параметры моделей геоинформационных данных подпадают под одну из этих характеристик: место, время, предмет. Затруднительно исчерпывающим образом описать сразу все три эти характеристики. Поэтому при построении моделей данных на основе наблюдений явлений реального мира один параметр считают "неизменным", изменения другого "задаются" и при этом "измеряют" изменения
третьего параметра.
Зафиксировав географическое положение и изменяя время, можно
получить временные ряды данных. Зафиксировав время и изменяя географическое положение, получаем данные по профилям.
В большинстве технологий ГИС для определения места используют один класс данных - координаты, для определения параметров времени и тематической направленности - другой класс данных - атрибуты.
Однако прежде чем рассмотреть два основных класса данных в ГИС, необходимо рассмотреть методы определения местоположения точек объектов на поверхности Земли.
Определение положения точек на поверхности Земли
Координатные данные, составляющие один из основных классов геоинформационных данных, используют для указания местоположения на
земной поверхности.
Поверхность Земли имеет сложную форму. При общей площади ее
поверхности 510 млн. км2 71 % приходится на дно морей и океанов и
29 % - на сушу. Это дает основание считать, что земная поверхность
состоит из двух резко отличающихся морфологических элементов - ма-
териков и океанов.
С учетом того, что поверхность вод Мирового океана занимает по-
чти 3/4 поверхности Земли, за общую фигуру земли принимают тело,
ограниченное поверхностью воды океанов. Такая поверхность называ-
етсяуровненной. Потенциал силы тяжести на ней имеет одно и то же
значение. Другими словами, эта поверхность везде перпендикулярна от-
весной линии, т.е. везде горизонтальна.
Можно построить семейство горизонтальных поверхностей. Повер-
хность, которая совпадает с поверхностью Мирового океана в состоя-
нии покоя и равновесия и продолжена под материками, образует фигу-
ру, принятую в геодезии за общую фигуру Земли, называемуюгеоид.
С помощью методов дистанционного зондирования удалось уста-
новить, что Земля имеет грушевидную форму. В качестве математичес-
кой модели Земли применяют эллипсоид, который в геодезии принято
называтьреференц-зллипсоидом. В СССР до 1946 г. использовался эл-
липсоид, полученный Ф. Бесселем. В 1946 г: для обязательного исполь-
зования был введен эллипсоид, вычисленный в ЦНИИГАиК в 1940 г.
под руководством Ф.Н. Красовского при участии А.А. Изотова.
Для отображения положения точек поверхности на плоскости ис-
пользуют различные математические модели поверхности и различные
системы координат. На практике применяют два основных типа коорди-
нат: плоские и сферические. Реже применяют криволинейные или по-
лярные.
Выбор системы координат зависит от размеров исследуемых участ-
ков поверхности, как следствие, от влияния кривизны Земли. При изоб-
ражении небольших участков Земли часть уровненной поверхности мож-
но принять за плоскость. Такими участками будут участки до 20 км дли-
ной и площадью до 400 км2.
В этих случаях применимы плоские координаты.Плоские декар-
товы координаты определяются заданием двух осей. При этом обыч-
но координата Х указывает на восток, Y - на север. Задают масштабные
отрезки. Упорядоченная пара (X, Y) определит положение точки в за-
данной системе.
Плоские полярные координаты используют расстояние от начала координат (r) и угол ((r) от фиксированного направления. Направление обычно фиксируется на север, а угол отсчитывается по часовой стрелке от него. Полярные координаты удобны при проведении измерений от какой-либо заданной точки, например, когда используются данные таких источников, как радарные съемки.
При необходимости учета кривизны Земли применяют пространственные системы координат.
Для определения географической системы координат (разновидности сферической системы) введем следующие понятия:
• плоскость земного экватора - проходит через центр Земли перпендикулярно к оси вращения;
• плоскость географического (астрономического) меридиана- проходит через ось вращения Земли и отвесную линию в точке земной поверхности;
• меридиан - линия пересечения плоскостей географических меридианов с земной поверхностью;
• параллель - линия, образованная пересечением плоскости, параллельной плоскости земного экватора, с поверхностью Земли.
Положение точки определяется широтой ((р) и долготой ( А.).
Широта - это угол между точкой и экватором вдоль меридиана '.
Она изменяется от -90 ° (южный полюс) до +90 ° (северный полюс).
Долгота - это угол в плоскости экватора между меридианом точки
и главным (нулевым) меридианом, проходящим через Гринвич (Англия).
Она изменяется от -180° (западная долгота) до +180° (восточная дол-
гота).
На рисунке 2.3 изображено измерение широты и долготы для точки на поверхности Земли с координатами 550 с. ш. и 600 в. д.
Рис. 2.3
Основными понятиями этой системы координат являются:
меридиан - линия постоянной долготы;
параллель - линия постоянной широты;
большой круг - воображаемый круг на земной поверхности, обра-
зованный плоскостью, проходящей через центр земного шара;
малый круг - воображаемый круг на земной поверхности, образо-
ванный плоскостью, не проходящей через центр земного шара.
Рассмотренные системы координат носят в большей степени теоре-
тический характер. На практике используют более широкий набор сис-
тем координат: геоцентрические, топоцентрические, полярные гео-
дезические, эллиптические и др.
Координатные данные
Геометрически информация, содержащаяся на карте, может быть
определена как совокупность наборов точек, линий, контуров и площа-
дей, имеющих метрические значения, отражающие трехмерную реаль-
ность. Эта информация образуеткласс координатных данных ГИС, являющийся обязательной характеристикой геообъектов. Будучи частью (классом) общей модели данных в ГИС, координатные данные определяюткласс координатных моделей.
Основные типы координатных моделей
Класс координатных моделей можно разбить на типы. При этом сле-
дует учесть, что попытка включить в описание широкий набор групп
приводит к усложнению базы данных и процессов обработки. В ГИС
используют меньшее число атомарных моделей по сравнению с САПР.
В ГИС, как и в САПР, применяют набор базовых геометрических
типов моделей, из которых создают все остальные, более сложные. С
учетом предметной области карт ограничиваются лишь описанием та-
ких типов (структур географических данных), которые относятся к пред-
ставлению топографии и к тематическому упорядочению.
В ГИС включают следующие основные типы координатных данных:
• точка (узлы, вершины) (см. Рис. 2.4);
Рис. 2.4 Отображение точечных объектов.
;
• линия незамкнутая (см. Рис. 2.5);
Рис. 2.5 Отображение линейных объектов
• контур (замкнутая линия);
• полигон (ареал, район) - группы примыкающих друг к другу замкнутых участков (Рис. 2.6).
Рис. 2.6 Отображение полигональных объектов.
В некоторых системах в описание основных типов моделей включа-
ют понятие пространственная сеть, которая является развитием типа
данных район. Контуры и линии часто объединяют общим термином -
"линейные объекты". Таким образом, в разных ГИС число основных
типов координатных моделей меняется от трех до пяти. Проводя сравне-
ние с технологиями САПР, отметим, что основные типы координатных
данных являются аналогами атомарных моделей в САПР, которые назы-
ваютпримитивами.
Приведенные выше понятия носят концептуальный характер. На
практике для построения реальных объектов используют большее чис-
ло составных координатных моделей. В разных ГИС они незначительно
отличаются, поэтому рассмотрим в качестве примера набор данных в
системе ГеоГраф:
• точка - пара координат X, Y;
• отрезок - линия, соединяющая две точки;
• вершина (вертекс) - начальная или конечная точка отрезка;
• дуга (линия) - упорядоченный набор связных отрезков (или вершин);
• узел - начальная или конечная вершина дуги;
• висячий узел - узел, принадлежащий только одной дуге, у которой
начальная и конечная вершины не совпадают;
• псевдоузел - узел, принадлежащий только двум дугам либо одной замкнутой дуге, у которой начальная и конечная вершины совпадают. Исключением является узел, принадлежащий двум дугам, одна из которых самозамкнута в этом узле, а другая примыкает к ней (такой узел является нормальным);
• нормальный узел - узел, принадлежащий трем (и более) дугам.
Нормальным также является узел, принадлежащий двум дугам, одна из
которых самозамкнута в этом узле, а другая примыкает к ней;
• висячая дуга - дуга, имеющая висячий узел;
• замкнутая дуга - дуга, у которой совпадают начальная и конечная
вершины (у такой дуги имеется только один узел);
• полигон - единичная область, ограниченная (находящаяся внутри)
замкнутой дугой или упорядоченным набором связных дуг, которые об-
разуют замкнутый контур;
• покрытие - набор файлов, фиксирующий в виде цифровых запи-
сей пространственные объекты (точки, дуги, полигоны) и структуру
отношений между ними;
• пустое покрытие - покрытие, в котором отсутствуют простран-
ственные объекты;
• слой - покрытие, рассматриваемое в контексте его содержатель-
ной определенности (растительность, рельеф, административное деле-
ние и т.п.) или его статуса в среде редактора (активный слой, пассивный
слой);
• внутренний идентификатор пространственного объекта - целое чис-
ло, являющееся служебным идентификатором системы (уникальное для
каждого объекта данного покрытия и назначаемое автоматически в процес-
се работы редактора). Может изменяться системой в процессе работы;
• пользовательский идентификатор (внутренний ключ) простран-
ственного объекта - целое число, служащее для связи объектов цифро-
вой карты с базой (таблицами) тематических данных. Назначается и из-
меняется только пользователем.
Точечные объекты. Простейший тип пространственного объекта задают точечные данные, к которым относятся не только точки, но и все точечные условные знаки. Выбор объектов, представляемых в виде точек, зависит от масштаба карты или исследования. Например, на крупно масштабной карте точками показываются отдельные строения, а намелкомасштабной карте - города.
Особенность точечных объектов состоит в том, что они хранятся и в
виде графических файлов, как другие пространственные объекты, и в
виде таблиц, как атрибуты. Последнее обусловлено тем, что координаты
каждой точки описывают как два дополнительных атрибута. В силу это-
го информацию о наборе точек можно представить в виде развернутой
таблицы или таблицы, содержащей помимо координат наборы атрибу-
тов (идентификационные номера, тематические характеристики и т.д.).
В таких таблицах каждая строка соответствует точке - в ней собрана вся
информация о данной точке. Каждый столбец - это признак, содержащий
типизированные данные: координаты или атрибуты. Каждая точка незави-
сима от всех остальных точек, представленных отдельными строками.
Линейные объекты. Они широко применяются для описания се-
тей, для которых в отличие от точечных объектов характерно присут-
ствие топологических признаков.
Любая сеть состоит из узлов (вершин) - соединений, концов обо-
собленных линий и звеньев (дуг) - цепей в модели базы данных.
Для каждого узла существует специальная характеристика, называ-
емаявалентностью, определяемая количеством звеньев в нем. Концы
обособленных линий одновалентны. Для уличных сетей (пересечения
типа "крест") наиболее характерны четырехвалентные узлы. В гидроло-
гии чаще всего встречаются трехвалентные узлы.
В древовидной сети (Е-дерево) каждая пара узлов имеет лишь одно
соединение, не допускаются петли и замкнутые контуры, большая часть
речных сетей имеет древовидную структуру.
Линейные объекты, как и точечные, имеют свои атрибуты, причем
разные для дуг (звеньев) и узлов. Атрибутами для дуг являются:
• направление движения, интенсивность движения, протяженность;
• количество полос, время пути вдоль звена;
• диаметр трубы, направление движения газа;
• напряжение в ЛЭП, высота опор;
• количество путей, уклон, ширина тоннеля, грузоподъемность и др.
Атрибуты для узла:
• наличие перехода, названия пересекающихся улиц;
• наличие автоматического регулирования перекрестков;
• тип (ручной или автоматический) перевода стрелок;
• характеристики трансформаторов ЛЭП;
• мощность компрессора.
Некоторые атрибуты (например, названия пересекающихся улиц)
служат для связи одного типа объектов с другими (узлы со звеньями),
другие характеризуют только участки звеньев сети.
Во многих ГИС для включения дополнительных атрибутов в сеть необходимо разбиение существующих звеньев и создание новых узлов. Например, звено улицы, часть которой ремонтируется, разрывается на
месте начального и конечного участка ремонта, его атрибуты присваи-
ваются новому (двухвалентному) узлу. Другой пример: для отрезка до-
роги, проходящей через мост, создаются новое звено и два новых узла.
Такой подход может привести к появлению недопустимо большого чис-
ла звеньев и двухвалентных узлов, поэтому он имеет ограничение, оп-
ределяемое ресурсами конкретной ГИС.
Сети часто используют как системы линейной адресации. В этих
случаях точки размещают в сети по данным о номере звена и о расстоя-
нии от его начала. Это более удобно, чем использовать X, Y координаты
точки из таблицы, поскольку такие данные непосредственно указывают
положение точки в сети.
Данный подход определяет метод присвоения атрибутов отдельным
участкам звеньев. При этом линейные объекты (здания, тоннели) хра-
нятся в отдельных таблицах, а с сетью они увязаны путем указания но-
мера звена и расстояния от его начала.
Для точечных объектов необходимо указать одно значение коорди-
нат, для линейных — два (для начальной и конечной точек). Это позволя-
ет при необходимости рассчитать X, Y координаты этих объектов и ис-
ключает необходимость дробить звенья и вводить двухвалентные узлы.
Ареалы. В настоящее время в ГИС может быть представлено не-
сколько типов ареалов: зоны в приложении к окружающей среде или
природным ресурсам, социально-экономические зоны, данные об уго-
дьях и др.
Для ареальных объектов границы могут определяться свойством или
явлением, а также независимо от явления (затем перечисляются значе-
ния атрибутов). Кроме того, границы могут устанавливаться искусст-
венно, например для микрорайонов.
Взаимосвязи между координатными моделями
В общем случае пространственные данные могут иметь большое число разнообразных связей. Эти связи играют важную роль для пространственного анализа данных. Например, связь типа "содержится в" позволяет соотносить объекты с их окружением, связь "пересекает" между двумя линиями важна для анализа маршрутов в сетях.
Взаимосвязи могут существовать между объектами одного типа или разных типов.
Исходя из критерия построения моделей можно выделить три основных типа взаимосвязей между координатными объектами.
Первый тип - взаимосвязи для построения сложных объектов из
ростах элементов, например, взаимосвязи между дугой и упорядочен-
ным набором определяющих ее вершин, взаимосвязи между полигоном
упорядоченным набором определяющих его линий. При этом исполь-
уют процедуры агрегации и обобщения.
Второй тип - взаимосвязи, которые можно вычислить по коорди-
натам объектов. Например, координаты точки пересечения двух линий
определяют взаимосвязь типа "скрещивается" и наличие четырехвален-
тного узла. Табличные координаты отдельной точки и данные о грани-
цax полигонов позволяют найти полигон, включающий данную точку.
Этим определяется взаимосвязь типа "содержится в". Используя данные о
раницах полигонов, можно выяснить, перекрываются ли полигоны, и тем
амым установить взаимосвязь типа "перекрывает". Другими словами, вто-
ой тип связи содержится в атрибутивных данных в неявном виде.
Третий тип - "интеллектуальный". Эти взаимосвязи нельзя вы-
числить по координатам, они должны получать специальное описание и
семантику при вводе данных. Например, можно вычислить пересечение
двух линий, но, если этими линиями являются автодороги, нельзя ска-
зать, пересекаются они или в этом месте находится развязка автодорог.
Следовательно, для решения дополнительных задач необходима инфор-
мация о связях. Учет связей происходит при кодировании данных, т.е. в
подсистемах семантического моделирования.
Номенклатура и разграфка топографических карт
Поскольку основой интеграции данных в ГИС является географическая информация, необходимо рассмотреть понятия разграфка и номенклатура топографических карт.
Разграфкой называется разделение топографических карт на листы.
Номенклатура - это система обозначений отдельных листов топографических карт.
Общегеографические карты делятся на три вида:
• обзорные (масштаб 1 : 1 000 000 и мельче);
• обзорно-топографические (масштаб 1: 100 000- 1 : 1 000 000);
• топографические (масштаб 1 : 100 000 и крупнее).
Обзорно-топографические карты составляются по картам более крупных масштабов.
Топографические карты составляются по результатам съемок территорий и отличаются детальностью изображения местности. Это многолистные карты, т.е. на каждом листе отображается часть территории, а в совокупности на всех листах содержится полное отображение. Строго говоря, криволинейная часть поверхности отображаемой на листе карты соответствует некоей криволинейной трапеции. Поэтому для обозначения определенных листов карты используют термин трапеция.
В основу разграфки топографических карт положен лист карты масштаба 1 : 1 000 000. Для составления карты такого масштаба изображение земной поверхности разбивается на 60 колонн (двухугольников) начиная от Гринвичского меридиана через 6° .
Двухугольники нумеруются арабскими цифрами от 1 до 60 на восток от 180°. Возможна нумерация от 0°. В этом случае двухугольники называют не колоннами, а зонами. Нумерация зон от колонн отличается на 30 единиц, например, колонна с номером 40 соответствует зоне с номером 10.
Таким образом колонны и зоны делят земной шар по меридианам. Параллелями через 4° по широте изображение земной поверхности делится на ряды, обозначаемые буквами латинского алфавита к северу и югу от экватора. Таким делением по меридианам и параллелям определяется номенклатура листа карты масштаба 1 : 1 000 000 (миллионной).
Номенклатура каждого листа включает букву ряда и номер колонны. Так, лист, на котором показывается г. Москва, имеет номенклатуру N-37, что соответствуют 52 - 56° широты и 36 - 42° долготы. Номенклатура сдвоенных или счетверенных листов карты складывается из обозначений широтного пояса и соответственно двух или четырех колонн.
Номенклатура листов карт более крупных масштабов связана с номенклатурой листов миллионной карты. Так, лист карты масштаба
500 000 составляет 1/4 листа миллионной карты и обозначается добавлением прописной буквы А, Б, В, Г к номенклатуре листа
миллионной карты, например N-37-Б.
Лист карты масштаба 1 : 300 000 составляет 1/9 листа миллионной
карты и обозначается римскими цифрами от I до IX, расположенными
перед номенклатурой миллионного листа, например I-N-37.
Лист карты масштаба 1 : 200 000 составляет 1/36 листа
миллионной карты и обозначается римскими цифрами от I до XXXVI,
расположенными после номенклатуры миллионного листа, например
N-37-I.
Лист карты масштаба 1 : 100 000 составляет 1/144 листа миллионной карты и обозначается арабскими цифрами от 1 до 144, расположенными после номенклатуры миллионного листа, например N-37-143.
Номенклатура листов карт более крупных масштабов строится на
основе листа карты масштаба 1 : 100 000, подобно тому, как строились
номенклатуры рассмотренных выше карт на основе листа миллионной
карты.
Так, лист карты масштаба 1 : 50 000 составляет 1/4 листа карты мас-
штаба 1: 100 000 и обозначается добавлением прописной буквы А, Б, В,
Г к номенклатуре листа карты стотысячного масштаба, например N-37-144-A.
Лист карты масштаба 1 : 50 000 содержит 4 листа карты масштаба 1: 25 000, которые обозначаются добавлением строчных букв а, б, в, г к номенклатуре листа карты пятидесятитысячного масштаба, например N-37-144-E-6.
Лист карты масштаба 1 : 25 000 содержит 4 листа карты масштаба
1: 10 000, которые обозначаются добавлением арабских цифр 1, 2, 3, 4
к номенклатуре листа карты двадцатипятитысячного масштаба, например N-37-144-B-a-l.
Лист карты масштаба 1 : 100 000 содержит 256 листов карты масш-
таба 1: 5 000, которые обозначаются добавлением арабских цифр от
1 до 256 к номенклатуре листа карты стотысячного масштаба, например N-37-144-(255).
Номенклатура листа карты масштаба 1:2 000 образуется на основе деления листа карты 1: 5 000 на 9 частей. Каждый лист обозначается путем добавления строчных букв русского алфавита а, б, в, г, д, е, ж, з, и к номенклатуре пятитысячного масштаба, например N-37-144-(256-a).
2.2 АТРИБУТИВНАЯ ИНФОРМАЦИЯ В ГИС
Одних координатных данных недостаточно для описания картографической или сложной графической информации. Картографические
объекты кроме метрической обладают некоторой присвоенной им описательной информацией (названия политических единиц, городов и рек). Характеристики объектов, входящие в состав этой информации, называют атрибутами. Совокупность возможных атрибутов определяет класс атрибутивных моделей ГИС.
Выше отмечалось, что атрибутивные данные описывают тематические и временные характеристики. Таблица, содержащая атрибуты объектов, называетсятаблицей атрибутов.
Атрибуты, соответствующие тематической форме данных и определяющие различные признаки объектов, также хранятся в таблицах. Каждому объекту соответствует строка таблицы, каждому тематическому
признаку - столбец таблицы. Каждая клетка таблицы отражает значение
определенного признака для определенного объекта.
Временная характеристика может отражаться несколькими способами:
• путем указания временного периода существования объектов;
• путем соотнесения информации с определенными моментами времени;
• путем указания скорости движения объектов.
В зависимости от способа отражения временной характеристики она
может размещаться в одной таблице или в нескольких таблицах атрибутов данного объекта для различных временных этапов.
Применение атрибутов позволяет осуществлять анализ объектов базы
данных с использованием стандартных форм запросов и разного рода
фильтров, а также выражений математической логики. Последнее эффективно при тематическом картографировании.
Кроме того, с помощью атрибутов можно типизировать данные и
упорядочивать описание для широкого набора некоординатных данных.
Таким образом, атрибутивное описание дополняет координатное,
совместно с ним создает полное описание моделей ГИС и решает зада-
чи типизации исходных данных, что упрощает процессы классификации и обработки.
Атрибутами могут быть символы (названия), числа (статистическая
информация, код объекта) или графические признаки (цвет, рисунок,
заполнения контуров).
Числовые значения в ГИС могут относиться как к координатным
данным, так и к атрибутивным. Для пояснения этого напомним, что ос-
новной формой представления атрибутивных данных в БД является таб-
лица, а в таблице могут храниться как координаты объектов (координат-
ные данные), так и описательные характеристики (атрибутивные
данные).
Можно по-разному организовывать взаимосвязь координатного и
атрибутивного описания. Например, В. Вебером было предложено спе-
цифическое сочетание координатного и атрибутивного классов для опи-
сания картографических данных. Для построения общей модели дан-
ных ГИС он вводит четырехмерное пространство объекта, где первые
два (плановые) размера присваиваются данным X, У, атрибуты распола-
гаются в третьем измерении, а четвертое измерение резервируется для
временных наборов данных.
Такой подход не нов, он заимствован из методов релятивистской
механики и теории N-мерных пространств. По Веберу, данные по коор-
динате Z следует обрабатывать как атрибуты, помещая их в одну и ту же
категорию наряду с описательными текстами и значениями.
Существуют различные методы хранения атрибутивной информа-
ции в ГИС:
- хранение для всех объектов системы 1-2 стандартных атрибутов;
• хранение таблицы атрибутов, связанных с пространственными
объектами, и информации о реляциях;
• хранение ссылок на элементы данных иерархической или сетевой БД;
· хранение атрибутивной информации может вообще не применять-
ся, если система опирается на классификатор.
Вопросы точности координатных и атрибутивных данных
Использование любой информации допустимо, если она удовлетво-
ряет определенным критериям и стандартам. Одним из критериев при-
менимости пространственно-временных данных в системах ГИС являетсяточность - близость результатов, расчетов или оценок к истинным значениям (или значениям, принятым за истинные). Например, точность горизонтали в цифровой базе данных, полученной на основе дигитализации по карте, можно оценить сравнением ее с горизонталью на исходной карте.
Рассмотрим несколько показателей точности в ГИС' точность вы-
числения, точность измерения, точность представления
Точность вычисления определяется количеством значимых цифр
после запятой, точность измерении - количеством значимых цифр при
измерениях, точность представления - количеством разрядов, описы-
вающих координатные данные
Точность вычислений и измерений не адекватна точности представ-
ления. Большое количество значимых цифр не всегда гарантирует точ-
ность вычислений или измерений.
Точность вычисления в ГИС велика, обычно она намного выше, чем
точность самих данных Более того, набор специальных методов и алго-
ритмов в ряде случаев позволяет повысить точность первичных измере-
ний.
Точность входит в комплекс данных, определяющий важный пока-
затель- качество данных.
В США разработаны национальные стандарты для цифровых кар-
тографических данных, которые применяются при оценке точности циф-
ровых данных.
Стандарт выделяет несколько компонентов качества данных
• позиционную точность;
• точность атрибутов;
• логическую непротиворечивость;
• полноту,
• происхождение.
Позиционная точность выражается степенью отклонения данных
ГИС о местоположении от истинного положения объекта на местности
Обычно точность карт приблизительно определяется толщиной линии,
или 0,4 мм Это соответствует 10 м в масштабе 1 : 25 000.
Для проверки позиционной точности используют независимые бо-
лее точные источники, например карту более крупного масштаба, сис-
тему глобального позиционирования (GPS) и др.
Можно на основе известного в статистике правила "переноса оши-
бок" оценить точность, зная погрешности, вносимые различными ис-
точниками. Например, при создании цифровой модели имели место сле-
дующие погрешности-1 мм в исходном материале, 0,4 мм на карте, пред-
назначенной для цифрования, 0,1 мм при цифровании.
Точность атрибутов определяется близостью значений атрибута
к его истинной величине. Атрибуты могут со временем меняться: до-
вольно часто по сравнению с координатными данными.
В зависимости от типов данных точность атрибутов может быть из-
мерена разными способами. Для непрерывных атрибутов (поверхнос-
тей), например в полигонах Тиссена, точность выражается как погреш-
ность измерений. Для атрибутов категорий объектов, например класси-
фицированных полигонов, точность зависит от того, являются ли кате-
гории подходящими, достаточно подробными и определенными, и от
того, какова вероятность наличия в данных грубых ошибок.
Точность атрибута может быть различной в разных частях карты,
поэтому полезнее рассчитывать пространственную вариацию вероятно-
сти ошибки в классификации, чем пользоваться обобщенными статис-
тическими показателями.
Понятиелогической непротиворечивости связано с непротиворе-
чивостью данных в базах данных.
В среде ГИС это понятие распространяется на внутреннюю непро-
тиворечивость структур данных и внутреннюю топологическую непро-
тиворечивость векторных данных. В частности, это определяет такие
требования, как замкнутость полигонов, уникальность идентификатора
полигона, наличие или отсутствие узлов на пересечениях дуг.
Понятиеполноты (достаточности) данных связано со степенью
охвата данными множества соответствующих объектов. В зависимости
от правил отбора, генерализации и масштаба определяют число соот-
ветствующих объектов для полного описания ситуации, картографичес-
кой композиции, явления и т.п.
Несколько специфический показательпроисхождение включает
сведения об источниках данных и операциях по созданию базы данных,
о методах кодирования данных, времени сбора данных, методе обработ-
ки данных, точности результатов вычислений и т.п.
2.3 ЭЛЕМЕНТЫ ЦИФРОВОЙ КОМПЬЮТЕРНОЙ КАРТОГРАФИИ
Векторные и растровые модели
Основой визуального представления данных при помощи ГИС-технологий служит так называемая графическая среда. Основу графической среды и соответственно визуализации базы данных ГИС составляют векторные и растровые модели.
В общем случае модели пространственных (координатных) данных
могут иметьвекторное илирастровое (ячеистое) представление, со-
держать или не содержать топологические характеристики. Этот подход
позволяет классифицировать модели по трем типам:
• растровая модель;
• векторная нетопологическая модель;
• векторная топологическая модель.
Все эти модели взаимно преобразуемы. Тем не менее при получе-
нии каждой из них необходимо учитывать их особенности. В ГИС фор-
ме представления координатных данных соответствуют два основных
подкласса моделей - векторные и растровые (ячеистые или мозаичные).
Возможен класс моделей, которые содержат характеристики как векто-
ров, так и мозаик. Они называются гибридными моделями.
В дальнейшем под терминами решетка, мозаика, элемент растра
будем понимать одно и то же. Основу такой классификации составляет
атомарная единица (пространства), содержащая представления площа-
дей линий и точек.
Векторная модель
Построение модели. Векторные модели данных строятся на векто-
рах, занимающих часть пространства в отличие от занимающих все про-
странство растровых моделей. Это определяет их основное преимуще-
ство - требование на порядки меньшей памяти для хранения и меньших
затрат времени на обработку и представление.
При построении векторных моделей объекты создаются путем со-
единения точек прямыми линиями, дугами окружностей, полилиниями.
Площадные объекты - ареалы задаются наборами линий. В векторных
моделях термин полигон (многоугольник) является синонимом слова
ареал.
Векторные модели используются преимущественно в транспортных,
коммунальных, маркетинговых приложениях ГИС. Системы ГИС, рабо-
тающие в основном с векторными моделями, получили названиевек-
торных ГИС.
В реальных ГИС имеют дело не с абстрактными линиями и точка-
ми, а с объектами, содержащими линии и ареалы, занимающими про-
странственное положение, а также со сложными взаимосвязями между
ними. Поэтому полная векторная модель данных ГИС отображает про-
странственные данные как совокупность следующих основных частей:
• геометрические (метрические) объекты (точки, линии и полигоны);
• атрибуты - признаки, связанные с объектами;
• связи между объектами.
Векторные модели (объектов) используют в качестве атомарной
модели последовательность координат, образующих линию.
Линией называют границу, сегмент, цепь или дугу. Основные типы
координатных данных в классе векторных моделей определяются через
базовый элемент линия следующим образом. Точка определяется как
выродившаяся линия нулевой длины, линия - как линия конечной дли-
ны, а площадь представляется последовательностью связанных между
собой сегментов.