Пространственное представление цифровых изображений
1. Оцифровка двумерных сигналов
Для формирования компьютерного цифрового изображения сигналы, полученные от сенсоров в аналоговой форме, преобразуются в цифровую форму. Оцифровка предполагает дискретизацию и квантование. При обработке графических изображений при дискретизации конечным множеством значений представляются координаты изображения, а при квантовании - уровни яркости, т.е. амплитуды сигнала (рис.1).
Рис.1 а) Исходное (аналоговое) изображение, б) Изображение с оцифрованным фрагментом вдоль линии АВ, в) Изменение яркости вдоль линии АВ,
г) Дискретизация по координатам, д) квантование по уровню
На рис.1 изображена шкала яркостей, разбитая на восемь дискретных уровней от черного до белого. При квантовании каждому значению непрерывной яркости в точках дискретизации сопоставляется один из восьми дискретных уровней (ближайший по яркости). В результате дискретизации и квантования формируется дискретный набор цифровых отсчетов, соответствующий одной строке изображения. Для полной оцифровки построчную процедуру необходимо выполнить для всех строк изображения. Интервал между строками устанавливается согласно требованиям к точности дискретизации.
Теоретически оцифровка предполагает доступность непрерывного изображения по обеим координатам и по яркости. На практике способ оцифровки определяется конструкцией сенсорного устройства, применяемого для регистрации изображения. Если изображение формируется одиночным сенсором в сочетании с механическим его перемещением, то выходной сигнал сенсора квантуется, как описано выше, а дискретизация определяется выбором шага механического перемещения сенсора в процессе сбора данных. На качестве сказывается и несовершенство оптической системы, применяемой для фокусировки светового пятна на чувствительном элементе.
Если для формирования изображения используется линейка сенсоров, то число сенсоров в ней определяет предел дискретизации изображения по одному направлению. Механическим перемещением в другом направлении можно управлять и с более высокой точностью. Выходные сигналы всех элементов линейки квантуются однотипно.
В случае регистрации изображения с помощью матрицы сенсоров параметры дискретизации изображения по обоим направлениям определяются числом сенсоров в матрице (рис.2).
Рис.2 а) Исходное (аналоговое) изображение, б) Цифровое представление изображения при матричной регистрации
В результате дискретизации и квантования формируется матрица действительных чисел из L строк и M столбцов. Координаты исходного аналогового изображения представлены в матрице дискретными значениями. Для ясности обозначений и удобства использования эти дискретные координаты представляются целочисленными значениями, принимая за начало координат левый верхний угол изображения. Матричное представление оцифрованного изображения имеет вид:
Более традиционная матричная запись оцифрованного изображения:
где - элемент матрицы, т.е. изображения.
Каждый элемент изображенияназывается пикселем (Pixel – picture element).
Для оцифровки изображения принимается решение относительно значений L и M, а также числа уровней (градаций) яркости I каждого пикселя, т.к. качество цифрового изображения в большой степени зависит от шага дискретизации и количества уровней квантования.
Для L и M не существует специальных требований помимо того, что они должны быть положительными целочисленными значениями. Значение I выбирают равным целочисленной степени двойки: I=2q. Следовательно, при 8-битном квантовании изображение имеет 256 градаций серого. Уровни яркости располагаются с постоянным шагом и принимают целые значения в интервале [0, 2q-1]. Интервал значений яркости называют динамическим диапазоном изображения. Изображение с большим динамическим диапазоном имеет высокий контраст. Наоборот, изображение с малым динамическим диапазоном выглядит тусклым, размытым и серым.
Количество битов, необходимое для хранения цифрового изображения, определяется по формуле . В случае квадратного изображения (L=M=N) это равенство приобретает вид . Таким образом, при размере изображения 1024х1024 пикселей при 8-битном квантовании требуется 1Мбайт памяти.
Дискретизация определяет пространственное разрешение изображения, т.е. размер наиболее малых различимых фрагментов. Под разрешением понимается максимальное число различимых пар линий на единицу длины, например, 100 пар линий на миллиметр. Пара линий – это одна линия условного чертежа с примыкающим к ней с одной стороны промежутком между линиями.
Яркостным (или полутоновым) разрешением, называется наименьшее различимое изменение яркости.
Как правило, изображение, имеющее размеры LxM пикселей и I градаций, называют изображением с пространственным разрешением LxM пикселей и яркостным разрешением I градаций. Реальный размер различимых элементов указывается только в случае необходимости.
2. Системы координат двумерных изображений
Растровая координатная система, применяемая при выводе изображения, имеет пиксел с начальными координатами (1,1) в левом верхнем углу экрана. Пикселы нумеруются по строкам слева направо, а по столбцам – сверху вниз (рис.2а). В пространственной системе координат каждый пиксел представляется квадратом размером 1х1 (рис.2б). Координаты центра каждого квадрата совпадают с координатами пикселов в растровой системе. Другие геометрические распределения пикселей в пространственной системе показаны на рис.2в,г (треугольная и гексагональная).
Рис.2 Растровая (а) и варианты пространственной систем координат
3. Окрестностные соотношения
У элемента прямоугольного изображения (центрального пиксела) p, с координатами (х, у) имеются четыре соседних пиксела по вертикали и горизонтали с координатами (рис.3). Это множество пикселей называется четверкой соседей (4-компонентная окрестность) и обозначается N4(p). Каждый его элемент находится на единичном расстоянии от пикселя (х, у). Если же точка (х, у) расположена на краю изображения, то некоторые из соседних пикселей оказываются за пределами изображения.
Четыре соседних пиксела по диагонали имеют координаты и обозначаются ND(p). Вместе с четверкой эти пикселы образуют восьмерку (8-компонентная окрестность), обозначаемую N8(p). Некоторые пикселы восьмерки также могут оказаться за пределами изображения, если пиксел (х, у) расположен на его краю.
Рис.3 Варианты окрестностей
В случае треугольной координатной сетки можно определить 3-компонентные и 12-компонентные окрестности, в которых соседние элементы имеют либо общее ребро, либо общий угол.
На гексагональной сетке присутствует только 6-компонентная окрестность.