Виды информации и их классификация
В принципе информацию можно разделить по:
1. Области знаний (биологической, технической, экономической...);
2. Физической природе восприятия (зрительная, слуховая, тактильная);
3. Структурно-аналитическим свойством;
4. Структурно-метрическим свойствам.
Первое и второе не требует пояснений.
Структурно-аналитический метод классификации
В основе этого метода лежит подход, основанный на обобщенном анализе физического процесса как источника информации. В принципе все источники информации можно интерпретировать геометрическими образами.
Физическая система (рис. 1.3.1), являясь источником информации, не всегда может быть описана аналитическими выражениями, но используя подход, развитый в теоретической области, можно в физической системе выделить совокупность характеристик, правильно представляющих данные об объекте. Например, такая характеристика, как граница объекта - это геометрический образ, который наряду с внутренней структурой достаточно полно характеризует форму и часть его свойств. У физических объектов, их моделей и преобразователей информации много общего, основанного на геометрических образах.
Рис. 1.3.1. Физическая система и ее информационные характеристики
Поэтому структурно-аналитический метод позволяет качественно сопоставлять различные физические процессы, их модели и преобразователи информации.
Например, структурно-аналитический метод позволяет ввести:
- единую качественную классификацию физических процессов, уравнений, описывающих их, и моделей;
- наглядно представить место классифицируемого объекта среди других на основе совокупности его характеристик.
Для описания особенностей объектов использована матричная форма представления характеристик.
Как было указано, у физического объекта может быть выделено две главные характеристики - граница и структура, т.е. внутренняя область. Причем, в реальных условиях обе они могут находиться под воздействием различных факторов. В реальных условиях это, например, нагрев, разрушение структуры или ее образование (кристалла) и т.п.
Для аналитического представления (рис.1.3.1) введем обозначения:
F - структура физической системы; G - граница; f - воздействие на структуру;
g - воздействие на границу;
Каждая из характеристик (F,f,G,g) может зависеть от различных аргументов, например:
t0 – значение в начальный момент; t - зависимость характеристик от времени;
j - зависимость от искомой функции.
Это можно записать в виде структурно – аналитического вектора (САВ) – (1,1,0), где “1” и “0” означается наличие или отсутствие зависимости от t0, t, j.
Используя такие векторы по каждой характеристике можно записать структурно-аналитическую матрицу (САМ) в следующем виде:
М = 3
Для более общего случая можно ввести зависимость от производных каждой из характеристик, и тогда САМ будет иметь вид:
M = n
Данная структурно-аналитическая матрица представляет обобщенное описание физической системы, где цифра “3” обозначает трехмерный (объемный) физический объект. САМ, развитая в сторону увеличения зависимости от производной по t, более полно представляет динамику изменений в процессе. Коэффициент n перед матрицей указывает на размерность.
По подобной методике можно представить процесс, основываясь на математической модели, его описывающей. Это позволяет использовать аппарат САМ для установления возможностей реализации технического моделирования процесса, исходя из его аналитического описания.
Этот же подход легко переносится на устройства преобразования информации, которые по существу являются устройствами параметрического отражения физических характеристик объекта наблюдения, например САМ для отображения имеет вид:
M =2
Эта САМ, описывающая плоский индикатор (например дисплей тепловизора), в котором границы не изменяются, а внутренняя структура изменяется. Вектор f(1,1,0) показывает изменение частоты излучения на плоскости, т.е. цвета соответствующего температуре тела.
Необходимо отметить, что используемые в настоящее время методы информационного анализа могут применяться при:
1) фиксирование характеристик поля (электрического, теплового, магнитного...);
2) фиксирование собственных характеристик вещества (плотности, концентрации, теплопроводности и т.п.);
3) фиксирование геометрических характеристик;
4) фиксирование физических характеристик, имеющих другую физическую природу, чем интересующее нас следствие (например, температура и связанная с ее изменением кристаллизация) и т.д.
Описание этих процессов и позволяет проводить структурно-аналитический метод.
Структурно-метрическая классификация
В основе этого подхода лежит анализ по форме представления сигналов.
Таблица 1.1. Виды и формы представления информации
Виды информации | Обо-зна- | Формы представления информации | ||||||
чение | топологи-ческая | парамет-ры | абстракт-ная | лингвис-тическая | ||||
Событие | Ф0 | точка | “0.1” | суждение | знак | |||
Величина | Ф1 | линия | единица | понятия | буква | |||
Функция | Ф2 | функция (поверх-ность) | площадь | образ | слово | |||
Комплекс | Ф3 | объем (тело) | объем | система | предло-жение (фраза) | |||
Поле | Ф4 | простран-ство | обобщен-ная метрика | универ-сум | фонд |
Ф0 - информация нулевого порядка, соответствует мощности точки;
Ф1 - информация первого порядка, соответствует мощности линии;
Ф2 - информация второго порядка, соответствует мощности функции, поверхности;
Ф3 - информация третьего порядка, соответствует мощности объема, тела.
Таким образом, строение информации можно изменять, переходя от одного вида информации к другому.
Параметрической информацией чаще всего пользуются в науке и технике для выражения результатов измерения. Топологической информацией удобно выражать образы и ситуации, подлежащие распознаванию.
Абстрактную информацию применяют в исследованиях на высоком теоретическом уровне, когда нужны отвлечения, обобщения и символизация.
Представим геометрическими образами некоторые формы представления информации (Рис. 1.3.2. а).
Событие А. Первичным и неделимым элементом информации является элементарное двоичное событие - выбор из утверждения или отрицания, истины или лжи, согласие или несогласие, наличие или отсутствие какого-либо явления. Примером могут служить сведения об импульсе или паузе в электрической цепи, выпуске годного или негодного изделия, достижении или недостижении измеряемой величиной одного определенного значения, черным или белым элементах телевизионного изображения, наличия или отсутствия команды и т.д.
Двоичность события позволяет представлять его условно в геометрической символике точкой и пробелом (· и о), в арифметической символике - единицей и нулем (1 и 0), в сигнальной символике - импульсом и паузой (__Ç__ и ¾ ).
Событие является категорией нулевой меры, т.е. не имеет геометрических измерений. Поэтому оно и представимо.
Другие категории информации могут быть представлены как совокупность различных событий.
Величина Q(рис.1.3.2 б) - есть упорядоченное в одном измерении (по шкале значений) множество событий, причем каждое из них отвечает принятию величиной какого-либо одного значения. Величина может быть или дискретной, или непрерывной; в первом случае она представлена совокупностью дискретных значений в одном измерении, во втором - упорядоченной, непрерывной величиной.
Функция Q(T)(рис.1.3.2 в) - это функция Q(T),или в зависимости от S Q(S) или от другой функции Q1 - Q2 (Q1),есть соответствие между величиной и временем, пространством или другой величиной. В этом смысле функцию можно трактовать как двумерное поле событий.
Комплекс Q(T,S)(рис. 1.3.2 г) полный комплекс информации Q(T,S) есть соответствие между величиной, с одной стороны, и временем и пространством - с другой. Таким образом, полный комплекс информации есть трехмерное поле событий.
Как указывалось, информация может быть представлена моделями с различной размерностью. Отвлекаясь от конкретного вида координат (параметр Q, время T, пространство S) и введя обобщенную координату информации Ф (согласно таблице 2), получаем следующую классификацию:
Ф0, Ф1, Ф2, Ф3, ... , Фn,
где Ф0 - нульмерная информация (событие); Ф1 - одномерная информация (величина); Ф2 - двумерная информация (функция); Ф3 - трехмерная информация (комплекс); ... ; Фn - n-мерная информация (n - мерное пространство).
Рис.1.3.2. Категории информации
Таблица 1.2. Структурные информационные формулы
События | события по времени |
Ф0 (А) Ф1 (А1, А2, А3, ... , Аn) | Ф1 (A, T) Ф2 (А1, А2, А3, ... , Аn, T) |
ПАРАМЕТРЫ | ПАРАМЕТРЫ ВО ВРЕМЕНИ |
Ф1 (Q) Ф2 (Q1, Q2) Ф3 (Q1, Q2, Q3) ............................... Фn (Q1, Q2, Q3, ... , Qn) | Ф2 (Q, T) Ф3 (Q1, Q2, T) Ф4 (Q1, Q2, Q3, T) ............................... Фn (Q1, Q2, Q3, ... , Qn-1, T) |
ПРОСТРАНСТВО СОБЫТИЙ | ПРОСТРАНСТВО СОБЫТИЙ ВО ВРЕМЕНИ |
Ф1 (S) Ф2 (S1, S2) Ф3 (S1, S2, S3) | Ф2 (S, T) Ф3 (S1, S2, T) Ф4 (S1, S2, S3, T) |
ПАРАМЕТРИЧЕСКИЕ ПРОСТРАНСТВА | ПАРАМЕТРИЧЕСКИЕ ПРОСТРАНСТВА ВО ВРЕМЕНИ |
Ф2 (Q, S) Ф3 (Q, S1, S2) Ф4 (Q, S1, S2, S3) | Ф3 (Q, S, T) Ф4 (Q, S1, S2, T) Ф5 (Q, S1, S2, S3, T) |
Показатель степени указывает размерность или порядок информации. Наиболее часто встречающиеся на практике разновидности научной и технической информации могут быть выражены теперь структурными информационными формулами (табл.1. 2), которые отличаются тем, что в них указываются только размерность и компоненты информации, но не функциональные зависимости между компонентами.
Одна группа событий есть нульмерная относительно времени категория, так что совокупность пронумерованных подряд событий занимает одно измерение S. Время T само по себе не содержит информации.
Вторая группа формул в табл. 1.2 описывает представление каких-либо событий во времени. Множество событий во времени можно упорядочить относительно координат S и T в виде функций S(T).
Чаще всего параметрическая информация сообщает о различных физических величинах, оцениваемых по индивидуальным шкалам измерения или приведенных к одной общей шкале. Эти физические величины будем называть параметрами. Информация об одной скалярной величине одномерна. Информация о функциональной зависимости между двумя величинами, например S2 = f (S1), занимает два измерения в координатах S1 и S2. Более сложные соотношения между многими величинами представляются n-мерными категориями или образами. Информация об изменении параметров во времени занимает от двух до n измерений в зависимости от количества отдельных параметров.
Геометрические пространства (линия, плоскость, объем) представляют собой информационные категории только в тех случаях, когда они определяют местоположение событий. Пространства, отнесенные к определенному времени, также имеют информационный смысл только в связи с описанием некоторых событий, например появления или перемещения поездов на линии, кораблей в море, самолетов в воздухе или обнаружения дефектов в проволоке, листовом материале, слитке стали. Координата S представляет событие на линии; S1 и S2 являются координатами плоскости; S1, S2 и S3 характеризуют объем.
Параметрические пространства могут содержать информацию о распределении некоторых параметров по линии, плоскости и объему. К ним относятся, в частности, одномерные, двумерные и трехмерные физические поля или производственные комплексы, в которых точки контроля описаны столбцом, плоской матрицей или объемным макетом.
Параметрические пространства, отнесенные к определенному времени, могут содержать информацию об изменении множества величин, упорядоченных относительно одной (S1), двух (S1, S2) или трех (S1, S2 и S3) пространственных координат и приведенных к одной общей унифицированной шкале измерения. Примером может служить изменение физических полей во времени.
Структура информации
Информация может претерпевать ряд преобразований. Последовательность этих преобразований может быть различной в различных информационных системах. Получаемые в процессе преобразований структуры имеют абстрактный характер и не соответствует строго тем или иным этапам обработки информации в технических средствах информационных систем.
Табл. 1.3. Символическое описание нормализованной информации
обозначение | структура | характеристика структуры |
{Q} {T} {S} | Натуральная | Первоначальная структура информации |
M, D, L [{Q} {T} {S}] | Нормализован-ная | Приведена к единому масштабу, диапазону и началу отсчета |
{Q, T, S} | Комплексиро- ванная | Приведена к единым координатам, времени и параметру. |
Декомпаниро- ванная (операция декомплексирования) - декомпозиция | Преобразованы числа измерений, структура и расположение. | |
GA {Q, T, S} | Генерализован-ная | Устранена избыточность, выделена существенная часть по условию А. |
Q*, T*, S* | Дискретная | Квантованная по любому из элементов структуры. |
qA, qT, qS | Безразмерная | Дискретные отсчеты приведены к безразмерной форме |
AQ, AT, AS | Кодирование | Цифровая форма информации |
Натуральная информация отражает реальное существование объектов. Она имеет аналоговую форму, засорена шумами, неоптимальна по диапазонам и началам отсчетов значения. Эти ограничения обусловлены непосредственно физическими свойствами наблюдаемого объекта. Натуральную информацию можно условно представить как совокупность величин Q, моментов времени T и точек пространства S в виде множеств {Q}, {T} и {S}.
Нормализованная информация отличается от натуральной тем, что в ней каждое множество {Q}, {T}, {S} уже приведено к одному масштабу, диапазону, началу отсчета и другим общим унифицированным характеристикам. Нормализованную информацию можно трактовать как результат воздействий на натуральную информацию операторов: масштабного M, диапазонного D и локализационного L.
Символическое описание нормализованной информации представленов табл. 1.3. Комплексированная информация образуется в результате приведения всей информации к полному комплексу, т.е. к трехмерной системе QST, где Q - обобщенная координата значений параметров или унифицированная шкала каких-либо оценок; T - обобщенная координата времени; S - обобщенная координата пространства источников информации. Комплексированная информация представляет собой связанное и координированное множество {Q, S, T}. Изменение количества измерений структуры и расположения элементов в информационных комплексах приводит к форме декомпонированной информации. Особенно часто применяют два вида декомпозиции:
1) приведение физического пространства трех измерений (объема) физических полей, объемных факторов, многомерных систем датчиков, векторных и комплексных величин к пространствам двух и одного измерений;
2) приведение полного комплекса информации QST к любой плоскости QT, QS, ST или оси Q, S, T координат измерений.
Декомпонированная информация декоррелирована, в ней нарушены или удалены связи между отдельными элементами информации.
Структурная формула декомпозиции имеет вид:
В генерализованной информации исключены второстепенные ее части, данные обобщены и укрупнены. Генерализация может охватывать как номенклатуру параметров, так и моменты времени, диапазоны измерения и степень подробности из отображения.
Формула GA {Q, T, S} показывает, что производится генерализация G по алгоритму A комплекса {Q, T, S}.
Дискретная (квантованная) информация совпадает с исходной непрерывной по физической размерности, отличаясь от нее лишь прерывным характером. Дискредитация может быть осуществлена по осям Q, T и S параметрического комплекса. Дискретная информация удобна для расчетов и экономична в реализациях. Дискретизация может быть равномерной или неравномерной, производится по постоянному или изменяющемуся во времени закону. Оптимальные интервалы дискретизации определяются на основании теории дискретных отсчетов.
Безразмерная информация отличается универсальной числовой формой. Число, отображающее безразмерную информацию, соответствует количеству информационных элементов (квантов) и получается в результате дискретизации информационного комплекса, т.е. равно отношению любой координаты к ее интервалу дискретности:
qQ = ; qT = ; qS =
Кодированная информация несет форму совокупности чисел, или цифровую форму, основанную на применении какой-либо системы счисления или кодирования.
Из бесконечного множества физических процессов, протекающих в объектах наблюдения или управления, выделяются сигналы, формирующие первичную информацию. Рис. 1.4.1.
Первой фазой является структурное устранение избыточности.
Вторая фаза состоит в том, чтобы устранить статистическую избыточности путем учета вероятностных характеристик информации.
Третья фаза заключается в том, что выделяется смысловое содержание, т.е. осуществляется семантическое обогащение информации.
Далее может последовать фаза формирования решений и воздействий, после которой выдаются единичные командные сигналы.
Рис. 1.4.1. Этапы устранения избыточности информации
Перечисленные выше этапы устранения избыточности показаны в виде пирамиды потоков информации с последовательным уменьшением их плотности.