И стоят в таблице по диагонали.
a11=g11=0,911 | a12=a12=0,045 | a13=a13=3,369×10-4 | a14=a14=0,074 |
a21=b21= 0,125 | a22=g22=0,897 | a23=a23= 0,136 | a24=a24= 0,081 |
a31=b31=2,462×10-4 | a32=b32= 0,897 | a33=g33=0,928 | a34=a34=0,01 |
a41=b41=0,329 | a42=b42=0,19 | a43=b43=0.028 | a44=g44=0,933 |
Расчет достоверности классификации горных пород по признаку Z осуществляется по формуле (1.10.4).
G(Z)=0,2×0,911+0,4×0,897+0,3×0,928+0,1×0,933=0,913
Информативность легенды геолого-геофизической
Документации
Рассмотрим, какую полную информацию имеет точка наблюдений в будущей геологической карте при созданной модели документации горных пород района.
На практике при геологической съемке о геологическом пространстве мы судим по комплексу геологических наблюдений, поэтому вместо реального пространства (система Х) , получаем некоторую модель (система У), которую называют геологической картой, и которая не во всем совпадает с реальным пространством (система Х).
Различия между геологическим пространством (Х) и полученным его отражением - геологической картой (У) могут быть двух типов:
1. Различия за счет того, что некоторые состояния системы Х не нашли отражения в системе У. Геологическая карта всегда беднее подробностями, чем реальное геологическое пространство.
2. Различия за счет ошибок определения параметров геологического пространства и ошибок результатов наблюдений. В частности, ошибки могут возникать за счет помех технического и геологического происхождения.
В случае, когда интересующая нас система X (геологическое пространство) и наблюдаемая модель - образ Y (геологическая карта) различны, возникает вопрос: какое количество информации о системе X находится в полученной в результате исследований геологической карте (система Y).
При построении геологической карты, прежде всего, возникает задача элементаризации геологического пространства.
Рассмотрим какую полную информацию несет одна точка наблюдений в будущей геологической карте при созданной классификации горных пород.
Пусть в результате составленной модели геологической документации горных пород района выбранная модель пространства характеризуется m разновидностями горных
пород x1 ;x2;...xm, которые встречаются с априорными вероятностями p(x1);p(x2);...p(xm). Полученные данные запишем в таблицу априорных вероятностей состояния системы Х.
x | x1 | x2 | ... | xm |
p | p(x1) | p(x2) | ... | p(xm) |
Будем рассматривать x1;x2;...xm - как элементы геологического пространства, выделенные при классификации горных пород, которые через систему геолого-геофизических параметров отображаются символами (y1;y2;...ym) на геологической карте.
Количество информации, которую можно получить при наблюдениях на одной точке, равно энтропии системы классификации.
(1.11.1)
Если бы геолого-геофизические исследования проводились без помех, то количество информации, содержащиеся в системе Y относительно системы Х было бы равно энтропии самой системы Х. При наличии ошибок оно меньше.
(1.11.2)
Естественно рассматривать условную энтропию как потерю информации в одной точке наблюдения на геологической карте, связанную с наличием помех. Эту же информацию можно рассчитать и по формуле:
(1.11.3)
При проведении работ по геолого-геофизическому картированию в каждой точке наблюдения необходимо по комплексу параметров горную породу i, в соответствии с созданной легендой документации, отнести к тому или иному классу, при этом мы совершаем ошибки классификации. В результате будем получать реально наблюдаемую систему Y символов горных пород на геологической карте y1;y2;...ym. Вероятность того, что в данной точке определена порода xj при условии, что на самом деле в пространстве находится порода yi, является ошибкой первого рода при выделении породы j , и ошибкой второго рода aji, если выделялась порода i.
При создании классификации горных пород обычно вычисляются ошибки выделения одной породы на фоне другой, которые сводятся в таблицу парных ошибок классификации.
Таблица 1.11.1
i\j | ... | m | |||
... | |||||
... | |||||
... | |||||
... | ... | ... | ... | aij | ... |
m | ... |
Здесь по строкам записаны ошибки первого рода, а по столбцам ошибки второго рода.
В процессе геологического картирования каждая горная порода, независимо от других , может быть правильно определена на основе комплекса исследуемых параметров, либо перепутана.
Зная таблицу парных ошибок классификации, можно вычислить вероятности правильной диагностики каждой gi разновидности горной породы и соответствующие ошибки диагностики.
Вероятность того, что в данной точке геологической карты определена порода yj при условии, что на самом деле в природе там находится порода хi, т.е. вероятность того, что порода xi перепутана и ошибочно названа yj.
(1.11.4)
Вероятность правильного обнаружения породы xi ,т.е. условная вероятность определения породы yj при условии, что в природе в этой точке находится именно эта порода xi (p (yi/xi).
P(yi/xi) = (1.11.5)
Ошибки диагностики сведем в таблицу условных вероятностей.
Таблица 1.11.2
i\j | y1 | y2 | y3 | ... | ym | |
x1 | µ11 | µ12 | µ13 | ... | µ1m | |
x2 | µ21 | µ22 | µ23 | ... | µ2m | |
x3 | µ31 | µ32 | µ33 | ... | µ3m | |
... | ... | ... | ... | ... | ... | ... |
xm | µm1 | µm2 | µm3 | ... | µmm |
Зная ошибки диагностики и априорные вероятности встречи пород в геологическом пространстве p(x1); p(x2); ... p(xm), можно рассчитать таблицу вероятностей совместной системы (ху)
Pij=p(xy) = p(x)p(y/x) = p(y)p(x/y)
Таблица 1.11.3
i\j | y1 | y2 | y3 | ... | ym | p(x) |
x1 | p11 | p12 | p13 | ... | p1m | p(x1) |
x2 | p21 | p22 | p23 | .. | p2m | p(x2) |
x3 | p31 | p32 | p33 | ... | p3m | p(x3) |
... | ... | ... | ... | ... | ... | ... |
xm | pm1 | pm2 | pm3 | ... | pmm | p(xm) |
p(y) | p(y1) | p(y2) | p(y3) | ... | p(ym) |
Суммируя вероятности pij по столбцам, получим вероятности появления элементов системы y.
(1.11.6)
Это дает возможность рассчитать энтропию одной точки геологической карты в принятой системе классификации горных пород.
(1.11.7)
Информацию легенды геологической документации, т.е. количество информации наблюдаемой системы у (геологической карты) о системе х (геологическом пространстве), получаемое в одной точке наблюдения, будем вычислять по формуле (1.11.3)
Для нахождения полной условной энтропии E(y/x) определим сначала частные условные энтропии E(y/xi)- энтропию системы наблюдения при условии, что в точке наблюдения реального пространства находится порода xi.
(1.11.9)
Эту формулу следует применить для каждой строки таблицы условных вероятностей диагностики. (Таблица 1.11.2)
Полная условная энтропия равна взвешенной сумме частных энтропий
(1.11.10)
Рассмотрим приведенную теорию расчета количества информации на
примере.
Лабораторная работа №5.
Вычисление информативности легенды документации горных пород
Пусть имеет четыре разновидности горных пород x1,x2,x3,х4. Вероятности их появления в данном районе равны
р(х1)=0,2; p(x2)=0,4; p(x3)=0,3; р(х4)=0,1.
В этих породах изучались свойства Z и T. По результатам анализов построена интегральная и дифференциальная функции распределения.
Рис.1.11.1
На рис.1.11.1 приведены графики дифференциальных и интегральных функций распределений каждой горной породы по изучаемому признаку z.
Пользуясь стратегией Байеса и критерием максимального правдоподобия, определим ошибки первого и второго рода, которые свели в таблицу.
a11=g11=0,911 | a12=a12=0,045 | a13=a13=3,369×10-4 | a14=a14=0,074 |
a21=b21= 0,125 | a22=g22=0,897 | a23=a23= 0,136 | a24=a24= 0,081 |
a31=b31=2,462×10-4 | a32=b32= 0,897 | a33=g33=0,928 | a34=a34=0,01 |
a41=b41=0,329 | a42=b42=0,19 | a43=b43=0.028 | a44=g44=0,933 |
Энтропия модели геологического пространства, вычисляется по формуле ( 1.11.1).
(1.11.1)
Учитывая, что , получим:
дв.ед.
Рассчитаем теперь таблицу условных вероятностей диагностики, для чего воспользуемся формулой (1.11.4)
Полученные результаты сведем в таблицу условных вероятностей диагностики Р(Уj/Хi).
i\ j | y1 | y2 | y3 | y4 |
X1 | 0,968 | 0,022 | 1,263×10-4 | 9,312×10-3 |
X2 | 0,042 | 0,877 | 0,068 | 0,013 |
X3 | 7,035×10-5 | 0,049 | 0,949 | 1,46×10-3 |
X4 | 0,072 | 0,084 | 9,429×10-3 | 0,834 |
Для нахождения априорных вероятностей элементов геологической классификации, т.е. системы Y (геологических символов на карте) составим таблицу вероятностей совместной системы (ху). Элементы этой таблицы
определяются по формуле
Pij=р(ху) = р(х)р(у/х)
Результаты расчетов запишем в таблицу двумерного
закона распределения Р(ХУ):
i\j | y1 | y2 | y3 | y4 | p(x) |
X1 | 0,194 | 4,457×10-3 | 2,527×10-5 | 1,862×10-3 | 0,2 |
X2 | 0,017 | 0,351 | 0,027 | 5,384×10-3 | 0,4 |
X3 | 2,11×10-5 | 0,015 | 0,285 | 0,087 | 0,3 |
X4 | 0,218 | 8,43×10-3 | 9,429×10-4 | 0,083 | 0,1 |
p(y) | 0,218 | 0,378 | 0,313 | 0,091 | 1,0 |
Последняя строка таблицы получена путем суммирования соответствующих столбцов.
Энтропия системы геологической документации, равна
Пользуясь таблицей ошибок диагностики, рассчитаем частные условные энтропии по формуле (1.11.9)
Тогда полная условная энтропия на одну точку наблюдения, вычисленная как средневзвешенная, будет равна (1.11.10)
E(y/X) = 0,2×0,232+0,4×0,704+0,3×0,3+0,1×0,856 = 0,504
Количество информации, заключенное в легенде геологической документации, состоящей из четырех типов пород с приведенными распределениями на одну точку геологической карты, равна: Формула (1.11.3)
дв.ед.
Таким образом, составленная классификация горных пород района на основе изучения признака z позволит получить немного более половины возможной информации о геологическом пространстве в рамках принятой модели.
Рассмотренные приемы позволяют рассчитать и оценить среднее количество информации на одну точку наблюдения. Если на карте имеется n точек, в которых выполнены наблюдения, то общая средняя информативность такой карты равна:
J=n
Здесь предполагается статистическая независимость результатов наблюдений горных пород в соседних точках площади. В реальных условиях такая зависимость, конечно существует, поэтому при расчете информативности геологической карты необходимо ее учитывать.
Работы первого этапа геолого-геофизических исследований уже дают большую информацию о геологическом пространстве, однако, эти сведения еще не могут непосредственно использоваться для расчленения геологического пространства в связи с закрытостью части территории. Переход от петрографических характеристик к полям над геологическими телами неоднозначен из-за одновременного влияния на поле окружающих геологических тел и различного рода помех.