Линейные и нелинейные регрессии и их применение в геологии
Важной задачей в анализе является аналитическое описание выявленной зависимости. Этот процесс называется регрессионным анализом. Н-р: содержание платиноидов (плохо определяются) можно определить по содержанию Cu, Сo и S.
Проведение регрессионного анализа можно разделить на 3 этапа:
- выбор формы зависимости, т.е. типа уравнения регрессии;
- вычисление коэффициентов выбранного уравнения;
- оценка достоверности полученного уравнения.
Уравнение регрессии Х и У называется уравнение вида y = f(x) устанавливающее зависимость между значениями независимой переменной Х и условными средними значениями переменной У.
Линейная регрессия.
Если коэффициент корреляции значим и близок корреляционному отношению, то зависимость между Х и У выражается уравнением У=АХ+В и представляет собой линейную регрессию. Из аналитической геометрии известно, что в зависимости от знака коэффициента в уравнении может быть 4 вида уравнения регрессии (У=АХ+В; У=АХ-В; У= -АХ+В; У= -АХ-В). Одним из простых и наиболее распространенных способов вычисления коэффициентов уравнения регрессии является метод наименьших квадратов. Сущность метода в том, что наилучшим считается то положение линии регрессии при котором сумма квадратов отклонений эмпирических значений случайной величины от теоретических минимально. В этом случае значение коэффициентов А и В определяется из систем нормальных уравнений:
a ∑xini + b ∑ni = ∑yini
a ∑x2ini + b ∑xini = ∑yinixi
где ni – частота (число одинаковых значений xi)
yi – условные средние значения yi для каждой группы одинаковых значений xi).
Нелинейная регрессия.
Если коэффициент корреляции и корреляционное отношение существенно отличаются, то корреляция является нелинейной, то график отличается от прямой.
Рассмотрим 2 типа нелинейной корреляции: 1) полиномы 2-ой, 3-ей,и более степеней; 2) гиперболические кривые y=a/x+b и y=1/(ax+b). При вычислении коэффициента уравнения регрессии методом наименьших квадратов, количество нормальных уравнений равно количеству неизвестных.
Для полинома третьей степени система нормальных уравнений имеет следующий вид:
a ∑x2ini + b ∑xini + с ∑ni = ∑yini
a ∑x3ini + b ∑x2ini + с ∑xini = ∑yinixi
a ∑x4ini + b ∑x3ini + с ∑x2ini = ∑yinix2i
Уравнения гиперболического вида легко привести к линейному.
36. Задачи распознавания образовв геологии.
Многие задачи прогноза решаются с помощью сопоставления комплекса признаков изучаемого объекта с комплексом тех же признаков эталона
Совокупность методов прогноза основана на принципе аналогии получило название метода распознавания образов. Для распознавания надо предварительно изучить признаки эталонных объектов. Н-р: характеристики локальных поднятий с доказанной нефтеносностью и характеристики изученных структур.
При распознавании образов среди объектов подлежащих распознаванию не должно быть таких, на которых обучение не осуществлялось. Н-р: нельзя вести распознавание пород на изверженные и осадочные, если в числе распознаваемых есть метаморфические породы, т.к. последние будут относится то к осадочным, то к изверженным.
В результате изучения эталонных объектов каждый из них характеризуется набором измеренных значений геологических, геофизических и геохимических признаков, выраженных числами. Каждая совокупность таких признаков интерпретируется как точка в одномерном или двумерном пространстве (в случае наличия двух признаков) Область многомерного пространства, в которой сосредоточены точки эталонных объектов первого класса называется собственной.
Если объекты тождественны друг другу, их собственные области совпадают. Собственные области объектов, резко различающиеся в пространстве не пересекаются.
Процедура методов распознавания образов состоит из следующих последовательных операций:
(1) задание математических моделей дач двух конкурирующих по теологической природе состояний объекта. Каждое из состояний должно быть охарактеризовано одним набором признаков.
(2) Выбор эталонных объектов на площади исследования при этом необходимо учитывать, что наиболее эффективные результаты могут быть получены при равномерном чередовании эталонных и распознаваемых объектов.
(3) Оценка статистических характеристик признаков. Геофизические и геохимические признаки оцениваются количественно. Определяют дипресии. строят гистограммы и т.д.
(4) Производится выбор алгоритма распознавания, который зависит от характера исходных данных.
(5) Оценка эффективности алгоритма распознавания.
Классификация методов распознавания образов:
Подразделяются на:
- методы с обучением на эталонах;
- методы самообучения.
Методы с обучением на эталонах построены на основе метода математической логики. В алгоритме предусмотрено обучение на эталонных объектах Этап изучения сводится к перебору всех возможных комбинации признаков, которые встречаются среди эталонов 1 класса и ни разу не встретилась среди эталонов других классов, то эта комбинация является эталоном 1 класса.
Базируются на основе регрессионного анализа. Эти задачи широко используются при решении задач промысловой геофизики. Суть методов зависит от построения зависимости между некоторым параметром и геолого-геофизическими признаками
Основана на применении способов проверки статистических гипотез на основе различных критериев, в частности на основе критерия максимального правдоподобия.
Методы самообучения делятся на три группы: 1) Эвристические методы, которые используют различные приемы суммирования признаков: 2) корреляционные методы базируются на основе корреляционного и факторного анализа. 3) статистические методы.