Анализ адекватности уравнения регрессии
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Анализ качестваэмпирического уравнения парной и множественной линейной регрессииначинаютс построения эмпирического уравнения регрессии, которое является начальным этапом эконометрического анализа. Первое же, построенное по выборке уравнение регрессии, очень редко является удовлетворительным по тем или иным характеристикам. Поэтому следующей важнейшей оценкой является проверка качества уравнения регрессии. В эконометрике принята устоявшаяся схема такой проверки, которая проводится по следующим направлениям:
· проверка статистической значимости коэффициентовуравнения регрессии
· проверка общего качества уравнения регрессии
· проверка свойств данных, выполнимость которых предполагалась при оценивании уравнения (проверка выполнимости предпосылок МНК)
Прежде, чем проводить анализ качества уравнения регрессии, необходимо определить дисперсии и стандартные ошибки коэффициентов, а также интервальные оценки коэффициентов. Корреляционный и регрессионный анализ, как правило, проводится для ограниченной по объёму совокупности.
Поэтому параметры уравнения регрессии (показатели регрессии и корреляции), коэффициент корреляции и коэффициент детерминации могут быть искажены действием случайных факторов. Чтобы проверить, на сколько эти показатели характерны для всей генеральной совокупности и не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
При анализе адекватности уравнения регрессии (модели) исследуемому процессу, возможны следующие варианты:
1. Построенная модель на основе F-критерия Фишера в целом адекватна и все коэффициенты регрессиизначимы. Такая модель может быть использована для принятия решений и осуществления прогнозов.
2. Модель по F-критерию Фишера адекватна, но часть коэффициентов не значима. Модель пригодна для принятия некоторых решений, но не для прогнозов.
3. Модель по F-критерию адекватна, но все коэффициенты регрессии не значимы. Модель полностью считается неадекватной. На ее основе не принимаются решения и не осуществляются прогнозы.
Проверить значимость(качество) уравнения регрессии–значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации. Проверка адекватностиуравнения регрессии (модели) осуществляется с помощьюсредней ошибки аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение). http://helpstat.ru/2012/01/proverka-adekvsionnoj-modeli/
Значимость уравнения регрессии еще не означает, что выбранная модель достаточно правильно (адекватно) описывает исследуемое экономическое явление. Применение неадекватной модели для целей анализа и прогнозирования может приводить к неоправданно большим ошибкам. Если модель адекватна, то остатки регрессии представляют собой независимые нормально распределенные случайные величины с одинаковой дисперсией. В случае неадекватности модели остатки содержат также и систематическую составляющую, а закон их распределения отличается от нормального. Проверка адекватности регрессионной модели рассматривается в § 3.8.
Обычно в начале исследуется линейная модель, для которой после оценки параметров и проверки значимости уравнения регрессии определяется коэффициент детерминации и оценивается точность.
Коэффициент детерминации R2 рассчитывается по формуле
21. Что такое знания. Отличие БД от БЗ.
Данные– это информация, полученная в результате наблюдений или измерений отдельных свойств (атрибутов), характеризующих объекты, процессы и явления предметной области.
Знания (с точки зрения представления знаний в интеллектуальных системах) – это связи и закономерности предметной области (принципы, модели, законы), полученные в результате практической деятельности и профессионального опыта, позволяющего специалистам ставить и решать задачи в данной области.
Знания от данных отличаются рядом свойств:
- внутренняя интерпретируемость;
- структурированность;
- связность;
- семантическая метрика;
- активность.
Внутренняя интерпретируемость.Данные, хранящиеся в памяти или на внешних носителях, лишены имен, таким образом, отсутствует возможность их однозначной идентификации системой.
Данные может идентифицировать лишь программа, извлекающая их по определенному алгоритму. При переходе к знаниям в память вводится дополнительная информация (атрибуты: фамилия, год рождения, специальность, стаж). Атрибуты могут играть роль имен. По ним можно осуществлять поиск нужной информации.
Структурированность.Информационные единицы должны обладать гибкой структурой. Иначе говоря, должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа ≪часть – целое≫, ≪род – вид≫ или ≪элемент – класс≫.
Связность.Между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информационные единицы могут быть связаны отношением ≪одновременно≫, две информационные единицы – отношением ≪причина – следствие≫ или ≪быть рядом≫.
Семантическая метрика. На множестве информационных единиц в некоторых случаях яолезно задавать отношение, характеризующее их ситуационную близость, то есть силу
ассоциативной связи. Его можно было бы назвать отношением релевантности для информационных единиц. Оно дает возможность выделять в информационной базе некоторые типовые ситуации (например, ≪покупка≫, ≪регулирование движения на перекрестке≫).
Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным.
Активность.Все вычислительные процессы инициируются командами, а данные используются этими командами лишь в случае необходимости. Иначе говоря, данные пассивны, а команды активны.
Знания позволяют адаптироваться и действовать в реальной действительности. Существует огромное множество различных знаний, начиная от рецепта приготовления омлета до квантовой физики.
База знаний (БЗ) – основа любой интеллектуальной системы, где знания описаны на некотором языке представления знаний, приближенном к естественному. Сегодня знания приобрели чисто декларативную форму, то есть знаниями считаются предложения,
записанные на языках представления знаний, приближенных к естественному языку и понятных неспециалистам.
22. Модели представления знаний. Пример БЗ.
23. Понятие фрейма. Структура и свойства фрейма.
24. Определение семантической сети. Достоинства и недостатки. Пример.
25. Логические модели представления знаний. Предикаты. Пример.
В настоящее время разработано множество моделей представления знаний. Имея обобщенное название, они различаются по идеям, лежащим в их основе, с точки зрения математической обоснованности. Типы моделей:
Первый подход, называемый эмпирическим, основан на изучении принципов организации человеческой памяти и моделировании механизмов решения задач человеком. На основе этого подхода в настоящее время разработаны и получили наибольшую известность следующие модели:
· продукционные модели – модели, основанные на правилах, позволяют представить знание в виде предложений типа: «ЕСЛИ условие, ТО действие». Недостаток продукционных моделей –при накоплении достаточно большого числа (порядка нескольких сотен) продукций они начинают противоречить друг другу. Имеется большое число программных средств, реализующих продукционных подход: OPS5, EXSYS RuleBook, ЭКСПЕРТ, ЭКО, G2 и др.;
Пример продукционной модели:
ЕСЛИ
«двигатель не заводится»
И
«стартёр двигателя не работает»
ТО
«неполадки в системе электропитания стартёра»
· сетевые модели (или семантические сети) – подразумевается граф, отображающий смысл целостного образа. Узлы графа соответствуют понятиям и объектам, а дуги – отношениям между объектами.
Формально сеть можно задать в следующем виде:
H = < I, C, G>
I – множество информационных единиц;
C – множество типов связей между информационными единицами;
G – отображение, задающее конкретные отношения из имеющихся типов C между элементами I.
Семантическая сеть как модель наиболее часто используется для представления декларативных знаний. С помощью этой модели реализуются такие свойства системы знаний, как интерпретируемость и связность, в том числе по отношениям IS-A и PART-OF. За счет этих свойств семантическая сеть позволяет снизить объем хранимых данных, обеспечивает вывод умозаключений по ассоциативным связям.
Одной из первых известных моделей, основанных на семантической сети, является TLC-модель (Teachaple Languge Compre-hender – доступный механизм понимания языка), разработанная Куиллианом в 1968 году. Модель использовалась для представления семантических отношений между концептами (словами) с целью описания структуры долговременной памяти человека в психологии.
Как правило, различают экстенсиональные и интенсиональные семантические сети. Экстенсиональная семантическая сеть описывает конкретные отношения данной ситуации. Интенсиональная – имена классов объектов, а не индивидуальные имена объектов. Связи в интенсиональной сети отражают те отношения, которые всегда присущи объектам данного класса.
Проблема поиска решения в БЗ типа семантической сети сводится к задаче поиска фрагмента сети, соответствующего некоторой подсети, соответствующей поставленному вопросу. В семантических сетях есть возможность представлять знания более естественным и структурированным образом, чем в других формализмах. Основным преимущество то, что она более других соответствует современных представлениям об организации долговременной памяти человека. Недостаток этой модели – сложность организации процедуры поиска вывода на семантической сети.
Для реализации семантических сетей существуют специальные сетевые языки (NET, SIMER+MIR и др.). Известны системы, использующие семантические сети в качестве языка представления знаний— PROSPECTOR, CASNET, TORUS;
Примеры семантической сети:
· фреймовая модель – основывается на понятии как фрейм (англ. frame – рамка, каркас). Фрейм – структура данных для представления некоторого концептуального объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах. Слоты могут быть терминальными либо являться сами фреймами нижнего уровня, т.о. образуя целую иерархическую сеть.
Каждый фрейм, состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем:
> имя фрейма (имя фрейма) – это идентификатор, присваиваемый фрейму. Фрейм должен иметь имя, единственное в данной фреймовой модели (уникальное имя);
> имя слота (имя слота) – это идентификатор, присваиваемый слоту. Слот должен иметь уникальное имя во фрейме, к которому он принадлежит. Обычно имя слота не несет никакой смысловой нагрузки и является лишь идентификатором данного слота, но в некоторых случаях оно может иметь специфический смысл;
> указатель наследования – только для фреймовых моделей иерархического типа; они показывают, какую информацию об атрибутах слотов во фрейме верхнего уровня наследуют слоты с такими же именами во фрейме нижнего уровня;
> указатель атрибутов – указатель типа данных слота. К таким типам относятся: (указатель), (целое), (вещественное), (булево), (присоединенная процедура), (текст), (список), (таблица), (выражение) и другие;
> значение слота – значение, соответствующее типу данных слота и удовлетворяющее условиям наследования;
> демон – процедура, автоматически запускаемая при выполнении некоторого условия. Демоны запускаются при обращении к конкретному слоту фреймовой модели. Например, демон запускается, если в момент обращения к слоту его значение не было установлено, запускается при подстановке в слот значения, запускается при стирании значения слота.
Фреймы образуют иерархию. Иерархия во фреймовых моделях порождает единую многоуровневую структуру, описывающую либо объект, если слоты описывают только свойства объекта, либо ситуацию или процесс, если отдельные слоты являются именами процедур, присоединенных к фрейму и вызываемых при его актуализации.
Формально фрейм – это тип данных вида:
Ø – имя объекта;
Ø – множество слотов, содержащих факты, определяющие декларативную семантику фрейма;
Ø – множество слотов, обеспечивающих связи с другими фреймами (каузальные, семантические и т. д.);
Ø – множество слотов, обеспечивающих преобразования, определяющие процедурную семантику фрейма.
Фреймы подразделяются на:
> фрейм-экземпляр – конкретная реализация фрейма, описывающая текущее состояние в предметной области;
> фрейм-образец – шаблон для описания объектов или допустимых ситуаций предметной области;
> фрейм-класс – фрейм верхнего уровня для представления совокупности фреймов образцов.
Состав фреймов и слотов в каждой конкретной фреймовой модели может быть разный, однако в рамках одной системы целесообразно единое представление для устранения лишнего усложнения.
В целом фреймовая модель допускает представление всех свойств декларативных и процедурных знаний. Глубина вложенности слотов во фрейме (число уровней) зависит от предметной области и языка, реализующего модель.
Осн. преимущество фреймов– то, что они отражают концептуальную основу организации памяти человека, а также ее гибкость и наглядность. Еще одно достоинство фреймов – то, что значение любого слота может быть вычислено с помощью соответствующих процедур или найдено эвристическими методами. Недостатки фреймовых систем – относительно высокая сложность, это снижает скорость работы механизма вывода и увеличения трудоемкости внесения изменений в родовую иерархию. Поэтому при разработке фреймовых систем уделяют наглядным способам отображения и эффективным средствам редактирования фреймовых структур. Специальные языки представления знаний в сетях фреймов FRL (Frame Representation Language), KRL (Knowledge Representation Language), фреймовая оболочка Kappa, PILOT/2 и другие программные средства позволяют эффективно строить промышленные системы.
Пример фреймовой модели:
· Ленемы представляют собой смешанный тип модели, являющийся как бы «развитием» других моделей (фреймы, семантические сети и т.д.). Ленема предназначена для структурного комплексного описания понятий предметной области. По изобразительным возможностям ленемы более совершенны, чем такие традиционные модели представления знаний, как семантическая сеть, фрейм, система продукций. Однако, для некоторых понятий модель представления знаний на основе ленем может быть неудобной и даже неприемлемой. Например, это такие понятия, в описании которых очень большую роль играет внутренняя динамика. Модель, созданная на базе ленем, позволяет объединить на пользовательском уровне три существующие в настоящее время парадигмы представления знаний:
1) логическую (продукционная и логическая модели);
2) структурную (семантические сети и фреймы);
3) процедурную.
Для некоторых ситуаций это очень удобно, так как при реализации сложных моделей, включающих знания различных типов, возникает необходимость совмещения в одном языке представления знаний различных концепций.
· Условно в группу эмпирического подхода можно включить нейронные сети и генетические алгоритмы, относящиеся к бионическому (основано на предположении о том, что если в искусственной системе воспроизвести структуры и процессы человеческого мозга, то и результаты решения задач такой системой будут подобны результатам, получаемым человеком) направлению искусственного интеллекта. Особенность этих моделей – широкое использование эвристик, что в каждом случае требует доказательства правильности получаемых решений.
Второй подход можно определить как теоретически обоснованный, гарантирующий правильность решений. Он в основном представлен моделями, основанными на формальной логике (исчисление высказываний, исчисление предикатов), формальных грамматиках, комбинаторными моделями, в частности моделями конечных проективных геометрий, теории графов, тензорными и алгебраическими моделями. В рамках этого подхода до настоящего времени удавалось решать только сравнительно простые задачи из узкой предметной области.
Логическая модель. Вся информация в логической модели рассматривается как совокупность фактов и связывающих их утверждений, которые представляются как формулы в некоторой логике. Знания при этом представляются набором подобных утверждений, а построение выводов и получение новых знаний сводится к реализации процедуры логического вывода. Этот процесс может быть строго формализован, так как в его основе лежит классический аппарат математической логики. Логические модели знаний задается картежем:
> – счетное множество базовых символов (алфавит);
> – множество, называемое формулами;
> – выделенное подмножество априори истинных формул (аксиом);
> – конечное множество отношений между формулами, называемое правилами вывода.
Основные достоинства логических моделей знаний:
- в качестве «фундамента» здесь используется классический аппарат математической логики, методы которой достаточно хорошо изучены и формально обоснованы;
- существуют достаточно эффективные процедуры вывода, в том числе реализованные в языке логического программирования «Пролог»;
- в базах знаний можно хранить лишь множество аксиом, а все остальные знания получать из них по правилам вывода.
В логических моделях знаний слова, описывающие сущности предметной области, называются термами (константы, переменные, функции), а слова, описывающие отношения сущностей – предикатами.
Для представления математического знания в математической логике пользуются логическими формализмами — исчислением высказываний и исчислением предикатов. Эти формализмы имеют ясную формальную семантику и для них разработаны механизмы вывода. Поэтому исчисление предикатов было первым логическим языком, который применяли для формального описания предметных областей, связанных с решением прикладных задач.
Логические модели представления знаний реализуются средствами логики предикатов. Предикат – логическая -арная пропозициональная функция, определенная для предметной области и принимающая значения либо истинности, либо ложности. Пропозициональной называется функция, которая ставит в соответствие объектам из области определения одно из истинностных значений («истина», «ложь»). Предикат принимает значения «истина» или «ложь» в зависимости от значений входящих в него термов.
Способ описания предметной области, используемый в логических моделях знаний, приводит к потере некоторых нюансов, свойственных естественному восприятию человека, и поэтому снижает описательную возможность таких моделей.
Сложности возникают при описании «многосортных» миров, когда объекты не являются однородными. Так, высказывания:
«2 + 2 = 4»
«Москва – столица России»
имеют одно и то же значение «истина», но разный смысл. С целью преодоления сложностей и расширения описательных возможностей логических моделей знаний разрабатываются псевдофизические логики, логики, оперирующие с нечеткостями, эмпирическими кванторами, обеспечивающие индуктивные (от частного к общему), дедуктивные (от общего к частному) и традуктивные (на одном уровне общности) выводы. Такие расширенные модели, объединяющие возможности логического и лингвистического подходов, принято называть логико-лингвистическими моделями предметной области.
Пример логической модели:
ДАТЬ (МИХАИЛ, ВЛАДИМИРУ, КНИГУ);
($x) (ЭЛЕМЕНТ (x, СОБЫТИЕ-ДАТЬ) ? ИСТОЧНИК (x, МИХАИЛ) ? АДРЕСАТ ? (x, ВЛАДИМИР) ОБЪЕКТ(x, КНИГА).
Здесь описаны два способа записи одного факта: «Михаил дал книгу Владимиру».
Логический вывод осуществляется с помощью силлогизма (если из A следует B, а из B следует C, то из A следует C).
Комбинаторные модели основаны на рассмотрении дискретных объектов, конечных множеств и заданном на них отношении порядка. В рамках комбинаторики также рассматриваются все возможные изменения, перестановки и сочетания, в рамках заданных множеств. Под комбинаторикой понимают более обширный раздел дискретной математики, включающий, в частности, теорию графов.
Комбинаторные модели используются в задачах топологии (например, поиск пути), задачах прогнозирования поведения автоматов, при изучении деревьев решений, частично упорядоченных множеств.
Основная проблема указана еще в определении этой модели: она оперирует только дискретными объектами и конечными множествами, связанными однородными отношениями.
Алгебраическая модель подразумевает представление знаний в виде некоторых алгебраических примитивов, над которыми определено множество действий (некоторые из которых можно задать таблично). Для набора знаний представленного в таком виде действуют правила алгебраических множеств, такие как формализация, определение подсистем и отношений эквивалентности. Также возможно построение цепей множеств (множества, для которых определен порядок отношения «быть подсистемой»).
Изначально предполагалось использовать подобную модель в качестве формализованной системы построения аналогий (за счет определения эквивалентности). Однако, на эту формальную модель очень сложно отобразить весь набор знаний, поэтому от этой идеи отказались.