Представление знаний о структуре системы в форме условных вероятностей
Числовая модель производственной системы в данном случае представляет собой систему количественных зависимостей выходных переменных от входных.
В данном случае в каждой подсистеме входные переменные предполагаются независимыми, сами переменные — дискретными, а связи между выходными и входными переменными — вероятностными. Следовательно, связи могут быть количественно охарактеризованы математическим ожиданием вероятностью значений входных переменных при заданном значении выходной переменной.
Такая количественная характеристика связей может быть построена на основе наблюдений моделируемых систем даже при полном отсутствии какого-либо априорного знания о характере связей. Однако её достоверность зависит от количества имеющихся наблюдений моделируемых систем и от точности выполнения условий применимости формализма условных вероятностей. Часто наличие априорного знания позволяет получить значительно более точные и достоверные количественные характеристики связей. В этом случае создание числовой модели требует более мощных формализмов для представления знаний о связях.
На основе наблюдений за поведением изучаемой системы нельзя сделать полностью достоверное заключение о вероятностях её состояний. Например, если 18 раз бросить игральную кость, то из того, что единица выпала шесть раз, не следует, что вероятность её выпадания равна
Наблюдаемая частота некоторого значения переменной может быть обусловлена различной действительной вероятностью этого значения. Однако при разных действительных вероятностях шансы на то, чтобы наблюдать именно такую частоту, различны.
Располагая только ограниченным количеством наблюдений изучаемой дискретной переменной, исследователь не имеет никакой более обоснованной оценки вероятности её значений, нежели средняя взвешенная вероятностей данного значения, которые могли вызвать его реализацию n раз из N наблюдений. Эта величина называется наиболее правдоподобной оценкой вероятности.
Можно доказать, что наиболее правдоподобная оценка вероятностей, которые могли вызвать наблюдение некоторого значения дискретной переменной n раз из N наблюдений, равна где k — число возможных значений. Чем больше число наблюдений, тем меньше эта величина отличается от
Для полной характеристики стохастических связей дискретной выходной переменной от дискретных взаимно независимых входных переменных достаточно определить:
¨ оценки вероятности каждого значения всех переменных;
¨ оценки условной вероятности каждого значения всех входных переменных при заданном значении выходной переменной.
При отсутствии какой-либо другой информации математические ожидания условной вероятности рассчитываются на основе комбинационных таблиц (таблиц сопряжённости), включающих выходную и одну из входных переменных. Столбцы такой таблицы соответствуют дискретным значениям входной, а строки — выходной переменной. В клетках таблицы помещается число наблюдений, в которых наблюдались соответствующих значения обеих переменных.
При этом:
¨ вероятность выходной переменной оценивается по вышеприведённой формуле (в при выполнении заданий данного практикума этот способ применяется редко: см. ниже!);
¨ условные вероятности значений входной переменной при известных значениях выходной переменной (именно эти вероятности потребуются нам для модели) — по формуле
где nij — число наблюдений, при которых выходная переменная имела значение i, а входная — j; nj — общее число наблюдений j‑го значения входной переменной; Q — число квантилей выходной переменной. При правильном вычислении сумма всех условных вероятностей, имеющих одинаковый индекс j, должна быть равна единице.
Для вероятностей значений числовых переменных, приведённых к дискретной форме путём разбиения интервала вариации на Q квантилей, возможна лучшая оценка, чем вышеприведённая, поскольку, кроме данных, можно использовать знание закона распределения случайной величины, основанное на теоретическом представлении о причинах её вариации.
В этом случае вместо оценки вероятности по вышеприведённой формуле используется оценка, равная 1/Q. Эта оценка надёжнее математического ожидания вероятности: ведь при выдвижении гипотезы о распределении вероятности значений данной переменной мы опирались не только на результаты наблюдения, но и на другие знания: экономическое содержание данной переменной, диапазон вариации, аналогию с другими экономическими переменными и др.
Библиографический список
Гатаулин А.М. Система прикладных статистико-математических методов обработки экспериментальных данных в сельском хозяйстве. М., 1992.
Искусственный интеллект: Справочник: в 3 книгах / Под ред. Э.В. Попова. М., 1990.
Красс М.С., Чупрынов Б.П. Математические методы и модели для магистрантов экономики: Учеб. пособие. СПБ.: Питер, 2006.
Нейлор К. Экспертные системы: принципы работы и примеры. М., 1987.
Орлов А.И. Теория принятия решений: Учеб. пособие. М.: Изд-во «Март», 2004.
Светлов Н.М. Обоснование весовых коэффициентов исходов в стохастических моделях сельскохозяйственного производства // Доклады ТСХА. М., 1995, вып. 266, с. 190-195.
Практическая часть
Аудиторные занятия: 2 часа.
Самостоятельная работа: 1 час.
Цель работы
Приобрести навыки количественного описания зависимостей между дискретными переменными средствами формализма условных вероятностей.
Научиться обосновывать взаимную независимость входных переменных системы и исследовать существенность их влияния на выходную.
Закрепить теоретические знания по вопросам «формы представления систем», «свойства систем», «метод системного анализа» и «связь теории систем с другими науками».
Приборы и материалы
Компьютерный класс с доступом к сети Internet; программное обеспечение, реализующее вычислительные процедуры проверки существенности и независимости переменных (рекомендуется MathCad; в его отстутствие задача может быть решена средствами Excel); информационный сайт Продовольственной и сельскохозяйственной организации ООН (FAO): http://faostat.fao.org/DesktopDefault.aspx?PageID=567&lang=ru
Задание
1. Проверить соответствие подсистемы первого уровня требованиям существенности и независимости входных переменных.
2. При необходимости пересмотреть набор входных переменных. Числовые переменные, вновь включённые в модель, привести к дискретной форме. Для каждой переменной, включённой в модель, рассчитать таблицы условных вероятностей.
3. Определить математические ожидания условной вероятности возможных значений каждой входной переменной при заданном значении выходной и построить таблицы условных вероятностей.
Замечание. Если для проверки существенности и независимости некоторых входных переменных рабочая группа решила применять метод относительной информативности, то для данных переменных последовательность выполнения задания меняется: сначала выполняется п.3, затем пп.1 и 2.
Методические указания по выполнению задания
При решении задач практического уровня сложности по мере возможности исследуются многофакторные зависимости. Для достижения целей изучения данной темы с учётом естественных ограничений по времени и сложности выполнения задания достаточно исследовать только парные зависимости между переменными.
Для обеспечения достоверности анализа рекомендуется использовать не менее двух методов оценки тесноты связи для каждой пары переменных.
Если преподавателем не указано иначе, используйте следующие критерии исключения входной переменной из модели:
отсутствие статистически достоверной связи с выходной переменной при α = 0,1 по подходящему статистическому критерию независимости;
снятие более 15% энтропии какой-либо выходной переменной, не исключаемой из модели, либо отклонение гипотезы об их независимости по подходящему статистическому критерию при α = 0,05.
Исключённые переменные заменяют новыми переменными из ранжированного ряда, составленного при выполнении задания к теме 1, отдавая предпочтение переменным с наиболее высоким рангом. Для новых переменных повторяют процедуру проверки их существенности и независимости.
Если по результатам проверки существенности и независимости переменных не удаётся выбрать достаточное количество переменных для включения в модель, а также в случае возникновения сомнений относительно того, следует ли вносить изменения в модель подсистемы первого уровня, необходимо обратиться к преподавателю.
Требования к отчёту
Отчёт о выполнении практического задания состоит из коллективной и индивидуальных частей. Объём коллективной части — не более 2 страниц, индивидуальной — до 8 страниц (не считая приложений).
В коллективной части указываются переменные подсистемы первого уровня, исключённые из модели, и переменные, предложенные для включения в модель вместо исключённых. Изменения в модели должны быть обоснованы.
В каждой индивидуальной части должны быть приведены:
¨ комбинационные таблицы, построенные составителем;
¨ математические ожидания вероятности, рассчитанные составителем;
¨ использованные составителем методы анализа связей для каждой пары показателей, исследованной составителем отчёта;
¨ количественная оценка тесноты связей;
¨ заключение о тесноте связей;
¨ предложения по совершенствованию модели;
¨ результаты проверки гипотез о распределении вероятностей, границы квантилей и таблицы условных вероятностей для исследованных составителем отчёта переменных, введённых в модель взамен не отвечающих условиям существенности и независимости;
¨ список литературы, использованной при подготовке к практическому занятию.