Тема 4. Спецификация второго уровня аграрной производственной системы
Теоретическая часть
При использовании формализма условных вероятностей модели второго уровня требуются в том случае, если данные о значении сооветствующей входной переменной первого уровня отсутствуют. Хотя данный формализм позволяет получить оценки распределения вероятностей выходной переменной, наилучшим образом согласующиеся с поступившей информацией о значениях входных переменных даже в тех случаях, когда значения некоторых переменных не поступили вовсе или известны лишь с некоторой вероятностью, необходимо принимать меры по получению информации о возможно большем количестве входных переменных, так как чем больше данных поступило, тем меньше неопределённость результата, обусловленная неопределённостью значений некоторых переменных.
Если наблюдать некоторые входные переменные первого уровня всё же не удаётся, имеется возможность оценить распределение вероятностей их значений, опираясь на наблюдения тех переменных, от которых они зависят, то есть входных переменных моделей второго уровня.
Процедура спецификации второго уровня аграрной производственной системы и используемые при её реализации методики отличаются от рассмотренных в предыдущих трёх темах лишь в деталях. В целом определение набора входных переменных второго уровня требует выполнения всё тех же этапов:
¨ предварительного отбора входных переменных второго уровня при посредстве построенного с помощью экспертных процедур ранжированного ряда переменных, влияющих на выходную переменную второго уровня (одновременно являющуюся входной переменной первого уровня);
¨ их дискретизации (если они непрерывные);
¨ проверки их существенности и независимости и, при необходимости, корректировки модели;
¨ формирования таблиц условных вероятностей.
Отличия состоят в том, что на практике спецификация систем второго уровня обыкновенно сталкивается с ещё большим недостатком эмпирических данных, чем это наблюдается при работе с первым уровнем. Чаще остаются неизвестными формы распределений вероятностей переменных второго уровня, и потому дискретизация чаще выполняется непосредственно по эмпирическим данным, а не по теоретическому распределению. Чаще используются переменные, значения которых для каждого наблюдения получены не путём статистического наблюдения или постановки опыта, а посредством экспертных оценок.
При практическом использовании формализма условных вероятностей для разработки интеллектуальных информационных систем часто используется подход, отличающийся от рассматриваемого в данном практикуме. Именно, входные переменные второго и нижележащих уровней выбираются по такой же или схожей процедуре, но таблицы условных вероятностей строятся для вероятностей значений входной переменной второго (или более низкого) уровня при условии заданного значения выходной переменной первого уровня. При этом, во избежание смещённой оценки выходной переменной из-за зависимости факторов, одновременно используемых в расчётах (ведь входные переменные первого уровня заведомо зависят от соответствующих входных переменных второго уровня, что обеспечивается процедурой их отбора), данные о значениях факторов низших уровней обрабатываются только при отсутствии данных о соответствующей переменной более высокого уровня.
Такой подход упрощает алгоритм работы формализма и сокращает объём вычислений, но у него есть существенный недостаток: не всегда существуют наблюдения, в которых зафиксированы значения выходной переменной первого уровня вместе со значениями входных переменных низших уровней. Многоуровневая модель даёт возможность использовать независимые источники данных для построения таблиц условных вероятностей для разных подсистем. В случае, если все таблицы условных вероятностей связывают входные переменные разных уровней с выходной переменной первого уровня, требуется, чтобы значения всех этих переменных фиксировались в одних и тех же наблюдениях.
Теоретически входная переменная некоторой подсистемы второго уровня не может одновременно быть входной переменной другой подсистемы второго уровня: если бы такое имело место, две выходных переменных второго уровня оказались бы зависимыми. То же касается и более низких уровней. На практике смещение оценки выходной переменной первого уровня, обусловленное подобными зависимостями, может оказаться неизбежным, так как полную независимость факторов обеспечить удаётся далеко не всегда. При недостатке данных с подобными явлениями приходится мириться, а в дальнейшем, по мере накопления опытных данных, возникающие в связи с этим проблемы неадекватности модели решаются либо путём замены парных таблиц условных вероятностей таблицами большей размерности (трёх- или четырёхмерными), либо обращением к более мощным формализмам. Поэтому на практике включение одной и той же входной переменной в две подсистемы второго уровня в исключительных случаях допускается. При этом связь её с соответствующими выходными переменными должна быть существенной, но слабой.
Библиографический список
Теория систем: Учеб. пособие / В.Н. Волкова, А.А. Денисов. М.: Высшая школа, 2006.
Франс Дж., Торнли Дж. Математические модели в сельском хозяйстве / Пер. с англ. М.: Агропромиздат, 1987.
Практическая часть
Аудиторные занятия: 4 часа.
Самостоятельная работа: 4 часа.
Цель работы
Приобрести навыки спецификации подсистем производственной системы.
Научиться решать задачи системного анализа в условиях ограниченной информационной базы, пользуясь экспертными оценками, картографическим материалом, справочными изданиями и другими источниками информации.
Закрепить теоретические знания по теме «структура систем».
Приборы и материалы
Компьютерный класс с доступом к сети Internet; программное обеспечение, автоматизирующее рутинные операции по ранжированию факторов, реализующее аналитическую группировку, проверку статистических гипотез о характере распределения случайной величины, численные методы решения интегральных уравнений, вычислительных процедур проверки существенности и независимости переменных (рекомендуются Excel и MathCad; в отстутствие MathCad задача может быть решена средствами Excel и VBA); информационный сайт Продовольственной и сельскохозяйственной организации ООН (FAO): http://faostat.fao.org/DesktopDefault.aspx?PageID=567&lang=ru
Задание
1. Специфицировать входные переменные всех подсистем второго уровня исследуемой производственной системы.
2. Построить таблицы условных вероятностей для подсистем второго уровня.
3. Проверить соответствие переменных подсистем второго уровня требованиям независимости и существенности; при необходимости пересмотреть спецификацию подсистем.
Методические указания по выполнению задания
Для достижения целей практического задания общее число входных переменных подсистем второго уровня должно составить 7…10, из них не менее 5 числовых. Существенность и независимость переменных проверяются только одним методом, по возможности наименее трудоёмким. С разрешения преподавателя для некоторых переменных эту проверку можно опустить.
Учитывая ограниченность информационной базы, доступной для выполнения практического задания, замену входных переменных, для которых не выполняются требования существенности и независимости, производить не обязательно (в практических приложениях это делать необходимо!).
В процессе решения задачи предполагается использование электронных таблиц, алгоритмов и программ, разработанных при выполнении предыдущих заданий.
Требования к отчёту
Отчёт о выполнении практического задания включает коллективную и индивидуальные части. Объём коллективного раздела не должен превышать 1 страницы, индивидуального — 6 страниц (не считая приложений).
Коллективный раздел должен содержать схему модели производственной системы, отражающую все её переменные и связи между ними.
В индивидуальных разделах должны присутствовать:
¨ сведения о виде распределения и границах квантилей, а также таблицы условных вероятностей для каждой переменной, исследованной составителем отчёта;
¨ краткое описание методов, не описанных в методических указаниях, но использованных при выполнении практического задания;
¨ список использованной литературы.