Модели кластерного анализа и теории распознавания образов
При моделировании и прогнозировании электропотребления все шире используются методы, характерные для теории искусственного интеллекта, в частности, методы кластерного анализа и теории распознавания образов [1, 3, 14, 23, 34, 68].
Суть их применения заключается в следующем [3, 23]. Состояние электропотребления объектов характеризуют набором или вектором параметров
,
в котором координаты Pij представляют собой значение j-го случайного процесса в i-й момент времени. Например, моделирование и прогнозирование процесса работы радиоэлектронной системы промышленного предприятия предполагает определение текущего режима работы системы, текущего вида, формы суточного графика энергетической нагрузки системы, а в конечном итоге для моделирования – текущей прогнозирующей модели [3, 23, 68] из набора возможных для данного объекта. При определении режима работы для характеристики состояния объекта желательно использовать скалярную, либо векторную величину меньшей размерности, чем , но полно описывающей процесс функционирования системы. Замена векторов параметров на векторы меньшей размерности называется переходом в классифицирующее признаковое пространство (пространство признаков) со словарем признаков [21, 23, 24, 34, 68, 69]:
При решении этой задачи из графика исключаются «шумовые» точки, не несущие дополнительной информации об электропотреблении, многократно дублирующие эту информацию или малоинформативные точки. Выбранные признаки должны просто вычисляться на основе функционального преобразования . Режим объекта в пространстве признаков характеризуется m-мерной точкой , которую называют образом режима. Область пространства признаков, принадлежность к которой образов соответствует одному из режимов электропотребления объекта, называют кластером (классом, множеством) [3, 23] этого режима.
Таким образом, в пространстве признаков множество образов разбивается на кластеры , :
Наличие образа в кластере определяет текущее s-е состояние системы. При моделировании образов автоматическая кластеризация позволяет выделить в обучающей выборке , имеющиеся в ней M отдельных типов (кластеров, режимов) реализаций и обеспечить распознавание каждого нового типа , а следовательно, учесть неоднородность контролируемого процесса [3, 23].
Построение моделей для каждого кластера реализаций, позволяет значительно уточнить моделирование контролируемого процесса в целом [3, 23], так как учет нелинейностей, неоднородностей моделируемого процесса осуществляется не в рамках одной сложной, громоздкой модели и, как правило, вычислительно неустойчивой модели, а с помощью набора простых точных моделей каждого отдельного режима работы.
При моделировании процесса функционирования системы осуществляется распознавание как возможных режимов работы системы , так и текущего режима , используя методы кластерного анализа и теории распознавания образов [21, 24, 34, 69]. Выявление возможных режимов осуществляется, как было указано выше, по ретроспективной выборке из реализации процесса за месяц, квартал, год с использованием методов автоматической кластеризации [24, 70].
Определение текущего режима осуществляется путем отнесения текущего графика функционирования системы к одному из сформированных кластеров . Решение о принадлежности графика к кластеру осуществляется на основе правила распознавания [3, 23, 69, 71, 72].
Таким образом, рассмотренное [3, 23] применение кластерного анализа и теории распознавания образов при моделировании и прогнозировании электропотребления требует решения следующих задач:
1) построение признакового пространства, которое бы наилучшим образом позволяло различать кластеры (режимы электропотребления), в то же время размерность признакового пространства должна быть минимальной;
2) выбор правил определения принадлежности образа к тому или иному кластеру (правила распознавания) с учетом особенностей классифицируемого процесса и неполноты информации;
3) выбор алгоритма автоматической кластеризации обучающей выборки случайного процесса, для определения текущего числа кластеров (режимов) в выборке.
До недавнего времени принципы кластерного анализа и распознавания образов при моделировании и прогнозировании случайного процесса использовались в упрощенном виде [6, 73]. Так, распознавание и кластеризация осуществлялись в пространстве признаков полной размерности n, без построения эффективного признакового пространства, что в свою очередь не обеспечивало требуемого качества кластеризации случайного процесса, а следовательно, эффективного выделения основных режимов работы объектов электропотребления. При распознавании применялась простейшая евклидова метрика, а эффективные параметрические или непараметрические правила распознавания [13] не использовались, что обеспечивало не высокое качество и точность распознавания типов реализаций. Автоматическая кластеризация не проводилась, а разделение на кластеры осуществлялось интуитивно экспертами.
В настоящее время изложенные выше принципы использования кластеризации и распознавания образов при моделировании процессов находят применение при поэтапном адаптивном управлении, в частности, в авиации [9]. При этом реализуются алгоритмы идентификации и адаптации, прогнозирования, включая блок логики, осуществляющий разделение модели на группы (кластеры) алгоритмов моделирования и управления, в зависимости от определенного состояния объекта.
Кроме того, в экономике применяются регрессионные модели временных рядов с кластеризацией его локальных отрезков по принципу изменчивости дисперсии и ковариации, что позволяет повысить точность моделирования рядов [74]. Такие модели называют моделями волатильности, учитывающие гетероскедастичность дисперсии. Они являются модификациями ARMA-моделей и к ним относят ARCH- (AutoRegressive Conditional Heteroscedasticity), GARCH- (General ARCH) и др. Таким образом, применение методов искусственного интеллекта, в частности, методов кластеризации и распознавания образов при моделировании и прогнозировании процессов можно рассматривать как общенаучную тенденцию [9, 74, 75].
ЛИТЕРАТУРА К ГЛАВЕ 3
1. Гурский С.К. Адаптивное прогнозирование временных рядов в электроэнергетике. – Минск: Наука и техника, 1983. – 271 с.
2. Галустов Г.Г., Бровченко С.П., Мелешкин С.Н. Статистические прогнозные математические модели по курсам «Автоматизированная обработка данных», «Измерение и оценивание параметров в диагностических системах»: учебное пособие. – Таганрог: Изд-во ТТИ ЮФУ, 2010. – 43 с.
3. Седов А.В., Надтока И.И. Системы контроля, распознавания и прогнозирования электропотребления: модели, методы, алгоритмы и средства. – Ростов-на-Дону: Изд-во Рост. ун-та, 2002. – 320 с.
4. Бэнн Д.В., Фармер Е.Д. Сравнительные модели прогнозирования электрической нагрузки. – М.: Энергоатомиздат, 1987. – 200 с.
5. Галустов Г.Г., Цымбал В.Г., Михалев М.В. Принятие решений в условиях неопределенности. – М.: Радио и связь, 2001. – 196 с.
6. Гордеев В.И., Васильев И.Е., Щуцкий В.И. Управление электропотре-блением и его прогнозирование. – Ростов-на-Дону: Изд-во РГУ, 1991. – 104 с.
7. Праховник А.В., Розен В.П., Дегтярев В.В. Энергосберегающие режимы электроснабжения горнодобывающих предприятий. – М.: Недра, 1985. – 232 с.
8. Орнов В.Г., Рабинович М.А. Задачи оперативного и автоматического управления энергосистемами. – М.: Энергоатомиздат, 1988. – 223 с.
9. Теряев Е.Д., Шамриков Б.М. Цифровые системы и поэтапное адаптивное управление. – М.: Наука, 1999. – 330 с.
10. Галустов Г.Г., Мелешкин С.Н. Автоматизированная обработка реализаций случайных процессов: учебно-методическое пособие – Ростов-на-Дону: Изд-во ЮФУ, 2014. – 40 с.
11. Галустов Г.Г. Моделирование случайных процессов и оценивание их статистических характеристик. – М.: Радио и связь, 1999. – 120 с.
12. Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды. – М.: Наука, 1976. – 540 с.
13. Надтока И.И., Седов А.В. Адаптивные модели прогнозирования нестационарных временных рядов электропотребления // Изв. вузов. Электромеханика. – 1994. – № 1 – 2. – С. 57 – 64.
14. Современные методы идентификации систем / под ред. П. Эйкоффа. – М.: Мир, 1983. – 400 с.
15. Льюнг Л. Идентификация систем. Теория для пользователя. – М.: Наука, 1991. – 432 с.
16. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. – М.: Мир, 1974. Вып. 2. – 406 с.
17. Френкель А.А. Прогнозирование производительности труда: методы и модели. – М.: Экономика, 1989. – 214 с.
18. Лукашин Ю.Г. Адаптивные методы краткосрочного прогнозирования. М.: Статитстика, 1989. – 256 с.
19. Калман Р.Е. Идентификация систем с шумами // Успехи мат. наук. – 1985. – Т.40, вып. 4(244). – С. 234 – 267.
20. Демура А.В., Кушнарев Ф.А., Надтока И.И., Седов А.В. Прогнозиро-вание электропотребления в энергосистеме Ростовэнерго // Изв. вузов. Электромеханика. – 1994. – № 4-5. – С. 102 – 110.
21. Галустов Г.Г., Ковригин В.М. Нелинейное преобразование случайных процессов в диагностических системах // Радиотехника. – Вып. 62. Радиоэлектронные устройства и системы управления, локации и связи. – М. – 2002. – №2 – С.10 – 14.
22. Ту Дж., Гонсалес Р. Принципы распознавания образов. – М.: Мир, 1978. – 412 с.
23. Седов А.В. Микропроцессорные устройства контроля и прогнозиро-вания в системах управления электроэнергетическими объектами с дискретно-распределенными параметрами: дисс. … канд.техн.наук. – Новочеркасск, 1995. – 370 с.
24. Галустов Г.Г. Оценка погрешностей вычисления статистических характеристик, при использовании метода стохастического кодирования случайных процессов // Международная конференция “Научный прогресс на рубеже тысячилетий». 22 – 30 мая 2014 г. Publishing House Изд-во ‘Education and Science' s.r.o., г.Прага.
25. Прикладная статистика: классификация и снижение размерности / под ред. С.А. Айвазяна. – М.: Финансы и статистика, 1989. – 600 с.
26. Лоэв М. Теория вероятностей. – М.: Наука, 1962. – 720 с.
27. Андерсон Т. Введение в многомерный статистический анализ. – М.: Наука, 1963. – 500 с.
28. Иванов Е.А., Жердецкий В.В. Электробезопасность в судовом электромонтажном производстве. – Л.: Судостроение, 1986. – 70 с.
29. Щуцкий В.И. Применение теории вероятностей и математической статистики для исследования изменения сопротивления изоляции шахтных участковых электрических сетей в процессе эксплуатации // Изв. вузов. Электромеханика. – 1964. – №1. – С.73– 79.
30. Brown R.G. Smoothing, Forecasting and Prediction of Discrete Time Series. Prentice-Hall, 1962. – 150 p.
31. Седов А.В., Лачин В.И., Иванов Е.А. Прогнозирование изменения сопротивления изоляции судовых ЭЭС постоянного тока на основе уточненного метода экспоненциального сглаживания // Изв. вузов. Сев.-Кав. регион. Техн. науки. – 2002. – №3. – С.12 – 16.
32. Галустов Г.Г., Рыжов В.П. Выбор параметров сигналов при частотно-временных измерениях //Радиосистемы. Радиоэлектронные устройства и системы управления, локации и связи. – 2000. – Вып. 78, №3. – С.18 – 22.
33. Галустов Г.Г. Автоматизированные системы и аппаратура медицин-ской диагностики: учебное пособие. – Таганрог: Изд-во ТТИ ЮФУ, 2010. – 162 с.
34. Андерсон Т. Статистический анализ временных рядов. – М.: Мир, 1976. – 755 с.
35. Пугачев В.С. Теория случайных функций и ее применение к задачам автоматического управления. – М.: Физматгиз, 1962. – 884 с.
36. Фукунага К. Введение в статистическую теорию распознавания образов. – М.: Наука, 1979. – 376 с.
37. Голуб Дж., Ван Лоун Ч. Матричные вычисления. – М.: Мир, 1999. – 548 с.
38. Гантмахер Ф.Р. Теории матриц. – М.: Наука, 1966. – 456 с.
39. Воеводин В.В., Кузнецов Ю.А. Матрицы и вычисления. – М.: Наука, 1984. – 320 с.
40. Иберла К. Факторный анализ. – М.: Статистика, 1980. – 398 с.
41. Лоули Д., Максвелл А. Факторный анализ, как статистический метод. – М.: Мир, 1967. – 144 с.
42. Йереског К.Г., Клован Д.И., Реймент Р.А. Геологический факторный анализ. – Л.: Недра, 1980. – 223 с.
43. Андрукович П.В. Некоторые свойства метода главных компонент // Многомерный статистический анализ в социально-экономических исследованиях. – М.: Мир, 1974. – С.189 – 228.
44. Дубров А.М. Обработка статистических данных методом главных компонент. – М.: Статистика, 1978. – 135 с.
45. Ватанабе С. Разложение Карунена – Лоэва и факторный анализ. Теория и применение // Автоматический анализ сложных изображений. – М.: Мир, 1970. – С.163 – 181.
46. Корн Г., Корн Т. Справочник для научных работников и инженеров. – М.: Наука, 1984. – 831 с.
47. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. – М.: Статистика, 1974. – 238 с.
48. Седов А.В., Гречко Г.И., Гречко О.В., Липкин М.С., Давыдов А.Б. Автоматическая идентификация сплавов по вольтамперограммам инверсионного осаждения с использованием кластерного анализа // Изв. вузов. Сев.-Кав. регион. Техн. науки. – 2001. – №1. – С.5 – 12.
49. Седов А.В., Гречко Г.И., Давыдов А.Б., Липкин М.С. Электрохимический анализ сложных многокомпонентных сплавов // Теория, методы и средства измерений, контроля и диагностики: материалы Междунар. науч.-практич. конф., г. Новочеркасск, 21 сентября 2000 г.: в 10 ч. / Юж.-Рос. гос. техн. ун.-т (НПИ). – Новочеркасск: УПЦ «Набла» ЮРГТУ (НПИ), 2000. Ч.3. – С. 28 – 29.
50. Седов А.В., Гречко Г.И., Давыдов А.Б., Липкин М.С. Микропроцессорная система электрохимического анализа сложных многокомпонентных сплавов // Теория, методы и средства измерений, контроля и диагностики: материалы Междунар. науч.-практич. конф., г. Новочеркасск, 21 сентября 2000 г.: в 10 ч. / Юж.-Рос. гос. техн. ун.-т (НПИ). – Новочеркасск: УПЦ «Набла» ЮРГТУ (НПИ), 2000. Ч.3. – С. 31 – 32.
51. Седов А.В., Давыдов А.Б. Определение пробы металла по вольтамперограммам инверсионного осаждения методами распознавания образов // Теория, методы и средства измерений, контроля и диагностики: материалы Междунар. науч.-практич. конф., г. Новочеркасск, 21 сентября 2000 г.: в 10 ч. / Юж.-Рос. гос. техн. ун.-т (НПИ). – Новочеркасск: УПЦ «Набла» ЮРГТУ (НПИ), 2000. Ч.3. – С. 33 – 34.
52. Галустов Г.Г., Захаров С.М. Микропроцессорный модуль предвари-тельной обработки медико-биологических сигналов // Вопросы радио-электроники. Сер. Электронная вычислительная техника (ЭВТ). – 1988. – Вып. 2.
53. Липас Дж.Р., Рунс Дж.М. Многомерный анализ химических данных факторными методами // ЭВМ помогает химии. – Л.: Химия, 1990. – С.182 – 237.
54. Радиотехнические цепи и сигналы. Примеры и задачи: учеб. пособие для вузов / Г.Г. Галустов, И.С. Гоноровский, М.П. Дёмин и др.; под ред. И.С. Гоноровского. – М.: Радио и связь, 1989. – 248 с.
55. Галустов Г.Г., Сидько И.В. Математическое моделирование случайных процессов и оценивание их статистических характеристик. – Таганрог: Изд-во ЮФУ, 2013. – 45 с.
56. Каприо У.Ди, Дженезио Р., Поцци С., Вицино А. Сопоставление модели авторегрессии скользящего среднего и обобщенного фильтра Винера для прогнозирования нагрузки в ENEL (Северная Италия) // Сравнительные модели прогнозирования электрической нагрузки. – М.: Энергоатомиздат, 1987. – С.92 – 109.
57. Zadeh L.A., Ragazzini J.R. An extension of Wiener’s theory of prediction. J. Appl. Phys. – 1950. – № 21. – iss. 7.
58. Растригин Л.А., Маджаров Н.Е. Введение в идентификацию объектов управления. – М.: Энергия, 1977. – 215 с.
59. Справочник по теории автоматического управления / под ред. А.А. Красовского. – М.: Наука, 1987. – 712 с.
60. Методы классической и современной теории автоматического управления: в 3 т. Т.1. Анализ и статистическая динамика систем автоматического управления / под ред. Н.Д. Егупова. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2000. – 748 с.
61. Солодов А.В. Методы теории систем в задаче непрерывной линейной фильтрации. – М.: Наука, 1976. – 264 с.
62. Трофимов А.И., Егупов Н.Д., Дмитриева А.Н. Методы теории автоматического управления, ориентированные на применение ЭВМ / под ред. К.А. Пупкова. – М.: Энергоатомиздат, 1997. – 652 с.
63. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. – М.: Наука, 1986. – 287 с.
64. Фильтрация и стохастическое управление в динамических системах / под ред. К.Т. Леондерса. – М.: Мир, 1980. – 407 с.
65. Теория автоматического управления. Нелинейные системы, управление при случайных воздействиях / под ред. Л.В. Нетушила. – М.: Высшая школа, 1983. – 431 с.
66. Фарина А., Студер Ф. Цифровая обработка радиолокационной информации. Сопровождение целей. – М.: Радио и связь, 1993. – 320 с.
67. Abu-Ei-Magd M.A., Sinha N.K. Two new algorithms for on-line modeling and forecasting of the load demand of multimode power systems // IEEE Trans. Power App. Syst. – 1981. – Vol. PAS-100, № 7. – P. 3246 – 3252.
68. Седов А.В. Оперативное определение режима работы ЭЭС на основе кластеризации и распознавания образов // Кибернетика электрических систем: материалы XXIV сессии семинара «Диагностика электрооборудования», г. Новочеркасск, 24 – 26 сент. 2002 г. / Юж.-Рос. гос. техн. ун-т. Новочеркасск: Ред. журн. «Изв. вузов. Электромеханика», [приложение к журналу] – С. 24 – 25.
69. Галустов Г.Г., Захаров С.М., Чеботарёва Л.А. Распознавание случайных сигналов на основе параметрического и непараметрического алгоритмов // Тезисы докладов Всесоюзной научно-технической конф. «Человеко-машинные системы и комплексы принятия решений». – Таганрог, 1989.
70. Горелик А.Л., Скрипкин В.А. Методы распознавания. – М: Высшая школа, 1989. – 232 с.
71. Дюран Б., Оделл П. Кластерный анализ. – М.: Финансы и статистика, 1977. – 128 с.
72. Патрик Э. Основы теории распознавания образов. – М.: Сов. радио, 1989. – 408 с.
73. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. – М.: Наука, 1983. – 416 с.
74. Mathewman P.D., Nicholson H. Techniques for load prediction in the electricity-supply. Proc. Inst. Elec. Eng. – 1968. – Vol.115, № 10. – P.1451 – 1457.
75. Арженовский С.В., Молчанов И.Н. Статистические методы прогнозирования: учебное пособие. – Ростов-на-Дону, 2001. – 74 с.
76. Седов А.В., Сухомлинова О.А. Обобщенное векторно-матричное представление модели экспоненциального сглаживания для прогнозирования электрической нагрузки энергосистем // Кибернетика электрических систем: матер. XXV сессии семинара «Электроснабжение промышленных предприятий», г. Новочеркасск, 15 – 16 окт. 2003 г./ Юж.-Рос. гос. техн. ун-т. Новочеркасск: Ред. журн. «Изв. вузов. Электромеханика», 2004 [прил. к журналу] – С. 36 – 37.
77. Галустов Г.Г., Ковригин В.М. Нелинейное преобразование случайных процессов в диагностических система // Радиотехника. Вып. 62 Радиоэлектрон-ные устройства и системы управления, локации и связи. – М. – 2002. – №2. – С.10 – 14.
78. Пытьев Ю.П. Математические методы интерпретации эксперимента. – М.: Высшая школа, 1989. – 351 с.
79. Благуш П. Факторный анализ с обобщениями. – М.: Финансы и статистика, 1989. – 248 с.
80. Sharma K.L.S., Mahalanabis A.K. Recursive short-term load forecasting algorithm // Proc. Inst. Elec. Eng. – 1974. – Vol. 121. – P. 59 – 62.
81. Тутубалин В.Н. Границы применимости (вероятностно-статистические методы и их возможности). – М.: Знание, 1977. – 64 с.
82. Шнейдер А.М., Такенава Т., Шиффман Д.А. Суточное прогнозиро-вание нагрузки электроэнергетической системы с учетом прогнозов температуры. // Сравнительные модели прогнозирования электрической нагрузки. – М.: Энергоатомиздат, 1987. – С.74 – 91.
83. Тимченко В.Ф., Меламед А.М., Скрипко О.А. Прогнозирование режимов электропотребления нерегулярных дней // Электрические станции. – 1987. – №5. – С.52 – 57.