автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Синтез управления неопределенными динамическими объектами на основе прямой и обратной минимаксных задач
Автореферат диссертации по теме "Синтез управления неопределенными динамическими объектами на основе прямой и обратной минимаксных задач"
^ ^ РОССИЙСКАЯ АКАДЕМИЯ НАУК V ^ Институт проблем управления
На правах рукописи
УДК 681-51
Коган Марк Михайлович
Синтез управления неопределенными динамическими объектами на основе прямой и обратной минимаксных задач
05.13.01 - управление в технических системах
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
№
Москва 1998 о //
Работа выполнена в Нижегородском архитектурно-строительном
университете
Оффициальные оппоненты:
Член-корреспондент РАН, профессор С.К.Коровин Доктор технических наук, профессор Е.С.Пятницкий Доктор физико-математических наук, профессор П.В.Пакпшн
Ведущая организация - Институт математики и механики им. академика В.И.Смирнова Санкт-Петербургского государственного
университета
в 14.00 часов на заседании диссертационного Совета Д002.68.03 в Институте проблем управления по адресу: 117806, Москва, ул. Профсоюзная, 65.
С диссертацией можно ознакомиться в библиотеке Института проблем
управления.
Защита диссертации состоится
1998 г.
Автореферат разослан
1998 г.
Ученый секретарь диссертационного Совета Д002.68.03
кандидат технических наук
С.А.Власов
ОБЩАЯ ХАРАКТЕРИСТИКА. РАБОТЫ
В диссертационной работе развиваются методы управления дянами-гесктш объектами в условиях неполной информации, основанные на прп-1ененш1 теории дифференциальных игр и обратных минимаксных за-1ачах. а также синтезируется адаптивное локально-оптимальное .упра-шенпе. Разработан общий подход к синтезу робастных, абсолютно ста-¡плизирующпх и Ны субоптпмальных регуляторов для классов неопре-геленных аффинных по входам нелинейных систем, нелинейных систем Турье п линейных систем в непрерывном п дискретном времени. Решен эяд новых обратных вариационных задач минимаксного и оптимального травлений. Проведено исследование идентификации методом наименьшее квадратов при невыполнении условий теоремы Гаусса-Маркова о состоятельном оценивании п яа его основе для тшейвых стохастических объектов синтезировано адаптивное управление, не требующее идентифицируемости неизвестных параметров.
Актуальность темы. В своем развитии теория управления прохо-хила несколько этапов, среди которых можно условно выделить следующие: классическая теория устойчивости и автоматического регулирования, теория оптимальных систем управления, теория стохастических систем управления и современный этап - теория адаптивного п робаст-аого управлений. Возникновение последнего связано с необходимостью травления сложными техническими объектами, меняющимися в процессе функционирования в изменяющейся со временем среде, получение точных математических моделей которых представляется весьма проблематичным. Отсутствие точной математической модели объекта препятствует нахождению закона управления, обеспечивающего устойчивость и эптимальность. В этих условиях естественно желание преодолеть "узкую специализацию* стратегии управления и сделать ее более универсальной но отношению к объектам п возмущениям, что и привело к появлению теорий адаптивного и робастного управлений.
Исходным в теории робастного управления является стремление к обеспечению устойчивости не только заданной (номинальной) системы управления, но п всех не очень отличных от нее в определенном смысле систем. В отличие от классической теории автоматического регулирования, в теории робастного управления цель должна достигаться не только для данного объекта, а для целого класса объектов и возмуще-
нпп. выделяемых на основе априорной пнформащш. Теория адаптивного управления - это теория систем управления, которые благодаря самонастройке п обучению меняют свою стратегию, стремясь прпблпзпть ее к оптимальной, причем делают они это асимптотически точно, если объект перестает меняться, и, следовательно, достаточно точно, если объект меняется медленно.
Работы Лурье. Апзермана. Попова. Якубовича. Калмана, Лефшеца. Ла-Салля стимулировали большой интерес к теории устойчивости, вообще, и к методам Ляпунова п проблеме абсолютной устойчивости, в частности. Проблема робастной устойчивости получила развитие в работах Харитонова. Цыпкпна, Поляка, Barmish, Hollot. Jury и многих других; Неймарком на основе D-разбиения было введено понятие меры робастной устойчивости. Синтез робастного управления для различных классов неопределенных объектов во многом опирается на метод функций Ляпунова. Так. в работах Меплахса, Barmish, Барабанова Н., Hollot, Petersen, Bernstein. Haddad для неопределенных линейных систем с ограниченными по норме неизвестными нестационарными параметрами были введены понятия квадратичной устойчивости и квадратичной стабпли-зпруемостп, в соответствии с которыми осуществляется поиск линейного стационарного закона .управления и квадратичной функции, являющейся при' этом управлении функцией Ляпунова для произвольной системы рассматриваемого класса, а также понятие оптимального гарантированного управления, обеспечивающего определенный уровень показателя качества при любой допустимой неопределенности. В работах Khargonekar, Zhou, Xie, de Souza установлена связь между теорией H^ оптимального управления п робастной стабилизацией неопределенных линейных систем. Применение этих методов, как правило, предполагает нахождение положительно определенного решения матричного уравнения Лурье-Риккати, по которому п определяются параметры обратной связи.
В последнее время для систем Лурье, которые наряду с линейными блоками содержат неизвестные нелинейные характеристики, активно разрабатывается проблема абсолютной стабшпппруемостп, т.е. существования регуляторов, обеспечивающих абсолютную устойчивость замкнутой системы. В работах Брусина, Савкина, Petersen условия абсолютной стабилизпруемости выражаются в виде частотного неравенства, включающего решение матричного уравнения для задачи Нх опти-
ального управления, или в терминах решений пары ма!рнтшых уравне-пй, характерных для задачи #х-оптимального управления. Мггрецкпй Rantzer показали, как сложная система может быть описана, пепользуя ак называемые пнтегрально-квадратпчеекпе ограничения для ее компо-ентов, п получили условия устойчивости таких систем.
Отметим также, что в работах Boyd. Ghaoui, Feron, Balakrislman. cherer. Weiland условия абсолютной устойчивости для систем Лурье и словдя робастной устойчивости для некоторых классов неопределенных пстем выражены на языке так называемых линейных матричных не-авенств (LMI). В 60-е годы Якубович, Попов. Калман. Цыпкин и дру-ие получили различные частотные условия разрешимости соответствующих LMI, которые свели решение проблемы Лурье к проверке простых рафпчеекпх критерйев. Далее Пятницкий и Скородинский показали, что адача Лурье для систем со многими нелинепностямп может быть све-[ена к задаче выпуклой оптимизации, включающей LMI. и применили 1ля ее решения метод эллплсондов. Немировскии и Нестеров на основе пвестных алгоритмов выпуклой оптимизации разработали так называние алгоритмы внутренней точки, позволяющие в среде MATLAB вы-1снять разрешимость данного LMI илп находить экстремум линейной функции при ограничениях, задаваемых LMI.
Что касается робастного управления нелинейными неопределенными объектами, то первые результаты в этом направлении были получены Zanies на основе так называемой теоремы о малом коэффициенте роста. В последнее десятилетие был сделан значительный прогресс в развитии геометрической теории нелинейных систем управления. Вместе с теорией устойчивости Ляпунова она составляет основу для синтеза робастного управления. В частности. достаточные условия существования функции Ляпунова при соответствующем законе управления для различных классов нелинейных систем управления даны в работах Artstein..Tsinias, Sontag, Isidori, Khali], Corless. Согои, Praly, Teel, В работах Freeman, Kokotovic, Sussman изучаются итеративные процедуры построения функции Ляпунова, а в работах van der Schaft, Doyle, Lu для некоторых классов систем со структурированной неопределенностью результаты получены на основе теории Нх оптимального управления для нелинейных систем.
Следует отметить, что в большинстве работ этого направления
результаты формулируются в терминах существования положительно определенного решения уравнений/неравенств Гампльтона-Якоби, что создает проблему при реализации предлагаемых законов управления. Таким образом, при спнтезе робастного управления различными классами неопределенных динамических объектов остается актуальной разработка регулярных методов, по возможности не требующих решения нелинейных дифференциальных уравнений/неравенств Гамильтона-Якобп пли нелинейных матричных уравнений/неравенств Лурье-Рпккатп.
В последние десятилетия произошел значительный прогресс в теории адаптивного управления. Вместе с тем. из-за существенной нелинейности и многомерности уравнений адаптивных систем управления многие фундаментальные теоретические проблемы остаются еще нерешенными. Одной из наиболее значимых из них является сходимость самонастраивающихся регуляторов, основанных на рекуррентом оценивании методом наименьших квадратов (МНК). Сложность этой задачи заключается в следующем. Если старший коэффициент числителя передаточной функции объекта является неизвестным, тогда текущее управление должно входить в регрессионный вектор в качестве одной из его компонент. Однако. выбор закона управления в виде линейной обратной связи от остальных регрессоров приводит в таком случае к нарушению так называемого условия неисчезаюшего возбуждения, обеспечивающего в соответствии с классической теоремой Гаусса-Маркова невырожденность информационной матрицы п сходимость опенок к их истинным значениям.
Для преодоления этой трудности обычно применяют внешние сигналы или модифицируют алгоритм МНК так, чтобы, дополнительно возбуждая систему, обеспечить состоятельное оценивание. Вместе с тем, как отмечалось многими авторами, указанные меры значительно усложняют синтез и анализ адаптивной системы и, что, наверное, самое существенное, могут приходить в противоречие с целями управления. Таким образом, при изучении адаптивного управления, основанного на идентификации, важно выяснить, что происходит с оценками при невыполнении условий непечезающего возбуждения.
Цель диссертационной работы состоит в спнтезе законов управления динамическими объектами при отсутствии полной информации о математических моделях системы и действующих возмущении на основе минимаксного подхода; в решении обратных вариационных задач мнни-
максного управления для нелинейных и линейных, непрерывных и дискретных систем п обратной задачи оптимального управления для линейных дискретных систем; в выяснении возможности адаптивного управления. основанного на рекуррентной идентификации методом наименьших квадратов, в отсутствие идентифицируемости неизвестных параметров объекта.
Методы исследования. В диссертации используются методы теории управления, теории устойчивости, теории оптимального управления и дифференциальных игр. теории матриц, а также компьютерное моделирование.
Достоверность полученных результатов основана на строгом п обоснованном прцмененпп математических методов, на сравнении результатов компьютерного моделирования с теоретическими: выводами.
Научная новизна. На основе минимаксного подхода разработан метод синтеза регуляторов, обеспечивающих асимптотическую устойчивость пли равномерное гашение возмущении для классов неопределенных аффинных по входам нелинейных непрерывных систем, непрерывных и дискретных систем Лурье, а также непрерывных и дискретных линейных систем с неизвестными нестационарными параметрами, принимающими значения в эллипсоидальной области. Показано, что для указанных классов неопределенных объектов задача робастного управления представпма как обратная вариационная задача минимаксного управления и получено ее решение непосредственно в терминах обратной связи, исключая при этом необходимость в решении нелинейных уравнений/неравенств Гамильтона-Якоби пли Лурье-Риккати. Решены обратные вариационные задачи минимаксного управления для нелинейных и линейных, непрерывных и дискретных систем и обратная задача оптимального управления для линейных дискретных систем. Выяснены особенности идентификации методом наименьших квадратов при невыполнении условий теоремы Гаусса-Маркова о состоятельном оценивании и синтезировано адаптивное управление, не требующее идентифицируемости объекта.
Основные результаты диссертации
• Доказано, что робастными, абсолютно стабилизирующими и Нж субоптимальными законами управления для рассматриваемых классов неопределенных объектов являются минимаксные законы упра-
вленпя в дифференциальной игре протнв искус ственного возмущения для полностью определенной вспомогательной системы п целевого функционала некоторого вида, а функцией Ляпунова для исходной неопределенной системы является функция Беллмана этой игры. Для нелинейных систем эти законы управления выражены в терминах решений нелинейных уравнений плп неравенств Гампль-тона-Якоби, а для линейных систем - в терминах решений матричных уравнений плп неравенств Лурье-Рпккатп. а также в впде линейных матричных неравенств.
• Показано, что задача синтеза робастных, абсолютно стабилизирующих и Я-* субоптпмальных регуляторов может быть рассмотрена как обратная задача минимаксного управления. Получены проверяемые условия для данной обратной связи, при выполнении которых она соответствует требуемому закону управления, что исключает необходимость решения нелинейных неравенств пля уравнений. Для нелинейных аффинных по входам неопределенных систем эти условия выражаются в виде интегральных неравенств, а для систем Лурье и линейных систем - в виде линейных матричных неравенств или частотных условий.
• Решены обратные вариационные задачи наихудшего возмущения, дифференциальной игры и минимаксного управления для нелинейных аффинных по входам динамических систем и для линейных непрерывных п дискретных систем, а также обратная задача оптимального управления для линейных дискретных систем.
• Установлено, что при идентификации методом наименьших квадратов в общей задаче линейной регрессии, когда не выполнены условия теоремы Гаусса-Маркова о состоятельном оценивании, имеет место сходимость оценок к многообразию, на котором дисперсия ошибки прогноза принимает минимальное значение. Показало, что при идентификации в замкнутых системах управления, когда параметры регулятора являются функциями оценок неизвестных параметров объекта, существуют локально-оптимальные законы управления, инвариантные на этом многообразии.
• Для линейных стохастических объектов синтезировано адаптивное
локально-оптимальное управление, основанное на пдентпфпкацпл рекуррентным методом наименьших квадратов и не требующее для своей реализации идентифицируемости параметров объекта. Получены дифференциальные уравнения, описывающие динамику оценок в этой адаптивной системе, п доказано существование глобально притягивающего предельного многообразия, на котором реализуется локально-оптимальный закон у правления неизвестным объектом.
Практическая ценность работы. Теоретические результаты диссертации могут быть использованы для расчета конкретных робастных и адаптивных регуляторов. Результаты работы использованы при разработке спецкурсов, прочитанных автором диссертации в 1987-1998 гг. студентам и бакалаврам факультета Вычислительной математики и кибернетики Нижегородского государственного университета, а также в курсовых и дипломных работах.
Апробация работы. Результаты диссертации докладывались и обсуждались на 12 Всемирном Конгрессе Международной федерации по автоматическом}' управлению (IFAC) (Сидней, 1993), на 3 п 4 Европейских конференциях по управлению (Рим. 1995 и Брюссель, 1997). на,33-н Конференции по принятию решении л управлению (CDC) (Орландо, 1994), на 10 Симпозиуме IFAC по идентификации (Копенгаген. 1994), на 2-м Симпозиуме IFAC по стохастическому управлению (Вильнюс, 1986), на Симпозиуме IFAC по адаптивному управлению (Тбилиси, 1989), на 2-й Российско-Шведской конференции по управлению (Санкт-Петербург, 1995), на 1-й Международной конференции по управлению колебаниям и хаосом (Санкт-Петербург. 1997). на 7, 9,10, И Всесоюзных совещаниях по проблемам управления (Минск, 1977; Ереван, 1983; Алма-Ата, 1986; Ташкент, 1989) и на Всероссийской конференции "Новые направления в теории систем с обратной связью" (Уфа, 1993), на Всесоюзных конференциях "Теория адаптивных систем ц ее применение" (Ленинград, 1983 и 1991), на 5 Всесоюзном совещании по статистическим методам в процессах управления (Алма-Ата, 1981), на 12 Всесоюзной школе-семинаре по адаптивным системам (Могилев. 1984), на Всесоюзном семинаре " Динамика нелинейных систем управления"' (Таллин, 1987) и на 4 и 5 Международных семинарах "Устойчивость и колебания нелинейных систем управления" (Москва, ИПУ РАН, 1996 и 1998), на 6 и 7 Всесоюзных
совещаниях по непараметрпчоскпм п робастньш методам статнстпкп в кибернетике (Томск, 2987 п 1990). на 8 Всесоюзной конференции "Проблемы теоретической кибернетики" (Горький, 1988), на 4-й конференции по нелинейным колебаниям механических систем (Нижний Новгород. 1996). на Итоговых научных конференциях Горьковского госунпверспте-та (1981-1989), на семинаре в 1985 году в Институте проблем управления под руководством академика РАН Я.З.Цыпкина. на семинаре "Нелинейные динамические системы" на факультете ВМпК в МГУ под руководством академика РАН С.В.Емельянова и члена-корреспондента РАН С.К.Коровина (1992 и 1996).
Публикации. Основные результаты диссертации опубликованы в 28 работах, среди которых 15 статей в центральных научных журналах РАН, 1 статья в Вестнике Нижегородского университета. 3 статьи в международных журналах и 9 работ - в трудах международных конференций. Результаты по адаптивном}' локально-оптимальному управлению, опубликованные в совместных с Ю.И.Неймарком статьях, вошли в главу 7 п являются неразделимыми.
Структура и.объем работы. Диссертация состоит из введения, 7 глав, заключения и списка литературы. Содержание изложено на 223 страницах, включая список литературы из 185 наименований.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении обосновывается актуальность темы диссертационной работы, приводится обзор работ по теории робастного и адаптивного управлений и излагаются основные содержательные моменты развиваемого подхода.
В первой главе диссертации ставятся и решаются обратные вариационные задачи наихудшего возмущения, дифференциальной пгры п минимаксного управления для аффинных по входам нелинейных и линейных динамических систем, описываемых дифференциальны ми уравнениями. Разрабатываемый при этом математический аппарат служит в дальнейшем для решения задачи синтеза управления в условиях неопределенности.
Общий вид рассматриваемой системы представлен уравнением
. .г =Л(.г) + В(г) и + Г(.г) г . " (1)
в котором .г £ В'" - состояние, и £ И1' - управление, с € /?' - возмущение, .4(0) = 0. Целевой функционал, который "максимизируется" возмущением с и должен быть мпнпмизпрован управлением и. предполагается следующего впда
ос
.7(и.у) = У[С(.г) + «7Л(.г)»-г'Г5(^)с] (2)
'о
где С(х) > 0,(6'(0) = 0) .В(х) > О.Б(г) > 0. Принято, что класс рассматриваемых систем п функционалов ограничен такими, для которых в некоторой области фазового пространства А", включающей начало координат. выполняются условия существования и единственности решения задачи Кощп п для которых существует непрерывно-дифференцируемая функция V — Г (.г) > 0. называемая верхней ценой игры и удовлетворяющая неравенству Гамильтона-Якоби-Беллмана
(^Л И+<?(,•)-
[В (х) Я"1 (л-) Вт (х) -Г (х) ¿Г1 (г) Гг (г)] ~ < 0 .
Как известно, при этом минимаксное управление и наихудшее возмущение определяются следующим образом
Обратная задача наихудшего возмущения, состоящая в нахождении условий, при которых данная обратная связь
г = С(х) (3)
системы
х='А(г) + Р(х) V
доставляет максимум функционалу впда (2) при ?/ б (х) >0, имеет следующее решенпе.
(4)
= 0 для некоторой
Теорема 1 Стратегия (3). при которой управляемая система Ц) имеет единственное глобально асимптотически устойчивое состояние равновесия х = 0. является наихудшей по отногиению к функционалу (2) с и = 0 при некоторой G{x) > 0 тогда и только тогда, когда по траектории системы (4) с x(to) = 0 для всех допустимых v(t). при которых х (f) = 0. выполняется
J\r-C[r)]TS[x)[v-Mx)} df<JrTS{x)rdt . (5)
h <о
В случае устойчивой линейной системы
X = Л.)' + Fr , квадратичного функционала вида
ос
J(v) = J (xTGx-vTSv) df о
и возмущения г = (Тх. интегральное неравенство (5) сводится к частотному неравенству
И''<2)Г (-iw) SW™ (iw) < S , Vu> 6 (-oo. ос) .
в котором IV,'2' (р) = I — (J [pi — Л)-1 F - матрица возвратной разности выбранной обратной связи.
Обратная задача дифференциальной игры, состоящая в нахождении условий, при которых пара стратегий вида
и=~в(х), г: = С(х) (б)
является соответственно минимаксным управлением и наихудшим возмущением, имеет следующее решение.
Теорема 2 Пара стратегий (6), при которых управляемая по совокупности переменных u,v система (1) имеет единственное глобально асимптотически устойчивое состояние равновесия х = 0, является соответственно минимаксным управлением и наихудшим возмущением по отношению к функционалу (2) для некоторой G (х) > 0 тогда и только
тогда, когда по траектории системы (1) с .г(^о) = 0 для всех допустимых и (I) и г (/). при которых .г (<) = 0. выполняется
■х
I [(« + В (..•))ГЯ(.г) (и + (?(.*■)) - (г - С,"(^))Г5(.г) (с - С (.г))] Л >
ос (7)
> У о - гг5{.г) ?■] Л .
'о
Для линейной системы
.г = Аз- + В и + Ги , квадратичного функционала вида
ос
,7 (и, v) = ] (хТСт + итЯи - Лг) <Н (8)
о
п линейных стратегий
п = -втг . V = (тх интегральное неравенство (7) преобразуется в частотное условие
И? (-М 11\¥и [ш) - ТГ,г (~М 5И"„ М > | * | , (9) в котором
И'„ (р) = (1 + 9т (р1 - Л)'1 В, вт (р/ - А)"1 Г) ,
(10)
И", (Р) = (-СТ (р/ - А)"1 Б . I - Сг (р/ - Л)"' -Р) •
Решение обратной задачи минимаксного управления, где в отлпчпе от обратной задачи дифференциальной игры стратегия противника (возмущения) не задана и требуется найти условия, прп которых закон управления вида
!| = -0(аг) (11)
является минимаксным, дается следующей теоремой.
Теорема 3 Стратегия (11). при которой управляемая система (1) с г = 0 имеет единственное глобально асимптотически устойчивое состояние равновесгш х = 0. является минимаксной по отношению к функционалу (2) для некоторой G (х) > 0 тогда и только тогда, когда по траектории системы (1) при нулевых начальных условиях и любых допустимых стратегиях u(t) и r(f), при которых .r(f) = 0. выполняется следующее интегральное неравенство
ос ОС
j (и + в(х))ТЯ(х)(и + 0(х)) di > J [urIÏ(x)ti-vTS(x)v] di . (12)
и fo
Для линейной системы
.?• = Ах + Bu + Fv ,
квадратичного функционала (8) и линейной стратегии и = -втг интегральное неравенство (12) преобразуется в частотное условие
Wï (-М RWU M > | * _°5 j , (13)
где П'и (р) задана в (10), которому удовлетворяют все устойчивые обратные связи, являющиеся минимаксными законами управлениями.
Прп S —* оо минимаксный регулятор переходит в линейно-квадратичный оптимальный регулятор, а частотное условие (13) преобразуется в так называемое условие возвратной разности Калмана
W*l)r fiwW (lLU) > R , (H)
где И'<» (р) = I + вт (pi — Л)'1 В, выделяющее средп всех устойчивых обратных связей те, которые соответствуют оптимальным законам управления. Кроме того, частотное условие (13) показывает, что множество оптимальных законов управления для данной системы в отсутствие возмущений включает в себя множество минимаксных законов управления.
• Во второй главе излагается новый подход к синтезу робастного управления, основанный на теории дифференциальных цгр и решении обратных вариационных задач.
; Рассматривается класс неопределенных систем, описываемых уравнением
х = [Л. (x)+Fi (*) Oi (s, t) Ех (z)]+[B (a;)+F2 (г) (х,*) Еч (л-)] и , (15)
в котором А (.»•). В (г). Л (х). F-2 (.г). E¡ (.г) . E-¿ .(.г) - заданные непрерывные матричные функции соответствующих порядков. А (0) = 0. E¡ (0) = 0 .i = 1.2. Относительно матричных функций Í2] (г, t). (■''• соответствующих имеющимся неопределенностям в системе, предполагается, что при всех х. t они удовлетворяют условиям
Qi(xJ)TQi(x,t) < I, / = 1.2. (10)
Задача синтеза робастного управления состоит в построении законов управления впда обратной связи по состоянию
и = -*(*), 0(0) = 0 , (17)
при которых для всех допустимых неопределенностей состояние равновесия г — 0 замкнутой системы (15), (17) является асимптотически устойчивым и выполняется целевое условие
ос
f [G(x) + uTR (х) и] dt < V (.г (0)) , (18)
о
где G {х) > 0. G (0) = О, R (х) = RT (х) > 0, V (х) > 0. Г (0) = 0.
Предлагаемый подход к решению сформулированной задачи заключается в том. что наряду с исходной неопределенной системой рассматривается вспомогательная полностью определенная система
х = A(x) + B(x)u + F{x)v , (19)
в которой F(x) = (Fi (г) (х)) п все входящие в это уравнение функции те же, что в (15). В отличие от (15) это уравнение не содержит неизвестных функций, но включает фиктивное возмущение г. В частности, при
/ ПЦx,i)Ey{x) \ [a2(x,t)E2(x)u J
уравнения (15) и (19) совпадают, и в этом случае из (16) следует, что
vTv < Е[ (х) £1 (х) + vTE( (х) Е2 (х) г;. . (20)
Тогда поставленная задача робастного управления будет решена, если найдется закон управления системой (19), который обеспечивает выполнение цели (18) при любых возмущениях v, удовлетворяющих условию (20).
Установлено, что такими законами управления будут минимаксные законы управления для системы (19) и функционала
ос
7(и,у) = / {(5(х) + итя(х) и~^1'т1<] Л , о
в котором 7 ф О - некоторое число, <5 (х) > С (х), а
' 6 (х) = &(*)+ 7'1Е1 (х) Е> (х) , П(х) = В (х) + -¡1Е\ (г) Е2 (х) .
Теорема 4 Пусть существуют непрерывно-дифференцируемая положительно определенная функция V (х) и 7 ф 0 такие, что для всех г ф 0 € X имеет место неравенство Гамилътона-Якоби
[%)ТА{х) + 6{х)~ У "
(~) [В («) В"1 (х) Вт (х) - 7"2Г (х) 1? (х)] ^ < 0 . Тогда закон управления
и^х) = -1-Е-'(х)Вт(х)^ (22)
обеспечивает для системы (15) выполнение цели (18).
В последующем закон управления вида (22) будем называть центральным робасгньш законом управления, соответствующим функции V (х). Эти законы управления не исчерпывают множество всех обратных связей по состоянию, решающих поставленную задачу. К последним относится также закон управления (17), если существуют непрерывно-дифференцируемая положительно определенная функция V (х) и 7 ф О такие, что для всех х ф 0 6 X выполняется неравенство
{х)+с{х)+вт{х)к{х) в (^ТР(х)г'г < о,
" ' ' - (23)
где Ад(х) = А{х) - В (х)9 (х). В этом случае центральный робастный регулятор, соответствующий данной функции V (х), также приводит к достижению цели. '
(21)
Сформулированные выше условия (21).(22)- или (23) можно рассматривать как ограничения на функцию 0(х), при выполнении которых закон управления (17) определяет робастное управление. Этп условия содержат неизвестную функцию V (х). которая должна удовлетворять матричному неравенству (21) пли (23). Возникает вопрос: нельзя ли выразить этп условия только в терминах функции в (х) ?
Позитивный ответ на поставленный вопрос получен путем сведения этой проблемы к обратной вариационной задаче п решению последней методами, разработанными в первой главе.
Теорема 5 Стратегия v = —в (х), при которой управляемая невозмущенная система (19) имеет единственное глобально асимптотически устойчивое состояние равновесия х = 0, является центральным ро-бастпым законом управления для неопределенной системы (15) тогда и только тогда, когда при нулевых начальных условиях и любых допустимых стратегиях u(t) и v (t), при которых limace х (t) = 0, по траектории системы (19) выполнено следующее интегральное неравенство
ОС оо
/ [и + в{х))ТЁ(х){и + в(х)) dt>f [G{x) + uTR(x)u-72rri>] dt .
о о
Для линейных неопределенных систем
х = [А + FiOi (t) £,] х + [В + F2fi2 (<) Е2] и (24)
с матричными функциями (t). П2 (*), которые соответствуют неизвестным параметрам п при всех 1 удовлетворяют условиям
« = 1,2, (25)
центральный робастнып регулятор, обеспечивающий выполнение цели
оо
J (xTQx + итRu) dt < хт (0) Сх (0) ( 26)
о
с <2 > 0 и Д > 0, имеет вид
и. = ~R~lBTCx .
Здесь матрица С = Ст > 0 удовлетворяет при некотором ф 0 неравен-
ству
в котором
ЛтО+ С А - СВГГ[ВТС + -} ~'1СТГтС + <5 < 0 . ... (27)
0 = с?+",2е1е1 . я = п+~,2е%е2 .
Кроме того, установлено, что поставленная цель достигается при законе управления и = —07х, если п только еслп для некоторых С — Ст > О п -) ф 0 пмеет место неравенство
АТС + СА + 9В9Т + 1~2СГРТС + 0 < 0 ,
(28)
где А — А — В9Т - устойчивая матрица. Отметим, что неравенства (27) и (28) представимы в виде так называемых линейных матричных неравенств
( АР + РАт-Вй-1Вт-¥Г2ЕЕт Р\[§ -т
у/я р
относительно матрицы Р = С-1 и
АТС + С А + <Э вт
РТС
<0
-I
в СР -П'1 о О -72//
<0
относительно матрицы С. Это дает возможность проверять пх выполнимость в среде МАТЬАВ.
Вместе с тем, тот факт, что искомым робастным управлением оказалось минимаксное управление по отношению к произвольному квадратичному функционалу из некоторого класса, позволяет сформулировать задач}' синтеза робастного управления как обратную задачу минимаксного управления, определенную в главе 1. При этом ее решение выражается непосредственно в терминах параметров обратной связи и не включает неизвестную матрицу С, которая должна удовлетворять матричному неравенству (27).
Теорема 6 Пусть в системе (24) матрица А не имеет чисто мнимых собственных значений, а матрица В имеет максимальный ранг. Закон управления и = —6Тх с матрицей 9 такой, что пара (А, 9) - наблюдаема,
а матрица А = А — ВвТ - гурвнцева. является центральным робастным законом управления тогда и только тогда, когда для некоторого у ф О и всех и,' 6 (—ос. ос) имеет место частотное условие
IV]' (—гл) Я1Уи (/и,-) - т*КТ {-/о.') К М - V (-{иг) Ь (»и;) >
(29)
>
с:
где И\(р) задана в (10).
К (р) = Е\ (р1 - А)~х (В, Г) . X (р) = уЩ (Р1 - А)'1 [В.Г) . (30) и выполняется неравенство
тТАВ + ВТАТвВ + -)-2ВвТГГТ9Я-ВТ(9Н9Т-¿¿)В < 0 . (31)
В последнем параграфе этой главы установлено, что множество оптимальных робастных регуляторов для неопределенных стационарных систем (24), П (?) = П, которые при любых допустимых значениях неизвестных параметров О являются оптимальными по отношению к некоторому квадратичному функционалу с апостерпорно вычисляемой неотрицательно определенной весовой матрицей состояния, зависящей от П, определяется частотным условием
(ги) - 7*Кт(-ш) К(¡ш) | • (32)
В отсутствие неопределенности неравенство (32) переходит в условие возвратной разности Калмана (14). являющееся критерием оптимальности замкнутой номинальной системы. Таким образом, условие (32) распространяет решение обратной задачи оптимального управления для заданной системы на рассматриваемый класс неопределенных систем.
В третьей главе описанный выше подход применяется к синтезу абсолютно стабилизирующих регуляторов для нелинейных динамических систем, структурно представляемых в виде известной нелинейной или линейной динамической системы, в обратной связи которой находятся неизвестные нелинейные статические характеристики, принадлежащие
заданным секторам. Когда в прямом контуре находится линейная система. такие структуры известны как системы Лурье.
Рассматривается класс неопределенных систем, описываемых уравнениями
x = A(x) + B{x)u + F{x)<¡>(y,t) , y = L{x) , (33)
где х € Rm - состояние, и £ Rh - управляемый вход, у £ Л1 - выход, Л(0) = 0, ¿(0) = 0, Ф(у4) € R1 - неизвестная нелинейная непрерывная вектор-функция, <р (0, i) ~ 0, компоненты которой при всех t > 0 расположены в заданных секторах, приведенных заменой переменных к виду
0< Ф^У,Л) < 1 . г = 1,2,...,/, (34)
Vi
где y¡ - i-ая компонента вектора у. Предполагается, что система эволю-цпонпрует на открытом множестве А" С i?", содержащем начало координат. Задача состоит в нахождении абсолютно стабилизирующих законов управления вида обратной связи по состоянию
и = -в (х) , в (0) = 0 , (35)
при которых состояние равновесия т = 0 замкнутой системы (33), (35) является асимптотически устойчивым и для всех допустимых ó (у, t) выполняется
/ [G (х) + uTR (х) и] dt<V (х (0)) , (36)
о
где G (х) > 0, R{x) — RT {х) > 0, V {х) > 0.
Показано, что минимаксное управление системой
х = A(x) + B(x)u + F(x)v , y = L{x) , (37)
по отношению к функционалу вида
00
J (u, v) = ] [G (х) + uTR (х) и - 2игГ (v - j/)| dt , (38)
о
в котором G (х) > G (х) и Г = Над (71,72, • • •, 7/) > О» решает поставленную задачу.
Теорема 7 Пустпи существуют непрерывно-дифференцируемая положительно определенная функция Г (г) и скаляры *„■ > 0. < = 1.2...../
такие, что для всех .г ф 0 £ Л" имеет место неравенство Гамильтона-Якоби
д¥\Т кШ)
1 /дУ"т
1
1
А (г) + -Р НI (г) + в Н + -V (х) П И -
4 \д.с/ Тогда закон управления
В (х) л-' (г) Вт И - -Р (х) Г-'?' (х)
их
(39)
обеспечивает для системы (33) выполнение цели (36).
(40)
Установлено, что помимо закона управления (40). который назван центральным абсолютно стабилизирующим, поставленная цель достигается при законе управления (35). если для данной в (г) имеет место определенное неравенство относительно неизвестной функции V (х) > 0. Применяя подход, разработанный в первой главе для решения обратных минимаксных задач, сформулированные выше условия (39).(40) можно выразить непосредственно в терминах функции 9{х), тем самым исключая необходимость решения неравенств или уравнений для нахождения I7 (х).
Теорема 8 Стратегия и = —9{х), при которой управляемая система (37) с и = 0 имеет единственное глобально асимптотически устойчивое состояние равновесия х = 0. определяет центральный абсолютно стабилизирующий регулятор для системы (33) тогда и только тогда, когда при нулевых начальных условиях и любых допустимых стратегиях и (£) и V (¿), при которых Нт^^ х (/) = 0, по траектории системы
(37) дляТ = <Иад (71,72.____л) > 0 выполнено следующее интегральное
неравенство
ро
I (и + 9{х))Т П(х)(и + в(х)) Д> о
оо
> ] [в (х) + ит11 (х)и~ 2г.,ТГ (?' - у)} И .
Для системы Лурье
х = Ах+ Ви +Р&{уЛ) , 2/ = 1г.г
(42)
центральный абсолютно стабилизирующий регулятор, при котором для всех допустимых нелинепностеп выполняется
/ (хт(Эх + итПи) а < .г (0)т С г (0) .
(43)
где <Э = Ог > 0. Я = Кт > 0, имеет вид
и, = -ВГ1ВтСх . (44)
Здесь матрица С удовлетворяет неравенству
АТС + СА- С В Я'1 ВТС + д + ^(СТ + ЩТ~1 (СТ + £Г)Т<0 , (45)
которое представимо в виде лпнеиного матричного неравенства относительно матрицы Р = С-1
<0 ,
(46)
где А = А + д = С} + \LTl7.
В предположении, что начальные условия х (0) выбираются случайно с нулевым математическим ожиданием и единичной ковариационной матрицей, усреднение правой части целевого неравенства (43) приводит к 1гС - следу матрицы С - как усредненной характеристике качества переходного процесса. В диссертации доказано, что £г С является выпуклой функцией параметров 7?, I = 1,2,...,/, что позволяет проводить ее оптимизацию по этим параметрам.
Далее реализован другой путь построения абсолютно стабилизирующих регуляторов для систем Лурье, не требующий нахождения матрицы С. А именно, рассмотрение соответствующей обратной вариационной за-
о
дачи позволяет получить частотное условие
И7 (-ы) ДИ*и («*■) - 2йе ^ | ГЛ" (м) - (М >
>(в 0 ь
- \ О —2Г ) в котором И*и задана в (10).
К(р) = Ьт(р1-АГ1(В.Р) , С(р) = ^(р1-Лу1{В,Р) и неравенство
пвтлв + втлтвв+вт (д - отт) в+
+11/твя+Птв)т Г"1 (ГТ9В+птв) < о,
(48)
прп выполненпп которых и = —втх является центральным абсолютно стабилизирующим регулятором системы (42).
Для систем Лурье со стационарными нелинейными характеристиками показано, что рассмотренное выше множество абсолютно стабилизирующих законов управления может быть расширено включением 'минимаксных законов управления в дифференциальной игре для системы
х = Ах + Ви 4- Ру
и функционала
оо
] (и, V) = ] [ггд.г + и7Ей - 2г|ТГ (г- - у) + 2лГЛу] Л ,
о
в которой £}>С}, г = <11ад (7?, ...,7?) , Л = diag (Аь Л2...., А/) и
2Г - Л1ТГ - ГТ1А > 0 .
Функция Беллмана в этой игре является функцией Ляпунова в форме Лурье-Постникова
1 и
И' (х) = хтСх + 2 Ё А, / ф( (а) Жт '
<=1 о
для абсолютно устойчивой замкнутой системы.
Четвертая глава посвящена синтезу робастного II^ субоптпмаль-ного управления, обеспечивающего равномерное гашение внешних возмущений. Рассматриваются неопределенные системы вида
.i- = А (.г) + В (х) и + G (г) н- + F (.г) ?• .
(49)
в которых 1С - вектор внешнего возмущения, а вектор г соответствует неопределенности, имеющей следующую структуру
/ (2,
П2 (а-)«
V П3 а- )
где (хЛ). (' = 1.2,3 при всех х.1 удовлетворяют условиям
.^<1. ¡ = 1.2.3.
Требуется синтезировать обратную связь по состоянию, которая при нулевых начальных условиях и любых допустимых неопределенностях и внешних возмущениях обеспечивает для данного у ф 0 выполнение условия
f[Q(x) + uTR{x)u} dt о_
оо
j wTwdi
<12
(50)
raeQ(x)>OnR(x) = RT(x) >0.
Показано, что робастный Ноо субоптимальнып регулятор определяется минимаксным законом управления в дифференциальной игре между "управленцем" и п "возмущением" (J = [и-1. г,т). состоящим из внешнего возмущения w и неопределенности v, для системы (49) и целевого функционала
J(и.£) = J[Q+ (х) + uTR+ (х) и - fT+ (х) (\ dt,
где
<3+Н = (-Пх) + ^ЕТ{г)Е1{х) . В+(х) = Я(х)+^Е^{х)Е2(х) . (у21-^Е{(х)Е3(х) 0 \
\ 0 I
(31)
Теорема 9 Пусть существуют непрерывно-дифференцируемая положительно определенная функция (х) и ¿1 ф 0 такие, что для всех х ф О £ Л" имеет место у2 7 — р^Ё^ (х) Ез (х) > 0 и неравенство Гамильтона-Якоби
(ЩТ А (х) + (,) \В М Я+ (X) Вт (X) -
- С (х) (7У - рЩ{х) Ег (X))-1 С7 (х) - р->Е (х) (*)] ^ < 0 .
(52)
Тогда закон управления
и>(х) = -1-1Г+х{х)Вт{х)^- ' (53)
обеспечивает для неопределенной системы (49) выполнение цели (50).
В следующей теореме установлено, что закон управления (53), названный центральным робастным суболтпмальным законом управления, может быть определен непосредственно с помощью некоторого интегрального неравенства, не требуя прп этом нахождения решения неравенства (52).
Теорема 10 Стратегия и = —9 (г), при которой управляемая система (49) с и> = V 5 0 имеет единственное глобально асимптотически устойчивое состояние равновесия х = 0, является центральным робастным Нх субоптимальным законом управления для системы (49) тогда и только тогда, когда при нулевых начальных условиях и любых допустимых стратегиях и и ({) = [и,Т , ит (£)), при которых
ос-!' — 0. по траектории системы (49) выполнено следующее интегральное неравенство
X
](и+ен)Тя^(з') (и+в {.>-)) л>
<о
X
> / [(?+ (I) + (х) и - ?Т+ (х) {] л .
'о
Для линейной неопределенной системы
х = [А + ^П, (О Г,] * + [В + /-А» (*) Е2\ и + [О + Р30з (<) £у И' .
где П; (<)г (/)</./ = 1,2,3, центральное робастное #ос субоптнмаль-ное управление, при котором для нулевых начальных условий и произвольных допустимых неопределенностей имеет место
М1<7\ у = М,х+М2и,
где ||.|| обозначает норму в Ь2. = = 0 .= Я.
пмеет вид
и. = -Я~1ВТС+ х . Здесь С+ = С+ > 0 удовлетворяет неравенству
АТС+ 4- Сг+А - С+В (Л + 1*Ч$Е2)~1 ВгС++ +С+(?(72/- С7'С+ + + д + = 0 ,
в котором Л+ и Г+ > 0 определены аналогично тому, как п в (51). Доказано, что данная обратная связь и = —втх будет соответствовать вентральному На, субоптимальному регулятору, если при выполнении общих системных требований для некоторой С = Ст > 0 пмеет место следующее линейное матричное неравенство
(АтС + СА + д+-9Я+9т СВ-9Н+ Св СЕ \
{СВ-вЯ+)т -0 0 0
СТС 0 -(72/-,,2£3г£З) О
ГГС 0 0 -ц*1
или прл всех о.' б ( — х.эс). лля которых <1еГ (¡¿I — Л) ф 0. выполняется следующее частотное условие
(-/-;) (Ъ) -тг£(-и-)Ир(и-) > >(п+ 0
- I о -г+
где
Кги(г)=т(р).\У2(р),Ц'3(р)) ■ 1Г,0») = 1 + вт(р1-Лу[В , «а (Р) = 0Г (Р1 ~ А)~1 С , Из (;>) = вг (Р1 - АУ1 Р ,
В пятой главе приводятся решения обратных задач оптимального и минимаксного управлений для линейных дпскретных систем.
Теорема 11 Пусть для системы
х(+1 = Ах{ + Вщ ,
в которой пара (А,В) - управляема и с1е1 А ф 0, выбрана матрица в такая, что Ас = А — В9Т является устойчивой матрицей. Тогда закон управления гц =
•( будет оптимальным по отношению к функционалу вида
о
при некоторой С? > 0, если и только если Ки (0) > 0 и для всех и> € [0,2тг) выполнено следующее частотное условие
где
Ки{=) = 1 + 9Т{-~1-АГ1В
является матрицей возвратной разности выбранного закона управления.
Дуальной к этой задаче является обратная задача о наихудшем возмущении. в которой требуется выяснить условия, при которых возмущение вида Vf = С,тX) будет наихудшим для устойчивой системы
жт = Axt + Fvt
и функционала вида
J2(v) = t{xfQvXt-V?SvVt) , о
при некоторой Qr — Ql > 0. Доказано, что этими условиями являются неравенство И", (0) > 0 и частотное условие
W, (е~")Т Wv (О)"1 И; (ew) < -S, , Vjj € ¡0.2тг] ,
в которых
Обратная задача линейно-квадратичной динамической игры имеет следующее решение.
Теорема 12 Пусть для системы
xl+l = Axt +But+Fvt , t = 0,1,..., (54)
в которой по меньшей мере одна из пар {А, В) или (A,F) - управляема и det А ф 0, выбраны матрицы 9 и С такие, что Ас = А — В9Т + F(T является устойчивой матрицей и I — FTA~TC, > 0. Тогда стратегии
щ ~ -0Txt , vt = (TXi
будут соответственно минимаксным управлением и наихудшим возмущением для функционала вида
СО
J (и, v) = £ (xfQxt + ujut - -Afi'i) (55)
о
при некоторой Q > 0, если и только если для всех и € (0,27т) выполнено следующее частотное условие
где
Далее, для системы (54) введены понятия локально-наихудшего возмущения и локально-минимаксного управления по отношению к критерию ' >■■■-:■■-
Ф, = АЦ + и(гт/, - -^{г, ,
где - приращение за один шаг по траектории (54) некоторой положительно определенной функции V (х) = хтСх. Установлено, что млнн-максное управление для функционала (55). имеющее вид
и, = -в^х, , вi = вт (с-1 + ввт - Т2^)-1 а , где матрица с = ст > 0 удовлетворяет уравнению
д = с-лт (с-1 + ввт - 7-2*ттГ' а ,
всегда является локально-минимаксным для критерия с соответствующей матрицей С, тогда как обратное утверждение имеет место только при выполнении определенного частотного условия. В заключении этой главы показано, что для линейно-квадратичных задач множество обратных связей, отвечающих минимаксным законам управления, включено в множество устойчивых обратных связей, соответствующих оптимальным законам управления в отсутствие возмущений.
В шестой главе осуществляется синтез робастных, абсолютно стабилизирующих и робастных Дзо субоптимальных регуляторов для неопределенных дискретных систем. Для систем вида
хш = (А + Г^1^) I, + (В + Г2П12)Е2) и, , (56)
где П,(2) - матричные функции, соответствующие неизвестным параметрам, которые при всех < удовлетворяют условиям
< I ,:.,! — 1,2.,.
показано, что робастньш управлением, обеспечивающим при любых допустимых неопределенностях заданное качество переходного процесса
00
£ (¿'^ф'/ + и^Яи,) < j-QC.ro , (57)
о
является минимаксное управление в динамической игре для системы д(+1 = Ах, + Вщ + Р1н . Г = (Гь Г2)
п функционала
ос
■к (и, v) = £ 0,тф'( + и^ящ - -дд-,) -о
в котором ф >(?.(? = <5 +- у2Е1Е1. Я ~ Я +- ^Е^Еъ- А именно, имеет место следующая теорема.
Теорема 13 Если при некотором ■у ф О матрица С — СТ > 0 удовлетворяет неравенствам
АТ (С-1 + - 1~2ГЕт)~1 А - С + <9 < 0 (58)
и
72/ - > 0 , (59)
тогда закон управления
И? = , С = (С-1 + ВЯ~1ВГ - л
обеспечивает для системы (56) выполнение цели (57) при любых допустимых и Обратно, если закон управления вида и, = —вТх( обеспечивает выполнение указанной цели, то неравенство (58) при некотором 7 ф 0 имеет решение С = СТ > 0, для которого выполняется (59).
Кроме того, установлено, что множество робастных законов управления, решающих поставленную выше задачу, составляют обратные связи
1/1 = —Отх,. для которых при нскоторо11 С > 0 выполняется линейное матричное неравенство
(Л1СЛв-С + 0 0 ЛтпСГ х
9Т -Я"1 О
у, Г7СЛ9 0 - (уЧ - Г'СТ) )
где Ао — Л- Ввт.
Для управляемой системы Лурье
< О
г(+1 = Ах, + Ви, + Г6, {у,) . у, = 1/х,
(60)
где о/ (у/) £ й'- нелинейная непрерывная вектор-функппя гу( и t. о, (0) = 0. каждая компонента которой для всех / = 0.1____расположена в секторе
№ (Л
0<
рассматривается задача синтеза абсолютно стабилизирующих регуляторов. обеспечпвающпх выполнение пелп (57). Как и в случае робастных регуляторов, решение этой задачи получено путем рассмотрения динамической игры, описываемой уравнением
г 1+1 = Ах, + Ви, -г Ег, ,
1 т
где А = А + . с целевым функционалом
х1 (я + I, + а?Яи, - 2г',Т1>,
в котором €}>(}.
Теорема 14 Если при некоторой Г = (Над (тЬт!.....")?) > 0 матрица
С = СТ > 0 удовлетворяет неравенству
2Г - ГгСГ > 0
(61)
и неравенству
Ат(С-1+ВЦ-1Вт-1ГТ-'Г^ 1 А-С + СЭ + ^ЬГЬ7 <0 , (62)
тогда закон управления
и, = ~в1.г, . 01 = Я~1ВТ (с~1 + ВЕ~1ВТ- ^ГГ"1^ ' Л (63)
является абсолютно стабилизирующим, который обеспечивает для системы (60) выполнение цели (57).
В случае одной нелинейной характеристики (1 = 1). выполнение (62) и (61) для некоторых С = Сг > 0 м Г = является не только достаточным. но и необходимым условием для существования абсолютно стабилизирующего регулятора вида = —
Законы управления (СЗ) ве исчерпывают множество всех линейных обратных связей, решающих поставленную задачу. В это множество входят обратные связи и = — для которых при некоторой С > 0 выполняется лпнейное матричное неравенство
/ Л1СЛ9 - С + £ 9 АТвСГ
вт -Я"1 О
к ГтСАв 0 - (2Г - ГтСТ)
<0,
где А«-А- В9Т.
В последнем параграфе этой главы рассмотрена задача синтеза Я<» субоптпмального управления для неопределенных дискретных систем. Ее решению предшествует рассмотрение следующей задачи динамической игры для неопределенной системы, которая представляет и самостоятельный интерес.
Пусть уравнение неопределенной системы представлено в виде х1+1 = (А + ЛПГ'Я) хг + [В + щ + (р + Г3П,(3)£з) ^ , (64)
где щ £ Д* - управление, «;г £ И1 - возмущение, г = 1,2,3 - матричные функции, соответствующие неизвестным параметрам, которые при всех t удовлетворяют условиям ,
П{°ГП{0</, ¿ = 1,2,3.
\
Целевой функционал, который должен быть мпнюшчпрован управлением п максимизирован возмущением, имеет вид
.7 (u. w) = £ (.rfor, + «fi?;/, - -,Vnv) . и
Задача состоит в нахождении робастно-мпшшаксноп стратегии вида и* = ~0Т.Г/. прп которой для всех допустимых Qj'1 выполняется
шах .7 (u*. w) < /¡¡С.
п робастно-макспмпннон стратепш вида !г(* = . при которой для всех допустимых fij1' выполняется
min J(u.w*) > .гцС-Л'о ,
где С_ - некоторые симметрические положительно определенные матрицы и i'o - начальные условия.
Решение этой задачи получено на основе решений двух вспомогательных динамических пгр для полностью определенных систем, в одной из которых "неопределенность" играет на стороне возмещения, а в другой - на стороне управления. Первая игра между и и £ определяется уравнением
х,+1 = Д.г(-|-£и,+(<?..ГК, (65)
и функционалом
j+ (и. С) = t + "ГЯ+«< - , (66)
о
в которых все матрппы - такпе же. как п в (64). F = (F\. F2.F3) и Q+ =Q+fi2E(E1 . R+ = B + SEtE2, Г+ = ( ^ ~ .
fi ф 0 - некоторый параметр. Вторая пгра между г/ ц w определяется уравнением
x,+i = Axt + {В. F) Tjt + Gw, (6?)
и функционалом
j- Oh = t {-rjQ-Jf + vJS-Ч, - wjD.wt) (68)
о
в которых
Q- — Q - p'EÏE: . D. « + /.»tfE, • s- = ( Л - "lEÎEi Д ) .
Теорема 15 Минимаксное управление в игре (65). (66) с Г+ > О
и, = -я~]вт [с;1 + вл~1вт - (G.F) г;1 (G.F)T]_1 Аг, . (69)
где С'+ = Cj > О - стабилизирующее решение уравнения
АТ [С;1 + Ш?;'ВТ - (G. F) Г;1 (С,F)7]"' А - С++ -fÇ+^FfF^O.
¿W которого
Г+ - [G.F)TС+ (G.F) > 0 .
является робастно-минимаксным управлением для системы (64). Наихудшее возмущение в игре (67). (68) с Q- > 0 и 5_ > О
wt = DZ]GT |ci' 4- (В,F) Si1 (В, F)T — G-Dl'Grj~l . где С- — CT > 0 - стабилизирующее решение уравнения
АТ [Сг1 + (В, F) SZ1 (В. F)T - GDzlGTyi А - С_+ . +Q - p?EyEi = О ,
для которого
- GTC-G > 0 .
является робастно-максиминным возмущением для системы (64).
Возвращаясь к -исходной задаче робастного Нх суболтпмального управления. показано, что рассмотренное выше робастно-шшпмаксное управление при нулевых начальных условиях л произвольных допустимых неопределенностях обеспечивает выполнение пелп
М^<72. Vt = M\xt + Miut ,
IMI2
где ||.|j обозначает норму в 12. а MjMy = Q .MjM2 = О .М'.[М2 = В. Это значит, что (69) определяет робастный #х-суС>оптпмальнын закон управления, прп котором для любой допустимой неопределенности отношение нормы выходного сигнала системы к норме возмущения оказывается ограниченным уровнем 7. Кроме того, показано, что найденная выше стратегия не является единственно возможной н что множество линейных обратных связей, также решающих поставленную задачу, характеризуется в терминах линейных матричных неравенств.
Седьмая глава посвящена адаптивному управлению, основанному на рекуррентной идентификации методом наименьших квадратов (МНК). Сложность этой проблемы, как было отмечено выше, заключается в вырождении информационной матрицы прп одновременном осуществлении идентификации и управления. В диссертации показано, что для синтеза адаптивного управления, основанного на идентификации, не требуется обеспечивать состоятельность опенок в системе. В том случае, когда параметры регулятора являются некоторыми специфичными функциями текущих оценок, этот синтез может быть осуществлен на основе чистого МНК без введения каких-либо дополнительных сигналов. Это утверждение основывается на проведенном в диссертации исследовании динамики оценок МНК прп невыполнении условий теоремы Гаусса-Маркова.
Пусть данные удовлетворяют линейной регрессии
, (70)
где \(+1 - измеряемый выход, Ф/ - вектор регрессоров. П, - вектор неизвестных параметров. $ - белый шум с нулевым средним и дисперсией а1. Согласно теоремы Гаусса-Маркова оценка МНК. определяемая рекур-рентно
пм = nt + лтМ* (xt+i - fif Ф< ) • "
с произвольными начальными условиями По и > 0, будет состоятельной в среднеквадратическом смысле, если и только если последовательность минимальных собственных чисел матриц i?j неограниченно возрастает, т.е.
lim. Xmin(Rt) =00 . ' (72)
В диссертации установлено, что прп невыполнении этого условия пространство оценок можно разложить в прямую сумму трех ортогональных подпространств
В" sPieft* Р3 ■
где непдентпфпкационное подпространство
П = {я : lim ат £ <$>&fn = 0} , ,~*ос i=fl
частично-идентификационное подпространство
?2 = {а 6 Рп : 0 < lim ат]Г ф,ф[а < ос}
<=о
п идентификационное подпространство Р\ - ортогональное дополнение к прямой сумме первых двух подпространств. При этом оказывается, что проекция оценки на идентификационное подпространство всегда является состоятельной, а проекция ошибки оценки на ортогональное к нему дополнение имеет конечную дисперсию. Причем в отличие от проекции оценки на частично-идентификационное подпространство, в формировании которой используются результаты измерений, проекция оценки на непдентпфпкационное подпространство определяется только начальными условиями алгоритма идентификации. Кроме того установлено, что при этом для любых равномерно ограниченных регрессоров пмеет место
gaEixt+i-tifbfszo2 , (73)
т.е. ошибка прогноза выхода стремится к своему минимальному значению, даже если условие (72) теоремы Гаусса-Маркова не выполняется.
В частности, если условие (72) выполняется, тогда идентификационное подпространство совпадает со всем пространством п оценка является состоятельной.
Теперь, при управлении неизвестным объектом ошибка слежения между его выходом и заданной эталонной траекторией ei+i = j/(+i - у<*+1 может быть представлена в виде
ем = (ум - П?*,) + (ПJ*t - Ум) ■
гласно (73). если Ф/ остается ограниченным, а управление выбирается условия
= ?/;+! • (74)
ошибка слежения будет стремится к минимально возможной, несмотря то. что опенка, вообше говоря, не будет сходится к П». Так как прп ом регрессионный вектор представим в виде
= {Ф;т,Ф;;) , Ф;=07 (П()Ф; . (75)
е регрессор Ф" отвечает управлению, определяемому согласно выбран-го закона правления в виде линейной функции остальных регрессоров юктором параметров в (О/), то условле (74) будет выполняться для
0(0,) = -ДОГ1 (76)
е = (Пчто соответствует локально-оптимальному закону равлення, минимизирующему приращение целевой функции 1'( — е'{. Для дет ермпнпр ов анн о го минимально-фазового объекта доказано, что 'П соответствующем адаптивном локально-оптимальном законе упра-енпя имеет место
Бт -у*м) = 0 • Ит (и, - и*) =0 ,
е и*( - локально-оптимальный закон управления истинным объектом, и ли, кроме того, размерность эталонной траектории превышает 2т, где - размерность фазового пространства, параметры 0(П<) стремятся к тинным значениям 9 (Пф).
В случае стохастических регрессоров в (70), которые могут зависеть от текущей оценки, с помощью метода усреднения получены дпффе-нциальные уравнения медленных движений при идентификации МНК, гекоцие вид
н п > (7?)
Л = р2 (П) ,
;е матрица Р\ (П) является предельной ковариационной матрицей век->ра регрессоров, полученной прп = П. При идентификации в замкну->м контуре управления с вектором регрессоров вида (75) уравнения (77) геют интегральное многообразие, во всех , точках которого дисперсия
ошибки прогноза принимает минимально возможное значение. Показано, что функция в (П), заданная в (76). инвариантна на этом интегральном многообразии, т.е. для всех его точек выполняется в (££) =
В соответствии с этим для линейного стохастического объекта т-го порядка адаптивное локально-оптимальное управление имеет вид
где
и, = , 0, = - (П})~' П" , <р[ = (й-ш+1, • • • УиУ*1-т+1 • • • • Уп У1+1! «<-т+1 •
■ И<-1)
а оценка неизвестного вектора Г?,, который состоит пз коэффициентов числителя г-1/?« (~-1) и знаменателя о* (г"1) передаточной функции объекта, а также пз коэффициентов характеристического полинома Л/ фильтра Винера-Калмана, вычисляется в соответствии с уравнением
С21+1 = П, + ДГ+,Ф( (г/(+1 - Й+О Д,+х = Я, + Ф,Ф,Т ,
в котором Ф(Г — м().
Показано, что для этой адаптивной системы дифференциальные уравнения (77) принимают вид
П = -Я^П"
I
Я =
(78)
п имеют одномерное интегральное многообразие
М \ (П )-1 И" — Я'^, во всех точках которого параметры адаптив-
ного регулятора принимают значения, совпадающие с соответствующими значениями параметров локально-оптимального закона управления для неизвестного объекта. Линеаризация уравнений (78) в окрестности многообразия М обнаруживает, что состояния П 6 М, для которых
Sign [iV'/il") > 0 являются устойчивыми, а состояния ii G M. для которых Sign (Q"/Q"} < 0. являются неустойчивыми. Глобальное поведение решений системы (78) в области устойчивости замкнутой системы выясняется в следующей теореме.
Теорема 16 Пусть выполнены следующие предположения:
А1. П, € Аг .
А2. Ilr [AJ1 (f'*") - 5] > 0. V*- € [0.2зг) .
A3. а% (с-1) и -Л ■ несократимы.
А4. о, (--1) ф Л/ (:"').
А 5. dim {у*} > т .
Тогда для любого решения (78). лежащего ь Dq. выполняется
' иш (ir (or1 n" (t) =
Приводятся результаты математического моделирования, подтверждающие, что в адаптивных локально-оптимальных системах управления. несмотря на отсутствие идентифицируемости оцениваемых параметров объекта, происходит идентификация параметров требуемого локально-оптимального регулятора и. тем самым, решается задача управления.
В заключении формулируются основные результаты дпссертаипп.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Коган М.М. Решение обратных задач о наихудшем возмущении и минимаксном управлении для линейных непрерывных систем // Автоматика и телемеханика. 1997. N 4. С. 22-30.
2. Коган М.М. Синтез минимаксного управления неопределенной системой на основе решения обратной вариационной задачи // Дифференциальные уравнения. 1997. Т. 33. N 8. С.1141-1142.
3. Коган М.М. Локально-минимаксное и минимаксное управления линейными дискретными системами // Автоматика и телемеханика. 1997. N 11. С. 33-44.
4. Коган М.М. Решение обратных задач минимаксного и мпнимаксно-робастного управлений // Автоматика и телемеханика. 1998. N 3. С. 87-97.
о. Коган М.М. Решение некоторых обратных вариационных задач для нелинейных спстем управления // Вестннк ННГУ. Математическое моделирование п оптимальное управлеште./Под ред. Р.Г.Стронгпна - Н.Новгород: йзд-во Нижегородского ун-та. 1998. N 1(18). С.161-177.
6. Коган М.М. Когда линейная система управления является минимаксной? Доклады РАН. 1998. Т. ЗСО. N 2. С. 179-181.
7. Коган М.М. Теоретико-игровой подход к синтезу робастных регуляторов // Автоматика и телемеханика. 1998. N 5. С. 142-151.
8. Коган М.М. Оптимальные робастные законы управления линейными непрерывными системами. Доклады РАН. 1998. Т. ЗС2.. Л.
9. Коган М.М. Решение обратных задач минимаксного и Я» субоптп-мального управлений для линейных непрерывных спстем // Тезисы докладов IV Международного семинара " Устойчивость и колебания нелинейных систем управления''. Москва. ИПУ РАН. 1996. С.113.
10. Коган М.М. О построении функций Ляпунова и абсолютно стабилизирующих регуляторов для спстем Лурье методами теории дифференциальных игр // Тезисы докладов V Международного семинара "Устойчивость н колебания нелинейных спстем управления". Москва. ИПУ РАН, 1998. С.53.
11. Коган М.М., Неймарк Ю.И. Адаптивное локально-оптимальное управление // Автоматика и телемеханика. 1987. X 8. С.126-136.
12. Коган М.М., Неймарк Ю.И. Исследование идентифицируемости в адаптивных системах управления методом усреднения // Автоматика и телемеханика. 1989. N 3. С.108-116.
13. Коган М.М., Неймарк Ю.И. Идентифицируемость локально-оптимальных адаптивных законов управления при косвенных наблюдениях // Автоматика и телемеханика. 1990. N 1. С.65-75.
14. Коган М.М., Неймарк Ю.И. Об оптимальности локально-оптимальных решений линейно-квадратичных задач управления и фильтрации // Автоматика и телемеханика. 1992. N 4. С.101-110.
15. Коган М.М.. Неймарк Ю.И. Адаптивное управление стохастическим объектом с непзмеряомым состоянием в условиях непдонти-фппируемости // Автоматика п телемеханика. 1992. N 6. С.114-122.
16. Коган М.М., Неймарк Ю.И. Идентификация рекуррентным методом наименьших квадратов при невыполнении условии теоремы Гаусса-Маркова // Известия РАН. Техническая кибернетика. 1993. К 4. С. 29-34.
17. Коган М.М., Неймарк Ю.И. Локально-оптимальное адаптивное управление линейным стохастическим объектом с непзмеряемым состоянием // Известия РАН. Техническая кибернетика. 1993. N G. С. 48-53. '
18. Коган М.М., Неймарк Ю.И. Функциональные возможности адаптивного локально-оптимального управления // Автоматика и телемеханика. 1994. N 6. С. 94-105.
19. Kogan М.М. and Ju.I.Neimark. Locally-optimal adaptive control without persistent excitation // Preprints of 12th World Congress IFAC. Sydney. 1993. V. 2. P.71-77.
20. Kogan M.M. and Ju.I.Neimark. Estimating the locally-optimal control in closed-loop adaptive systems // Preprints of 10th IFAC Symposium on System Identification, Copenhagen. 1994. V. 3. P. 543-548.
21. Kogan M.M. and Ju.I.Neimark. The attracting manifold of slow identification in adaptive control systems // Proceedings of the 33rd IEEE Conference on Decision and Control. Lake Buena Vista. USA. 1994. V. 3. P.2201-2202.
22. Kogan M.M. and Ju.I.Neimark. A family of multistep locally-optimal controls // Proceedings of the third European Control Conference, Rome. 1995. V. 4. Part 2. P.3616-3619.
23. Kogan M.M. and Ju.I. Neimark. Locally optimal adaptive control without persistent excitation // Automatica (The Journal of the International Federation on Automatic Control). Pergamon Press. 1996. V. 32. No 10. P.1463-1467.
'24. Kogan M.M. A local approach to the inverse minimax control problem for discretertime systems // Proc. of 1st Conference on Control of Oscillations and Chaos, St.Petersburg.. 1997. P.88-91.
25. Kogan M.M, On ininimaxity criteria of a linear regulator for known and uncertain systems // Proceedings of 4 European Control Conference. Brussels. 1997.
26. Kogan M.M. A local approach to solving the inverse niinimax control problem for discretertime systems // International Journal of Control. 1997. V. 68. No 6. P.1437-1448.
27. Kogan M.M. Solution to the inverse problem of minimax control and worst case disturbance for linear continuous-time systems // IEEE Transactions on Automatic Control. 1998. V. 43. No 5. P.670-674.
28. Kogan M.M. On inverse problems of minimax control and worst case disturbance for affine nonlinear systems // Proc. of IFAC Simposium on Nonlinear Control Systems Design, Enschede, The Netherlands. 1998.
Нижегородский государственный архитектурно-строительный университет, 603600. Н.Новгород, Ильинская, 65.
Подписано в печать 18.09.98. Бумага газетная. Формат 60x90 1/16. Печать офсетная. Объем 2.5 печ.л. Тираж 100 экз. Заказ N /37
Полиграфический центр ННГАСУ, 603600, Н.Новгород, Ильинская, 65.
Текст работы Коган, Марк Михайлович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
fà 0% X1 9Í
DÍái/'o J
Министерство ^бщсто и профессионального образования / Российской Федерации
Нижегородский архитектурно-строительный университет
На правах рукописи
УДК 681-51
Коган Марк Михайлович
СИНТЕЗ УПРАВЛЕНИЯ НЕОПРЕДЕЛЕННЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ НА ОСНОВЕ ПРЯМОЙ И ОБРАТНОЙ МИНИМАКСНЫХ ЗАДАЧ
Диссертация на соискание ученой степени доктора физико-математических наук (специальность 05.13.01 - управление в технических системах)
Нижний Новгород - 1998
Содержание
Введение 5
Глава 1. Решение обратных задач минимаксного управления непрерывными системами 19
1.1 Обратные задачи дифференциальной игры для линейных систем.............................................19
1.1.1 Обратная задача наихудшего возмущения............19
1.1.2 Обратная задача минимаксного управления и наихудшего возмущения ....................................24
1.2 Обратная задача минимаксного управления..................31
1.3 Обратные задачи дифференциальной игры для нелинейных аффинных систем................................................37
1.3.1 Предварительные сведения о дифференциальных играх для нелинейных систем . .......................37
1.3.2 Прямая и обратная задачи наихудшего возмущения . 40
1.3.3 Обратная задача дифференциальной игры............44
1.3.4 Обратная задача минимаксного управления..........47
Глава 2. Синтез робастных регуляторов 51
2.1 Теоретико-игровой подход к синтезу робастных регуляторов 51
2.2 Частотные условия робастного управления....................56
2.3 Оптимальные робастные законы управления................62
2.4 Робастные законы управления нелинейными системами . 66
2.4.1 Синтез в пространстве состояний ....................66
2.4.2 Интегральные неравенства для робастных регуляторов ......................................................70
Глава 3. Синтез абсолютно стабилизирующих регуляторов для нелинейных систем Лурье 74
3.1 Квадратичная функция Ляпунова..............................74
3.1.1 Синтез регуляторов в пространстве состояний ... 74
3.1.2 Частотные условия для абсолютно стабилизирующих регуляторов..........................................83
3.2 Функция Ляпунова в форме Лурье-Постникова..............88
3.3 Нелинейные системы с нелинейными статическими характеристиками ......................................................94
Глава 4. Синтез минимаксного и .Н^-оптимального управлений в условиях неопределенности 101
4.1 Линейно-квадратичная дифференциальная игра с неопределенной системой........................101
4.2 Частотные условия робастно-минимаксного управления . .110
4.3 Робастно-минимаксное управление для нелинейных систем 113 4.3.1 Дифференциальная игра с неопределенной системой 113
4.3.2 Интегральные неравенства для робастно-минимаксного управления........................121
Глава 5. Решение обратных задач оптимального и минимаксного управлений для линейных дискретных систем 125
5.1 Обратная задача оптимального управления.........125
5.2 Локально-минимаксное и минимаксное управления.....129
5.2.1 Локальный подход к синтезу минимаксного управления .............................129
5.2.2 Прямая и обратная задачи наихудшего возмущения . 134
5.2.3 Когда локально-минимаксное управление будет ми-
нимаксным ........................140
5.3 Обратная задача минимаксного управления и наихудшего
возмущения............................144
Глава 6. Синтез робастных и абсолютно стабилизирующих регуляторов для дискретных систем 151
6.1 Синтез робастных регз^ляторов................151
6.2 Синтез абсолютно стабилизирующих регуляторов.....156
6.3 Синтез робастно-минимаксных регуляторов.........160
Глава 7. Адаптивное локально оптимальное управление 169
7.1 Идентификация методом наименьших квадратов при невыполнении условий теоремы Гаусса-Маркова........169
7.2 Идентифицируемость локально-оптимального закона управления ...............................175
7.3 Локальное-оптимальное управление в условиях неопределенности .............................179
7.3.1 Детерминированный случай..............179
7.3.2 Стохастический случай.................185
7.4 Результаты численного моделирования............191
Заключение 202
Список литературы 204
Введение
В своем развитии теория управления проходила несколько этапов, среди которых можно условно выделить следующие: классическая теория устойчивости и автоматического регулирования, теория оптимальных систем управления, теория стохастических систем управления и современный этап - теория адаптивного и робастного управлений. Возникновение последнего связано с необходимостью управления сложными техническими объектами, меняющимися в процессе функционирования в изменяющейся со временем среде, получение точных математических моделей которых представляется весьма проблематичным. Отсутствие точной математической модели объекта препятствует нахождению закона управления, обеспечивающего устойчивость и оптимальность. В этих условиях естественно желание преодолеть "узкую специализацию" стратегии управления и сделать ее более универсальной по отношению к объектам и возмущениям, что и привело к появлению теорий адаптивного и робастного управлений.
Исходным в теории робастного управления является стремление к обеспечению устойчивости не только заданной (номинальной) системы управления, но и всех не очень отличных от нее в определенном смысле систем. В отличие от классической теории автоматического регулирования, в теории робастного управления цель должна достигаться не только для данного объекта, а для целого класса объектов и возмущений, выделяемых на основе априорной информации.
Теория адаптивного управления - это теория систем управления, которые благодаря самонастройке и обучению меняют свою стратегию, стремясь приблизить ее к оптимальной, причем делают они это асимптотически точно, если объект перестает меняться, и, следовательно, достаточно точно, если объект меняется медленно.
Работы Лурье, Айзермана, Попова, Якубовича, Калмана, Лефшеца, Ла-Салля стимулировали большой интерес к теории устойчивости, во-
обще, и к методам Ляпунова и проблеме абсолютной устойчивости, в частности. К этому добавилось понимание принципа динамического программирования Беллмана и достижения в стохастическом оценивании, связанные с фильтром Калмана-Бьюси. Тесная связь, которая существует между идентификацией и управлением, и дуальная роль управления были вскрыты Фельдбаумом.
В конце 70-х параллельно с развитием теории адаптивного управления стала развиваться теория робастного управления. В работе Харитонова [72] было показано, что для выяснения устойчивости класса линейных дифференциальных уравнений произвольного порядка, параметры которых принимают значения в заданных интервалах, достаточно проверить устойчивость только четырех полиномов. Эта работа через некоторое время вызвала экспоненциально растущий поток публикаций [168], [183], [98], [95], [93], [13], [75], не прекращающийся по настоящее время [83], [94], [51], [161], [7], [180]. В работах Цыпкина и Поляка [58], [59] были получены частотные критерии робастной устойчивости и апериодичности линейных систем. Впоследствие, Неймарк [48], [49], [50] показал, что рассмотрение проблемы робастной устойчивости с позиции D-разбиения позволяет определить меру робастной устойчивости и применить алгоритмы оптимизации для ее вычисления.
Синтез робастного управления для различных классов неопределенных объектов во многом опирается на метод функций Ляпунова [46], [105], [92], [171], [82], [181], [ИЗ], [118], [119], [84]. Так, для неопределенных линейных систем с ограниченными по норме неизвестными нестационарными параметрами были введены понятия квадратичной устойчивости и квадратичной стабилизируемости [158], [159], [5], в соответствии с которыми осуществляется поиск линейного стационарного закона управления и квадратичной функции, являющейся при этом управлении функцией Ляпунова для произвольной системы рассматриваемого класса, а также понятие оптимального гарантированного управления [97], [160], обеспе-
чивающего определенный уровень показателя качества при любой допустимой неопределенности. В связи с развитием теории Д^о-оптимального управления [110], [108], [57], [4], [144] появился ряд работ [127], [177], [178], [184], [104], в которых устанавлена связь между Н^ управлением и ро-бастной стабилизацией неопределенных линейных систем. Применение этих методов предполагает нахождение положительно определенного решения матричного уравнения типа Лурье-Риккати, по которому и определяются параметры обратной связи.
Подходы к синтезу робастного управления, ориентированные на задание неопределенных объектов передаточными матрицами с аддитивными, мультипликативными или дробно-рациональными возмущениями развиваются в [174], [143], [114], [144], [101], [91], [53].
Для систем Лурье, которые наряду с линейными блоками содержат неизвестные нелинейные характеристики, принадлежащие заданным секторам, анализ устойчивости состояния равновесия, как хорошо известно, основан на построении функции Ляпунова квадратичного вида или в форме Лурье-Постникова [43], [44], [2]. Частотные условия, полученные в работах [78], [60], [61], [81], [8], [10], гарантируют существование функции Ляпунова соответствующего вида и, тем самым, глобальную асимптотическую устойчивость состояния равновесия при любой допустимой нелинейной характеристики или, другими словами, абсолютную устойчивость. В [71], [176], [182], [6], [52], [65], [100], [157] методы абсолютной устойчивости развиты для стохастических систем и для дискретных систем со случайными параметрами и структурой.
В последнее время проблема абсолютной стабилизируемости, т.е. существования регуляторов, при которых замкнутая система Лурье является абсолютно устойчивой, обсуждается с позиций теории #оо оптимального управления. В частности, в [163] условия абсолютной стабилизируемости были сформулированы в терминах решений пары матричных уравнений, характерных для задачи Яос-оптимального управления, а в [9] эти
условия выражаются в виде частотного неравенства, включающего решение матричного уравнения для задачи Н^ - оптимального управления. В [162], [151], основываясь на работе [80], показано, как сложная система может быть описана, используя так называемые интегрально квадрати-ческие ограничения, и представлены условия устойчивости такого рода систем.
Что касается робастного управления нелинейными неопределенными объектами, то первые результаты в этом направлении были получены на основе так называемой теоремы о малом коэффициенте роста [185], [12]. В последнее десятилетие был сделан значительный прогресс ъ развитии геометрической теории нелинейных систем управления [121], [126]. Вместе с теорией устойчивости Ляпунова она составляет основу для синтеза робастного управления. Вопросы управления и оценивания в неопределенных нелинейных системах изучались в [42], [76], [35], [16]. Управляемость, наблюдаемость и условия существования функции Ляпунова при соответствующем законе управления для различных классов нелинейных систем управления даны в [175], [88], [170], [11], [40], [15], [172], [106], [107], в работах [138], [111] изучаются итеративные процедуры построения функции Ляпунова, а в [165], [166], [156], [179], [150] для некоторых классов систем со структурированной неопределенностью результаты получены на основе теории Н^ оптимального управления для нелинейных систем [164], [122], [90], [123], [149].
Следует отметить, что в работах этого направления результаты, как правило, формулируются в терминах существования положительно определенного решения уравнений/неравенств Гамильтона-Якобп, что представляет проблему при реализации предлагаемых законов управления. Таким образом, при синтезе робастного управления различными классами линейных и нелинейных неопределенных объектов, остается актуальной разработка регулярных методов, по возможности не требующих непосредственного решения нелинейных дифференциальных урав-
нений/неравенств Гамильтона-Якоби или нелинейных матричных уравнений/неравенств Лурье-Риккати.
Исследования в области адаптивного управления проводились в различных направлениях, среди которых можно выделить такие как адаптация параметров, модели теории чувствительности и методы, основанные на теории устойчивости Ляпунова. Потребовалось значительное время на осознание того факта, что методы синтеза адаптивного управления, основанного на функциях Ляпунова, состоят в получении таких дифференциальных или разностных уравнений, описывающих динамику настраиваемых параметров или оценок, которые в дополнении к уравнениям объекта обеспечивают устойчивость полной системы.
В конце 60-х появилась монография Цыпкина [73], в которой было показано, что многие адаптивные и обучающиеся схемы могут быть описаны в рамках алгоритмов стохастической аппроксимации. В этот период также были получены результаты по сходимости самонастраивающихся регуляторов и по адаптивным наблюдателям. Получил развитие синтез адаптивного управления на основе алгоритмов идентификации типа метода наименьших квадратов [89], [115] и конечно-сходящихся алгоритмов решения рекуррентных целевых неравенств [79], [66], [67], [64], а также синтез адаптивного управления по скорости убывания функции Ляпунова [47], [68], [69], [27], который впоследствии стал известен как метод скоростного градиента [70].
В конце 70-х появилось понимание того, что для адаптивных законов управления, основанных на методе Ляпунова, характерным является то обстоятельство, что производная или приращение функции Ляпунова полной системы, включающей фазовые переменные объекта и настраиваемые параметры или оценки, является только неположительной, а не отрицательно определенной как это требуется для экспоненциальной устойчивости. Это привело к развитию различных методов, обеспечивающих робастностъ адаптивных систем по отношению к внешним и внутренним
возмущениям [139], [120], [154], [147].
В последние десятилетия произошел значительный прогресс в теории адаптивного управления. Об этом можно судить, например, по монографиям [54], [146], [109], [66], [63], [74], [117], [87], [70], [140]. Вместе с тем, из-за существенной нелинейности и многомерности уравнений адаптивных систем управления многие фундаментальные теоретические проблемы остаются еще нерешенными. Одной из наиболее значимых из них является сходимость самонастраивающихся регуляторов, основанных на рекуррентом оценивании методом наименьших квадратов (МНК). Сложность этой задачи заключается в следующем. Если старший коэффициент числителя передаточной функции объекта является неизвестным, тогда текущее управление должно входить в регрессионный вектор в качестве одной из его компонент. Однако, выбор закона управления в виде линейной обратной связи от остальных регрессоров приводит в таком случае к нарушению так называемого условия неисчезающего возбуждения, обеспечивающего в соответствии с классической теоремой Гаусса-Маркова невырожденность информационной матрицы и сходимость оценок к их истинным значениям.
Для преодоления этой трудности обычно применяют внешние сигналы или модифицируют алгоритм МНК так, чтобы, дополнительно возбуждая систему, обеспечить состоятельное оценивание. В [167], [41], например, это достигается путем усложнения алгоритма МНК, в [3] для этого применялся регулятор переменной структуры, в [67], [102], [145], [103] это происходит за счет введения дополнительных шумов, в [86] -вследствие разнообразности эталонной траектории, а в [87] - путем обогащения опорных сигналов. Вместе с тем, как отмечалось многими авторами. указанные меры значительно усложняют синтез и анализ адаптивной системы и, что, наверное, самое существенное, могз^т приходить в противоречие с целями управления. Что касается адаптивных регуляторов, в которых не обеспечивается состоятельное оценивание, то в [116], [152],
[141] была доказана асимптотическая оптимальность регулятора, использующего алгоритм стохастической аппроксимации. Для стохастических объектов в [45], [14], [148], [142], [173], [169] поведение алгоритмов адаптации изучалось методом усреднения. Отметим, что в этих работах не рассматривалось поведение оценок в случае, когда возбуждение является неполным. Таким образом, при изучении адаптивного управления, основанного на идентификации, важно выяснить, что происходит с оценками при невыполнении условий неисчезающего возбуждения.
В диссертации развивается новый подход к синтезу робастного управления неопределенными динамическими объектами, основанный на применении теории дифференциальных игр и решении обратных минимаксных задач, а также синтезируется адаптивное управление классами линейных дискретных стохастических объектов, использующее идентификацию рекуррентным методом наименьших квадратов и не требующее идентифицируемости неизвестных параметров.
Синтез робастного управления осуществляется для следующих классов неопределенных объектов:
• аффинных по входам нелинейных непрерывных систем, уравнения которых включают неизвестные функции, удовлетворяющие квадратичным неравенствам;
• непрерывных и дискретных нелинейных систем Лурье, включающих линейную систему и неизвестные статические нелинейные характеристики, при
-
Похожие работы
- Минимаксное параметрическое оценивание в линейных обобщенных неопределенно-стохастических регрессионных моделях
- Методы минимаксного оценивания в многомерных линейных моделях наблюдения при наличии геометрических ограничений на моментные характеристики
- Методы робастной оптимизации стратегий в линейных стохастических моделях
- Алгоритмы оптимального оценивания в стохастических системах в условиях априорной неопределенности
- Минимаксные оценивание и оптимизация параметров стохастических систем по вероятностным критериям
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность