автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Метод инвариантных эллипсоидов для подавления ограниченных внешних возмущений в линейных системах управления
Автореферат диссертации по теме "Метод инвариантных эллипсоидов для подавления ограниченных внешних возмущений в линейных системах управления"
УЧРЕЖДЕНИЕ РОССИЙСКОЙ АКАДЕМИИ НАУК ИНСТИТУТ ПРОБЛЕМ УПРАВЛЕНИЯ им. В.А. ТРАПЕЗНИКОВА РАН
На правах рукописи
00460
734
ХЛЕБНИКОВ МИХАИЛ ВЛАДИМИРОВИЧ
МЕТОД ИНВАРИАНТНЫХ ЭЛЛИПСОИДОВ ДЛЯ ПОДАВЛЕНИЯ ОГРАНИЧЕННЫХ ВНЕШНИХ ВОЗМУЩЕНИЙ В ЛИНЕЙНЫХ СИСТЕМАХ УПРАВЛЕНИЯ
Специальность 05.13.01 — Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук
Г2 9 АПр
Москва 2010
004601734
Работа выполнена в Учреждении Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН
Научный консультант: доктор технических наук, профессор
Поляк Борис Теодорович
Официальные оппоненты:
доктор физико-математических наук, профессор Рапопорт Лев Борисович
доктор физико-математических наук, профессор Граничин Олег Николаевич
доктор физико-математических наук, профессор Коган Марк Михайлович
Ведущая организация: Институт проблем машиноведения РАН
Защита состоится М& & 2010 г. в / V часов на заседании
Диссертационного совета Д002.226.02 при Учреждении Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН по адресу: 117997, Москва, Профсоюзная ул., д. 65.
С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН.
Автореферат разослан «ДА.» (/7К- 2010 п
Ученый секретарь
Диссертационного совета Д 002.226.02 кандидат технических наук
В.Н. Лебедев
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Задача о подавлении внешних возмущений является одной из основных в теории управления и рассматривается в различных ее разделах. В линейно-квадратичной оптимизации рассматриваются задачи со случайными гауссовскими помехами (т. н. линейно-квадратичная гауссов-ская задача, LQG). Проблема Н^-оптимизации связана либо с гармоническими внешними возмущениями, либо со случайными гауссовскими, либо с возмущениями из класса ¿2 (т. е. убывающими с течением времени). Однако во многих практических случаях внешние возмущения являются просто ограниченными; какая-либо дополнительная информация о них отсутствует.
Задачей о подавлении неслучайных ограниченных внешних возмущений стали интересоваться еще в середине прошлого века. В 1940-е годы т.н. проблемой о накоплении возмущений занимался Б.В. Булгаков. Однако основное внимание тогда уделялось проблеме анализа — каково максимальное отклонение, вызываемое произвольными ограниченными внешними возмущениями, что, по сути, являлось задачей программного оптимального управления, поскольку внешние возмущения рассматривались как управления. Лишь значительно позже появляются работы по компенсации ограниченных возмущений, в которых, впрочем, не предлагались методы синтеза оптимальных регуляторов.
Впервые задача об оптимальном подавлении неслучайных ограниченных возмущений в дискретном случае была сформулирована в работе1; ее полное решение было построено в работах А.Е. Барабанова и О.Н. Граничила и, позже, — М. Далеха и Дж. Пирсона. Впоследствии эта теория получила название 1\-оптимизации. Однако методы /i-оптимизации имеют ряд существенных недостатков: ее применение к задаче синтеза оптимального управления часто приводит к регуляторам очень высокого порядка; отметим и асимптотический характер получающихся оценок. Обобщение приведенных результатов на непрерывный случай (Ь\-оптимизация) вызывает дополнительные сложности.
Наряду с Ii -оптимальным управлением хорошо известны также методы динамического программирования для подобных задач. Заметим, что ограниченные возмущения также изучаются в работах, посвященных исследованию собственно множеств достижимости (отметим JI.C. Гноенского с соавторами, Д. Бертсекаса и И. Родеса, A.M. Формальского), а также в теории дифференциальных игр (H.H. Красовский, А.И. Субботин, B.C. Пацко, Т. Башар).
'Якубович Е.Д. Решение задачи оптимального управления для линейных дискретных систем // Автоматика и телемеханика. 1975. №9. С. 73-79.
Специальные методы борьбы с внешними возмущениями предложены в теории систем переменной структуры. Управление на скользящих режимах для решения этой проблемы изучается в работах C.B. Емельянова, С.К. Коровина, В.И. Уткина, В.А. Уткина и других. В целом, подавление неслучайных ограниченных возмущений традиционно считается трудной задачей в теории управления.
Существует иной подход к данной проблематике, основанный на методе эллипсоидального оценивания. Эллипсоиды довольно широко используются в различных задачах теории гарантированного оценивания, фильтрации и минимаксного управления в динамических системах при наличии неопределенностей. Принципиальными в этом направлении можно считать работы Ф. Швеппе, Д. Бертсекаса, А.Б. Куржанского, Ф.Л. Черноусько. Отметим, что во многих случаях эллипсоиды оказываются удобными аппроксимациями для областей достижимости динамических систем; это позволяет широко их использовать в задачах анализа.
В теории систем и автоматического управления активно применяется концепция инвариантности, см. монографию2. Среди различных форм инвариантных множеств особо выделяются эллипсоиды из-за их простой структуры и прямой связи с квадратичными функциями Ляпунова. Ввиду этого, в рамках эллипсоидального описания в качестве технического средства может быть использован мощный аппарат линейных матричных неравенств {Linear Matrix Inequalities, LMI) и полуопределенного программирования (Semidefinite Programming, SDP). Первой работой, в которой систематически изложена техника LMI, является книга3, а первой монографией на русском языке, посвященной этому вопросу, является книга4.
Необходимо упомянуть, что техника LMI, очень популярная в последнее время, уже использовалась в целях подавления возмущений. Однако отметим, что в большинстве работ не рассматривались задачи подавления Lœ-or-раниченных возмущений; так, в монографии Д.В. Баландина и М.М. Когана техника LMI применялась для подавления возмущений, ограниченных в ¿2-норме. В статье5 решаются задачи анализа и синтеза при ограниченных внешних возмущениях, но лишь в непрерывном случае; кроме того, в ней не
-Blanchini F., Miani S. Set-Theoretic Methods in Control. Boston: Birkhäuser, 2008.
3Boyd S„ EI Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. Philadelphia: SIAM, 1994.
4Баландин Д.В., Коган М.М. Синтез законов управления на основе линейных матричных неравенств. М.: Физматлит, 2007.
'Abedor J., Nagpal К., Poolla К. A linear matrix inequality approach to peak-to-peak gain minimization // Int. Journal of Robust and Nonlinear Control. 1996. Vol. 6. P. S99-927.
используется явно техника LMI.
В диссертации предлагается общий подход к широкому классу задач, связанных с подавлением неслучайных ограниченных внешних возмущений. Он основан на методе инвариантных эллипсоидов и систематическом использовании техники LMI. Применение этой концепции позволяет свести синтез оптимального регулятора к поиску наименьшего инвариантного эллипсоида замкнутой динамической системы. Такой подход приводит к простым оптимальным (или субоптимальным) регуляторам; он имеет большой потенциал и возможности для обобщений и в равной мере распространим как на непрерывный, так и на дискретный вариант задачи.
Для решения полученных задач существуют мощные вычислительные методы и соответствующие пакеты программ, среди которых отметим свободно распространяемые программные пакеты YALMIP и SeDuMi для системы Matlab, а также пакет cvx.
Цслыо диссертационной работы является разработка методов подавления ограниченных внешних возмущений в непрерывных и дискретных линейных системах в терминах инвариантных эллипсоидов на основе систематического использования техники LMI и сведения задач к формату SDP. Рассмотрены случаи управления по состоянию, фильтрации, управления по выходу с использованием наблюдателя, а также управление при наличии неопределенностей.
Методы исследования. В диссертационной работе используются методы теории оптимального управления, оптимизации, линейных матричных неравенств, линейной алгебры, а также компьютерное моделирование.
Научная новизна. Полученные в диссертации результаты и доказательства утверждений являются новыми. К основным новым результатам относятся следующие:
1. Разработан метод синтеза оптимального управления с помощью статической линейной обратной связи по состоянию в линейных непрерывных динамических системах с неслучайными ограниченными внешними возмущениями.
2. Предложен метод решения задачи фильтрации (оценки состояния динамической системы по измерениям) в линейных непрерывных стационарных системах с неслучайными ограниченными внешними возмущениями.
3. Разработан простой и универсальный способ подавления неслучайных ограниченных внешних возмущений в линейных непрерывных динамических системах с помощью линейной обратной связи по выходу с использованием наблюдателя.
4. Предложен способ построения нехрупкого (допускающего вариации параметров) регулятора для подавления неслучайных ограниченных внешних возмущений в линейных непрерывных динамических системах.
5. Аналогичные п.п. 1-4 методы разработаны для линейных дискретных динамических систем с неслучайными ограниченными внешними возмущениями.
6. Разработаны методы решения робастных вариантов задач, рассмотренных в п.п. 1, 2, 4, 5.
Теоретическая и практическая ценность. В целом диссертационная работа носит теоретический характер. Разработанные подходы к подавлению внешних возмущений в линейных динамических системах основаны на методе инвариантных эллипсоидов и предполагают систематическое использование техники линейных матричных неравенств и сведение задач к формату полуопределенного программирования. Предложена новая техника доказательств, использующая модифицированный вариант S-процедуры.
Вместе с тем, полученные результаты представляются значимыми и с практической точки зрения. Разработанные методы могут найти применение в целях подавления внешних возмущений в разнообразных технических системах. Результаты диссертационной работы также могут быть использованы в учебном процессе.
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на IX Международном семинаре "Устойчивость и колебания нелинейных систем управления" имени Е.С. Пятницкого (Москва, 2006), Конференции по принятию решений и управлению CDC'06 (Сан-Диего, США, 2006), XIV Международной школе-семинаре по динамике и управлению (Звенигород, 2007), Международной конференции, посвященной 150-летаю со дня рождения A.M. Ляпунова "LMC2007" (Харьков, Украина, 2007), II школе-семинаре "Управление большими системами" (Воронеж, 2007), III Международной конференции по физике и управлению "PhysCon 2007" (Потсдам, Германия, 2007), XIV Международной конференции по автоматическому управлению "Автоматика-2007" (Севастополь, Украина, 2007), XVII Всемирном конгрессе ИФАК (Сеул, Корея, 2008), IX Крымской международной математической школе "Метод функций Ляпунова и его приложения" (Алушта, Украина, 2008), VIII Всероссийской научной конференции "Нелинейные колебания механических систем" (Н. Новгород, 2008), XII Международной научно-технической конференции "Моделирование, идентификация и синтез систем управления" (пос. Канака, Украина, 2009), XVI Международной конференции по автоматическому управлению "Автоматика-2009" (Черновцы, Украина,
2009), а также на научно-исследовательских семинарах ИПУ РАН и СПбГУ.
Исследования по теме диссертации проводились в соответствии с плановой тематикой работ ИПУ РАН (направление 3101 "Разработка методов управления динамическими системами в условиях неопределенности") и программы Отделения ЭММПУ РАН "Робастные и адаптивные методы управления движением".
Публикации. Основные результаты диссертации опубликованы в работах [1-31], из них 11 статей в ведущих рецензируемых научных журналах, входящих в перечень ВАК. Все результаты, составляющие основное содержание диссертации, получены автором самостоятельно.
Структура и объем работы. Диссертация состоит из введения, трех шав, заключения и списка литературы, содержащего 130 наименований. Объем диссертационной работы 198 страниц; в текст включен 31 рисунок.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении приведен обзор результатов, относящихся к теме работы, обоснована актуальность темы исследования, сформулированы его цели и задачи, дана общая характеристика полученных результатов, определена их научная новизна.
В первой главе рассматривается задача синтеза оптимального управления в линейной динамической системе с помощью регулятора в форме статической линейной обратной связи по состоянию, который стабилизирует замкнутую систему и оптимально (в смысле минимальности следа ограничивающего эллипсоида по выходу системы) подавляет внешние возмущения.
Первый раздел главы посвящен непрерывным системам. Рассмотрим задачу анализа для системы
х = Ах+Оаи, д;(0)=хо, г = Сх,
где А £ Кл*л, й € Ш.пхт, С € Е'хп, х(() е М" - фазовое состояние системы, г(1) е!1- выход системы, гиЦ) 6Й"- внешнее возмущение, измеримое по ? и ограниченное в каждый момент времени:6
И0К1 (2)
'Здесь и далее || • [| — евклидова норма вектора и спектральная норма матрицы, т — символ транспонирования, 1г — след матрицы, / — единичная матрица соответствующей размерности, а матричные неравенства понимаются в смысле знакоопределенности матриц.
Класс таких возмущений будем называть допустимым. Будем полагать, что система (1) устойчива (матрица А гурвицева), пара (А,й) управляема, С — матрица полного ранга.
Эллипсоид с центром в начале координат
будем называть инвариантным (по состоянию) для системы (1), (2), если из условия jc(0) е £х следует x(t) е £х для всех t ^ 0 при всех допустимых внешних возмущениях w(t). Иными словами, любая траектория системы, исходящая из точки, лежащей в эллипсоиде £х, в любой момент времени принадлежит этому эллипсоиду.
Отметим, что из условия управляемости следует существование хотя бы одного инвариантного эллипсоида. Инвариантный эллипсоид для линейной системы является также и притягивающим: при х(0) ^ £х будет x(t) —> £х, t -> оо (при этом, возможно, x(t) е £х при t > Т для некоторого Т > 0), т. е. траектория системы, исходящая из точки вне эллипсоида £х, стремится к нему с течением времени.
Таким образом, если начальное состояние системы принадлежит инвариантному эллипсоиду, то имеем равномерную оценку поведения траекторий системы — в каждый момент времени траектории принадлежат этому эллипсоиду при любых допустимых внешних возмущениях; если же начальные условия произвольны, получаем асимптотическую оценку — траектории системы будут стремиться к этому эллипсоиду с течением времени при любых допустимых внешних возмущениях.
Если в начальном состоянии системы содержится неопределенность
то для получения равномерной оценки поведения траекторий потребуем, чтобы £о С £х, т. е.
С другой стороны, в тех же целях, в случае непосредственного задания начального условия Хо ф 0, потребуем, чтобы х^Р^х^ ^ 1; это условие по лемме Шура представимо в виде
При необходимости ограничения (3) или (4) добавляются в качестве дополнительного условия в формулировках последующих результатов.
В упомянутых выше работах С. Бойда и Дж. Абедора установлена
= {x 6 М": xTp-'jts; 1}, Р^О,
*(0) € So = {х е R": хТР0~1х < 1}, Р0 >- 0,
Р>Ро.
(3)
(4)
Теорема 1. Эллипсоид £х является инвариантным для системы (1), (2) тогда и только тогда, когда его матрица Р удовлетворяет LMI
АР + РА7 + аР + ~DDJ =4 О а
при иекотораи а > 0.
В диссертационной работе получено доказательство этого результата, основанное на принципиально иной технике. В ней существенно используется модифицированный вариант S-теоремы — с двумя ограничениями7. Основная идея доказательства состоит в построении квадратичной функции Ляпунова, обладающей необходимыми свойствами против всех допустимых внешних возмущений.
Инвариантные эллипсоиды рассматриваются в качестве характеристики влияния внешних возмущений на траектории динамической системы. В данном случае задача состоит в оценке степени влияния внешних возмущений на выход системы; в этой связи представляют интерес минимальные в некотором смысле эллипсоиды £г, содержащие выход z.
Нетрудно видеть, что если £х — инвариантный эллипсоид с матрицей Р, то выход z = Cx системы (1) при xq е £х принадлежит эллипсоиду
& = {zeR': zT(CPCT)~'z ^ l}. (5)
В случае одномерного выхода (/ = 1) этот эллипсоид является полосой £2 = {zeR: |z| ^ VCPCT},
в которой будет находиться выход 2 системы.
Эллипсоид (5) будем называть ограничивающим (по выходу). В качестве критерия его минимальности выберем линейный критерий следа
f{P) = tr СРСТ, (6)
который соответствует сумме квадратов полуосей эллипсоида £г. Это позволит свести проблему к стандартной задаче SDP.
Итак, степень влияния ¿^-ограниченных внешних возмущений w на выход системы г сводится к нахождению ограничивающего эллипсоида (5), минимального по критерию (6). В частности, для скалярного выхода оценивается максимальное по модулю значение z.
Из теоремы 1 вытекает
''Polyak В.Т. Convexity of quadratic transformations and its use in control and optimization // Journal of Optimization Theory and Applications. 1998. Vol. 99. P. 553-583.
Следствие 1. Минимальный по критерию (6) ограничивающий эллипсоид системы (}), (2) принадлежит однопараметрическому семейству, порожденному матрицами Р(а), удовлетворяющими уравнению Ляпунова
АР + PA1 + аР + -DD1 = 0 (7)
а
на интервале О < а < —2 max Re А;(Л), где А,(Л) — собственные значения
i
матрицы А. При этом функция ip(a) = tr С Pia) С1 строго выпукла на указанном интервале.
Следствие 1 позволяет при поиске минимального ограничивающего эллипсоида ограничиться рассмотрением однопараметрического семейства (7), что сводит задачу к одномерной выпуклой минимизации на конечном интервале.
Обратимся к задаче синтеза. Рассмотрим непрерывную систему х = Ах + В\и + Dw, jc(0) = jco, z — Сх + В211,
где А 6 1ЛХ", Вх е Rnxp, В2 € Rlxp, D е R"*m, С е М.Ып, x{t) е W - фазовое состояние системы, z(t) SR' — регулируемый выход, u(t) € Rp — управление, w{t) G Rm — внешнее возмущение, удовлетворяющее ограничению (2); пара (Л, В\) управляема, пара (Л, С) наблюдаема.
Целью является нахождение регулятора К в форме статической линейной обратной связи по состоянию
и = Кх, (9)
который стабилизирует замкнутую систему и оптимально (в смысле минимальности следа ограничивающего эллипсоида по выходу системы) подавляет воздействие допустимых внешних возмущений w. Отметим, что мы ограничиваемся только такими линейными обратными связями и не рассматриваем, например, релейные управления.
Наличие компоненты В211 в выходе системы (8) позволяет рассмотреть более общую постановку задачи: одновременно с минимизацией выхода избежать появления больших значений управления. Альтернативой этому подходу является явное введение ограничения на величину управления; этот подход будет освещен ниже.
В следующей теореме поиск оптимального регулятора сводится к задаче SDP и одномерной минимизации.
Теорема 2, Решение Р, Y, Z задачи
tr[СРС1 + CVTB] + B2YCr + B2ZB]} —> min (10)
при ограничениях
где минимизация проводится по матричным переменным Р — Рт £ Шпхп, Y £ Rpx", Z = ZT б Ерхр и скалярному параметру а, определяет матрицу СРСТ + CY^Bj + ВгУС^ + B2ZB2 минимального ограничивающего эллипсоида по выходу системы (8), (2) и статический регулятор по состоянию
к = ??-*,
оптимально подавляющий внешние возмущения.
Таким образом, исходная задача синтеза статического регулятора по состоянию (9), оптимально подавляющего внешние возмущения в системе (8), (2), эквивалентна полученной задаче (10)-(11), т.е. условия теоремы 2 являются необходимыми и достаточными. При фиксированном а данная задача представляет собой задачу SDP, которая принадлежит к классу задач выпуклой оптимизации.
Нетрудно видеть, что
KaxlK max \\Кх\\ = \ЛгКРК\
В рамках данного подхода к подавлению внешних возмущений естественно потребовать введения ограничений на управление. Пусть
ИОК/х, (1> 0. (12)
Следующая лемма сохраняет свою силу и в дискретном случае.
Лемма 1. Ограничение (12) для системы (8), (2) гарантируется выполнением LMI
fР Yr\
J
где Р — матрица инвариантного эллипсоида системы, a Y = KP.
В процессе доказательства теоремы 2 строится функция Ляпунова V(x) для замкнутой системы, такая, что V(x) ^ 0 при V{x) > 1 и wrw < 1. Естественно задаться целью найти ограниченное внешнее возмущение w(t), максимизирующее V(x) (т.н. "наихудшее" возмущение). Ответ дает
Лемма 2. Наихудшее возмущение w(i) для системы (8), (2) задается формулой
DTP~xx(t)
5(i)
1Ртя->4011"
и
В частности, если возмущение одномерно, то w(t) = sign (DTP-1x(t)).
В качестве критерия минимальности ограничивающего эллипсоида можно выбрать норму его матрицы, т. е. минимизировать радиус шара, содержащего этот эллипсоид. Такая постановка задачи также допускает решение в терминах LMI и SDP. Соответствующий аналог теоремы 2 может быть получен добавлением к условиям теоремы LMI
С PC1 + CY1B} + В2УСТ + ß2ZBj 4 XI
и заменой (10) на минимизацию по скалярной переменной Л.
Вместо евклидовых ограничений (2) на допустимые возмущения можно наложить интервальные ограничения
К(0|<1 Vi ^ 0, i — \,...,m.
При такой постановке получено субоптимальное решение задачи в терминах LMI и SDP. Соответствующий аналог теоремы 2 получается заменой первого из ограничений (11) на LMI
(АР + РА1+ aP + BlY + (BlYf D \ _
V Z)T -diag{A ... ßm})*
с добавлением ограничения
т i= 1
где ßi,..., ßm — скалярные переменные.
Второй раздел главы посвящен дискретным системам. Рассмотрим задачу анализа для системы
хы = Axk + Dwk,
л V* /
Zk = LXk
с некоторым начальным условием хц, где А € ¡Х"хп, D 6 R"xm, С 6 R'xn, Xk € К" — фазовое состояние системы, Zk 6 К' — выход системы, !£)i 6 Ея -внешнее возмущение, удовлетворяющее ограничению
кII <1. ¿ = 0,1,2,... (14)
Будем полагать, что система (13) устойчива (матрица А шуровская), пара (А, D) управляема, С — матрица полного ранга. Эллипсоид с центром в начале координат
= 6 R": xjp-lxk^ 1}, РуО,
будем называть инвариантным (по состоянию) для дискретной динамической системы (13), (14), если из условия x<j £ £х следует Xk 6 £х для всех k = 1,2,... при всех допустимых внешних возмущениях Матрицу Р будем называть матрицей эллипсоида £х.
Как и в непрерывном случае, инвариантный эллипсоид также является и притягивающим, т. е. при xq £ £х будет Xk —> £х, k —v оо (при этом, возможно, X;, е £х при k ^ К для некоторого К £ N).
Дискретным аналогом теоремы 1 является
Теорема 3. Эллипсоид £х является инвариантным для динамической системы (13), (14) тогда и только тогда, когда его матрица Р удовлетворяет LMI
-АРА7 -Р + —i—DD1 4 О а 1 — а
при некотором а 6 (0,1).
Как и в непрерывном случае, если £х — инвариантный эллипсоид с матрицей Р, то выход Zk = Схи системы (13) при xq е £х принадлежит эллипсоиду
£г = {zk е Rm: zl(CPCTrxzk < 1}.
который будем называть ограничивающим (по выходу). Из теоремы 3 вытекает
Следствие 2. Минимальный по критерию (6) ограничивающий эллипсоид системы (13), (14) принадлежит однопараметрическаму семейству, порожденному матрицами Р{а), удовлетворяющими дискретному уравнению Ляпунова
-АРА7 -Р + ——DD7 = 0 (15)
а 1 — а
па интервале р2(А) < а < 1, где р(А) = шах|Л,(Л)| — спектральный ра-
i
диус матрицы А. При этом функция <р(а) = tr СР(а)С7 строго выпукла на указанном интервале.
Таким образом, как и в непрерывном случае, поиск минимального ограничивающего эллипсоида сводится к задаче одномерной выпуклой минимизации среди однопараметрического семейства, порожденного уравнением (15). Теперь обратимся к задаче синтеза. Рассмотрим дискретную систему
Xk+i = Axk + Biuk + Dwk, zu = Cxk + B2uk
с некоторым начальным условием х0, ще А € К"*", В\ е Еяхр, В2 е ШЫр, D 6 Rnxm, С е К'*", xk 6 R" — фазовое состояние системы, zk е U1 —
регулируемый выход, Uk 6 W — управление, wk € Rm — внешнее возмущение, удовлетворяющее ограничению (14); пара (А, Вi) управляема, пара (А, С) наблюдаема.
Требуется найти регулятор К в форме статической линейной обратной связи по состоянию
uk = Kxk, (17)
обеспечивающий минимальный по критерию (6) размер ограничивающего эллипсоида по выходу системы при всех допустимых внешних возмущениях. Дискретным аналогом теоремы 2 для системы (16), (14) является Теорема 4. Решение Р, Y,Z задачи
tr[СРС1 + CYJB] + B2YCt + B2ZBj] —► min
при ограничениях
-аР (AP + BiY)т
где минимизация проводится по матричным переменный Р = рт е Г*",
и скалярному параметру а, определяет матрицу СРСт + СУ1 В1 + В2УС"! + Вг^г минимального ограничивающего эллипсоида по выходу системы (16), (14) и статический регулятор по состоянию
к = ?р-\
оптимально подавляющий внешние возмущения.
Как и в непрерывном случае, условия теоремы 4 являются необходимыми и достаточными. При этом ||и*тах|| ^ уХгКРК1,
В ходе доказательства теоремы 4 строится функция Ляпунова У(хк) для замкнутой системы, такую, что < 1 при У{хр) ^ 1 и а^шь < 1.
Естественно найти ограниченное внешнее возмущение щ, максимизирующее ]/{Хк+\) ("наихудшее" возмущение). Ответ дает следующая лемма, являющаяся дискретным аналогом леммы 2.
Лемма 3. Для линейной дискретной системы (16), (14) одномерное наихудшее возмущение а)к задается формулой
щ = 51еп(£>тР"1(Л + В{К)хк).
В третьем разделе рассматриваются примеры. Первый — задача мини-
Z Ут
>0,
мизации перерегулирования (или всплеска). Рассмотрим систему (п — 10)
/0 1 0 •■ ■ (о\ /0\
0 0 1 •■ • 0 0 0
; , • х + и +
0 0 0 •• • 1 0 0
V0 0 0 • • V) \Ч
Если в соответствии с традиционными методами расчета регуляторов выбирать стабилизирующий регулятор Кг таким образом, чтобы у характеристического полинома замкнутой системы все корни были равны всего лишь —2, то оказывается, что коэффициенты усиления в цепи обратной связи превышают 1.5 • 104. Более того, при хо = (1 1 ... 1) (и единичном внешнем возмущении) компонента ХюО) решения х(() замкнутой системы достигает значения « 2030, т. е. начальное значение возрастает более, чем в 2000 раз, прежде, чем начать убывать. С другой стороны, для задачи минимизации выхода г — [и Хю) системы при ограничении Р -< 5000/ на фазовое состояние, с помощью теоремы 2 был построен оптимальный регулятор К с компонентами |К,\ ^ 250, при котором тах |хю(01 ^ 70, а тах[и(г)| < 970. При этом тахтах ^ 130.
Рис. 1.
На рис. 1 при начальном состоянии Хо и единичном внешнем возмущении построены две траектории — Хю(£). соответствующая регулятору К (сплошной линией), и х[0(£), соответствующая регулятору Кг (пунктиром).
Второй пример — задача управления двойным осциллятором, т.е. системой двух тел с массами Ш] и т.2, соединенных пружиной с коэффициентом упругости к, скользящих без трения вдоль горизонтального стержня. Она часто рассматривается в качестве модельной для различных методов, чему способствуют ее реальное происхождение и разумные размеры. Управление и приложено к левому телу для компенсации ограниченного внешнего возмущения т = гш2)Т, компоненты которого воздействуют на левое и правое тело. Пусть Ль О] — координата и скорость левого тела, а хг, щ — правого. Непрерывная модель возмущенных колебаний системы описывается уравнениями
XI =0ь
¿2 = и2,
к к 1 1
VI =--Х\ Н--Х2 + —и Н--Ш>ь
т\ т2 т\ т\
к к 1
Щ = -Х\--Х2 Н--И>2-
Ш-2 т.2 т-2
В качестве регулируемого выхода системы возьмем вектор г — (и х<^.
При единичных параметрах системы с помощью теоремы 2 построен оптимальный регулятор
К« (-2.5439 0.7907 -2.4863 -1.8051).
Рис. 2.
На рис. 2 изображен найденный минимальный ограничивающий эллипс
для замкнутой системы с регулятором К. На том же рисунке при одном и том же начальном состоянии системы xq = (0.1 0.1 0.1 0.1) и наихудшем внешнем возмущении w(t), определяемым леммой 2, построены две траектории выходной переменной — z(t), соответствующая регулятору К (сплошной линией), и Z[qr(f), соответствующая линейно-квадратичному регулятору K\v (с единичными весовыми матрицами), найденному с помощью Control System Toolbox в системе Matlab (пунктиром). Видно, что траектория замкнутой системы с регулятором K\v выходит за пределы ограничивающего эллипса, тогда как траектория замкнутой системы с регулятором К в нем остается.
Во второй главе рассматривается синтез обратной связи по выходу, которая минимизирует размер ограничивающих эллипсоидов динамической системы. Поскольку цель диссертации — систематическое использование техники линейных матричных неравенств и сведение задач к формату полуопределенного программирования, то, как и выше, задача синтеза управления по выходу сводится к условиям в виде LMI и задаче SDP. При этом используется оценка состояния, получаемая с помощью наблюдателя Люенбергера.
Первый раздел главы посвящен задаче фильтрации, т. е. оценки состояния динамической системы по измерениям. При случайных возмущениях она допускает исчерпывающее решение с помощью фильтра Калмана, однако, во многих ситуациях предположение о случайности шумов является неоправданным. Часто известно лишь, что все возмущения являются ограниченными, а в остальном произвольными; в этом случае можно строить гарантированные (а не вероятностные) оценки состояний. В частности, в работах8 и9 была развита эллипсоидальная техника фильтрации.
В диссертации рассматривается проблема фильтрации с ограниченными неслучайными возмущениями для линейных стационарных задач, когда все параметры модели не зависят от времени. Более того, ищется оценка состояния такая, что ее ошибка гарантированно заключена в инвариантный эллипсоид для всех моментов времени, т. е. оценка является равномерной. Сам фильтр также ищется в классе линейных стационарных фильтров. В этом классе задач и оценок проблема оказывается полностью разрешимой, т. е. удается построить оптимальный фильтр и оценку состояния.
Рассмотрим линейную непрерывную систему
x=Ax + Diw, хф) = х0, ^
у = Сх + £>2®,
'Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М., 1977.
'Черниусько Ф.Л. Оценивание фазового состояния динамических систем. М., 1988.
где Л € IT*", D\ е Rnxm, D2 6 Rixm, С е К'*", с фазовым состоянием x(t) е R", наблюдаемым выходом y(t) € R' и внешним возмущением (шумом) w(t) € Rm, удовлетворяющим ограничению (2). Пара (Л, D\) управляема, пара (Л, С) наблюдаема, D\Dj = 0.
Пусть состояние х системы недоступно измерению и информация о системе предоставляется ее выходом у. Построим фильтр, описываемый линейным дифференциальным уравнением относительно оценки состояния х, включающим в себя рассогласование выхода у и его прогноза Сх:
х = Äx + L(y - Сх).
Подчеркнем, что структура фильтра задается заранее — он является линейным стационарным, подлежит выбору лишь постоянная матрица L. Эта структура такая же, как в известном наблюдателе Люенбергера10.
Введем в рассмотрение невязку e(t) — x(t) - x(t), характеризующую точность фильтрации. Задачей является нахождение минимального (в определенном смысле) инвариантного эллипсоида £, содержащего невязку е. Таким образом, оценивается асимптотическая (а при малых уклонениях и равномерная по t) точность фильтрации.
Будем искать минимальный инвариантный эллипсоид (существование хотя бы одного инвариантного эллипсоида следует из условия управляемости) при фиксированном L, стабилизирующем систему относительно е, а затем минимизируем этот эллипсоид по L. По-прежнему, удобно считать тот эллипсоид минимальным, у которого минимален след его матрицы.
В диссертации установлена следующая
Теорема 5. Решение Q, Y задачи
tr Н —► min (19)
при ограничениях (ÄtQ + QA-YC-(YC)T + aQQDl-YD2\ /Я А п
I m-YDtf -al J«0' (,/ (20)
где минимизация проводится по матричным переменным Q = Qr G Rnx,!, Y е R"*', Н = Н1 € ®"х'! и скалярному параметру а, определяет матрицу Р = Q-1 минимального инвариантного эллипсоида для невязки системы (18), (2) и оптимальную матрицу фильтра
L = Q-1?.
"Luenberger D. G. An introduction to observers // IEEE Transactions on Automatic Control. 1971. Vol. 35. P. 596-602.
Исходная задача синтеза оптимальной (в смысле следа инвариантного эллипсоида, содержащего невязку) матрицы фильтра для системы (18), (2), эквивалентна полученной задаче (19)—(20), т. е. полученные условия являются необходимыми и достаточными.
В некоторых случаях имеется априорная информация о начальном состоянии системы:
Тоща, выбирая 2(0) = 0, имеем е(0) 6 £о, поэтому, если потребовать £о С В, то можно гарантировать, что е{1) 6 £ для всех I. Соответственно, если к системе ЬМ1 в теореме 5 добавить ограничение
то получим не только асимптотическую, но и справедливую для всех моментов времени оценку точности фильтрации.
Нередко нужно оценивать качество фильтрации не всех координат состояния х, а лишь некоторых. Пусть имеется регулируемый выход у^ = С\х (например, одна из координат состояния) и надо сделать ошибку его оценки
Можно воспользоваться и иными критериями оптимальности, помимо суммы квадратов полуосей эллипсоида £. Например, можно минимизировать ¿оо-норму невязки, т.е. радиус шара, содержащего эллипсоид £. Для этого потребуем г —► шах при дополнительном ограничении С} ^ г1.
Аналогичные результаты получены для дискретной системы
с некоторым начальным условием х0, где А 6 Й"хп, А 6 Кпхт, А € ®'хт, С е К'*", с фазовым состоянием хк € К", наблюдаемым выходом ^ е й' и внешним возмущением тк е Кт, удовлетворяющим ограничению (14); пара (Л,Д) управляема, пара (А, С) наблюдаема, = 0-
Построим фильтр, описываемый линейным уравнением с постоянной матрицей Ь относительно оценки состояния хк:
х(0)е£0 = {хеКп: Ро >- 0.
Я Ро"'.
е\=у\-у\= Сг(х - х) возможно малой; в этом случае второе ЬМ1 в (20) заменится на
хш = + Ук = Схк +
(21)
хк+\ = Ахк + Цук - Схк).
Введем в рассмотрение невязку е^ = Xk — задачей является нахождение такой матрицы L, которая обеспечивает минимальность инвариантного эллипсоида, содержащего невязку е^.
Дискретным аналогом теоремы 5 для системы (21), (14) является Теорема 6. Решение Q, Y задачи
it И —> min
при ограничениях
f-aQ (QA-YC)т 0 \ /и
1; ? T-Sr0'
где минимизация проводится по матричным переменным Q = Qr € Rnxn, Y £ R"xi, H — HT 6 Клхп и скалярному параметру а, определяет матрицу Р = Q-1 минимального инвариантного эллипсоида для невязки системы (21), (14) и оптимальную матрицу фильтра
L = Q~lY.
Во втором разделе главы рассматривается синтез оптимального управления с помощью линейной обратной связи по выходу. Рассмотрим непрерывную систему
х = Ах + В\и + D\w, х(0)-хо, у = C\X + D2w, (22)
z = С?х + Biu,
где А £ Г1*", В\ £ Rnxp, В2 £ Rrxp, А £ Rnxm, D2 £ Rixm, С, e R'*n, C2 € ¡Rrxn, с фазовым состоянием x(t) £ R", наблюдаемым выходом y(t) € R', регулируемым выходом z(t) £ Р/, управлением u(t) £ Шр и внешним возмущением w(t) £ Rm, удовлетворяющим ограничению (2); пара (А,В]) управляема, пара (Д Ci) наблюдаема, DjDj = 0.
Пусть состояние х системы недоступно измерению и информация о системе предоставляется ее выходом у. Задачей является нахождение субопти-малыюго эллипсоида, содержащего выход z. По-прежнему будем рассматривать инвариантные эллипсоиды как характеристику влияния внешних возмущений на траектории системы, в данном случае — на выход z системы; в этой связи будем интересоваться ограничивающими эллипсоидами по выходу z.
Будем строить наблюдатель, описываемый линейным дифференциальным уравнением, содержащим рассогласование выхода у и его прогноза С\Х\
х = Ах + В\и + L(y - С\х).
При этом обратная связь строится с помощью динамического регулятора
и = Кх.
Условия следующей теоремы являются достаточными, т. е. приводящими к субоптимальным решениям.
Теорема 7. Решение Р\, Q2, Уь Y2, Z\, Н задачи
tr[С2(Р, + H)Cj + B2Y{Cj + C2Y?Bj + B2ZiBj] —> min
при ограничениях
(Z Y2Ci 0 Y2D2 \
* AtQ2 + Q2A -T- aQ2 - Y2C, - (Y2CI)t Q2DI -Y2D2
* * — od 0
\* * * —al )
2^ + 2 1 \ / - {АРу + Р, Лт + аР, + В, П + (В, У1)т)у
гс)е минимизация проводится по матричным переменным Р\ = Р7 €
<Э2 = е к"*«, у, 6 крхл, У2 е Клх', 2 = г7 е Млх", 2, = г,7 е Ерхр, Н =
Клхп и скалярному параметру а, определяет матрицу С2(Р\ + Н)С2 + В2У\С1 + С2У?В] + В$\В7 ограничивающего эллипсоида по регулируемому выходу системы (22), (2), динамический регулятор
и матрицу наблюдателя
Аналогичные результаты получены для линейной дискретной системы
хк+\ = Ахи + В\Чк + А®а> ук = С\хк + й2тк, (23)
2к = С2хк + В2ик
с некоторым начальным условием хо, где А € Мп*", В\ € Елхр, В2 & А 6 Ш.пхт, А € М1хт, С{ е К'х", С2 е Кяхг, с фазовым состоянием хк е Е", наблюдаемым выходом ук 6 К', регулируемым выходом гк € Кг, управлением ик е и внешним возмущением иок еКя, удовлетворяющим ограничению (14); пара (Л,В[) управляема, пара (А, СО наблюдаема, = 021
Состояние xk системы недоступно измерению и информация о системе предоставляется ее выходом у^. Задача заключается в нахождении субоптимального эллипсоида, содержащего выход z
Следующая теорема является дискретным аналогом теоремы 7; ее условия также являются достаточными.
Теорема 8. Решение Р\, Q>, У|, Y2,Zi,H задачи
tr[C2(Pi + Н)С] + В2KiСJ + C2Y?Bj + B2ZiBj] —> min
при ограничениях
(Z Y2Ci Y2D2 0 \
* Л! Л2 (У2С,)Т
* * Лз (Y2D2)т
у* * * —Q2 J
(1Q2 + Z 1
к)*0'
/ + BiУ1ЛТ + At?B} + ) + h) V
где
Л1 = АтЯ2А - АтУ2С1 - С]У?А - а€?2,
л2 = лтс?2д - с^А - лтг2д2,
Л3 = - - - (1 - <*)1,
а минимизация проводится по матричным переменным Р\ = Ру 6 (¿2 =
е Епхп, У1 е У2 б К**', г = гт е Епх", ^ = г/ е крхр, я = Ят е Е"х" и скалярному параметру а, определяет матрицу С2{Р\ + Н)С] + В2У\С] + С2У,ТВ1 + В^В1 ограничивающего эллипсоида по регулируемому выходу системы (23), (14), динамический регулятор
К = %РГ1
и матрицу наблюдателя
1 = Я2%.
Предложенный подход продемонстрирован на примере задачи управления двойным осциллятором. В качестве наблюдаемого выхода системы возьмем у — {х 1 + шз х2) , содержащий возмущение щ, а в качестве регулируемого — вектор 2 == (и х2)\ Вектор возмущений пи = ш2 Доз) предполагается удовлетворяющим ограничению (2). С помощью теоремы 7 найден регулятор
Ь (-1.6072 0.2759 -1.9126 -1.3343) 22
и фильтр
/1.2681 0.13694 0.2667 1.1859 0.6422 0.3744 \0.2206 0.8480/
С другой стороны, построив динамический /4о-регулятор с помощью
Robust Control Toolbox в системе Matlab, имеем: max Re А, (Ас) и -0.0114,
i
где Ас — замкнутая матрица системы с -регулятором, т. е. замкнутая система получилась слабо устойчивой.
И
Рис. 3.
На рис. 3 изображен ограничивающий эллипс по выходу замкнутой системы с регулятором К. На том же рисунке при одном и том же начальном состоянии системы и некотором внешнем возмущении построены две траектории выходной переменной — z(t), соответствующая регулятору К (сплошной линией) и 2//те, соответствующая Я^-регулятору (пунктиром). Видны выбросы траектории замкнутой системы с Дзо-регулягором далеко за пределы ограничивающего эллипса (например, при t = 0.02 имеем z\(t) — u(t) и -3118), тогда как траектория замкнутой системы с регулятором К в нем остается.
Третья глава посвящена управлению при наличии неопределенностей. В первом разделе главы рассматриваются различные обобщения и модификации т.н. леммы Питерсена11 о робастной матричной знакоопределенности,
11Petersen I. A stabilization algorithm for a class of uncertain systems // Systems and Control Letters. 1987. Vol. 8. P. 351-357.
которая часто привлекается при решении задач квадратичной устойчивости, построении робастно квадратично стабилизирующих регуляторов, в робаст-ной ЬС>11-задаче и др. Полученные обобщения леммы используются при доказательстве утверждений данной главы. Условия, получающиеся при их использовании, являются достаточными, т.е. приводящими к субоптимальным решениям.
Одно из важных обобщений леммы Питерсена представляет Лемма 4. Пусть й = Ст, ... ,МГ и .....Ыг — матрицы соответствующих размерностей, 71,..., -уг > 0. Тогда если
Г 1
Эб1,..., ег > 0: О + УЧ {£■№№] + 4 0,
¿=1 . е'1
то УД;: || Д,|| < 7,-, \ = 1,..., т., выполняется
г
°++(^адГ)
1-1
Во втором разделе главы исследуется робастный вариант задачи синтеза оптимального управления с помощью статической линейной обратной связи по состоянию. Рассмотрим линейную непрерывную динамическую систему
х = (А + ДЛ( 0)* + (£> + ДО(0)ш, *(0) = хо,
2 = Сх,
вдЛе ЕГХП, й 6 Епхт, С 6 Е'х", х(/) € К" — фазовое состояние системы, г(<) е I' - выход системы, ш({) 6 Мт — внешнее возмущение, удовлетворяющее ограничению (2), системные неопределенности ДЛ(0> Д1>(0 имеют структуру
ДЛ(0 = РААД(0НД,
Д£>(<) = РВА0«)Н0,
где /7,, Рд, Ял. Но — постоянные матрицы соответствующих размерностей, а матричные неопределенности Дл(0 и До(0 удовлетворяют ограничению
||Д(0К1 (25)
Будем полагать, что матрица А устойчива, пара {А, Б) управляема, С — матрица полного ранга.
Условия (25) являются достаточно естественной формой задания неопределенностей системы; неопределенности такой структуры часто возникают
в разнообразных технических системах. Заметим, что при Дд(0 = Дд(0 = О система (24) обращается в систему без неопределенностей (1). Робастным аналогом теоремы 1 является
Теорема 9. Эллипсоид £х является инвариантным для динамической системы (24), (2), (25), если его матрица Р удовлетворяет ЬМ1
(АР + РА1 + аР + е^И} + £2/^ О РИ} 0 \
* -а/ О НI
* * — £\1 О
\ * * * — £¡1 /
о (26)
при некоторых а,£¡,62 6 К.
Задача состоит в оценке степени влияния внешних возмущений т и матричных неопределенностей на выход г системы (24). В этой связи будем искать минимальный в смысле критерия (6) ограничивающий эллипсоид, содержащий выход системы. Соответственно, приходим к задаче минимизации ХгСРС^ при ограничении (26) по матричной переменной Р = Р1 6 Елхл, скалярным переменным £{,£2 и скалярному параметру а. Аналогичные результаты получены для линейной дискретной системы
хш = (Л + ДАк)хк + (£> + ДОДда*, гк = Схк
с некоторым начальным условием хо, где Л € Е"*", £) е М"*"1, С 6 Е'х", хк 6 М™ — фазовое состояние системы, гк € Е' — выход системы, £ Ет — внешнее возмущение, удовлетворяющее ограничению (14), системные неопределенности ААк, Айк имеют структуру
ААк = АкНА,
АЭк = РвА0кН0,
где /71, /*д, //д, Но — постоянные матрицы соответствующих размерностей, а матричные неопределенности и Дд4 удовлетворяют ограничению
||Д»||<1, к = 0,1,2,... (28)
Будем полагать, что матрица А устойчива, пара (Л, О) управляема, С — матрица полного ранга.
Заметим, что при Ал(0 — Дд(0 = 0 система (27) обращается в систему без неопределенностей (13).
Робастным аналогом теоремы 3 и дискретным аналогом теоремы 9 является
Теорема 10. Эллипсоид £х является инвариантным для динамической системы (27), (14), (28), если его матрица Р удовлетворяет ЬМ1
f—aP РЛТ 0 PHJ 0 \
* -P + £lFAFj + £2FDFl D 0 0
* * -(!-<*)/ 0 Щ
* * * -£\I 0
\ * * * * -£2//
при некоторых а, £(, е% € К.
Задача состоит в оценке степени влияния внешних возмущений и матричных неопределенностей Длъ Дш на выход системы (27). Как и в непрерывном случае, приходим к задаче минимизации \rCPC1 при ограничении (29) по матричной переменной Р = РТ 6 скалярным переменным £ь £2 и скалярному параметру а.
Обратимся к задаче синтеза оптимального управления. Рассмотрим непрерывную систему
x = (A + AA(t))x+(Bl + ABl(t))u+{D + AD(t))w, x(Q) = xq,
z = Сх + B2u,
где A € lnx", Bi e R"xp, D e R4xm, С e R/xn, x(t) el"- фазовое состояние системы, z(t) 6 R' — регулируемый выход, u(t) £ Rp — управление, w{t) G Em — внешнее возмущение, удовлетворяющее ограничению (2). Системные неопределенности ДЛ(/), АВ\ (t), AD(t) имеют структуру
AA(t) = FAAA(t)HA, ДВ1«) = /7в,Дв,(0Яв„ AD(t) = FDAD(t)HD,
где Fa, Fri, Fd, На, H[h> Hd — постоянные матрицы соответствующих размерностей, а матричные неопределенности Дд(0. Дд,(0 и Дд(/) удовлетворяют ограничению (28); пара (А,В\) управляема, пара (А, С) наблюдаема.
Целью является нахождение регулятора К в форме статической линейной обратной связи по состоянию (9), который стабилизирует замкнутую систему и, в смысле минимальности следа ограничивающего эллипсоида по выходу 2, подавляет воздействие внешних возмущений w при всех допустимых неопределенностях. Точнее, ищется такой стабилизирующий регулятор К, чтобы при любых допустимых внешних возмущениях и системных неопределенностях гарантировать малость выхода z в смысле критерия (6).
Робастным аналогом теоремы 2 для системы (30), (2), (28) является
Теорема 11. Решение Р, Y,Z задачи
tr[CPCT + CYTBj + B2YCr + B2ZBj] min при ограничениях
<0, lyTp)>0,
/п D PHJ (НвХ)1 0 \
* -al 0 0 Hl
* * -eil 0 0
* * * -е21 0
V* * * * -Ы/
где
П = АР + РАТ + аР + В[У + (Б,У)Т + е^} + +
а минимизация проводится по матричным переменным Р = Рт € К»*», К 6 2 = 6 Крхр, скалярным переменным е\,е2^г и скалярному
параметру а, определяет матрицу СРСТ + СУТВ1 + В2УСТ + В^В^ ограничивающего эллипсоида по выходу системы (30), (2), (28) и статический регулятор по состоянию
К = ?Р~1.
В рамках данного подхода к робастному подавлению внешних возмущений можно потребовать введения ограничений на управление, при этом лемма 1 сохраняет свою силу; также установлен робастный аналог леммы 2. Аналогичные результаты получены для дискретной системы
хш = (А + ААк)хк + (В, + ДВи)и* + (Я + АОк)ть гк = Схк + В2ик
с некоторым начальным условием х0, где А е В\ е К"хр, й 6 Епхт, С е Ш1хп, хк 6 К" — фазовое состояние системы, гк б К' — регулируемый выход, ик € Шр — управление, тк <Е К"1 — внешнее возмущение, удовлетворяющее ограничению (14). Системные неопределенности ААк,АВ\к,АОк имеют структуру
ААк = ^Д АкНА, Д5и = РвАв1кНв,, А О* = Р0А0кН0,
где Ра, Рв^Ро, ¡ь\,нв,, но — постоянные матрицы соответствующих размерностей, а матричные неопределенности Адк, Ав[к и Аок удовлетворяют ограничению (28); пара (А,В\) управляема, пара (А, С) наблюдаема.
Требуется найти регулятор К в форме статической линейной обратной связи по состоянию (17), который стабилизирует замкнутую систему и подавляет воздействие внешних возмущений Wk при всех допустимых неопределенностях. В диссертации установлен дискретный аналог теоремы 11 (и, соответственно, робастный аналог теоремы 4), а также робастный аналог леммы 3.
В третьем разделе главы исследуется робастный вариант задачи фильтрации. Установлен робастный аналог теоремы 5 для непрерывной системы
x = (A + AA(t))x + (Dl + ADl(t))w,
у = Сх + D2W,
ще А 6 Млхл, Si 6 Rnxp, D е Елхт, С е К'хл, x(t) е R" - фазовое состояние системы, y(t) É I'- наблюдаемый выход, w(t) £ Rm — внешнее возмущение, удовлетворяющее ограничению (2). Системные неопределенности AA(t), ADi (t) имеют структуру
AA(t) = FAAA(t)HA, ДО, (0 = FD>ADt(t)UDi, ще Fa,Fd1,Ha,Ho1 — постоянные матрицы соответствующих размерностей, а матричные неопределенности Дд(0 и Дс,(0 удовлетворяют ограничению (28); пара (A, D\) управляема, пара (А, С) наблюдаема, D\Dj = 0.
В том же объеме рассмотрен робастный вариант задачи фильтрации для дискретной системы.
В четвертом разделе главы рассматривается проблема построения нехрупкого регулятора. Впервые проблема хрупкости стабилизирующего регулятора для управляемых систем была поднята С. Бхаттачарией и JI. Килем в работе12. На разнообразных примерах было показано, что даже при малом изменении параметров регулятора оптимальная система может стать неустойчивой (такие регуляторы были названы "хрупкими").
Рассмотрим линейную непрерывную систему (8), (2). Нехрупкий регулятор К ищется в форме статической линейной обратной связи по состоянию (9), таким образом, чтобы возмущенный регулятор
K + AK(t)
при всех ||Д*(*)|| < 7к стабилизировал замкнутую систему и, в смысле минимальности следа ограничивающего эллипсоида по выходу, подавлял воздействие допустимых внешних возмущений. Величина определяет размер области пехрупкости регулятора К.
nKeel L.H., Bhaltacharyya S.P. Robust, fragile, or optimal? // IEEE Transactions on Automatic Control. 1997. Vol. 42. P. 1098-1105.
В диссертации установлена следующая Теорема 12. Решение R,P, Y задачи
trß
min
при ограничениях
/АР + РАт + аР + В^ + (В^)т +-YlKeiBlBj D Р * -а/ О
4 0,
1-РЛ-^ке2В2В\ -СР-В2У о * -Р Р
\ * * —ег/у
где минимизация проводится по матричным переменным Р = Рт £ Е"х", Л = RJ € Ш!х1, У € Ерхп, скалярным переменным £\,£2 и скалярному параметру а, определяет матрицу Л ограничивающего эллипсоида по выходу системы (8), (2) и статический регулятор по состоянию
К = ?Р~\
стабилизирующий систему с запасом нехрупкости
В приведенной постановке задачи число задано; если оно слишком велико, может оказаться, что система неравенств неразрешима — нельзя стабилизировать систему с таким запасом нехрупкости.
Дискретным аналогом теоремы 12 для системы (16), (14) является Теорема 13. Решение Я,Р, У задачи
tr R
min
при ограничениях
(-аР
\
(AP + BJY
-Р + ^ВхВ] *
*
0 Р \
D 0
-а)! 0
* -El//
=$0,
(-R + y'2K£2B2B] -CP-B2Y 0 \
-Р Р \ 4 О,
\ * *
где минимизация проводится по матричным переменным Р = РТ € R"x,!, R = RT б Rlxl, Y € Rpxn, скалярным переменным £\,£2 и скалярному параметру
а, определяет матрицу R ограничивающего эллипсоида по выходу системы (16), (14) и статический регулятор по состоянию
K=YP~l,
стабилизирующий систему с запасом нехрупкости "{к-
Аналогичные результаты получены для непрерывной системы
k = (A + 6A(tj)x + Biu->rDw, х(0) = х0,
Z = CX + B2U,
ще А € Е"*п, Bi в D е R"*m, С е Rlxn, x(t) 6 Е" - фазовое состояние системы, z(t) е М' — регулируемый выход, u(i) е 1р — управление, w{t) е Em — внешнее возмущение, удовлетворяющее ограничению (2). Системная неопределенность AA(i) имеет структуру
AA(t) = FAAA(i)HAl
где Fa,Ha — постоянные матрицы соответствующих размерностей, а матричная неопределенность AA(t) удовлетворяет соотношению ||Дд(0Ц ^ 7л; пара (А,В\) управляема, пара (Л, С) наблюдаема. В том же объеме рассмотрен ро-бастный вариант построения нехрупкого регулятора для дискретной системы.
В заключении диссертации подведены итоги проведенных исследований и изложены основные выводы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ
1. Разработан метод синтеза оптимального управления с помощью статической линейной обратной связи по состоянию для непрерывных и дискретных линейных динамических систем с ограниченными внешними возмущениями. Исходные задачи сведены к эквивалентным условиям в виде линейных матричных неравенств и задаче полуопределенного программирования.
2. Предложен метод решения задачи фильтрации (оценки состояния динамической системы по измерениям) для непрерывных и дискретных динамических систем с ограниченными внешними возмущениями. Построен оптимальный фильтр и найдена равномерная оценка состояния.
3. Разработан способ подавления ограниченных внешних возмущений для непрерывных и дискретных линейных динамических систем с помощью линейной обратной связи по выходу с использованием наблюдателя. При этом используется оценка состояния, получаемая с помощью наблюдателя Люенбергера.
4. Предложен способ построения нехрупкого (допускающего вариации параметров) регулятора в форме статической линейной обратной связи по состоянию для подавления ограниченных внешних возмущений в непрерывных и дискретных линейных динамических системах.
5. Разработаны методы решения робастных вариантов задач синтеза оптимального управления с помощью линейной обратной связи по состоянию, задачи фильтрации, а также задачи построения нехрупкого регулятора для непрерывных и дискретных линейных динамических систем с ограниченными внешними возмущениями.
6. Введено понятие "наихудшего" внешнего возмущения и матричной неопределенности и получены соотношения для их определения в непрерывном и дискретном случае.
7. Доказательства полученных утверждений основываются на новой технике, использующей модифицированный вариант 5-процедуры — с двумя ограничениями.
8. Предложенные подходы опробованы на разнообразных тестовых задачах.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Хлебников М.В. Нехрупкий регулятор для подавления внешних возмущений // Автоматика и телемеханика. 2010. №4. С. 106-119.
2. Поляк Б.Т., Хлебников М.В. Подавление неслучайных ограниченных возмущений в линейных управляемых системах: управление по выходу // Тезисы докладов XVI Международной конференции по автоматическому управлению "Автоматика-2009". Черновцы, Украина, 22-25 сентября 2009 г. Черновцы: Книги-ХХ1, 2009. С. 44-45.
3. Хлебников М.В. Нехрупкий регулятор для подавления внешних возмущений // Сборник тезисов XII Международной научно-технической конференции "Моделирование, идентификация и синтез систем управления". Канака, Украина, 16-23 сентября 2009 г. Донецк: ИПММ, 2009. С. 51-52.
4. Хлебников М.В. Робастная фильтрация при неслучайных возмущениях: метод инвариантных эллипсоидов // Автоматика и телемеханика. 2009. №1. С. 147-161.
5. Поляк Б.Т., ТОПУНОВ13 М.В. Подавление ограниченных внешних возмущений: управление по выходу // Автоматика и телемеханика. 2008. №5. С. 72-90.
6. Shcherbakov P.S., topunov M.V. Extensions of Petersen's lemma on matrix uncertainty // Proceedings of the 17th IFAC World Congress. Seoul, Korea, July 6-11,2008. P. 11385-11390.
7. Polyak b.t., topunov M.V. Filtering with nonrandom noise: invariant ellipsoids technique // Proceedings of the 17th IFAC World Congress. Seoul, Korea, July 6-11, 2008. P. 15349-15352.
8. polyak b.t., Shcherbakov P.S., topunov M.V. Invariant ellipsoids approach to robust rejection of persistent disturbances // Proceedings of the 17th IFAC World Congress. Seoul, Korea, July 6-11, 2008. P. 3976-3981.
9. Polyak B.T., Nazin S.A., Khlebnikov M.V. The invariant ellipsoids technique for analysis and design of linear control systems // Advances in Mechanics: Dynamics and Control / Eds. F.L. Chernousko, G.V. Kostin, V.V. Saurin. Moscow: Nauka, 2008. P. 239-246.
10. Polyak B.T., Khlebnikov M.V., Shcherbakov P.S. Robust rejection of exogenous disturbances via invariant ellipsoids technique // Advances in Mechanics: Dynamics and Control / Eds. F.L. Chernousko, G.V. Kostin, V.V. Saurin. Moscow: Nauka, 2008. P. 247-254.
11. Khlebnikov M.V., Shcherbakov P.S. Ramifications of Petersen's lemma of uncertain matrices // Advances in Mechanics: Dynamics and Control / Eds. F.L. Chernousko, G.V. Kostin, V.V. Saurin. Moscow: Nauka, 2008. P. 296-302.
12. ПОЛЯК Б.Т., ТОПУНОВ М.В. Фильтрация при неслучайных возмущениях: метод инвариантных эллипсоидов // Доклады Академии Наук. 2008. Т. 418. №6. С. 749-753.
13. Хлебников М.В., Щербаков П.С. Лемма Питерсена о матричной знакоопределенности и ее обобщения // Автоматика и телемеханика. 2008. №11. С. 125-139.
14. поляк Б.Т., Хлебников М.В. Лилейная задача управления с ограниченными внешними возмущениями: новый подход // Труды VIII Всероссийской научной конференции "Нелинейные колебания механических систем". Н.Новгород, 22-26 сентября 2008 г. Н.Новгород: Нижегородский гос. ун-т, 2008. С. 273-278.
15Топупов — прежняя фамилия М.В. Хлебникова.
15. Поляк Б.Т., Хлебников М.В. Подавление ограниченных внешних возмущений с помощью метода инвариантных эллипсоидов: управление по выходу // Тезисы докладов IX Крымской международной математической школы "Метод функций Ляпунова и его приложения". Алушта, Украина, 15-20 сентября 2008 г. Симферополь: Таврический нац. ун-т, 2008. С. 140-141.
16. Назин С.А., Поляк Б.Т., Топунов М.В. Подавление ограниченных внешних возмущений с помощью метода инвариантных эллипсоидов // Автоматика и телемеханика. 2007. №3. С. 106-125.
17. Топунов М.В. Обобщения леммы Питерсена о матричной знакоопределенности // Материалы XIV Международной конференции по автоматическому управлению "Автоматика-2007". Севастополь, Украина, 10-14 сентября 2007 г. Севастополь: СНУЯЭиП, 2007. С. 64-65.
18. polyak в .т., Shcherbakov p.S., topunov m.v. Optimal control of a mechanical two-mass-spring system using invariant ellipsoids technique // Abstracts of the 3rd International IEEE Scientific Conference on Physics and Control (PhysCon2007). Potsdam, Germany, September 3-7, 2007. Univer-sitatsverlag Potsdam, 2007. P. 179.
19. Топунов М.В. Новые методы в линейной задаче управления с ограниченными внешними возмущениями // Труды II школы-семинара "Управление большими системами". Воронеж, 9-12 июля 2007 г. Воронеж: Научная книга, 2007. Т. 1. С. 58-63.
20. shcherbakov P.s., Topunov M.V. Optimal stabilization of uncertain system via invariant ellipsoids approach // Proceedings of the Lyapunov Memorial Conference (LMC2007). Kharkiv, Ukraine, June 24-30, 2007. P. 149-150.
21. Shcherbakov P.S., Topunov M.V. Ramification of Petersen's lemma on uncertain matrices // Abstracts of the 14th International Workshop on Dynamics and Control. Zvenigorod, May 28 - June 2, 2007. P. 66.
22. Polyak B.T., Nazin S.A., Topunov M.V. The invariant ellipsoids technique for analysis and design of linear control systems // Abstracts of the 14th International Workshop on Dynamics and Control. Zvenigorod, May 28 - June 2, 2007. P. 58.
23. Polyak В.Т., Shcherbakov P.S., Topunov M.V. Robust rejection of exogenous disturbances via invariant ellipsoids technique // Abstracts of the 14th
International Workshop on Dynamics and Control. Zvenigorod, May 28 - June 2, 2007. P. 59.
24. Поляк Б.T., Топунов M.B., Щербаков П.С. Идеология инвариантных эллипсоидов в задаче о робастном подавлении ограниченных внешних возмущений // Стохастическая оптимизация в информатике. Вып. 3. / Под ред. О.Н. Граничила. СПб: С.-Петерб. гос. ун-т, 2007. С. 51-84.
25. Топунов М.В. О классе ^-коммутативных билинейных управляемых систем // Автоматика и телемеханика. 2006. №6. С. 113-125.
26. Polyak В.Т., Nazin A.V., Topunov M.V., Nazin S.A. Rejection of bounded disturbances via invariant ellipsoids technique // Proceedings of the 45th IEEE Conference on Decision and Control (CDC'06). San Diego, USA, December 13-15, 2006. P. 1429-1434.
27. Поляк Б.Т., Топунов M.B. Подавление ограниченных внешних возмущений на примере задачи о двойном маятнике // Тезисы докладов IX Международного семинара "Устойчивость и колебания нелинейных систем управления" им. Е.С. Пятницкого. Москва, 31 мая - 2 июня 2006 г. М.: ИПУ РАН, 2006. С. 213-214.
28. Топунов М.В. Достаточное условие вложенности множеств достижимости двух гладких управляемых систем постоянного ранга, линейных по фазовым переменным // Автоматика и телемеханика. 2005. №12. С. 114-124.
29. ТОПУНОВ М.В. О выпуклости множества достижимости гладкой управляемой системы, линейной по фазовым переменным // Автоматика и телемеханика. 2004. №11. С. 79-85.
30. топунов М.В. О выпуклости множества достижимости квазикоммута-тивиой билинейной системы // Автоматика и телемеханика. 2003. №8. С. 44-53.
31. Топунов М.В. О выпуклости множества достижимости билинейной управляемой системы // Прикладная математика и механика. 2003. Т. 67. Вып. 5. С. 752-758.
В работах, опубликованных в соавторстве, личный вклад автора состоит в следующем: в [2,5,7,12,14,15,27] автору принадлежат доказательства теорем и численные расчеты; в [6,11,13,20,21] автору принадлежит постановка задачи; в [8,10,18,23,24] автору принадлежат доказательства теорем; в [9,16,22,26] автору принадлежат формулировки теорем на языке линейных матричных неравенств.
Подписано в печать:
23.03.2010
Заказ № 3443 Тираж -150 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www. autoreferat. ru
Оглавление автор диссертации — доктора физико-математических наук Хлебников, Михаил Владимирович
Введение.
1. Задача подавления ограниченных внешних возмущений
2. Структура и содержание диссертации.
3. Список обозначений.
1. Управление по состоянию.
1.1. Управление по состоянию для непрерывных систем.
1.1.1. Задача анализа.
1.1.2. Синтез оптимального управления.
1.2. Управление по состоянию для дискретных систем.
1.2.1. Задача анализа.
1.2.2. Синтез оптимального управления.
1.3. Примеры.
1.4. Выводы.
2. Управление по выходу.
2.1. Фильтрация.
2.2. Управление по выходу
2.2.1. Управление по выходу: непрерывный случай.
2.2.2. Управление по выходу: дискретный случай.
2.3. Примеры.
2.4. Выводы.
3. Управление при наличии неопределенностей.
3.1. Лемма Питерсена и ее обобщения.
3.1.1. Лемма Питерсена.
3.1.2. Радиусы знакоопределенности и невырожденности
3.1.3. Лемма Питерсена для нескольких неопределенностей
3.2. Управление по состоянию: робастный вариант.
3.2.1. Непрерывный случай.
3.2.2. Дискретный случай.
3.3. Фильтрация: робастный вариант.
3.4. Нехрупкий регулятор.
3.5. Примеры.
3.6. Выводы.
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Хлебников, Михаил Владимирович
1. Задача подавления ограниченных внешних возмущений
Задача подавления внешних возмущений является одной из основных в теории управления и рассматривается в различных ее разделах. В линейно-квадратичной оптимизации рассматриваются задачи со случайными гауссов-скими помехами (т. н. линейно-квадратичная гауссовская задача, Ь0,О). Проблема Нос-оптимизации связана либо с гармоническими внешними возмущениями, либо со случайными гауссовскими, либо с возмущениями из класса ¿2 (т. е., по-существу, убывающими с течением времени). Однако во многих практических случаях внешние возмущения являются просто ограниченными; какая-либо дополнительная информация о них отсутствует.
Задачей о подавлении неслучайных ограниченных внешних возмущений стали интересоваться еще в середине прошлого века. В 1940-е годы т. н. проблемой о накоплении возмущений занимался Б.В. Булгаков [10]. Однако основное внимание тогда уделялось проблеме анализа — каково максимальное отклонение, вызываемое произвольными ограниченными внешними возмущениями, что, по сути, являлось задачей программного оптимального управления, поскольку внешние возмущения рассматривались как управления. Лишь значительно позже появляются работы по компенсации ограниченных возмущений (см. [42]), в которых, впрочем, не предлагались методы синтеза оптимальных регуляторов.
Отметим еще, что ранее чаще употреблялся термин управление при постоянно действующих возмущениях или возмущенное движение', термин подавление внешних возмущений (заимствованный из западной литературы оборот rejection of external perturbations) появился позже.
Впервые задача об оптимальном подавлении неслучайных ограниченных возмущений в дискретном случае была сформулирована в работе Е.Д. Якубович [52] и, для некоторых частных случаев, решена в [7,52, 96]. Полное решение было построено в работах А.Е. Барабанова и О.Н. Граничина [8] и, позже, — М. Далеха и Дж. Пирсона [66]. Впоследствии эта теория получила название ^-оптимизации. Однако методы /¡-оптимизации имеют ряд существенных недостатков: ее применение к задаче синтеза оптимального управления часто приводит к регуляторам очень высокого порядка; отметим и асимптотический характер получающихся оценок. Наконец, решение важной задачи описания достижимых множеств для систем, подверженных действию ограниченных внешних возмущений, достаточно сложно. Обобщение приведенные результатов на непрерывный случай (т.н. L{-оптимизация) вызывает дополнительные сложности.
Наряду с /¡-оптимальным управлением хорошо известны также методы динамического программирования для подобных задач [57,68,70]. Ограниченные возмущения также изучаются в работах, посвященных исследованию собственно множеств достижимости (отметим здесь работы JI.C. Гноенско-го [13], Д. Бертсекаса и И. Родеса [57], A.M. Формальского [44]), а также в теории дифференциальных игр [11,27,54]. Специальные методы борьбы с внешними возмущениями предложены в теории систем переменной структуры. Управление на скользящих режимах для решения этой проблемы изучается в работах C.B. Емельянова и С.К. Коровина [17,20,26], В.И. Уткина [43], В.А. Уткина и других. В целом, подавление ограниченных возмущений традиционно считается трудной задачей в теории управления [36,37].
Существует иной подход к данной проблематике, основанный на методе эллипсоидального оценивания. Эллипсоиды довольно широко используются в различных задачах теории гарантированного оценивания, фильтрации и минимаксного управления в динамических системах при наличии неопределенностей. Принципиальными в этом направлении можно считать работы Ф. Швеппе [92], Д. Бертсекаса и И. Родеса [57, 58], А.Б. Куржанского [30], Ф.Л. Черноусько [47]. Отметим, что во многих случаях эллипсоиды оказываются удобными аппроксимациями для областей достижимости динамических систем; это позволяет широко их использовать в задачах анализа; например, работа А.В. Назина, С.А. Назина и Б.Т. Поляка [32] посвящена эллипсоидальной аппроксимации множества достижимости линейной дискретной системы.
В теории систем и автоматического управления также активно применяется концепция инвариантности (см. обзорную статью Ф. Бланкини [60] и недавнюю монографию Ф. Бланкини и С. Миани [61]). Среди различных форм инвариантных множеств особо выделяются эллипсоиды из-за их простой структуры и прямой связью с квадратичными функциями Ляпунова. Ввиду этого, в рамках эллипсоидального описания, в качестве технического средства может быть использован мощный аппарат линейных матричных неравенств {Linear Matrix Inequality, LMI) и полуопределенного программирования (Semidefinite Programming, SDP). Первой работой, в которой систематически изложена техника LMI, является книга С. Бойда с соавторами [62], а первой монографией на русском языке, посвященной этому вопросу, является книга Д.В. Баландина и М.М. Когана [5].
Необходимо упомянуть, что техника LMI, очень популярная в последнее время, уже использовалась в целях подавления возмущений [5,53,59,62]. Однако в большинстве работ не рассматривались задачи подавления Loo-ограниченных возмущений. В [67] L.2-ограниченные возмущения рассматривались в пространстве состояний на языке уравнений Риккати; в [74] для задач с L2-ограниченными возмущениями была впервые применена LMI-техника. В [5, гл. 8] техника LMI также применялась для подавления возмущений, ограниченных в /^-норме. В статье Дж. Абедора с соавторами [53] решаются задачи анализа и синтеза при ограниченных внешних возмущениях, но в ней рассматривается лишь непрерывный случай; кроме того, в [53] не используется явно техника LMI.
Отметим, что в западной литературе рассматриваемый круг вопросов называется peak-to-peak gain minimization. Это означает, что целью является уменьшение максимального {пикового) значения выхода при ограниченных максимальных значениях возмущений (речь идет о системах с одним входом - одним выходом; эллипсоидальная техника обобщает этот подход на многомерный случай).
В диссертации предлагается общий подход к широкому классу задач, связанных с подавлением неслучайных ограниченных внешних возмущений. Он основан на методе инвариантных эллипсоидов и систематическом использовании техники LMI. Применение этой концепции позволяет свести синтез оптимального регулятора к поиску наименьшего инвариантного эллипсоида замкнутой динамической системы. Такой подход приводит к простым оптимальным (или субоптимальным) регуляторам; он имеет большой потенциал,и возможности для обобщений и в равной мере распространим как на непрерывный, так и на дискретный вариант задачи.
Для решения полученных задач существуют мощные вычислительные методы [33,63,83] и соответствующие пакеты программ, среди которых особо отметим свободно распространяемые программные пакеты YALMIP [79], SeDuMi [93] для системы MATLAB [3,48], а также пакет cvx [71], разработанный под руководством С. Бойда.
Мы ограничиваемся случаем линейных стационарных систем, для которого предлагаемая техника особенно проста и наглядна. Однако идеология инвариантных эллипсоидов может быть применена и в более общих ситуациях, см. по этому поводу [60-62,89].
В каждой из глав диссертации дан обзор литературы по соответствующей тематике.
Заключение диссертация на тему "Метод инвариантных эллипсоидов для подавления ограниченных внешних возмущений в линейных системах управления"
3.6. Выводы
В главе предложен простой и универсальный подход к решению задачи робастного подавления произвольных ограниченных внешних возмущений с помощью статической линейной обратной связи по состоянию. Как и в предыдущих главах, применение концепции инвариантных эллипсоидов позволило переформулировать исходную проблему в терминах линейных матричных неравенств и свести ее к задачам полуопределенного программирования и одномерной минимизации, легко решающихся численно.
Эффективность полученных результатов продемонстрирована на примерах систем достаточно большого порядка.
Сравним полученные результаты с ранее известными, в частности, с результатами, полученными в наиболее близкой по тематике работе [81].
1) Работа [81] посвящена вопросам устойчивости и стабилизации интервальной системы. В диссертации рассмотрена задача в существенно более общей постановке; при этом: разработан простой и универсальный подход к решению задачи робастного подавления ограниченных внешних возмущений в линейной динамической системе с помощью линейной обратной связи по состоянию; предложен метод решения задачи робастной фильтрации для линейной стационарной системы с ограниченными внешними возмущениями; предложен способ построения нехрупкого регулятора, т. е. допускающего вариации его параметров.
2) Получены разнообразные обобщения и уточнения леммы Питерсена о ро-бастной матричной знакоопределенности, которая часто привлекается при решении задач квадратичной устойчивости, построении робастно квадратично стабилизирующих регуляторов, в робастной LQR-задаче и др.; необходимые условия устойчивости системы, полученные в [81], являются ошибочными (см. [82]).
3) В равном объеме рассмотрен как непрерывный, так и дискретный вариант задачи; в [81] исследован только непрерывный случай.
4) В качестве целевой функции выбран критерий следа; это позволило свести соответствующую проблему к стандартной задаче SDP; в работе [81] не рассматривается понятие инвариантного эллипсоида и тем более авторы не задаются целью его минимизации.
5) Введено понятие "наихудших" матричной неопределенности и внешнего возмущения и получены соотношения для их определения в непрерывном и дискретном случае.
Заключение
В диссертации исследован комплекс вопросов, связанных с проблемой подавления неслучайных ограниченных внешних возмущений в линейных управляемых системах. Для решения поставленной проблемы используется метод инвариантных эллипсоидов, который сводит синтез оптимального регулятора к поиску наименьшего инвариантного эллипсоида замкнутой динамической системы.
Применение концепции инвариантных эллипсоидов позволило переформулировать исходную проблему в терминах линейных матричных неравенств, а сам синтез регулятора непосредственно свести к задачам полуопределенного программрхрования и одномерной выпуклой минимизации, легко решающихся численно.
В диссертации решены следующие основные задачи.
1) Разработан метод синтеза оптимального управления с помощью статической линейной обратной связи по состоянию для непрерывных и дискретных линейных динамических систем с ограниченными внешними возмущениями. Исходные задачи сведены к эквивалентным условиям в виде линейных матричных неравенств и задаче полуопределенного программирования.
2) Предложенный подход учитывает возможную неопределенность в начальном состоянии системы, а также наличие ограничений на управление.
3) Помимо случая евклидовых ограничений исследован случай интервальных ограничений на допустимые возмущения.
4) Предложен метод решения задачи фильтрации (оценки состояния динамической системы по измерениям) для непрерывных и дискретных динамических систем с ограниченными внешними возмущениями. Построен оптимальный фильтр и найдена равномерная оценка состояния.
5) Разработан способ подавления ограниченных внешних возмущений для непрерывных и дискретных линейных динамических систем с помощью линейной обратной связи по выходу с использованием наблюдателя. При этом используется оценка состояния, получаемая с помощью наблюдателя Люенбергера.
6) Получены разнообразные обобщения и уточнения леммы Питерсена о ро-бастной матричной знакоопределенности, которая часто используется при решении задач квадратичной устойчивости, построении робастно квадратично стабилизирующих регуляторов, в робастной ЬСЖ-задаче и др.
7) Предложен способ построения нехрупкого (допускающего вариации параметров) регулятора в форме статической линейной обратной связи по состоянию для подавления ограниченных внешних возмущений в непрерывных и дискретных линейных динамических системах.
8) Разработаны методы решения робастных вариантов задач синтеза оптимального управления с помощью линейной обратной связи по состоянию, задачи фильтрации, а также задачи построения нехрупкого регулятора для непрерывных и дискретных линейных динамических систем с ограниченными внешними возмущениями.
9) Введено понятие "наихудшего" внешнего возмущения и матричной неопределенности и получены соотношения для их определения в непрерывном и дискретном случае.
10) Доказательства полученных утверждений основываются на новой технике, использующей модифицированный вариант 5-процедуры — с двумя ограничениями.
Эффективность полученных результатов продемонстрирована на примерах систем достаточно большого порядка.
Для линейных стационарных систем предлагаемая в диссертации техника особенно проста и наглядна, однако, идеология инвариантных эллипсоидов может быть применена и в более общих ситуациях.
Библиография Хлебников, Михаил Владимирович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. АНДРЕЕВ Ю.Н. Дифференциально-геометрические методы в теории управления // Автоматика и телемеханика. 1982. №10. С. 5-46.
2. Андронов A.A., Понтрягин JI.C. Грубые системы // Андронов A.A. Собрание трудов. М.: АН СССР, 1956. С. 183-187.
3. Ануфриев И.Е., Смирнов А.Б., Смирнова E.H. Matlab 7 в подлиннике. СПб: БХВ-Петербург, 2005. 1104 с.4. баландин Д.В., Коган М.М. Синтез грубых регуляторов на основе линейных матричных неравенств // Автоматика и телемеханика. 2006. №12. С. 154-162.
4. Барабанов А.Е. Оптимальное управление неминимально-фазовым дискретным объектом с произвольным ограниченным шумом // Вестник ЛГУ. Серия: математика. 1980. Т. 13. С. 119-120.
5. Барабанов А.Е., Граничин О.Н. Оптимальный регулятор для линейных объектов с ограниченным шумом // Автоматика и телемеханика. 1984. №5. С. 39-46.9. беллман Р. Введение в теорию матриц. М.: Наука, 1969. — 368 с.
6. B.В. Александрова. М.: МГУ им. М.В. Ломоносова, 1993. С. 7-29.
7. Голуб Дж., Ван Лоан Ч. Матричные вычисления. М.: Мир, 1999. — 548 с.
8. Гусев C.B., Лихтарников А.Л. Очерк истории леммы Калмана-Попо-ва-Якубовича и 5-процедуры // Автоматика и телемеханика. 2006. №11.1. C. 77-121.
9. ДАВЫДОВ A.A. Особенности границы достижимости в двумерных управляемых системах // Успехи математических наук. 1982. Вып. 37. №3. С. 183-184.
10. Емельянов C.B. Системы автоматического управления с переменной структурой. М.: Наука, 1967. — 336 с.
11. Емельянов C.B., Коровин С.К., Сизиков В.И. Бинарные системы управления свободным движением динамических объектов. М.: Меж-дунар. НИИ проблем управления. Серия: Бинарные динамические системы. 1983. Вып. 3. 90 с.
12. Емельянов C.B. Бинарные системы автоматического управления. М.: Междунар. НИИ проблем управления. Серия: Бинарные динамические системы. 1984. Вып. 1. — 313 с.
13. Емельянов C.B., Коровин C.K. Новые типы обратной связи: Управление при неопределенности. М.: Наука, 1997. — 352 с.
14. Емельянов C.B. Избранные труды по теории управления. М.: Наука, 2006. 450 с.
15. Жермоленко В.Н. Робастная стабилизация параметрически возмущаемой системы // Автоматика и телемеханика. 2001. №2. С. 122-134.
16. Жермоленко В.Н. Максимальное отклонение колебательной системы второго порядка с внешним и параметрическим возмущениями // Известия РАН. ТиСУ. 2007. №3. С. 75-80.
17. ЗУБОВ В.И. Колебания в нелинейных и управляемых системах. Л.: Суд-промгиз, 1962. — 630 с.26. коровин с.к., фомичев В.В. Наблюдатели состояния для линейных систем с неопределенностью. М.: Физматлит, 2007. — 224 с.
18. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. — 456 с.
19. Красовский H.H. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука, 1985. — 520 с.
20. КУНЦЕВИЧ В.М. Управление в условиях неопределенности: гарантированные результаты в задачах управления и идентификации. Киев: Нау-кова думка, 2006. — 261 с.
21. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. — 392 с.
22. Малкин И.г. Теория устойчивости движения. М.: Гостехиздат, 1952. — 432 с.
23. Назин A.B., Назин с.а., Поляк Б.Т. О сходимости внешних эллипсоидальных аппроксимаций областей достижимости линейных дискретных динамических систем // Автоматика и телемеханика. 2004. №8. С. 39-61.
24. Нестеров Ю.Е. Методы выпуклой оптимизации. М.: МЦНМО, 2009.
25. Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. — М.: Наука, 2002. 303 с.
26. Семенов Ю.М. Введение в теорию достижимости линейных систем. — Чебоксары: Чуваш, гос. ун-т, 2006. — 134 с.
27. Сиротин А.Н., Формальский A.M. Области достижимости и управляемости линейных дискретных систем // Изв. РАН. ТиСУ. 2002. №4. С. 5-16.
28. Сиротин А.Н., Формальский А.М. Достижимость и управляемость дискретных систем при ограниченных по величине и импульсу управляющих воздействиях // Автоматика и телемеханика. 2003. №12. С. 17-32.
29. Уланов Г.М. Динамическая точность и компенсация возмущений в системах автоматического управления. М.: Машиностроение, 1971. — 318 с.
30. Уткин В.И. Скользящие режимы в задачах оптимизации и управления.1. М.: Наука, 1981.- 368 с.
31. Формальский А.М. Об угловых точках границ областей достижимости // Прикладная математика и механика. 1983. Т. 47. Вып. 4. С. 566-574.45. фурасов В.Д. Задачи гарантированной идентификации. М.: Бином, 2005. 152 с.
32. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир, 1989. — 656 с.
33. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука, 1988. — 320 с.
34. Чурилов А.Н., ГЕССЕН A.B. Исследование линейных матричных неравенств. Путеводитель по программным пакетам. СПб.: С.-Петерб. гос. ун-т, 2004. 148 с.
35. Якубович В.А. Частотная теорема в теории управления // Сибирский матем. журнал. 1973. Т. 14. №2. С. 384-419.
36. Якубович Е.Д. Решение задачи оптимального управления для линейных дискретных систем // Автоматика и телемеханика. 1975. №9. С. 73-79.
37. Abedor J., Nagpal К., Poolla К. A linear matrix inequality approach to peak-to-peak gain minimization // Int. J. of Robust and Nonlinear Control. 1996. No. 6. P. 899-927.
38. Basar Т., Olsder G. Dynamic Noncooperative Game Theory. N.Y.: Acad. Press, 1982.
39. Basar Т., bernhard P. Яоо-Optimal Control and Related Minimax Design Problems: a Dynamic Game Approach. Boston: Birkháuser, 1995.56. ben-tal A., Nemirovski A. Lectures on Modern Convex Optimization. Philadelphia: SIAM, 2001.
40. Blanchini E, Sznaier M. Persistent disturbance rejection via static state feedback// IEEE Trans. Automat. Control. 1995. No. 40. P. 1127-1131.
41. BLANCHINI F. Set invariance in control — a survey // Automatica. 1999. No. 35. P. 1747-1767.
42. Blanchini R, Miani S. Set-Theoretic Methods in Control. Birkhauser, 2008.
43. Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. Philadelphia: SIAM, 1994.
44. Boyd S., Vandenberge L. Convex Optimization. Cambridge: Cambridge Univ. Press, 2004.64. brickman L. On the field of values of a matrix // Proceedings of the American Mathematical Society. 1961. No. 12. P. 61-66.
45. Chernousko F., polyak B. (eds) Special issue: Set-membership Modelling of Uncertainty in Dynamical Systems. Math, and Comp. Modelling of Dyn. Syst., 2005. Vol. 11. No 2.
46. Dahleh M.A., Pearson J.B. /i-Optimal feedback controllers for MIMO discrete-time systems // IEEE Trans. Automat. Control. 1987. No. 32. P. 314-322.
47. Doyle J.C., Glover K., Khargonekar P.P., Francis B.A. State-space solution to standard H2 and H°° control problem // IEEE Trans. Autom. Control. 1989. Vol. 34. No 8. P. 831-847.
48. Elia N., Dahleh M.A. Minimization of the worst case peak-to-peak gain via dynamic programming: state feedback case // IEEE Trans. Automat. Control. 2000. No. 45. P. 687-701.
49. Freeman R.A., Kokotovic P.V. Robust Nonlinear Control Design. StateSpace and Lyapunov Techniques. Boston: Birkhauser, 1996.
50. Glover D., Schweppe F. Control of linear dynamic systems with set constrained disturbances // IEEE Trans. Automat. Control. 1971. No. 16. P. 411-423.
51. Grant M., Boyd S. CVX: Matlab software for disciplined convex programming (web page and software). URL http://stanford.edu/~boyd /cvx
52. Hao F., Chu T., Huang L., Wang L. Non-fragile controllers of peak gain minimization for uncertain systems via LMI approach // Dynamics of Continuous, Discrete, and Impulsive Systems. 2003. Vol. 10. P. 681-694.
53. Hao F., Chu T., Wang L., Huang L. An LMI approach to persistent bounded disturbance rejection for uncertain impulsive systems // Proceedingsof the 42nd IEEE Conference on Decision and Control (CDC'03). Hawaii, USA, December 9-12, 2003. P. 4068-4073.
54. Iwasaki T., Skelton R.E. All controllers for the general H,x control problem: LMI existence conditions and state space formulas // Automatica. 1994. Vol. 30. No. 8. P. 1307-1317.
55. Jadbabaie A., Abdallah C., Dorato P., Famularo D. Robust, nonfragile, and optimal controller design via linear matrix inequalities // Proceedings of the American Control Conference (ACC'98). Philadelphia, USA, June 24-26, 1998. P. 2842-2846.
56. Khargonekar P.P., Petersen I.R., Zhou K. Robust stabilization of uncertain linear systems: Quadratic stabilizability and H^ control theory // IEEE Trans. Automat. Control. 1990. Vol. 35. P. 356-361.
57. Keel L.H., Bhattacharyya S.P. Robust, fragile, or optimal? // IEEE Trans. Autom. Control. 1997. Vol. 42. P. 1098-1105.
58. Kurzhanski A.B., Valyi I. Ellipsoidal Calculus for Estimation and Control. Boston: Birkhauser, 1997.
59. Lófberg J. YALMIP: Software for solving convex (and nonconvex) optimization problems // Proceedings of the American Control Conference (ACC'06). Minneapolis, USA, June 14-16, 2006. URL http:// control.ee.ethz.ch/~joloef/wiki/pmwiki.php
60. Luenberger D.G. An introduction to observers // IEEE Trans. Autom. Control. 1971. Vol. 35. P. 596-602.
61. Mao W.-J., Chu J. Quadratic stability and stabilization of dynamic interval systems // IEEE Trans. Automat. Control. 2003. Vol. 48. No. 6. P. 1007-1012.
62. MAO W.-J., Chu J. Corrections to "Quadratic stability and stabilization of dynamic interval systems" // IEEE Trans. Automat. Control. 2006. Vol. 51. No. 8. P. 1404-1405.
63. Nesterov Yu., Nemirovsky A. Interior-Point Polynomial Algorithms in Convex Programming. Philadelphia: SIAM, 1994.
64. Petersen I.R. A stabilization algorithm for a class of uncertain linear systems // Syst. Contr. Lett. 1987. Vol. 8. P. 351-357.
65. Petersen I.R., Hollot C.V. A Riccati equation approach to the stabilization of uncertain linear systems // Automatica. 1986. Vol. 22. No. 4. P. 397-411.
66. Polyak B.T. Convexity of quadratic transformations and its use in control and optimization // J. Optim. Theory and Appl. 1998. V. 99. P. 553-583.
67. Polyak B.T., Nazin S.A., Durieu C., Walter E. Ellipsoidal parameter or state estimation under model uncertainty // Automatica. 2004. Vol. 40. P. 1171-1179.
68. Polyak B.T., Nazin S.A. Invariant ellipsoids technique for persistent disturbance rejection // Proceedings of the 13th IFAC Workshop on Control Applications of Optimization (CAO'06). Kachan, France, April 26-28, 2006. P. 422-427.
69. Polyak B.T., Shcherbakov PS. Ellipsoidal approximations to attraction domains of linear systems with bounded control // Proceedings of the American Control Conference (ACC'09). St. Louis, USA, June 10-12, 2009. P. 5363-5367.
70. Reinelt W. Robust control of a two-mass-spring system subject to its input constraints // Proceedings of the American Control Conference (ACC 2000). Chicago, USA, June 28-30, 2000. P. 1817-1821.
71. ROHN J. Positive definiteness and stability of interval matrices // SIAM J. Matrix Analysis Appl. 1994. Vol. 15. No. 1. P. 175-184.
72. Schweppe F.C. Uncertain Dynamic Systems. NJ: Prentice Hall, 1973.
73. Sturm J.F. Using SeDuMi 1.02, a Matlab toolbox for optimization over symmetric cones (updated for version 1.05). URL http: //sedumi. ie. lehigh.edu/
74. Alamo Т., Tempo R., Ramirez D.R., Camacho E.F. A new vertex result for robustness problems with interval matrix uncertainty // Proceedings of the European Control Conference (ECC'07). Kos, Greece, July 2-5, 2007, paper ThC07.3.
75. Venkatesh S., Dahleh M. Does star norm capture l\ norni? // Proceedings of the American Control Conference. 1995. P. 944-945.
76. Vidyasagar M. Optimal rejection of persistent bounded disturbances // IEEE Trans. Automat. Control. 1986. No. 31. P. 527-535.
77. Yang G.-H., Wang J.L. Nonfragile H^ output feedback controller design for linear systems // Journal of Dynamic Systems, Measurement, and Control. 2003. Vol. 125. No. 1. P. 117-123.
78. XlE L. Output feedback control of systems with parameter uncertainty // Int. J. Control. 1996. Vol. 63. P. 741-750.
79. Zhou K., Doyle J., Glover K. Robust and Optimal Control. NJ: Prentice Hall, 1996.
80. ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
81. Хлебников М.В. Нехрупкий регулятор для подавления внешних возмущений // Автоматика и телемеханика. 2010. №4. С. 106-119.
82. Хлебников М.В. Робастная фильтрация при неслучайных возмущениях: метод инвариантных эллипсоидов // Автоматика и телемеханика. 2009. №1. С. 147-161.
83. Поляк Б.Т., Топунов2 М.В. Подавление ограниченных внешних возмущений: управление по выходу // Автоматика и телемеханика. 2008. №5. С. 72-90.
84. Polyak B.t., Khlebnikov M.V., Shcherbakov P.S. Robust rejection of exogenous disturbances via invariant ellipsoids technique // Advances in2Топунов — прежняя фамилия м.в. Хлебникова.
85. Mechanics: Dynamics and Control / Eds. F.L. Chernousko, G.V. Kostin, V.V. Saurin. Moscow: Nauka, 2008. P. 247-254.
86. Khlebnikov M.V., shcherbakov P.S. Ramifications of Petersen's lemma of uncertain matrices // Advances in Mechanics: Dynamics and Control / Eds. F.L. Chernousko, G.V. Kostin, V.V. Saurin. Moscow: Nauka, 2008. P. 296-302.
87. ПОЛЯК Б.Т., ТОПУНОВ M.B. Фильтрация при неслучайных возмущениях: метод инвариантных эллипсоидов // Доклады Академии Наук. 2008. Т. 418. №6. С. 749-753.
88. Хлебников М.В., Щербаков П.С. Лемма Питерсена о матричной знакоопределенности и ее обобщения // Автоматика и телемеханика. 2008. №11. С. 125-139.
89. Назин С.А., Поляк Б.Т., Топунов М.В. Подавление ограниченных внешних возмущений с помощью метода инвариантных эллипсоидов // Автоматика и телемеханика. 2007. №3. С. 106-125.
90. Топунов М.В. Новые методы в линейной задаче управления с ограниченными внешними возмущениями // Труды II школы-семинара "Управление большими системами". Воронеж, 9-12 июля 2007 г. Воронеж: Научная книга, 2007. Т. 1. С. 58-63.
91. Shcherbakov P.S., Topunov M.V. Optimal stabilization of uncertain system via invariant ellipsoids approach // Proceedings of the Lyapunov Memorial Conference (LMC2007). Kharkiv, Ukraine, June 24-30, 2007. P. 149-150.
92. Shcherbakov P.S., Topunov M.V. Ramification of Petersen's lemma on uncertain matrices // Abstracts of the 14th International Workshop on Dynamics and Control. Zvenigorod, May 28 June 2, 2007. P. 66.
93. Polyak B.T., Nazin S.A., Topunov M.V. The invariant ellipsoids technique for analysis and design of linear control systems // Abstracts of the 14th International Workshop on Dynamics and Control. Zvenigorod, May 28 June 2, 2007. P. 58.
94. Polyak B.T., Shcherbakov P.S., Topunov M.V. Robust rejection of exogenous disturbances via invariant ellipsoids technique // Abstracts of the 14th International Workshop on Dynamics and Control. Zvenigorod, May 28 June 2, 2007. P. 59.
95. Polyak В.Т., Nazin А.V., Topunov M.V., Nazin S.A. Rejection of bounded disturbances via invariant ellipsoids technique // Proceedings of the 45th IEEE Conference on Decision and Control (CDC'06). San Diego, USA, December 13-15, 2006. P. 1429-1434.
96. Топунов М.В. Достаточное условие вложенности множеств достижимости двух гладких управляемых систем постоянного ранга, линейных по фазовым переменным // Автоматика и телемеханика. 2005. №12. С. 114-124.
97. Топунов М.В. О выпуклости множества достижимости гладкой управляемой системы, линейной по фазовым переменным // Автоматика и телемеханика. 2004. №11. С. 79-85.
98. Топунов М.В. О выпуклости множества достижимости квазикоммутативной билинейной системы // Автоматика и телемеханика. 2003. №8. С. 44-53.
99. Топунов М.В. О выпуклости множества достижимости билинейной управляемой системы // Прикладная математика и механика. 2003. Т. 67. Вып. 5. С. 752-758.
-
Похожие работы
- Алгоритмы робастного субоптимального управления для динамических объектов
- Оценка областей притяжения и инвариантных множеств в задаче управления колёсным роботом
- Управление движением морских судов с учетом неопределенностей в задании внешних возмущающих воздействий
- Локально-оптимальное управление в условиях неопределенности
- Робастное управление с компенсацией возмущений
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность