автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Адаптивное робастное управление в 4 постановке
Автореферат диссертации по теме "Адаптивное робастное управление в 4 постановке"
ИНСТИТУТ ПРОБЛЕМ УПРАВЛЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК
РГ6 ОД
^ СЕН 1Ь9У пРавах рукописи
СОКОЛОВ ВИКТОР ФЕДОРОВИЧ АДАПТИВНОЕ РОБАСТНОЕ УПРАВЛЕНИЕ В /1 ПОСТАНОВКЕ
05.13.01 - управление в технических системах
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
Москва - 1998
Работа выполнена в Сыктывкарском государственном университете на кафедре геометрии, математической статистики и теории управления математического факультета
Официальные оппоненты:
доктор физ.-мат. наук, профессор Арутюнов A.B.; доктор физ.-мат. наук, профессор Бобылев H.A.; доктор физ.-мат. наук¥профессор Брусин В. А.
Ведущая организация - Санкт-Петербургский государственный технический университет.
Защита диссертации состоится 29 октября 1998 г. в 14 часов на заседании диссертационного совета Д 002.68.03 Института проблем управления РАН по адресу: 117806, Москва, ул. Профсоюзная, 65.
С диссертацией можно ознакомиться в библиотеке Института проблем управления РАН.
Автореферат разослан
1998 г.
Ученый секретарь диссертационного совета кандидат технических наук
Власов С.А.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Задачей теории адаптивного управления, зародившейся в середине 50-х, является управление системами в условиях параметрической неопределенности. До конца 70-х в основном рассматривались адаптивные системы без возмущений или со стохастическими аддитивными Ьозмущениями. Для систем без возмущений были получены многочисленные результаты по устойчивости адаптивных систем, а для объектов со стохастическими возмущениями были построены системы оптимального адаптивного управления. Однако стохастические модели возмущений не являются универсальными и не могут использоваться в задачах управления, в которых возмущения не имеют стохастической природы илй информация о стохастических свойствах возмущеНйй недоступна.
В конце 70-х были построены примеры объектов управления с малыми и даже исчезающими возмущениями, для которых разработанные к тому времени законы адаптивного управления приводили к неустойчивости замкнутых систем. Эти примеры явились толчком к активному развитию в 80-х теории адаптивного робастного управления, предметом исследования которой стали задачи обеспечения устойчивости систем в условиях Детерминированных возмущений и параметрической неопределенности.
Исторически первой моделью детерминированных возмущений явились аддитивные возмущения, принимающие значения в некотором известном ограниченном множестве. Различные оптимальные задачи оценивания состояния и управления на конечном промежутке времени для объектов с такими возмущениями рассматривались в работах H.H. Красовского, А.Б. Куржанского, А.И. Субботина, Ф.Л. Черноусько и других авторов и получили наименование задач управления с гарантированным результатом. Задачи управления с ограниченными аддитивными возмущениями на бесконечном промежутке времени отличаются наличием дополнительного требования устойчивости системы. Решение задачи синтеза оптимального минимаксного регулятора для линейного дискретного скалярного объекта с ограниченной помехой было получено А.Е. Барабановым и О.Н. Граничиным в 1984 г. Впоследствии М. Dahleh и J.B. Pearson получили близкий результат в 1986 г. и его многомерное обощение в 1987 г. Эти работы послужили толчком к развитию нового направления - теории Ii оптимального управления.
Модель аддитивных возмущений с известной верхней границей ис-
пользовалась в теории адаптивного управления в рамках метода рекуррентных целевых неравенств, предложенного В.А. Якубовичем во второй половине 60-х. Согласно этому методу задача адаптивного управления сводится к асимптотическому решению последовательности неравенств, определяемых данными измерений и известной верхней границей возмущений. Для решения задачи были разработаны различные варианты алгоритмов оценивания неизвестных параметров, обеспечивающих сходимость оценок за конечное время благодаря введению зоны нечувствительности.
Модель возмущений с известной верхней границей широко используется с начала 80-х и в теории идентификации и оценивания параметров. Основной задачей этого направления теории, имеющей несколько наименований в англоязычной литературе и получивший на русском языке название теории гарантированного оценивания, является построение внешних и внутренних аппроксимаций множества оценок, согласованных с наблюдениями и априорной информацией о системе. Необходимость построения аппроксимаций связана со сложностью полного и точного описания множества согласованных оценок, а аппроксимации выбираются в классе эллипсоидов, параллелотопов и т. п. Об интенсивности потока публикаций по этому направлению свидельствуют, в частности, специальные выпуски журналов International Journal of Adaptive Control and Signal Processing (1994 и 1995) и Mathematics and Computers in Simulations (1990). Несмотря на большое число публикаций, задачи теории гарантированного оценивания рассматриваются в основном вне контекста задач управления.
Предметом теории робастного управления являются системы, в которых присутствуют возмущения самого оператора системы. Бурное развитие теории робастного управления началось, по видимому, после того, как J.C. Doyle, G. Stein и М. Safonov (1981) исследовали устойчивость линейных стационарных систем, возмущенных диагональными линейными стационарными операторами с известной верхней оценкой их нормы. Именно системы со стационарными возмущениями были и остаются основным объектом исследований как за рубежом, так и в России (Ю.И. Неймарк, A.A. Первозванский, Б.Т. Поляк, Я.З. Цып-кин и другие). Более широкий класс возмущений в виде ограниченных линейных нестационарных или нелинейных операторов из loo в /то рассматривается в ¡i теории робастного управления. Основы этой теории заложили М. Dahleh (1988), М. Khammash и J.B. Pearson (1991, 1993), получившие необходимые и достаточные условия робастной устойчиво-
сти и достижения робастного качества систем со структурированными возмущениями. Впоследствии M. Khammash (1995) получил результаты, позволяющие вычислять асимптотическое качество робастных систем в классах возмущений с конечной памятью и с затухающей памятью.
Задачи робастного управления сделали актуальной разработку методов идентификации и оценивания параметров, адекватных этим задачам. Проблемы "робастной идентификации", или "идентификации для робастного управления", обсуждались в специальных выпусках ведущих журналов по теории управления - IEEE Transactions on Automatic Control (1992) и Automática (1995) - и находятся в фокусе внимания на крупнейших научных конференциях по управлению. Однако два основных направления робастной идентификации - задачи верификации модели (model validation) и I-, теория оценивания - развиваются, как и теория гарантированного оценивания, вне контекста задач управления. В свою очередь, полученные к настоящему времени условия робастной устойчивости и оценки робастного качества адаптивных систем являются, по существу, качественными в силу своей консервативности.
Работа над диссертацией велась по планам научно-исследовательской работы кафедры геометрии, математической статистики и теории управления Сыктывкарского государственного университета в рамках темы "Аналитические и геометрические вопросы теории динамических систем" №ГР 01.940000331 и была поддержана грантами Госкомвуза РФ (1993-1995), Российского фонда фундаментальных исследований (19961998), Министерства общего и профессионального образования РФ -(1998 - ), а также Шведским Институтом (1997).
Цель работы. Основные цели настоящей работы: развитие результатов /i теории робастного управления в направлении, позволяющем оценивать робастное качество систем и решать различные задачи синтеза адаптивного робастного управления; синтез субоптимальных робастных регуляторов для скалярных объектов управления; решение задач адаптивной стабилизации и синтеза неконсервативного адаптивного управления скалярными объектами с использованием адекватных /1 теории робастного управления алгоритмов оценивания градиентного типа и множественного оценивания.
Научная новизна и практическая ценность.
- Получены явные формулы для наихудшего значения верхнего предела супрс -;ум нормы выхода многомерной линейной дискретной ста-
ционарной системы в классах ограниченных аддитивных возмущений и структурированных неопределенностей с конечной памятью и с затухающей памятью в задачах регулирования и слежения (при наличии дополнительного фиксированного входного сигнала).
- Поскольку модели неопределенностей с конечной памятью и с затухающей памятью неверифицируемы на основе конечного набора измерений, рассмотрены подклассы неопределенностей с ограниченной памятью и с экспоненциально убывающими импульсными характеристиками, допускающие такую верификацию. Показано, что условия робастной устойчивости и формулы для асимптотических показателей в задаче регулирования в классе неопределенностей с конечной памятью являются неконсервативными для класса неопределенностей с ограниченной, но большой памятью. Аналогичное свойство Неконсервативности показателей качества в задаче слежения выполняется при некотором дополнительном свойстве фиксированного входного сигнала, справедливом, в частности, для периодических сигналов.
- Поставлены и решены задачи синтеза субоптимальных робаст-ных регуляторов для конечномерных скалярных объектов управления в условиях структурированной неопределенности (независимые ограниченные операторные возмущения в каналах выхода и управления) и неструктурированной неопределенности (смешанные ограничения на операторные возмущения в каналах выхода и управления). Рассмотренные задачи синтеза являются обобщением задачи синтеза /1 оптимального регулятора для скалярного объекта.
- Рассмотрена нетрадиционная задача оценивания по результатам наблюдений неизвестного вектора номинальных параметров дискретного скалярного объекта. Нетрадиционность задачи заключается во включении в список оцениваемых параметров неизвестных норм каждого из возмущений и в предположении о неизвестной верхней границе нормы аддитивного возмущения. На основе понятия вектора оценок, согласованных с наблюдениями и априорной информацией, формализована неидентифицируемость вектора номинальных параметров управляемого объекта.
- На основе метода рекуррентных целевых неравенств решены задачи адаптивной стабилизации скалярного объекта в условиях неопределенности и аддитивных возмущений с неизвестной верхней границей.
- Поставлены и решены не рассматривавшиеся в литературе задачи синтеза неконсервативного адаптивного управления скалярным объектом в условиях неопределенности и аддитивных возмущений с иеиз-
вестной верхней границей: задачи регулирования и слежения, задача управления объектом с неизвестной структурой. Под неконсервативным понимается адаптивное управление, гарантирующее ту же оценку асимптотического робастного показателя качества, что и для объекта с полностью известными параметрами и нормами возмущений. Решение задач основано на использовании множественных оценок неизвестных параметров и выборе в качестве идентификационного критерия робастного показателя качества в задаче управления.
- Естественным следствием сложности задачи синтеза неконсервативного адаптивного управления является сложность используемых для ее решения алгоритмов. Рассмотрены проблемы реализации алгоритмов неконсервативного адаптивного управления, возможные модификации и эвристические аппроксимации, позволяющие решать более слабые задачи адаптивного робастного управления. Приведены результаты моделирования, подтверждающие работоспособность предложенных алгоритмов.
Апробация полученных результатов. Основные результаты диссертации докладывались на международных семинарах "Устойчивость и колебания нелинейных систем управления" (Москва, 1998, 1996), международных конференциях "Дифференциальные уравнения и применения" (С.-Петербург, 1998, 1996), Европейской конференции по управлению (Брюссель, 1997), симпозиумах IFAC/IFORS по идентификации систем (Фукуока, 1997; Копенгаген, 1994), Американской конференции по управлению (Альбукерке, 1997), симпозиуме IFAC по адаптивным системам в управлении и обработке сигналов (Будапешт, 1995), Всероссийском семинаре "Проблемы нелинейной динамики" (Горький, 1993), С. Петербургском семинаре "Теория управления" (1992), Ленинградском семинаре "Адаптивные и экспертные си-темы управления" (1991), на научных семинарах в С.-Петербургском университете (1989,1994,1998), С.-Петербургском техническом университете (1994,1998), Институте математики и механики УрО РАН (1994), в Королевском технологическом институте, г. Стокгольм (1997), в университетах гг. Гетеборг (1997), Лулео (1997), Бирмингем (1996), Оксфорд (1996).
Публикации. По теме диссертации опубликовано 28 работ в журналах Автоматика и телемеханика, Известия РАН Сер. Техническая кибернентика, Вестник Сыктывкарского университета, Automática, Systems and Control Letters, в трудах Коми научного центра УрО РАН, в трудах международных конференций. Основные результаты днссерта-
ции изложены в работах [3,4,8-10,21,23-25,27].
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы, насчитывающего 143 наименования, изложена на 290 страницах текста, включающего 27 иллюстраций и подготовленного в издательской системе Ш|гХ.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Введение содежит два раздела: робастное управление и адаптивное управление. В первом разделе дано краткое описание основных направлений теории робастного управления, основных результатов /1 теории робастного управления, постановок задач синтеза ¡1 робастных регуляторов и связь этих задач с /1 теорией оптимального управления и минимаксными (игровыми) задачами управления. Во втором разделе обсуждается различие стохас, ических и детерминированных задач адаптивного управления, приведена краткая историческая справка по адаптивному робастному управлению. Дано краткое описание идентификационного подхода к синтезу адаптивного управления, метода рекурррентных целевых неравенств, задач гарантированного оценивания и проблем идентификации для робастного управления. Обсуждаются постановки задач адаптивного управления, вопросы выбора идентификационного критерия и приведена постановка задачи синтеза неконсервативного адаптивного управления.
Глава 1. Робастность систем со структурированной неопределенностью в /1 постановке. В разделах 1.1-1.3 вводятся основные обозначения, приводятся описание линейной дискретной системы со структурированной неопределенностью, основные понятия и результаты /1 теории робастного управления. Пусть /] обозначает пространство суммируемых последовательностей, - пространство векторных последовательностей размерности п со стандартными нормами || • ||х и || • 11оо) соответственно.
Пусть Ь^у - пространство линейных ограниченных причинных операторов из в /£,, и ||Я|| := вир^о ||Яя||оо/|М|оо ~ индуцированная норма оператора Я £ ¿ту' •
Пусть Ьрх- подпространство пространства Ь^у , состоящее из стационарных операторов. Оператор М £ удобно задавать матрицей импульсных характеристик М = (М,^-). Значение оператора М на век-
торе х 6 lb определяется формулой
(МхЫк) := 2 Мц * ч := £ £ Щ (/)*; (к - I) , « £ {1.....р},
7 = 1 ) = 1 1=0
где (АГобозначает ¿-ю компоненту вектора Мх(к). Оператор свертки (конволюции) * в обозначениях, как правило, опускается. Индуцированную норму оператора М £ Ьрхя можно представить в виде ||М|| = шах1<,<р =1 \\Mij Ц1 • Для матрицы импульсных характеристик М введем матрицу с неотрицательными элементами
(над
[Mb
|| м,
«Hi
\
v 114,1b ••■ ||м„||г 7
Рассмотрим систему, изображенную на рис. 1. Последовательность
IV __У
м
■{Ah^
Рис. 1: Система с параметрическими возмущениями
w 6 обозначает внешнее ограниченное аддитивное возмущение, у -выход системы, dim у = пу. Оператор М G описывает
систему, включающую некоторый номинальный объект управления и некоторый стабилизирующий регулятор. Оператор Д £ Ь^ТуП" описывает возмущения в системе, называемые параметрическими. Предполагается, что оператор Д неизвестен, но принадлежит известному классу D. В дальнейшем будут рассмотрены различные классы параметрических возмущений.
Запишем систему, изображенную на рис. 1, в виде
(0.1)
с блоками Mvw 6 ¿"vxn„i е M2W € Ln**n™, Mzi € L"»*"».
В силу строгой причинности оператора возмущений Д € jD для каждого
фиксированного оператора Д определено отображение 7д, сопоставляющее аддитивному возмущению w управляемый выход у,
у = Ты», ТА : С" - ¡е' ,
Тд = Myww + Myf Д(/ - MziA)~lM,ww . (0.2)
Пусть If - пространство произвольных векторных Последовательностей размерности р. Отображение G : Í? —► /е? называется loo-устойчивым, если оно причинное, отображает в , и существует постоянная С > О такая, что ||G(a;)||oo < С||г||оо для всех х 6 /£,.
Система (0.1) называется робастно устойчивой в классе D, если отображение (I — /oo-устойчиво для всех А £ D.
Классом структурированных параметрических возмущений называется множество
D(Pl q) := { Д = diag{Дь ..., Д„} | Vi Д, CE L^*"*" , ||Д<|| < 1 } С ,
(0.3)
где р = (pi,... Рп), q = (?ь • • - ,gn), Пр := Pi + ... +рп, Tiq := qi + ...+ qn. Система (0.1) с возмущениями из класса D(p,q) Называется также системой со структурированной неопределенностью.
Для удобства изложения в большинстве последующих формулировках ограничимся случаем скалярных блоков Д,-, т.е. случаем Pi = q¿ = 1, г G {1,...,тг}, и пр — ni = п. Класс структурированных возмущений в этом случае будем обозначать через D(n). Основной результат по робастной устойчивости системы (0.1) имеет следующий вид.
Теорема (М. Khammash, J.В. Pearson (1991)). Следующие утверждения эквивалентны:
1. Система (0.1) робастно устойчива в классе D(n).
2. p([Mz¿]i) < 1, где р(А) обозначает спектральный радиус матрицы А.
3. Система неравенств ж < [Mz¿\ix не имеет ненулевых решений х £ R", удовлетворяющих условию х > 0, где неравенства понимаются покомпонентно.
М. Khammash и J.B. Pearson (1991, 1993) сформулировали соотвест-вующий результат и для класса D(p, q) и доказали также его справедливость для класса нелинейных параметрических возмущений. Второй основной результат /1 теории робастного управления связан оценкой качества системы (0.1). Будем говорить, что система (0.1) достигает робастного качества в классе D, если она робастно устойчива в классе D и ||Тд|| < 1 для всех Д 6 D.
Для формулировки основного результата о достижении системой робастНоГо качества рассмотрим систему на рис. 2, полученную введением в систему (0.1) дополнительной обратной связи и) = До у, где До € ¿туХПу ~ Произвольный строго причинный оператор, удовлетворяющий условию ||До|| < 1. Пусть /)(р, </) обозначает класс всех структурированных параметрических возмущений, полученных добавлением к операторам Д 6 В(р, q) дополнительного блока До в левом верхнем углу.
IV
м
у 2
Л
Рис. 2: Замкнутая система со структурированной неопределенностью
Теорема (М. Khammash, J.В. Pearson (1991)). Система (0.1) достигает робастного качества в классе D(p, q) если И только если система на рис. 2 робастно устойчива в классе D{p, д).
Равномерным робастным показателем качества системы (0.1) назовем показатель
JociM)- sup ||7д|| = sup sup ||Тдги||оо. (0.4)
Д€D(p,q) AeD(p.l) IMI~<1
Пусть A - (n + 1) x (n + 1) матрица с неотрицательными элементами,
t1 I12 ),
где An и A-j2 ~ квадратные матрицы порядков 1 и п, соответственно, и р(А22) < 1- Положим
F(A):=All+A12(/-A22)-1A21. (0.5)
Для случая пу = nw = 1 М. Khammash (1994) получил следующую формулу для робастно устойчивой в классе D(n) системы (0.1):
Joo(M) = F([M]i). (0.6)
В разделе 1.3.2 настоящей работы дается обобщение формулы (0.6) на случай сигналов и возмущений произвольной размерности. В качестве следствия вычислена используемая в дальнейшем наихудшая по классу возмущений Д € D(p,q) норма опрератора Д(I — MZ(Д)-1. В разделе 1.3.2 изложены две основные причины, по которым вместо равномерного показателя качества Joo(M) в задачах адаптивного управления рассматривается робастный показатель качества, связанный с асимптотическим функционалом
\\у\\1г := limsup |y(¿)|.
к—*оа
Первая причина заключается в том, что начальные данные в реальных системах управления являются ненулевыми, в то время как формула (0.6) справедлива только для нулевых начальных данных. Вторая причина состоит в том, что класс D(p,q) является слишком широким и содержит операторы Д с бесконечным последействием, что приводит к зависимости асимптотического поведения системы от начальных данных.
В разделе 1.4 рассматривается подкласс возмущений с конечной памятью Dp{p,q) С D(p,q). Оператор Д называется оператором с конечной памятью, если он переводит последовательности с конечным числом отличных от нуля элементов в такие же.
М. Khammash (1995) исследовал систему (0.1) в классе ö^(n) при фиксированном скалярном сигнале w и показал, что ее робастная устойчивость в классе D¡r(n) эквивалентна робастной устойчивости в классе D(n). Второй результат, дающий критерий достижения системой асимптотического робастного качества, имеет вид
уд е of(n) ||y||äs < i р(м„н) < i,
где
ад := ( Wrw\" К4 ) •
И И" := (llalli«. •••,||sn||»j)T для х е IНа основе этого результата М. Khammsh установил, что для фиксированного скалярного входного сигнала w асимптотический показатель качества J(M, w) :=
SUPдеог(п) 1Ы1»» Равен F{M„{w)).
Рассмотрим асимптотический робастный показатель качества си-
стемы (0.1) в случае возмущений произвольной размерности
J(M) := sup sup ||у||„ . (0.7)
b€DF(p,q) |Н1°о<1
Показатель качества (0.7) соответствует задаче регулирования.
В разделе 1.4.1 получена формула для показателя качества J(M) в классе скалярных возмущений Df(n), в разделе 1.4.2 доказана эквивалентность условий робастной утойчивости системы (0.1) в классах 0р(Р)3) и D(p,q), в разделе 1.4.3 доказано многомерное обобщение критерия достижения системой (0.1) асимптотического робастного качества в классе Df(p, <?)> в разделе 1.4.4 получено многомерное обобщение формулы для асимптотического робастного показателя J(M,w) при фиксированном входном сигнале w и вычислен показатель качества (0.7). Часть указанных результатов отражается следующей теоремой.
Теорема 1. Система (0.1) робастно устойчива в классе Dp{p,q) тогда и только тогда, когда она робастно устойчива в классе D(p,q). Если система (0.1) робастно устойчива в классе Df{p, ?), то
J(M)= sup sup ||у||л — Joo(M) .
&eDF(p,q) i|w||„<l
В разделе 1.4.5 отмечен основной недостаток класса возмущений с конечной памятью - неверифицируемость этой модели возмущений на основе конечного набора измерений, что затрудняет использование изложенных выше результатов в практических задачах.
Для обеспечения верифидируемости модели возмущений в разделе 1.5 определен подкласс возмущений с ограниченной памятью Dg (р, q) С fHP>?)> гДе G N - память возмущений. Согласно приведенному в разделе 1.5.1 критерию, две произвольные векторные последовательности связаны соотношением £ = Az с некоторым оператором Д € Dg тогда и только тогда, когда
Vi6N |£(<)1°о < max \z(t - £)|оо ,
О <к<ц
где |ж|оо •'= max|a;fc| для вектора х € R". Из этого критерия следует, что все результаты, устанавливаемые для класса линейных параметрических возмущений с ограниченной памятью, остаются справедливыми и для класса нелинейных возмущений.
Рассмотрим робастные показтели качества для класса Dy (р, q):
j£(M,w):= sup ||у||„ < J(M,w) (0.8)
в случае фиксированного входного сигнала w и
J£(M):= sup sup \\y\\„<J(M)
в случае ограниченного аддитивного возмущения w. Основной результат раздела 1.5 отражен в следующей теореме.
Теорема 2. Если система (0.1) робастно устойчива в классе Dp(p, q),
то
lim rt(M) = J(M). (0.9)
Для систем, имеющих конечные импульсные характеристики, показано, что при достаточно больших ¡1 условия робастной устойчивости в классах Dß(p,q) и Df{p,([) являются эквивалентными, и Jg{M) = J(M), и найдены соответствующие значения памяти возмущений ц. Установлено также аналогичное (0.9) равенство для показателей качества Jß(M,w) и J(M,w) при некотором дополнительном предположении о свойствах векторных последовательностей Myww и Mzww. Показано, что это дополнительное предположение выполнено для периодических входных сигналов w.
В разделе 1.6 рассмотрены класс параметрических возмущений с затухающей памятью Dfd{p, q) С D(p,q) и его подкласс DgD(p,q) возмущений с экспоненциально убывающими импульсными характеристиками. Оператор возмущений А называется оператором с затухающей памятью, если он переводит сходящиеся к нулю последовательности в такие же. В разделе 1.6.1 показано, что все результаты по робастной устойчивости и формулы для показателей качества для класса Df{p, q) остаются справедливым и для класса Dfj)(p,q). Однако модель возмущений с затухающей памятью сохраняет основной недостаток модели возмущений с конечной памятью - неверифицируемость этой модели возмущений на основе конечного набора измерений. Поэтому далее определен и рассмотрен подкласс возмущений с экспоненциально убывающими импульсными характеристиками DgD(p,q). Согласно критерию, установленному в разделе 1.6.1, для любых двух последовательностей z = (z?,..., 4)т G /Г', z,- €//■_, и i = (tf, • • ■, 0Т 6 С . fc € /?•,
и для любого набора чисел А = (Лх,..., А„), A; S [0,1), г 6 {1,..., п}
3 Д G DxED{p,q) (, = Дг Vie{l,...,n) ViGN ^(¿)|оо <m,(i)>
(0.10)
где m,(<) := A¿m;(< - 1) + (1 - A,)|z,(i - l)|oo, тг(0) := 0. Преимуществом возмущений из класса D^D(p,q) является то, что более старые значения выхода г системы (0.1) с такими возмущениями оказывают затухающее влияние на текущее значение выхода у, в то время как в классе Dg(p,q) все р. предыдущих значений выхода z могут оказывать равное влияние на текуее значения выхода у. Введем асимптотические показатели качества, соответствующий классу возмущений DßD (р, q)
J%D(M,w):= sup 1Mb,
¿6 DlD(p,q)
Jed{M)'-~ suP suP INI"
Л6D%D(p,q) |M|..<1
Из включения D^D(p,q) С ÜFD(p,q) следует, что
J%D{M,w)<.J(M,w), 4D(M)<J(M). (0.11)
В разделе 1.6.2 приведен построенный А.Е. Барабановым пример системы с одним скалярным блоком возмущений (п = 1), для которой Jed(M) < J(M) — £ с не зависящим от А £ [0,1) числом е > 0, и установлены частные случаи систем, для которых Jed(M) = J{M).
В разделе 1.7 все установленные ранее результаты переносятся на систему, изображенную на рис. 3 и имеющую помимо внешнего адди-
Рис. 3: Система со структурированной неопределенностью и задающим сигналом г
тивного возмущуния w дополнительный внешний фиксированный сигнал г, называемый задающим. В частном случае асимптотического показателя качества, связанного с функционалом ||j/— гЦ,, (dimу = dimr),
робастный показатель качества соответствует задаче слежения. Система (0.1) является частным случаем системы на рис. 3. Рассмотрим асимптотический показатель качества
J{M,r):= sup sup \\у\\„. (0.12)
Л€-Df(p,?) IMI»<1
Для формулировки основного результата раздела 1.7 и главы 1 введем множество мультииндексов
К,j := { (ki,...,kn) | Vi ki G {1,..., g,} } , и для каждого г € {1,..., ny } и каждого к 6 Kq определим матрицу
/ \\(МуГЬг\\„ + \\(Муш){\\ ||(Myíl)i|| ••• IKM^Jill
\\(M:ir)klr\\S! + \\(MZlW)kl\\ IKM^HJI ••• IKM^kll
\ \\(Mtnr)knr\\ss + \№ZnW)kj\ ||(M,„fl)fcn|| ••• ||(м2„аь„
(0.13)
где (Л); обозначает 1-ю строку матрицы А.
Теорема 3. Пусть система на рис. 3 робастно устойчива в классе Df{p, q), и векторная последовательность г £ /еПг такова, что все элементы первых столбцов матриц Mi,k(r), i G {1,...,пу}, к 6 Кя, конечны. Тогда
J(M,r)= шах шах F(Mi,k(r)). (0.14)
1<|<п, k£Kq
В разделе 1.7 изложены также обобщения на случай системы с фиксированным задающим сигналом ранее установленных результатов, связанных с классами возмущений D^(p,q), Dpj) (р, q) и DgD(p,q). Для применения изложенных результатов непосредственно к задаче слежения достаточно вместо оператора Муг использовать всюду оператор Муг ~ I.
Глава 2. Синтез /i субоптимальных робастных регуляторов для SISO объектов. В главе 2 и последующих главах рассматриваются SISO (Single Input - Single Output) объекты управления, т.е. объекты со скалярными выходом и управлением:
=q-db(q-l)u(t)+v(t)t t€ N, (0.15)
где у - измеряемый выход объекта, и - управление, v - суммарное неизмеряемое возмущение, d - запаздывание в управлении. a(q~1) и
b(q 1 )- полиномы от оператора сдвига назад q 1
аОГ1) = 1 + aiqГ1 + ... + anq~n , ¿(g"1) = 60 + 6i?_1 + ... + bmq~m .
Суммарное возмущение v(t) предполагается складывающимся из возмущений различной природы,
v{t) = wa(t) + wp(t) , |К||оо<йш (0.16)
где слагаемое wa представляет ограниченное внешнее возмущение, а wp - параметрическое возмущение (неопределенность) в объекте (0.15). Рассмотрим параметрические возмущения двух типов.
1. Неструктурированное параметрическое возмущение.
w" = A(s"j)' Дея^ДМ, (0-17)
где множители Sy > 0 и 6и > 0 учитывают интенсивность параметрических возмущений в каналах выхода и управления, и класс возмущений Dns соответствует одному блоку возмущений в определении (0.3): п = 1, р = 1, q = 2.
2. Структурированное параметрическое возмущение. В этом случае последовательность wp имеет вид
шр = (1,1)д( ^ ) =6уА1У+6иА2и, д°2)б^:=В(2),
(0.18)
и класс возмущений Ds есть класс структурированных возмущений: п = 2, р = (1,1), q = (1,1). В этом случае числа 6у и 6и будем называть нормами параметрических возмущений в каналах выхода и управления, соответственно.
В разделе 2.1.2 результаты главы 1 применяются к задаче регулирования объектом (0.15). В этом случае управление осуществляется линейным регулятором
a{q-l)u(t) = p{q-l)y{t), (0.19)
где а и ¡3 - произвольные полиномы от оператора g-1 (о(0) = 1), обеспечивающие устойчивость характеристического полинома
X(z):=a(z)a(z)-zdb(z)p(z) (0.20)
системы (0.15) и (0.19). Полином называется устойчивыми, если все его нули лежат вне замкнутого единичного круга := {г | \г\ < 1}. Для существования стабилизирующего регулятора необходимо и достаточно, чтобы полиномы а(г) и Ь(г) не имели общих корней в Ь\.
Для применения результатов главы 1 к системе (0.15), (0.19) при ненулевых начальных данных, последнюю необходимо представить в виде системы (0.1). Это достигается введением в систему (0.1) дополнительного внешнего сигнала с конечным носителем. В связи с этим далее рассматриваются подклассы параметрических возмущений с конечной памятью, Юр3 и Бр, или с затухающей памятью, Орр и Пусть Ммз и М5 обозначают оператор М после приведения системы (0.15), (0.19) к виду (0.1) в случае структурированной и неструктурированной неопределенности, соответственно.
Введем передаточные функции от возмущения и к выходу у и управлению и в системе (0.15), (0.19)
~ <у\г) = ^ О*' ' = хМ = ^
и положим ||Суи|| := ||Суи||1, ||С?т,|| := ЦС^Ць
Теорема 4. Для робастной устойчивости системы (0.15) и (0.19) в классе возмущений Ор'4 необходимо и достаточно, чтобы
тах{й„||(7у|)||>би||Сив||}< 1. (0.21)
Если система (0.15) и (0.19) робастно устойчива в указанных классах возмущений, то
=___со 221
> 1-тах{5,||Оу„||Л||<?и,,||Г У >
Теорема 5. Для робастной устойчивости системы (0.15) и (0.19) в классе возмущений Юр (Црд) необходимо и достаточно, чтобы
Мад + МСш,!!^. (0.23)
Если система (0.15) и (0.19) робастно устойчива в указанных классах возмущений, то
В разделе 2.1.3 указанный результат обобщается на задачу слежения в присутствии дополнительной ограниченной помехи измерений.
В разделе 2.3 приведены различные /] постановки задач синтеза ро-бастных и оптимальных регуляторов. В частности, задача минимизации числителей в робастных показателях качества (0.22) и (0.22) является задачей /1 оптимального управления, решение которой для SISO объекта было получено А.Е. Барабановым и О.Н. Граничиным (1984). М. Dahleh (1992) рассматривал задачу минимизации ||G¡,V|| + ||GUW||, названную им задачей обеспечения наибольшей области устойчивости. В терминах робастного показателя качества (0.24) эта задача эквивалентна задаче максимизации его знаменателя. Следует также заметить, что не существует регулятора, обеспечивающего наибольшую область устойчивости в плоскости параметров бу,ёи.
В связи с тем, что, согласно двум приведенным выше основным теоремам ¡i теории робастного управления, система (0.1), в случае скалярных сигналов, достигает робастного качества тогда и только тогда, когда p([M]i) < 1, М. Khammash и J.B. Pearson (1993) рассматривали задачу синтеза оптимального робастного регулятора как задачу минимизации спектрального радиуса /?([M]i) и предложили для ее решения процедуру построения последовательности приближенных решений, сходящихся к локальному минимуму. Ниже эта и другие перечисленные задачи проиллюстрированы для SISO объекта со структурированной неопределенностью.
В настоящей работе формулируется задача синтеза 1\ оптимального робастного регулятора как задача минимизации показателя качества J(M). В общем случае многомерных объектов эта задача является сложной задачей невыпуклой оптимизации. В разделах 2.3 и 2.4 эта задача рассматривается для SISO объекта с показателями качества (0.24) и (0.22), соответственно.
Приведем краткое описание метода решения задачи синтеза ¡i субоптимального робастного регулятора в случае структурированной неопределенности. Решение основано на дробно-линейной зависимости показателя качества (0.24) от передаточных функций Gyv и Guv. Выберем число £ > 0 и рассмотрим задачу построения регулятора (0.19) такого, что
J(MS) <£. Эта задача эквивалентна задаче
+ < (0.25)
где и := j + 6у. Задача (0.25) при заданном значении параметра и является стандартной смешанной задачей оптимизации. Для решения поставленной задачи синтеза /j оптимального робастного регулятора необходимо и достаточно решить задачу (0.25) при максимально возможном значении параметра v. Из приведенной интерпретации вытекает метод ее решения, основанный на последовательном поиске приемлемого субоптимального значения параметра v. Выберем начальное значение параметра v из отрезка возможных значений \8у, 1 /уо), где 7о mine HGyt/Ц - оптимальное значение показателя качества в стандартной задаче 1\ оптимизации (минимум вычисляется на множестве стабилизирующих регуляторов). Применяя метод (^-масштабирования для решения смешанной задачи 1\ оптимизации (0.25), предложенный М. Khammash (1996), вычислим с требуемой точностью верхние и нижние оценки оптимального значения смешанной задачи. Если по ходу вычислений верхняя граница оказалась меньше 1, то текущее значение параметра v увеличивается. Если по ходу вычислений нижняя граница оказалась больше 1, то текущее значение параметра v уменьшается.
В разделе 2.3 приведена теорема, дающая оценку точности субоптимального решения, полученного посредством описанной схемы и метода деления пополам. Обсуждаются также возможные способы ускорения сходимости алгоритма. Отдельно сформулирован и обоснован алгоритм проверки робастной стабилизируемости объекта при заданных нормах параметрических возмущений. Доказано утверждение о существовании 1\ оптимального робастного регулятора в классе линейных (возможно нерациональных) стабилизирующих регуляторов.
Геометрическая интерпретация ¡i оптимального робастного регулятора и других упоминавшихся выше оптимальных регуляторов представлена на рис. 4, где D обозначает множество возможных значений норм передаточных функций с устойчивой функцией-параметром Q из стандартной параметризации множества стабилизирующих регуляторов для объекта (0.15). Параметр v* обозначает искомое максимальное значение параметра v. Интересно отметить, что /i оптимальный робастный регулятор не зависит не только от нормы аддитивного возмущения 8W, но и от нормы возмущения по выходу ёу. В то же время оптимальный регулятор, минимизирующий спектральный радиус матрицы [M5]i, зависит как от 8у, так и от 8Ю, что, по-видимому, свидетельствует о недостатке в постановке задачи.
В разделе 2.4 рассматривается задача построения 1\ субоптимального робастного регулятора для показателя качества (0.22). Использо-
\Ш0)\\
I
11 оптимальный миниитьтй спектральный радиус И оптимальный робастный максимальный знаменатель
Р__
№
X
V.
± над и
еу
Рис. 4: Оптимальные регуляторы 4 типов
вание аналогичного приема сводит задчу к поиску наилучшего решения из семейства нестандартных смешанных задач /1 оптимизации, для решения которых потребовалось обобщение метода (^-масштабирования, описанное в разделе 2.4.2. Описанное обобщение метода позволяет решать задачу синтеза 1\ субоптимального робастного регулятора для функционала качества, включающего управление. В разделе 2.4.3 описаны алгоритмы построения субоптимального решения и доказана теорема, дающая оценку точности алгоритма.
Глава 3. Адаптивное рабастное управление: оценивание и стабилизация. В разделе 3.1 приведены постановки двух основных рассматриваемых задач синтеза адаптивного управления. Первая из них - задача адаптивной стабилизации - заключается в построении стабилизирующего управления объектом (0.15) с неизвестными коэффициентами и нормами возмущений. Вторая задача - задача синтеза неконсервативного адаптивного управления - является существенно более сложной и малоизученной. Приведем формулировку этой задачи в предположении, что параметрические возмущения в объекте (0.15) принадлежат классу (2). Положим
вр:={а1,...,ап,Ь0,...,Ьт)Т, 9 := <5У, 5и, 5Ш)Т 6 И."' , (0.26)
пд := п + т + 4. Вектор вр будем называть вектором номинальных коэффициентов, вектор в - вектором номинальных параметров объекта (0.15). Набор
1рг :={/)£ (2),<г,ер,} (0.27)
назовем априорной информацией об объекте (0.15). Первый элемент набора указывает на класс параметрических возмущений. Второй элемент а := (п, т, с!) описывает структурные параметры объекта. Третий элемент описывает известное конструктору системы управления множество возможных значений вектора в £ Эрг.
Пусть для каждого вектора номинальных параметров в 6 0рг задан регулятор,
а[ч-1,9)иЦ) = Р{Ч-1,в)у{1), а(О,0) = 1У0 6 0рг, (0.28)
где а и - зависящие от в полиномы от оператора сдвига д-1, обеспечивающий робастную устойчивость системы (0.15), (0.28). Пусть М(в) обозначает оператор замкнутой системы (0.15), (0.28), соответствующей вектору в. Предположим, что регуляторы (0.28) выбраны таким образом, что для каждого из объектов с известным вектором номинальных параметров в € 0рг обеспечивается желаемая верхняя оценка асимптотического показателя качества:
ГВ(М{9))<ЛМ{0)).
В частности, в качестве регулятора (0.28) может быть выбран 1\ субоптимальный робастный регулятор.
Задача синтеза неконсервативного адаптивного управления. Для неизвестного объекта, удовлетворяющего априорной информации /рг, требуется построить ограниченное управление, гарантирующее при всех допустимых возмущениях неравенство
112/11» < ЦЩО)) , ' (0.29)
для выхода у объекта (0.15).
Согласно идентификационному методу синтеза адаптивного управления, используемому в настоящей работе, управление в момент времени £ определяется адаптивным регулятором
«(Г1, *(<))«(*) =/*(в-1 (0-30)
где 9(1) обозначает оценку неизвестного вектора в в момент времени £. Тогда задача синтеза закона адаптивного управления сводится к построению последовательности оценок 6>(<), обеспечивающей достижение цели адаптивного управления.
Отметим несколько отличий описанных выше задач адаптивного управления от стандартных задач адаптивного управления. Первое важное отличие, обсуждающееся в разделе 3.1.2, состоит в том, что робастный регулятор (0.28) может зависеть от вектора 0, в то время как при стандартных формулировках он зависит только от вектора коэффициентов вр. Второе важное отличие, обсуждающееся в разделе 3.2, заключается в том, что не предполагается известной никакая верхняя граница нормы аддитивного возмущения 6,„. Следствием этого является неидентифицируемость объекта (0.15). В разделе 3.2 вводится также понятие множества оценок, согласованных с наблюдениями и априорной информацией. Обсуждаются особенности описания этих множеств для 4 различных видов априорной информации (структурированные и неструктурированные возмущения, возмущения с ограниченной памятью и с экспоненциально убывающими импульсными характеристиками). В частности, в случае априорной информации (0.27), это множество описывается системой линейных неравенств относительно в.
Недостаток сформулированных выше и других стандартных задач адаптивного управления заключается в том, что в этих формулировках не учитываются явно ограничения на переходные процессы в адаптивных системах управления. Это делает возможным формальное математическое решение этих задач посредством неприемлемых с практической точки зрения переборных методов оценивания. В разделе 3.3 это продемонстрировано в отношении задач адаптивной стабилизации и синтеза неконсервативного адаптивного управления. Следует заметить, что задачи с ограничениями на качество переходных процессов являются весьма трудными и малоисследованными математическими задачами.
В разделе 3.4 даны решения задач адаптивной стабилизации с помощью метода рекуррентных целевых неравенств. Существенное отличие от стандартного подхода связано с учетом параметрических возмущений в объекте и отказом от стандартного предположения об известной верхней границе возмущений. Для оценивания неизвестного вектора номинальных параметров используются градиентные алгоритмы оценивания с зоной нечувствительности. В случае априорной информации 1рг алгоритм оценивания имеет вид
т = + (0.3!)
. f о , если 0(t - If ФЦ - 1) > e(t) - е\ф(1 - 1)|, \ 1 , в противном случае ,
где
e(t) := S(t)y(t), s(t) := sign (y(t) - 6p(t - 1 fj>{t - 1)) , и регрессионный вектор ф{1 — 1) имеет вид
ФЦ - 1) := («(<№(* " l)T,™y(*),m„(<)> 1)Т . (0-32)
my(t) := li/Jliloo, m„(t) := I^U . (0.33)
Положительный параметр е в (0.31) обеспечивает сходимость оценок за конечное время.
В разделе 3.4.2 доказана теорема о решении задачи адаптивной стабилизации для 4 различных типов априорной информации. В разделе 3.4.3 рассмотрена и обоснована модификация алгоритма, обеспечивающая максимизацию области робастной устойчивости при структурированной неопределенности для случая стандартного выбора регулятора (0.28) по вектору коэффициентов вр. Рещеция, описанные в разделах 3.4.2 и 3.4.3 используют стандартное обременительное предположение выпуклости априорных множеств. В разделе 3.4.4 приведено обобщение предыдущих результатов на случай конечного семейства выпуклых априорных множеств и конечного семейства допустимых структур объекта, основанное на переборном методе поиска подходящего члена семейства.
Глава 4. Адаптивное робастное управление на основе множественного оценивания. Возможность решения задачи синтеза неконсервативного адаптивного управления в условиях неидентифицируемости объекта управления основывается на центральной идее использования показателя качества в задаче управления в качестве идентификационного критерия. Эта идея была предложена в [1-4] применительно к задачам адаптивного управления объектами с ограниченными возмущениями. Пусть 0(l/ô) Up-1,/рг) ~ множество оценок неизвестного вектора номинальных параметров, согласованных с наблюдениями î/q, и'а~1 и априорной информацией 1рг. В разделе 4.1 приведен краткий обзор методов идентификации и выбор критериев идентификации, мотивированных теорией робастного управления. С точки зрения теории гарантированного оценивания все оценки из множества @(2/о> uô-1> Jpr) являются равноправными, что не позволяет рассчитывать на решение задачи синтеза неконсервативного адаптивного управления. В соответствии с указанной выше центральной идеей, текущие
оценки следует выбирать в виде
<?(<) € а^тт J{M{т)). 1-€®(у 'о.иу-1'1^)
(0.34)
Сам по себе выбор (0.34) не обеспечивает решение задачи синтеза неконсервативного адаптивного управления ни с теоретической, ни с практической точек зрения. Если рассмотреть замкнутую систему управления (0.15), (0.30), в которой последовательность оценок выбирается согласно формуле (0.34), то оценка качества этой системы представляет собой едва ли поддающуюся решению математическую задачу. Кроме того, реализация формулы (0.34) нуждается в общем случае в неограниченно возрастающей памяти для запоминания множеств согласованных с наблюдениями оценок.
В разделе 4.2.1 показано, как можно решить первую из указанных проблем за счет ослабления требования к качеству адаптивного управления посредством дискретизации гарантированных значений показателя качества. Для решения второй проблемы в разделе 4.2.2 описан алгоритм множественного оценивания неизвестных параметров, обеспечивающий сходимость оценок за конечное время. Приведем краткое описание алгоритма в случае априорной информации вида (0.27). В каждый момент времени t алгоритм вычисляет множественные оценки Е(1), задаваемые системой линейных неравенств, и Векторные оценки
Выберем число е > 0 - параметр алгоритма оценивания. Выберем некоторое начальное множество Е(0) Э 0рг и любую начальную векторную оценку 0(0) := (#Р(0), 0, 0, 0)т £ &рг. Пусть Е(< - 1) - множественная оценка и в(< — 1) - векторная оценка неизвестного вектора номинальных параметров в объекта (0.15) в момент времени ^ — 1. Измерив значение выхода у{1), положим
Как и в случае градиентного алгоритма оценивания, параметр е > 0 в (0.35) обеспечивает сходимость множественных и векторных оценок
т-
(1(г) := { г I ТТФУ - 1) > е(<) } ,
ОО I
за конечное время при условии ограниченности априорного множества допустимых значений векторов вр. Основное назначение и достоинство описанного алгоритма оценивания заключается в обеспечении неравенства ,/(.Л/(0оо)) < 1(М{в)), где 0оо - финальная оценка неизвестного и неидентифицируемого вектора номинальных параметров в.
В разделе 4.2.3 доказана теорема о приближенном, с любой заданной точностью, решении задачи синтеза неконсервативного адаптивного управления для 4 видов априорной информации. Сформулируем результат, соответствующий априорной информации вида (0.27). Пусть М(в1,02) обозначает оператор системы, включающей объект (0.15) с вектором номинальных параметров 9х и регулятор (0.28), соответствующий вектору параметров в2. Пусть ](М(0Х ,в2)) обозначает показатель качества (0.24), соответствующий этой системе.
Теорема 6. Пусть априорная информация об объекте (0.15) имеет вид (0.27), где = гаах{п,с£+т}, 0рг = 0с х [0,+оо), и множество 0С компактное. Пусть параметр е > 0 алгоритма оценивания выбран таким, что
У0 6 0РГ (^+е)||Су1)(-)в)|| + (й|| + с)||Сги«(-,в)||<1. (0.37)
Тогда выход у(1) и управление и(<) системы (0.15), (0.30), в которой оценки в(Ь) определяются согласно множественному алгоритму оценивания (0.35), (0.36), равномерно ограничены, число изменений множественных оценок Е({) и векторных оценок конечно и ограничено постоянной, зависящей только от е, ©с и ¿ш, при этом
||у||„ < *«,)), 3(М(в00))<3(М(в)), (0.38)
где <?оо := Нт0(*), и вс := (^«,,^,00 + £, ¿и,со + Ми>,+ е)т.
Условие (0.37) необременительно, поскольку при е = 0 переходит в условие робастной устойчивости (0.23) для системы (0.15), (0.28). Другими словами, адаптивный регулятор незначительно сокращает область допустимых норм параметрических возмущений по сравнению с регулятором для известного объекта.
Неравенство (0.38) означает приближенное решение задачи синтеза неконсервативного адаптивного управления, поскольку
Нт^М^'.б«,)) = 3(М(9^)) < 3(М(9)).
Уменьшение значения параметра е > 0 положительно сказывается на робастной устойчивости и асимптотическом качестве адаптивной системы. С другой стороны, близкие к нулю значения г недопустимы в
силу полиномиального по е роста объема необходимых,вычислений и, кроме того, несущественно отражаются на качестве адаптивного управления. Поэтому выбор Параметра е должен осуществляться с учетом указанного компромисса.
В разделе 4.3 результаты раздела 4.2 обобщаются на задачи с неизвестной структурой объекта из конечного семейства возможных структур и на задачи адаптивного робастного слежения. Следует отметить, что, в отличие от задачи адаптивной стабилизации, оценивание неизвестной структуры объекта осуществляется также на основе идентификационного критерия, совпадающего с показателем качества в здДаче управления, что исключает элементы перебора с присущими ему недостатками. В адаптивной задаче слежения отдельно рассмотрены случаи полностью Известного задающего сигнала и произвольного заранее неизвестного ограниченного задающего сигнала.
Алгоритмы адаптивного неконсервативного управления обеспечивают достижение наиболее сложной цели управления за счет высокой сложности алгоритмов оценивания. Ослабление цели управления позволяет снизить сложность соответствующего ей алгоритма оценивания. В разделе 4.4 рассмотрен пример такого алгоритма - конусный алгоритм оценивания, использующий множественные оценки, составленные из постоянного числа rig = dim0 линейных неравенств. В разделе 4.4 дано описание алгоритма, выявлены некоторые его свойства и описано его применение к задачам адаптивного управления с минимизацией оценки нормы аддитивного возмущения и минимизацией суммарного эффекта возмущений. В последнем случае адаптивное управление на основе конусного алгоритма оценивания обеспечивает, в случае априорной информации вида (0.27) и зависимости регуляторов (0.28) только от вектора коэффициентов вр, гарантию качества
где z > 0 - выбираемый параметр алгоритма оценивания, и
Gy '.= sup ||Gyu(-, 0Р)|| < +со , Gu ~ sup ||Gm,(-,0p)|| < +oo.
В разделе 4.5 обсуждаются вопросы реализации и моделирования неконсервативного адаптивного управления. Предложены возможные модификации алгоритмов множественного оценивания фиксированной сложности, обсуждаются возможности распределения необходи-
мых вычислений на достаточные для этого промежутки времени, возможности реализации субоптимального адаптивного управления. Предложен алгоритм квазиоптимального адаптивного управления, обсуждаются сравнительные достоинства и недостатки моделей возмущений с ограниченной памятью и с экспоненциально убывающими импульсными характеристиками. Приведены результаты численного моделирования неконсервативного адаптивного управления, свидетельствующие о работоспособности рассмотренных модификаций.
В заключении перечислены основные результаты диссертационной работы.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Соколов В. Ф. Рекуррентные процедуры адаптивного е-оптималь-ного управления при минимаксном подходе // Упорядоченные множества и операторные уравнения. 1982. Сыктывкар. С. 63-70.
2. Соколов В.Ф. Пример рекуррентного адаптивного субоптимального управления в случае ограниченной помехи // Тезисы докладов и сообщений Всесоюзной конференции ' 'Теория адаптивных систем и ее применения". 1983. М. J1. С. 24.
3. Соколов В.Ф. Адаптивное субоптимальное управление в случае ограниченной помехи // Автоматика и телемеханика. 1985. №9. С. 78-86.
4. Sokolov V.F. Adaptive suboptimal control of a linear system with bounded disturbances // Systems and Control Letters. 1985. V. 6. P. 93-98.
5. Соколов В.Ф. Сохранение гарантированного результата при управлении дискретным объектом с неизвестными параметрами // Упорядоченные пространства и операторные уравнения. 1989. Сыктывкар. С. 133-139.
6. Соколов В.Ф. Адаптивное субоптимальное управление линейным объектом первого порядка с ограниченными помехами в объекте и измерениях // Автоматика и телемеханика. 1990. №12. С. 125-135.
7. Соколов В.Ф. Рекуррентное линейное программирование в задаче адаптивного субоптимального управления линейным объектом 1-го порядка с ограниченными помехами в объекте и измерениях // Тезисы докладов Ленинградского симпозиума "Адаптивные и экспертные системы в управлении''. 1991. Ленинград. 4.1. С. 63-65.
3. Соколов В.Ф. Рекуррентное линейное программирование в задачах адаптивного минимаксного управления// Известия РАН. Техническая кибернетика. 1993. №3. С. 103-109.
9. Соколов В.Ф. Адаптивное минимаксное управление на основе рекуррентного линейного программирования// Автоматика и телемеханика. 1993. №12. С. 127-139.
10. Соколов В.Ф. Адаптивное робастное управление с гарантированным результатом в условиях ограниченных возмущений// Автоматика и телемеханика. 1994. jV'2. С. 121-131.
11. Sokolov V.F. Closed-loop identification for the best asymptotic performance of adaptive robust control // Prepr. 10th IFAC/IFORS Symp. on System Identification. 1994. Copenhagen. V. 2. P. 267-272.
12. Sokolov V.F. Cone algorithm of identification for adaptive robust control// Prepr. 10th IFAC/IFORS Symp. on System Identification. 1994. Copenhagen. V. 2. P. 273-278.
13. Sokolov V.F. Adaptive robust control design depending on desired control performance // Prepr. I Asian Control Conference. 1994. Tokyo. 4 c.
14. Соколов В.Ф. Адаптивное робастное управление на основе конусного алгоритма оценивания // Квантовые группы, дифференциальные уравнения и теория вероятностей. 1994. Сыктывкар. С. 71-84.
15. Соколов В.Ф. Адаптивное управление в условиях параметрических и аддитивных ограниченных возмущений // Тезисы докладов III междунар. семинара "Негладкие и разрывные задачи управления. Оптимизация и приложения." 1995. С.-Петербург. 4.2. С. 151-154.
16. Sokolov V.F. Adaptive control with improved asymptotic performance in the presence of deterministic disturbances // Prepr. 5-th IFAC Symposium on Adaptive Systems in Control and Signal Processing. 1995. Budapest. P. 89-94.
17. Sokolov V.F. Adaptive robust control design depending on desired control performance//Prepr. American Control Conference. 1995. Seattle. 5c.
18. Соколов В.Ф. Адаптивное робастное управление скалярным объектом в ¡1 постановке // Тезисы докладов IV межд. семинара "Устойчивость и колебания нелинейных систем управления". 1996. Москва. ИПУ РАН. С. 106.
19. Соколов В.Ф. Адаптивное робастное управление скалярным объектом со структурированными возмущениями // Тезисы докладов I межд. научн.-практич. конф. "Дифференциальные уравнения и при-
менения". 1996. С.-Петербург. С. 195.
20. Соколов В.Ф. Робастное качество линейного регулятора для линейного дискретного объекта в li постановке // Вестник Сыкт. унта. 1996. Сер. 1: математика, механика, информатика, Выпуск 2. С. 213-224.
21. Sokolov V.F. Closed-loop Identification for the Best Asymptotic Performance of Adaptive Robust Control // Automatica. 1996. V. 32. P.1163-1176.
22. Sokolov V.F. Robust performance bounds provided by linear controller for SISO plant with structured uncertainty // Proceedings of the 35th Conf. on Decision and Control. 1996. Kobe. Japan. December. P. 2336-2341.
23. Соколов В.Ф. Адаптивное управление линейным дискретным объектом в условиях аддитивных и параметрических Возмущений // "Алгебра, дифф. уравнения и теория вероятностей". Труды Коми научного центра УрО РАН. 1997. Сыктывкар. №151. С. 85-111.
24. Sokolov V.F. Robust performance bounds for scalar output of linear system with structured uncertainly // Proc. European Cotrol Conference.
1997. Brussels. Belgium. 6c.
25. Sokolov V.F. Adaptive robust control for SISO plant in l\ setting // Proc. European Cotrol Conference. 1997. Brussels. Belgium. 6c.
26. Sokolov V.F., Veres S.M. Adaptive robust steady-state tracking control // Proc. of the American Control Conference. 1997. Albuquerque. New Mexico. P. 1198-1202.
27. Соколов В.Ф. Адаптивное робастное управление дискретным скалярным объектом в постановке // Автоматика и телемеханика.
1998. №3. С. 107-131.
28. Veres S.M., Sokolov V.F. Robust adaptive control under unknown plant orders // Automatica. 1998. V. 34. No. 6.
29. Соколов В.Ф. 11 субоптимальные робастные регуляторы для дискретного скалярного объекта управления // Тезисы докладов II межд. конференции "Дифференциальные уравнения и их применения". 1998. С.-Петербург. С. 159-160.
-
Похожие работы
- Модели и алгоритмы робастных систем управления нестационарными объектами
- Алгоритмы робастного нелинейного управления нестационарными динамическими объектами
- Адаптивные и робастные системы управления в условиях возмущений и запаздывания
- Алгоритмы адаптивного и робастного управления линейными объектами по выходу
- Построение модальных робастных регуляторов для многосвязных систем
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность