автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Принцип максимума для задач импульсного управления с ограничениями смешанного типа и численные методы поиска экстремалей
Автореферат диссертации по теме "Принцип максимума для задач импульсного управления с ограничениями смешанного типа и численные методы поиска экстремалей"
На правах рукописи
005017827
СТАРИЦЫН МАКСИМ ВЛАДИМИРОВИЧ
ПРИНЦИП МАКСИМУМА ДЛЯ ЗАДАЧ ИМПУЛЬСНОГО УПРАВЛЕНИЯ С ОГРАНИЧЕНИЯМИ СМЕШАННОГО ТИПА И ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА ЭКСТРЕМАЛЕЙ
05.13.01 - Системный анализ, управление и обработка информации (в технике, экологии и экономике)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
2 б дпр
Иркутск - 2012
005017827
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте динамики систем и теории управления Сибирского отделения РАН (ИДСТУ СО РАН).
Научный руководитель:
кандидат физико-математических наук,
доцент
Гончарова
Елена Владимировна,
Официальные оппоненты: доктор физико-математических наук,
профессор Сесекин
Александр Николаевич
УрФУ им. Б.Н. Ельцина, зав. кафедрой
кандидат физико-математических наук,
доцент
Антипина
Наталья Валерьевна, БГУЭП, доцент
Ведущая организация: Институт программных систем
им. А.К. Айламазяна РАН
(г. Переславль-Залесский)
Защита состоится 17 мая 2012 г. в 13:00 ч. на заседании диссертационного совета Д 003.021.01 в ИДСТУ СО РАН по адресу: 664033, Иркутск, ул. Лермонтова, 134. ^ о
С диссертацией можно ознакомиться в библиотеке и на официальном сайте www.idstu.irk.ru ИДСТУ СО РАН.
Автореферат разослан 16 апреля 2012 г.
Ученый секретарь диссертационного совета д.ф.-м.н. _ A.A. Щеглова
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Диссертационная работа посвящена исследованию задач оптимального управления импульсными гибридными системами. Этот класс моделей описывается дифференциальными уравнениями с мерами при ограничениях смешанного типа, связывающих фазовую траекторию и управляющую меру.
Актуальность темы. Объектом исследования теории оптимального импульсного управления являются задачи оптимизации с разрывными траекториями и управлениями типа мер, или более широко, типа обобщенных функций (распределений). Задачи импульсного управления появляются при расширении так называемых вырожденных классических задач оптимального управления, решение которых не существует в классе обычных измеримых управлений (в первую очередь речь идет о системах с линейной зависимостью от неограниченного управления). На практике такие вырожденные задачи (иногда сразу в расширенной, импульсной постановке) возникают в таких высокотехнологичных отраслях, как раке-тодинамика, лазерная технология, телекоммуникация, энергетика, робототехника, квантовая электроника, экономика, экология и др.
Основы теории импульсного управления были заложены в работах H.H. Красовского, С.Т. Завалищина, А.Б. Куржанского, В.Ф. Кротова, В.И. Гурмана, Р. Ришела, Дж. Варги. Дальнейшее развитие этой теории связано с именами A.B. Арутюнова, А. Брессана, Р. Винтера, В.А. Дых-ты, Б.М. Миллера, М. Мотта, Ф.Л. Перейра, Ф. Рампаццо, А.Н. Сесекина, Ж.Н. Силва, Т.Ф. Филипповой, А.Г. Ченцова и др.
Наибольшую сложность и практический интерес представляют задачи импульсного управления с траекториями ограниченной вариации и управлениями типа векторной меры. Разные классы таких задач при фазовых ограничениях и некоторых типах смешанных ограничений изучались в работах Б.М. Миллера и Е.Я. Рубиновича1', A.B. Арутюнова, Д.Ю. Карамзина и Ф.Л. Перейра2), В.А. Дыхты и О.Н. Самсонюк3' и др. Важной спецификой подобных моделей является неоднозначная интерпретация условий фазового и смешанного типа, что порождает различные возможные
^ Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. М.: Наука, 2005. 429 с.
''Arutyunov А.V., Karamzin D.Yu., Pereira FX. On Constrained Impulsive Control Problems. Journal of Mathematical Sciences. 2010. V. 165, Ji; C. P. 654-fi88.
Дмхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: ФИЗ-МАТЛИТ, 2000. 256 с.
постановки задач, типы локального оптимума и условия оптимальности.
В исследовании различных классов задач импульсного управления нелинейными системами с траекториями ограниченной вариации весьма эффективным оказался метод разрывной замены времени. В оптимальном импульсном управлении этот метод ведет свою историю от работ Р. Ри-шела и Дж. Варги, хотя еще на рубеже 20-х гг. XX века он, фактически, применялся A.M. Размадзе при исследовании нерегулярных вариационных задач. При исследовании нерегулярных задач оптимального управления важную роль играют и другие методы — преобразование Гурмана4' к производной задаче и нелинейный вариант преобразования Гоха3', которые (как и метод замены времени) позволяют свести задачу импульсного управления к классической.
Необходимые и достаточные условия оптимальности в теории импульсного управления были получены как для задач без ограничений на распределения (когда траектории являются функциями класса Loo), так и при наличии таковых (с траекториями ограниченной вариации). Первые и наиболее полные результаты по необходимым условиям оптимальности в задачах с траекториями ограниченной вариации получены в серии работ Б.М. Миллера. В дальнейшем теория принципа максимума для различных классов таких задач развивалась в работах A.B. Арутюнова, А. Брессана, Р. Винтера, В.А. Дыхты, С.Т. Завалищина, Б.М. Миллера, Ф.Л. Перейра, А.Н. Сесекина, Ж.Н. Силва.
В диссертации исследуется задача импульсного управления при смешанных ограничениях на траекторию и управляющую меру, которые отличаются от других известных типов смешанных ограничений. Подобные модели подходят для формализации некоторых процессов из робототехники (например, при описании движения манипуляторов с блокируемыми степенями свободы), а также систем мониторинга и контроля экологических и эпидемиологических процессов. Таким образом, получение необходимых условий оптимальности для таких задач и развитие методов их эквивалентного преобразования к классическим задачам оптимального управления является актуальным направлением исследования.
На фоне внушительного списка работ по численным методам для классических задач оптимального управления библиография, посвященная вычислительным методам решения задач импульсного управления, является довольно скромной. В работах В.И. Гурмана, В.А. Батурина, Е.В. Да-
41 Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977. 304 с.
нилиной, В.А. Дыхты, Н.В. Деренко, Е.В. Гончаровой, И.О. Верхозиной и др. предложены алгоритмы улучшения для задач оптимального управления системами с траекториями класса Ь^. Методы градиентного спуска для задач оптимального управления импульсными гибридными системами с конечным числом автономных переключений разработаны В.В. Ажмяко-вым и его коллегами. В статьях A.B. Куржанского, А.Н. Дарьина развиты численные алгоритмы синтеза импульсных управлений для линейных задач с траекториями ограниченной вариации. Разработка вычислительных методов решения нелинейных задач импульсного управления с траекториями ограниченной вариации является актуальной задачей.
Предмет и объект исследования. Объектом исследования являются задачи оптимального управления импульсными гибридными системами (ИГС), которые описываются дифференциальными уравнениями с мерами при ограничениях вида
Q(t,x(t-)) = 0, Q(t,x(t)) = 0, 4>(t,x{t))<Q dp- п.в.
Здесь ж(-) — фазовая траектория, удовлетворяющая дифференциальному уравнению с мерами, dfi — скалярная неотрицательная мера Лебега-Стилтьеса (импульсное управление). Предмет исследования — необходимые условия оптимальности для задач оптимального управления ИГС и численные методы решения нелинейных задач оптимального импульсного управления с траекториями ограниченной вариации.
Целью работы является доказательство принципа максимума для задач оптимального управления импульсными гибридными системами и построение вычислительных методов импульсного управления в некоторых классах задач с траекториями ограниченной вариации.
Методы исследования базируются на принципе максимума для классических задач оптимального управления с фазовыми ограничениями5^, серии методов численного решения классических задач оптимального управления6', методе разрывной замены времени7', а также модифицированном преобразовании времени (адаптированном для задач оптимального управления ИГС). Метод разрывной замены времени сводит задачу импульсного управления к классической, а окончательные результаты
5>Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. 480 с.
6'Срочко В.А. Итерационные методы решения задач оптимального управления. М.: ФИЗМАТЛИТ, 2000. 160 с.
7>Миллер В.М. Метод разрывной замены времени в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. 1993. № 12. С. 3-32.
получаются путем расшифровки в терминах исходной модели принципа максимума и алгоритмов улучшения в соответствующих преобразованных классических задачах.
Кроме того, в работе используются теория функции вещественного переменного и аппарат дифференциальных уравнений с мерами.
Научная новизна. В работе предложена новая модификация метода разрывной замены времени, подходящая для задачи оптимального управления ИГС. Отметим, что другие реализации метода замены времени не применимы в этой задаче. Полученный в работе принцип максимума является первым из известных автору результатов по необходимым условиям оптимальности первого порядка для задач оптимального импульсного управления со смешанными ограничениями на меру и траекторию.
Разработанные в диссертации процедуры численного решения нелинейных задач импульсного управления с траекториями ограниченной вариации при ограничении на полный импульс управляющего воздействия являются новыми.
Предложены новые формализации задач оптимального импульсного управления динамикой численностей конкурирующих популяций и быстродействия в двух моделях манипуляторов с блокируемой степенью свободы.
Достоверность и обоснованность результатов диссертационной работы обусловлена строгостью доказательств, адекватными результатами вычислительных экспериментов, апробацией и обсуждением на научных конференциях, а также экспертизой публикаций в ведущих научных журналах.
Теоретическая и практическая значимость. Полученные в работе результаты по преобразованию задачи оптимального управления ИГС к классической могут применяться для разработки методов качественного исследования задач оптимального управления ИГС (например, для получения условий оптимальности, инвариантности и др.). Принцип максимума может применяться при решении задач оптимального управления ИГС. Практическое значение полученных результатов определяется широким спектром прикладных задач импульсного управления, которые описываются классом моделей ИГС, и возможностью их численного решения на базе разработанных методов.
Проблематика работы является составной частью исследований, выполнявшихся в ИДСТУ СО РАН по базовому проекту "Методы оптималь-
ного управления при структурных воздействиях и неопределенностях с приложением к техническим и социально-эколого-экономическим системам" (№ гос. регистрации 01.2.007 08580) в рамках программы фундаментальных исследований СО РАН, 2007-2009 гг., по проекту III.24.1.3.10 "Методы и вычислительные технологии исследования задач управления с приложениями к социальным, экономическим, природным и техническим системам" (№ гос. регистрации 01.2.010 01345), 2010, 2011 гг., а также по проектам РФФИ 05-01-00477, 08-01-00156.
Соответствие диссертации паспорту научной специальности. В соответствии с паспортом специальности 05.13.01 в диссертации проведено теоретическое исследование сложных задач динамической оптимизации (задач импульсного управления при нестандартных смешанных-ограничениях); предложен конструктивный метод сведения этих задач к классическим, использующий технику разрывной замены времени; разработано специальное математическое и программное обеспечение для решения оптимизационной задачи (пп. 1, 4, 5 области исследований).
Апробация работы. Результаты диссертации докладывались на 5-й Международной научной конференции по физике и управлению (PhysCon 2011), Леон, Испания, 2011; 18-м Всемирном конгрессе Международной федерации по автоматическому управлению (The 18th IFAC World Congress), Милан, Италия, 2011; Российско-монгольской конференции молодых ученых по математическому моделированию, вычислительно-информационным технологиям и управлению, Иркутск, Россия — Ханх, Монголия, 2011; 2-й Международной школе-семинаре "Нелинейный анализ и экстремальные задачи", Иркутск, 28 июня - 4 июля 2010; X Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям, Ханх, Монголия, 2009; XIV и XV Байкальских международных школах-семинарах "Методы оптимизации и их приложения", Иркутск — Северобайкальск, 2008, и Иркутск — Листвянка, 2011; 8-й Португальской конференции по автоматическому управлению (CONTROLO'2008), Вила Реал, Португалия, 2008; IV Международном симпозиуме "Обобщенные решения в задачах управления" (GSCP'08), Улан-Удэ, 2008; 9-й школе-семинаре "Математическое моделирование и информационные технологии", Иркутск, 2007; 7-й Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям, Новосибирск, 2007, а также на ежегодных конференциях "Ляпуновские чтения", Иркутск, 2008-2010. Результа-
ты диссертации обсуждались на семинаре в Институте математики Университета г. Севилья, Испания (май, 2010) и регулярно — на семинарах ИДСТУ СО РАН.
Публикации и личный вклад автора. По материалам диссертации опубликовано 15 работ, в том числе статьи [1-5] в журналах, рекомендованных ВАК РФ. На защиту выносятся результаты, полученные автором самостоятельно. В статьях [1-3, 7, 8] Е.В. Гончаровой принадлежат постановки задач оптимального импульсного управления со смешанными ограничениями на меру и траекторию и модифицированное преобразование времени для учета такого типа ограничений. Автором диссертации в этих работах получен вид редуцированной задачи, дано обоснование метода преобразования исследуемой задачи к классической на основе модифицированного преобразования времени и доказан принцип максимума. В работах [4, 5] Е.В. Гончаровой принадлежит идея построения методов приближенного решения нелинейных задач импульсного управления с траекториями ограниченной вариации с использованием метода разрывной замены времени. Расшифровка алгоритмов и доказательства теорем о сходимости получены автором. В публикациях [6, 9] автору принадлежит техническая реализация общего вычислительного метода оптимального управления дискретно-непрерывными процессами. Программная реализация вычислительных методов и численный анализ модельных и прикладных задач проведены автором работы.
Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения и списка литературы, включающего 194 наименования. Общий объем диссертации составляет 143 страницы, из которых 124 страницы основного текста, включающего 29 рисунков и 2 таблицы. Результаты главы 1 опубликованы в работах [1-3, 7, 8], результаты главы 2 — в работах [4-6, 9], результаты главы 3 — в работах [1, 6].
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во Введении обосновывается актуальность темы исследования, дается краткий обзор имеющейся литературы и характеризуются основные результаты диссертационной работы.
Первая глава содержит основные теоретические результаты. В § 1.1 приводится постановка задачи оптимального управления импульсной ги-
бридной системой (ИГС) следующего вида:
¿х — /{Ь, х, и) ей + х, и) с1ц, (1)
х(0-)=х°, (2)
и{і)є.и С,<ірс-п.в., (3)
Ф(і,аг(«))<0, (4)
<3_(£: )) = 0, <3+(і,х(і)) = 0 с^-п.в., (5)
ф(і,і(«-)) < о, Ф(г,х(г)) < о йц-п.ъ., (6)
ц(Т) < м. (7)
Здесь х° € Кп; х(-) € ВУ+([0, Т],ЕП) являются непрерывными справа функциями ограниченной вариации; ы(-) — измеримые по Борелю функции; (1/.1 — регулярная неотрицательная мера, порожденная (неубывающей) функцией (х(-) € ВУ+({0,7'],®), д(0—) = 0, <1цс — непрерывная компонента разложения Лебега меры ¿(1] М — положительное число. Предполагается, что Ф(0, х°) < 0.
Приняты следующие предположения: множество I/ С Мт выпукло и компактно; функции / и д непрерывны по совокупности переменных, удовлетворяют локальному условию Липшица и линейного роста по х; вектор-функции Ф и Ф непрерывны по г € {—,+}, — непре-
рывные неотрицательные вектор-функции; множество х, (7, [0,1]) := {Т(1,х,и,а)| и € 1Г, а & [0,1]}, где ^(Ь,х,и,а) = (1 - а)/(г,х,и) + ад(£,х,«), выпукло при всех (£,х).
Под траекторией системы (1), (2) при управлениях и(-), (1/1 понимается непрерывная справа функция х(-) ограниченной вариации, удовлетворяющая всюду на отрезке времени [0, Т] интегральному соотношению
х(1) = х° + Г /(9, X, и)(19 + [ д(в, X, и)йцс{в) + V \х{т)). (8) иа J о
Суммирование в (8) ведется по г € П [0, (]. Здесь О^ = {т 6 [0, Г] : [д(т)] ф 0} — множество точек разрыва функции Интеграл по мере понимается в смысле Лебега-Стилтьеса. Скачки функции х(-) в точках г € О^ определяются равенствами
1х(т)] = хт(Тг)-ф-),
где Тт = [К7")], а Функции хт{-) € Ж7([0,ТГ],К") удовлетворяют системе к(в) = д{т, х(в), ит(в)), ит(в) е и С-п.в. [0,Тт], *(0) = х(т-). (9)
Систему (9) назовем предельной, а семейство Х(-) — {хгт(-),?гт(')}тей„ будем называть пополнением графика разрывной траектории х(-). Скажем, что пополнение Х(-) графика траектории х(-) является допустимым, если при каждом т е D,¡ оно удовлетворяет ограничениям
Ф(г,*г(0))< 0, 0е[О,Гт]. (10)
Рассмотрим задачу оптимального управления импульсной гибридной системой
(Р) I = F{x(T)) -> inf при ограничениях (3)-(10).
Здесь функция F(x) непрерывна. Набор а — (х(-), и(-), dfi(-), Х(-)), удовлетворяющий всем условиям (3)-(10), будем называть допустимым процессом задачи (Р). Совокупность всех допустимых процессов задачи (Р) обозначим через Е(Р).
Раздел 1.2 посвящен модификации метода разрывной замены времени для задач оптимального управления ИГС. Эта модификация приводит к следующей редуцированной классической задаче оптимального управления на нефиксированном отрезке времени [0. S], S >Т:
(RP) J = F[y+{S)) —inf при ограничениях
£=<*, V± = af{bv+,v) + {\-a)p±g{£,y±,v), ??± = (1-а)/?±> (11)
£(0) = г/±(0) =0, у±(0) = ®°, (12)
=Т, V+(S) = r¡^(S) < М, y+{S) = y_(S), Ф(5,y+(S)) < 0, (13)
v(s) € U, a(s), /ЗД б [0,1], P+(s)+P_(s) = 1, (14)
а(а)Ф(€(в),У+(в))<0, (15)
(1 - а(в))^_(8)Ф($(8), y_(s)) < 0, (16)
- »?+(«) < 0, J,- = I T,(s) ds = 0, j = 173. (17)
Jo
Здесь траектории £(■), &(-) и 77¡(-), ¿ € {+, -}, являются абсолютно непрерывными функциями, управления и(-), а(-) и &(•) — измеримые по Борелю, условия (14)-(16) выполняются £-п.в. на [0,5], функции Tj в (17) имеют вид Tj = а(т]+-т)-. + <р(у+ - у_)), где tp(z) = (ж, ж), Т2 = (1 - ot)0+Q_(£,y_) и Т3 = (1 - »)/?_<?+(£, у+). Остальные входные данные в (RP) - те же, что и в задаче (Р). Через £(РР) будем
обозначать множество процессов ç = (г(-). ui(-)-,S), допустимых в задаче (АР), т.е. удовлетворяющих условиям (11)-(17). Здесь z — (ç,y,rj) и w = (v, а, /?), у = (у+, у-), а г] и ¡3 определяются аналогично.
Редуцированная задача (RP) эквивалентна (Р) в следующем смысле.
Теорема 1. Пусть <г — (х, и, dp., X) € Е(Р). Тогда существует процесс ç = (*,ы; 5) € £(ДР) такой, что S = Г(Г), Г(*) = i + 2ji(t), i € [О, Г], и равенства
у+(Г(0) = У-(Г(0) = *(i), »^(Г(О) = 17-(Г(4)) = Mi) (18)
выполняются всюду на отрезке времени [0,Т].
Теорема 2. Пусть ç £ £(ЯР). Тогда существует а € Е(Р) такой, что выполняются равенства (18), где F(i) = inf{s € [0,51] : £(s) > i},
t € [О, Г), и Г(Т) = 5.
Теорема 3. Оптимальные процессы о* и ç* в задачах (Р) и (RP) существуют одновременно, причем 1{о*) = J(<*)-
В § 1.3 получены необходимые условия оптимальности в задаче (Р) путем анализа условий понтрягинского минимума в редуцированной задаче (RP).
Во избежание громоздкости будем считать, что Ф, Ф и Q± — скалярные функции и Ф, Ф не зависят явно от времени t. Предположим дополнительно, что функции /, g, Q± имеют непрерывные частные производные по t, X] F, Ф и Ф непрерывно дифференцируемы. Введем в рассмотрение функции Поптрягина вида
Ha(t, х, ф\ фх, и) = (фх, f(t, х, и)) + ф\ H°(t, х, фх, ф», и) = (фх, g(t, х, и)) + ф»,
расширенные функции Понтрягина
Ha(t, х, ф\ фх, щ I) = Ha(t, х, ф\ фх,и)- Щх), H*±(t, х, ф\ фи; 7) = H'(t, х, фх, ф», и) - 7Q±(î, х), H*±(t, х, фх,ф», и; 7, q) = H*±(L х, ф*, и; 7) - <?Ф(х),
а также соответствующие гамильтонианы На = тахиеу На и Н3,..., "H.±, определяемые аналогично. Здесь ф = (ф*,фх,ф'') — вектор переменных, сопряженных к (t,x,n) (fi формально считается фазовой переменной), f>7> Я ~ скалярные множители Лагранжа, Ф = тах{0, Ф} и обозначение Ф имеет аналогичный смысл.
Теорема 4. Пусть а* € I)(Р) — оптимальный процесс. Тогда существует нетривиальный набор А = ({А*}, Ь(-), {сТ}, йрф, йр*, ¿р®, ф{-)) множителей Лаграижа, такой что выполнены следующие условия:
a) \к € К, к = 07Г, Л0,А2,А6 > О, А8 е К"; б(-) € ВК+([0,Т],К) -неубывающая функция, 6(0-) = 0; Сг < [6(т)], г € £>*, — неотрицательные числа; (Iрф и скалярные неотрицательные меры, определенные на <В(о,г]8^ и абсолютно непрерывные относительно мер Лебега и йц*с соответственно; , т € £>*, — скалярные неотрицательные меры, каждая из которых определена на В[о,т;], т; = [/х*(т)], и абсолютно непрерывна относительно меры Лебега;
ф{-) € ВУ+([0,Т]Л2п+3), Ф=(Фг,Фх+,Ф1,Г+,Г-)-
b) Справедливы равенства А2(/и*(Т) — М) — 0, Х6Ф(х*(Т)) = 0, меры с1рф и <1рф локализованы соответственно на множествах € [0,Г] : Ф(х*(г)) = 0} и {Ь е [0 ,Т] : Ф(®*(4)) = 0}, при любом тей; мера локализована на множестве {в € [0,Т*} : Я>(х*(в)) = 0}.
c) Компо'ненты г € {+, —}, вектор-функции ф(-) имеют вид
= А3(г - Т) + Ь(Т) - Щ) - А2 - А7, ^(0 - Аз(Т - О + 6(0 - Ъ{Т) + Ат, « € [0, Г].
Функции фь{-), Ф{{-) удовлетворяют системе дифференциальных
уравнений с мерами
¿ф1 = - +
Л о
(1ф% = -д^нчг - + А4УФ <1р$, (19)
л
<ц>*- = --^НЧр* + А5УФ ¿р"
при условиях ф*(Т) = -Аь ^(Г) = -У^(а;*(Т))-АеУФ(х*(Т))-А8, Ф1(Т) = А8.5 уравнениях (19) производные функций На, Щ подсчи-тываются вдоль наборов х*, фг, ф% + фх_, и*) и (¿, х*, <Щ, ф?, и*\ А3) соответственно, а производные функций Ф и Ф вычисляются в точке х*. Скачки функций фь(-), ф?(-) в точках т £ £>* определяются соотношениями
[#(т)] = ф\т) - р*.+(0), [0?(т)] = #(т) - р*<(0).
8^[о,г| ~~ с-алгебра борелевских подмножеств [0, Г).
Функции и рх'г(-), г € {+,-}, удовлетворяют на отрезке
[О, Т*\ сопряженной предельной системе
при условиях р^~{Т*) = Ф1(т), = #-(0), рх/{Т*т) = фх(г).
Здесь <1р~ = ¿Рт, йр* — нулевая мера.
с1) Равенства
На(1, х*, ф\ ф% + фх_, и*) = х\ф\ фх+ + ф1), тах{ВД х',фх+, ФЧ и*; А3), х\ фх_, ф11, н*; Л3)} =
= тах{^1(г, а:*, Аза:*, ф1, А3)}
выполняются соответственно С-п.в. и (1/1*-п.в. на [О, Т]. е) Неравенство
Па > тах{Н'_,Н%}
выполняется С-п.в. на [О, Т] \зирр{й/и*}, а неравенство
На < тах{Н3_,П\}
справедливо (¡ц*-п.в. на [О, Т]. Здесь функции На и вычисляются вдоль наборов (£, х*, фь, ф++фх) и (£, х", ф^, ф1^; А3, А5) соответственно, а функции — в точках (Ь,х*А3).
/) При каждом т € условия
Нэ(т,х*т,рх'\ф>1(т),и*т) = Н8(т,х*т.,рх/,ф?{т)), i е {-,+},
на(т,х;у+,рх'+ +рхт'-(т;у, а4) < н^т,*;,?*, г® +
-На(т,х*(т),ф-,РХ<-+Рх-+(ТТ*)) < Н'^^У'-Мт)-^) + выполняются С-п.в. на [0,Т^].
Полученные условия оптимальности близки по форме к принципу максимума для слабых решений в задачах импульсного управления с фазовыми ограничениями и необходимым условиям оптимальности обобщенных решений гибридных систем с односторонними ограничениями9'.
Возникновение в качестве множителя Лагранжа неизвестной функции Ь(-) ограниченной вариации, а также повышение размерности сопряженных переменных связаны со смешанными ограничениями (5), (6). Условия е) оптимальности носителя непрерывной компоненты управляющей меры устанавливают приоритеты между возможными режимами поведения системы. Группа условий /) отвечает за локализацию моментов импульсов и правильный выбор пополнения Х*(-) = {х*(-),и*(-)}тес>. графика траектории £*(•).
Вторая глава посвящена методам приближенного решения задач оптимального импульсного управления. Здесь предлагается конструкция методов оптимизации импульсных управлений на основе редукции к классическим задачам оптимального управления с помощью сингулярных пространственно-временных преобразований. Для приближенного решения задачи (Р) применяется общая "концептуальная" схема: 1) преобразование импульсного процесса к процессу классической задачи оптимального управления с помощью методов редукции; 2) применение подходящей базовой процедуры для приближенного решения преобразованной задачи; 3) восстановление искомого импульсного процесса с помощью обратного преобразования времени. Полученные в работе аналитические соотношения, описывающие прямой и обратный переход между допустимыми процессами задач (Р) и (RP), позволяют использовать готовые программные продукты для численного решения задачи оптимального управления ИГС, в частности в диссертационной работе применяется пакет OPTCON III10'.
В §2.1 рассматривается задача оптимизации управления простейшей гибридной системой — моделью "с толчками" (дискретно-непрерывной си-
9> Miller B.M., Bentsman J. Optimal control problems in hybrid systems with active singularities // Nonlinear Anal. 2006. V. G5, № 5. P. 999-1017.
1D'J Зародшок T.C. Вычислительные технологии поиска глобального экстремума в задаче оптимального управления с параллелепшгедными ограничениями: Дис... канд. тех. наук: 05.13.01; ИДСТУ СО РАН. Иркутск, 2011. 138 с.
стемой, ДНС)
/ = Р(х(Т)) ->■ Ы, х = /(Ь,х,и), х(О-) = х0, Ип)] = д{тих{п-),щ), «€¿7, ¿|И| <М.
(20) (21) (22) (23)
Здесь £ 6 [О, Г], £(•) е ВК([0,Т];К.п), и(-) - борелевские функции со значениями в выпуклом компактном множестве I/ С Мг. Моменты г» приложения импульса не фиксированы и вместе с векторами ц е Кт подлежат определению в результате оптимизации критерия качества (20). Для данной задачи дана конструкция общего вычислительного метода оптимизации. Конструкция включает процедуру аппроксимации обобщенных решений ДНС (слабых-* пределов последовательностей траекторий системы (21)-(23)) траекториями дискретно-непрерывной системы.
Подход к численному решению задачи (Р) может состоять в переходе к задаче оптимального управления нелинейным дифференциальным уравнением с мерами, в которой ограничения вида (4)-(6), (10) предварительно сняты с помощью метода штрафов. В § 2.2 исследуется простейшая задача такого типа:
где мы дополнительно предполагаем, что векторные поля, определяемые столбцами матрицы коммутируют (модель удовлетворяет условиям корректности типа Фробениуса).
Решена задача о расшифровке (базовых) вычислительных алгоритмов поиска субэкстремальных процессов, основанных на процедурах слабого и игольчатого (понтрягинского) варьирования управлений5' в соответствующей редуцированной задаче1'. Формулируются вычислительные алгоритмы для задачи (24)—(26), исследуются их свойства. В алгоритмах присутствует этап построения модифицированного преобразования времени, которое представляет собой результат "варьирования" временных шкал и отвечает в конечном итоге за изменение носителя управляющей меры.
Обозначим через (Л1) вычислительный алгоритм, полученный в ре-
,о
(24)
(25)
(26)
зультате расшифровки базового метода, использующего процедуру слабого варьирования.
Теорема 5. Пусть а0 — (ха(-), и°(-), д,иа) — допустимый процесс задачи (24)-(26), не удовлетворяющий условиям линеаризованного принципа максимумаТогда алгоритм (Лх) определяет новый допустимый процесс ст1 = (а:1^), м1(-), ¿и1) задачи (24)-(26) со свойством улучшения
ПО1) < Ч<7°)-
Введем в рассмотрение неотрицательную величину
10 Т6Д„ Л>
которая определяет меру уклонения процесса а0 от выполнения условий линеаризованного аналога (в части условий максимума по ограниченному управлению и) принципа максимума в задаче (24)-(26). Через мы обозначаем непрерывную компоненту разложения меры Лебега-Стилтьеса ¿Г0, порожденной функцией Г°(£) = Ь + Уаг[0,е] Ь € [О, Т],
С = шах х°, ф, тг°), тг - тг0^} ,
Н = ХНа 4- (1 - А)Н\ А € [0,1], На(1,х,р, д, и) = (р,/(«,х,и)) + д и Н8^,х,р,1) = (р, 0(1, х)1) — функции Понтрягина. Здесь ж = (и, А,/), и — II х [0,1] х ВВ. а функции А°(-) и /°(-) заданы соотношениями
А°№ = ¿°(Г°(*)). = Ь € [0,Т],
гДе £°(") — функция, обратная к Г°(-), ¿и0/\(1и°\ означает производную Радона-Никодима меры (1и° по мере полной вариации = {т €
[0, Г] : Цг^т)]! >0} — множество точек разрыва функции г/°(-)- Под управлением и°(-) понимается фиксированный представитель соответствующего класса эквивалентности — борелевская функция, такая что м°(<) 6 и всюду на [0,Т]. Функция ф(-) = (фг(-),фх(-)) определяется на одном из этапов алгоритма (Ах) как решение сопряженной системы дифференциальных уравнений с мерой
¿ф1 = - ф\Т) = -р,
= -§-хНасИ - £1Р\с1и01, ф*(Т) = —VF(x0(T)),
где производные функций Понтрягина вычисляются вдоль (х°, и0,1При каждом т е D° функция >г°(-) удовлетворяет на [0,1] предельной системе
m = G(T, ^)Ж(г)], *(0) = ®°(г-),
а функции (?г(-) и рг(-) — сопряженной предельной системе
№ = -&Н>(т,^(0),р{0),Р{т))№(т)]\, 9(1) = ф\т), р(0) = —¡¡¡Н*(т, ,p(i?), Z°(r))|[i/°(r)]|, p(l) = ф*(т).
Следующая теорема характеризует сходимость итерационного процесса алгоритма (Ах) по невязке линеаризованного принципа максимума.
Теорема 6. Пусть ак — последовательность допустимых процессов задачи (24)-(26), генерируемая алгоритмом (Ai), тогда Аа(сгк) —> 0 при к —¥ оо.
Критерием остановки алгоритма (Ai) является достаточная малость невязки Дст(сг°).
Алгоритм (Лг), основанный на процедуре игольчатого варьирования управлений в редуцированной задаче, улучшает процессы, не удовлетворяющие принципу максимума в задаче (24)-(26), и сходится по соответствующей невязке. В отсутствие ограниченного управления процедуры (Ai) и (Аг) порождают в исходной задаче улучшения итеративный процесс, который сходится по невязке принципа максимума для импульсных управлений.
Третья глава посвящена апробации разработанного метода редукции и предложенной вычислительной процедуры. Здесь идеи и методы, изложенные в предыдущих главах, применяются для численного исследования ряда иллюстративных и прикладных моделей.
В § 3.1 описывается вычислительный эксперимент, приводятся результаты расчетов для набора тестовых задач оптимального управления ДНС. Для тестирования численных методов была разработана программная реализация общей процедуры, в качестве базового применялся алгоритм проекции градиента. Программа реализована в среде Visual Basic 6.0. В ряде примеров получены процессы, отвечающие обобщенным решениям ДНС (т.е. слабым-* пределам последовательности дискретно-непрерывных траекторий).
Параграф 3.2 посвящен анализу трех моделей из математической теории биологических систем и робототехники. Первая задача — оптимальное
управление популяцией паразитических организмов с помощью их естественных биологических врагов. Предполагается, что популяционная динамика отвечает импульсной модели типа Лотки-Вольтерра, а критерием качества управления выступает компромисс между суммарным ущербом, который популяция вредителей причиняет в течение всего периода управления, и расходами на мероприятия по борьбе с ней. Численное исследование проводилось для набора входных данных, идентифицированных для популяции гусениц Anticarsia gematalis, паразитирующих на сельскохозяйственной культуре сои. Естественными врагами (хищниками) выступают осы. В ходе численного эксперимента для различных начальных данных получены режимы, отвечающие чисто импульсным управлениям. При этом число импульсов, их локализация и интенсивность существенно зависят от численности видов к началу периода управления и величины этого периода.
Найдено численное решение задачи быстродействия для двух моделей манипуляторов с блокируемой степенью свободы11'. Первый представляет собой поступательную пару, прикрепленную к основанию с помощью шарнира. Поступательное движение внутреннего звена телескопического механизма может быть мгновенно заблокировано с помощью фрикционного тормоза (импульсное управление). Другой манипулятор имеет вид двойного маятника, причем одна из степеней свободы (та, что связана с шарниром, соединяющим звенья) подлежит управляемому блокированию. Для каждого из манипуляторов рассмотрено два маневра. Численно найдены управления, рекордные по быстродействию. Результаты вычислительных экспериментов подтверждают, что методы улучшения, использующие разрывную замену времени, успешно работают в различных классах задач оптимального импульсного управления.
РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ
1. Построено преобразование задачи оптимального управления импульсными гибридными системами в форме дифференциальных уравнений с мерами при смешанных ограничениях на меру и траекторию к эквивалентной классической задаче оптимального управления.
2. Доказан принцип максимума для задачи оптимального управления импульсной гибридной системой.
11 > Yunt К. Impulsive optimal control of hybrid finite-dimensional lagrangian systems: Ph.D. thesis Zurich, 2008. 221 p.
3. Разработаны численные алгоритмы поиска экстремалей в классе слабых и понтрягинских вариаций управления для нелинейных задач импульсного управления. Получено численное решение задач оптимального импульсного управления динамикой конкурирующих популяций и быстродействия в моделях движения манипуляторов с блокируемыми степенями свободы.
СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Goncharova Е., Staritsyn М. Optimization of Measure-Driven Hybrid Systems // JOTA. 2012. V. 153, № 1. (Published online: 18 October 2011, DOI 10.1007/sl0957-011-9944-x).
2. Гончарова E.B., Старицын M.B. Задача оптимального импульсного управления с фазовыми и смешанными ограничениями // ДАН. 2011. Т. 441, №1. С. 29-32.
3. Гончарова Е.В., Старицын М.В. Метод разрывной замены времени в задачах оптимального управления импульсными гибридными системами // Известия РАН. ТиСУ. 2011. № 3. С. 41-51.
4. Гончарова Е.В., Старицын М.В. Метод улучшения управления импульсными системами // Известия РАН. ТиСУ. 2010. № 6. С. 53-60.
5. Гончарова Е.В., Старицын М.В. Градиентные методы улучшения для задач оптимального импульсного управления // Управление большими системами. 2010. Вып. 31. С. 35-48.
6. Goncharova Е., Ovseevich A., Staritsyn М. Control Improvement Problem for Discrete-Continuous Dynamic System // Intern. J. of Mathematics and Statistics (IJMS). 2009. V. 5, № A09. P. 71-82.
7. Goncharova E., Staritsyn M. Optimal Control of Impulsive Hybrid Systems // Proc. of the 18th IFAC World Congress. Milan (Italy), 2011. P. 10255-10260.
8. Гончарова E.B., Старицын М.В. Задача импульсного управления при ограничениях на пределы траектории в точках разрыва // Тр. XV Байкальской междунар. шк.-семинара "Методы оптимизации и их приложения". Иркутск, 2011. С. 56-60.
9. Goncharova Е., Ovseevich A., Staritsyn М. Control Improvement Problem for Discrete-Continuous Dynamic System // Proc. of the 8th Portuguese Conf. on Automatic Control (CONTROLO'2008. Vila Real (Portugal), 2008. P. 130-135.
Редакционно-издательский отдел Федерального государственного бюджетного учреждения науки Института динамики систем и теории управления СО РАН 664033, Иркутск, ул. Лермонтова, д. 134 E-mail: rio@icc.ru
Подписано к печати 05.04.2012 г. Формат бумаги 60x84 1/16, объем 1,2 п.л. Заказ 4. Тираж 120 экз.
Отпечатано в ИДСТУ СО РАН
Текст работы Старицын, Максим Владимирович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
61 12-1/888
Федеральное государственное бюджетное
учреждение науки
Институт динамики систем и теории управления Сибирского отделения РАН
На правах рукописи
старицын Максим Владимирович
ПРИНЦИП МАКСИМУМА ДЛЯ ЗАДАЧ ИМПУЛЬСНОГО УПРАВЛЕНИЯ С ОГРАНИЧЕНИЯМИ СМЕШАННОГО ТИПА И ЧИСЛЕННЫЕ МЕТОДЫ ПОИСКА ЭКСТРЕМАЛЕЙ
05.13.01 — "Системный анализ, управление и обработка информации (в технике,
экологии и экономике)"
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель кандидат физ.-мат. наук, доцент Е.В. Гончарова
Иркутск - 2012
Оглавление
Введение 3
1 Импульсное управление при фазовых и смешанных ограничениях на меру и траекторию 27
1.1 Импульсная гибридная система (ИГС). Постановка задачи оптимального управления ..................................................................27
1.1.1 Формальная модель....................................................28
1.1.2 Понятие решения дифференциального уравнения с мерами. Пополнение графика разрывной траектории..........................30
1.1.3 Задача оптимального управления ИГС..............................33
1.2 Преобразование задачи........................................................35
1.3 Необходимые условия оптимальности........................................45
1.3.1 Формулировка результата ............................................45
1.3.2 Доказательство необходимых условий оптимальности............49
1.3.3 Обсуждение ............................................................59
2 Вычислительные методы оптимального импульсного управления 63
2.1 Улучшение дискретно-непрерывных процессов..............................63
2.1.1 Задача оптимального управления ДНС..............................64
2.1.2 Вспомогательные результаты..........................................66
2.1.3 Общая процедура улучшения дискретно-непрерывных процессов 72
2.2 Численные методы решения задач оптимального управления нелинейными дифференциальными уравнениями с мерами........................78
3 Численный анализ модельных и прикладных задач 97
3.1 Решение тестовых примеров..................................................97
3.1.1 Базовый алгоритм улучшения........................................97
3.1.2 Вычислительный эксперимент........................................98
3.1.3 Замечания ..............................................................104
3.2 Прикладные задачи............................................................107
3.2.1 Оптимальное импульсное управление популяцией паразитических организмов........................................................107
3.2.2 Телескопический манипулятор с блокируемой степенью свободы 114
3.2.3 Двузвенный манипулятор с блокируемой степенью свободы ... 118
Литература 125
Введение
Диссертационная работа посвящена исследованию задач оптимального управления импульсными гибридными системами. Этот класс моделей описывается дифференциальными уравнениями с мерами при ограничениях смешанного типа, связывающих фазовую траекторию и управляющую меру.
Данное исследование инспирировано, в первую очередь, работами [68-74, 123, 170-172] и ориентировано на решение следующих вопросов: разработку методов эквивалентных преобразований задач импульсного управления с ограничениями новых типов, вывод необходимых условий оптимальности и построение вычислительных процедур поиска оптимального импульсного управления. В методологическом плане основной упор сделан на систематическое использование сингулярных пространственно-временных преобразований.
Актуальность темы работы и обзор имеющихся результатов
Задачи импульсного управления
Объектом исследования теории оптимального импульсного управления выступают задачи оптимизации с разрывными траекториями и управлениями типа мер или — более широко — типа обобщенных функций (распределений). Исторически, задачи импульсного управления возникают при расширении некоторых классов вырожденных стандартных задач, решение которых не достигается в исходном множестве допустимых управлений (в первую очередь речь идет о системах с линейной зависимостью от неограниченного управления). Под расширением понимается взятие подходящего замыкания множества допустимых процессов исходной модели. При этом руководствуются желанием обеспечить существование оптимального решения в расширенной постановке.
Внимание к данной тематике было во многом обусловлено потребностями моделирования реальных объектов, управление которыми производится на протяжении пренебрежимо малых промежутков времени, таких что протекающие в них процессы можно идеализировать как мгновенные, а результаты управляющих воздействий выражаются в скачкообразных изменениях фазовой траектории. На практике импульсные системы возникают в различных высокотехнологичных отраслях, таких как ракетодинамика, лазерная технология, телекоммуникация, энергетика, робототехника, квантовая электроника, а также в экономике, экологии, при исследовании демографических и эпидемических процессов [39,43,52,62,107,185,193].
Основы теории импульсного управления были заложены в работах H.H. Красовского, С.Т. Завалищина, A.B. Куржанского, В.Ф. Кротова, В.И. Гурмана, Р. Ришела, Дж. Варги. Дальнейшее развитие этой теории связано с именами российских и зарубежных ученых A.B. Арутюнова, А. Брессана, Р. Винтера, В.А. Дыхты, Б.М. Миллера, М. Мотта, Ф.Л. Пе-рейра, Ф. Рампаццо, А.Н. Сесекина, Ж.Н. Силва, Т.Ф. Филипповой, А.Г. Ченцова и др.
Наибольшую сложность и практический интерес представляют задачи импульсного управления с траекториями ограниченной вариации и управлениями типа векторной меры. Разные классы таких задач при фазовых ограничениях и некоторых типах смешанных ограничений изучались в работах Б.М. Миллера и Е.Я. Рубиновича, A.B. Арутюнова, Д.Ю. Карамзина и Ф.Л. Перейра, В.А. Дыхты и О.Н. Самсонюк и др. Важной спецификой подобных моделей является неоднозначная интерпретация условий фазового и смешанного типа, что порождает различные возможные постановки задач, типы локального оптимума и условия оптимальности.
Преобразование задач импульсного управления
В оптимизации импульсных систем широко распространен следующий подход: задача с импульсами преобразуется к некоторой задаче с ограниченными управлениями, для исследования которой применяются уже известные регулярные методы. Последние могут быть впоследствии подвергнуты расшифровке с тем, чтобы можно было дать интерпретацию полученных результатов в терминах задачи импульсного управления. На сегодняшний день уже имеется ряд эффективных методов эквивалентного преобразования задач импульсного управления к задачам с ограниченны-
ми управлениями (и конструктивных методов расширения, если решение не достигается в исходном классе допустимых), в том числе,
• метод преобразования Гурмана к производной задаче, предложенный В.И. Гурманом для вырожденных задач оптимального управления [30,31,34]. Для применения этого метода в задаче импульсного управления достаточно, чтобы векторные поля при неограниченном линейно входящем управлении были линейно независимы и обладали свойством инволютивности ;
• нелинейный вариант преобразования Гоха [145,146], близкий по замыслу к методу В.И. Гурмана, но отличающийся большей симметрией. Разработка этого преобразования в задачах импульсного управления принадлежит В.А. Дыхте [36,37,39,40]. Для применения нелинейного преобразования Гоха достаточно, чтобы в импульсной системе были выполнены условия полной интегрируемости Фробениуса (векторные поля при неограниченных управлениях коммутируют);
• метод разрывной замены времени — в различных его вариация — является эффективным инструментом преобразования в задачах с траекториями из BV. В основе метода разрывной замены времени лежит известная теорема Лебега о замене переменной под знаком интеграла Стилтьеса [74]. Этот подход берет свое начало, вероятно, в работах Р. Ришела [182] и Дж. Варги [195]. В принятой нами форме метод замены времени был впервые предложен Б.М. Миллером сначала для задач со скалярным импульсным управлением [68] и затем — для векторного случая [69]. Последующие обобщения метода были получены в работах А.Н. Сесекина [89-92]. Та же идея, что и в подходе Б.М. Миллера, облеченная в несколько иную форму, лежит в основе техники, которая применялась в работах А. Брессана и Ф. Рампаццо [125,127], а также Ф. Рампаццо и М. Мотта [173-175]. Для гибридных систем с односторонними ограничениями специальное сингулярное преобразование предложено Б.М. Миллером и Дж. Бентсманом как развитие метода пенализации [123,171,172]. В работах Р. Винтера, Ф.Л. Перейра и Ж. Силва [176-178,180,186,188] техника разрывной замены времени была распространена на задачи, в которых динамика описывается нелинейным дифференциальным включением с мерами.
Метод замены времени успешно применялся при решении широкого круга задач, примыкающих к теории импульсного управления. Преобразования этого типа использовались при обосновании различных подходов к определению понятия решения дифференциальных уравнений с мерами, а также в качестве конструктивного приема расширения в моделях,
описываемых уравнениями в распределениях (Дж. Дал Мазо, А. Брес-сан, Ф. Рампаццо, М. Мотта [128,138,173-175], С.Т. Завалищин, А.Н. Се-секин [43,92], Т.Ф. Филиппова [141-143,179], Р. Винтер, Ф.Л. Перейра и Ж. Силва [176,186] и др.).
Рассмотрим задачу оптимального управления дифференциальным уравнением с мерами:
I = F(x(T)) min,
dx = f{t,x,u)dt + G(t,x)dv, x(0-)=x°, (0.1)
u(t) ei/, [ \dv\ < M,
J о
в предположении, что матрица G удовлетворяет условию корректности типа Фробениуса:
г\ г\
[G¿(t,:r),G^(í,x)] :=— G?(t,x)Gj{t,x)-— ж) = 0.
CJ Jb \J Jo
Здесь i,j — 1, m, Gk означает к-й столбец матрицы G, [•, •] — скобка Ли. Метод разрывной замены времени
В основе метода [74] лежит специальное сингулярное пространственно-временное преобразование, при котором время в исходной модели становится новой фазовой переменной. Преобразование времени состоит в растяжении моментов приложения импульса в интервалы конечной длины, пропорциональной интенсивности соответствующего импульсного воздействия, и в "раскрытии" соответствующих сингулярностей. Это позволяет уложить в единую временную шкалу "быстрые движения" и процессы, протекающие в естественном масштабе времени. Соответствующая (0.1) редуцированная задача [74] определена на нефиксированном отрезке времени [0, S], Т < S < Т + М, и имеет вид
J = F(y(S)) ^ min,
у = а/К, у, v) + (1 - á)G(£, у)е, у(0) - х°, ¿ = а, £(0) = 0, (0.2)
№) = Г,
v(s) Е U, a(s) е [0,1], e(s) е В, s G [0, S}.
Здесь управления о;(-) = (г>(-), а(-), е(-)) — ограниченные измеримые по Борелю функции, траектории z(-) = (£(•), у(-)) G Ж7([0, £], Rn+1), В — единичный шар в Ш.т с нормой | • | = || • ||i и центром в нуле.
Любому допустимому процессу (z(-),u(-), S) задачи (0.1) соответствует допустимый процесс задачи (0.2). Прямое преобразование осуществляется следующим образом. Определим на [0, Т] функцию Г(-):
T(t) = t+ f\dv{ß)\, *е[0,Т]. J о
Поскольку функция Г(-) монотонно возрастает, существует обратная к ней £ = Г-1. Функция £(•) абсолютно непрерывна и не убывает на отрезке [0,Г(Т)]. Положим S = Г(Т). Определим управление v(-) как суперпозицию tt(£(-)), а в качестве управлений а{-) и е(-) возьмем борелевские функции, такие что a(s) = £(s) и e(s) = l(£(s)) почти всюду по мере
Лебега С на [0,51. Здесь lit) = f^fl, — производная Радона-Никодима
\dv{t)\
меры du по мере полной вариации. Управление cj(-) = (г>(-), а(-), е(-)) удовлетворяет всем ограничениям в задаче (0.2). Решая задачу Коши, мы найдем допустимую траекторию z(-) = (£(•)>?/(■))• Тем самым будет определен допустимый процесс в преобразованной задаче.
Наоборот, если процесс (z(-),üj(-), S) является допустимым в задаче (0.2), то набор (x(-),u(-),dv), определенный соотношениями
гт
x(t) = y(T(t)), u(t) = v(T(t)), v(t) = (1 - a{s))e(s)ds,
J о
T(t) = inf{s G [0, S] : £(s)>t},
оказывается допустимым процессом задачи импульсного управления (0.1).
Утверждение 0.0.1 ( [74]) Пусть функция £(•) абсолютно непрерывна на [0, S] и удовлетворяет условиям
o<4w<i, £(о) = о, as) = T.
Тогда функция Г(-); определяемая условиями
T(t) = inf{s : f (s) > t} при t e [0, T), T(t) = S при t>T,
есть неубывающая, непрерывная справа функция, и выполняются соотношения:
£(Г(г)) = t при всех t е [0, Т),
r(£(s)) = s, если t — £(s) есть точка непрерывности Г(-). Отображение Г(-) задает обратное преобразование времени.
Нелинейное преобразование Гоха
Нелинейное преобразование Гоха [37] упрощает вид сингулярностей в исходной задаче. Оно задается формулами
\dv{t)[
где rj(t, х, v) — ((t, х, — а C(t, х, v) есть решение допредельной системы
= CUo = у.
Глобальная разрешимость допредельной системы обеспечивается предположением корректности. Результатом применения преобразования Гоха в задаче (0.1) является следующая задача оптимального управления [39]
F(y{T)) min,
у = g(t,y,u,v), u(t)eU С-п.в.,
du = ld/i, l(t) £ В d/jL-п.в.,
dß > 0, (0.3)
ге[о,т], 2/(0) = Ж0, 1/(0-) = о,
ß{T) < м,
где g(t, у, и, I) = {rjt(t, х, I) + rjx(t, х, l)f(t, ж, u)} \x=w,y,i) , а ф и /(•) — новые управления. Здесь d/i — мера, порожденная полной вариацией функции z/(-) (а значит, скалярная и неотрицательная). Исходная траектория х(-) восстанавливается по у(-) при помощи суперпозиции
x(t)=((t,y(t),v(t)), te[0,T}.
Комбинация замены времени с нелинейным преобразованием Гоха
В задачах, где выполнено условие полной интегрируемости типа Фробе-ниуса, метод разрывной замены времени можно применять в комбинации с модифицированным преобразованием Гоха. Замена времени в задаче (0.3) приводит к еще одному варианту редуцированной задачи с ограни-
ченными управлениями и абсолютно непрерывными траекториями: F(y(S)) min,
£ = у = осд(£, у, v, w), w = (1 - ot)e, «0) = 0, y(0)=s°, w(0) = 0, w(S) < M, as) = T, v(s)Gi/, a(s)G[0,l], e(s) G B, s G [0,5], T < S.
Соответствия между процессами задач (0.3) и (0.4) легко устанавливаются по аналогии с тем, как это делается для задач (0.1) и (0.2).
Продолжение редуцированной задачи на фиксированный отрезок времени
Как отмечено выше, преобразование времени (как и его комбинация с преобразованием Гоха) приводят к стандартным задачам оптимального управления, которые, однако, рассматриваются на нефиксированных интервалах времени. Обратимся к постановке (0.2). Заметим, что множество скоростей редуцированной системы в (0.2) содержит нуль. Поэтому всякий процесс задачи (0.2) можно продолжить [74] на максимальный отрезок времени [0, 5], S = Т + М, полагая a(s) = 0 и e(s) = 0 £-п.в. на (S, S] с сохранением свойства быть измеримыми по Борелю функциями. Данный способ продолжения сохраняет информацию о реальном эффективном расходе ресурса импульсного управления. Такое доопределение процесса можно интерпретировать как выработку остаточного ресурса "на холостом ходу" системы. Таким образом, (0.2) может быть сведена к задаче на фиксированном отрезке времени [0, ¿>]
J = F{y(S)) min,
у = af(z, v) + (l- a)G(z)e, y(0) = x°, ¿ = £(0) = 0, aS) = T, (°'5)
u{s)eU, sg[0,5].
Здесь *(.) = (£(■),2/(0), w(-) = («(•),"(•), e(-)), и U = U x [0,1] x B.
Оптимальная продолжительность времени в задаче (0.2) определяется величиной
+ [ (l-a*(s))\e*(s)\ds,
где £**(•), е*(-) — компоненты оптимального управления оо*{-) в продолженной задаче (0.5). Для того чтобы восстановить оптимальное управление в (0.2), следует переопределить управления из (0.5) сдвигом влево по интервалам времени, где одновременно a*(s) = 0 и e*(s) = 0 £-п.в.
Продолжение процессов задачи (0.4) осуществляется аналогично.
Необходимые условия оптимальности импульсных процессов
Необходимые и достаточные условия оптимальности в теории импульсного управления были получены как для задач без ограничений на распределения (когда траектории являются функциями класса LqqU так и при наличии таковых (с траекториями ограниченной вариации). Наиболее сильные необходимые условия первого порядка для импульсных и особых режимов в случае Ь^- траекторного расширения принадлежат В.А. Дых-те и носят название вариационного принципа максимума [36,37,39,40]. Квадратичные необходимые условия оптимальности получены в работах В.А. Дыхты и И.А. Никифоровой [36,78]. Вариационный принцип максимума высокого порядка и его обобщение на нелинейные системы и дифференциальные включения с неограниченной правой частью получены Г.А. Колокольниковой [48].
Для задач с траекториями ограниченной вариации необходимые условия оптимальности в основном сконцентрированы вокруг различных вариантов принципа максимума, а развитие достаточных условий происходило через обобщение методов динамического программирования и условий типа К. Каратеодори и В.Ф. Кротова. Первые и наиболее полные результаты по необходимым условиям оптимальности в задачах с траекториями ограниченной вариации получены в серии работ Б.М. Миллера [70,71]. В [74,123,171] содержатся необходимые условия оптимальности для специальных классов задач импульсного управления, в том числе, задач оптимального управления дискретно-непрерывными системами (в терминах обобщенных решений), задач с ограниченным числом импульсов, линейно выпуклых задач импульсного управления, задач оптимального управления гибридными системами с односторонними ограничениями, а также для задачи импульсного управления с траекториями ограниченной вариации при фазовых ограничениях. Близкие результаты для гладких задач импульсного управления с траекториями из BV получены А. Брессаном и Ф. Рампаццо [126,127] с привлечением метода разрывной замены времени, а также в работах С.Т. Завалищина и А.Н.
Сесекина [43,91].
Негладкие задачи оптимального управления в импульсных системах, не обладающих свойством корректности, с терминальными и промежуточными
-
Похожие работы
- Численный метод и программный комплекс для поиска экстремали в задачах оптимального управления на основе процедуры продолжения по параметру
- Методы улучшения в задачах с линейным неограниченным управлением и их приложение
- Дискретные задачи оптимального управления
- Сквозная оптимизация ветвящихся траекторий выведения космических летательных аппаратов в атмосфере на основе принципа максимума Понтрягина
- Методы нелинейного анализа в построении приближенных решений задач управления и оптимизации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность