автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Метод разделения переменных при построении оптимального и гарантированного управления в однотипных дифференциальных играх и в задачах управления с помехой
Автореферат диссертации по теме "Метод разделения переменных при построении оптимального и гарантированного управления в однотипных дифференциальных играх и в задачах управления с помехой"
На правах рукописи
Гущин Денис Васильевич
Метод разделения переменных при построении оптимального и гарантированного управления в однотипных дифференциальных играх и в задачах управления с помехой
05.13.18 — Математическое моделирование, численные методы и комплексы программ
Автореферат диссертации па соискание учёной степени кандидата физико-математических наук
і з '■■::■! ¿иіз
005061375
Челябинск - 2013
005061375
Работа выполнена на кафедре теории управления и оптимизации Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Челябинский государственный универси-
тет»
У хоботов Виктор Иванович.
доктор физико-математических наук,
профессор
Петров Николай Ннкаїідропмч.
доктор физико-математических наук, профессор, ФГБОУ ВПО «Удмуртский государственный университет», профессор
Заляпин Владимир Ильич, кандидат физико-математических наук, доцент, ФГБОУ ВПО «Южно-Уральский государственный университет» (национальный исследовательский университет), профессор
Институт математики и механики
им. H.H. Красовского Уральского отделения
Российской академии наук
Защита состоится июня 2013 г. в часов на заседании диссертаци-
онного сонета Д212.296.02 при ФГБОУ ВПО «Челябинский государственный университет», расположенном по адресу: 454001, г. Челябинск, ул. Братьев Калпиршгых, 129, в конференц-зале.
С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Челябинский государственный университет».
Автореферат разослан «J2> мая 2013 года.
Ученый секретарь диссертационного совета, доктор физико-математических наук, профессор
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
Общая характеристика работы
Актуальность работы. Актуальным направлением математического моделирования управления динамическими системами при наличии воздействия со стороны неконтролируемых помех, о которых известны лишь области их изменения, является подход, основанный на, том, что помехам предписывается поведение, ухудшающее показатель качества, и соответствии с которым моделируется управление. Такой подход приводит к рассмотрению задачи построения управления в рамках теории игр. Такие задачи имеют своим источником многочисленные задачи из механики и других областей знаний. Актуальность этих задач, их теоретический интерес и прикладное значение обеспечивает интенсивное развитие теории дифференциальных игр. составляютцее основу алгоритмов синтеза оптимальных и гарантированных управлений.
Степень разработанности темы исследования. Становление теории дифференциальных игр связано с ¡заботами зарубежных ученых Р. Ай-зекса. А. Брайсона, У. Флеминга. Основопологающий вклад в развитие дифференциальных игр внесли работы академиков H.H. Красовского и Л.С. Понтрягнна. и представителей их научных школ: Э.Г. Альбрехта.
A.B. Кряжимского. А.Б. Куржанского, К).С. Осипова, А.И. Субботина, H.H. Субботиной, В.Е. Третьякова, В.Н. Ушакова и Р.В. Гамкрелидзе. М.И. Зеликина, Е.Ф. Мищенко и других отечественных математиков.
Изучением конфликтных задач об управлении объектами, которые описываются обыкновенными дифференциальными уравнениями, занимались М. Барди, E.H. Баррон, В.Д. Батухтин, Т. Башар, Р. Беллман, С.А. Бры-калов, Н.Л. Григоренко, П.Б. Гусятников, В,И. Жуковский, H.A. Зенкевич. Н. Ка/гтон, А.Ф. Клейменов, А.Н. Красовский, Ю.С. Ледяев, Дж. Лейтман, Н.Ю. Лукоянов. П.Л. Лионе, A.C. Мищенко, М.С. Никольский, Г. Ольдстер,
B.C. Пацко, H.H. Петров. Л.А. Петросян, Г.К. Пожарицкий. Е.С. Половин-кин, Б.Н. Пшеничный, A.M. Тарасьев, В.И. Ухоботов. А. Фридман, Хо-Ю-Ши, A.A. Чикрий, А.Ф. Шориков, Р. Эллиот и другие ученые.
В работах A.A. Меликяна, А.Н. Ченцова, Ф.Л. Черноуеько и других при изучении конфликтно-управляемых задач развит подход, основанный на коррекции программных управлений.
Цель диссертационной работы. Целью исследования является обоснование метода разделения переменных для однотипных дифференциальных игр со смешанными ограничениями на выбор управления и для однотипных задач управления при наличии помехи, который позволяет получить аналитическое решение для ряда задач об игровой встрече и управления механическими системами переменной массы, испытывающими воздействие со С1 0])01 i ы неко 1 ттрол и ру емо й ном ех и.
Для достижения данной цели в диссертации решены следующие задачи:
1. Предложен метод разделения переменных для однотипных дифференциальных игр с: заданным моментом окончания и со смешанным ограничением на управление. Этот метод позволяет получить простую реализацию построения управления в виде произведения двух функций, одна из которых зависит от фазового состояния, а вторая - от текущего времени и начального запаса ресурсов.
2. Обоснован метод разделения переменных при построении оптимального и гарантированного управлений в однотипных задачах, содержащих опре-■ деленные условия выпуклости.
3. На основе этого метода разработан алгоритм для решения однотипных дифференциальных игр. Найдена зависимость диаметра разбиения ломаных, моделирующих движение, от допустимой погрешности значения целевой функции.
4. Метод разделения переменных модифицирован для задай управления с помехой и с произвольным выпуклым терминальным множеством.
5. Этот метод апробирован на решении дифференциальной игры, которая является модификацией известной в теории дифференциальных игр задачи "мальчик и крокодил".
6. Полученные решения реализованы в виде комплекса программ с наглядным интерфейсом, позволяющим применять его в учебном процессе.
Научная новизна. Разработан и обоснован метод разделения переменных - новый метод построения оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными ограничениями и в однотипных задачах управления с помехой.
■ Для задач, обладающих определенными свойствами выпуклости, установлено, что оптимальное управление в однотипных дифференциальных играх и в задачах управления с помехой можно строить в виде произведения двух функций, одна из которых зависит от текущего времени и начального запаса ресурсов, а вторая - от фазового состояния. В прикладных задачах управления системой переменного состава это означает, что расход топлива строится программным образом, а направление относительной скорости выброса. топлива записит от реализовавшегося фазового состояния. Такой метод построения назван в диссертации методом разделения переменных.
На основе предложенного метода па ЭВМ реализован и зарегистрирован комплекс программ для решения однотипной дифференциальной игры со смешанными ограничениями.
Теоретическая значимость. В диссертации рассматриваются однотипные дифференциальные игры и задачи управления с помехой. Под однотипными в диссертации понимаются задачи, в которых правая часть уравнений движения может быть представлена в виде суммы управлений двух игроков, вектограммы которых являются шарами. К такому виду с помощью замены переменных сводятся известные 1» теории игр задачи "изотроп-
4
ньте ракеты"1 и ее вариант при отсутствии трения "мальчик и крокодил"2, а также контрольный пример Л.С. Поитрягина 2. В них вектограммы игроков являются шарами, зависящими от времени. Линейная задача управления с помехой, в которой цслыо построения управления является минимизация модуля заданной линейной функции, с помощью линейной замены переменных также сводится к задаче рассматриваемого типа. Вопросы построения цены и оптимальных управлений для таких однотипных игр рассмотрены в работах В.И. Ухоботова3, 4 и в совместной работе С.Р. Алеевой и В.И. Ухо-ботова5. Рассматриваемые в диссертации однотипные задачи усложнены тем, что вектограммы игроков зависят еще от оставшегося запаса ресурсов, которые используются для формирования управления. В ряде случаев получаемые игры становятся нелинейными. Такие задачи возникают при управлении механическими системами переменного состава, в которых ис перерасход начального запаса топлива приводит к интегральному ограничению на выбор управления. Так, если величина относительной скорости выброса реактивной массы постоянна, а величина тяга ограничена заданным числом, то получается задача со смешанными ограничениями на выбор управления.
В диссертации разработан алгоритм построения оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными ограничениями и в однотипных задачах управления с помехой.
Практическая значимость. В диссертации приведены практические примеры дифференциальных игр и задач оптимального управления, в которых оптимальное и гарантированное управления строятся согласно предложенному подходу разделения переменных.
Метод разделения переменных апробирован на нахождении аналитического решения модификации известной в теории дифференциальных игр задачи "мальчик и крокодил".
Разработан программный комплекс, реализующий предлагаемый в диссертации метод построения оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными ограничениями и в задачах управления с помехой.
Методология и методы исследования. При построении оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными органичениями и в задачах управления с помехой по/; реали-
1 АГппкс Р. Дифференциальные игры. M.: Mirp, 19G7. 479 с.
2Поптрягш1 Л.С. Лилейные дифференциальные игры (аналитическая теория на основе альтернированного интеграла) .// Тр. МИАН СССР. 198S. Т. 185. С. 208-214.
3Ухоботов В.И. Область безразличия а одиотииных дифференциальных играх удержания на ограниченном промежуткр нремени // Прккл. мятом, и мех. 1994- T. 5S, Вып. 6. С. 55 -ПО.
4Ухоботоо В.И. Метод одномерного проектирования в линейной игре с интегральными ограничениями и однотипные игры // Изв. АН. Техн. кибернетика. 1994. № 3. С. 192 -199.
г'Алеека O.P., Ухоботои В.И. Однотипная игра с интегральным ограничением первого игрока // Втеките ЧелГУ. Серия 3. Математика. Механика. 1999. » 1(4). С. 16-29.
зовавшимся движением понимается пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре измерения, стремящемся к нулю6.
Для доказательства сформулированных утверждений применялись методы математического и выпуклого анализа, математического моделирования, оптимизации и численные методы, теория многозначных функций.
Поставленные задачи решены в диссертации методом разделения переменных, разработанным автором. Управления в задачах строятся в виде произведения двух функций, одна из которых зависит от фазового состояния, а вторая - от текущего времени и начального запаса ресурсов.
При обосновании метода разделения переменных фиксировалась составляющая управления, зависящая от времени. Рассматривалась задача с геометрическими ограничениями. Функция цены игры для этой задачи зависит от выбранной составляющей управления. При наличии условия выпуклости обосновывается существование минимального значения функции цены по выбранной составляющей управления.
На основе предложенного подхода в диссертации построены алгоритмы решения задач однотипных дифференциальных игр и задач управления с помехой.
На защиту выносятся следующие основные положения:
1. Разработан метод разделения переменных для построения оптимального и гарантированного управлений в однотипных дифференциальных играх со сметанными ограничениями и в однотипных задачах управления с помехой.
2. Предложенный метод обоснован для дифференциальных игр и задач управления, обладающих определенными условиями выпуклости и однотипностью в цели и в уравнениях движения.
3. Для ломаных, задающих движение в однотипной дифференциальной игре, найдена зависимость диаметра разбиения от допустимой погрешности значения целевого функционала.
4. Метод разделения переменных модифицирован для задач управления с помехой и с произвольным выпуклым терминальным множеством.
5. Построено аналитическое решение задачи управления точкой переменного состава, которая является модификацией игры "мальчик и крокодил".
6. Разработан программный комплекс для решения дифференциальной игры со смешанными ограничениями на выбор управления.
Степень достоверности результатов. Обоснованность и достоверность полученных результатов обусловлена математической строгостью постановки задач, корректным использованием математического аппарата. Алгоритм предложенного в диссертации метода апробирован при решении мо-
"Красовский H.H., Cj-бботнп Л.И. Позиционные дифференциальные) игры. М.: Науха, 1074. 456 с.
дификации известной в теории д иф фе ре н ц м а л ы i ы х игр задачи "мальчик и крокодил".
Полученные в работе исследовательские результаты согласуются с результатами других авторов.
Апробация работы. Основные результаты работы докладывались на Воронежской весенней математической школе "Понтрягинские чтения-XXI" (Воронеж, 2010), Всероссийской конференции, посвященной 80 - летаю со дня рождения В.И. Зубова, "Устойчивость и процессы управления" (Сапкт - Петербург, 2010), Международной конференции, посвященной памяти В.К. Иванова, "Алгоритмический анализ неустойчивых за-дач"(Екатеринбург, 2011), конференции, посвященной 90 - летию со для рождения академика Е.Ф. Мищенко, "Дифференциальные уравнения и оптимальное управление"(Москва, 2012).
Основные результаты работы обсуждались на научных семинарах кафедры теории управления и оптимизации Челябинского государственного университета (Челябинск, 2010-2012), научном семинаре отдела динамических систем Института математики и механики УрО РАН им. H.H. Крясов-ского (Екатеринбург, 2013).
Комплекс программ, реализующий алгоритм разделения переменных для построения оптимального и гарантированного управлений в однотипных дифференциальных играх и в задачах управления с помехой, зарегистрирован в Объединенном фонде электронных ресурсов "Наука и образование"при Российской Академии Образования (ОФЭРНиО).
Структура и объем диссертации Диссертация состоит из введения. 3 глав, заключения, списка литературы и приложения. Нумерация глав сквозная. Главы разбиты на параграфы, которые имеют двойную нумерацию -первая цифра означает номер главы, вторая - номер параграфа в главе. Нумерация формул в параграфах тройная. Объем работы 102 страницы, библиография содержит 106 наименований.
Основное содержание работы
Во введении излагается история изучаемого вопроса, обосновывается актуальность и научная новизна работы, ставятся цели работы и формулируются основные задачи для достижения поставленных целей, приводятся методы исследования, содержится информация по апробации работы, описана структура диссертации и ее краткое содержание.
Первая глава состоит из 3 параграфов. В §1.1 рассматриваются примеры задач оптимального управления, которые могут быть сведены к изучаемым в рамках данной диссертации однотипным дифференциальным играм. Два первых примера связаны с; игровой задачей управления точкой перемен-
кого состава. В третьем примере рассматривается произвольная линейная задача управления при наличии помехи. Критерием выбора управления является минимизация модуля произвольной линейной функции в заданный момент времени. Излагается процедура сведения рассмотренных задач к однотипным.
В §1.2 приведена постановка линейной однотипной дифференциальной игры в пространстве в которой уравнения движения имеют вид:
¿ = -а(1.)р{1)и + Ь(1.)у> М = 1, |Н|<1, 0<р<1, г<р. (1)
Здесь а(1.) и Ь(1) - неотрицательные при /, < р скалярные функции, суммируемые на каждом отрезке полуоси (-эс,р], р - момент окончания игры. Допустимым управлением первого игрока является произвольная функция и : (—эс.р] х Е" -»■ К", удовлетворяющая ограничению ||и(М)|| = 1, и измеримая функция у : [¿о,р] [0,1], которая строится в зависимости от начального состояния = ^ь, ¿о < р.
Допустимым управлением второго игрока является произвольная функция V : (-ос,р] хР-> К», удовлетворяющая ограничению ||г>(г,.г)|| < 1.
Цели игроков формулируются следующим образом. Задано число г > 0. Первый игрок стремится осуществить неравенство < г, минимизируя
интеграл
/ Я{г,ф))йг. (2)
А
Цель второго игрока заключается в том, чтобы не допустить выполнения этого неравенства. Если второй игрок не имеет возможности не допустить выполнения этого неравенства, то он стремится сделать как можно большим значение интеграла (2).
Предположение 1. Функция д(1,!р) > 0 определена при всех £ < ы, 0<?<1- При любом I < р является выпуклой и непрерывной по <р е [0,1]. При каждом \р е [0,1] она измерима по I и ограничена сверху суммируемой на каждом отрезке из полуоси (—эс,р] функцией С(1).
Дадим определение движения в игре (1). Зафиксируем начальное состояние ¿о < Р, — А)- Возьмем разбиение
ш : /0 < ¿1 < ... < 1к+1 = р (3)
с диаметром с1(и) = пик (/,,:+1 - /,,). Построим ломаную
0<г,<к
ЗЛО = - Ц а{г):р(г)дг^ иЩ,^)) + Ц'й(О^) ьЩ^Щ)). (4)
Здесь = го, к < г < и+ъ г = 07к,. Под движением г(1) будем
понимать равномерный предел последовательности ломаных (4), у которых диаметр разбиения стремится к нулю.
8
Управление а первого игрока, которое обеспечивает неравенство ||г(р)|| < £, строится без использования информации о функции '•Р '• [¿о>.р] [0: !]• Оно равно и = Wo(z), где
wo(z) = Tj—гт* при г Ф 0 и любое ||w;o(z)|j = 1. если 2 = 0.
\\Щ\
Теорема 1. Пусть начальное состояние удовлетворяет неравенствам ГР
j (b(r) - a(r)'r(r)) dr <е для любых L G [l-o,p], (5)
Г(Ь(г) - a(r)tp(r)) dr < e - . (6)
Jto
Тогда для любого числа е* > е существует число S > 0 такое, что для любого разбиения ш (3) с диаметром разбиения d(w) < S и для любой ломаной (4) с управлением первого игрока u(t, z) = u'q(z) выполнено неравенство
\\Ш\\<е-
Теорема 2. Пусть не выполняются либо неравенство (5), либо неравенство (6). Тогда существуют числа е, > г и S > 0 такие, что для любого разбиения ш (3) с диаметром разбиения d(ui) < 5 и дм любой ломаной (4) с управлением второго игрока v(t, z)— wo(z) выполнено неравенство >
fti+i
Число Ö выбирается из условия I (а(г) 4- 6(r)) dr <£*—£.
Управление if{L) : [¡о,р] -> [0,1] первого игрока строится как решение задачи о нахождении минимума расхода ресурсов:
g(r,v(r))dr->mm, ^ г (7)
по всем измеримым функциям ip, удовлетворяющим ограничениям (5), (6). Теорема 3. Пусть выполнены условия совместности Hejnëencme (5) и (6)
max Г(6(г) - a(r))dr < s. Г(6(г) - a{r)) dr < г -ta<t<pJt J t«
а функция g(l, tp) удовлетворяет условиям предположения 1. Тогда решение 'го '■ [£<ьр] [ОД] 0 задаче (7) при ограничениях (5) и (6) существует.
Теорема 3 обосновывает метод разделения переменных для построения оптимального управления в однотипной дифференциальной игре (1) с интегральной платой (2). Задача построения управления первого игрока, обеспечивающего выполнение неравенства z(p) < s и минимизирующего плату (2), сводится к решению экстремальной задачи (5)-(7),
В конце второго параграфа первой главы приведены достаточные условия оптимальности управления первого игрока.
9
/ь.
Теорема 4. Пусть измеримая функция ip0 : [i0,p] [ОД] удовлетворяет Связям (5) и (б). Пусть существует число X > 0 v. неубывающая на отрезке [к,р] функция ф{1:) > 0 такие., что ф{10) = 0 и
ГФ(г)(Ь{г) - a(r)<po(r)) dr = é(p)s, '
J t-a
A (J\b(r) ~ Щг)<ро{г)) dr + |M| - s) = 0,
il(r,Mr)) ~ Mr) + А)а(гЫг) = min (g(r,ip) - (ф(г) + А)а(г)^)
для почти всех г € [к.р]. Тогда функция ¡р0(г) является решением, задачи (7) с. ограничениями (5), (б).
В §1.3 рассмотрена нелинейная однотипная дифференциальная игра со смешанными ограничениями и с терминальной платой
à = -a(t, ix, ф + b(t)v, z e Rw, . ï|u|| = 1, INI < 1, (8) ¡i=-g(t,fi)<f, 0<^<L t<p. (9)
Здесь p - момент окончания игры. Первый игрок, выбирая управления и и If, минимизирует норму \\z(p) II. Второй игрок, выбирая управление v, максимизирует эту норму. На выбор управления первого игрока, наряду с геометрическими ограничениями, накладывается еще ограничение
ц{Ь)>0, *о <«<Р-
Предположение 2. Функции > 0, g{l,f.i) > 0 определены при
t < р, ц> 0, 0 <.'f < 1 и являются непрерывными. Функция 6(f) > 0 суммируема на каждом отрезке, полуоси (-ос,р].
Предположение 3. При каждых I <р, ц> 0 функция a(t, ц, <р) является вогнутой по f € |0.1].
Предположение 4. Для любого начального условия /0 < р, р{к) = \хО > 0 и для любой измеримой функции ip : [l.0,p] ->■ [0,1] дифференциальное уравнение (9) имеет единственное решение р. = j(t;to,po,<f{-)), определенное при
к < I < Р-
Управлениями первого игрока являются любая функция « : (-ос.р] х удовлетворяющая равенству |ММ)|| ~ 1, и измеримая функция ■f(l). которая строится в зависимости от начального состояния к, Яо, До и удовлетворяет неравенствам
0<?<1, 7(р; к, До, <?(•)) > о, к < I < р. 10
Управление второго игрока задается функцией v : (-oc,j>] х M" -»• К", которая удовлетворяет ограничению ||i'(i, z)\\ < 1.
Функция цены и оптимальные управления и0 : Rn -» Rn, "о : [h,p] * К" К" игроков строятся на основе результатов, полученных в работах' для дифференциальных игр с геометрическими ограничениями.
Оптимальное управление : [¿о.р] [0.. 1] строится как решение следующей оптимизационной задачи:
v(-)
О < ф) < 1 при t0<t<p, 7 (р; у(-) > 0, (11)
где обозначено
Jta
f{t,iJ.o,A-)) = -J а,{г.,ц{т),ф))<1г,
F{lo,Vo, -A')) = max [Дт, ^ ¥?(-)) + f b{r) dr].
taST<p Jr
Метод разделения переменных для построения оптимального управления первого игрока в нелинейной однотипной дифференциальной игре (8),
(9) обоснован' в следующей теореме.
Теорема 5. При любых l0 < p. zq 6 R", До > 0 решение <р0(1) в задаче
(10), (И) существует.
Функция (10) является функцией цены в игре (8), (9). Во второй главе предложена модификация метода разделения переменных при построении гарантированного управления в нелинейных однотипных задачах управления с помехой.
В §'2.1 рассмотрены нелинейные задачи управления о выводе фазовой точки на произвольное выпуклое множество в фиксированный- момент времени при наличии воздействия со стороны неконтролируемой помехи
z = Ф)и + b(t)v, z G Rn, ||u|| = 1, INI < 1, (12)
/i = -5(t,M,¥?) 0<?<1, t<p. (13)
Здесь, j) - заданный момент окончания процесса управления, v - помеха.
Предположение 5. Функции a(t,n,<f) > 0 и g(t,p,4>) > 0 определены, при t < р, /f > 0, 0 < V2 < 1 и являются непрерывными. Функция b{t) > 0 суммируема на као/сдом отрезке полуоси (—ос,р].
"Ухоботов В.И. Синтез упраилепня и одлотиииых. дифференциальных играх с фиксированным временем // Вестник ЧелГУ. Серия 3. Математика, механика. 1996. .V« 1(3). С. 178-184.
11.
Предположение 6. При асах I < р, ¡л > 0 выполнено равенс.тво дЦф, 0) = 0.
Предположение 7. Для любого начального условия ¿о < Р, М^о) = А) > О и <?ля любой измеримой функции <р : [/.0,р] ~> [0,1] дифференциальное уравнение (13) имеет единственное, решение fj.it) = -у(Р,10,Ц0,¥>(•))> определенное при ¿о < 4 < р.
Помехе предписывается действие, ухудшающее показатель качества, который необходимо минимизировать. Управление строится таким образом, чтобы достичь поставленной цели при наихудшей реализации помехи. В отличие от дифференциальной игры наихудшая реализация помехи не строится.
Управлением является функция и : [10,р] х К" К", У которой |!«(М)11 = 1: и измеримая функция --Р : [10,р] -> [0,1], которая строится в зависимости от начального условия ¿о < Р, /¿(¿о) = Мо > 0, г(1-о) € К".
При каждом ¡1 > 0 задано выпуклое замкнутое множество %(/х) С К". Задача заключается в построении допустимого для начального состояния /.о < р, г(/.0) = го, //(/-о) = Но > 0 управления, которое обеспечивает включение
г{р) € '¿Ш), ц{р) > 0 (14)
для любого реализовавшегося движения.
Чтобы построить управление и(1,г), гарантирующее выполнение включения (14), рассмотрим дифференциальную игру с геометрическими ограничениями
¿ = -а(«,М0,¥>(0)« + &(Ф. МО = «>.?(■)). N1 < 1, ||«||<1
и с терминальной целью (14). Для этой игры в работе4 приведен алгоритм построения альтернированного интеграла Л.С. Понтрягина в случае, если
ММ) II < 1.
Альтернированный интеграл равен8
ИЧ*; «о, «>,¥>(•)) = ^{¡.^-^Ь^оМ^ + ^^тМШ (15) Здесь 5 ={ге К" : ||г|| < 1},
ГР
/3(Р,¿0. ДО. ¥>(■)) = тах / (6(г) - Мг), ?(»•)) ^
t<т<pJT
«(¿; /.0, Мо, <р(0) = № 'о. До, ?(■)) +1 (а(г, МО. ^(г)) - 6(г)) ¿г.
Посредством ЛГ±У = {г € К" : г + У С X} обозначена геометрическая разность" двух множеств X и У в пространство Е".
"Ухоботов В.И. Однотипные дифференциальные игры с выпуклой целью /7 Тр. 1ШМ УрО РАН. 2010. Т. 16, .V' 5. С. 196-204.
"Понтрт ии д.С. Линейные дифференциальные игры преследовании // Матом. сб. Нонам серия. 1930. Т. 1X2, Вып. 3. С. 307-330.
С помощью алгоритма из работы8 строится управление •u(t,z), ||«(í, z)|¡ = 1, обеспечивающее выполнение включения (14). Оно строится из начального состояния z(¿o) € И7 /,0j Mo-¥=(")) следующим образом.
Обозначим при 1 < р иге R"
e(í, z) = min{e >0:ze W(l; /о, lio, ?(•)) + 2eS}.
Если множество W{t;to,Цо,<р(-)) = то полагаем s(¿,z) = +оо. Если s(t,z) < +00, то существуют ||u(£, z)\\ = 1 и \\u*(t,z)\\ < 1, которые удовлетворяют включению
z-s{l,z)u(l,z) + £(l.,z)ut(Lz) б И/(/,;¿0!/i0!<£(•)).
Это управление ?/(í, z) является искомым.
В диссертации показано, что множество тех начальных состояний ¿о < р, z(l,о) е R", /¿о > 0, откуда можно осуществить включение (14) имеет вид
z(lo) е Wt(l,0,ii0), W,(¿o,/io) = U /о, 1Ю, ?(•))■
vi)
Объединение берется по всем измеримым функциям tp : [í(hp] [0,1], для которых ¡i(p) = 7(р; ¿/о, <£(•)) > 0.
Положим
— е( ЛИ J^Г(/У')І>Í'£,, = ^ ПРИ любом х > 0;
[sup{>f > 0 : Z(p,)~xS 0} в противном случае.
Тогда, если множество /7(/г) - выпуклый компакт, то №*(/.о,Мо) т^ тогда и только тогда, когда
ГР(Ь(г) - a(r, /i(r), <p(r))) dr < х{ц{р)) при l0 < I < р, (17)
Г
п
при некоторых
ß'(r)= -д(г,ц(г),ф)), fi{to) = ito, ß{v)> о, 0 < ip{r) < 1. (18)
В заключение §2.1 рассматривается случай, когда Z(p) = x(ß)S. В §2.2 рассматривается задача управления (12), (13) о минимизации расстояния до произвольного выпуклого целевого множества Z{ß). Предполагается. что д(1, /г, -р) линейна по ip : [1-о,р] [0,1], т.е. y(l,ß, <р) = gt(l. ß)-p. Управление строится из условия
£ -> min, е > 0, z{p) € Z{ß{p)) + eS, р(р) > 0. (19)
Предположение 8. При каждых t < р, ß > 0 функция a(t, ц, <р) является вогнутой по £ [0,1].
Предположение 9. При каждом, р > 0 множество Z(p) является выпуклым компактом, удовлетворяющим условию замкнутости
ßk —> Ai, Zk -> г, Zk € Z(fik) =» 2 € Z(n),
о, функция x(ß) (16) удовлетворяет условию полунепрерывности сверху
ск с. ßk -> ß, х{цк) > Ск > x{ß) > С.
Подставим множество Z(ß) + sS в формулы (15),(17) и (18). Тогда решение задачи (19) для заданного начального состояния принимает вид
г min, £ > 0, (20)
£ (б(г) - a(r, fi(r), <p{r))) dr < x(ß[p)) + е при /.0 < I < р, (21)
Zo е (Z(n(p)) + £.9) *ß(tо; to,lio, <p(-))S + aft,; to,tto, (22)
At) = -<fc(í.M0M0. ß(h) = ßo, ß(p)> 0; о < v?(¿) < 1. (23)
Теорема 6. Пусть выполнены предположения 5.7-9. Тогда, для любого начального условия lo < р, /¿о >0, го € R" задача (20)-(23) умеет. решение.
Значение целевой функции г на оптимальном управлении <fo{l.) задает функцшо цены E(U). zq, ßo).
В заключение параграфа рассматривается задача о миним изации || z{p) ||. Для такой задачи функция цены имеет вид
E{lo,zo,(M¡)= min max (max í (b{r) - a(>r, ß(r),ip{r)))dr-, W-Ы-)) \to<t<pJt
\\zo\\ + J\a(r,ii(r),<p(r))-b(r))dr). Здесь inin берется по всем функциям, удовлетворяющим соотношениям
(23).
В §2.3 рассматривается задача управления с помехой (12), (13), в которой целью является минимизация значения выпуклой скалярной функции ф : —>■ R в заданный момент времени. Обоснован алгоритм вычисления функции цены и построения оптимального управления : [l-o^p] [0,1]. который основывается на способе решения линейных однотипных дифференциальных игр с геометрическими ограничениями и с выпуклой платой. Функция цены имеет вид
V(t,z) = mill min max é (z0 - a (t0; to. ßo, (■))" + ß (¿o! ¿o - ßo, Ч> С• })v).■
¡p(-¡ ива v£í>
Здесь функции ¡p : [fo.p] [0,1] удовлетворяют (23).
Для построения управления и : [ío-p] х R™ —R", ||u(í, z)\\ = 1, применяется алгоритм, описанный в первом параграфе второй главы, где í{i.z) задается соотношением
t(L z) = inf{£ > 0 : min V(¿, z + єи* - ги) < V(í0. го); и*, и Є А'}.
и* ,«
Третья глава диссертации посвящена аналитическому решению задачи управления точкой переменного состава из §1.1, которая является модификацией игры "мальчик и крокодил". Глава включает пять параграфов, в которых рассматриваются различные случаи решения задачи в зависимости от параметров системы и описывается программный комплекс, реализующий алгоритм метода разделения переменных при построении оптимального управления в однотипной дифференциальной игре со смешанными ограничениями.
В §3.1 получено, что оптимальное управление второго игрока имеет вид
<;0(/„ ?/. X, х) = w0(l,y, X, х),
у-х-{р- t)x - f (р - t.)2
W0(t, у, X, х) =
\у-х-{р-1)х-ЫР -і?
С
при у ф х + (р — L)x +-^-(р — L)2 и любая ||?(,'о(/,у,а;,.г')|| = 1 в противном случае.
Оптимальное управление первого игрока записывается в виде произведения wo(l,y,x, x)'-pa(t.), где ujq задает направление выброса топлива, a ipo(t) -закон изменения массы топлива.
Выписаны достаточные условия оптимальности функции ИМ!>
юг вид:
(1 при 1 < ('0(г) + Л)(р-г)7, О при 1 > (й(г) + А)(р - г)7, любая ¡ро € [0,1] при 1 = (ti'(r) + А)(р — г)').
Здесь А > 0 и неубывающая функция 'tp(t), ф{0) = 0, удовлетворяют условиям:
J^ (b — (р — г)7<fo(r)) dr < г при /,0 < I < р,
[P(b-(p-r)rMr))dr + \\zo\\<s: Jin
ГР
/ ф(г)(Ь - (р - r)7v?o(r)) dr = Ip{p)s, J to
A ( I (b-(p-rhifo(r))dr+\\zo\\-s)=0.
(ftb-b-rhvoWär+Ml-e)
В §3.2 рассмотрен случай, когда параметры задачи удовлетворяют неравенству - > В этом случае управление у?о(0 в зависимости от начальных "67
условий £0. ¡¡2о|| может быть либо нулевым, либо имеет график, изображенный на рис. 1, 2.
Рис. 1 Рис. 2
О £
В §3.3 рассматривается случай — > При этом условии функция ¡р0{1.)
либо тождественно равна нулю, либо имеет график, изображенный на рис. 1.
В §3.4 для случая — > г > найдена функция щ(/,). Она может быть 7 о 27
либо тождественно равной нулю, либо ее график имеет вид, изображенный на рис. 1-3.
гвЩ
В §3.5 описана программа, которая является реализацией предложенного алгоритма метода разделения переменных для построения оптимального и гарантированного управлений в задаче управления точкой переменного состава, описанной в §1.1.
Заключение
В результате проведенного исследования дифференциальных игр и задач управления с помехой разработан новый метод построения оптимального и гарантированного управления, названный п диссертации "методом разделен и я переме нн Ы X ".
В диссертации иследован класс однотипных дифференциальных игр, для которых предложенный метод позволяет построить оптимальные управления игроков. Доказана теорема, указывающая способ для отыскания управлений в линейных однотипных трах с выпуклой интегральной платой и в нелинейных однотипных играх со смешанными ограничениями и с терминальной платой.
В результате исследования нелинейных однотипных задач управления с помехой, выявлен класс задач управления, для которых в диссертации обоснован алгоритм построения гарантирующего управления. В случае терминальной платы построена функция цены.
Мстодика построения оптимальных управлений апробирована на решении практического примера, который является модификацией игры "мальчик и крокодил".
Алгоритм построения оптимального и гарантирующего управления в однотипной дифференциальной игре, которая является модификацией примера "мальчик и крокодил", реализован на ЭВМ. Программный комплекс зарегистрирован в Объединенном фонде электронных ресурсов "Наука, и образова-пие"ири Российской Академии Образования.
Разработанный метод разделения переменных для построения оптимального и гарантированного управлений в однотипных задачах управления с помехой может быть развит и для случая, когда множество окончаний имеет форму кольца. Вопрос решения таких задач требует проведения дополнительных исследований.
Работы автора по теме диссертации Публикации в изданиях, рекомендованных ВАК:
1. Гущин. Д.В. Об одной дифференциальной игре с фиксированным моментом окончания и с интегральной платой / Д.В.Гущин // Вестник ЮУрГУ. Математика.. Механика. Физика. - 2012. - Вып.7. .№34(293). -С.150 152.
2. Ухоботов. В.И. Об одном классе однотипных дифференциальных игр со смешанными ограничениями на управления / В.И.Ухоботов, Д.В.Гущин /7 Вестник УдГУ. - 2010. - Вып.З. - С.81-86.
3. Ухоботов, В.И. Однотипная задача управления с выпуклой целью при наличии помехи / В.И.Ухоботов, Д.В.Гущин // Вестник ЮУрГУ. Математика. Механика. Физика. - 2012. - Вып.6, №11(270). - С.24-29.
4. Ухоботов, В.И. Однотипные дифференциальные игры с выпуклой интегральной платой / В.И.Ухоботов, Д.В.Гущин // Труды института математики и механики УрО РАН. - 2011. - Т. 17, №1. - С.251-259.
Другие публикации:
5. Гущин Д. В. Об одном классе однотипных игр со смешанными ограничениями / Д.В.Гущин // Современные методы теории краевых задач: материалы Воронежской весенней математической школы "Поптрягин-ские чтения - XXI", Воронеж, 3-9 мая 2010г. - Воронеж: ВГУ, 2010. -С.73 74.
6. Ухоботов, В.И. К вопросу о существовании цены игры в однотипной игре со сметанными ограничениями / В.И.Ухоботов, Д.В.Гущин /7 Вестник ЧелГУ. Математика. Механика. Информатика. - 2010. -Вып.12, №23(204). - С.67.....74.
7. Ухоботов, В.И. Об одном классе однотипных игр со смешанными ограничениями на выбор управления / В.И.Ухоботов, Д.В.Гущин // Устойчивость и процессы управления. Всероссийская конференция посвященная 80-ти летию со дня рождения В.И. Зубова. Санкт-Петербург, 1-2 июля 2010г. - С.-Петербург: ВВМ, 2010. - С.182.
8. Ухоботов, В.И. Однотипная дифференциальная игра с выпуклой платой и терминальным множеством в форме кольца / В.И.Ухоботов, Д.В.Гущин // Известия Института математики и информатики УдГУ.
- 2012. - Вып.1. - C.13G-137.
9. Ухоботов, В.И. Однотипная дифференциальная игра с выпуклой целью и платой / В.И.Ухоботов. Д.В.Гущин // Конференция " Дифференциальные уравнения и оптимальное управление", посвященная 90-летию со дня рождения Е.Ф. Мищенко, Москва.. 16-17 апреля 2012т\: Тезисы докладом. - М.: Математический институт им. В.А. Стеклова РАН, 2012.
- С.137-138.
10. Ухоботов, В.И. Однотипные дифференциальные игры со смешанными ограничениями на выбор управления / В.И.Ухоботов, Д.В.Гущин /7 Алгоритмический анализ неустойчивых задач: тез. докл. Между народ, конф., посвящен, памяти В.К. Иванова, Екатеринбург, 31 окт. - 5 нояб. 2011г. - Екатеринбург: ИММ УрО РАН, 2011. - С.279-280.
И. Ukhobotov, V.l. Single-type differential games with convex integral payoff / V.I.Ukhobotov, D.V. Gusli chin // Trnrly Inst. Mat. i Mekh. UrO RAN. -2011. - Vol.17, №1. - P.251--258.
Подписано к печати 16.05.2013г. Формат 60x84 1/16 Объем 0,9 уч.-нзд.л. Заказ № 532. Тираж 100 зга. Отпечатано на ргоографе в типографии ФГБОУ ВПО ЧГПУ 454080, г. Челябинск, пр. Легаша, 69
Текст работы Гущин, Денис Васильевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ЧЕЛЯБИНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
На правах рукописи
Гущин Денис Васильевич
МЕТОД РАЗДЕЛЕНИЯ ПЕРЕМЕННЫХ ПРИ ПОСТРОЕНИИ ОПТИМАЛЬНОГО И ГАРАНТИРОВАННОГО УПРАВЛЕНИЯ В ОДНОТИПНЫХ ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ И В ЗАДАЧАХ УПРАВЛЕНИЯ С
ПОМЕХОЙ
05.13.18 - Математическое моделирование, численные методы и комплексы программ
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель
доктор физико-математических наук.
профессор,
Ухоботов Виктор Иванович
Челябинск - 2013
Оглавление
Введение ........................................................................4
Глава 1. Построение оптимальных управлений в однотипных дифференциальных играх....................................................13
1.1. Примеры рассматриваемых задач....................................14
1.2. Однотипная дифференциальная игра с выпуклой интегральной платой ..................................................................18
1.3. Однотипная дифференциальная игра со смешанными ограничениями и с терминальной платой......................................30
Глава 2. Построение гарантирующего управления в нелинейных
однотипных задачах управления с помехой........................39
2.1. Модификация метода разделения переменных для нелинейной однотипной задачи управления с помехой и с выпуклой целью . . 39
2.2. Задача о минимизации расстояния до замкнутого выпуклого множества....................................................................49
2.3. Выпуклая однотипная задача управления с помехой и с терминальной платой ........................................................58
Глава 3. Решение модификации игры "мальчик и крокодил" . . 62
3.1. Построение оптимальных управлений................................62
3.2. Случай I................................................................64
3.3. Случай II................................................................72
3.4. Случай III ..............................................................75
3.5. Численная реализация на ЭВМ полученного алгоритма ..........86
Заключение......................................................................89
Список литературы ..........................................................90
Приложение 1. Свидетельство о регистрации электронных ресурсов
Введение
Актуальность темы. Актуальным направлением математического моделирования управления динамическими системами при наличии воздействия со стороны неконтролируемых помех, о которых известны лишь области их изменения, является подход, основанный на том, что помехам предписывается поведение, ухудшающее показатель качества, в соответствии с которым моделируется управление. Такой подход приводит к рассмотрению задачи построения управления в рамках теории игр. Такие задачи имеют своим источником многочисленные задачи из механики и других областей знаний. Актуальность этих задач, их теоретический интерес и прикладное значение обеспечивает интенсивное развитие теории дифференциальных игр, составляющее основу алгоритмов синтеза оптимальных и гарантированных управлений.
Степень разработанности темы исследования. Становление теории дифференциальных игр связано с работами зарубежных ученых Р. Айзекса, А. Брайсона, У. Флеминга. Основопологающий вклад в развитие дифференциальных игр внесли работы академиков H.H. Красовского и JI.C. Понтрягина и представителей их научных школ: Э.Г. Альбрехта, A.B. Кряжимского, А.Б. Куржанского, Ю.С. Осипова, А.И. Субботина, H.H. Субботиной, В.Е. Третьякова, В.Н. Ушакова, А.Н. Ченцова и Р.В. Гамкрелидзе, М.И. Зеликина, Е.Ф. Мищенко, Н.Х. Розова.
В работах H.H. Красовского и представителей его научной школы получены основные результаты для задач позиционных дифференциальных игр. Управления в позиционных дифференциальных играх строятся как функции от времени и фазового состояния системы. Движение, порожденное этими управлениями, определяется с помощью пределов ломаных. В рамках исследования таких задач доказана фундаментальная теорема об альтернативе [32], [33], которая утверждает существование решения дифференциальной игры в классе позиционных стратегий. В основе предложенной H.H. Красовским концепции
лежит понятие стабильного моста и правило экстремального прицеливания на него.
Этот подход был распространен в работах Э.Г. Альбрехта [3], [4], A.B. Кря-жимского [36], B.C. Пацко [10], [19], [49], [50], А.И. Субботина [68] - [70], [72], H.H. Субботиной [71], [75], [76], В.Н. Ушакова [95], [96], А.Г.Ченцова [17], [98] - [102] и других представителей школы H.H. Красовского на разные классы дифференциальных игр, в том числе с интегральными и со смешанными ограничениями на выбор управлений игроков.
В трудах JI.C. Понтрягина и представителей его научной школы предложена и обоснована аналитическая схема решения линейных дифференциальных игр преследования. В работах М. С. Никольского [43], [45], [46] доказана сходимость альтернированных сумм и разработаны вычислительные алгоритмы, в основе которых лежат первый и второй методы JI.C. Понтрягина. Они базируются на операции геометрической разности двух множеств и процедуре альтернированного интегрирования. В совместных работах A.C. Мищенко и JI.C. Понтрягина [59] - [61] разработан алгоритм моделирования управления догоняющего игрока в линейной дифференциальной игре преследования без дискриминации его позиций.
В работах В.Н. Пшеничного была развита идея второго метода JI.C. Понтрягина для нелинейных дифференциальных игр [63], [65]. Предложенная в его трудах операторная схема позволила в общем случае нелинейной системы описать структуру позиций, из которых игру преследования можно окончить к заданному моменту времени.
Изучением конфликтных задач об управлении объектами, которые описываются обыкновенными дифференциальными уравнениями, занимались М. Барди, E.H. Баррон, В.Д. Батухтин, Т. Башар, Р. Беллман, С.А. Брыкалов, H.JI. Григоренко, П.Б. Гусятников, В.Н. Жуковский, H.A. Зенкевич, Н. Калтон, А.Ф. Клейменов, А.Н. Красовский, Ю.С. Ледяев, Дж. Лейтман, Н.Ю. Лукоя-нов, П.Л. Лионе. A.A. Меликян, Г. Ольдстер, H.H. Петров, Л.А. Петросян, Г.К.
Пожарицкий, Е.С. Половинкин, А. М. Тарасьев, В.И. Ухоботов, Ф.Л. Черноусь-ко, A.A. Чикрий, А. Фридман, Хо-Ю-Ши, А.Ф. Шориков, Р. Эллиот и другие ученые.
Цель работы. Целью исследования является обоснование метода разделения переменных для однотипных дифференциальных игр со смешанными ограничениями на выбор управления, который позволяет получить аналитическое решение для ряда задач об игровой встрече и управления при наличии помехи механическими системами переменной массы.
Достижение данной цели предполагает решение следующих задач:
1. Предложен метод разделения переменных для однотипных дифференциальных игр с заданным моментом окончания и со смешанным ограничением на управление. Этот метод позволяет получить простую реализацию построения управления в виде произведения двух функций, одна из которых зависит от фазового состояния, а вторая - от текущего времени и начального запаса ресурсов.
2. Обоснован метод разделения переменных при построении оптимального и гарантированного управлений в однотипных задачах, содержащих определенные условия выпуклости.
3. На основе этого метода разработан алгоритм для решения однотипных дифференциальных игр. Найдена зависимость диаметра разбиения ломаных, моделирующих движение, от допустимой погрешности значения целевой функции.
4. Метод разделения переменных модифицирован для задач управления с помехой и с произвольным выпуклым терминальным множеством.
5. Этот метод апробирован на решении дифференциальной игры, которая является модификацией известной в теории дифференциальных игр задачи "мальчик и крокодил".
6. Полученные решения реализованы в виде комплекса программ с нагляд-
ным интерфейсом, позволяющим применять его в учебном процессе.
Научная новизна. Разработан и обоснован метод разделения переменных - новый метод построения оптимального и гарантированного управления в дифференциальных играх со смешанными ограничениями и в однотипных задачах управления с помехой.
Для задач, обладающих определенными свойствами выпуклости, установлено, что оптимальное управление в однотипных дифференциальных играх и в задачах управления с помехой можно строить в виде произведения двух функций, одна из которых зависит от текущего времени и начального запаса ресурсов, а вторая - от фазового состояния. В прикладных задачах управления системой переменного состава это означает, что расход топлива строится программным образом, а направление относительной скорости выброса топлива зависит от реализовавшегося фазового состояния. Такой метод построения назван в диссертации методом разделения переменных.
На основе предложенного метода на ЭВМ реализован и зарегистрирован комплекс программ для решения однотипной дифференциальной игры со смешанными ограничениями.
Теоретическая значимость. В диссертации рассматриваются однотипные дифференциальные игры и задачи управления с помехой. Под однотипными в диссертации понимаются задачи, в которых правая часть уравнений движения может быть представлена в виде суммы управлений двух игроков, вектограммы которых являются шарами. К такому виду с помощью замены переменных сводятся известные в теории игр задачи "изотропные ракеты"[1] и ее вариант при отсутствии трения "мальчик и крокодил"[33, С. 242], [58, С. 327], а также контрольный пример Л.С. Понтрягина [58]. В них вектограммы игроков являются шарами, зависящими от времени. Линейная задача управления с помехой, в которой целью построения управления является минимизация модуля заданной линейной функции, с помощью линейной замены переменных также сводится к задаче рассматриваемого типа. Вопросы построения цены и опти-
мальных управлений для таких однотипных игр рассмотрены в работах В.И. Ухоботова [2], [86], [87]. Рассматриваемые в диссертации однотипные задачи усложнены тем, что вектограммы игроков зависят еще от оставшегося запаса ресурсов, которые используются для формирования управления. В ряде случаев получаемые игры становятся нелинейными. Такие задачи возникают при управлении механическими системами переменного состава, в которых не перерасход начального запаса топлива приводит к интегральному ограничению на выбор управления. Так, в случае, если величина относительной скорости выброса реактивной массы постоянна, а величина тяги ограничена заданным числом, то получается задача со смешанными ограничениями на выбор управления.
В диссертации разработан алгоритм построения оптимального и гарантированного управления в однотипных дифференциальных играх со смешанными ограничениями и в однотипных задачах управления при наличии помехи.
Практическая значимость. В диссертации приведены практические примеры дифференциальных игр и задач оптимального управления, в которых оптимальное и гарантированное управления строятся согласно предложенному подходу разделения переменных.
Метод разделения переменных апробирован на нахождении аналитического решения модификации известной в теории дифференциальных игр задачи "мальчик и крокодил".
Разработан программный комплекс, реализующий предлагаемый в диссертации метод построения оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными ограничениями и в задачах управления с помехой.
Методология и методы исследования. При построении оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными ограничениями и в задачах управления с помехой под реализовавшимся движением понимается пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре
измерения, стремящемся к нулю [33, С. 33].
Для доказательства сформулированных утверждений применялись методы математического и выпуклого анализа, математического моделирования, оптимизации и численные методы, теория многозначных функций.
Поставленные задачи решены в диссертации методом разделения переменных, разработанным автором. Управления в задачах строятся в виде произведения двух функций, одна из которых зависит от фазового состояния, а вторая -от текущего времени и начального запаса ресурсов.
При обосновании метода разделения переменных фиксировалась составляющая управления, зависящая от времени. Рассматривалась задача с геометрическими ограничениями. Функция цены игры для этой задачи зависит от выбранной составляющей управления. При наличии условия выпуклости обосновывается существование минимального значения функции цены до выбранной составляющей управления.
На основе предложенного подхода в диссертации построены алгоритмы решения задач однотипных дифференциальных игр и задач управления с помехой.
На защиту выносятся следующие основные положения:
1. Разработан метод разделения переменных для построения оптимального и гарантированного управлений в однотипных дифференциальных играх со смешанными ограничениями и в однотипных задачах управления с помехой. Этот метод имеет простую реализацию - управление строится в виде произведения двух функций, одна из которых зависит реализовавшегося фазового состояния, а вторая зависит от времени и строится программным образом согласно начальным условиям.
2. Предложенный метод обоснован для дифференциальных игр и задач управления, обладающих определенными условиями выпуклости и однотипностью в цели и в уравнениях движения.
3. Для ломаных, задающих движение в однотипной дифференциальной иг-
ре, найдена зависимость диаметра разбиения от допустимой погрешности значения целевого функционала.
4. Метод разделения переменных модифицирован для задач управления с помехой и с произвольным выпуклым терминальным множеством.
5. Построено аналитическое решение задачи управления точкой переменного состава, которая является модификацией игры "мальчик и крокодил".
6. Разработан программный комплекс для решения дифференциальной игры со смешанными ограничениями на выбор управления.
Степень достоверности результатов. Обоснованность и достоверность полученных результатов обусловлена математической строгостью постановки задач, корректным использованием математического аппарата. Алгоритм предложенного в диссертации метода апробирован при решении модификации известной в теории дифференциальных игр задачи "мальчик и крокодил".
Полученные в работе исследовательские результаты согласуются с результатами других авторов.
Апробация работы. Основные результаты работы докладывались и обсуждались в рамках Воронежской весенней математической школы "Понтря-гинские чтения- XXI"(Воронеж, 2010), Всероссийской конференции, посвященной 80 - летию со дня рождения В.И. Зубова "Устойчивость и процессы управ-ления"(Санкт - Петербург, 2010), Международной конференции, посвященной памяти В.К. Иванова, "Алгоритмический анализ неустойчивых задач"(Екатеринбург, 2011), Конференции, посвященной 90 - летию со дня рождения академика Е.Ф. Мищенко, "Дифференциальные уравнения и оптимальное управление" (Москва, 2012).
Результаты работы обсуждались на научных семинарах кафедры теории управления и оптимизации Челябинского государственного университета (Челябинск, 2010 - 2012).
Диссертационная работа докладывалась на научном семинаре отдела динамических систем Института математики и механики УрО РАН им. Н.Н. Кра-
совского (Екатеринбург, 2013).
Комплекс программ, реализующий алгоритм разделения переменных для построения оптимального и гарантированного управлений в однотипных дифференциальных играх и в задачах управления с помехой, зарегистрирован в Объединенном фонде электронных ресурсов "Наука и образование "при Российской Академии Образования (ОФЭРНиО).
О структуре работы. Диссертация состоит из введения, 3 глав, заключения, списка литературы и приложения. Нумерация глав сквозная. Главы разбиты на параграфы, которые имеют двойную нумерацию - первая цифра означает номер главы, вторая - номер параграфа в главе. Нумерация формул в параграфах тройная. Объем работы 102 страницы, библиография содержит 106 наименований.
Первая глава состоит из трех параграфов и посвящена однотипным дифференциальным играм. Обосновывается метод разделения переменных при построении оптимальных управлений в однотипных дифференциальных играх с выпуклой интегральной платой и в однотипных дифференциальных играх со смешанными ограничениями и с терминальной платой.
Вторая глава состоит из трех параграфов. В данной главе изучены нелинейные задачи управления о выводе фазовой точки на заданное множество в фиксированный момент времени при наличии воздействия со стороны неконтролируемой помехи. Управление удовлетворяет геометрическому ограничению и заданному дифференциальному уравнению. Помехе предписывается действие, ухудшающее показатель качества, который необходимо минимизировать или максимизировать. Задача управления отличается от дифференциальной игры тем, что помеха в
-
Похожие работы
- Моделирование гарантированного результата в задачах управления движением с интегральными ограничениями в условиях воздействия помех
- Теория, методы и алгоритмы моделирования гарантированного результата в задачах управления движением с помехой и с неопределенностью
- Моделирование гарантированного результата в задачах управления движением в декомпозиционных и квазилинейных динамических системах
- Решение некоторых классов дифференциальных игр при неопределенности методом штрафных функционалов
- Численные методы решения дифференциальных игр с нетерминальной платой
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность