автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Аналитические и вычислительные модели некоторых управляемых процессов с неопределенностью
Автореферат диссертации по теме "Аналитические и вычислительные модели некоторых управляемых процессов с неопределенностью"
р г 6 0/1
о 3 ФЕВ 1ЭЯЗ
На правах рукописи
ГУСЕЙНОВ ХАЛИК ГАРАКИШИ оглы
АНАЛИТИЧЕСКИЕ И ВЫЧИСЛИТЕЛЬНЫЕ
МОДЕЛИ
НЕКОТОРЫХ УПРАВЛЯЕМЫХ ПРОЦЕССОВ С НЕОПРЕДЕЛЕННОСТЬЮ
05.13.18 - теоретические основы математического моделирования, численные методы и комплексы программ
Автореферат на соискание ученой степени доктора физико-математических наук
Челябинск - 1998
Работа Выполнена в Институте математики и механики Уральского отделения Российской Академии наук
Официальные оппоненты: Доктор физико-математических наук,
Профессор В.И.Благодатских; доктор физико-математических наук, профессор А.Н.Красовский; член-коррреспондент РАН, профессор А.Г.Ченцов.
Ведущая организация - Московский физико - технический институт
Защита состоится " ^ " Сребра Л Я 1998 г. в " // " час. на заседания диссертационного совета Д 064.19.03 по защите диссертаций на соискание ученой степени Доктора наук При Челябинском государственном университете по адресу: 454136, г. Челябинск, ул. Братьев Кашириных, 129.
С диссертацией можно ознакомиться в библиотеке Челябинского государственного университета.
Автореферат разослан ". С/ " ЯЬ^рЛ , 199-3 г.
Ученый секретарь
диссертационного совета , I
доктор физ. - мат. наук, профессор V. ^—^ Г.А.Свиридюк
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В диссертационной работе рассматриваются теоретические и вычислительные аспекты теории управляемых систем с неопределенностью. Такие системы возникают в разных задачах механики, физики, в математических моделях экономики, биологии и других областях науки. Потребность изучать управляемые системы с неопределенностью возникает в связи с тем что, при моделировании динамических систем некоторые ее параметры измеряются неточно или же вообще не учитываются. Источником неопределенности могут'быть также воздействия на динамическую систему некоторых помех, у которых известна лишь область изменения.
В становлении теории управляемых процессов в условиях неопределенности важное место занимает теория позиционных дифференциальных игр, созданная Н.Н.Красовским и его сотрудниками (см., например1-4 и библиографию в них). В теории позиционных дифференциальных игр концепция управления основывается на принципе обратной связи, где требуется построить позиционную стратегию, гарантирующую определенное качество управляемого процесса при любых заранее неизвестных воздействиях на систему, у которых известна лшць область изменения. К настоящему времени развиты различные методы получения оптимальных стратегий игроков, гарантирующих требуемое качество управляемого процесса. В частности, в рамках теории позиционных дифференциальных игр удалось формализовать многие прикладные задачи: задачу преследования одного объекта другим; задачу сближения - уклонения с целевым множеством; задачу удержания параметров управляемого процесса в заданных пределах и другие.
Одним из основных элементов конструкции теории позиционных дифференциальных игр является функция гарантированного результата, которая как правило является недифференцируемой функцией. В точках дифференцируемости эта функция удовлетворяет уравнению Беллмана -Айзекса. Функция гарантированного результата обладает свойствами и и V - стабильности, позволяющими определить оптимальную гарантированную стратегию. Свойство и - стабильности (и - стабильности) означает слабую инвариантность надграфика (подграфика) функции относительно некоторого семейства дифференциальных включений. Эти свойства мож-
1КрасовскиВ H.H., Субботип А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
'Krasovskii N.N., Subbotin A.I. Game-theoretical control problems. Springer. New York. 1988.
3Kraeovskii A.N., Krasovskii N.N. Control under Lack of Information. Birkhausen 1995,
^Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.
но выразить в-форме дифференциальных неравенств, в основе которых лежат производные по направлениям. Такие неравенства были введены в работах5,6 А.И.Субботиным для определения обобщенных (минимаксных) решений уравнения Беллмана - Айзекса. Они были, по ^ видимому, первыми среди различных по форме определений (включая определение вязкого решения) негладких решений5уравнения Гамильтона - Якоба. 'В основе определения минимаксного решения лежит подходов котором уравнение Гамильтона - Якоби заменяется парой дифференциальных неравенств. В дальнейшем теория минимаксных решений была распространена на'исследование краевых задач для различных типов уравнений в частных производных первого порядка7 .
Отметим, что в работе8 М.Дж.Крэндаллом и П.Л.Лионсом было предложено определение вязких решений уравнения Гамильтона - Якоби. Определение вязкого решения по форме отличается от определения минимаксных решений. Однако, впоследствии в работе9 была доказана эквивалентность определения вязких и минимаксных решений. Доказательство эквивалентности этих определений опирается на возможность овыпукления контингентных конусов и производных по направлениям8,10, используемых в определениях минимаксных решений. Возможность овыпукления контингентных конусов'в определениях минимаксных решений явилась источником ' исследований в негладком анализе по применению конструкций проксимальных градиентов11 .
Дифференциальные уравнения в частных производных первого порядка методами идемпотентйого анализа исследовались в работах В.П.Маслова' и его сотрудников. ' ' '•
Фундаментальные результаты в математической теории управляемых процессов получены в работах Л.С.Понтрягина и его сотрудников.
Широкий круг задач математической теории управляемых процессов в условиях неопределенности был исследован А'.Б.Куржанским и его сотрудниками в рамках теории гарантированного оценивания состояний системы!
'Субботин А.И. Обобщение основного уравнения теории дифференциальных игр. 'Докл. АНЧХСР. 1980. Т. 254. N 2. С.293-297. ' ' ' ' - -v..". " ¿ :
вСубботиа А И. Минимаксные неравенства в уравнения Гамлльтона - Якоби. М.:Наука, 1991. 7Subbotin А Л. Generalized solutions of first order partial differential equations. The dynamical-optimization perspective. Birkhauser, 1995. ' ' ' ^ r - « : s ' •••
•CrandaÙ M.G., lions P.L.Viscosity solutions of Hamilton - Jacobi equations. Trans. Amer. Math. Soc. l983. V.277. P.l-22. ' - •'•' • • '
®Subbotin A.I., Tarasyev A.M. Stability properties of the value function of a differential game and viscosity solutions of Hamilton - Jacobi equations. Problems Contr. Inform. Theory. 1985/Vol.14, no.l.P.451 - 463.
10Guseinov Kh.G., Subbotin A.I., Ushakov V.N. Derivatives for multivalued mappings with applicationatogame theoretical problems of control. Probl. Control Inform. Theory. 1985. Vol. 14. P.155-167.
"Clarke T!H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Qualitative properties of differetial inclusions: a survey. J. of Dynamical and Control Systems. 1995, vol.1, p.1-48.
по результатам наблюдений (см., например12,13 и библиографию в них).
В диссертации рассматриваются динамические системы, математическая модель которых задается дифференциальным уравнением с многозначной правой частью, т.е. дифференциальным включением (ДВ). ДВ можно рассматривать,как обобщение управляемой системы. Они возника- , ют также при исследовании задач, математические модели которых задаются дифференциальным уравнением в неявном виде или же в виде дифференциального неравенства.
По видимому, ДВ впервые рассматривались в работах14,15 как дифференциальные уравнения с многозначной правой частью. Широкое развитие теория ДВ получила в начале 60-ых годов. В этот период установлены важные результаты, относящиеся к качественной теории ДВ, в том числе теоремы существования решений задачи Коши, изучены разные топологические свойства множеств достижимости и интегральных воронок, зависимость пучка траекторий от параметров. Заметим, что в этот же период ДВ применялись для исследования дифференциальных уравнений с разрывной правой частью18 .
Как правило при математическом моделировании управляемых процессов требуется учитывать различного рода сингулярности. Например, оптимальный результат как функция начального положения (функция Беллма-на) может быть недифференцируемой, а границы множеств достижимости управляемых систем не обладают свойствами гладкости. Поэтому в исследованиях математических моделей таких задач методы классического анализа дополняются конструкциями негладкого анализа, который опирается на такие понятия, как субдифференциал, конус касательных или возможных направлений, производная многозначных отображений и т.д. Как известно, в классическом анализе график дифференцируемой функции аппроксимируется гиперплоскостью, в негладком анализе для аппроксимации используются конусы. Этот подход, по видимому, впервые был предложен в работе11 и, дальше, в работах14,15 был применен для определения „траекторий ДВ. Отметим, что обобщение принципа максимума Л.С.Понтрягина для ДВ, которое было получено Кларком, опирается на ,
"Курхансгвй А.Б. Управление в наблюдение в условиях неопределенности. М.: Наук». 1977.
"Kunhaoski A.B., Valyi L. Ellipsoïdal Calculus for Esimation and Control. Birlch'auser, 1996.
14Marchaud A. Sur les champa dea demi-cones et les equations différentielles du premier ordre. Bull. Soc. Math. France. 1934. Vol.62. no.l. P.l-38.
"Zaïemba S.C. Sur les equation« au paratingent. Bull, des Scienc. Math. 1936. 2 Ser., 60, N 5. P.139-160.
^Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. Матем. сборник. 1960. Т51. N 1. C.9J-128.
введенное им понятие касательного конуса . -
Донятие производной многозначного отображения базируется на понятии множества касательных направлений и, определяется как многозначное отображение, графиком которого являются касательный конус к графику исходного многозначного отображения. В зависимости от спе-. цифики задачи, в негладком анализе рассматриваются различные. типы касательных конусов и производных многозначных отображений (см.,. например10'19'20). ' ....... .
Начиная с .работы21, касательные кону сы и производные многозначных отображений находят широкое применение в теории ДВ, , Новый импульс развитию теории ДВ придала теория оптимального управления., Были изучены управляемые процессы, математическая модель которых задается ДВ и получены необходимые условия для оптимальности траекторий ДВ в виде принципа максимума Л.С.Понтрягина (см., например16,'18^22,23 и библиографию в них).
Большое место в исследовании динамических систем с неопределенностью занимает задача удержания траекторий на заданном замкнутом множестве. Рассматриваются два типа задач удержания: задача слабого удержания траекторий (ее синоним - задача существования выживающих траекторий ) и задача сильного удержания траекторий.
Суть задачи слабого удержания траекторий состоит в том, что существует хотя бы одна траектория управляемой системы, которая, остается на заданном множестве. В,задаче сильного удержания требуется, чтобы все траектории, выходящие из заданной начальной позиции оставались на заданном множестве.
Задачи слабого и сильного удержания, исследовались многими авторами (см,,7,10'11, 13'20,21,24 и,библиографию в них). В работах8,11;24 изучены свойства слабой и сильной инвариантности замкнутого множества относительно систем, математическая модель которых задается ДВ. В случае, когда множество является слабо (сильно) инвариантным относительно заданной системы, то задача слабого (сильного) удержания траекторий этой
17BouIigand G. Sur l'existence dee dimi - tangents a une courbe de Jordan. Fund. Math. 1930. Vol.IS. F.215 -218. . . - , ..
"ClarVe f\H. Generalized gradients and applications. Trans. Amer. Math. Soc. 1975.' Vol.205: P.247 -262.
19Половинкин E.C. Теория многозначных отображений. M.: Изд-во МФТИ. 1983. ;. .....
20Aubin J.P., Cellina A. Differential inclusions. Set valued maps and viability theory. Berlin. Springer-Verlag. 1984.
"Naguirio M. Uber die Lage der Integralkurven gewonlicher Differentialgleichungen. Proc. Phys. Math. Soc. Japan. 1942/Vol.24. P.551 - 559. - r
гзБарбашин E.A., Алимов Ю.И. К теории релейных дифференциальных уравнений. Изв. вузов. Математика. 1962. N 1; С.З - 13. ; ,
23Благодатских В.И. Некоторые результаты по теории дифференциальных включений. Summer school on
ordinary differential equations. - Brno, 1975. ■
системы на заданном множестве разрешима.
По видимому, первой работой, посвященной изучению свойства слабой инвариантности, следует считать работу21 . Критерий слабой инвариантности, полученный в работе18, сформулирован с помощью касательного конуса Кларка. Отметим, что эта тематика получила новый размах в начале 80- ых годов в связи с дальнейшим развитием теории ДВ и негладкого анализа (см.,7,10,13' 18-20,23 и и библиографию в них).
В работе25 приведен критерий слабой инвариантности множеств, который имеет инфинитезимальную форму и связывает правую часть системы с касательным конусом Булигана, который содержит касательный конус Кларка. В работе20 этот результат сформулирован в терминах производных многозначного отображения.
В работе10 на базе конструкций теории позиционных дифференциальных игр, получен критерий и - стабильности множеств относительно конфликтно - управляемых систем, в котором применяется локальное овыпу-кление производной многозначного отображения. Пойятие и - стабильности множеств1 близко к понятию слабой инвариантности множеств относительно дифференциального включения. Оно означает слабую инвариантность множества относительно некоторого семейства ДВ, которые определяются правой частью конфликтно - управляемой системы. В работе24 аналогичные критерии получены для слабой и сильной инвариантности множеств относительно ДВ.
Сильно инвариантные множества относительно ДВ рассмотрены в работах (см.,18,20,24 и библиографию в них).
При исследовании управляемых систем, часто оказывается достаточным знать не полную траекторию систему, а только положение системы в определенный момент времени. Совокупность всевозможных векторов состояния системы в этот момент времени называется областью или Множеством достижимости системы в заданный момент времени. В теории управляемых систем большое количество работ посвящено теоретическим исследованиям и численным методам построения множеств достижимости (см., например13,28,27 и библиографию в них).
В диссертационной работе, наряду с теоретическими разработками задач удержания траекторий управляемых систем, левосторонних решений
"Гусейнов Х.Г., Ушаков В.Н. Сильно и слабо инвариантные множества относительно дифференциального включения. Докл. АН СССР. 1988. Т.ЗОЗ. N 4. С.7Э4 - 797.
"Haddad G. Monotone trajectoriea of diiïereatial inclusions and functional differential inclusion with memocy. Israell. of Math. 1981. Vol.39, no.l. P.83- 100. t иЧерноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука. 1988.
"Пакасюк А.И., Пан&сюк В.И. Об одном уравнении, порождаемом дифференциальным включением. Матем. заметки. 1980. Т.27. N 3. С.429 - 437.
уравнения Гамильтона - Якоби, предлагаются вычислительные процедуры построения множеств достижимости управляемых систем с геометрическими, а также с квадратичными интегральными ограничениями на управления.
Цель работы состоит в изучении задач удержания траекторий управляемых систем с неопределенностью на замкнутом множсктво с помощью аппарата производных многозначного отображения, в разработке аппрок-симационных схем и алгоритмов для вычисления множеств достижимости управляемых систем с геометрическими и интегральными ограничениями на управления, в исследовании левосторонних решений уравнения Гамильтона - Якоби.
Методы исследования. В основе разрабатываемых в диссертации методов лежат концепции теории позиционных дифференциальных игр, теории минимаксных решений уравнения Гамильтона - Якоби и теории дифференциальных включений. Активно используются понятия и результаты негладкого анализа, функционального анализа и дифференциальных уравнений.
Научная новизна. 1. Получены критерии для задач слабого и сильного удержания на заданном замкнутом множестве траекторий управляемой системы с неопределенностью, задаваемой дифференциальным уравнением с многозначной правой частью, т.е. ДВ. Другими словами, получены критерии слабой и сильной инвариантности замкнутых множеств относительно ДВ в терминах производных многозначного отображения.
2. С применением этих критериев исследованы некоторые задачи управления: сформулированы необходимые и достаточные условия для функции оптимального результата в задаче управления, в которой динамика задается ДВ; даны дифференциальные соотношения, характеризующие интегральную ворбнку ДВ; для заданного множества определено ДВ, интегральная воронка которого совпадает с этим множеством; доказаны теоремы существования периодических решений ДВ с фазовым ограничением, зависящим от времени; приведено достаточное условие устойчивости (относительно неточных измерений фазового состояния) позиционной стратегии, разрешающей задачу сближения для конфликтно - управляемых систем; найден критерий стабильности множества программного поглощения в линейной задаче сближения.
3. Разработана вычислительная процедура приближенного построения множеств достижимости нелинейных управляемых систем с геометриче-
скими ограничениями на управления. Дано теоретическое обоснование приближенного построения множеств достижимости и получена оценка точности. Вычислены множества достижимости конкретно заданных систем на плоскости.
4. Дана аппроксимационпая схема для построения множеств достижимости управляемых систем с квадратичными интегральными ограничениями на управления. Доказана сходимость аппроксимирующей системы множеств к множеству достижимости и найдена оценка точности приближенных вычислений множеств достижимости. Приведено описание алгоритма для приближенного вычисления множеств достижимости. Проведено вычисление множеств достижимости конкретно заданной системы на плоскости.
5. Введено понятие левостороннего решения (ЛР) уравнения Гамильтона - Якобй и на примерах показано его качественное отличие от минимаксного решения. Приведено достаточное условие существования ЛР и изучены некоторые его свойства. Дано описание левосторонних решений в терминах производных по направлениям. Предложена аппроксимационная схема для построения множеств уровня ЛР.
6. Изучена задача удержания траекторий управляемых систем при наличии помех, задаваемых ДВ с управляющим вектором. Введено понятие позиционно слабо инвариантного множества относительно таких управляемых систем. Получены достаточные условия для позиционно слабой инвариантности. На основе этих условий установлена процедура определения стратегий, удерживающих движения системы на заданном множестве. Приведены процедуры определения стратегий, разрешающих задачу сближения и уклонения для конфликтно - управляемых систем, математическая модель которых задается ДВ.
7. Получены необходимые, а также близкие к ним достаточные условия разрешимости задач слабого и сильного удержания траекторий обобщенных динамических систем на заданном замкнутом множестве. Рассмотрен вопрос существования ДВ, интегральная воронка которого совпадает с графиком многозначного отображения, определяющего эволюцию обобщенной динамической системы. Найдены достаточные условия, гарантирующие удержание траекторий обобщенных динамических систем с управляющим вектором на заданном замкнутом множестве и определены стратегии, удерживающие движения системы на этом множестве.
Теоретическая и практическая ценность диссертации заключается в том, что изложенные в ней методы являются конструктивными. Они создают теоретическую основу для разработки алгоритмов и программ ре-
шения прикладных задач управляемых процессов в условиях неопределенности. Предложенные в работе численные методы могут быть применены при построении множеств достижимости управляемых систем с геометрическими и интегральными ограничениями на управления. Аппарат производных многозначных отображений является удобным средством для анализа задач слабого и сильного удержания траекторий управляемых процессов в условиях неопределенности.
Апробация работы. Результаты диссертации докладывались на 5-ой и 7-ой Всесоюзных конференциях по управлению в механических системах (Казань, 1985; Свердловск, 1990), 2-ой Всесоюзной конференции по функционально - дифференциальным уравнениям и их приложениям (Челябинск, 1987), мини - семестре по дифференциальным включениям и их приложениям в Международном Математическом центре им. С.Банаха (Варшава, 1989), И-ом Всемирном конгрессе Международной Федерации по Автоматическими Управлению (Таллинн, 1990), Всесоюзной конференции по негладкому анализу и его приложениям в экономических системах (Баку, Д991), семинарах отдела динамических систем ИММ УрО РАН, кафедры оптимального управления факультета вычислительной математики и кибернетики МГУ, кафедры теории управления и оптимизации ЧелГУ, кафедры высшей математики МФТИ.
Публикации. По теме диссертации опубликовано 19 работ, список которых приводится в конце автореферата. Результаты, вошедшие в диссертации получены автором. , . ; ' <У "•.'•'
Структура и объем работы. Диссертация состоит из введения, пяти глав, разбитых на 24 параграфов. Объем диссертации составляет 354 страниц, набранных на текстовом редакторе Ш^цХ. Библиография состоит из 267 наименований.
- " СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы исследования, определяется цель работы, дается обзор литературы по исследуемой проблематике, приводятся сведения о публикациях и апробации работы и кратко излагаются основные результаты диссертации.
Первая глава состоит из 8 параграфов и посвящена изучению задач слабого и сильного удержания на заданном замкнутом множестве траекторий
управляемой системы с неопределенностью, задаваемой дифференциальным уравнением с многозначной правой частью, т.е. дифференциальным включением (ДВ). Далее полученные критерии для этих задач применяются доя исследования некоторых задач управления.
В § 1.1 рассматривается аппроксимация. многозначных отображений. Формулируются определения верхних и нижних производных многозначного отображения.
- . Пусть задано замкнутое множество й' СТ х Д", где Т = [О, в]. Полагаем 7 " - щг) = {х 6 Я" : («,*) € И'}. . .
Для (*,х) €Т х Л" определим - *
о+Ш{г,х) = {<1 е й" :Эхь е > Кт^ - х)/{гк - *) = <*},
1Г\¥(1,х) = {а е й" : Зхь € < <,{Дто(х1 - ±)/{Ц - г) = У},
= {а 6 Я" : Зх(т) € Щг),г > ¿^(«(т) - х)/(т - 4) = а},
ДГИ^,х) = {а € Я" : Зх(т) е Щт), г < I, гИто(;с(т) - ±)/(т -1)' = с*}.
Множества й х) называются соответственно правым
верхним и левый верхним, а множества и - соот-
ветственно правым нижний и левым нижним производными множествами многозначного отображения I —►вычисленными в точке (4, х). Эти множества являются замкнутыми и ойй тесно связаны с верхним и нижний касательными конусаМй Вулигапа к множеству IV в точке (4, х) (см., например19,20,24)^ Изучаются некоторые свойства производных множеств, Которые используются В дальнейшем.
В параграфе 1.2 изучается задача слабого удержания траекторий динамической системы на заданном замкнутом множестве 1У С Т х Д". Полагается что математическая модель системы задается соотношением
х ё -Р(гтаг), г е т, х е Я", (1)
которое называется ДВ или дифференциальным уравнением е многозначной правой частью.
Решением ДВ (1) называется абсолютно непрерывная вектор функция х(-) : Т —► R", почти всюду на отрезке Т удовлетворяющая включению x(t) 6 F(t,x(t)). ' • ' -
Совокупность решений ДВ (1), удовлетворяющих начальному условию x(i.) 6 Х„ где X, С -Н",обозначим символом X(t.,X,).
Сформулируем несколько условий относительно правой части ДВ (1).
1.2.а) F(t,x) С Л" - выпуклый компакт при всех (t, х) £ Т х Rn;
1.2.b) многозначное отображение (t, х) —» F(t,x) непрерывно по совокупности аргументов ;
1.2.с) многозначное отображение (t,x) —► F(t, х) локально - липшицево по х, т.е.
a(F(t,x1),F(t,x2))<X(G)\\ Xl-X2 ||,
где G С Т х Д" - любая ограниченная область, (i, х,) 6 G, ¿=1,2, X(G) = const, q(-, •)-хаусдорфово расстояние.
i.2.d) многозначное отображение (¿, х) —► F(t,x) полунепрерывно сверху по (i, х) ;
1.2.е) max || / ¡|< с(1+ || х ||) при /6 F(t,x), где с = const.
Задача 1.2.1* (задача положительного слабого удержания). Для (fo, xq) 6 W требуется определить х(-) € X(ta,x0) так, чтобы выполнялось (t,x(i))'eW при всех t €
Задача 1.2.2 (задача отрицательного слабого удержания). , Для (¿о, xq) € W требуется определить х(-) 6 ЛГ(£о> хо) так,чтобы выполнялось (t,x(t)) 6 W при всех t 6 [Mo]- : / •.■:■' Л;
Заметим, что в работах13'?0 задача слабого удержания траекторий системы (1) на замкнутом множестве W С Т .х Rn рассмотрена с точки зрения, существования выживающих траекторий системы (1) на множестве.W. ■
В работах6,11,24 задача слабого удержания траекторий системы (1) ва;. замкнуто!^ множестве W С Т х it" исследована с помощью слабо инвариантных множеств относительно ДВ (1). ,, , . , , . . ,
Приведем определения положительно и отрицательно слабой инвариантности замкнутого множества W С Г х R". относительно ДВ (1), которые играют важную роль при решении задач слабого удержания траекторий, системы (1) на замкнутом множестве W. ...г; .-■.-.,-,„.
Определение ' 1.2.1. • Замкнутое множество ТК С Т х R" называется положительно (отрицательно) слабо инвариантным относительно ДВ (1), если для любой точки (f„x,) 6 W существует такое решение х(-) 6
'Определения и утверждения далее нумеруются в соответствии с текстом диссертации
х,), что выполняется соотношение (<,£(<)) € V/ при всех t 6 (при всех < £ [0,<,]).
Из определения 1.2.1 следует, что если множество Цг С Т хВ." положительно (отрицательно) слабо инвариантно относительно ДВ (1), то задача положительного (отрицательного) слабого удержания из любой точки (<„ х.) € \У разрешима.
Обозначим
11+^,х,з) = {у€1Г :<з,у> >£(*,х,з)}, ф*{1,х,з) = зир < з,<1 > при сг £ х),
где
Ф,х,$) = ппп < в,/> при (2)
Сформулируем теорему о положительно слабой инвариантности замкнутого множества Ш С Т х Ип относительно ДВ (1).
. Теорема 1.2.2. Пусть правая часть ДВ (1) удовлетворяет условиям 1.2.а), 1.2.с1), 1.2.е). Тогдадлятого, чтобы замкнутое множество \Ус ТхЛ" было положительно слабо инвариантным относительно ДВ (1), необходимо и достаточно, чтобы выполнялось одно из следующих эквивалентных условий: "
1.2.Б) Г(^х)ПсоР+И^(«,а:)^0 при всех х) 6 Ш;
1.2.С) соБ+ЦтЦ, х) Л П+(<, х, з) ф 0 при всех (*, х)й1У, з £ ЯР;
1.2.Б) ф*(1, х, з) > £(г, х, з) при всех (<, х) € \У, з£ IV, где со {•} означает замкнутую выпуклую оболочку.
Теорема 1.2.2 является значительным обобщением теорем о слабой инвариантности замкнутых множеств относительно ДВ (1), приведенных в работах20,25. Здесь критерий для слабой инвариантности выражен с помощью выпуклой оболочки производной многозначного отображения I —»
щ*)--- "7 : - ■ ■■:..■■;; ■ ;; - 7;;; _
В этом параграфе также рассмотрена слабая инвариантность множеств с кусочно - гладкими границами.
В параграфе 1.3 рассматривается задача положительного (отрицательного) сильного удержания траекторий системы (1) на заданном замкнутом множестве IV С Т х Я". Суть задачи сильного удержания состоит в том, чтобы для любых (*»,£») € Иг и х(-) 6 выполнялось соотношение
(«,1(4)) € V? при всех г € [<„б] (при всех Ь £ [0,«.]). {
В дальнейшем задачу сильного удержания будем исследовать с помощью свойства сильной инвариантности множеств относительно системы (1).
Сформулируем определение положительно и отрицательно сильной инвариантности множеств относительно ДВ (1).
Определение 1.3.1. Замкнутое множество С Т х Нп называется положительно (отрицательно) сильно инвариантным относительно ДВ (1), если для любых (г„ х,) 6 У( и х(-) € Х(и, х,) выполняется соотношение (<, х(*)) € IV при всех г е [*,, в] (при всех < € [0,4,]).
Из определения 1.3.1 следует, что если множество Ш СТ х В." положительно (отрицательно) сильно инвариантно относительно ДВ (1), то задача положительного (отрицательного) сильного удержания из любой точки (£., х.) е IV разрешима.
. Введем обозначения. Для (*,х, в) € Г х й" х Д" положим П_(<,®,в) = {у € Я" :< а,у > <
«/'.(*, х,з) =Ы < а, <1> при <1 е х).
Напомним, что функция £(¿, 2,«) : Т х Д" х —► Л1 определена соотношением (2). .
Сформулируем критерий для положительно сильной инвариантности множества Ш, который связывает правую часть системы (1) с выпуклой оболочкой производной многозначного отображения 4 —»
Теорема 1.3.1. Пусть многозначное отображение (*, х) —► удо-
влетворяет условиям 1.2.а) - 1.2.с), 1.2.е). Тогда замкнутое множество IV С Т х Яп является положительно сильно инвариантным относительно ДВ (1) тогда и только тогда, когда выполняется одно из следующих эквивалентных условий:
1.3.А) ^(г, х) С Х>4И^(<,г) при всех
1.3.В) Р(*,х)С соО+Ш{1,х) при всех (1,х)€1У;
1.3.С) соХ>+И^,х)ЛП_(*,х,в)^0 при всех (1,х)€^, в € Я";
1.3.2?) < £(<,х,з) при всех а € Л".
Заметим, что верхняя правая производная многозначного отображения, фигурирующая в формулировке критерия для сильной инвариантности, определяется на основе верхнего касательного конуса Булигана к множеству УГ, который содержит касательный конус Кларка.
Далее свойство сильной инвариантности изучено в случае, когда правая часть системы (1) непрерывна, и в случае, когда правая часть системы
(1) полунепрерывна сверху по {I, х). В обоих случаях сформулированы достаточные условия для сильной инвариантности замкнутого множества IV относительно системы (1).
1.3.а) Пусть функция р(-) : Т —> В.1 удовлетворяет условию Липшица с константой Ь, гшпр(г) > 7 > 0 при X € Т.
Для замкнутого множества IV С Г х К", е > 0 и функции р(-) : Т (О, оо) обозначим
И:» = {(},г) € Т х Лл : №(?))< £р(г)}. }.
Теорема 1.3.5. Пусть IV с ТхЕп - замкнутое множество, правая часть ДВ (1) удовлетворяет условиям 1.2.а), 1.2.(1), 1.2.е), функция р(-): Т—-+ Я1 удовлетворяет условию 1.3.а). Предположим, что существует ео > О такое,-что для всех е 6 (0, ео) выполняется соотношение -
Г(г,х) С всех (<,*) бТГ^.
Тогда множество IV является положительно сильно инвариантным относительно ДВ (1).
В этом же параграфе исследована сильная инвариантность множеств с кусочно - гладкими границами. '
Отметим, что в параграфах 1.2 и 1.3 аналогичные результаты "приведены соответственно и для отрицательно слабой и отрицательно сильной инвариантности замкнутого множества №. относительно ДВ (1)." '
Параграфы 1.4-1.8 посвящены применению полученных в параграфах 1.2 и 1.3 критериев слабой и сильной инвариантности в задачах управления.
В параграфе 1.4 исследуются свойства функции оптимального результата в задаче управления, в которой поведение управляемой системы описывается ДВ (1). Полученные в этом параграфе дифференциальные неравенства, характеризующие функцию оптимального результата близки к дифференциальным неравенствам, которые характеризуют функцию цены дифференциальной игры8.
Параграф 1.5 посвящен исследованию интегральной воронки системы (1). Доказывается, что заданное замкнутое множество ТУ С Т х Л" является интегральной воронкой системы (1) тогда и только тогда, когда оно положительно сильно, отрицательно слабо инвариантно относительно системы (1). Исходя из этого утверждения, приводятся инфинитезималъные соотношения, характеризующую интегральную воронку системы (1).
В параграфе 1.6 рассматривается одна обратная задача теории ДВ. Для заданного замкнутого множества IV С Т х й" требуется определить систему
вида (1) так, чтобы интегральная воронка искомой системы, выпущенная в нулевой момент времени из начального множества 1^(0), совпадала с заданным множеством Ш.
При некоторых дополнительных условиях относительно множества IV, определены системы вида (1), разрешающие рассматриваемую обратную задачу. В конструировании этих систем важное место занимают слабо и сильно инвариантные множества относительно ДВ. Заметим, также, что в диссертационной работе искомые системы определяются конструктивным способом и правая часть этих систем удовлетворяет традиционным условиям, гарантирующим существование и продолжимость решений.
В параграфе 1.7 рассматривается существование периодических траекторий системы (1), удовлетворяющих фазовому ограничению а;(<) € t > 0. Полученное в этом параграфе условие существования периодических решений, имеет инфинитезимальную форму и базируется на свойстве сильной инвариантности множества IV относительно системы (1).
В параграфе 1.8 рассматриваются две задачи из теории дифференциальных игр. Первая задача - задача об устойчивости позиционных стратегий относительно неточных измерений фазового состояния системы. В работе28 исследована устойчивость гарантированного результата в задаче позиционного управления. Предполагается, что в процессе движения, позиционная стратегия реализуется на основе неточной информации о состояния конфликтно - управляемой системы. Доказывается, что пучок движений системы, формирующийся при неточных измерениях фазового состояния совпадает с множеством решений некоторого ДВ, которое определяется по правой части конфликтно - управляемой системы. В параграфе 1.8 этот результат используется при обосновании достаточных условий устойчивости позиционных стратегий, разрешающих задачу (М, ЛГ) - сближения.
Вторая задача - задача об и - стабильности множества программного поглощения в линейной задаче (М, Лг) - сближения. В случае, когда сечения множества программного поглощения имеют непустую внутренность, установлен критерий стабильности множества программного поглощения. В отличие от известных ранее условий регулярности (см., например29 ), для проверки полученного критерия требуется рассматривать пишь точки, лежащие на границе множества программного поглощения.
Во второй главе рассматриваются численные методы построения множеств достижимости управляемых систем. В теории ДВ большое количе-
28Дзкафаров В .Я. Об устойчивости гарантированного результата в задаче позиционного управления. Докл. АН СССР. 1985. Т.285. N I. С.27 - 31.
39Тарлинский С.И. Об одной линейной дифференциальной игре сближения. Прикл. математика и ыеха-вшса. 1973. Т.37. Вып.1. С.14 - 32.
ство работ посвящено исследованию эволюции множеств достижимости и методам их приближенного построения. В многочисленных исследованиях, относящихся к численным методам построения множеств достижимости системы (1), представлены различные подходы. Группа исследований посвящена оценке множеств достижимости эллипсоидами или же наборами эллипсоидов (см., например13,28 и библиографию в них). Оценки множеств достижимости системы (1) были получены в работах30,31 . В работе32 изучается вопрос о приближенном вычислении множеств достижимости в виде многогранников.
В параграфе 2.1 приведен способ построения множеств достижимости системы (1), функционирующей на конечном отрезке времени [¿о, 6\. Предлагаемый здесь метод приближенного вычисления множеств достижимости, основан на введении некоторого конечного разбиения отрезка с шагом Д и подмене фазового пространства ЕР некоторой е - решеткой. На базе этой аппроксимационной схемы получена оценка точности приближенного вычисления множеств достижимости, зависящая от е и Д. Из этой оценки следует, что если е имеет порядок малости относительно Д больший, чем первый, то при Д —» 0 приближенно построенные множества сходятся к множеству достижимости системы (1). Приведенный в этом параграфе метод аппроксимации множеств достижимости близок к работам Н.Н.Моисеева п его сотрудников, которые основаны на введении в пространстве позиций (/,х) прямоугольной решетки и аппроксимации множеств достижимости множествами, состоящими из узлов решетки.
Множество достижимости Х{1\ <♦, X,), X, С Я", ДВ (1) в момент времени 'о £ и ^ * ^ б аз начального множества Х„ определяется соотношением
Х(Ц X,) = {х(*) € Л" : *(•) € *(*.,*.)},
где Х„) - множество решений ДВ (1), удовлетворяющих начальному условию х(<.) £ X*.
Итак, рассмотрим задачу вычисления множества Х(0-,^,Хо), Хо С Л", часто возникающую в теории и приложениях. В общем случае множество Х(в- АГо) точно вычислить невозможно, поэтому вместо задачи точного вычисления Х(в\ <0, Хо) рассмотрим задачу приближенного вычисления Х(Ъ1а,Х0).
^Никольский М.С. Об аппроксимации множества достижимости для управляемого процесса. Журя, выч. натем. я матем. фиэ. 1988. Т.28. N 8. С.1252 - 1254.
Я1Комаров В. А. Оценки множества достижимости дифференциальных включений. Матем. заметки. 1985. Т.87. N 8. С.916 - 925.
^'Ушаков В Н., Хрипунов А.П. О приближенном построении интегральных воронок дифференциальных включений. Журн. выч. матем. в матем. фи. 1994. Т.34. N Т. С.965 - 977.
В дальнейшем, будем предполагать, что Х0 С Л." - компактное мно-Жество>дравая часть системы (1) удовлетворяет условиям 1.2.а) - 1.2.с), 1.2.е). Ответим, что в силу предположений 1.2.а) - 1.2.с), 1.2.е) нетрудно установить, что существует цилиндр Б = [1о, в] х <? в пространстве позиций, такой, что ¿о, Х^) + е*В [¿о, в]. Здесь С? - некоторый замкнутый
шар, В = {хе Яп :|| х ||< 1}.
Исходя из этого замечания, будем считать, что все наши построения осуществляются в цилиндре й. Постоянное число, при котором правая часть ДВ (1) удовлетворяет условию Липшица по а; в области £), обозначим через Ь = Ь(В). Далее положим
К = тах{|| /||:/6 (*,х)€0}, К 6 [0, со).
Пусть Г разбиение отрезка [(о,0] моментами <о,<1, ...,<лг-ь — где Д = — = (в — ¿о)/-^)4 = 0,1, — 1. Полагаем, также
Хм = ^ X,), « = 0,1,..., N - 1, (3)
откуда следует Хн =
Таким образом, множество достижимости ДВ (1) Х(в; *<» Хо) можно было бы вычислить точно по рекуррентным формулам (3), если бы мы умели вычислять точно промежуточные множества достижимости
Первый этап приближенных вычислений соответствует начальному промежутку [(0, <1] разбиения Г.
Разобьем пространство IV* кап- мерные кубы Ф; с центрами х° и вершинами, отстоящими от центров на величину е. Это бесконечное множество центров Ху мы называем £ решеткой в 22" и обозначаем через Л^. Пусть
Х0£ = 6 ЛГ, П*О5*0}-
Зададим также 6 > 0 (й < Ье) и для каждого множества определим с помощью некоторого правила конечную 6 - сеть =
{// 6 F(ío,Xj) : к = 1,2,..., К1]}, удовлетворяющую неравенству < 6. Положим
Х{ = {хЧ 6 Ме: Ф, П «о, X0£) ф 0}.
Доказывается, что
< ее2£д +Ы(Д) + е, 18
где ЦД) = Дш*(Д), ц>'(Д) X 0 при Д 10.
Продолжая этот процесс до момента tf^ — в, установлнваем, что
а(Х(в; Х0), Х'„) < + \)е + (в - <0К((1 + Л')Д)}, (4)
где А — (в — ^o)/N - длина промежутков разбиения Г.
Теперь согласуем число е - параметр решетки ЛГе с длиной Д промежутков Г. А именно, выберем число е в зависимости от Д по формуле е = ПД\/Д, где П - некоторое конечное положительное число. Тогда оценка (4) примет вид
аЩв; Х0), Х'„) < еи^(9 - + и/*((1 + К)Д)}.
В параграфе 2.2 на основе предложенной аппроксимационной схемы проведено вычисление множеств достижимости некоторых нелинейных управляемых систем в пространстве Я2. В том числе построены множества достижимости системы, описывающей движение плоского маятника в вязкой среде и множества достижимости системы, которая описывает эволюцию биологического сообщества, состоящего из двух видов, хишншса и жертвы.
В параграфе 2.3 рассматривается приближенное конструирование множеств достижимости управляемых систем с квадратичными интегральными ограничениями на управления. Такие системы часто встречаются в задачах управления летательными аппаратами.
Пусть дана управляемая система, поведение которой на промежутке ['о, < 0 < со) описывается уравнением
х = /(*, х) + В{г, х)и, х(*0) = х0, (5)
где х £ Д" - п - мерный фазовый вектор системы, и - г - мерный вектор управления, /(¿,х) - п - мерная вектор функция, В(1,х) - пхг - мерная матрица функция.
Предполагается, что реализации < 6 [<0, б], управления и стеснены ограничением
£ II и(<) < ц1 (6)
Здесь /ло > 0 - ограничение на ресурсы управления.
Предполагается, что выполняются условия:
2.3.А) Функции /(¿, х) и В^,х) непрерывны по совокупности аргументов, а также для любой ограниченной замкнутой области И С [¿а, б) х Я" существуют постоянные Липшица = £,•(£)) 6 [0, оо) (г = 1,2) такие, что
II /(«,*•) - f{t,x,) II< Lx II - II, II B(t,x*) - B(t,x.) ||< Li II x* II
при любых (i.i*), (t,x,) из D.
2.3.B) существуют такие константы 7i € [0,oo), что
II /(*,*) ||< 7i(l+ II * ||), || B(t,x) ||< 72 при любых (*,;г) 6 [*о,в) х Rm.
Под допустимым управлением u(-) = {u(t),i £ [¿0,в]} будем понимать любую интегрируемую с квадратом функцию и(-) («(•) 6 £i[io, б]), удо-алетворяющую неравенству (6). Класс всех допустимых управлений и(-) обозначим через U.
Решение дифференциального уравнения (5), отвечающее управлению «(•) € U, будем называть движением системы (5), порожденным управлением и(-). Символом X(to, iq) обозначим совокупность всех движений системы (5), отвечающих всевозможным ы(-) 6 U. Полагаем
*(*; *о, ®о) = {»(«) € Rn ■ *(•) 6 X(t0, яв)>,
2(«о,»о) = {(«,*(<)) 6 Ml х : *(•) 6 X{t0)x0)}.
X(*.;t),X3) есть множество достижимости управляемой системы (5) при ограничениях (6), отвечающее моменту времени t.
Мокпо показать, что существует ограниченная область D С * -К", в которой содержится интегральная воронка Z(tQ,Xo).
Аппроксимация множества достижимости Х(в; to, хо) управляемой системы (5) осуществляется в несколько этапов. Вводится класс управлений Uг хстоэнй представляет собой совокупность управлений, удсрлетворя-юшз: г:<Ес:.:скННЫм ограничениям: интегральному ограничению (6) и еще геометрическому ограничению вида || u(t) ||< Я, Показано, что при достаточно большом выборе числа Я, множество достижимости системы с смешанными ограничениями достаточно хорошо аппроксимирует множества достижимости системы с интегральными ограничениями. Далее класс Ug сузим до некоторого класса кусочно - постоянных управлений Un\ класс Uц заменяем классом Uн кусочно - постоянных управлений, нормы значений которых лежат в определенной равномерной сетке; класс Uh сужаем до конечного класса 11ц, управлений, у которых не только нормы значений, но и сами значения в локальном смысле располагаются равномерно. Класс управлений 0ц порождает конечное число траекторий системы. На
последнем этапе траектории системы заменяются подходящими ломаными Эйлера. Получена оценка точности хауедорфова расстояния между множеством достижимости и приближенно построенным множеством.
Пусть Н € (0, оо). Введем в рассмотрение множество {/# всех управлений u(-) е U, для которых || и(t) ||< Я, t б [t0,в).
Определим такое разбиение Г = {¿о> ¿1, ■•■< = 0} промежутка [<o.ö], что tj+] - f, = [в - t0)/N — i — 0,1 ,...,N - 1. Рассмотрим класс Гц всевозможных кусочно постоянных управлений tx(-) € Ь'н, промежутками постоянства которых являются промежутки [t,, t,+i) разбиення Г.
Теперь введем в рассмотрение класс 0ц, являющийся сужепгеи къ-ic са Uff. Для этого, наряду с переменной t, рассмотрим новуо . кгыяр-ную переменную у, имеющий смысл || и ||5 . Наряду с введенным ранее разбиением Г = {to,ti, ...,tfi = 6} отрезка [io, ö], рассмотрим разбиение Г* = {уо — 0,у1,...,уя = Н2} отрезка [О,Я2] оси у на равные промежутки Ivj, ft+i] так, что у}Н -yJ = 3r = A',j = 0,l.....Л - 1.
Символом Uff обозначим совокупность всех тех управлений u(-) € Uh> для которых значения y(t) =|| ti(i) ||2, t € [ij,ii+i), t = 0,1,...,JV- 1, содержатся в множестве Г*.
Пусть S =s {и 6 Rr :|| и ||= 1} - единичная сфера в пространстве IV. Зададим конечное разбиение И = {so, sj,..., эр}, являющееся <5 - сетью сферы S, где 6 > 0 - заданное число.
Обозначим через Üu класс всевозможных управлений й( ) € Vh таких, что на каждом промежутке [<,-,<,+i) разбиения Г, управление й(-) определяется соотношением й(<) = у/уЦа^, где щ, 6 Г*, si, € Н.
Таким образом, имеем последовательность включений
VDUffDÜffDÜHDÜH,
в которой каждый последующий класс управлений является в определенном смысле более удобным для вычисления порождаемых им множеств достижимости. Так, самый удобный для вычисления множеств достижимости, это последний класс Uff. Он порождает конечное число движений системы (5).
Управлению й(-) 6 0ц поставим в соответствие ломаную Эйлера г(-) = {¿(f), t € [¿о, Ö]}, определенную рекуррентными соотношениями
2(ii+i) = z{U) + Д[/(г„ г(<()) + В(U, z{U))«(*,)], (7)
где г = 0,1,..., N — 1, и управление ü(tj) принимает значение
= JvJt slr (8)
Здесь yj, - скалярная величина, принимающая значения из сетки Г* = {О - Уо,Уь-,УД = Я2} с шагом Д*, т.е. yj.-^juji = О, \,...,R = fj, si(, = 0,1,...,p- r- мерный единичный вектор из 5 - сетки Е. , Из соотношений (7) и (8) вытекает, что точки г(и) вычисляются по рекуррентной формуле , .
2(ii+i) = z{U) + A[/(t,-, *(«,•)) + B(tit s,l
z{ta) = x{tQ) = хй, j = 0,l1...,JVr-l,(9) • ;.s ji = 0, 1,...,JR = sij €S, l{ = 0,1,...)P - .
Поскольку выбранное управление должно удовлетворять интегральному ограничению (6), то, следовательно,' целые скалярные переменные Jp.il> -ч должны удовлетворять неравенству
К-1 . Н2
.....Д-Д\£*<4
Символом Z(9;to,xo) обозначим множество всех точек z(tN) б й", в которые приходят ломаные Эйлера определенные формулой (9) в момент tfi = 9, порожденные всевозможными кусочно - постоянными управлениями «(•) € &ц вида (8). Доказывается, что
а{Х(9-, to, *о), Z(9; <0) г0)) < 2(1 + с,ее-)т2$+ +(1 + c.ee')fi{9 - *0)Д* + (1 + с,ее')ц(в - (0)ЯЙ4- 1 '
где I = Ii + Я12, с. = h{6 - i0) + lj(0 - <о)Ь«о.
■ ' Я = max || f(t, х) ||, у(Д) = (1 + А')Д +
ш*(Д) = max jrj5((*,i*) ~ II,
к*(Д) = ■ max , || f(t',x') - f(U,x.) ||,
(«*,*'). (t„Xt) ИЗ D, Д > 0. :.. ...... .., ! Л
Из соотношения (10) следует, что задававшись сколь угодно малым £ > 0, по нему можно подобрать числа Я, Л, Д*, 6 из (0,ос), так чтобы выполнялось
а(Х(0; to, xq), Z(6\ to, XQ)) < e. ,
В параграфе 2.4 дан алгоритм для вычисления множеств достижимости управляемой системы (5) с квадратичным интегральным ограничением (6). Этот алгоритм разработан па основе исследований, проведенных в предыдущем параграфе. Вычислены множества достижимости в пространстве Я2 нелинейных систем.
В третьей главе рассматриваются левосторонние решения (ЛР) уравнения Гамильтона - Якоби, т.е. дифференциального уравнения с частными производными первого порядка
+ = (*,*)€ М]ХД», (11)
удовлетворяющие начальному условию
с(0,х) = сг(х) при всех х € В.", (12)
где а : К1 —+ Л1 - заданная непрерывная функция.
Напомним, что в теории минимаксных решений (см., например8,7) решение должно удовлетворять терминальному условию
с (<9,х)=а(х), (13)
т.е. условию на правом конце промежутка времени. При этом свойства, определяющие минимаксные решения, являются правосторонними, т.е. здесь используются правосторонние варианты слабой инвариантности, производные по направлению, правосторонние относительно времени, и т.д. Понятно, что решение задачи Коши с начальным условием на левом конце, определенное на основе левосторонних вариантов слабой инвариантности отличается от обычного минимаксного решения простой заменой времени на противоположное.
Отличительной особенностью ЛР, рассматриваемых в третьей главе, является то, что начальное условие задано на левом конце, а основные свойства, которым должны удовлетворять ЛР должны быть правосторонними.
Отметим, что в диссертационной работе ЛР изучаются в случае, когда гамильтониан уравнения (11) {1,х,з) —► £(<,х,з) удовлетворяет следующим условиям:
3.1.а) функция £(•) : Т х Л" х й" —► Л1 непрерывна по совокупности аргументов;
3.1.Ь) для любой ограниченной области Р С Т х Л" существует А(1)) > О такое, что
| Ф,хи в) - аи И, 5) |< А(£>) II X! - хг II
при всех (i,xi) 6 D, (f,x2) € D, s € Д";
3.1.с) max [| f(t,x,ei) - Z(t,x,s2) l -L(t,x) || s, - s2 ||] < 0, где £(■) :
TxR" —♦ Я1 непрерывна по совокупности аргументов, Z(t, x) < c(l+ || x |j) при всех (i, x) € T x Я", с = const;
3.1.d) £(i,x,as) = a£(i,x,s) при всех (t,x,s) б Т xJf. x Я", a > 0;
3.1.e) i(i,x,asi + (l-a)i2) >a£(<,x, si)-f(l-a)£(i,x,s2) при всех (f,x) 6 T x Л", si, S2 6 Л" a a G [0,1]. ..
В параграфе 3.1 вводится понятие JIP и приводится пример, иллюстрирующий возникновение ЛР. ЛР рассматриваются в классе полунепрерывных снизу функций и определяются с помощью конструкций негладкого анализа, которые применяются для определения минимаксных решений. Обозначим ■ ' :
F(t,x) = {/ 6 Я" : min [< ¿,/ > > 0}.
Рассмотрим ДВ
¿(0бФ(М(0). , (14)
где z = (х,хп+1) € Я"+1, Ф(<, г) = {F(i,x), {0}}.
Пусть io € [0,6], Zo С Д"+1. Совокупность решений ДВ (14) (на отрезке [0,*о])> удовлетворяющих условию z(i0) £ обозначим символом X-(ta, Zq). Положим
H-(t0, Z0) = {(i, z(t)) 6 [0, t0] x R"+l: z(-) e X.(t0, ZQ)},
X-(t", Ц, Zq) = {z(t) e Я"41: *(•) 6 X.(io, Z0)}, t < f0., .
Сформулируем определение ЛР задачи (11) (12). • i"
Пусть c(-) : TxR? —» R1 - некоторая функция. Надграфик и подграфик функции с(-) :Т х Rn♦ Я1 определяются соотношениями
; epi c(-) = {(f, x,ct) € [0, 0]x Я" x Я'.: c(i, х) < a}, -
hypo с(-) = {(t,x,a) € [0,6] х Rn х Я1 : c(t,'x) > a}. ' ;
. Определение 3.1.2. Полунепрерывная снизу функцйя'с(-) : ТхЯ" —» Я1, называется. ЛР задачи (11) (12) на множестве Т х Я" , если с(0, г) = а{х) при всех х € Яп и ,,, .; v .•,-; ¡.-^
epi с(-) = Я_(0,е;>г с(1>, ■)). ' (15)
Здесь epi с{0, ■) = {(г, а) £ хЯп х R1: с(в, х) < а}.
Отметим, что если функция с(-) :Т х R" —> Л1 является минимаксным решением задачи (11) (13), то для этой функции выполняется соотношение (15). А если непрерывная функция с(-) : Т х R" —» R1 является JIP задачи (11) (12), то множество ерг с(-) является положительно слабо инвариантным, а множество hypo с(-) - положительно сильно инвариантным относительно д.в.:(14).
Можно показать, что если ЛР задачи (11) (12) с(-) : Т х Л" —► R1— дифференцируемая в точке (i, г) функция, то она в этой точке удовлетворяет уравнению (11). ■ '
На примерах показывается, что в рамках предположений, гарантирующих существование, единственность и непрерывность минимаксных решений, ЛР могут не существовать, либо могут оказаться не единственными. Это показывает, что ЛР качественно отличаются от минимаксных решений.
В параграфе 3.2 исследуются свойства ЛР. Доказана, что замкнутая нижняя огибающая ЛР задачи (11) (12) также является ЛР этой же задачи.
Обозначим
c,(t,x) = inf {c(í,a:): с(-) é Sol},
c0(t,x) - Mmiaf c.(r, y). ...... (16)
где Sol означает совокупность ЛР задачи (11) (12).
Теорема 3.2.1< ' Функция Со(-) : Т х R" —> R1, определенная соотношением (16), является левосторонним решением задачи (II) (12), т.е. с0(-) € Sol. . ; '.-.¡.'vc'' " ...... ' ^
Сформулировано достаточное условие существования J1P и дано его описание в терминах производных по направлениям.
Приведем условия, при выполнении которых Множество Sol не пусто и далее определим конструкцию, которая позволит аналитическим путем определить функцию Со(-) : Т х Rn -—» i?1. Обозначим
ЛГ = {(11а)€ДлхЛ1:Х-(0;б,г,а)Серга(-)}: (17)
Поскольку функция а(-) : R" —-+' R1 непрерывна, то нетрудно установить, что множество N замкнуто.
Теорема 3.2.2. Предположим, что множество N С Rn х Л1, определенное соотношением (17), не пусто и выполняется соотношение
Пусть функция s(-) : Т х Rn —» Л1 -определена, соотношением
«(í,x) — inf {a g Rl : (t,x,a) € H~(8,N)}. (18)
...Тогда s(-) € Sol,,т.е. Sol ф 0, s.(t,x).= c0(í,x) при всех (í,x) € Г x Rn, где функция cq(.) : T x J?n —» ií1'определена соотношением (16), и более того в соотношении (18) инфимум можно заменить ммимумом.
■ Приведем условия, которые характеризуют ЛР задачи >(11) (12) в терминах производных по направлениям. <■> • ■"-'"да--;--1
Пусть с(-) : Г х Лп —► Я1 - некоторая Заданная функция. Для (t,x) £ (0,0) х Д", (a,d) еЛ1 х R" обозначим ' . > ^ ; к „г,••.:
; ^=+- «v*^ :■
Утверждение 3.2.4. Полунепрерывная снизу функцияс(-) :TxRn —* Rl является ЛР задачи (11) (12) тогда и только тогда, когда с(0, х) — о(х) при всех х € Л" И выполняются неравенства ,
" ".' d~c(t,x) d~c(t,x}
■ 7. ~WjjT- /сХ) ЗГ-W)
при всех (í, х) € {0,6) х Л", или же неравенства
при всех (<,*,») 6 [0,6) xfí" х Rn. : : п -
Здесь a*(t,x, s) и 0,{t,x,s) определены соответственно соотношениями
•5~cft х)
a'(t\х, s) = sup < a,d > при d € {<í: ,,, < 0}, • ■ ■■ . 0(1,4) ■
A(t,iaf. <■«,<*> при d € id < 0}.
Параграф 3.3 посвящен построению систем множеств, аппроксимирующих множества уровня ЛР. Предлагаемый метод построения аппроксимирующей системы, является попятной процедурой. Такая процедура применялась в работе33 при построении стабильных мостов в задаче сближения.
Доказана сходимость аппроксимирующей системы множеств к множеству уровня ЛР.
Четвертая глава посвящена исследованию задач удержания движений управляемых систем с помехой, математическая модель которых задана в виде
/ х е Г(1,х,и), * € [о,в], X € /?", и 6 Р. (19)
К системам вида (19) могут быть приведены, например, управляемые системы, описываемые системой дифференциальных уравнений с разрывными правыми частями16.
В параграфе 4.1 изучены некоторые свойства системы (19), которые используются в следующих параграфах.
В параграфе 4.2 рассматриваются способы управления и модели движений системы (19). Управление системой (19) осуществляется по принципу обратной связи. В качестве управляющих функций используются позиционные стратегии, широко применяемые в теории позиционных дифференциальных игр (см., например1"4). Предлагаются два способа управления системой (19). Первый - это в реализовавшейся позиции (£., х.) шаг приращения времени при назначении управляющего воздействия не зависит от ({„!,). Второй - это в реализовавшейся позиции ((., х.) шаг приращения времени при назначении управляющего воздействия зависит от (<„, х.). Приводится определение движений системы (19) для обоих способов управления. ' . : ' . - .-г
В параграфе 4.3 рассматривается задача слабого удержания движений системы (19) на заданном замкнутом множестве IV С [0,0] х Л". Вводится понятие позшцюнно слабой инвариантности множества И-* относительна, системы (19)- Суть позицирнно слабой инвариантности множества IV С [0, в] х К" относительно системы (19) заключается в том, что для любой начальной позиции, принадлежащей множеству И7, можно определить стратегию управления так, что движение' управляемой системы (19), порожденное этой стратегией, остается на этом же множестве IV вплоть до заранее заданного момента времени Понятие позиционно слабой инвариантности близко к понятию и - стабильного моста из теории позиционных дифференциальных игр и'Является в некотором смысла обобщенном понятий слабой ;и сильной ицйариаитности множоств! : ' . ■•• Приведены достаточные условия для •по-зицпокио слабой инвариантности множества И'- С [0,0] X В." относительно' системы (19). Эти условия вы-
^Ушаков В.Н. К задаче построений стабильных мостов вдифферсшиюльииН игре сближения - уклонения. Изв. АН СССР. Техн. кибернетика. 1980. N 4. С.29 -36.
ражены в инфинитезимальной форме и связывают прааую часть системы (19) с производным множеством многозначного отображения г —► На базе этих достаточных условий установлена процедура определения стратегии, удерживающей движения системы (19) на заданном множестве, Рассмотрена позиционно слабая инвариантное» множеств вида IV = х) 6 [0,0] х Д" : с(г, х) < 0}. Приведены достаточные условия, позволяющие оценить сверху функцию гарантированного результата в задаче управления с терминальной платой, когда динамика управляемой системы задается в виде (19).
В параграфе 4.4 рассматривается задача (М, Аг) - сближения для управляемой системы (19), и, в частности, для управляемых систем, описываемых дифференциальными уравнениями с разрывными правыми частями. Постановка задачи (М, Ы) - сближения формулируется согласно подходу, предложенному в теории позиционных дифференциальных игр1,2 . Важным элементом при определении стратегии, разрешающую задачу (М, ЛГ) - сближения, является позиционно слабо инвариантное множество И^ С [0, удовлетворяющее соотношениям IV С N и IV(в) с М. Приведена процедура, определяющая аппроксимирующую систему множеств позиционно слабо инвариантного множества в задаче {М, Дг) - сближения для системы
(19)-
Параграф 4.5 посвящен исследованию конфликтно - управляемой системы вида
х 6 Г(*,х,и,1/), ь€ [0,0], х еял, и еР, V е д. (20)
Рассмотрена задача сближения - уклонения для системы (20). Установлена процедура, определяющая стратегию агрокь и, разрешающую задачу (А/, ТУ) - сближения, а также стратегию игрока v, разрешающую задачу (А/, М)е - уклонения. Отметим, что при исследовании задачи сближения -уклонения для системы (20) используются конструкции из теории дифференциальных игр и результаты параграфов 4.1 - 4.4. Дальше рассмотрены верхняя цена и нижняя цена дифференциальной игры для системы (20) с терминальной платой. Получены дифференциальные неравенства, характеризующие верхнюю и нижнюю цены игры. Эти неравенства являются аналогами дифференциальных неравенств, которые характеризуют ик V -стабильность функции цены дифференциальной игры и минимаксные решения уравнения Гамильтона - Якоби (см., например4-7).
В пятой главе рассматриваются задачи слабого и сильного удержания траекторий обобщенных динамических систем (ОДС), эволюция которых задается непосредственно множеством достижимости. Понятие ОДС бы-
ло сформулировано в работах34,35 в рамках аксиоматического подхода к исследованию эволюционных систем. Оно определяется как многозначное отображение
I'(•) : [0. Щ * (0. х R" 2R™, (21)
второе удовлетворяет следующим условиям:
5.1.1) уяъж&стъа F(U:to,xö) определено для всех (í0. *о) € [0,0] х Я", ft 6 [?о, 0] и является непустым компактом в пространстве Rn;
5.1.2) начальное условие: F(to; to, xq) = {хо} Лля всех (tо, го) € [0, б] х Я";
5.1.3) полугрупповое свойство: для любых (fo,xo) € [0,9] х Rn, t0 < ti < '■2<в справедливо
FQttito,xo)= U F^tuxí).
xief(<b(o,io)
5.1.4) для заданных Xi € R", 11, ¿o, to < существует z0 € R" такой, rro xi e F(ti\ta,xo)\
5.1.5) для любого фиксированного (íq,xo) € T x Rn многозначное отобра-кение t —► F{t; fo, xo) непрерывно по 1 в хаусдорфовой метрике.
5.1.6) F(f; <o,So) полунепрерывно сверху по (t0. хц) равномерно по í в лю-¡ом интервале [ii,fj], т.е., для заданных (tQ, z0) € [0,0), <ь t? (tois <i < 2 < ff) и £ > 0 существует 5 > 0 такое, что для всех t, tj, xj удовлетво-|яющих соотношениям || — x<¡ ¡|< <5, 11¡ - t0 |< 6, t € [ti, tí], ¿o < <o < 'i ыполняется
F(t;t'0,x'0) с F{f,t0,x0) + cB це В = {i Л" :|| x ||< 1}.
5.1.7) условие ограниченной скорости: для каждого ограниченного мно-сества G С Г х Й" существует число r(G) > 0 такое, что
■ snpv(í0,r0) < r(G) при (to, xv) £ G,
це v(t0, io) — ümsup ^ a(a;0, F(tQ + S; t0, i0))-Í-.+0 о
Отметим, что символ F(t\ tg, Xq), t > fo, означает множества достижимо-ги системы в момент времени í из начальной позиции (to, хо).
Основная часть пятой главы посвящена задачам слабого и силыю-з удержания траекторий ОДС (21) па заданном замкнутом множестве 7 С [0,0] х R". В работе35 были введены понятая слабой и сильной пн-з.риаитности замкнутого множества W С [0,0] х Rn относительно ОДС
34Барбашин Е.А. К теории обобщенных динамических систем. Уч. зап. Моск. унив. 1949. N 135. C.U0-5.
"Roxm Е. Stability in Genera! Control Systems. J. Different. Equat., 1965. V.l. P. 115 - 150.
(21). Если множество XV слабо (сильно) инвариантно относительно ОДС (21), задача слабого (сильного) удержания траекторий ОДС (21) на этом же множестве разрешима при любых (¿о, я<>) € IV, В данной диссертационной работе свойства слабой и сильной инвариантности замкнутого множества V/ С [0,0] х Я" относительно ОДС (21) исследуются с применением инфи-нитезимальных конструкций негладкого анализа, а именно с применением производных многозначного отображения.
В параграфе 5.1 приведено ранее известное3'* определение траекторий ОДС (21). '
Определение 5.1.2. Функция х(-) : [¡о, б] —► Я", удовлетворяющая вгуирчению х(¡г) £ для любых и где /о < < ^ <
в, называется траекторией ОДС (21), выпущенной из начальной позиции (<0,х0) €Гх Я".
Дается определение производной ОДС (21), основанное на понятия производной многозначного отображения.
Для ОДС (21) и (<0, хо) € [С1,0) х Я"! обозначим
= {<1 € Я" : Вх(г) 6 Г(Мо,*о), t > «0, Пт/^ ~ Х° =
I—<о+о г — ¡о
0,Х0) = {¿€ Я" : Зх* € Ь > *0, 11т ** ~~ =
и—<0+0 — I о
Множество хо) назовем нижней, а множество £)-Г(*а, х0) верхней
производными ОДС (21), вычисленными в точке (<о,хо).
Изучены некоторые свойства этих производных. Дальше исследуется слабая инвариантность замкнутого множества IV' С [0, б] х Я" относительно ОДС (21). Формулируются необходимые, а также близкие к ним достаточные условия слабой инвариантности замкнутого множества IV С [0, б] х Яп относительно ОДС (21). Эти условия выражены в инфинитезимальной форме и требуют репустоты пересечения производной системы и производной многозначного отображения < -—
В параграфе 5.2 рассматривается задача сильного удержания траекторий ОДС (21) на заданном замкнутом множестве IV С [0,6] х Я". Другими словами, рассматривается сильная инвариантность множества \У относительно ОДС (21). Получены необходимые, а также достаточные условия для сильной инвариантности множества IV относительно ОДС (21), связывающие производные ОДС (21) и многозначного отображения £ —>
В этом же параграфе изучена задача существования дифференциального включения, интегральная воронка которого совпадает с графиком многозначного отображения t—► F(i; ¿о. го)'
Обозначим F(t0,х0) = {(<,х)€ [М! х R" : х б F(i; <0,*о)'}." Рассмотрим задачу: При каких условиях существует ДВ, интегральная воронка: которого совпадает с множеством F(to, хо)? '
Рассмотрим ДВ
^ x(t)ecoDF(t,x(t)). ■'; (22)
где DF(t,x(t)) - верхнее производное ОДС (21), вычисленное в точке
:«>*(*))• ' ' ■ ■■
Совокупность решений ДВ (22), удовлетворяющих начальному условию r(io) = xo> обозначим символом У(fo,xo)-Пусть
Z{t0,xQ) = {(i,x(i)) € [¿о,01 х Rn : х{-) € Y(t0,x0)}. :
Множество Z(t0, xq) является интегральной воронкой ДВ (22), выпущен-аой из начальной позиции (i3, хо).
Приведем необходимые и достаточные условия совпадения множеств Z(t0,x0) и F(f0, х0). , г.
Теорема 5.2.4. Пусть многозначное отображение (<, х) —► DF(t,x) аепрерывно по (t, х) и локально липшицево по х. Тогда, для того, чтобы Z(tQ,x0) — F(io, хо), необходимо и достаточно, чтобы выполнялось соотношение
со DF(t,x)f]co D~F(t0,x0) | (t,x) ^ 0 при всех (i,x) е F(*0,_xo)'-" ' Здесь
^?-F(ío,:xo) | (1,х) = {с£ € Я" : Зх* е Ц,х0), и < «, й = Пшп
<»—|-о — г
г.е. множество £>^(<о,хо) | является лепим перхним производным
множеством многозначного отображения / —вычисленным в гочке (<,х). ■ ; -
, Исследована функция оптимального результата в задаче управления с терминальной платой, где управляемая система задается в виде (21). .
, В параграфе 5.3 рассматривается ОДС с помехой, задаваемая как многозначное отображение
F(-) : [0,0] x [0,9] x Rn xP, —-» 2я". ■ ;(23)
■ Символ F{t-,to,xa,u), t > to, означает множества достижимости^системы в момент времени t из начальной позицци (tí), xq) при воздействии на систему на отрезке [í0, í] постоянного управления к € Р. В качестве управляющих функций для системы (23) выбираются позиционные стратегии. Сформулировано определение движения системы (23), порожденного позиционной стратегией.
г В параграфе 5.4 рассмотрена задача слабого удержания движений системы {23) на заданном замкнутом множестве W С [0,9}xRn. Введено понятие позиционно слабой инвариантности множества W относительно ОДС (23). Приведены достаточные условия для позиционно слабой инвариантности множества W относительно ОДС (23). На основе этих условий установлена стратегия управления, которая удерживает движения ОДС (23) на множестве W вплоть до заданного момента времени в.
Рассмотрена позиционно слабая инвариантность множеств..вида W = {(<, *)•€ [0,0 х Л" :c(í,z) <0}.
Исследована функция гарантированного результата в задаче управления с терминальной платой, когда динамика управляемой системы задается как ОДС вида (23).
Автор. '' выражает глубокую признательность академи-
ку РАН А.И.Субботину и профессору В.Н.Ушакову за ценные советы и
постоянное внимание к работе.
ЗАКЛЮЧЕНИЕ
Диссертационная работа посвящена аналитическим и вычислительным аспектам управляемых систем с неопределенностью, математические модели которых задаются дифференциальными уравнениями с многозначными правыми частьями, т.е. дифференциальными включениями (ДВ). При этом получены следующие основные результаты:
1, Получены критерии для задач слабого и сильного удержания на заданном замкнутом множестве траекторий управляемой системы с неопределенностью, задаваемой ДВ. Другими словами,- получены критерии слабой и сильной инвариантности замкнутых множеств относительно ДВ в терминах производных многозначного отображения. ■ • 4 ■
2. С применением этих критериев исследованы некоторые задачи управления:
сформулированы необходимые и достаточные условия для функции оптимального результата в задаче управления, в которой динамика задается ДВ; даны дифференциальные соотношения, характеризующие интегральную воронку ДВ; для заданного множества определено ДВ, интегральная воронка которого совпадает с этим множеством; доказаны теоремы существования периодических решений ДВ с фазовым ограничением, зависящим от времени; приведено достаточное условие устойчивости (относительно неточных измерений фазового состояния) позиционной стратегии, разрешающей задачу сближения для конфликтно - управляемых систем; найден критерий стабильности множества программного поглощения в линейной задаче сближения.
3. Разработана вычислительная процедура приближенного построения множеств достижимости нелинейных управляемых систем с геометрическими ограничениями на управления'. Дано теоретическое обоснование приближенного построения множеств достижимости и получена оценка точности. Вычислены множества достижимости конкретно заданных систем на плоскости.
4. Дана аплроксимационная схема для построения множеств достижимости управляемых систем с квадратичными интегральными ограничениями на управления. Доказана сходимость аппроксимирующей системы множеств к множеству достижимости и найдена оценка точности приближенных вычислений множеств достижимости. Приведено описание алгоритма для приближенного вычисления множеств достижимости. Проведено вычисление множеств достижимости конкретно заданной системы на плоскости.
5. Введено понятие левостороннего решения уравнения Гамильтона -Якоби и на примерах показано его качественное отличие от минимаксного решения. Приведено достаточное условие существования левостороннего решения и изучены некоторые его свойства. Дано описание левосторонних решений в терминах производных по направлениям. Предложена ап-проксимационная схема для построения множеств уровня лёвоеторонних решений. '
- б. Изучена, задача удержания, траекторий управляемых" систем при наличии помех, задаваемых ДВ с управляющим вектором. 'Введено' понятие' ггозиционно слабо инвариантного Множества относительно таких управля-гмых систем. Получены достаточные условия для иозйцношю слабой инвариантности. На основе этих условий установлена процедура определения стратегий, удерживающих движеиия системы па заданном множестве. Приведены процедуры определения стратегий, разрешающих задачу сбли-
жения и уклонения для конфликтно - управляемых систем, математическая модель которых задается ДВ. Также получены дифференциальные неравенства, характеризующие верхнюю и нижнюю цены дифференциальной игры.
7. Получены необходимые, а также близкие к ним достаточные условия разрешимости задач слабого и сильного удержания траекторий обобщенных динамических систем на заданном замкнутом множестве. Рассмотрен вопрос существования ДВ, интегральная воронка которого совпадает с графиком многозначного отображения, определяющего эволюцию обобщенной динамической системы. Найдены достаточные условия, гарантирующие удержание траекторий обобщенных динамических систем с управляющим вектором на заданном замкнутом множестве и определены стратегии, удерживающие движения системы на этом множестве.
ПУБЛИКАЦИИ ОСНОВНЫХ РЕЗУЛЬТАТОВ
1. Гусейнов Х.Г. Свойства стабильных мостов в линейной задаче сближения. В сб.: Исследование задач минимаксного управления. Свердловск. УНЦ АН СССР. 1985. С.15 - 20.
2. Гусейнов Х.Г., Субботин А.И., Ушаков В.Н. Стабильные мосты в дифференциальной игре сближения и их производные // Тезисы докладов V Всесоюзн. конф. "Управление в механических системах." Казань. 1985. С.38.
3. Guseinov Kh.G., Subbotin АЛ., TJshakov V.N. // Derivatives for multivalued mappings with applications to game theoretical problems of control. // Probl. Control Inform. Theory. 1985. Vol. 14. P.155-167.
4. Гусейнов Х.Г. О разбиении стабильных мостов. В сб.: Синтез оптимального управления в игровых системах. Свердловск. УНЦ АН СССР. 1986. С. 32 - 35.
5. Гусейнов Х.Г. Производные слабо и сильно инвариантных множеств и их применение к задачам управления // Ин-т кибернетики АН Аз.ССР.
- Баку, 1986. - Деп. в ВИНИТИ 01.12.1986. N 8155 - В 86. 24 с.
6. Гусейнов Х.Г., Ушаков В.Н. Сильно и слабо инвариантные множества относительно дифференциального включения // Докл. АН СССР. 1988. Т.ЗОЗ. N 4. С.794 - 797.
7. Гусейнов Х.Г., Ушаков В.Н. Инфинитезимальные свойства интегральных воронок и стабильных мостов // Ин-т кибернетики АН Аз.ССР.
- Баку, 1988. - Деп. в ВИНИТИ 06.05.1988. N 3571 - В 88. 32 с.
8. Гусейнов Х.Г. Сильно инвариантные множества и периодические решения дифференциального включения // Дифференц. уравнения. 1990. Т.26. N 10. С. 1690 - 1699.
9. Гусейнов Х.Г., Ушаков В.Н. Сильно и слабо пннариантные множества относительно дифференциального включения, их производные и применение к задачам управления. //Дифференц. уравнения. 1990. Т.26. N 11. С. 1888-1894.
10. Гусейнов Х.Г. Об управляемых системах с разрывными правыми частями // Тезисы докладов VII Всесогозн. Кинф. "'Управление в механических системах." Свердловск. 1990. С.33.
11. Гусейнов Х.Г. Об одном определении функции цены дифференциальной игры с помощью неравенств. В сб.: Управление в динамических системах. Свердловск. УрО АН СССР. 1990. С.47 -51.
12. Guseinov Kh.G. Strong invariant sets and stability of positional strategies in (M, N) game encounter problem // Autom. Contr.: Proc. ll"1 Trienn. World Congr. Int. Fed. Aütom. Contr., Tallinn, 13 - 17 Aug. 1990. Vol. 3. - Oxford etc., 1991. P. 323 - 325.
13. Гусейнов Х.Г. О свойствах интегральных воронок дифференциального включения // Тезисы докладов Всесоюзн. конф. "Негладкий анализ и его приложения в математической экономике." Баку. 1991. С. 16.
14. Гусейнов Х.Г., Ушаков В.Н. Дифференциальные свойства интегральных воронок И стабильных мостов. // Прпкл. математика и механика. 1991. Т. 55. Вып.1. С.72 - 73.
15. Гусейнов Х.П Сильно инвариантные множества относительно дифференциального включения и задача сближения для разрывных систем управления//Дифференц. уравнения. 1992. T.2S. N9. С.1490- 1498.
16. Гусейнов Х.Г. О свойствах стабильных мостов в задаче сближения // Автоматика и телемеханика. 1993. N 5. С.27 - 35.
17. Гусейнов Х.Г. Об управляемых системах, описываемых дифференциальными включениями 41//Дифференц. уравнения. 1995. Т.31. N8. С.1285 - 1293.
18. Гусейнов Х.Г. Об управляемых системах, опчсыпаемых дифференциальными включениями 42. //Дифференц. уравнения. 1995. Т. 31. N 9. С.1449 - 1456.
19. Гусейнов Х.Г., Ушаков В.Й. Инфшшгешмальнмр конструкции в теории обобщенных динамических систем // Пп-т математики и механики УрО РАН. - Екатеринбург, 1997. - Деп. в ВИНИТИ 05.06.1997. N 1819 - В 97. 40 с.
Подписано в печать -/¿9? Формат 60x84 1/16 Бумага типографская Усл.печ.л.2,0 Тираж -{СО Заказ № ^Ю Печать офсетная
Нклгерннбург, К-83, ир.Ленина 51. ТииодабораторияУрГУ
Текст работы Гусейнов, Халик Гаракиши оглы, диссертация по теме Математическое моделирование, численные методы и комплексы программ
РОССИЙСКАЯ АКАДЕМИЯ НАУК УРАЛЬСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ
На правах рукописи
УДК 517.9
ГУСЕЙНОВ ХАЛИК ГАРАКИШИ оглы
АНАЛИТИЧЕСКИЕ И ВЫЧИСЛИТЕЛЬНЫЕ
МОДЕЛИ
НЕКОТОРЫХ УПРАВЛЯЕМЫХ ПРОЦЕССОВ С НЕОПРЕДЕЛЕННОСТЬЮ
05.13.18 - теоретические основы математического моделирования, численные методы и комплексы программ
диссертация на соискание ученой степени доктора физико-математических наук
Екатеринбург - 1997
ОГЛАВЛЕНИЕ
стр.
Введение .............................................................5
ГЛАВА 1. Математические модели задач удержания траекторий управляемых систем с неопределенностью и их применения.
§ 1.1. Аппроксимации многозначных отображений .................23
§ 1.2. Задача слабого удержания пучка траекторий управляемых систем с неопределенностью (слабая инвариантность) ..........38
§ 1.3. Задача сильного удержания пучка траекторий управляемых систем с неопределенностью (сильная инвариантность) ......49
§ 1.4. Функция оптимального результата в задаче управления многозначным дифференциальным уравнением (дифференциальным включением) ...............................................74
§ 1.5. Дифференциальные свойства интегральной воронки дифференциального включения ........................................... 83
§ 1.6. Об одной обратной задаче теории дифференциальных
включений.............................................................91
§ 1.7. Периодические решения дифференциального включения
с фазовыми ограничениями ..........................................106
§ 1.8. Управление по принципу обратной связи (позиционные стратегии) для систем с неопределенностью. Использование задач программного управления для синтеза стратегий в задаче гарантированного сближения .................................110
ГЛАВА 2. Теоретические обоснования и вычислительные алгоритмы приближенного построения множеств достижимости управляемых систем.
§ 2.1. Приближенное конструирование множеств достижимости управляемых систем с геометрическими ограничениями на управления .......................................116
§ 2.2. Моделирование вычислений множеств достижимости в задачах управления с геометрическими ограничениями.
Примеры .............................................................129
§ 2.3. Приближенное конструирование множеств достижимости управляемых систем с интегральными
ограничениями на управления .......................................157
§ 2.4. Алгоритм вычисления множеств достижимости управляемых систем с интегральными ограничениями на управления. Примеры................................................177
ГЛАВА 3. Конструирование левосторонних решений уравнения Гамильтона-Якоби.
§ 3.1. Определение левосторонних решений .......................188
§ 3.2. Свойства левосторонних решений ...........................199
§ 3.3. Построение множеств уровня левосторонних решений ......218
ГЛАВА 4. Моделирование в управляемых системах при наличии помех.
§ 4.1. Некоторые свойства управляемых систем с помехой........238
§ 4.2. Модели движений системы .................................. 244
§ 4.3. Задача слабого удержания траекторий управляемых
систем с помехой .....................................................249
§ 4.4. Задача (M, N) - сближения для управляемых систем
с помехой .............................................................267
§ 4.5. Конфликтно-управляемые системы, заданные дифференциальными включениями.........................................276
ГЛАВА 5. Задачи удержания пучков траекторий обобщенных динамических систем.
§ 5.1. Задача слабого удержания траекторий обобщенных
динамических систем (слабая инвариантность) ......................289
§ 5.2. Задача сильного удержания траекторий обобщенных
динамических систем (сильная инвариантность) .....................304
§ 5.3. Движение обобщенной динамической системы
с помехой.............................................................314
§ 5.4. Задача слабого удержания траекторий обобщенных динамических систем с помехой......................................321
Заключение........................................................333
Литература ........................................................335
ВВЕДЕНИЕ
В диссертационной работе рассматриваются теоретические и вычислительные аспекты теории управляемых систем с неопределенностью. Такие системы возникают в разных задачах механики, физики, в математических моделях экономики, биологии и других областях науки. Потребность изучать управляемые системы с неопределенностью возникает в связи с тем что, при моделировании динамических систем некоторые ее параметры измеряются неточно или же вообще не учитываются. Источником неопределенности могут быть также воздействия на динамическую систему некоторых помех, у которых известна лишь область изменения.
В становлении теории управляемых процессов в условиях неопределенности важное место занимает теория позиционных дифференциальных игр, созданная Н.Н.Красовским и его сотрудниками (см., например [72 - 82, 215, 216] и библиографию в них). В теории позиционных дифференциальных игр концепция управления основывается на принципе обратной связи, где требуется построить позиционную стратегию, гарантирующую определенное качество управляемого процесса при любых заранее неизвестных воздействиях на систему, у которых известна лищь область изменения. К настоящему времени развиты различные методы получения оптимальных стратегий игроков, гарантирующих требуемое качество управляемого процесса. В частности, в рамках теории позиционных дифференциальных игр удалось формализовать многие прикладные задачи: задачу преследования одного объекта другим; задачу сближения - уклонения с целевым множеством; задачу удержания параметров управляемого процесса в заданных пределах и другие.
Одним из основных элементов конструкции теории позиционных дифференциальных игр является функция гарантированного результата, которая как правило является недифференцируемой функцией. В точках дифференцируемости эта функция удовлетворяет уравнению Беллмана - Айзекса. Функция гарантированного результата обладает свойствами и и -и - стабильности, позволяющими определить оптимальную гарантированную стратегию. Свойство и - стабильности (г? - стабильности) озна-
чает слабую инвариантность надграфика (подграфика) функции относительно некоторого семейства дифференциальных включений. Эти свойства можно выразить в форме дифференциальных неравенств, в основе которых лежат производные по направлениям. Такие неравенства были введены в работах [140, 145] А.И.Субботиным для определения обобщенных (минимаксных) решений уравнения Беллмана - Айзекса. Они были, по - видимому, первыми среди различных по форме определений (включая определение вязкого решения) негладких решений уравнения Гамильтона - Якоби. В основе определения минимаксного решения лежит подход, в котором уравнение Гамильтона - Якоби заменяется парой дифференциальных неравенств. В дальнейшем теория минимаксных решений была распространена на исследование краевых задач для различных типов уравнений в частных производных первого порядка (см., например [141, 248] и библиографию в них).
Отметим, что в работе [198] М.Дж.Крэндаллом и П.Л.Лионсом было предложено определение вязких решений уравнения Гамильтона - Якоби. Определение вязкого решения по форме отличается от определения минимаксных решений. Однако, впоследствии в работах [147, 250] была доказана эквивалентность определения вязких и минимаксных решений. Доказательство эквивалентности этих определений опирается на возможность овыпукления контингентных конусов и производных по направлениям (см., [142, 207]), используемых в определениях минимаксных решений. Возможность овыпукления контингентных конусов в определениях минимаксных решений явилась источником исследований в негладком анализе (см., например [194, 228] и библиографию в них) по применению конструкций проксимальных градиентов.
Дифференциальные уравнения в частных производных первого порядка методами идемпотентного анализа исследовались в работах В.П.Масловаи его сотрудников (см., [99, 100] и библиографию в них).
Широкий круг задач математической теории управляемых процессов в условиях неопределенности был исследован А.Б.Куржанским и его сотрудниками в рамках теории гарантированного оценивания состояний системы по результатам наблюдений (см., например [32, 88, 90, 91, 220] и библиографию в них).
В диссертации рассматриваются динамические системы, математиче-
екая модель которых задается соотношением
х G F(t,x), t G [0, в], х G Rn.
(0.1)
которое называется дифференциальным включением или дифференциальным уравнением с многозначной правой частью. Дифференциальное включение (0.1) можно рассматривать как обобщение управляемой системы
где и - вектор управляющего воздействия. В таком случае F(t, х) = {/(£, х,и) : и G P(t, ж)}, и задача об оптимальном управлении сводится к задаче об оптимальной траектории дифференциального включения (0.1).
Дифференциальные включения возникают также при исследовании задач, математические модели которых задаются дифференциальным уравнением в неявном виде
По видимому, дифференциальные включения впервые рассматривались в работах [229, 266] как дифференциальные уравнения с многозначной правой частью. Широкое развитие теория дифференциальных включений получила в начале 60-ых годов. В этот период в работах [14, 21, 164, 199, 222, 233, 261] были установлены важные результаты, относящиеся к качественной теории дифференциальных включений, в том числе теоремы существования решений задачи Коши, изучены разные топологические свойства множеств достижимости и интегральных воронок, зависимость пучка траекторий от параметров. Заметим, что в этот же период дифференциальные включения применялись для исследования дифференциальных уравнений с разрывной правой частью (см., [2, 10, 101, 164 - 166]).
Как правило при математическом моделировании управляемых процессов требуется учитывать различного рода сингулярности. Например,
х = f(t,x,u), и G P(t,x),
(0.2)
g{t,x{t),i(t))<0,
оптимальный результат как функция начального положения (функция Беллмана) может быть недифференцируемой, а границы множеств достижимости системы (0.1) или (0.2) не обладают свойствами гладкости. Поэтому в исследованиях математических моделей таких задач методы классического анализа дополняются конструкциями негладкого анализа, который опирается на такие понятия, как су б дифференциал, конус касательных или возможных направлений, производная многозначных отображений и т.д. ( см., [25, 52, 53, 61, 93, 106, 111, 127, 135, 142, 178, 180, 184, 193, 194, 207, 255, 258]). Как известно, в классическом анализе график дифференцируемой функции аппроксимируется гиперплоскостью, в негладком анализе для аппроксимации используются конусы. Этот подход, по видимому, впервые был предложен в работе [184] и, дальше, в работах [229, 266] был применен для определения траекторий системы (0.1). Отметим, что обобщение принципа максимума Л.С.Понтрягина на системы вида (0.1), которое было получено Кларком, опирается на введенное им понятие касательного конуса (см.,[ 193 ]).
Понятие производной многозначного отображения базируется на понятии множества касательных направлений и, определяется как многозначное отображение, графиком которого являются касательный конус к графику исходного многозначного отображения. В зависимости от специфики задачи, в негладком анализе рассматриваются/различные типы касательных конусов, и производных многозначных отображений (см., например [127, 178, 207, 255 ]).
Начиная с работы [ 231 ], касательные конусы и производные многозначных отображений находят широкое применение в теории дифференциальных включений (см., например [26, 39 - 50, 61, 102, 108, 111, 113, 127, 130, 143, 177, 193, 200 - 212, 217 - 219, 223 - 225, 228, 236, 241]). Новый импульс развитию теории дифференциальных включений придала теория оптимального управления. Изучение управляемых процессов, математическая модель которых задается системой (0.1), начались в работах [4, 14, 21, 22, 132, 164 ], где были получены необходимые условия для оптимальности траекторий управляемой системы (0.1) в виде принципа максимума Л.С.Понтрягина. Эти исследования были продолжены в работах [ 103, 136, 150, 188, 194, 204, 257].
Большое место в исследовании динамических систем с неопределен-
ностью занимает задача удержания траекторий на заданном замкнутом множестве W С [0, в] х Ка. Рассматриваются два типа задач удержания: задача слабого удержания траекторий и задача сильного удержания траекторий.
Для системы (0.1) задача слабого удержания траекторий состоит в том, что для начальной позиции (fo,^o) £ W существует хотя бы одна траектория системы (0.1), удовлетворяющая включению x{t) Е W при всех t Е [¿о, 0]. В задаче сильного удержания требуется, чтобы для начальной позиции (¿о, xq) Е W все траектории, выходящие из начальной позиции (ifb^o) Е W, удовлетворяли включению (t,x(t)) Е W при всех te[t о,0].
Задачи слабого и сильного удержания, исследовались многими авторами. Задача слабого удержания (ее синоним - задача существования выживающих траекторий ) рассматривалась в работах [89, 91, 113, 177, 178, 208, 212, 217 - 219, 231, 235].
В работах [41, 46 - 48, 108, 141, 143, 179, 194, 206] изучены свойства слабой и сильной инвариантности замкнутого множества W С [0, в] х Rn относительно системы (0.1). В случае, когда множество W является слабо (сильно) инвариантным относительно системы (0.1), задача слабого (сильного) удержания траекторий системы (0.1) на множестве W разрешима для любой начальной позиции (¿о, £о) ^ W.
По видимому, первой работой, посвященной изучению свойства слабой инвариантности, следует считать работу [ 231 ]. В этой работе получен критерий слабой инвариантности множеств вида W = [0,0] х Y для систем обыкновенных дифференциальных уравнений х = f(x) (в отлчие от (0.1) /(х) является однозначной функцией). В работах [182, 187, 197, 242, 264, 265] также рассмотрен случай, когда правая часть системы (0.1) является однозначной. Критерий слабой инвариантности для системы (0.1) с многозначной липшицевой правой частью получен в работе [ 193 ]. В работе [179 ] приведено условие слабой инвариантности в случае, когда правая часть системы (0.1) непрерывна по совокупности аргументов. Критерии слабой инвариантности, полученные в работах [179, 193 ], сформулированы с помощью касательного конуса Кларка. Отметим, что эта тематика получила новый размах в начале 80- ых годов в связи с дальнейшим развитием теории дифференциальных включений и не-
гладкого анализа (см., [8, 17, 24, 30, 42, 44, 53, 61, 65, 92, 106, 124, 129, 133, 136, 143, 147, 156, 166, 180, 194, 207, 210, 221, 255]). В работе [208 ] приведен критерий слабой инвариантности множеств, который имеет инфинитезимальную форму и связывает правую часть системы (0.1) с касательным конусом Булигана, который содержит касательный конус Кларка. В работе [178 ] этот результат сформулирован в терминах производных многозначного отображения. Свойство слабой инвариантности множеств в бесконечномерных пространствах рассмотрено в работах [30, 176, 190, 200, 212, 235, 236, 253, 254]. Слабая инвариантность для систем с последействием изучена в [224, 246].
В работе [207] на базе конструкций теории позиционных дифференциальных игр, получен критерий и - стабильности множеств относительно конфликтно - управляемых систем, в котором применяется локальное овыпукление производной многозначного отображения. Понятие и - стабильности множеств (см., [82]) близко к понятию слабой инвариантности множеств относительно дифференциального включения. Оно означает слабую инвариантность множества относительно некоторого семейства дифференциальных включений, которые определяются правой частью конфликтно - управляемой системы. В работе [46] аналогичные критерии получены для слабой и сильной инвариантности множеств относительно системы (0.1).
Сильно инвариантные множества относительно системы (0.1) рассмотрены в работах [39, 41, 46, 48, 108, 177, 178, 187, 193, 194].
Остановимся на кратком изложении содержания диссертационной работы, которая состоит из пяти глав.
В первой главе рассматриваются задачи слабого и сильного удержания траекторий системы (0.1) на заданном замкнутом множестве W С [0,6] х Rn и применение свойств слабой и сильной инвариантности в задачах управления.
В параграфе 1.1 рассматривается аппроксимация многозначных отображений. Формулируются определения верхних и нижних производных многозначного отображения (см.,[127,178, 207]), которые тесно связаны с понятиями верхних и нижних касательных конусов Булигана (см., [184, 255]). Изучаются некоторые свойства производных множеств, которые используются в дальнейшем.
В параграфе 1.2 изучается задача слабого удержания траекторий системы (0.1) на заданном замкнутом множестве W С [0,0] х Rn. Рассматривается критерий слабой инвариантности в инфинитезимальной форме [207], который связывает правую часть системы (0.1) с выпуклой оболочкой производной многозначного отображения t —>■ W(t)1 где W{t) = {х Е Rn : (í, х) G W}. Этот результат является значительным обобщением критериев слабой инвариантности, приведенных в работах [177, 178, 194, 208]. В конце этого параграфа расмотрена слабая инвариантность множеств с кусочно - гладкой границей.
В параграфе 1.3 рассматривается задача сильного удержания траекторий системы (0.1) на заданном замкнутом множестве W С [0,0] х Rn. Свойство сильной инвариантности в случае W(t) и F(t, х) не зависящих от t, исследовались в рабо�
-
Похожие работы
- Механизмы стимулирования в активных системах с неопределенностью
- Динамические модели систем управления запасами с интервальной неопределенностью в данных
- Эллипсоидальное и интервальное оценивание состояний и параметров дискретных динамических систем с неопределенным описанием модели
- Вычислительные методы анизотропийного анализа и синтеза оптимального управления для систем с неопределенностью
- Методы представления интервальных динамических систем в пространстве состояний
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность