автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Геометрический подход к решению задачи оптимального синтеза стационарных гладких систем управления
Автореферат диссертации по теме "Геометрический подход к решению задачи оптимального синтеза стационарных гладких систем управления"
НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
На правах рукописи РГК ОД
1 7 ИЮЛ 2000
КОНДРАТЬЕВ ГЕННАДИЙ ВЯЧЕСЛАВОВИЧ
ГЕОМЕТРИЧЕСКИЙ ПОДХОД К РЕШЕНИЮ ЗАДАЧИ ОПТИМАЛЬНОГО СИНТЕЗА СТАЦИОНАРНЫХ ГЛАДКИХ СИСТЕМ УПРАВЛЕНИЯ.
Специальность 05.13.01 - Управление в технических системах
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора физико-математических наук
Н. Ногород - 2000
Работа выполнена на кафедре " Электроника и сети ЭВМ".
Официальные оппоненты: доктор физико-математических наук,
профессор ПАКШИН П.В., доктор физико-математических наук, профессор ТИШКИН В.Ф., доктор физико-математических наук, профессор УТКИН Г.А.
Ведущая организация: ИАП РАН
Защита диссертации состоится "ЗО" июня 2000 г. в часов на заседании диссертационного совета Д.063.85.02 при Нижегородском государственном техническом университете, 603600, г. Н.Новгород, ГСП-41, ул. Минина, 24.
С диссертацией можно ознакомиться в библиотеке Нижегородского государственного технического университета
Ваш отзыв на автореферат в одном экземпляре, заверенный печатью, просим направлять на имя ученого секретаря совета.
Автореферат разослан го мая 2000 г.
Ученый секретарь /р
диссертационного совета о"
кандидат технических наук А.Г1. ИВАНОВ
<? ¿¿¿Г. Г?~Р<?е1/0
с'
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Проблема синтеза оптимальной обратной связи для широкого класса систем является фундаментальной, важной, до конца не решенной проблемой. Сложность решения проблемы связана с тем, что управляющие воздействия, являясь функцией состояния системы, удовлетворяют обычно сложной системе дифференциальных уравнений с нестандартными граничными условиями. Автор предлагает новые концепции и методы разрешения существующих сложностей для стационарных гладких конечномерных систем управления.
Идея обратной связи, четко сформулированная Н.Винером, очертившим понятие кибернетической системы, является одной из наиболее фундаментальных и плодотворных идей современного теоретико-системного взгляда на мир. Смысл петли обратной связи заключается в создании автономной системы, корректирующей свое собственное состояние, исходя из этого же состояния, в соответствии с теми или иными признаками. Обратная связь является фундаментальным свойством, обеспечивающим автономное существование системы в рамках определенного качества. Ввиду разнообразия встречающихся систем, точная теория обратной связи в значительной мере не унифицирована. Более того, даже для отдельных хорошо математически определенных классов систем, где такая теория могла бы иметь место, она всё ещё отсутствует. Таким широким классом, описывающим многие физико-технические объекты, является класс стационарных гладких конечномерных систем. До некоторых пор почти единственными применявшимися на практике методами синтеза оптимальной обратной связи для гладких нелинейных объектов были: метод линеаризации системы в окрестности положения равновесия к метод синтеза оптимальной обратной связи заданной структуры. Диссертация посвящена исследованиям по применению инвариантных геометрических методов для решения задачи синтеза оптимальных стационарных гладких систем, в результате которых разработан аппарат синтеза оптимальных систем широкого класса и предложен ряд эффективных методов решения задачи синтеза.
Цель исследования состоит в разработке теории геометрических объектов, связанных с задачей оптимальной стабилизации на основе хорошо развитого, ранее не применявшегося в данной области, аппарата гамильтоновой механики, дифференциально-алгебраической геометрии, групп Ли преобразований; разработке математического аппарата, непосредственно используемого при решении задачи синтеза; создании новых эффективных численно-аналитических методов синтеза оптимальной и субоптимальной обратной связи; объединении всех предложенных методов в общую концепцию геометрического анализа и формализация вычислительных средств, что позволит по-новому и более глубоко подойти к решению известных проблем;
выявление соответствия: (тип системы) О (наиболее адекватные способы решения).
Методы исследования
— методы гамильтоновой механики;
— дифференциально-алгебраическая геометрия;
— алгебра;
— группы Ли преобразований;
— теория инвариантов геометрических объектов. Новые научные результаты
— развита геометрическая теория синтеза оптимальной обратной связи для стационарных гладких конечномерных систем управления;
— разработан инструментарий для решения задачи синтеза оптимальной стабилизации;
— представлены новые методы синтеза оптимальной обратной связи, допускающие эффективную численно-аналитическую реализацию (метод бихарактеристик для уравнения Гамильтона-Якоби восстановления лагранжева многообразия с заданными начальными условиями; метод первых интегралов и эволюционных симметрий для вычисления сепаратрис гамильтоновой системы; метод разложения аналитической функции Беллмана-Ляпунова в ряд Тейлора в окрестности начала координат; метод деформации алгебраического решения уравнения Гамильтона-Якоби в голономное; метод дифференцирования вдоль гамильтонова векторного поля; описаны системы с инвариантным слоением функции Беллмана-Ляпунова; описана алгебраическая структура первых интегралов гамильтоновой системы в задаче оптимальной стабилизации; разработаны алгоритмы синтеза оптимальной и субоптимальной обратной связи для гладких нелинейных систем; предложен ряд приёмов аналитического интегрирования уравнения Гамильтона-Якоби);
— представлена классификация систем оптимального управления по типам, для каждого из которых предложены наиболее адекватные методы решения задачи синтеза.
Практическая денность полученных результатов
— предложен гибкий, широкого спектра действия, целостный аппарат решения задачи АКОР;
— предложены методы аналитического конструирования оптимальных и субоптимальных регуляторов для нелинейных конечномерных систем;
— для систем с квадратичным гамильтонианом предложен комплекс методов решения задачи синтеза (метод первых интегралов, метод дифференцирования вдоль гамильтонова векторного поля, метод дифференциальных продолжений уравнения Гамильтона-Якоби);
— для систем с гамильтонианом, близким к квадратичному, предложен метод малого параметра восстановления потенциальной функции;
— для систем с инвариантным слоением функции Беллмана-Ляпунова предложен метод отыскания точного решения задачи оптимальной
стабилизации;
— предложен метод решения задачи оптимальной стабилизации для систем с вырожденной функцией Беллмана-Ляпунова;
— разработан универсальный численно-аналитический алгоритм синтеза оптимальной обратной связи для систем с невырожденной потенциальной функцией (метод бихарактеристик);
— предложен ряд аналитических методов интегрирования уравнений Беллмана и Гамильтона-Якоби (метод отыскания инволютивной системы дифференцирований; метод первых интегралов и эволюционных симметрий; метод приведения к вполне интегрируемой системе внешних дифференциальных уравнейий; метод продолжения функции Беллмана-Ляпунова на пространство большей размерности);
— формализован метод Колесникова А. А. синтеза оптимальной обратной связи для систем с функционалом специального вида.
Результаты, выносимые на защиту
— теория геометрических объектов, связанных с задачей оптимальной стабилизации;
— аппарат исследования систем оптимального управления и синтеза оптимальной обратной связи:
— методы синтеза оптимальной обратной связи для предложенных в работе типов систем.
Апробация работы и публикации По материалам диссертации были сделаны сообщения на V Всесоюзном Совещании по управлению многосвязными системами (г.Тбилиси, 1984 г.); на V Всесоюзной конференции по оптимальному управлению в механических системах (г.Казань, 1985 г.); на VII Всесоюзном Совещании-семинаре школы молодых ученых и специалистов по современным проблемам автоматического управления (г.Минск, 1987 г.); на X Всесоюзном Совещании-семинаре школы молодых ученых и специалистов по современным проблемам автоматического управления (г.Омск, 1989г.); на IX научной конференции молодых ученых и специалистов Волго-Вятского региона (г.Горький, 1989 г.); на IX Всесоюзном Совещании по проблемам управления (г.Ташкент, 1989 г.); на VI Международном Симпозиуме по автоматическому управлению и информатике SACCS'98 (Румыния, г.Яссы, 1998 г.). Основное содержание диссертации опубликовано в 19 статьях и одной монографии.
Структура и объем работы Диссертация состоит из введения, пяти глав, выводов по результатам исследования, списка литературы из 106 наименований. Основная часть работы изложена на 160 страницах. Работа содержит 9 рисунков.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность проблемы решаемой в работе, формулируются цель и основные задачи работы,а также приводятся положения, определяющие ее структуру и методы
исследования.
В главе 1 дается обзор состояния проблемы оптимального управления конечномерными системами и ставится задача оптимальной стабилизации для стационарных гладких конечномерных систем. Для гладкой конечномерной системы
х = f(x,u), х е Rn,ue Rm, /(0,0) = 0 (1.1)
и интегрального функционала
+ОС
J = f u(x,u)dt, w(x,v) > 0, w(0,0) = 0 (1.2)
о
требуется найти функцию и^^х), обеспечивающую глобальную устойчивость в некоторой максимальной окрестности начала координат системы (1.1) и реализующую минимум функционала (1.2) вдоль каждой её траектории. Все функции предполагаются гладкими и частичными, определенными в некоторой максимальной в каждом текущем контексте окрестности начала координат соответствующего пространства.
Согласно принципу Беллмана, задача (1.1), (1.2) сводится к решению функционального уравнения
тти{/*(х, u)Vi + и(х, и)} = 0 (1.3)
где (/'(я, и),..., fn(x, и))Т = f(x,u) - правая часть уравнения (1.1), Vidx' = dV - дифференциал функции Беллмана-Ляпунова. Уравнение (1.3) эквивалентно системе
Г(х,иЩ + ш(х,и) = 0 (1.4.)
/¿(г, ti)V5 + «ui и) = 0 (1.4.)
Здесь и далее применяются следующие соглашения: частная производная величины А по переменной х обозначается соответствующим нижним индексом Ах\по повторяющемуся индексу в. многоиндексной величине, расположенному на разных уровнях, производится суммирование; знакоопределенной в некоторой окрестности нуля называется функция, равная нулю в начале координат и сохраняющая знак в открытом плотном множестве этой окрестности (если функция равна нулю только в нуле, то она называется невырожденной). Для невырожденности функции Беллмана-Ляпунова V(x) достаточно невырожденности ы(г, и)|„=о .
В благоприятном случае путем исключения переменных и1, j = 1, ...,m, система (1.4) сводится к уравнению Гамильтона-Якоби
Ф',Ц) = 0 (1.5)
При указанном подходе задача синтеза оптимальной обратной связи полностью сводится к нахождению функции Беллмана-Ляпунова, удовлетворяющей уравнению (1.5).
Задача (1.1),(1.2) и уравнения (1.3)-(1.5) изучались с разных точек зрения разными авторами. Наряду с теоретическим обоснованием самого метода, исследованием условий существования оптимального управления, определением адекватного пространства, в котором решение всегда существует, разрабатывались пути решения конкретных задач, возникающих в механике, биологии, промышленности и т.д, а также классов задач для систем определенного вида.
Первым полностью изученным типом систем (1.1), (1.2), допускающих точное решение, были линейно-квадратичные системы Г(х,и) = А)х> +В[ик,
ш(х, и) = Cikyiyk = Dijxixj + Eikx'uk + Fkiukul,
(Qj)i,j=i,...,n+m, (A;').\J=1.....n, (Fki)kj=i,...,m- положительно определены.
Для линейно-квадратичных систем функция Беллмана-Ляпунова, удовлетворяющая (1.5), является квадратичной, положительно-определенной, вторые частные производные которой могут быть найдены из решения алгебраической системы уравнений второго порядка (системы Риккати)
Ч>Х* (0,0) + <pxiVl (о, 0)Vtk + <pvlXk (0,0) Vu + Cßv, v, (о, 0)VikVji = 0 (1.6)
Система (1.6) имеет два вещественных решения - искомую положительно-определенную матрицу (V,j) и отрицательно-определенную матрицу ш Uopt(x) является линейной функцией на лагранжевом многообразии функции V(x) . Следовательно, линейно-квадратичная задача (1.1), (1.2) полностью разрешима. Следующие шаги в построении общей теории систем (1.1), (1.2) и соответствующих уравнений (1.3)-(1.5), направленные в сторону увеличения полиномиальной размерности функций f и и введения особого рода нелинейностей, отраженные в ряде работ, представляют этап накопления и перехода к следующему логическому шагу - теории аналитических и гладких систем (1.1), (1.2). Однако, основными методами синтеза оптимальной обратной связи для нелинейных систем до сих пор остаются: метод замены исходной системы линейно-квадратичным приближением в окрестности особой точки, метод разбиения окрестности начала координат пространства состояний на достаточно малые блоки и попыткой склеить найденные на них, используя принцип оптимальности Беллмана, и^ц, i 6 I, в единую функцию Uppt, метод синтеза оптимальной обратной связи заданной структуры Ugpt(х, а), а—оптимизируемые параметры. Представляет интерес работа, в которой оптимальное управление восстанавливается по п оптимальным траекториям общего положения. Наибольший интерес представляют работы Колесникова A.A., в которых оптимальное по специально подобранному критерию управление выбирается путем
конструкции поля экстремалей для вариационной задачи на безусловный экстремум, а также излагаются многие другие важные идеи и методы.
Удивительно, что теория оптимального управления, выросшая из аналитической механики, совсем не использует методов последней и традиционно связанной с аналитической механикой дифференциальной геометрии. Данная работа в какой-то мере восполняет этот пробел. Приведенные методы допускают дальнейшее развитие и могут стать основой для создания инвариантной теории гладких оптимальных систем управления.
Следует отметить, что для одномерных систем с одним входом задача синтеза оптимального управления на полубесконечном промежутке времени решается аналитически. В этом случае уравнения (1.4) принимают вид
Таким образом,
ши1(х1У)11{х\и1)-ш(х1,и1)&(х1У) = 0 -
относительно и1 .
Выбирается решение и1 = и^а(х1) , обеспечивающее асимптотическую устойчивость системы (1.1) относительно начала координат х1 = 0 .
В главе 2 приводятся сведения из теории гладких многобразий, необходимые для проводимых в работе описаний и вычислений (тензорные расслоения, пучки векторных полей и форм, внешние дифференциальные системы, связности). изложены основные сведения из теории гладких многообразий(тензорные расслоения, пучки векторных полей и форм, внешние дифференциальные системы, связности) и ■ приведен базисный математический аппарат, используемый далее для описания и вычисления геометрических объектов, возникающих при расчете оптимальных систем управления (лагранжевых многообразий, интегральных поверхностей, инвариантных связностей, дифференциальных инвариантов);
определения сформулированы наиболее адекватным образом для дальнейшего их применения;
основное внимание уделено "операциональной" природе объектов, необходимой в конкретных вычислениях, проводимых в работе.
В главе 3 излагаются теория и приложения геометрии фазового пространства. С задачей синтеза оптимальной обратной связи ассоциируются два основных объекта: изолированное лагранжево многообразие на нулевой поверхности уровня гамильтониана в фазовом пространстве (лагранжево многообразие функции Беллмана-Ляпунова) и поле экстремалей в пространстве состояний при двойственном подходе к решению задачи синтеза. Функция Беллмана-Ляпунова является решением уравнения Гамильтона-Якоби, поэтому синтез оптимального
регулятора тесно связан с определенными объектам и в фазовом пространстве.
Фазовое пространство, подмногообразия и основные инфинитезимальные структуры
Определение 3.1. Фазовым пространством Ф называется четномерное многообразие с определенной на нем замкнутой невырожденной косой 2-формой ш2 (симплектической формой).
Важным примером фазового пространства является пространство
кокасательного расслоения T'B{x',Vj} гладкого многообразия В{х'},
симплектическая форма на котором в локальных координатах имеет вид
w2 = dVif\dxx. В действительности, согласно теореме Дарбу для каждого
четномерного многообразия и каждой невырожденной замкнутой косой
2-формы существует локальная система координат в окрестности
произвольно выбранной точки (так называемая симплектическая
система координат), в которой матрица 2-формы приводится к виду
(О -Е\ _ „
Ol' ГД6 ~ нулевая, Ь - единичная матрица, то есть
симплектическая форма является стандартной и1 — dVi A dx'. Координаты х' назовем базовыми, а Vi - сопряженными.
Как следует из определения 3.1, форма ы2 осуществляет изоморфизм между С°°(Ф)—модулем Der векторных полей на Ф и С°°(Ф)—модулем Д1 1-форм по правилу ш2( • , У) = a, У € Der, а £ А1. Согласно Арнольду обозначим указанный изоморфизм I, и, если а — dip - точная форма, то V? будем называть гамильтонианом, а соответствующее ему поле У = Id(p гамильтоновым векторным полем.
Имеют место следующие очевидные факты:
— производная Ли от dtp вдоль соответствующего гамильтонова поля Idip равна нулю (¿¡¿¿(dtp) = (i;dp о d + d о iid(p)(dip) = = d(uj2(Id<p, Idip)) = Ö);
— производная Ли симплектической формы ш2 вдоль Idip равна нулю (L/£V(w2) = d(uj2{Idp, ■ )) - d{-dip) = 0).
Определение 3.2. Подмногообразие фазового пространства L С Ф называется лагранжевым, если ограничение симплектической формы на него равно нулю ш2\ь = 0.
Все одномерные многообразия являются лагранжевыми. Примером п—мерного лагранжевого многообразия в 2п—мерном фазовом прстранстве Т*В является лагранжево многообразие гладкой функции F : В R : (х') Н- F(x'), заданное уравнениями "сопряженные координаты равны соответствующим частным производным функции F" Vi = Fxi(x\...,xn).
По лемме Картана существует разрешающий гомоморфизм в некоторую (внешнюю дифференциальную) алгебру Alg р : Л(Т*Л) -> Alg, р(ш2) = 0 с ядром, содержащим максимально п независимых образующих первой степени. Поэтому, в 2п—мерном фазовом пространстве допустимы лагранжевы многообразия
максимальной размерности п.
Если Lq~1 - (п — 1)—мерное начальное лагранжево многообразие, трасверсальное траекториям гамильтонова векторного поля Id<p, то однозначно определена эволюция начального многообразия L"-1 =
(expitldipWr1)-
Утверждение 3.1. Пусть С </>_1(0)- Тогда Ln = Ui6[o,T]
является п—мерным лагранжевым многообразием, принадлежащим нулевой поверхности уровня гамильтониана
Замечание 1. Утверждение 3.1 является основанием метода
{х* = Ipv
^ _ ^ с начальными
условиями, принадлежащими (п — 1)—мерному лагранжеву многообразию Lq~1 , лежащему на поверхности уровня гамильтониана ip = const (метод бихарактеристик).
Замечание 2. Если начальное (п — 1)—мерное лагранжево многообразие ¿J}-1 пересекает поверхности уровня гамильтониана, а не содержится целиком в одной из них, то п—мерное многообразие Мп = Uie[o,T] ¿Г-1 не является Лагранжевым. Мп является пространством слоения над отрезком [0,Т] с (п — 1)—мерными лагранжевыми слоями X"-1 . Мп пересекает те же самые поверхности уровня гамильтониана, что и исходное многообразие ¿о"1 •
Утверждение 3.2. Гамильтоново поле Idtp касается каждого-п—мерного лагранжева многообразия 2п—мерного, фазового пространства Ф , лежащего на поверхности уровня гамильтониана ip — const .
Замечание. (Idtp)\y, у 6 <р~1(с), является общим вектором, касающимся каждого п—мерного лагранжева многообразия, лежащего на поверхности уровня гамильтониана <р~1(с) и проходящего через точку у . Если у — неособая точка векторного поля Idtp , то размерность пересечения всех таких многообразий не меньше 1.
Следствие 1. Идеал /(■£"), Ln с у-1(с) С Ф , инвариантен относительно дифференцирования Idtp .
Следствие 2. Корректно определен дифференциальный эпиморфизм тг : (С°°(Ф), Id?) (C°°(L»), (Idtp)\L") ■
Следствия 1 и 2 широко используются в главах 3,4 в различных методах восстановления лагранжева многообразия функции Беллмана-Ляпунова.
Скобка Пуассона и первые интегралы
Определение 3.3. Скобкой Пуассона называется бинарная операция (ip, ф) ui2(Id(p, Ыф) = dip(Id<p) = Ь^ф, определенная в алгебре гладких функций С°°(Ф) фазового пространства (Ф;ш2).
В фазовом пространстве Ф{х1, Vj} со стандартной симплектической формой ш2 — dVi A dxl скобка Пуассона имеет вид
(<р, ф) = <ру{фх, - (р^фу. .
Скобка Пуассона (•, •) является билинейной кососимметрической операцией, удовлетворяющей тождеству Якоби (<р, (ф, т])) + (ф, (77, </?)) + (77, ф)) = 0 , и превращающей линейное пространство гладких функций на Ф п бесконечномерную алгебру Ли.
Определение 3.4. Первым интегралом гамильтонова поля Ы<р называется гладкая функция ф, сохранаяющая постоянное значение вдоль его траекторий.
Как следует из определений 3.4 и 3.3, гладкая функция ф есть первый интеграл векторного поля 1с1<р, тогда и только тогда, когда Ьц^ф =
Если ф,г) — первые интегралы Idip, то из тождества Якоби следует, что (ф, т]) — тоже первый интеграл (возможно функционально зависимый) гамильтонова поля Idip.
интегрируемой по Лиувиллю (коммутативно интегрируемой), если существует набор п коммутирующих функционально независимых интегралов {¿',}"=1, содержащий гамильтониан ip.
Коммутативный набор интегралов {V'iJiLi определяет п—мерное лагранжево слоение ф{ — Ci, i = l,...,n , в 2п—мерном фазовом пространстве Ф .
В задаче оптимальной стабилизации в связи с тем, что ищется одно точное решение уравнения Гамильтона-Якоби, обладающее определенными свойствами, не требуется искать коммутативный набор интегралов. В этой ситуации важны любые интегралы гамильтоновой системы. Определяющим топологическим свойством лагранжева многообразия функции Беллмана-Ляпунова является его изолированность (в обычной евклидовой топологии) в пространстве максимальных (л—мерных) лагранжевых многообразий, лежащих на нулевой поверхности уровня гамильтониана ¥>_1(0) •
Определение 3.6. Эволюционной симметрией (над базой В) называется автоморфизм алгебры гладких функций С°°(В) такой, что ассоциированный с ним автоморфизм пространства расслоения оо—струй отображений J°°(B,R) оставляет неподвижными точки базы В.
Инфинитезимальной образующей эволюционной симметрии является вертикальное (над В) дифференцирование алгебры С°°( J°°{B, Я)) .
Утверждение 3.3. Первый интеграл ' ф(х',\/)) гамильтонова векторного поля Idip = Vv.gp ~~ Ф&ш является эволюционной симметрией уравнения Гамильтона-Якоби tp(x\ V}) = 0. И наоборот, всякая эволюционная симметрия уравнения Гамильтона-Якоби <р = О вида j~V — ф(х', Vj) определяет первый интеграл ф — const гамильтонова векторного поля Idtp .
Следствие. Первые интегралы сохраняют постоянное . значение
(<р,ф) = 0 .
Определение 3.5. Гамильтонова система
называется
на изолированном лагранжевом многообразии Ьп С с производящей функцией, определенной на В.
Точные решения уравнения Гамильтона-Якоби в задаче синтеза оптимальной обратной связи
Обычно поиск точного решения нелинейного уравнения связан с тем или иным дополнительным условием на это решение (инвариантность относительно действия той или иной группы, разные случаи вырождения решения, особенности самого уравнения, наличие присоединенных к решению геометрических объектов, и т.п.).
Условием такого рода для задачи оптимальной стабилизации, имеющей конечное число решений, является топологическое свойство почти изолированности функции Беллмана-Ляпунова в пространстве решений уравнения Гамильтона-Якоби, в том смысле что график градиента потенциальной функции изолирован в любой окрестности начала координат в пространстве графиков градиентов решений уравнения Гамильтона-Якоби относительно топологии поточечной сходимости.
Покажем это для случая невырожденной функции Беллмана-Ляпунова.
Действительно, гамильтониан, отвечающий задаче оптимальной стабилизации, имеет на нулевой поверхности уровня, как минимум, два п—мерных лагранжевых многообразия, проходящих через начало координат фазового пространства: одно Ь+, соответствующее положительно-определенной потенциальной функции, и второе Ь~, соответствующее отрицательно-определенной функции, обеспечивающей неустойчивость начала координат синтезируемой системы.
Для невырожденной потенциальной функции многообразия Ь+ и Ь~ трансверсальны и пересекаются в одной точке -- начале координат фазового пространства. Совместное свойство трансверсальности и одноточечности пересечения является устойчивым относительно малых шевелений многообразий. Поэтому лагранжево многообразие, близкое к лагранжеву многообразию Ь+ функции Беллмана-Ляпунова, находится по отношению к Ь~ в общем положении и пересекает его в единственной точке, близкой к началу координат фазового пространства. Тале как вектор гамильтонова поля является общим касательным вектором в точке пересечения многообразий Ь+ и Ь~ , то такая ситуация возможна лишь в том случае, когда эта точка является особой для гамильтонова векторного поля, то есть в данном случае началом координат фазового пространства. По условию имеется конечное число лагранжевых многообразий, соответствующих задаче оптимальной стабилизации. Следовательно, каждое такое многообразие является изолированным в окрестности начала координат фазового пространства в множестве всех лагранжевых многообразий, лежащих на нулевой поверхности уровня гамильтониана и правильно проектирующихся на базовое пространство состояний.
На свойстве почти изолированности функции Беллмана-Ляпунова основывается возможность её эффективного вычисления. Зная достаточное количество эволюционных симметрий Фу(х',\4), 2 — 1,...,п, уравнения Гамильтона-Якоби, автоматически получаем соотношения ФДх*, Ук) — 3 = 1, ■••, п , описывающие все почти изолированные решения этого уравнения.
Фазовый портрет гамильтоновой системы, ассоциированной с однозначно решаемой задачей оптимальной стабилизации
В случае, если задача оптимальной стабилизации имеет решение, в некоторой максимальной окрестности начала координат фазового пространства имеет место одна из следующих двух картин:
— В случае невырожденной функции Беллмана-Ляпунова: через начало координат фазового пространства Ф = Т*В проходят две п-мерные (п = \dirn Ф) сепаратрисы устойчивых (¿+) и неустойчивых (Ь~) точек. Каждая сепаратриса целиком состоит из интегральных кривых гамильтонова векторного поля М<р , для которых начало координат является общей предельной точкой. Особая точка 0 € Ф = Т* В является седловой точкой для гамильтонова векторного поля , в том смысле, что половина собственных значений матрицы линеаризованной системы имеет отрицательные вещественные части, а половина собственных значений этой матрицы — положительные собственные части. На сепаратрисе устойчивых точек Ь+ точка О является устойчивым положением равновесия типа "узел" или, чаще всего, "фокус". На сепаратрисе неустойчивых точек Ь~ — аналогичная картина с точностью до направления интегральных кривых.
— Для вырожденной функции Беллмана-Ляпунова: через начало координат фазового пространства Ф = Т*В проходят два п—мерных (п = лагранжевых многообразия Ь+ и Ь~ . На многообразии Ь+ , соответствующем функции Беллмана-Ляпунова, имеется аттрактор, проходящий через начало координат фазового пространства. Проекция аттрактора на пространство состояний совпадает с множеством нулей функции Беллмана-Ляпунова. Аттрактор может представлять сепаратрису устойчивых точек на Ь+ . это соответствует асимптотической устойчивости начала координат пространства состояний В синтезируемой системы. Также возможны случаи компактного аттрактора или аттрактора, целиком состоящего из стационарных точек, что соответствует неасимптотически устойчивому положению равновесия оптимизируемой системы.
Приложение теории фазового пространства
Предполагается, что матрица (ГикиМ + ь>и*и01оег-д»хд™ , где Т"Кп - фазовое пространство, - невырожденная, то есть в некоторой окрестности начала координат Т"*./?71 существует однозначно определенная функция иор1 = и^х', V]) , удовлетворяющая (1.4.6), при подстановке которой в (1.4.а) получается уравнение Гамильтона-Якоби (1.5). В этом случае задача оптимальной
стабилизации сводится к поиску уравнений лагранжева многообразия Ь+ : У = У(х),г = 1,..., п, функции Беллмана-Ляпунова У(х). Для системы (1.1), (1.2), допускающей в начале координат невырожденную линейно-квадратичную аппроксимацию (система дифференциальных Уравнений - линейная, управляемая, подынтегральное выражение функционала - квадратичная положительно определенная форма), лагранжево многообразие Ь представляет сепаратрису устойчивых точек гамильтоновой системы
Система (3.1) имеет также сепаратрису Ь~ неустойчивых точек, являющуюся лагранжевым многообразием сопутствующего решения (1.5) отрицательно определенной функции V.
Решение задачи Коши для гамильтоновой системы (метод бихарактеристик)
Известно, что объединение траекторий гамильтоновой системы (3.1), проходящих через (п-1)-мерное лагранжево многообразие С «¿>~'(0) , трансверсальное траекториям гамильтоновой системы, представляет п-мерное лагранжево многообразие Ьп С уз~'(0). К сожалению, напрямую воспользоваться этим фактом для построения сепаратрисы устойчивых точек Ь+ не удается, так как по условию известна только одна точка (0,0) 6 Ь+. Тем не менее для системы с невырожденной функцией Беллмана-Ляпунова (типичный случай) можно воспользоваться следующей процедурой:
— вычислить (линейное) лагранжево многообразие Ь+ :
У{ = а^х*, а>1] 6 Я, линейного приближения в начале координат системы (3.1) (а^ является решением системы Риккати (1.6)),
— просчитать эволюцию начального (п-1)-мерного лагранжева многообразия Ц'1 = {(г1, V}) 6 Т*Нп | V, = (х1)2 + ... +
+(ж")2 = е1, е > 0 — } вдоль гамильтонова векторного поля (3.1) в обратном направлении.
Приближенным локальным параметрическим представлением многообразия Ь+ для аналитической гамильтоновой системы (3.1) является
(3.1)
(т, с2,...,Сп) - (ехр(тМр)х')|
= ((1 + 1(/<^)+
1!
Сп) = (ехр (т1ЛрЩ[
Ыф = (/зц А — ц>х, др- - гамильтоново векторное поле;
1 ах' ^ зу,
**(<*> с") = + £ рациональная
х (с2,...,сп) (1+(С2)2 +Г;.+(Сп)г) параметризация сферы
. 5?-1((®1)2 + - + («")2 = е2)
с удаленной точкой (е, 0,..., 0);
х (.с2, -.., - (1+(С2)З+...+(Сп)2)
У;(с2,...,Сп) = а0а;3'(с2,...,сп); т,с2,...,сп е Л.
Для каждой аналитической функции ^(я1, ряд
(ехр(т1с1(р)Р(х\ V,)) сходится в некоторой окрестности точки т = 0. Метод первых интегралов
В окрестности неособой точки векторное поле (3.1) имеет (2п — 1) функционально независимых первых интегралов, коммутирующих относительно скобки Пуассона с гамильтонианом
(<р,ф) = 0 (3.2.)
то есть удовлетворяющих линейному однородному уравнению в частных производных первого порядка
Ч>\'А>Х> - 4>х>фц = о (3.2.)
В окрестности особой точки системы (3.1) существует не более п функционально независимых интегралов (хотя в дополнении Ь+ и Ь~ функционально независимых интегралов может быть более п ). В любом случае, если {Л}, а € А, - некоторое множество интегралов системы (3.1), то при подходящем выборе констант са, а € А, функции (1а — са) принадлежат (приводимому) идеалу многообоазия Ь+ и Ь~. В действительности, для задания лагранжева многообразия достаточно иметь п функционально независимых попарно коммутирующих относительно скобки Пуассона интегралов.
Общим алгебраическим решением (над кольцом С°°(Т*ЛП) гладких функций) уравнения
УгА - = 0 (3.2.)
ассоциированного с уравнением (3.2.6), является
а. = -
V = С'к<ръ ~ (3.3)
где Ац, Б1' £ Ссо(Т'Яп) - кососимметрические матрицы, В* е Сж(Т'11п) - произвольная матрица, С{ = -В*.
Решениями уравнения (3.2.6) будут замкнутые 1-формы а = сН<1х,+Ы(1Ц = В\ух1)йх* + {С1ч)Ук-1У1Ч>я>)4У1, йа = 0 (3.4)
то есть элементы матриц А, В, С, Б должны удовлетворять следующим уравнениям в частных производных первого порядка
Ачу.Ч>У, + ~ хн - В^хМ-, = + Сакч>укХ, --В^, - Г>'!у>х<х'
+ - - 1У'<Р*у, = С'щфУь + С\лрУку, ~ -С>у,¥>х' - (3.5)
Эффективное решение последней системы без каких-либо дополнительных предположений является неопределенным. Предположениями такого рода могут быть некоторые функциональные или дифференциальные зависимости между элементами матриц А, В, С, £>. Для линейного уравнения (3.1) естественно искать интегралы движения квадратичными. В этом случае А^, В^, С[, £>■'' являются константами и решение уравнений (3.5) не вызывает затруднений (они сводятся к системе линейных однородных алгебраических уравнений).
Методы отыскания интегралов системы (3.1) представляют собой классическую задачу аналитической механики. Из традиционных методов можно отметить метод полного' интеграла, из современных - метод Ь-А-пары и метод орбит коприсоединенного представления группы.
Симметрии в задаче оптимальной стабилизации
Возможность эффективного определения симметрий дифференциальных уравнений основана на том, что дифференцирование в алгебре гладких функций С°°(В.п х Дг) на пространстве расслоения ж : Яп х Яг -> йп : (х1, у") м- (х1) однозначно продолжается до дифференцирования Х^' ,
д = 1,2,...,оо, алгебры С°°(/(9)(Л",ЛГ)) гладких функций на пространстве расслоения Ят): {а;1, уа, у",...,у? ^ }
д—струй сечений расслоения ж с сохраниением форм
Аа = <1уа - уУх' ;
А? = - у°<1х> ;
Д5 = ¿уа} - у%йхк ;
¿={зи-,зч) - я (#•/ = ?);
а = 1, ...,г
Дг = О о ... о ОхП .
Имеет смысл задавать дифференцирование X , сохраняющее формы Л" , сразу же в алгебре С°°(Яг)) , при этом оно вполне определено своими значениями 77е*[у], £;[у] £ Яг))
на координатных базисных функциях уа , х1 . Формулы продолжения (на другие координатные функции) совпадают с приведенными выше. В этом случае дифференцирование называется обобщенным, а при £'[?/] = О - эволюционным.
Дифференцирование X , представляющее симметрию системы дифференциальных уравнений
ед = о, ед е ^(я», яг)),
определяется из условия инвариантности идеала, порожденного продолженной системой, то есть
ХРа =
для некоторых гладких
функций Рал Е Сссрсо(Лп, Дг)) .
Эволюционные симметрии уравнения Гамильтона-Якоби
Польза эволюционных симметрий уравнения Гамильтона-Якоби <р = О для решения задачи оптимальной стабилизации связана с тем, что функция Беллмана-Ляпунова У(х) является "почти изолированным" решением этого уравнения. Действительно, лагранжево многообразие Ь+ , будучи единственной сеператрисой устойчивых точек гамильтоновой системы (3.1), представляет изолированное в топологии поточечной сходимости сечение расслоения Т*В.п Г) в любой окрестности
начала координат 0 € Я" . Поэтому пересечение достаточно малой окрестности функции У(х) (в обычной струйной топологии Л(Яп, Я) для любого д = 0,1,2, ...,оо) с множеством решений уравнения <р = О будет представлять отрезок прямой У(х) + с, с - параметр.
Отсюда следует, что значение эволюционного дифференцирования, сохраняющего уравнение Гамильтона-Якоби в точке У(х) может быть только константой (или что У{х) является стационарной точкой соответствующего эволюционного векторного поля с точностью до тривиальных сдвигов к — сопэЬ ).
Покажем, что симметрии уравнения ц> = 0 вида (¿(х1, в
большинстве случаев тривиальны, а определяют первый
интеграл £](х\ V}) соответствующей гамильтоновой системы. Пусть
Симметрия уравнения ip — 0 относительно дифференцирования X означает, что существует функция Р 6 Cx,(Jco(Rn, R)) , для которой
X(1V = р<р
{QxtW, + (Qv ~ Р)ч> ~ Qv" = 0;
в общем случае, ipy, <р, ш £ Cco(J°c(Rn, R)) -независимые функции; следовательно, Qx, — (Qy — Р) = Qy = 0 , то есть Q — const .
X = Q(x\Vk) J,; XM=X + (D*Q)$r
Записывая условие симметричности ц> — 0 , приводя подобные члены и учитывая, что функции </зу, 6 C°°(Jc°(Rn, R)) в общем случае независимы, придем к уравнению
(Q,v>) = о, б?(X',v,) -
Эволюционное векторное поле <р{х\ Vj)^ , являясь симметрией уравнения Гамильтона-Якоби, характеризуется кроме того тем, что оставляет все его решения неподвижными.
Приводятся определяющие уравнения конечномерных симметрий в задаче оптимальной стабилизации.
Представление первых интегралов и способ вычисления лагранжева многообразия
Если ф — первый интеграл гамильтоновой системы (3.1), связанной с задачей оптимальной стабилизации,
ф — с mod(I(L*)) = cmod(I(L~)), с — const,
I(L+), I(L~) - L+, L~ ;
ф0 = (ф-с)е1(ь+)Г)1(ь-) ■
Пусть
{ai = Vi- афУ}^ - I(L+) ;
Имеем I(L+)(]I(L~) = I{L+) ■ I(L~) (пересечение идеалов совпадает с произведением).
Действительно, I(L+) ■ I(L~) С I{L+)f]I(L~) (всегда); обратно: пусть
г = s'ai = Vbj ; s1, t* e C°°(T*Rn); общее решение последнего уравнения
относительно s\ t' :
s' = Aikak + Bikbk, -t> = Cila, -I- D% ;
Aik = Dji = _Dijt Cji = _вц £ ^(Т'Р") .
Г = S'at = Aikakai + ВаЬка{ = ВЧка{ € (/(L4) • I{L~)), то есть I(L+)nl(L~) С I(L+) ■ I(L~) .
Таким образом, каждый интеграл v'jq (в том числе у ), обращающийся в ноль в начале координат 0 € T'Rn , принадлежит произведению I(L+)-I(L~) . То есть для некоторых гладких функций 74 6 C°°(T*Rn), i,j — 1,... ,п, ф0 = = Е,<7(7!; + + Е,7м(^)2 - W'+
+7,-,a,i(a;)a:') + "j1^ atk(x)fiji{x)xk х1 (для гамильтониана системы линейно-квадратичной по управлению соответствующие функции Y1 не зависят от Vk).
При этом :
— идеалы I(L+), I(L~) инвариантны относительно дифференцирования
Idip ;
— образующие a,-, bj не являются первыми интегралами гамильтоновой системы (3.1).
Поэтому, при наличии некоторых базисных элементов аа bp, a, ft пробегают собственное подмножество {1, ...,гг} возможна генерация полного семейства образующих идеалов I(L+), I(L~) применением дифференцирования Idip :
аМ = (Id<p){an) [bf = (Ы<р)(Ьр)}
а<2> = (М<р)\аа) [bf-ildvf^)} ..
Может быть использован следующий алгоритм вычисления L+ :
— выбирается а\ — Vi — , где aij(x) — неопределенные элементы
C°°(Rn) ;
(1) 00
— находятся ai ,..., aj ,...
Имеет место импликация
( ai = oi4 = ... = а{Г1] = 0 ) =» ( a[f] = О, S = п, п + 1,... ),
из которой следует система дифференциальных уравнений в частных производных относительно ot\j . Если к полученной системе добавить условия интегрируемости Цх> = VjX, , выведенные из а\ = = ... = aj™-1^ = 0 , то результирующая система будет полностью описывать L+ U L~ . Для извлечения L+ следует учесть положительную определенность матрицы (Vjzj)"j=1 .
В случае линейно-квадратичной задачи aij — const . Поэтому здесь число неизвестных с п2 ( система Риккати ) уменьшается до п . Действительно,
а(Л) = + А = 0j _ t„_ 2,n - 1, .
а(В) = NBi(aij)Vi + S?{aij)3?, В = 0,..., п - 2, п,
где коэффициенты KAt(alj), NB,(aij), SP(a\j) - линейно
зависят от a\j.
Если а^ - линейно-независимы и а[В' - линейно-независимы, то выражения
КмМгЛ - MfKAi, А, А = 0,..., п - 2, п - 1,
NBiSf - SfNBi, В,В = О,... , п — 2, п
являются образующими произведения максимальных идеалов пары вещественных точек в Л", определяющих L+IJ L~.
Замечание. В некоторых случаях идеал 7,<i) =
= (oijfli^,. •'• .oi*') С I(L+), k < (п — 1), оказывается замкнутым относительно дифференцирования Idip. Здесь для восстановления I(L+) следует взять неопределенный элемент аг = Vi — ац(х)х1 и применять алгоритм дифференцирования вдоль гамильтонова векторного поля Idip, в результате чего восстановится идеал С 1{1Л). Если /(2) = I(i)+Ii Ф /(L+), то указанную процедуру следует повторить.
Алгебраический метод синтеза субоптимального управления заданной структуры
Пусть L С - n-мерное лагранжево многообразие, правильно
проектирующееся на i?Tl{a:t}"=1 (с производящей функцией V(a:)). Гамильтоново поле Idip касается L . Имеет место сюръективный гомоморфизм ограничения алгебр, сохраняющий дифференцирование Idip, Cco(T*Rn) -> C°°(T'Rn)/I(L) , где I(L) - идеал лагранжева многообразия L .
Алгебра C°°(T*Rn)/I(L) в точности изоморфна C^(Rn) , при этом дифференцированию Idip соответствует его х-проекция X = ipv,(x^ , где Vk — Vk(x) - уравнения
L . Поэтому имеет место сюръективный дифференциальный гомоморфизм р : (C°°(T*iin), Idip) (C°°Rn, X) .
Указанный факт используется при вычислении субоптимального управления заданной структуры и(х,а), а - параметры.
Разложение функции Беллмана-Ляпунова в ряд Тейлора в окрестности начала координат
Из рассмотрения структуры дифференциальных продолжений уравнения Гамильтона-Якоби (1.5)
dm = v* + Km =0 (3-6-)
Dxk о Dx,(ip) = ipxixt + VijtipVj + Vijipv.xk + Vkiipv,x' + VkiVijipVjV, = 0 (3.6.) Dx. о Dxk о Dxi(ip) = Dx.{ipxixt) + Viksjipv, + VikjDx.(ipVj) + Visjipv.xt + +VijDx.(ipv.xt) + Vksiipv, x' + VkiDx.{ipvlXi) + VksiVijipvjV, + VkiVi,j<pvjV,+
+VaVijDx.{w,vl) = 0 ■ • (3-6.)
где Dxi = + Vijjfir . видно, что в том случае, если функция Беллмана-Ляпунова существует, коэффициенты разложения ее ряда Тейлора в начале координат определяются системой (3.6) однозначно.
Для каждой подсистемы (3.6), определяющей р-струю ]а(У) , число уравнений совпадает с числом неизвестных (производные 1рх>, фу, по условию равны 0). Вторые производные У^ вычисляются из квадратичной системы Риккати (3.6.6) и условия положительной определенности матрицы (У^) , производные функции V, начиная с третьего порядка, вычисляются из системы линейных неоднородных уравнений. В случае аналитичности в окрестности начала координат функция У представляется разложением Тейлора
оо 1
£ лГ^1.--.'")*1)' "^Т (3-7)
..,•-)(0) - 5(х1)1, 5(а.п),»|г=0
Несмотря на то, что струя задана системой (3.6) в
неявном виде, решение любой конечной подсистемы (3.6) с помощью компьютерной алгебры не представляет трудностей (существует эффективный алгоритм решения такой системы). Инвариантные связности и первые интегралы Определение 3.7. Связность У(од) на модуле 1-форм К1 {В), где В -п-мерное гладкое многообразие, называется инвариантной относительно векторного поля X 6 Бег (В), если коммутатор Ьх ° У(01) ~ ^(0,1) ° ^х, Ьх - производная Ли вдоль векторного поля X, является нулевым оператором из А1 (В) в Сса(В,Т^<2)В).
Отображение {Ьх о - о Ьх) : А1 (В) -> С°°(В,Т^В)
является С°°(В)-модульным гомоморфизмом. Действительно, пусть Р € А\В), Ь 6 С°°(В), тогда (Ьх о У°01) - У?01) о ЬХ){ЬР) = = ЬХ(Ч°{0А)(Р)Ь + 'р ® Л) - Ч°{0Л)((ЬХЬ)Р + Ъ(Ьхр)) = = £Х(У°0 !,(/?))& + Ч\01р)ЬхЪ + (Ьх0) 0 м + р ® {Ьх О ¿{Ъ)) --V°{01)(Р)ЬХЬ - р ® {к о ЬХ{Ъ)) - V%Л){ЫР))Ь - {1хр) ® ¿ъ. = -(^о^-У^о ЬХ){Р)Ь.
Поэтому, для того, чтобы Ьх о У^) — У^од) о Ьх = 0, достаточно (Ьх о У(0д) — У(од) о ЬХ)(Р') = 0, р' - образующие модуля 1-форм А1 (В).
Утверждение 3.4. Векторное поле X с компонентами, линейными по координатам (X = + с')^?, а}, с' 6 Я), является симметрией
стандартной евклидовой связности У(од) = 0)-
Следствие 1. В задаче оптимальной стабилизации с квадратичным гамильтонианом <р имеется серия явных интегралов. Именно, последовательности
Ф\ = (^0д)№>)1 1<Ьр,Г<Ьр), = (У ^(¿ф^Ы^Ыр),...,
фт = (Ы<р),...;
Фг = = {а1\Ыр),
ф2 = ((У^а1)^, • )| 1сЬр) = (а2\Ы(р)>...,
фт = ((У^К"1)^, • = (ат\1Ар),...
являются первыми интегралами линейного гамильтонова поля Мр. . _
Симметрические (0,2)-тензоры г = 1,2,..., Ы<р- инвариантны.
Следствие 2. В окрестности начала координат фазового пространства задачи оптимальной стабилизации, допускающей невырожденное линейно-квадратичное приближение, существует евклидова связность (оператор кривизны В равен 0), инвариантная относительно гамильтонова векторного поля Ы<р. Обозначим Г уо, }](<1х') = <1х> ® а} + Щ ® ^
<„!)''„,. , ,т. л г,- , тогда формы инвариантной
I У(0,1)№) = <1х' ® 7у + ¿У3 ® Н ^ н
связности удовлетворяют уравнениям
+ - Р1]'Рх'хк ~ а{<Р\',х> + <1'РУ,хк + 1}к<РУ.Ц
- Р'фхщ + Ь!Лр(3{к = + + с1<рух\\
+ Ьм9- - - й<рх>хк - т¡№х%
Т.'^ЦП - ¿/^п + ¿/¿Д* = -Р1кЧ>х<х> - ~ ■
Поле экстремалей
Определение 3.9. Полем экстремалей называется векторное поле, определяющее конгруэнцию интегральных кривых, являющихся экстремалями функционала вариационной задачи (1.1),(1.2).
Иногда полем экстремалей называют саму конгруэнцию экстремальных кривых. Каждое поле экстремалей
д д
определяет семейство ' первых интегралов (по модулю {¿' - дг(х,и)]й* - /17'(х,и)},-=1,...1П;;=1,...,т)
/' = х' — д\х,и), г = 1,..., п ; З1 = й] — Н}(х, и), ] = 1,..., т
системы уравнений Эйлера-Лагранжа вариационной задачи (1.1),(1.2). Наоборот, каждая система п + т первых интегралов •
Г = х{ - д\х, и); Р ее & - Ь?(х, и)
системы уравнений Эйлера-Лагранжа определяет (однозначно с точностью до выбора констант а1, поле экстремалей
X = (д\х, и) + а')^ + (h?(x, и) + Ы) А .
Вывод уравнений Эйлера-Лагранжа вариационной задачи (1.1),(1.2) с неголономными связями представляет значительные затруднения. В ряде случаев при подборе функционала специального вида удается свести условную экстремальную задачу к задаче на безусловный экстремум. Функционалом такого вида может быть некоторый специальный функционал
оо
J L(x, х) dt, Ь{х,х)\х=цх<%) = ш(х,и) . о
Формальным критерием сводимости к безусловной экстремальной задаче является условие совместности системы уравнений Эйлера- •
оо
Лагранжа функционала / L(x, х) dt и системы х = f(x, и) .
Известные интегралы в вариационной задаче на безусловный экстремум
Для лагранжиана общего вида L(x, х) известен интеграл энергии
Н = L - Lx.xl .
Действительно,
Н = Lxtxk + L±txk - (Liix,il + - = 0 ,
где Э.-Л. — уравнения Эйлера -Лагранжа Lx, — jtLx, — 0 функционала
оо
/ Llx, х) dt .
о
Для лагранжиана с разделяющимися переменными L(x, х) = h(x\ х1) + ... + Ln(xn, хп) известны следующие интегралы
Hi = Li — L{ilxl, г=1 ,...,n.
Hi = Llxiii: + L,^ - (I.^i1 + - L^ = 0 ,
где Э.-Л. — уравнение Эйлера-Лагранжа — j.La< = 0 для
лагранжиана с разделяющимися переменными.
Для лагранжиана, не содержащего координату х1, Ьх._ = О, из уравнений Эйлера-Лагранжа следует "закон сохранения (г-ого) импульса"
Vi = —Li. = const. Метод Колесникова А.А. синтеза оптимальной обратной связи
Для системы управления (1.1) х' = f'(x, и) с т независимыми управляющимим воздействиями (предполагается, что
матрица (/¿i)i=i,...,n;j=i,...,m имеет максимальный ранг т в некоторой окрестности точки Об R" х R"1 ) выбирается т функционально независимых гладких функций ф3(х) или параметрическое семейство таких функций.
оо
Составляется функционал J = / L(x,x)dt , где L(x,x) — =
F(ili1, ...,фт, ф1,..., фт) — гладкая функция, подобранная так, что первые интегралы уравнений Эйлера-Лагранжа относительно переменных ф3,ф3 для указанного лагранжиана L легко и в достаточном количестве (т) вычисляются. Обозначим эти интегралы J3 = ф) =
J3{x,x) ,j = 1,...,т .
Вычисляются значения С3(ф,ф)|(z,i)=(o,o) = J'{x, ¿)|(о,о) = Jq ■ Рассматривается поле экстремалей относительно переменных ф3 ,ф3 , определенное уравнениями 0}{ф, ф) = J'ü . Из условия совместности уравнений
&{ф,гР) = Р{х,х) = 4 , j = 1,..., т
х1 = fl(x,u) , i — 1,..., п получается система т (алгебраических) уравнений
JJ(x,f(x,u)) = Ц , j — 1, ...,т
относительно m переменных и3 ,j — 1 ,...,m , одним из решений которой является оптимальная обратная связь и3 = и^^х), переводящая точки пространства состояний системы (1.1) на подмногообразие ф3(х)—р3 , j — l,...,m (где константы р3 удовлетворяют уравнениям G3(p', 0) — Jq ), оптимально в смысле минимума функционала J =
оо .
S Р(ф, ф) dt . Если функции ф3(х) зависят от параметров, то значения
последних подбираются из условия, чтобы многообразие ф3(х) = р3, j = 1,..., m , было сепаратрисой устойчивых точек в пространстве состояний. Приложение метода Колесникова A.A.
Рассмотрим произвольную гладкую систему управления с m независимыми управлениями
х1 = f\x,и), х € R'1, и G Rm, rank(^j = m (3.8) и функционал .
m m \
J = / ((£ + (E Ьгф2г{х))) dt (3.9)
6 4 r=l r=I '
фг(х),Г=1,...,ТП,- , aT,bT,r = 1 ,...,m,— .
Уравнениями, определяющими поле экстремалей функционала (3.9) в задаче.на безусловный экстремум (в координатах фт), будут
Lr - lTVA =0> Lr = + ьЧ2 (З.Ю)
или
= г= 1, ...,тп. (3.10.)
Подставив уравнения (3.8) в (3.10.а), получим систему (гладких) уравнений относительно переменных и1, 1 = 1,..., т,
аЧ'1 - Р{тргх<Г{х,и))2 = 0, г = 1,..., т. (3.11)
Система (3.11) разрешима относительно и1., I = 1,..., т, если для каждого х (из пространства состояний) поверхности уровня отображения Rn -> Rm : (z1,..., zn) н-> (6ix,z\ ...,rpmx,zl) трансверсальны образу отображения fi(u) = f(x,u) : Rm —> Rn. В противном случае система (3.11) будет противоречива (переменные хх не будут свободны).
Если множество решений системы (3.11) непусто, то оно в точности состоит из двух вещественных отображений и^){х), Щ2)(х), одно из которых является решением задачи оптимальной стабилизации для системы (3.8) и функционала (3.9).
Инвариантные дифференциальные свойства функции Беллмана-Ляпунова
Определение 3.10. Группой гладких преобразований, действующих слева на гладком многообразии £?{х'}"=1, называется группа Ли G (конечной или бесконечной размерности) вместе с гладким отображением ц : G х В —> В, удовлетворяющим условиям:
1) fi( 1, •) : В —► В - тождественное отображение,
2) n{gh, ■) = fi(g,n(h,-)) : ВВ, где 1 — единица группы G\ g,h£ G .
Определение 3.11. Геометрическим объектом на многообразии В называется (гладкое) сечение s : В Р расслоения 7г: Р —> В.
Используя локальные координаты базы В{х1}?=1 и пространства расслоения Р{у1}¥=1, можно задавать геометрические объекты упорядоченными наборами функций у' = уг(хг), I = 1,..., N, преобразующихся при замене координат определенным образом в зависимости от типа расслоения тг : Р —> В. Порядок геометрического объекта определяется высшим порядком производных функций преобразования координат базы, входящих в формулы преобразования координат пространства расслоения.
С каждым гладким расслоением я- : Р —>■ В естественным образом ассоциируется его дифференциальное продолжение порядка q, q = 0,1,...,оо, Jq(B,P) -> В, расслоенное над базой В, образованное q—струями локальных сечений исходного расслоения.
Если на многообразии В действует группа G, то это действие однозначно продолжается на пространство расслоения Р над В, а также на пространство расслоения струй сечений Jq(B, Р).
Определение 3.12. Дифференциальным инвариантом (относительно действия группы в) геометрического объекта 5 : В Р называется функция ^ : 1Ч(В, Р) Я, ограничение которой на образ ^(я9), д € С не зависит от выбора элемента д £ С.
Инварианты вводят отношение эквивалентности на множестве орбит группы преобразований, при этом чем больше инвариантов известно, тем тоньше это отношение. При наличии достаточного количества инвариантов отношение эквивалентности превращается в равенство, что позволяет классифицировать объекты пространства представления по признаку принадлежности одной и той же орбите.
В диссертации даны некоторые способы вычисления дифференциальных инвариантов потенциальной функции в линейно-квадратичной задаче оптимальной стабилизации (относительно действия полной линейной группы), а также гладкой потенциальной функции общего вида (относительно группы диффеоморфизмов) при помощи изоморфизма алгебр гладких функций с отмеченным дифференцированием. Приводится способ исследования инвариантных свойств невырожденной потенциальной функции на основе метрических соображений с использованием аппарата ковариантного дифференцирования.
Кроме того в главе 3 рассматриваются другие более специальные методы синтеза оптимальной обратной связи.
В главе 4 приводятся различные типы систем оптимального управления, классифицированные по определенным признакам (классы систем с квадратичным гамильтонианом, с гамильтонианом, близким к квадратичному, с инвариантным слоением функции Беллмана-Ляпунова, гладких систем общего вида с невырожденой функцией Беллмана-Ляпунова, с аналитической функцией Беллмана-Ляпунова, с вырожденной потенциальной функцией, с известными (или легко выделяемыми) первыми интегралами или эволюционными симметриями, с функционалом Колесникова). Некоторые из предложенных в работе общих методов оказались наиболее эффективными для определенных классов управляемых систем. В общем случае при отсутствии априорной информации о дополнительных свойствах системы можно использовать универсальный метод бихарактеристик. Однако, при. наличии тех или иных дополнительных признаков, которыми обладает система, процедура синтеза становится более эффективной при использовании других адекватных ситуации методов. Ниже описаны специальные классы систем, относительно которых имеется некоторая дополнительная информация.
Системы с квадратичным гамильтонианом
Этот класс включает все линейно-квадратичные системы. Для их расчета особенно эффективным оказался метод восстановления лагранжева многообразия функции Беллмана-Ляпунова с помощью дифференцирования вдоль гамильтонова векторного поля, сводящий
задачу к решению квадратичной системы алгебраических уравнений относительно п переменных. В линейно-квадратичном случае этот метод приводит к уменьшению числа алгебраических неизвестных с п2 п матричном уравнении Риккати до п.
Метод основан на инвариантности идеала /(L+) лагранжева многообразия L+ потенциальной функции относительно гамильтонова векторного поля Idip , ассоциированного с задачей оптимальной стабилизации.
Для систем с квадратичным гамильтонианом образующие идеала I(L+) являются линейными однородными вида Ц — а^х1, — const, что позволяет их эффективно восстанавливать.
Подбор функционала специального вида
Покажем, что для системы управления
х1 = f\x) + Ъ]и>
X2 = f (х) + Ъ;Ь> где. д gl е С00(ДП> щ (
¿т = Гш(х) + bmuj к = 1,..., т, I = m + 1,..., П,
•m+i т+1/ V7 р - линейные однородные,
¿m+i =
ие Rm, Ь) е Л, гапЩ) = т
хп = дп{х) выбор функционала
J = |((-с1)2 + (х2)2 + ... + (я")2 + (i1)2 + (х2)2 + ... + (х")2) dt о
приводит к квадратичному гамильтониану.
Обозначим f'(x) + Щи? = а'. Запишем уравнения (1.4) для указанной системы оптимального управления.
(1.4.): (а'Ц +... + amVm) + (gm+1Vm+1 + ... + gnVn) + ((х1)2 + ... + +(х".)2) + ((а1)2 + ... + (а"1)2) + ((ffm+1)2 + • • • + G?")2) = 0 ;
(1.4.) : b\Vx + b\V2 + • • • + bfVm + 2Ъ\а1 + 2b\a2 + ...+ 2Ъ?ат = 0 ;
b^ + b22V2 + ... + b?Vm + 2b\al + 2h\a2 + ... + 2b?am = 0 ;
ЬЩ -Ь + ■■■ + № + + 262,а2 + ... + 2Ь™ат = 0 .
Решением системы последних т уравнений является
а2 = —\У2 решение единственно, так как
.... гапЫЬ*) = т максимален.
ат - -\Ут
Подставляя ак , А: = 1,..., т , в (1.4.а), получим квадратичное уравнение
Гамильтона-Якоби
(_1(Ц)2 - . . . _ l(l/m)2) + ((х1)2 + . . . + (l»)2) + ((Г+1)2 + ... + = о j
левая часть которого представляет искомый гамильтониан.
Замечание. В качестве функционала системы оптимального управления, имеющей квадратичный гамильтониан, может быть взят
функционал с подынтегральной функцией ш = А(х) + Е (Г{х) + Ь)и3),
•¡=1
где fl(x) — нелинейная часть f'(x), Л(х') — квадратичная положительно определенная функция.
Системы с гамильтонианом, близким к квадратичному Рассматриваются системы оптимального управления с гамильтонианом вида ip(x',Vj,e), зависящим от параметра е, гладким по всем переменным и переходящим в квадратичный <р(х\ Vj) при £ — О, ip(x',Vj) = ip(xl,Vj,£)\e=o. В этом случае функция Беллмана-Ляпунова
V также зависит от параметра £ F = V(xl,e). Предполагая зависимость
V от е гладкой, можно, используя обычный метод малого параметра, эффективно вычислить начальные члены разложения функции V(x',e) в ряд Тейлора по переменной с в окрестности нуля.
Если существует разложение
V(x\ е) = 0°>(х<) + £eV<V) + ¿eV^V) +... + + • • •,
1! 2! г!
то его коэффициенты при степенях е вычисляются рекуррентно из уравнений с частными производными
при этом функция V^(i') удовлетворяет квадратичному уравнению Гамильтона-Якоби <p(xl,vj°\xk)) = 0 и, следовательно, вычисляется эффективно; функция ^^(г*), г > 1 удовлетворяет линейному неоднородному уравнению в частных производных первого порядка, коэффициенты которого определяются с учетом предыдущих функций (я'), q < г.
Выпишем определяющие уравнения для V^(xl), V^^x'), V(xi,Vjf>\xk)) = 0-,
V/V), V) + ч>е{х\ Vj'V). 0) = 0;
<pvMxi> о)к< + wAxi' Vl{O](xk),0)vj1\xi)+
+<pVj(xi,Vll°)(xk),0)vj2\xi) + ^«(x4, V,(<V). 0) - 0; mvXx*, Vj°\x'), 0)vj1\xi)vi1\xi)^l\xi)+
+2 ifbvA*', v?V), о V) ttf V)+
+<PV,(x\ V(°)(x'), 0)у13\х{) + <Pese(x', V?<V), 0) = 0.
Системы с инвариантным слоением функции Беллмана-Ляпунова
Применяется метод совместного вычисления дифференциальных инвариантов функции Беллмана-Ляпунова и гамильтониана. Основным результатом является последовательность внешних дифференциальных форм, принадлежащих идеалу лагранжева многообразия потенциальной функции. Ниже представлены характеристические свойства систем этого класса и приведены примеры синтеза, оптимальных регуляторов для систем, принадлежащих этому классу.
Система (1.1), (1.2) обладает инвариантным слоением функции Беллмана-Ляпунова, если оптимальный поток в пространстве состояний сохраняет поверхности уровня функции Беллмана-Ляпунова. Класс таких систем не пуст и имеет хорошее алгебраическое описание. Для систем этого класса имеет место следующее предложение.
Подалгебра, порожденная функцией Беллмана-Ляпунова, в алгебре гладких функций на Rn является дифференциальной относительно инфинитезимального оператора, определяющего оптимальный поток.
Обозначим: f(x', Vj) — гамильтониан, (— ш(х', Vj)) — лагранжиан (*р = <pv,Vi + w), I dip — гамильтоново векторное поле, L\% — k-я производная Ли вдоль Id<p (к = 0,1, 2,...),
~ операция подстановки гамильтонова поля в форму.
Последовательности 2-форм
du A dV, d{LIdipcj) A dV,.... d{L%u) A dV,...
и 1-форм
iIdip{du) A dV), iidvidiL/^w) A dV), ...,iIdp(d(L[kJpU!) A dV),...
содержатся в дифференциальном идеале лагранжева многообразия функции Беллмана-Ляпунова.
Последовательности 2-форм и 1-форм из предыдущего предложения полностью характеризуют пару лагранжевых многообразий L+IJ в фазовом пространстве, именно, сепаратрису устойчивых относительно начала координат точек гамильтонова векторного поля Id<p и сепаратрису неустойчивых относительно начала координат точек.
Приведенные факты могут быть использованы для точного вычисления оптимальной обратной связи в задаче оптимальной стабилизации для определенного выше класса систем.
Системы с гамильтонианом, допускающие группу симметрий вдоль поверхности уровня решения уравнения Гамильтона-Якоби
Существуют совместные дифференциальные инварианты гамильтониана ¡р и функции V(x), являющейся решением уравнения <р — 0. Вычислим дифференциальные инварианты первого порядка методом Лаптева Г.Ф.
На пространстве расслоения кореперов H°°(Rn) над R" существует последовательность 1-форм,инвариантных относительно гладких автоморфизмов H°°(Rn) —> Я°°(ДП) :
ш' = x'jdx3,
ш) = dxkx{ - х)кшк, ш)к = dx)k ~ Х)А ~ + x'jk"} + х?кх1т,и>1 - x)klwl, .. (4.1)
i)4 = ¿1-
Разложим dV dtp по инвариантным формам (4.1):
dV = Vtdx' = Viiy-, Ij - Цх);
dVi - dljxf + Ijdxj = dljx'i - Ijx\tJk - Ijx\x{kwk\
d<p = (<px,x'k - ipvjjxlxj^ + ipvtfdlj - wjjxfwi;
Jj = J3 = <pv,x\-, Jk = <Рх<хк - <ру,1}Х\х{к;
Ij) Jk) J3; Jk - дифференциальные инварианты первого порядка с дополнительными слоевыми параметрами. Эти инварианты зависимы между собой, поэтому при их оценке в исходной алгебре C,cc{T'Rn) возникнут нетривиальные базовые инварианты. В действительности, имеется один независимый нетривиальный совместный дифференциальный инвариант функций <р V, получаемый свёрткой Jk по верхнему и нижнему индексам с учетом значения Ij .
J = J] - ipvjjxj = <Pv,Vi
Если гамильтониан <p допускает группу симметрий с орбитами на Rn V = const, то J = <pVlVi = F(V) - V .
Отсюда сразу следует, что класс систем с инвариантным слоением функции Беллмана-Ляпунова содержится в классе систем с гамильтонианом, допускающим группу симметрий вдоль поверхности уровня решения уравнения Гамильтона-Якоби.
Класс гладких систем общего вида с невырожденной функцией Беллмана-Ляпунова
Применяется метод решения задачи Коши для гамильтоновой системы (метод бихарактеристик). Основными полученными здесь
результатами являются: модификация известного в теории уравнений с частными производными метода бихарактеристик и адаптация его к системам данного класса, а также алгоритм восстановления лагранжева многообразия функции Беллмана-Ляпунова по этому метод}'. На первых нескольких этапах получаются начальные условия задачи Коши, являющиеся (п — 1)-мерным лагранжевым многообразием, трансверсальным траекториям гамильтоновой системы и пересекающим поверхности уровня гамильтониана близкие к нулевой. На следующих этапах восстанавливается п-мерное многообразие, близкое к искомой сепаратрисе устойчивых точек гамильтоновой системы.
Класс систем с аналитической функцией Беллмана-Ляпунова Применяется метод разложения потенциальной функции в ряд Тейлора в начале координат пространства состояний, использующий дифференциальные продолжения уравнения Гамильтона-Якоби. Основной результат здесь заключается в возможности эффективного вычисления коэффициентов разложения (вторых частных производных в нуле путем решения системы Риккати, частных производных порядка выше второго в нуле - путем решения алгебраической системы линейных неоднородных уравнений). Используя р членов разложения можно найти приближенный закон оптимальной обратной связи.
Класс систем с вырожденной потенциальной функцией Основной применяемый метод - строится серия дополнительных внешних дифференциальных уравнений, описывающих лагранжево многообразие потенциальной функции. Результатом здесь является выработка техники исследования ситуации вырождения и получение необходимых уравнений. Ниже кратко описан этот метод, а также приведены примеры систем, сосчитанных им.
Для невырожденной функции Беллмана-Ляпунова У(х) существует гладкая функция к{х) ( к(х) > 0 для всех х из некоторой окрестности начала координат К" ), что п—форма [вУ\ А ... Л <Г/п — к(х)(1х1 Л ... Л йхп), а также все формы, полученные из нее операциями гцР, содержатся в дифференциальном идеале, определяющем Ь+.
При решении задачи оптимальной стабилизации могут встречаться случаи вырождения функции Беллмана-Ляпунова. При этом положение равновесия синтезируемой системы может оказаться неасимптотически устойчивым. Достаточным условием невыржденности потенциальной функции является невырожденность подынтегральной функции минимизируемого функционала. Поскольку ситуация вырождения встречается часто и легче для исследования, то полезно рассмотреть относящиеся к ней общие конструкции.
Под вырождением степени д, = 0,..., п, функции Ляпунова V понимается наличие д—мерного связного многообразия, содержащего начало координат пространства состояний, на котором функция V обращается в ноль.
Помимо уравнения Беллмана, которому удовлетворяет функция Ляпунова V, в данном случае имеется серия дополнительных соотношений, получаемых из п—формы "внешнее произведение дифференциалов сопряженных координат" Л ... А ¿Уп операциями подстановки г^ гамильтонова векторного поля Ы<р, ассоциированного с задачей оптимальной стабилизации, и внешнего дифференцирования й. При вырождении степени больше 1 число соотношений возрастает. В этом случае дифференциальному идеалу /(1/+) лагранжева многообразия Ь+ функции Беллмана-Ляпунова принадлежат все р—формы, п — д+1<р<п, полученные из формы " внешнее произведение дифференциалов сопряженных координат" удалением части сомножителей, а также формы, полученные из них операциями подстановки гамильтонова векторного поля и внешнего дифференцирования.
Полученные уравнения позволяют эффективно восстанавливать лагранжево многообразие Ь+ функции Беллмана-Ляпунова.
Системы с известными (или легко выделяемыми) первыми интегралами или эволюционными симметриями
Основным результатом и методом исследования является условие действия тривиальными сдвигами группы симметрии уравнения Гамильтона-Якоби на функцию Беллмана-Ляпунова как на почти изолированное решение в любой окрестности начала координат пространства состояний (см. п.п. 3.1.2, 3.2.2, 3.2.3, 3.2.13).
Системы с функционалом Колесникова
Система оптимального управления (1.1), (1-2) с тп независимыми управлениями (гапк(= ш) имеет функционал Колесникова, если найдутся тп независимых гладких функций
I = 1, ...,771, и гладкая функция Ь : Л2"1 —> Я, такие что: 1) подынтегральная функция ш(х,и) = Ь(ф\, ...,фт,фи —,Фт)\х=дх>и), 2) эффективно определяются т функционально независимых первых интегралов ^(ф,ф), г = 1 ,...,т , системы уравнений Эйлера-Лагранжа
относительно переменных V»/, I = 1 ,...,т, для функционала 3 =
00
I Ь(ф, ф) (И в вариационной задаче на безусловный экстремум, 3) если
ф) = сг - уравнения, определяющие поле экстремалей указанной вариационнй задачи, то они должны быть совместны с уравнениями динамики х — /(х,и) (то есть при свободных переменных хг, г — 1,..., п, переменные и1, I = 1 ,...,т, должны быть функционально зависимы от них).
При выполнении условий 1) и 2) условие 3) в большинстве случаев выполняется (определяет ситуацию общего положения).
Аналитическая процедура решения систем с функционалом Колесникова даже при очень высокой сложности объекта управления является простой и эффективной.
В пятой главе показана возможность использования предложенного
подхода для решения задачи оптимального синтеза синстем, определенных в банаховом пространстве. В типичной ситуации характерной особенностью гамильтовой системы, ассоциированной с общей абстрактной задачей оптимальной стабилизации, является свойство гиперболичности ее динамики в окрестности положения равновесия.
Гиперболическая динамика хорошо изучена и позволяет восстанавливать сепаратрисные многообразия итеративно с любой степенью точности.
Гиперболические системы
Определение 5.1. Непрерывная липшицева система х — /(ж) в банаховом пространстве X называется гиперболической в окрестности стационарной точки Хо 6 X, если спектр линейного оператора БХо/(х) =
целиком лежит вне мнимой оси. . Для гиперболических систем известна теорема о стабильном и нестабильном многообразиях. Именно, существует пара
трансверсальных инвариантных гладких многообразий Ь+ и Ь", проходящих через стационарную точку х0 £ X, одно из которых многообразие устойчивых точек, а другое многообразие неустойчивых точек. Касательные плоскости к этим многообразиям ТХоЬ+ и ТХаЬ~ аналогична являются устойчивым и неустойчивым многообразиями соответствующей линеаризованной системы х = (ОХ0/)х. Кроме того устойчивое и неустойчивое многообразия нелинейной системы могут быть представлены локально как графики отображений Т1оЬ+ —->■ ТХоЬ~
Для глобальной гиперболической системы существуют два трансверсальных гладких инвариантных слоения. Слои, проходящие через особую точку хо, будучи неподвижными, являются инвариантными для данной динамической системы и представляют многообразия устойчивых и неустойчивых точек.
Классическая абстрактная задача оптимальной стабилизации Задача синтеза оптимального регулятора называется классической, если с ней может быть ассоциирован гладкий гамильтониан. Более точно имеет место следующее определение.
Определение 5.2. Задача синтеза оптимальной обратной связи для системы управления
х = /(х,и), х € X, и е и, где X, II - области банаховых пространств,
и функционала
00
О
называется классической, если существует ассоциированный гамильтониан системы
являющийся непрерывно-дифференцируемой функцией переменной состояния х и сопряженной переменной р (линейного непрерывного функционала на X) с лигшицевым дифференциалом dip.
Очевидно, если система управления х = f(x,u) и подинтегральная
оо
функция ш(х, и) функционала качества J = / ш(х, u)dt являются
гладкими (достаточно дважды непрерывной дифференцируемости), тогда по теореме о неявной функции Uopt(x,p) существует в окрестности стационарной точки и является той же степени гладкой. Как будет показано в следующем пункте, лагранжево многообразие gradV = р(х) соответствующей функции Беллмана-Ляпунова, будучи
является гладким (той же степени, что и ¡р). В этом случае оптимальный регулятор и^х) существует и представляет собой гладкую функцию переменной состояния х.
Для классической задачи оптимальной стабилизации с гиперболическим гамильтонианом имеет место главный алгоритм синтеза оптимального регулятора (метод бихарактеристик).
Свойство гиперболичности гамильтоновой системы, ассоциированной с задачей синтеза
Указанное свойство является типичным (для его выполнения достаточно управляемости исходной системы и положительной определенности подинтегральной функции и>(х,и)) и вытекает из следующих качественных соображений.
Функция Беллмана-Ляпунова V = У{х), являющаяся решением уравнения Гамильтона-Якоби <р(х,gradV) — 0, имеет смысл функции
центрального поля экстремалей на пространстве состояния X (то
00
есть У(х) дает значение функционала J = 5 ul(x,u)dt, взятого
вдоль экстремали, идущей от точки х до стационарной точки 0 и удовлетворяющей дифференциальным соотношениям ¿'(£) = /(^(¿), для некоторой 'экстремальной' функции «(£)).
В общем случае имеет место следующая ситуация. Для гладкой задачи синтеза, имеющей решение (в частности, для классической задачи оптимальной стабилизации с гладким гамильтонианом), (локально) существуют в точности два центральных поля экстремалей. Именно, поле экстремалей, входящих в положение равновесия, и поле экстремалей, выходящих из положения равновесия. Каждому из них соответствует своя функция поля (У+(ж) = У{х) и У-(ж)). Обе функции удовлетворяют уравнению Гамильтона-Якоби ^p{x,gradV) = 0.
ip(x,p) d= miriueU j< p,f(x,u) > +w(x, u)j,
def
сепаратрисой устойчивых точек гамильтоновой системы
По смыслу центрального поля лагранжевы многообразия р = ^г и р = являются соответственно (трансверсальными) сепаратрисами устойчивых и неустойчивых точек ассоциированной
( i = ^
гамильтоновой системы < . .. Это означает гиперболичность
l Р = ~дх
положения равновесия гамильтоновой системы в гладкой задаче оптимальной стабилизации, имеющей решение (в типичном случае).
Кроме того, как следует из теоремы о стабильном и нестабильном многообразиях, если гамильтониан ip(x, р) непрерывно дифференцируем с липшицевым дифференциалом dip, то сепаратрисы гиперболической гамильтоновой системы будут непрерывно дифференцируемыми многообразиями.
Свойство гиперболичности выделяет обширный класс гамильтоновых систем, возникающих в задаче синтеза оптимальных регуляторов для гладких стационарных систем, и выгодно отличает их (например, от центральной динамики гамильтоновых систем классической механики). Для вычисления сепаратрис не требуется коммутативность полного набора интегралов. И кроме того, существует регулярный итеративный алгоритм их вычисления.
Вычисление сепаратрис гиперболической гамильтоновой системы (главный алгоритм синтеза)
Для гладких глобальных гиперболических систем известен следующий факт. Существует такое продолжение исходной динамической системы, определенной на области X банахова пространства, на некоторое пространство GX касательных элементов к X (или, что то же самое, на пространство некоторого грассманова расслоения над X), что найдется инвариантное распределение касательных элементов на X (инвариантное сечение X —> GX). Более точно, имеются два (необязательно различных) грассмановых расслоения, таких что для одного указанное инвариантное сечение будет (локально) асимптотически устойчивой стационарной точкой в пространстве гладких сечений Cl(X, GX) относительно продолженной динамики, а для другого соответственно (локально) асимптотически неустойчивой стационарной точкой. Из этого вытекает свойство интегрируемости указанных инвариантных распределений касательных элементов (так как они сколь угодно точно аппроксимируются интегрируемыми распределениями). При этом слои инвариантных распределений, проходящие через гиперболическую точку, являются (локальными) сепаратрисами неустойчивых и устойчивых точек соответственно.
Описанная ситуация определяет также простую и эффективную процедуру вычисления этих сепаратрис. Именно, любое' слоение на X (допустимое в том смысле, что связанное с ним расслоение является сечением из Cl{X, GX), имеющем 'не очень большой угол' с инвариантным слоением) 'прижимается' за полубесконечный
промежуток времени (соответственно прямым или обратным) динамическим потоком к инвариантному слоению. Оказывается, что касательные плоскости в гиперболической точке к сепаратрисам всегда лежат в области притяжения этих сепаратрис относительно соответствующего потока (прямого или обратного). Это свойство остается справедливым для (необязательно гладкой) липшицевой гиперболической системы. Таким образом, алгоритм вычисления сепаратрисных многообразий полностью определен.
Для (глобально) гиперболической гамильтоновой системы, ассоциированной с задачей синтеза, инвариантные распределения касательных элементов представляют собой сечения одного и того же грассманова расслоения над фазовым пространством.
На первом этапе вычисляются линейные сепаратрисные (лагранжевы) многообразия линеаризованной гамильтоновой системы в окрестности гиперболической особой точки. На втором этапе полученные плоскости рассматриваются как начальные данные решения задачи Коши для соответственно исходной или противоположной гамильтоновой системы на полубесконечном промежутке времени.
Более точно главный алгоритм синтеза оптимальной обратной связи можно описать следующим образом.
1. Составляется гамильтониан <р(х,р) исходной гладкой системы управления; и находится функция uopt(x, р).
2. Находится квадратичное приближение ipq(x,p) гамильтониана <р(х,р) в гиперболической особой точке.
3. Находится (линейная) сепаратриса устойчивых точек
(линейной) гамильтоновой системы , что соответствует
решению линеаризованной задачи оптимальной стабилизации.
Г х -
4. Решается задача Коши для гамильтоновой системы < др
противоположной исходной с начальными данными на
полубесконечном промежутке времени. При I —¥ оо решение задачи Коши £+(£) асимптотически стремится к искомой сепаратрисе
Г х = &
устойчивых точек — Нт^оо Ь+{() гамильтоновой системы < 0р
5. Ограничение и^х^) на Ь* определяет оптимальный регулятор "орДя) системы управления.
Для (локально) гиперболической гамильтоновой системы следует использовать алгоритм бихарактеристик с другими начальными условиями.
Замечание. Оптимальные системы управления с гладким гиперболическим гамильтонианом являются гладким аналогом невырожденных линейно-квадратичных систем в том смысле, что они имеют одинаковый локальный топологический портрет в фазовом
пространстве. Можно утверждать, что <р(я,р) = <ркп(х,р)то<1(х3 где (ркв(х,р) - гамильтониан невырожденной линейно-квадратичной системы, аппроксимирующей данную в особой точке; оптимальный регулятор иор((х) существует; и фазовые портреты гамильтоновых систем
г х = ¥ ( х = , ■
) • §£ и 1 • дукв (локалЬ11°) топологически эквивалентны.
I Р ~ ~дх ( Р- ~ дх"
ВЫВОДЫ
Основное внимание в работе было уделено точному решению задачи оптимальной стабилизации и исследованию инвариантных свойств потенциальной функции. На основе этих свойств был разработан ряд методов восстановления функции Беллмана-Ляпунова и, следовательно, закона оптимальной обратной связи. Все методы являются общими, применимыми к произвольным гладким системам управления и доведены до уровня практического использования. В работе:
— представлена теория геометрических объектов, связанных с задачей оптимальной стабилизации (теория фазового пространства, поля экстремалей в задаче на безусловный экстремум, совместимый с уравнениями связей, дифференциальных инвариантов функции Беллмана-Ляпунова);
— разработан определенный инструментарий исследования систем оптимального управления и синтеза оптимальной обратной связи;
— описаны инвариантные свойства функции Беллмана-Ля-пунова, используемые для отыскания точных решений задачи оптимальной стабилизации: топологические (функция Беллмана-Ляпунова является почти изолированным корнем уравнения Гамильтона-Якоби в пространстве всех решений данного уравнения, определенных в окрестности начала координат, позволяющее эффективно восстанавливать эту функцию с помощью достаточного числа симметрий уравнения Гамильтона-Якоби; лагранжево многообразие функции Беллмана-Ляпунова представляет сепаратрису устойчивых точек гамильтоновой системы, ассоциированной с задачей оптимальной стабилизации); алгебро-геометрические (идеал л-мерного лагранжева многообразия функции Беллмана-Ляпунова является свободно-порожденным ранга п, инвариантным относительно дифференцирования вдоль гамнльтонова векторного поля, ассоциированного с задачей оптимальной стабилизации, и содержащим некоторые отмеченные элементы алгебры гладких функций на фазовом пространстве; для систем с квадратичным гамильтонианом образующие идеала лагранжева многообразия функции Беллмана-Ляпунова являются линейными однородными определенного вида, что тозволяет их эффективно вычислять; для систем с инвариантным плоением функции Беллмана-Ляпунова и систем с вырожденной функцией Беллмана-Ляпунова получены последовательности внешних
дифференциальных форм, содержащиеся в дифференциальном идеале лагранжева многообразия и позволяющие эффективно восстанавливать его); аналитические (имеется эффективный алгоритм вычисления коэффициентов разложения аналитической функции Беллмана-Ляпунова в ряд Тейлора в начале координат пространства состояний; график градиента функции Беллмана-Ляпунова однозначно восстанавливается интегрированием гамильтоновой системы с подходящими начальными условиями);
— сформулированы прикладные методы синтеза оптимальной обратной связи, такие как метод бихарактеристик восстановления лагранжева многообразия функции Беллмана-Ляпунова, метод первых интегралов и обобщенных симметрии, метод дифференцирования вдоль гамильтонова векторного поля, метод деформации алгебраического решения уравнения Гамильтона-Якоби в голономное на полубесконечном отрезке, алгебраический метод синтеза субоптимального управления заданной структуры, метод приведения уравнения Гамильтона-Якоби к вполне интегрируемой системе внешних дифференциальных уравнений, формализм поля экстремалей в задаче на безусловный экстремум, совместимый с уравнениями связей, метод дифференциальных инвариантов потенциальной функции;
— получена серия явных первых интегралов для систем с квадратичным гамильтонианом, определяющая уравнения лагранжева многообразия функции Беллмана-Ляпунова;
— приведена классификация систем оптимального управления по типам, для каждого из которых предложены адекватные методы решения задачи синтеза (системы с квадратичным гамильтонианом, решаемые методом дифференцирования вдоль гамильтонова векторного поля; системы с гамильтонианом, близким к квадратичному, с использованием метода малого параметра; системы с инвариантным слоением функции Беллмана-Ляпунова и вырожденной функцией Беллмана-Ляпунова. решаемые методом конструирования внешних дифференциальных уравнений, описывающих лагранжево многообразие потенциальной функции; гладкие системы общего вида с невырожденной функцией Беллмана-Ляпунова, рассчитываемые методом бихарактеристик для уравнения Гамильтона-Якоби; системы с аналитической потенциальной функцией, допускающей эффективное разложение в ряд Тейлора; системы с легко выделяемыми первыми интегралами или эволюционными симметриями; системы с функционалом Колесникова, решаемые методом отыскания достаточного числа первых интегралов уравнений Эйлера-Лагранжа в задаче на безусловный экстремум);
— выделено свойство гиперболичности гамильтоновой системы, ассоциированной с задачей синтеза оптимального регулятора; предложен регулярный алгоритм синтеза для классической задачи оптимальной стабилизации с ассоциированным гиперболическим гамильтонианом.
Работа относится к- классу исследований по применению инвариантных геометрических методов в теории оптимального управления.
Геометрический подход, проясняя изучаемую ситуацию, является конструктивным и перспективен для дальнейшего использования в гладких задачах оптимального управления (описание полного набора дифференциальных инвариантов потенциальной функции; классификация систем оптимального управления по топологическому типу фазового портрета гамильтоновой системы, ассоциированной с задачей оптимальной стабилизации; конструкция симплектических связностей, инвариантных относительно гамильтонова векторного поля; эффективные методы вычисления сепаратрис гамильтоновой системы и конструирования эволюционных симмегрий уравнения Гамильтона-Якоби и т.д.).
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Кондратьев Г.В. Аппарат внешних форм в исследовании нелинейных систем, сб. "Современные проблемы автоматического управления: Тезисы докладов VII Всесоюзного Совещания-семинара школы молодых ученых и специалистов", Минск, 1987, с. 19
2. Кондратьев Г.В. Теорема Рашевского-Чжоу как критерий слабой управляемости конечномерных систем, линейных по управлению, сб. "Математическое моделирование в задачах механики и управления", Волгоград, 1990, с.32-34
3. Кондратьев Г.В. Достаточное условие управляемости нелинейных систем, сб. "Системы управления, преобразования и отображения информации", Рязань, 1984, с.42-45
4. Кондратьев Г.В. Управляемость нелинейных систем, в сб. "Управление многосвязными системами: Тезисы докладов V Всесоюзного Совещания", Тбилиси, 1984, с.76-77
5. Кондратьев Г.В. Построение областей достижимости конечномерных динамических систем, сб. "Оптимальное управление в механических системах: Тезисы докладов V Всесоюзной конференции", Казань, 1985, с.73
6. Кондратьев Г.В., Мисевич П.В. Построение информативной области для нелинейных систем при помощи уравнения Фокера-Планка-Колмогорова, сб. "Тезисы докладов V Всесоюзноой конференции по проблемам управления развитием систем", Саратов, 1988, с.34
7. Кондратьев Г.В. Класс систем с ивариантным слоением функции Беллмана- Ляпунова, сб. "Системы обработки информации и управления", Н.Новгород, 1995, 41-44 с.
8. Кондратьев Г.В., Жукова М.И. Один метод синтеза оптимальной обратной связи для нелинейных систем, сб. "Математическое моделирование в задачах механики и управления", Волгоград, 1990, с.59-64
9. Кондратьев Г.В., Жукова М.И. Синтез оптимальной обратной связи в реальном времени, в сб. "IX научная конференция молодых ученых и специалистов Волго-Вятского региона: Тезисы докладов", Горький, 1989, с.10
10. Кондратьев Г'.В. Синтез оптимальной обратной связи в задаче АКОР, в сб. "Проблемы управления: Тезисы докладов IX Всесоюзного Совещания", Ташкент, 1989, 11 с.
11. Кондратьев Г.В., Беляев Е.И. Синтез нелинейных дискретных систем управления при неполном наблюдении вектора состояния, статья в сб. "Системы управления, преобразования и отображения информации", Рязань, 1984, с.30-33
12. Кондратьев Г.В. Методы решения задачи оптимальной стабилизации для стационарных гладких конечномерных систем управления, кандидатская диссертация, Н. Новгород, 1998, 76 с.
13. Kondrat'ev V.V., Kondrat'ev G.V., Kondrat'ev M.I. Hamilton mechanics methods into the optimal stabilization problem, Proceedigs of the 6th International Symposium on Automatic Control and Computer Science (SACCS"98),MATRIX ROM Bucharest, Romania, 1998, v.l, pp.16-21
14. Kondrat'ev V.V., Kondrat'ev G.V., Kondrat'ev M.I. Optimal stabilization systems with degenerate function Lyapunov, ibidem, pp.22-23
15. Kondrat'ev V.V., Kondrat'ev G.V., Kondrat'ev M.I. Alternate method of analytical designing of optimal governors for linear systems with quadratic functional, ibidem, pp.24
16. Kondrat'ev G.V. Methods of solving of the optimal stabilization problem for stationary smooth system control, Computer Science Journal of Moldova. Academy of Sciences of Moldova, Institute of Mathematics, Kishinev, 1999. v. 7, part I No. 2, pp. , part II No.3, pp.
17. Кондратьев Г.В., Кондратьева М.И. Задача оптимальной стабилизации для систем с вырожденной функцией Ляпунова, сб. "Системы обработки информации и управления", Н.Новгород, 1998.
18. Кондратьев Г.В., Кондратьева М.И. Метод аналитического конструирования оптимальных регуляторов для систем с квадратичным гамильтонианом, сб. "Системы обработки информации и управления", Н.Новгород, 1998, с. 22-27
19. Кондратьев Г.В. Геометрическая теория синтеза оптимальной обратной связи для стационарных гладких конечномерных систем управления, монография, Н. Новгород, 1998, 125 с.
20. Кондратьев Г.В., Кондратьев В.В. Свойство изолированности лагранжева многообразия функции Беллмана-Ляпунова в задаче оптимальной стабилизации, ДАН, 2000, т.370, ном. 3, с.303-305
с. 17-21
Подписано в печать 17.05.2000. Формат 60х84'/16. Бумага писчая № 1 Печать офсетная. Уч.-изд. л. 2,0. Тираж 100 экз. Заказ 353.
Типография НГТУ. 603600, Н. Новгород, ул. Минина, 24.
Оглавление автор диссертации — доктора физико-математических наук Кондратьев, Геннадий Вячеславович
ВВЕДЕНИЕ б
1. ОБЗОР СОСТОЯНИЯ ВОПРОСА И ПОСТАНОВКА ЗАДАЧИ
1.1. Общие математические подходы к решению задач оптимального управления
1.2. Постановка задачи синтеза оптимальной обратной связи для стационарных гладких конечномерных систем с интегральным функционалом на полубесконечном отрезке времени
1.3. Двойственные методы в задаче синтеза оптимальной обратной связи
1.4. Синергетическая теория управления
1.5. Замечания об управляемости и устойчивости
1.6. Выводы и основные задачи исследования
2. ГЛАДКИЕ ИНФИНИТЕЗИМАЛЬНЫЕ СТРУКТУРЫ КАК АППАРАТ ИССЛЕДОВАНИЯ НЕПРЕРЫВНЫХ СИСТЕМ УПРАВЛЕНИЯ
2.1. Гладкие многообразия, отображения, подмногообразия
2.2. Касательный функтор
2.3. Векторные поля и формы
2.4. Внешние дифференциальные системы
2.5. Классификация отображений в группу и в однородное пространство
2.6. Связности
2.7. Выводы
3. ТЕОРИЯ ГЕОМЕТРИЧЕСКИХ ОБЪЕКТОВ, АССОЦИИРОВАННЫХ С ЗАДАЧЕЙ СИНТЕЗА
3.1. Геометрия фазового пространства
3.1.1. Фазовое пространство, подмногообразия и основные инфинитезимальные структуры
3.1.2. Скобка Пуассона и первые интегралы
3.1.3. Точные решения уравнения Гамильтона-Якоби в задаче синтеза оптимальной обратной связи
3.1.4. Фазовый портрет гамильтоновой системы, ассоциированной с однозначно решаемой задачей оптимальной стабилизации
3.1.5. Качественная оценка чувствительности замкнутой системы оптимального управления по отношению к изменению параметров модели
Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Кондратьев, Геннадий Вячеславович
Актуальность темы
Проблема синтеза оптимальной обратной связи для широкого класса систем является фундаментальной, важной, до конца не решенной проблемой. Сложность решения проблемы связана с тем, что управляющие воздействия, являясь функцией состояния системы, удовлетворяют обычно сложной системе дифференциальных уравнений с нестандартными граничными условиями. Автор предлагает новые концепции и методы разрешения существующих сложностей для стационарных гладких конечномерных систем управления.
Идея обратной связи, четко сформулированная Н.Винером, очертившим понятие кибернетической системы, является одной из наиболее фундаментальных и плодотворных идей современного теоретико-системного взгляда на мир. Смысл петли обратной связи заключается в создании автономной системы, корректирующей свое собственное состояние, исходя из этого же состояния, в соответствии с теми или иными признаками. Обратная связь является фундаментальным свойством, обеспечивающим автономное существование системы в рамках определенного качества. Ввиду разнообразия встречающихся систем, точная теория обратной связи в значительной мере не унифицирована. Более того, даже для отдельных хорошо математически определенных классов систем, где такая теория могла бы иметь место, она всё ещё отсутствует. Таким широким классом, описывающим многие физико-технические объекты, является класс стационарных гладких конечномерных систем. До некоторых пор почти единственными применявшимися на практике методами синтеза оптимальной обратной связи для гладких нелинейных объектов были: метод линеаризации системы в окрестности положения равновесия и метод синтеза оптимальной обратной связи заданной структуры. Представляет интерес создание более современных методов решения задачи синтеза, в том числе получение точных аналитических решений для некоторых типов систем. В данной работе выполнены исследования по применению инвариантных геометрических методов для решения проблемы синтеза оптимальных стационарных гладких систем. Развитый здесь геометрический подход является конструктивным и перспективным для синтеза оптимальных систем широкого класса. Цель исследования на основе хорошо развитого, ранее не применявшегося в данной области, аппарата гамильтоновой механики, дифференциально-алгебраической геометрии, групп Ли преобразований разработка теории геометрических объектов, связанных с задачей оптимальной стабилизации; разработка математического аппарата, непосредственно используемого при решении задачи синтеза; создание новых эффективных численно-аналитических методов синтеза оптимальной и субоптимальной обратной связи; объединение всех предложенных методов в общую концепцию геометрического анализа и формализация вычислительных средств, что позволит по-новому и более глубоко подойти к решению известных проблем; выявление соответствия: (тип системы) -н- (наиболее адекватные способы решения).
Методы исследования: методы гамильтоновой механики; дифференциально-алгебраическая геометрия; алгебра; группы Ли преобразований; теория инвариантов геометрических объектов.
Новые научные результаты: развита геометрическая теория синтеза оптимальной обратной связи для стационарных гладких конечномерных систем управления; разработан инструментарий для решения задачи синтеза оптимальной стабилизации; представлены новые методы синтеза оптимальной обратной связи, допускающие эффективную численно-аналитическую реализацию (метод бихарактеристик для уравнения Гамильтона-Якоби восстановления лагранжева многообразия с заданными начальными условиями; метод первых интегралов и эволюционных симметрий для вычисления сепаратрис гамильтоновой системы; метод разложения аналитической функции Беллмана-Ляпунова в ряд Тейлора в окрестности начала координат; метод деформации алгебраического решения уравнения Гамильтона-Якоби в голономное; метод дифференцирования вдоль гамиль-тонова векторного поля; описаны системы с инвариантным слоением функции Беллмана-Ляпунова; описана алгебраическая структура первых интегралов гамильтоновой системы в задаче оптимальной стабилизации; разработаны алгоритмы синтеза оптимальной и субоптимальной обратной связи для гладких нелинейных систем; предложен ряд приёмов аналитического интегрирования уравнения Гамильтона-Якоби); представлена классификация систем оптимального управления по типам, для каждого из которых предложены наиболее адекватные методы решения задачи синтеза.
Практическая ценность полученных результатов предложен гибкий, широкого спектра действия, целостный аппарат решения задачи АКОР; разработаны методы аналитического конструирования оптимальных и субоптимальных регуляторов для нелинейных конечномерных систем; для систем с квадратичным гамильтонианом предложен комплекс методов решения задачи синтеза (метод первых интегралов, метод дифференцирования вдоль гамильтонова векторного поля, метод дифференциальных продолжений уравнения Гамильтона-Якоби); для систем с гамильтонианом, близким к квадратичному, предложен метод малого параметра восстановления потенциальной функции; для систем с инвариантным слоением функции Беллмана-Ляпунова предложен метод отыскания точного решения задачи оптимальной стабилизации; предложен метод решения задачи оптимальной стабилизации для систем с вырожденной функцией Беллмана-Ляпунова; разработан универсальный численно-аналитический алгоритм синтеза оптимальной обратной связи для систем с невырожденной потенциальной функцией (метод бихарактеристик); предложен ряд аналитических методов интегрирования уравнений Беллмана и Гамильтона-Якоби (метод отыскания инволю-тивной системы дифференцирований; метод первых интегралов и эволюционных симметрий; метод приведения к вполне интегрируемой системе внешних дифференциальных уравнений; метод продолжения функции Беллмана-Ляпунова на пространство большей размерности); формализован метод Колесникова А.А. синтеза оптимальной обратной связи для систем с функционалом специального вида.
Результаты, выносимые на защиту: теория геометрических объектов, связанных с задачей оптимальной стабилизации; аппарат исследования систем оптимального управления и синтеза оптимальной обратной связи; методы синтеза оптимальной обратной связи для предложенных в работе типов систем.
Апробация работы и публикации По материалам диссертации были сделаны сообщения на V Всесоюзном Совещании по управлению многосвязными системами (г.Тбилиси, 1984 г.); на V Всесоюзной конференции по оптимальному управлению в механических системах (г.Казань, 1985 г.); на VII Всесоюзном Совещании-семинаре школы молодых ученых и специалистов по современным проблемам автоматического управления (г.Минск, 1987 г.); на X Всесоюзном Совещании-семинаре школы молодых ученых и специалистов по современным проблемам автоматического управления (г.Омск, 1989г.); на IX научной конференции молодых ученых и специалистов Волго-Вятского региона (г.Горький, 1989 г.); на IX Всесоюзном Совещании по проблемам управления (г.Ташкент, 1989 г.); на VI Международном Симпозиуме по автоматическому управлению и информатике SACCS'98 (Румыния, г.Яссы, 1998 г.). Основное содержание диссертации опубликовано в работах [1-20].
Содержание работы В главе 1 дается обзор состояния проблемы оптимального управления конечномерными системами и ставится задача оптимальной стабилизации для стационарных гладких конечномерных систем.
В главе 2 приводятся сведения из теории гладких многобразий, необходимые для проводимых в работе описаний и вычислений (тензорные расслоения, пучки векторных полей и форм, внешние дифференциальные системы, связности).
В главе 3 излагаются теория и приложения геометрии фазового пространства (анализируется алгебраическая структура первых интегралов и сепаратрис гамильтоновой системы, на основании чего формулируется способ вычисления лагранжева многообразия потенциальной функции; рассматривается метод первых интегралов и эволюционных симметрий; описывается метод бихарактеристик для восстановления лагранжева многообразия потенциальной функции; показывается возможность разложения аналитической функции Беллмана-Ляпунова в ряд Тейлора и эффективного вычисления коэффициентов ряда в окрестности особой точки; рассматривается внешняя дифференциальная система, связанная с задачей оптимальной стабилизации; приводятся алгоритмы синтеза оптимального и субоптимального управления); далее излагается концепция поля экстремалей и метод Колесникова А.А. синтеза оптимальной обратной связи, а также способы вычисления дифференциальных инвариантов потенциальной функции в некоторых частных случаях (вычисляются дифференциальные инварианты функции Беллмана-Ляпунова линейно-квадратичной задачи; дается определение невырожденной потенциальной функции, как эквидистантной функции евклидова пространства; рассматривается способ получения дифференциальных инвариантов с помощью подходящего изоморфизма дифференциальных алгебр).
В главе 4 приводятся различные типы систем оптимального управления, классифицированные по определенным признакам (классы систем с квадратичным гамильтонианом, с гамильтонианом, близким к квадратичному, с инвариантным слоением функции Беллмана-Ляпунова, гладких систем общего вида с невырожденой функцией Беллмана-Ляпунова, с аналитической функцией Беллмана-Ляпунова, с вырожденной потенциальной функцией, с известными (или легко выделяемыми) первыми интегралами или эволюционными симметриями, с функционалом Колесникова).
В главе 5 рассматриваются некоторые обобщения геометрического подхода к задаче синтеза на случай бесконечномерных пространств состояния и управления.
Изложение теоретического материала сопровождается примерами конструирования систем оптимального управления.
Заключение диссертация на тему "Геометрический подход к решению задачи оптимального синтеза стационарных гладких систем управления"
ОБЩИЕ ВЫВОДЫ
Основное внимание в работе было уделено точному решению задачи оптимальной стабилизации и исследованию инвариантных свойств потенциальной функции. На основе этих свойств был разработан ряд методов восстановления функции Беллмана-Ляпунова и, следовательно, закона оптимальной обратной связи. Все методы являются общими, применимыми к произвольным гладким системам управления и доведены до уровня практического использования. В работе: представлена теория геометрических объектов, связанных с задачей оптимальной стабилизации (теория фазового пространства, поля экстремалей в задаче на безусловный экстремум, совместимый с уравнениями связей, дифференциальных инвариантов функции Беллмана-Ляпунова); разработан определенный инструментарий исследования систем оптимального управления и синтеза оптимальной обратной связи; описаны инвариантные свойства функции Беллмана-Ляпунова, используемые для отыскания точных решений задачи оптимальной стабилизации: топологические (функция Беллмана-Ляпунова является почти изолированным корнем уравнения Гамильтона-Якоби в пространстве всех решений данного уравнения, определенных в окрестности начала координат, позволяющее эффективно восстанавливать эту функцию с помощью достаточного числа симметрий уравнения Гамильтона-Якоби; лагранжево многообразие функции Беллмана-Ляпунова представляет сепаратрису устойчивых точек гамильтоновой системы, ассоциированной с задачей оптимальной стабилизации); алгебро-геометрические (идеал n-мерного лагранжева многообразия функции Беллмана-Ляпунова является свободнопорожденным ранга п, инвариантным относительно дифференцирования вдоль гамильтонова векторного поля, ассоциированного с задачей оптимальной стабилизации, и содержащим некоторые отмеченные элементы алгебры гладких функций на фазовом пространстве; для систем с квадратичным гамильтонианом образующие идеала лагранжева многообразия функции Беллмана-Ляпунова являются линейными однородными определенного вида, что позволяет их эффективно вычислять; для систем с инвариантным слоением функции Беллмана-Ляпунова и систем с вырожденной функцией Беллмана-Ляпунова получены последовательности внешних дифференциальных форм, содержащиеся в дифференциальном идеале лагранжева многообразия и позволяющие эффективно восстанавливать его); аналитические (имеется эффективный алгоритм вычисления коэффициентов разложения аналитической функции Беллмана-Ляпунова в ряд Тейлора в начале координат пространства состояний; график градиента функции Беллмана-Ляпунова однозначно восстанавливается интегрированием гамильтоновой системы с подходящими начальными условиями); сформулированы прикладные методы синтеза оптимальной обратной связи, такие как метод бихарактеристик восстановления лагранжева многообразия функции Беллмана-Ляпунова, метод первых интегралов и обобщенных симметрий, метод дифференцирования вдоль гамильтонова векторного поля, метод деформации алгебраического решения уравнения Гамильтона-Якоби в голономное на полубесконечном отрезке, алгебраический метод синтеза субоптимального управления заданной структуры, метод приведения уравнения Гамильтона-Якоби к вполне интегрируемой системе внешних дифференциальных уравнений, формализм поля экстремалей в задаче на безусловный экстремум, совместимый с уравнениями связей, метод дифференциальных инвариантов потенциальной функции; получена серия явных первых интегралов для систем с квадратичным гамильтонианом, определяющая уравнения лагранжева многообразия функции Беллмана-Ляпунова; приведена классификация систем оптимального управления по типам, для каждого из которых предложены адекватные методы решения задачи синтеза (системы с квадратичным гамильтонианом, решаемые методом дифференцирования вдоль га-мильтонова векторного поля; системы с гамильтонианом, близким к квадратичному, с использованием метода малого параметра; системы с инвариантным слоением функции Беллмана-Ляпунова и вырожденной функцией Беллмана-Ляпунова, решаемые методом конструирования внешних дифференциальных уравнений, описывающих лагранжево многообразие потенциальной функции; гладкие системы общего вида с невырожденной функцией Беллмана-Ляпунова, рассчитываемые методом бихарактеристик для уравнения Гамильтона-Якоби; системы с аналитической потенциальной функцией, допускающей эффективное разложение в ряд Тейлора; системы с легко выделяемыми первыми интегралами или эволюционными симметриями; системы с функционалом Колесникова, решаемые методом отыскания достаточного числа первых интегралов уравнений Эйлера-Лагранжа в задаче на безусловный экстремум); выделено свойство гиперболичности гамильтоновой системы, ассоциированной с задачей синтеза оптимального регулятора; предложен регулярный алгоритм синтеза для классической задачи оптимальной стабилизации с ассоциированным гиперболическим гамильтонианом.
ЗАКЛЮЧЕНИЕ
Работа относится к классу исследований по применению инвариантных геометрических методов в теории оптимального управления.
Полученные результаты, как индивидуально, так и в сочетании, могут быть полезны при решении задачи оптимальной стабилизации движения.
Геометрический подход, проясняя изучаемую ситуацию, является конструктивным и перспективен для дальнейшего использования в гладких задачах оптимального управления (описание полного набора дифференциальных инвариантов потенциальной функции; классификация систем оптимального управления по топологическому типу фазового портрета гамильтоновой системы, ассоциированной с задачей оптимальной стабилизации; конструкция симплектических связностей, инвариантных относительно гамильтонова векторного поля; эффективные методы вычисления сепаратрис гамильтоновой системы и конструирования эволюционных симметрий уравнения Гамильтона-Якоби и т.д.).
Библиография Кондратьев, Геннадий Вячеславович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Кондратьев Г.В. Аппарат внешних форм в исследовании нелинейных систем, сб. "Современные проблемы автоматического управления: Тезисы докладов VII Всесоюзного Совещания-семинара школы молодых ученых и специалистов", Минск, 1987, с.19
2. Кондратьев Г.В. Теорема Рашевского-Чжоу как критерий слабой управляемости конечномерных систем, линейных по управлению, сб. "Математическое моделирование в задачах механики и управления", Волгоград, 1990, с.32-34
3. Кондратьев Г.В. Достаточное условие управляемости нелинейных систем, сб. "Системы управления, преобразования и отображения информации", Рязань, 1984, с.42-45
4. Кондратьев Г.В. Управляемость нелинейных систем, в сб. "Управление многосвязными системами: Тезисы докладов V Всесоюзного Совещания", Тбилиси, 1984, с.76-77
5. Кондратьев Г.В. Построение областей достижимости конечномерных динамических систем, сб. "Оптимальное управление в механических системах: Тезисы докладов V Всесоюзной конференции", Казань, 1985, с.73
6. Кондратьев Г.В., Мисевич П.В. Построение информативной области для нелинейных систем при помощи уравнения Фокера-Планка-Колмогорова, "Тезисы докладов V Всесоюзной конференции по проблемам управления развитием систем (КУРС-5)", ноябрь 1988, с.34
7. Кондратьев Г.В. Класс систем с ивариантным слоением функции Беллмана-Ляпунова, сб. "Системы обработки информации и управления", Н.Новгород, 1995, с.41-44
8. Кондратьев Г.В., Жукова М.И. Один метод синтеза оптимальной обратной связи для нелинейных систем, сб. "Математическое моделирование в задачах механики и управления", Волгоград, 1990, с.59-64
9. Кондратьев Г.В., Жукова М.И. Синтез оптимальной обратной связи в реальном времени, в сб. "IX научная конференция молодых ученых и специалистов Волго-Вятского региона: Тезисы докладов", Горький, 1989, с.10
10. Кондратьев Г.В. Синтез оптимальной обратной связи в задаче АКОР, в сб. "Проблемы управления: Тезисы докладов IX Всесоюзного Совещания", Ташкент, 1989, с.11
11. Кондратьев Г.В., Беляев Е.И. Синтез нелинейных дискретных систем управления при неполном наблюдении вектора состояния, статья в сб. "Системы управления, преобразования и отображения информации", Рязань, 1984, с.30-33
12. Кондратьев Г.В. Методы решения задачи оптимальной стабилизации для стационарных гладких конечномерных систем управления, кандидатская диссертация, Н. Новгород, 1998, 76 с.
13. Kondrat'ev V.V., Kondrat'ev G.V., Kondrat'ev M.I. Optimal stabilization systems with degenerate function Lyapunov, ibidem, pp.22-23
14. Kondrat'ev V.V., Kondrat'ev G.V., Kondrat'ev M.I. Alternate method of analytical designing of optimal governors for linear systems with quadratic functional, ibidem, pp.24
15. Кондратьев Г.В., Кондратьева М.И. Задача оптимальной стабилизации для систем с вырожденной функцией Ляпунова, сб. "Системы обработки информации и управления", Н.Новгород, 1998, с.16-18
16. Кондратьев Г.В., Кондратьева М.И. Метод аналитического конструирования оптимальных регуляторов для систем с квадратичным гамильтонианом, сб. "Системы обработки информации и управления", Н.Новгород, 1998, с.19-23
17. Кондратьев Г.В. Геометрическая теория синтеза оптимальной обратной связи для стационарных гладких конечномерных систем управления, монография, Н. Новгород, 1998, 125 с.
18. Кондратьев Г.В., Кондратьев В.В. Свойство изолированности лагранжева многообразия функции Беллмана-Ляпунова в задаче оптимальной стабилизации, ДАН, 2000, т.370, ном. 3, с.303-305
19. Винер Н. Кибернетика, М.: Наука, 1983, 340 с.
20. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами, М.: Мир, 1978, 316 с.
21. Янг Л.Ч. Лекции по вариационному исчислению и теории оптимального управления, М.: Мир, 1974, 488 с.
22. Сейдж Э.П., Уайт Ч.С. Оптимальное управление системами, М.: Радио и связь, 1982, 392 с.
23. Спиди К.,Браун Р., Гудвин Д. Теория управления, М.: Мир, 1973, 247 с.
24. Петров Ю.П. Вариационные методы теории оптимального управления, Л.: Энергия, 1977, 280 с.
25. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление, М.: Наука, 1969, 424 с.
26. Гельфанд И.М., Фомин С.В. Вариационное исчисление, М.: Издательство физико-математической литературы, 1961, 228 с.
27. Буслаев B.C. Вариационное исчисление, Издательство Ленинградского университета, 1980, 287 с.
28. Коша А. Вариационное исчисление, М.: Высшая школа, 1983, 279 с.
29. Болтянский В.Г. Математические методы оптимального управления, М.: Наука, 1966, 307 с.
30. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов, М.: Физматгиз, 1961, 384 с.
31. Беллман Р. Динамическое программирование, М.: Иностранная литература, 1960, 400 с.
32. Чаки Ф. Современная теория управления, М.: Мир, 1975, 424 с.
33. Красовский Н.Н. О выборе параметров оптимальных устойчивых систем, М.: Изд-во АН СССР, 1960, 10 с.
34. Зубов В.И. Лекции по теории управления, М.: Наука, 1975, 495 с.
35. Красовский А.А. Системы автоматического управления полётом и их аналитическое конструирование, М.: Наука, 1973, 558 с.
36. Крутько П.Д. Функции Ляпунова в обратных задачах динамики управляемых систем, Изв. АН СССР, техническая кибернетика, 1983, N 4, 168-177 с.
37. Летов A.M. Математическая теория процессов управления, М.: Наука, 1981, 255 с.
38. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем, М.: Мир, 1971, 398 с.
39. Мерриэм К. Теория оптимизации и расчет систем управления с обратной связью, М.: Мир, 1967, 548 с.
40. Кунцевич В.М., Лычак М.М. Синтез систем автоматического управления с помощью функций Ляпунова, М.: Наука, 1977,400 с.
41. Ли Э.Б., Маркус Л. Основы теории оптимального управления, М.: Наука, 1972, 574 с.
42. Красовский Н.Н. Теория управления движением, М.: Наука, 1968, 475 с.
43. Квакернаак X., Сиван Р. Линейные оптимальные системы управления, М.: Мир, 1977, 650 с.
44. Антомонов Ю.Г. Синтез оптимальных систем, Киев.: Нау-кова думка, 1972, 320 с.
45. Гёльднер К., Кубик С. Нелинейные системы управления, М.: Мир, 1987, 365 с.
46. Колесников А.А. Аналитическое конструирование оптимальных нелинейных систем, Таганрог, 1984, 72 с.
47. Колесников А.А. Последовательная оптимизация нелинейных агрегированных систем управления, М.: Энергоатомиздат, 1987, 160 с.
48. Лобри К. Динамические полисистемы и теория управления, статья в сб. "Математические методы в теории систем", М.: Мир, 1979, 134-173 с.
49. Брокетт Р.У. Алгебры Ли и группы Ли в теории управления, статья в сб. "Математические методы в теории систем", М.: Мир, 1979, 174-220 с.
50. Беляев Е.И. Численно-аналитический метод синтеза оптимальных и субоптимальных алгоритмов управления нелинейными объектами, диссертация, Горький, 1986, 154 с.
51. Рей У. Методы управления технологическими процессами, М.: Мир, 1983, 368 с.
52. Арнольд В.И. Математические методы классической механики, М.: Наука, 1974, 431 с.
53. Дубровин В.А., Новиков С.П., Фоменко А.Т. Современная геометрия, М.: Наука, 1986, 759 с.
54. Рашевский П.К. Геометрическая теория уравнений с частными производными, М.: Физматгиз, 1947, 354 с.
55. Лич Дж.У. Классическая механика, М.: Иностранная литература, 1961, 172 с.
56. Ланцош К. Вариационные принципы механики, М.: Мир, 1965, 408 с.
57. Гантмахер Ф.Р. Лекции по аналитической механике, М.: Наука, 1966, 300 с.
58. Добронравов В.В. Основы аналитической механики, М.: Высшая школа, 1976, 263 с.
59. Арнольд В.И., Козлов В.В., Нейштадт А.И. Математические аспекты классической и небесной механики, Итоги науки и техники, Динамические системы, том 3, 1985, 303 с.
60. Переломов A.M. Интегрируемые системы классической механики и алгебры Ли, М.: Наука, 1990, 238 с.
61. Кириллов А.А. Элементы теории представлений, М.: Наука, 1978, 343 с.
62. Громов М. Дифференциальные соотношения с частными производными, М.: Мир, 1990, 536 с.
63. Олвер П. Приложения групп Ли к дифференциальным уравнениям, М.: Мир, 1989, 637 с.
64. Ибрагимов Н.Х. Группы преобразований в математической физике, М.: Наука, 1983, 280 с.
65. Лаптев Г.Ф. Основные инфинитезимальные структуры высших порядков на гладком многообразии, Труды геометрического семинара, том 1, 1966, 139-190 с.
66. Евтушик Л.Е., Лумисте Ю.Г., Остиану Н.М., Широков А.П. Дифференциально-геометрические структуры на многообразиях, Итоги науки и техники, Проблемы геометрии, том 9, 1979, 246 с.
67. Колесников А.А., Гельфгат А.Г. Проектирование многокритермальных систем управления промышленными объектами, М.: Энергоатомиздат, 1993, 304 с.
68. Колесников А.А. Синергетическая теория управления, М.: Энергоатомиздат, 1994, 343 с.
69. Синюков Н.С. Геодезические отображения римановых пространств, М.: Наука, 1979, 255 с.
70. Grasse К.A. Structure of the boundary of the attainable set in sertain nonlinear systems, "Math. Syst. Theory", 18, 1, 1985, 5777 c.
71. Гороховик С.Я. Достаточные условия локальной управляемости нелинейных систем управления, в сб. "Управление многосвязными системами: Тезисы докладов V Всесоюзного Совещания" , Тбилиси, 1984, 74-75 с.
72. Левит М.Ю. О некоторых вопросах локальной и глобальной управляемости нелинейных систем, в сб. "Управление многосвязными системами: Тезисы докладов V Всесоюзного Совещания", Тбилиси, 1984, 72-73 с.
73. Furi М., Nistri P., Pera М.Р., Zezza P.L. Topological methods for the global controllability of nonlinear systems, J. Optim. Theory and Appl.", 45, 2, 1985, 231-256 c.
74. Колесников А.А. От кибернетики к синергетике, статья в журнале "Научная мысль Кавказа", 1, 1996, 22-29 с.
75. Колесников А.А. Синергетическая концепция энергосберегающего управления природно-техническими системами, статья в журнале "Научная мысль Кавказа", 3, 1996, 17-29 с.
76. Колесников А.А., Вавилов О.Т. Единая концепция задач оптимального управления, статья в сб. РАЕН "Синтез алгоритмов сложных систем", вып. 9, М, 1977, 18-24 с.
77. Красовский А.А. Проблемы физической теории управления, статья в журнале "Автоматика и телемеханика", 11, 1990, 3-28 с.
78. Бредон Г. Теория пучков, М.: Наука, 1988, 312 с.
79. Уэллс Р. Дифференциальное исчисление на комплексных многообразиях, М: Мир, 1976, 284 стр.
80. Кобаяси Ш., Номидзу К. Основы дифференциальной геометрии, том 1, М.: Наука, 1981, 344 с.
81. Кобаяси Ш., Номидзу К. Основы дифференциальной геометрии, том 2, М.: Наука, 1981, 414 с.
82. Зуланке Р., Винтген П. Дифференциальная геометрия и расслоения, М.: Мир, 1975, 348 с.
83. Уорнер Ф. Основы теории гладких многообразий и групп Ли, М.: Мир, 1987, 302 с.
84. Ленг С. Введение в теорию дифференцируемых многообразий, М.: Мир, 1967, 203 с.
85. Бишоп Р., Криттенден Р. Геометрия многообразий, М.: Мир, 1967, 335 с.
86. Стернберг С. Лекции по дифференциальной геометрии, М.: Мир, 1970, 412 с.
87. Нарасимхан Р. Анализ на действительных и комплексных многообразиях, М.: Мир, 1971, 232 с.
88. Спивак М. Математический анализ на многообразиях, М.: Мир, 1968, 164 с.
89. Шутц Б. Геометрические методы математической физики, М.: Мир, 1984, 303 с.
90. Хирш М. Дифференциальная топология, М.: Мир, 1979, 280 с.
91. Шевалле К. Теория групп Ли, М.: Иностранная литература, 1948, 315 с.
92. Шевалле К. Алгебраические группы, М.: Иностранная литература, 1948, 207 с.
93. Васильев A.M. Теория дифференциально-геометрических структур, М.: МГУ, 1987, 190 с.
94. Картан Э. Внешние дифференциальные системы и их геометрические приложения, М.: МГУ, 1962, 237 с.
95. Фиников С.П. Метод внешних форм Картана, М.: ОГИЗ, 1948, 432 с.
96. Гриффите Ф. Внешние дифференциальные системы и вариационное исчисление, М.: Мир, 1986, 360 с.
97. Громол Д., Клингенберг В., Мейер В. Риманова геометрия в целом, М.: Мир, 1971, 343 с.
98. Чжэнь Ш. Комплексные многообразия, М.: Иностранная литература, 1961, 240 с.
99. Бурбаки Н. Гомологическая алгебра, М.: Наука, 1987, 182 с.
100. Годбийон К. Дифференциальная геометрия и аналитическая механика, М.: Мир, 1973, 188 с.
101. Abraham, Marsden, Ratiu Tensor analysis on Banach manifolds, Springer-Verlag, 879 c.
102. Perko L. Ordinary differential equations and dynamical systems, Springer-Verlag, 570 c.
103. Katok A., Haselblatt B. Modern theory of dynamical systems, Cambridge, 1072 c.
104. Арнольд В.И. Дополнительные главы теории обыкновенных дифференциальных уравнений, М.: Наука, 1978, 356 с.1. ЛЙО?£КАim-b-oi
-
Похожие работы
- Задача оптимального управления для билинейных динамических систем с терминальным квадратичным функционалом
- Метод сетевого оператора для решения задачи многокритериального структурно-параметрического синтеза системы управления
- Теория автоматизации проектирования объектов и процессов на основе методов конструктивного геометрического моделирования
- Синтез законов квазиоптимального по быстродействию управления объектами высокого порядка
- Блочный синтез инвариантных систем слежения
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность