Оптимальное управление логико-динамическими системами

Бортаковский, Александр Сергеевич

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Оптимальное управление логико-динамическими системами

доктора физико-математических наук: Бортаковский, Александр Сергеевич
город: Москва
год: 2010
специальность ВАК РФ: 05.13.01
цена: 450 рублей

Диссертация по информатике, вычислительной технике и управлению на тему «Оптимальное управление логико-динамическими системами»

Автореферат диссертации по теме "Оптимальное управление логико-динамическими системами"

004683175

На правах рукописи

Бортаковский Александр Сергеевич

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛОГИКО-ДИНАМИЧЕСКИМИ СИСТЕМАМИ

05.13.01 - Системный анализ, управление и обработка информации (авиационная и ракетно-космическая техника)

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

Москва-2010

004603175

Работа выполнена на кафедре математической кибернетики Московского авиационного института (государственного технического университета).

Официальные оппоненты: доктор физико-математических наук, профессор

Арутюнов Арам Владимирович

Защита состоится 11 июня 2010 г. в 10 ч. 00 мин. на заседании Диссертационного совета Д 212.125.04 при Московском авиационном институте (государственном техническом университете) по адресу: 125993, г. Москва, А-80, ГСП-3, Волоколамское шоссе, д.4.

С диссертацией можно ознакомиться в библиотеке МАИ.

Отзыв на автореферат (в 2-х экземплярах), заверенный гербовой печатью организации, просьба направлять по указанному адресу.

Автореферат разослан *$J) " О V 2010 г.

доктор физико-математических наук, профессор Грумондз Валерий Тихонович

доктор физико-математических наук, профессор Давыдов Алексей Александрович

Ведущая организация: Институт программных систем

им. А.К.Айламазяна РАН

Ученый секретарь Диссертационного совета Д 212.125. кандидат физико-математических наук, доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Диссертационная работа посвящена разработке основных положений теории оптимального управления логико-динамическими системами и методов ее применения в новых актуальных приложениях, в том числе задачах авиационной и ракетно-космической техники.

Актуальность темы. Одним из важных направлений современного развития теории и практики оптимального управления является исследование гибридных систем, в которых непрерывно изменяющиеся компоненты, как правило, отражают физические законы, технологические или технические принципы, а дискретно меняющиеся моделируют работу устройств управления, например, цифровых автоматов с памятью. Разные классы гибридных систем представлены в работах Емельянова C.B., Уткина В.И. (системы с переменной структурой); Васильева С.Н., Жука К.Д., Тимченко A.A., Федосова Е.А., Федунова Б.Е. (логико-динамические системы); Куржанского А.Б., Миллера Б.М., Рубинови-ча Е.Я., Сесекина А.Н., Цыпютаа Я.З., LiZ., Silva G.N., Soh Y., Vinter R.V., Wen С. (импульсные системы); Аграчева A.A., Гурмана В.И., СавкинаА.В., Семенова В.В., Antsaklis Р.J., Brockctt R.W., Evans RJ, Hedlund S., Liberzon D., Rantzer A., Rischel H. (переключательные системы).

К гибридным системам относится разработанная математическая модель логико-динамических систем (ЛДС). Динамическая часть ЛДС, задающая движение объекта управления, описывается дифференциальными уравнениями, а логическая (автоматная) часть, моделирующая работу устройства управления, - рекуррентными включениями или уравнениями. Такая модель применима для описания широкого класса многорежимных систем автоматического управления техническими комплексами, технологическими и экономическими процессами, а также бортовых оперативно-советующих систем управления движением летательных аппаратов.

В отличие от непрерывно-дискретных систем, изменение состояний дискретной части которых происходит в заранее заданные (тактовые) моменты времени, переключения логической (автоматной) части ЛДС могут быть в произвольные моменты времени. Более того, выбор тактовых моментов считается ресурсом управления и подлежит оптимизации. Каждое переключение автоматной части "оценивается", и его "стоимость" учитывается в критерии качества ЛДС. Это, как правило, оказывает регуляризирующее влияние на оптимальные процессы, исключая из их числа процессы с многочисленными переключениями. Многае практические задачи оптимального управления приводят к релейным управлениям с конечным или бесконечным количеством переключений (например, задачи управления космическими и летательными аппаратами, задачи с эффектом Фуллера, задачи со скользящими режимами и др.). Эти задачи лучше рассматривать в классе ЛДС, учитывая при помощи штрафных слагаемых, что любое переключение релейного управления требует некоторых затрат. При этом задача регуляризируется, и ее решение становится более практичным. Например, в задаче активного гашения колебаний искусственного спутника Земли последовательность процессов, минимизирующая энергозатраты, состоит из коротких включений двигателя в моменты достижения максимальной угловой скорости. В пределе получается бесконечная последовательность мгновенных включений двигателя. Такое решение практически не реализуемо. Рассмотрение задачи в классе ЛДС предполагает, что каждое включение реактивного двигателя от его запуска до достижения номинальной тяги, а также и выключение двигателя, представляет собой немгновенный переходный процесс, сопровождаемый расходом топлива. Добавляя в критерий качества соответствующие штрафные слагаемые, получаем задачу, в которой определяется оптимальное (конечное) количество запусков двигателя, а процессы, требующие бесконечного числа включений, отбрасываются как неоптимальные.

Большой интерес представляет исследование минимизирующих последовательностей в классе ЛДС, приводящих к новым, ранее не встречавшимся в тео-

рии оптимального управления режимам с мгновенными многократными переключениями автоматной части (происходящими при фиксированном состоянии динамической части системы). Важным представляется тот факт, что эти новые режимы не являются редкими исключениями, напротив, они появляются в аналогах хорошо известных задач, например, в задаче управления линейными ЛДС с квадратичным критерием качества. Таким образом, исследования проблем оптимального управления ЛДС представляют теоретический интерес, поскольку рассматриваемые задачи отличаются от классических задач оптимального управления, а методы их решения не разработаны. Необходимость исследований определяется современными задачами проектирования сложных авиационных и ракетно-космических систем.

Цель работы и задачи исследования. Целью диссертационной работы является получение необходимых и достаточных условий оптимальности управления для нового класса логико-динамических систем и разработка методик их применения. В соответствии с целью работы были поставлены и решены следующие задачи:

1) вывод необходимых условий оптимальности ЛДС и анализ их применимости для синтеза оптимального программного управления;

2) вывод достаточных условий оптимальности ЛДС и разработка методики их применения для синтеза оптимального управления с обратной связью;

3) изучение нового типа минимизирующих последовательностей, приводящих к процессам с мгновенными многократными переключениями автоматной части;

4) вывод достаточных условий субоптимальности управления пучками траекторий ЛДС на основе принципа разделения.

Общие методы исследования. Для решения поставленных задач использовались математическая теория управления, вариационное исчисление, теория дифференциальных уравнений, системный анализ, оптимизация, численные методы. Вывод необходимых условий оптимальности ЛДС базируется на принци-

пе максимума Понтрягина. Техника вычисления вариаций функционалов при варьировании траекторий автоматной части аналогична применяемой Федорен-ко Р.П. для непрерывных систем. Поиск приближенного решения производился методом Черноусько Ф.Л. Для получения достаточных условий оптимальности управления ЛДС использовался подход, развитый в работах Кротова В.Ф., Гурмана В.И. Построение управления ЛДС в условиях параметрической неопределенности опирается на принцип разделения.

Научная новизна. Полученные в диссертационной работе основные результаты являются новыми, а именно: доказаны необходимые и достаточные условия оптимальности для нового класса ЛДС, выведены достаточные условия субоптимальности управления пучками траекторий ЛДС; открыт новый тип минимизирующих последовательностей, приводящих к процессам с мгновенными многократными переключениями автоматной части; доказаны условия оптимальности таких процессов.

Практическая значимость работы состоит в том, что ее теоретические результаты могут служить основой для разработки численных методов и программно-алгоритмического обеспечения решения прикладных задач синтеза гибридных систем автоматического управления техническими комплексами, в том числе, в областях авиационной и ракетно-космической техники, робототехнике и экономике.

Достоверность утверждений, представленных в диссертационной работе, подтверждена строгими математическими доказательствами. В частных случаях полученные условия оптимальности совпадают с известными классическими результатами. Диссертация содержит большое количество аналитических примеров, подтверждающих представленные теоретические результаты, а также численное решение задачи гашения колебаний спутника, полностью отвечающее физическим представлениям.

Апробация результатов исследования. Результаты диссертационной работы докладывались на 17 Международных конгрессах, конференциях, науч-

ных школах и семинарах, обсуждались на научных семинарах в Институте проблем механики РАН, Институте проблем управления РАН, Российском университете дружбы народов, Московском авиационном институте. Исследования были поддержаны РФФИ (гранты №№ 96-01-01830-а, 02-01-00099-а, 05-01-00458-а, 06-08-00882-а, 08-01 -00157-а, 09-08-00202-а) и Министерством образования и науки РФ: научная программа "Университеты России" (фанты №№015.04.01.64, 015.04.01.054, УР.04.01.021, УР.04.01.016, УР.04.01.128); аналитическая ведомственная целевая npoipaMMa «Развитие научного потенциала высшей школы» 2009 - 2010 (проект 2.1.1/2904).

Публикации. Основные результаты опубликованы в статьях [1-9] в журналах, входящих в перечень ведущих рецензируемых изданий ВАК РФ. Материалы диссертации вошли в монографию и учебные пособия. Всего по теме диссертации опубликовано 38 печатных работ.

Личный вклад. Все основные результаты диссертации получены автором самостоятельно. Программирование и приближенные вычисления для задачи активной стабилизации спутника выполнены Пегачковой Е.А.

Структура и объем работы. Диссертация состоит из введения, трех разделов основной части, заключения и списка использованных источников (158 наименований). Работа изложена на 168 страницах, содержит 39 рисунков.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении дается обзор известных методов и задач управления гибридными системами, а также работ по управлению динамическими системами в условиях неопределенности, указывается область проведенных исследований, обосновывается их научная новизна и актуальность, сформулированы цели и задачи диссертационной работы, представлены положения, выносимые на защиту, и описана структура диссертации.

В первой главе выводятся необходимые условия оптимальности ЛДС, динамическая часть которой описывается дифференциальными уравнениями, а логическая (автоматная) - рекуррентным включением:

т=ж,х«),у(0МФ, ал)

у(()е¥(1,х(0,у((~0)), (1-2)

где х, у - векторы состояния динамической и логической частей ЛДС,

ле^ГсК", у&УаЖт\ и - вектор управления, ие£/с®р; t - время, - промежуток времени функционирования системы. Для краткости изложения теоретико-функциональные требования к встречающимся функциям, а также некоторые дополнительные предположения и ограничения в автореферате опускаются.

Множество У^,х,у) задает совокупность тех состояний логической части системы, в которые возможен переход из состояния у при заданном в момент времени t состоянии х динамической части ЛДС. Предполагаем, что для любой абсолютно непрерывной функции _*(•) и каждого уеУ отображение (-> У((,х(1),у) непрерывно справа, т.е.

Г(( + 0,х« + 0),у) = Г((,х(0,У), (еТ. (1.3)

Начальное состояние ЛДС задано начальными условиями

*('о)=*о; (1-4)

Множество допустимых процессов ©(¿о.хо.Уо) составляют тройки функций (*(•), ХО^ОЖ гДе «(О - измеримая ограниченная функция и:Т -> и\ у(-) -непрерывная справа кусочно-постоянная функция у:Т ->У, точки разрыва которой образуют конечное множество ¿Г (тактовых моментов времени)-, *(•) -абсолютно непрерывная функция х:Т->Х, причем пара функций (*(■)> ХО) удовлетворяет начальным условиям (1.4) и при всех /еГ - рекуррентному включению (1.2), а тройка (*(•),Х-)>м(')) почти всюду на Г - уравнению (1.1).

Функции х(') и >'(■) определяют траектории движения динамической и логической частей ЛДС соответственно.

На множестве D{t(¡,XQ,yo) допустимых процессов задан функционал: 'i

/= ¡f°(t,x(t),y(.t)Mt))dt+ £g°(i,х(т),y(z-0),y(x)) + F(x(tO,y(h)). (1.5) í0 те?

Суммирование в выражении (1.5) производится по веем точкам т разрыва функции X") (множество W конечное для каждого допустимого процесса). Условия g®(t,x,y,v)>0, g®(t,x,y,y) = 0 позволяют рассматривать каждое слагаемое gü(x,x(x),j'(T-0),^(T)) в (1.5) как "штраф" за изменение (переключение) >'(т - 0) |-> у(х) состояния логической (автоматной) части системы.

Требуется найти минимальное значение функционала (1.5) и оптимальный процесс d* = (х*(-),у*('), «*(•)), на котором это значение достигается:

I(d*)= min I(d). (1.6)

deß{t0,x0,y0)

Если наименьшее значение (1.6) не достигается, то ставится задача нахождения минимизирующей последовательности dj = (xj (•), yj (•), «у (•)) s ® (^о, > Уо) >

7=1,2,..., допустимых процессов:

/(</,)-> inf I(d) = I* при у-*+00. (1.7)

deD(t0,x0,y0)

Поставленная задача представляет собой задачу со свободным правым концом траектории и фиксированным временем. В более общей постановке момент t\ окончания процесса управления не фиксирован, а определяется условием t\ =inf{íj >/olOb;c(íl)>>'(íl))€r} - первого попадания траектории на терминальную поверхность Г, заданную системой уравнений Г(/,х,_у) = 0. В частности, для задачи быстродействия правый конец траектории фиксирован x(ti)-0, а момент t\ не задан и находится в результате минимизации функционала.

В постановке задачи не исключается случай, когда компоненты вектора уеУ являются двузначными логическими (булевыми) переменными, принимающими значения 0 или 1. Эти условия можно учесть, ограничивая либо множество Г, либо множество У(*,*,>>), например

у еГс2т, (1.8)

где Ъ - множество целых чисел. Условие вида у е У = {1,2,..., Щ можно использовать для объектов, совершающих типовые движения (разгон, поворот, торможение и т.п.). В этом случае состояние у(() автоматной части соответствует "номеру" типовой траектории движения.

Чтобы исключить многократные переключения логического блока в фиксированный момент времени, предполагается, что

g0(í,x,y,w)<g0(t,x,y,v) + g0(t,x,v,w) УуеУ((,х,у) V н>еУ((,х,у);

У((,х,у)^У((,х,У((,х,у)) УувУ. (1.9)

Скользящие режимы с бесконечным числом переключений автоматной части можно исключить, усиливая условие неотрицательности: у)> X,>0.

Если в функционале (1.5) отсутствует "штраф" за переключения состояния логической части системы = 0), а в рекуррентном включении (1.2) нет зависимости от предшествующего состояния (У^,х,у) = У^,х)), то получается задача оптимального управления непрерывными системами с дополнительным кусочно-постоянным управлением >*(■). Если же моменты переключения логической части системы заданы заранее, то задача сводится к оптимизации непрерывно-дискретной системы.

Вывод необходимых условий оптимальности для задачи (1.1)-(1.6) имеет некоторые отличия от обычно применяемых подходов. Эти отличия касаются только вариаций траекторий у(-) автоматной части (для управления ы(•) динамической части применяются обычные игольчатые вариации). Дело в том, что

малые вариации функции >>(■) недопустимы, если множество ее значений несвязно, например, при условии (1.8). Игольчатые вариации траекторий автоматной части (конечные изменения состояний автоматной части системы на множестве малой меры) тоже не всегда допустимы. Эти вариации, как и в случае непрерывных систем, приводят к малым вариациям траектории динамической части системы. Однако, вариация функционала (1.5) оказывается конечной

из-за наличия штрафов за переключения (при > 0). Поэтому в общем случае в задаче (1.1)-(1.6) допустимы только вариации моментов переключения автоматной части, а также малые кусочно-постоянные вариации траекторий автоматной части в случае, когда у е Ет.

На рис.1 изображены допустимые вариации траектории логической части системы. Полужирными линиями обозначена оптимальная траектория у*((),

¡еТ, а светлыми - возмущенная траектория У(/) + 5у(0> ¡еТ. Вариации 5т|, 5*2 двух моментов переключения автоматной части указаны на рис.1,а, малые кусочно-постоянные вариации 3у(0> изображены на рис. 1,6.

5Х2 | <---

§Х[

! |

<0 ь Т] +5x1 х2 х2+6т2 / а

!Ы0

'о

XI г

Рис.1

Обозначим для системы (1,1)—(1.2) с функционалом качества (1.5) гамильтониан (анормальные случаи в диссертации не рассматриваются)

#(/, у, х, у, и) = у j ■ /] (г, х, у, и) - /° (/, х, у, и),

где ц/ = (н/1,...,ц;п) - вектор вспомогательных переменных.

Теорема 1.1 (необходимые условия оптимальности при однократных переключениях автоматной части). Пусть (ж(-),у(-),и(-)) - оптимальный процесс, причем Х\,Х2,...,Х^ — точки разрыва функции j>(-), ¿0 <Т[ <... < хдг </[. Тогда существует такая непрерывная справа функция

1|/(-):Г->Ел - абсолютно непрерывная на Т, за исключением, быть может, точек разрыва функции у(-), в которых (;/(•) непрерывна справа и имеет предел слева, что:

1) почти всюду на Т функция H(t,\y(t),x(t),y(t),u) достигает максимума по управлению (по аргументу и ) при и = u(t):

maxH(tMt),x(t),y(0,u) = Щ(М0,40,У(0Ж0У, (1-Ю)

ueU

2) в каждой точке х = хк (к = 1,2,...,N) разрыва функции у(-) существует управление ueU, при котором имеет место равенство

+ П^{х),х,х{х),у{х),и) - Н(у(х),х,х(1),У(т - 0),и) = 0; (1.11)

3) функция vj/0 почти всюду на Т удовлетворяет уравнению

m = -Hx(tMt),x(t),y(t),u(t)), (1.12)

в конечный момент времени t\ - краевому условию

vi'i)=~Fx(x(h)>y(f\$) 0.13)

и в каждой точке k = 2,.N,—условию скачка

4(4 -0) = \\>(хк)-g°x(хк,х{хк),у(хк-0),у(хк)). (1.14)

Если для оптимального прогресса (х(-),}'(■),и(■)) допустимы малые кусочно-постоянные вариации 5у(-) функции у(-), то для любых допустимых вариаций 8>>(.) выполняются неравенства

[8%ЛЧ1У>УЬ\Ъ ^(Ti_0)- \Hy(y{t),tAt),y{t)A№]■ъу%)>о, (1.15)

'о

У=У(Ч- 0)

- к = (1.16)

Ч-\

4+^(*(<1),*('!))-

- \нут\/,*(/),КО,и(0)й]-8у(т*)*0. (1.17)

Теорема представляет собой необходимые условия локального минимума в задаче с фиксированным временем и свободным конечным состоянием системы. Рассматриваются модификации условий для задачи с подвижным правым концом траектории. В частности, для задачи быстродействия с фиксированным конечным состоянием х(1\) = 0 и свободным временем окончания ^ добавляется условие #(^,\у(/]),х(Г|),:у(?1),«(г1)) = 0 вместо (1.13). Условия (1.11), (1.15), (1.17) соответственно изменяются, если переключения автоматной части происходят в начальный (д и конечный ^ моменты времени.

Для оптимального управления динамической частью системы выполняется принцип максимума. Для оптимальной траектории логической части, как и случае дискретных или непрерывно-дискретных систем, получены менее конструктивные условия - равенство (1.11) и неравенства (1.15)—(1.17), причем эти неравенства не используются, если множество допустимых состояний автоматной части является дискретным (несвязным), например, при (1.8). Если выполняется равенство £°(*,х,у,у) = 0, то неравенства (1.15)—(1.17) справедливы также для точек х^ ¡г¿Г, в которых у оптимальной траектории нет переключений. Это обстоятельство можно использовать для обнаружения дополнительных переключений автоматной части на неоптимальном процессе. В целом, ус-

ловия теоремы слабее принципа максимума и не всегда образуют "полную систему соотношений, достаточную для решения задачи".

Методика применения необходимых условий следующая. Из условия (1.10) максимума гамильтониана определяется структура оптимального управления и() динамической частью. Управление к выражается через вектор состояния z-{x,y) и вектор вспомогательных переменных \j/. Для вспомогательных переменных записывается сопряженная система (1.12), краевые условия (1.13), условие скачка (1.14), а также равенство (1.11), связывающее вектор \|/(т) вспомогательных переменных со значениями у(т - 0) и у(т) в точке разрыва т. Если допустимы малые кусочно-постоянные вариации 8у(-), то, применяя неравенства (1.15)—(1.17), получаем соотношения (равенства или неравенства) для значений y(i - 0) и у(т). В результате получаем двухточечную краевую задачу для системы 2п дифференциальных уравнений относительно функций *(-),\|/(-) с дополнительными условиями (равенствами или неравенствами) при наличии конечного числа точек разрыва функции у(-).

Применение условий оптимальности демонстрируется на примерах.

В примере 1.1 решается задача оптимального управления ЛДС ¿ = у(0 + и(0, u(t)eR, 0<íál; х(0) = 3, у(-0) = 2;

0 Т

в случаях: а) А. = 10; б) X = 1; в) А. = 0,1. Применяя необходимые условия, находим структуру оптимального управления динамической частью. Выясняем, что у оптимального процесса нет переключений автоматной части на интервале (0,1). Следовательно, условиям оптимальности удовлетворяют 4 процесса: 1) без переключений автоматной части; 2) с одним переключением в начальный момент времени; 3) с одним переключением в конечный момент времени; 4) с двумя переключениями в начале и в конце. Непосредственно вычисляя

функционал, выделяем оптимальный: в случае "а" - процесс 1), в случае "б" -процесс 2), в случае "в" - процесс 4).

В примере 1.2 решается задача оптимального управления ЛДС

* = А0. Я0е{±1), 0<(<1; х(0) = 0, у(-0) = 1, х(1) = 0;

7= ¡¡х(01* + £х-1у(т)-у(х-0)1. =

О Т

Поскольку малые вариации траекторий >'(•) не существуют, то неравенства (1.15)—(1.17) не используются. Остальные необходимые условия приводят к выводу, что оптимальная траектория динамической части является равнозвенной ломаной (только первое и последнее звенья в два раза короче остальных). Однако оптимальное количество звеньев, т.е. количество переключений автоматной части, условия ж

теоремы найти не позволяют (в этом проявляется неполнота полученных условий оптимальности). Поэтому имеем последовательность процессов, зависящую от количества переключений. Оптимальное количество переключений (3 для заданного значения А) находится путем дискретной минимизации. Оптимальная траектория динамической части изображена на рис.2.

В примере 1.3 решается задача оптимального управления ЛДС х(0 = и(0~у(0, у(()е[у((-0), + оо), и(()еШ, 0<(<1; х(0) = 37, у(-0) = 0; 1

/= Ци2(0Л + ^Х-(1-х)2(у(т)-у(т-0)) + ^(1)+^у2(1), 1 = 21. О *

Модель описывает процесс торможения (х - скорость движения) при помощи 2-х устройств: ускорение и меняется непрерывно, а у - нарастает скачками (такой процесс характерен, например, для торможения самолета при помощи реверса тяги реактивного двигателя и тормозных парашютов). Необходимые условия оптимальности выделяют единственный процесс, который и оказывается оптимальным.

В примере 1.4 решается задача оптимального управления ЛДС

Л(0 = 8шв(0, 6(0 = .КО. ХОеК, Ай)-0,8(^ = 0,

О т

для а) = + 6(0) =-л; б) й(0) = 5, 0О = -§. Модель, ана-

логичная так называемой машине Дубинса, описывает движение материальной точки с постоянной линейной скоростью по прямым (при у = 0) или окружностям (при у*0).В критерии качества учитывается "штраф" за изменение кривизны траектории. Необходимые условия для начального состояния ("а" или "б") выделяют единственный процесс, который оказывается оптимальным.

В разделе 1.4 рассмотрена задача активной стабилизации спутника с минимальным расходом топлива. В классической постановке оптимальное управление представляет собой последовательность режимов торможения в окрестности положения равновесия. Торможение производится с максимальной тягой двигателя. Чем короче промежуток работы двигателя при каждом включении, тем больше таких включений необходимо сделать для гашения колебаний. Однако общие затраты топлива при этом уменьшаются. В пределе получаем бесконечную последовательность импульсных включений (на бесконечно малое время) двигателя с максимальной тягой, при этом общее время стабилизации неограниченно возрастает. Разумеется, что это управление, практически нереализуемое, является абстрактным, идеальным решением, показывающим предельные возможности (экономии топлива) данной математической модели.

Математическая модель колебаний спутника в плоскости круговой орбиты имеет вид:

8(0 = ш, 'о —' —'1> Ю(/) = -К-81п29 + /-И,

где 0 - угол отклонения штанги от местной вертикали; ю - угловая скорость вращения спутника; к = —г-—, О - угловая скорость движения спутни-

X и у

ка по круговой орбите; Jx,Jy,Jz - моменты инерции спутника; / = —, Ь -

длина штанги; г0 = 0, /I - моменты начала и окончания процесса управления. Тяга двигателя и направлена перпендикулярно штанге в плоскости орбиты (в одном из двух противоположных направлений: в одном и > 0, в другом и < 0) и ограничена максимальным значением (/тах: (и|<{Утах. Начальное и конечное состояния системы заданы: 0(0) = ©о, ш(0) = ш0, О(^) = 0, со(^) = 0. Время {\ окончания процесса управления фиксировано. Предполагаем, что секундный расход топлива пропорционален тяге двигателя, т.е. затраты топлива вычисляются по формуле

'о

Требуется найти оптимальное управление, минимизирующее этот функционал Это классическая постановка задачи для непрерывной динамической системы. Оптимальный процесс, найденный с использованием принципа максимума, имеет 11 включений двигателя.

Будем рассматривать задачу в классе ЛДС, учитывая перерасход топлива при включении и выключении двигателя. Такая постановка задачи ближе к практике, чем классический вариант. При запуске реактивного двигателя максимальная тяга достигается не сразу, часть топлива тратится на переходный процесс. В некоторых конструкциях топливо используется также для запуска и работы турбонасосного агрегата. Кроме того, при включении и выключении двигателя часть топлива дожигается менее эффективно, чем при номинальном режиме. Поэтому предлагается оценивать качество процесса управления следующим функционалом

1\= /ЦпкММ + Е*.

(о 1

где X > 0 - величина "штрафа" за включение двигателя. Суммирование происходит по всем моментам х включения двигателя. Кусочно-постоянная непрерывная справа функция уО^о»'!]-^ задает траекторию автоматной части ЛДС. Она связана с тягой м(-) двигателя равенством и(() = £/тах у(0, ^ -' - > т.е. значение у(() определяет рабочее состояние двигателя: у = О - двигатель выключен; у > О или у < 0 - двигатель включен; а также направление тяги. Оптимальный процесс, найденный при помощи необходимых условий оптимальности ЛДС, имеет 5 включений двигателя.

Исследования показали, что оптимальные процессы в классе логико-динамических систем могут иметь новые, ранее не встречавшиеся, режимы с конечным или счетным числом мгновенных (т.е. происходящих в один и тот же момент времени) переключений автоматной части при фиксированном состоянии динамической части системы. Например, на рис.3,а изображена кусочно-постоянная функция стремя разрывами в точках т-2б, х-е, х и значениями

=у(х-2е-0), у1 = у(х-2е), у2 = у(х-е), у3 = у(х).При е-»+0 получаем кусочно-постоянную функцию с трехзначным разрывом в точке х (рис.3,б).

Заметим, что все эти мгновенные многократные переключения автоматной части совершенно не влияют на траекторию динамической части системы, поскольку они происходят на множестве меры нуль. Важным представляется тот

факт, что эти новые режимы не являются редкими исключениями, напротив, они появляются в аналогах хорошо известных задач, например, в задаче управления линейными ЛДС с квадратичным критерием качества.

Пополним множество <D(iо.-^Л)) процессами, в которых функции >>(■) имеют конечное число точек многозначных разрывов, и определим на нем функционал

h K{i)

i= х Е g0M^),yi~\y\)+Fm,y(t\)), (1.18)

/0 ТбУ (=1

где К(х) - количество переключений автоматной части в момент т.

Теорема 1.2 (необходимые условия оптимальности при мгновенных многократных переключениях автоматной части). Пусть (х(-),}>(•),и(-)) -оптимальный процесс, мингшизирующий функционал (1.18), траектория автоматной части которого имеет точки f->xN (t0<x\< — <xN <h) многозначных разрывов, причем в каждой точке т^ автоматная часть совершает К^ь) переключений

У(Ч~0) = y°l->ylt->yk <->■■■» Ук(Ч) = Хч), к = 1,2,.

Тогда существует такая непрерывная справа функция v|/(-) :Г—>Е", абсолютно непрерывная на Т, за исключением точек т^, в каждой из которых она имеет многозначный разрыв, принимая последовательно значения

что: У) почти всюду на Т функция II(t,x\i(t),x{t),y(t),u) достигает максимума по управлению (по аргументу и) при и = «(/):

ueU

2) в каждой точке (к -1,2,...,//) существует управление ueU, при котором выполняется равенство

Цч) м

3) функция у(-) почти всюду на Т удовлетворяет уравнению

Ш = - НЛМОЛМЫФ,

в конечный момент времени t\ — краевому условию

Vto^-^W'lM'l))

ивкаждойточке хk = \,2,...,Nрекуррентному уравнению

^ ^У{-8Х(ЧЛЧ1УГ1,}{), У = 1,2,-,К(.Ч)-Если для оптимального процесса (х(-),у(-),и(-)) допустимы малые кусочно-постоянные вариации 5j'(-) функции у(-), то для любых допустимых вариаций SyQ выполняются неравенства

I Т|

I J

Ы°(чЛч),у1~\у1)+8%кЛч)Ук,Я+1Я к%кЛч)>Ук{чУ\у(ч))+8у(ч+\Хч+\Шч),Ук+1)-

- \Hy(4(t),t,x{t),y{t),u{t))dt]by{xk)>0, k = \,2,...,N

- \Hy{y{t),t,x{t),y(t)A№]• Ьу(хм)> 0.

Применение необходимых условий демонстрируется на примере 1.5 решения задачи оптимального управления ДЦС:

х = и(0 + у(0> КОеМ, иеК,

1 Л'(т)

О г 1

для начальных условий: а) л(0) = 4, у(-0)=4; б) х(0) = 1, 0°5 у(-0) = 1. В каждом случае оптимальное управление ди-

-2

намической части оказывается постоянным. В случае "а" оптимальная траектория автоматной части имеет 12 переключений при / = 0, 3 переключения при Г-1 и постоянна при 0<^<1 (рис.4,"а"); в случае "б" - 2 переключения при / = 0, затем постоянна при 0</<1 (рис.4,"б").

Вторая глава посвящена достаточным условиям оптимальности ЛДС, динамическая часть которой описывается дифференциальными уравнениями, а логическая (автоматная) - рекуррентными уравнениями:

т=я<,х(о,у(омо)> (2.1)

у(О = в«,х(О,У«-0),т, (2.2)

где V - вектор управления логической (автоматной) частью, уеКс®', функция g:TxXxYxV->Жm, удовлетворяет при всех Г, х, у условию 8((,х,у,о) = у, где о - некоторый нейтральный элемент, оеУ. Множество допустимых процессов ©('о >■*()> Л)) образовано четверками функций (*(•),>>(•),и(.),у(-)), где функция V (управление логической (автоматной)

частью ЛДС) всюду на Т\£ равна нейтральному элементу (у(/) = о) и отлична от него только в тактовые моменты времени из . Остальные обозначения как в главе 1. На множестве ©Оо.^СЪ-Уо) допустимых процессов задан функционал

/= 1Л1,х(0,у(0А0)^+ (2.3)

'о ^

—г 1

Ставятся задачи нахождения наименьшего значения функционала (2.3) и оптимального процесса; минимизирующей последовательности процессов, если минимум функционала не достигается, а также задача синтеза оптимального позиционного управления (управления с обратной связью) и:ТхХхУ ->[/, у.ТхХхУ , которое для любых начальных условий

= = (2.4)

порождает оптимальный процесс (х(-),>•(•),и(-),у(-)) е Ю(1д,Х(),уо) с программными управлениями и(0 = и(«,х(*), >'(<))> у({)-у(1 -0)), 6<<<?[, минимизирующий функционал оставшихся потерь Н

к = + £ + (2.5)

8 е^т

Как и в главе 1, рассматриваются разные модификации постановки задачи, например, с терминальными условиями, в частности, задача быстродействия.

На основе принципа оптимальности Кротова В.Ф. доказываются достаточные условия оптимальности процесса управления (теорема 2.1), минимизирующей последовательности (теорема 2.2). Из теоремы 2.1 следует "уравнение Беллмана для ЛДС".

Пусть Ф - множество скалярных функций <р((,х,у), определенных на ТхХхУ, непрерывных вместе со своими частными производными фг, фл на всей области определения, за исключением, быть может, конечного числа точек промежутка Г, в которых они имеют предел слева и непрерывны справа по <. Обозначим через <Ж множество допустимых управлений с обратной связью.

Теорема 2.3 (достаточные условия оптимальности управления с обратной связью). Если существуют функция феФ и управление (н,у)е(И/Г с обратной связью, удовлетворяющие условиям:

а) ФЙ ,х,у) = Р(х,у);

б) ф(< - 0, х, у) = ф(г, х, g(í, х, уХ(,х, у))') + Е°((, х, у, , х, у));

в) min min P(t ,x,g(t,x, y, v), и) = 0, veV'(t,x,y) ueU

r) u(t,x,y)e Aigmin[(px(j,x,y)-f(t,x,y,u)+f°(t,x,y,u)]-,

ueU

ЮНt,x,y)e Arg min P(t, x, g(t, x, y, v), u(t, x, g(t, x, 7, v))), veV'(t,x,y)

то управление (u(t,x,y),v(t,x,y)~) с обратной связью является оптимальным, при этом величина предела слева ф(0-О,л:д,уд) равна минимальному значению функционала оставшихся потерь (2.5)

<р(в-0,Х0,У9)= min IQ(d). (2.6)

deO(.Q,xe,ye)

Здесь: P(t,x,y,u) = cpt(t,x,y) + q>x(t,x,y)-f(t,x,y,u)+f°(t,x,y,u) - производная функции ф(t,x,y) в силу уравнения движения;

V*(t,x,y)=Aigmm[q(t,x,g(t,x,y,v)) + g°(t,x,y,v)] (2.7)

veV

- множество точек глобального минимума.

Отметим, что оптимальное управление автоматной частью находится в

результате двух операций минимизации. Сначала определяется множество

(2.7), а затем в этом множестве, согласно условию "в", выбирается искомое

управление. Эта процедура отличается от применяемых для НДС

"упрощенных" условий, когда управление дискретной частью определяется

только из условия:

v(i,x,y)e Arg min [ cp(t, x,g(í,x,y,v)) +g (t,x,y,v)], (2.8)

veV

а уравнение в) имеет вид

<?х((,х>У) + min^(í,x,y) ■ f{t,x,y,u) + fQ(t,x,y, н)] = 0. (2.9) ueU

"Упрощенные" достаточные условия сильнее условий теоремы 2.3, поэтому их область применения уже. Это подтверждает пример 2.1, в котором решается задача синтеза оптимального позиционного управления ЛДС т = 2y(t)u(t), y(t) = I y(t - 0) - v(01, 0 < t < 1;

О т

где хеК, е{0,1}, меМ, уе{0,1). Условиям теоремы 2.3 удовлетворяют функция y(t,x,y) = t + х-у-1 и оптимальные управления и(1,х,у) = -у, у{1,х,у)~\\-у\. Равенство (2.9) для этих функций нарушается, а условие (2.8) выполняется как для оптимального, так и для неоптимального управлений.

В теореме 2.4 формулируются достаточные условия оптимальности автоматной части для модели ЛДС, описываемой уравнениями (1.1),(1.2). В примере 2.2 синтезирована оптимальная позиционная конструкция автоматной части у(1,х,у) для задачи, рассмотренной в примере 1.2. На рис.5 показаны области переключения автоматной части: переключение 1 ь-> —1 на рис.5,а; переключение -1 1 на рис.5,б. Двойными сплошными линиями изображена оптимальная траектория динамической части, которая была получена в примере 1.2 (по два звена этой ломаной в каждой половине рис.5).

В примере 2.3 найдены функция (p(t,x,y), оптимальное управление u(t,x,y) динамической частью и оптимальная позиционная конструкция y(t,x,y) автоматной части для ЛДС, модель которой рассмотрена в примере 1.3.

Предельным переходом, на основе теоремы 2.2, доказываются условия оптимальности при мгновенных многократных переключениях автоматной части.

Теорема 2.5 (достаточные условия оптимальности ЛДС при мгновенных многократных переключениях автоматной части). Если существуют функции и управление (и, v^) е W с обратной связью, удовлетворяю-

щие условиям'.

а)ф i0kthx,y) = F(x,yy,

б)^k\t,x>y) = (?^\t,x,g(t>x,yMk\t,x,y))) + g0(t,x,y,v^k\t,x,y))i

в) min min P^~^\i,x,g(i,x,y,v),u) = 0;

veFw(i,x,y) ueU

г) u(t, jc, у) e Arg min [ ф(х0) (/, x, y) ■ f(t, x, у, u) + f° (t, x, у, и)];

ueU

R)v(-k\t,x,y)e Argmin P{k~X\t,x, g(t,x,y,v),u(t,x, g(t,x,y,v))); ve V(l)(t,x,y)

e) k(t,x,y)s Argmin

где k = \,...,k(t,x,y), то управление (u(t,x,y),v^k\t,x,y)) с обратной связью

является оптимальным, при этом величина предела слева ф^(0-О,хд,.уд) равна минимальному значению функционала оставшихся потерь (2.5)

Ф(0)(е-о,х0,л>)= min h(d) ■

rfsmwe)'

Здесь: p(k\t,x,y,u) = <$\t,x,y) + $)(t,x,y)-f{t,x,y,u) + f°{t,x,y,u) - производная функции ф(k\t,x,y) в силу уравнения движения;

v{k) (t, X, у) = Arg min [ ф(А) {t, x, g(t, x, у, v))+g°(t, x, y, v) ] veV

- множество точек глобального минимума.

Разработана методика приближенного решения уравнений а)-ж) теоремы 2.5, в которой фиксируются моменты возможных мгновенных многократных переключений автоматной части, а операция минимизации д) откладывается и выполняется уж:е после интегрирования уравнения в).

Применение условий оптимальности демонстрируется на задаче управления линейной ЛДС с квадратичным критерием качества:

x(t) = A{t)x{t) + B{t)y{t) + C(t)u(t), (2.10)

XO = Atx(t) + Bty(t - 0) + Ctv(t), (2.11)

}[ i/{t)D(t)x(t)+xT{t)G(t)y{t)+i Ur {t)Q{t)u{t)]dt + 'o

+ £ [X, + \xT{x)Dxx{x) + xT(x)Gxy(x - 0) + + \vT(x)Qxv(x)] +

хеГ

+i/ ft ) + хт ft )Gj>(f, )+¿/ft )Fiy{tx), Ят >0. (2.12)

Эта задача аналогична проблеме аналитического конструирования оптимальных регуляторов (АКОР) А.М.Летова, но только для ЛДС. Показано, что функции q>(k\t,x,y), к = ОД,..., являются квадратичными

Ф(к)(?ЛУ) = \хтФк«)х + xT%(t)y + \yTrk(t)y + yk(t), к = 0,1,2,...,

- матрицы Фд (/), *Pg(f), Гд(/) и скалярная функция уд(0 удовлетворяют на Т дифференциальным уравнениям:

фо(0+фо(0ж0+^г(0фо(0+^(0-фо(0с(0б"г(0сг(0фо(0=о,

❖о(0+Фо(<ЖО+^(O^oW+GW - ®o(0c(i)ß-1(0cr(04'o(0 = 0.

*о(0+%r(0ß(0+BTw0(t) - v£(t)C(t)Q-\t)CT(t)%(i)=о, fo(0=о;

- в конечный момент времени выполняются терминальные условия:

ф0('1) = А> *о(<1) = Сь гоЙ)=0;

-при любом фиксированном ¿еГ матрицы Г* (О и скаляр-

ная функция у* (О удовлетворяют рекуррентным уравнениям:

г*+1(0=ад-м1(1)Кк(0Мк(1), у*+1(0=т*(')+>ч,

где Кк(0 = {&+<?Ш) + *ЯС1Г\ Ш = г*(0+ад>,

^*(0 = сТ[ГЛ(0+ад, 4 = 0,1,2,...;

- оптимальное управление динамической частью имеет вид

и(!,х,у)=-дА(1)Ст(0[Фо(.Ох+Ш0У1 ; (2.13)

- оптимальное управление автоматной частью имеет вид

У(к+1\1,х,у) = -КкШ1к«)х+Мкт, к = 0,1,2,...; (2.14)

- оптимальное количество к{1,х,у) переключений автоматной части находится по формуле

к($,х,у) = а^пип ф(^(/,х,у); ¿=0,1,2,..,

-функция удовлетворяет условию скачка

Оптимальное позиционное управление (2.13),(2.14) реализуется линейными регуляторами, как и в классических случаях проблемы АКОР для непрерывных, дискретных или непрерывно-дискретных систем. Однако в задаче АКОР ЛДС

функция Беллмана ф^(<~0,л:,>') оказывается кусочно-квадратичной, т.е. при фиксированном ? пространство состояний ХхУ можно разбить на области, в каждой из которых функция ф^(/-0,х,_у) квадратичная. В примере 2.4 решена задача синтеза оптимального позиционного управления ЛДС:

1 л:(т)

О г 1=1

где х е К, _у еЖ, меМ, V е М. На рис.6 представлено приближенное разбиение пространства начальных состояний на области (многоугольники), в каждой из которых функция Беллмана квадратичная. В этих областях через дефис (к^-к^ указаны оптимальные количества переключений автоматной части в начальный и конечный моменты времени соответственно. Оптимальная траектория (полужирная ломаная), исходящая из состояния = 4, = 4, совпадает с траекторией, найденной при помощи необходимых условий в примере 1.5.

В третьей главе рассматривается задача управления ЛДС в условиях параметрической неопределенности. Предполагается, что начальное состояние ЛДС

20 = (Х0>У()) точно не известно, а известно целое множество сто возможных состояний (оо с Ъ = ХхУ), т.е. речь идет об управлении пучком траекторий. Синтез управления ЛДС производится с целью минимизации среднего или максимального значений показателя качества (2.3) управления изолированной траекторией. Для управления пучками траекторий предлагается использовать оптимальное управление с обратной связью, в котором вместо неизвестного состояния системы подставляется его оценка (либо оптимальная гарантирующая, либо оптимальная в среднем). Таким образом, для управления пучком траекторий применяется оптимальное управление для одной, специальным образом выбранной траектории системы. Разумеется, что получаемое таким способом управление пучком является субоптимальным. Однако оно может оказаться удовлетворительным для практики.

Управление ЛДС (2.1),(2.2) в условиях параметрической неопределенности

будем искать, используя оптимальное управление е<У/ с полной об-

ратной связью. По определению субоптимальное управление является оптимальным для некоторой траектории. Поэтому оно может быть построено по оптимальному управлению с полной обратной связью согласно закону:

й(0 = иМ(0,Я0), К0 = у(1,т,у(1-0)), 10<1<{Ь (3.1) где £(/) = (я(0>К0) - оптимальная траектория, полученная при управлении (3.1).

Для построения достаточных условий субоптимальности вводится функция Р(в - О,г0,£0) = )), (3.2)

которая равна значению функционала оставшихся потерь (2.5), вычисленному на траектории, исходящей из позиции (Э,гд) при управлении , оптимальном для траектории, исходящей из позиции (6,%). Функция ^(9-0,20,%) является обобщением функции Беллмана и совпадает с ней при гд = £д: Р(8-0,%ге) = ф(е-0,7е).

В случае многозначного переключения в позиции (t,z,z) обозначим через

z,z) функцию (3.2) после к переключений автоматной части. Из определения и теоремы 2.5 следует, что она удовлетворяет уравнениям:

ßWfo.z.i)^*),

min Р(к~~1) (/, x, g(t,x, y, v), x,g(t, x, y, v), u(t,x,g(t, x, y, v))) = 0, V6 Vik\t,x,y)

u(t, z) e Argmin [ ßf (f, z)f(t,z,u) + f\t,z,u)}, «ei/

v{h](t,z)e Argmin P{k~l){i,x,g(t,z,v),x,g(t,z,v)Mi,x,g(i,z,v))), veFw(f,z)

k(t,z)e Arg min ß№) (t, z, z), ¿=0,1,2,...

где teT, xsX, yeY, z = (x,y), z = (x,y), k = 1,2.....k(t,z)\

- производная функции $k\t,z,z) в силу уравнений движения;

K(A+1)(i,x,j))=Argmin[ßW(i,x,g(i,x,i),v)) + g0(i,i,j),v)] veV

- множество точек глобального минимума.

Из условия минимума максимального значения оставшихся потерь или минимума их среднего значения находятся оценки zr(/0) или zc(t0) для используемой в законе управления оптимальной траектории (теорема 3.1):

zr(t0) б Argmin max ß(0)(f0 - 0,z,z), zc(i0) s Argmin lp(z)ß(0)(i0 - 0,z,z)dz. zsZ zea„ zeZ

а о

В примере 3.1 найдены субоптимальное в среднем и субоптимальное гарантирующее управления пучком траекторий линейной системы из примера 2.4, ис-

ходящих из квадрата стр = [0,2] х [0,2]. Субоптималыгое в среднем управление совпадает с оптимальным управлением для траектории, исходящей из центра (1,1) квадрата сгд, а оптимальное гарантирующее - с оптимальным для траектории, исходящей из состояния (—,—).

46 46

Представляют интерес задачи, в которых субоптимальное управление пучком оказывается оптимальным для пучка. Для непрерывных линейных систем с квадратичным критерием качества известно, что оптимальное в среднем управление совпадает с оптимальным управлением для траектории, исходящей из геометрического центра тяжести множества Од, а оптимальное гарантирующее - для траектории, исходящей из выпуклого замыкания со сто • Эти результаты удалось перенести (теорема 3.3) на задачи управления линейными ЛДС (2.10),(2.11) с квадратичным критерием качества (2.12), предварительно доказав их для соответствующей непрерывно-дискретной системы (теорема 3.2). Из теоремы 3.3 следует, что субоптимальные управления, найденные в примере 3.1, оказываются на самом деле оптимальными для пучка траекторий.

ОСНОВНЫЕ НАУЧНЫЕ РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ

1. Разработана новая математическая модель логико-динамических систем, описывающая широкий класс гибридных систем автоматического управления, качество управления которых оценивается функционалом, учитывающим переключения логической части [1-4,6,7,9]. Показано, что такая конструкция функционала отвечает потребностям практики [9].

2. Доказаны необходимые условия оптимальности логико-динамических систем, проведен анализ их применимости для синтеза оптимального программного управления [3,4].

3. Доказаны достаточные условия оптимальности логико-динамических систем, разработана методика их применения для синтеза оптимального позиционного управления [1,2,7]

4. Открыт новый тип минимизирующих последовательностей, приводящих к процессам с мгновенными многократными переключениями логической (автоматной) части. Необходимые и достаточные условия оптимальности доказаны для таких процессов [1,2,4,7].

5. Поставлена и решена задача оптимального управления линейной логико-динамической системой с квадратичным критерием качества, обобщающая известную проблему аналитического конструирования оптимальных регуляторов [7].

6. Доказаны достаточные условия субоптимального в среднем и субоптимального гарантирующего управлений пучком траекторий детерминированных логико-динамических систем. Показано, что для линейно-квадратичной задачи субоптимальные управления оказываются оптимальными [5,6,8].

7. Решена задача активной стабилизации колебаний спутника с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя [9].

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи в журналах, входящих в перечень ВАК

1. Бортаковский A.C. Достаточные условия оптимальности автоматной части логико-динамической системы // Известия РАН. Теория и системы управления, 2006, Ж. - С.77-92.

2. Бортаковский A.C. Субоптимальное управление логико-динамическими системами в условиях параметрической неопределенности // Автоматика и телемеханика. - 2007. - №11. -С.105-121.

3. Бортаковский A.C. Необходимые условия оптимальности управления логико-динамическими системами // Известия РАН. Теория и системы управления, 2007, №6.-С. 16-33.

4. Бортаковский A.C. Необходимые условия оптимальности автоматной части логико-динамической системы // Тр. МИАН. - 2008. - Т.262. - С.50-63.

5. Бортаковский A.C. Оптимальное и субоптимальное управления пучками траекторий детерминированных непрерывно-дискретных систем // Известия РАН. Теория и системы управления. - 2009. -№1. - С. 18-33.

6. Бортаковский A.C. Оптимальное и субоптимальное управления пучками траекторий детерминированных логико-динамических систем // Известия РАН. Теория и системы управления. - 2009. - №6. - С.27-45.

7. Бортаковский A.C. Синтез логико-динамических систем на основе достаточных условий оптимальности // Известия РАН. Теория и системы управления. - 2010. - №2. - С.54-68.

8. Бортаковский A.C., Пантелеев A.B. Достаточные условия оптимальности управления непрерывно-дискретными системами // Автоматика и телемеханика. -1987.- №7. -С.57-66.

9. Бортаковский A.C., Пегачкова Е.А. Синтез управления активной стабилизацией спутника на основе необходимых условий оптимальности логико-динамических систем // Вестник Московского авиационного института. - 2008. - Т.15. - № 2. - С.28-35.

Основные публикации в других изданиях

10. Бортаковский A.C. Управление детерминированными системами в условиях неопределенности при оптимальности эффективных управлений / Управление и навигация JIA в условиях параметрической неопределенности. М.: Изд-воМАИ, 1991. — С.18-23.

11. Бортаковский A.C. Достаточные условия оптимальности управления детерминированными логико-динамическими системами. // Информатика. Сер. Автоматизация проектирования. - М.: ВНИИМИ, 1992. - Вып. 2-3. - С.72-79.

12. Бортаковский A.C. Управление непрерывно-дискретными системами в условиях параметрической неопределенности при оптимальности эффективных

управлений / VI Международный семинар "Устойчивость и колебания нелинейных систем управления"- Тезисы докладов. - М.: ИПУ, 2000. - С.65.

13. Бортаковский A.C. Управление логико-динамическими системами в условиях неопределенности // Международная школа по динамическим и управляемым системам, г. Суздаль, 2001. Тезисы докладов. - Владимир: ВГУ, 2001. -С.12-17.

14. Бортаковский A.C. Оптимальное конструирование автоматной части логико-динамических систем // Второй международный конгресс "Нелинейный динамический анализ", г. Москва, 2002. - Тезисы докладов. - М.: Изд-во МАИ, 2002.-С.104.

15. Бортаковский A.C. Оптимальное управление линейными логико-динамическими системами // Международный научный семинар, посвященный 75-летию со дня рождения И.Я.Каца, Екатеринбург, 2006 - Устойчивость, управление и моделирование динамических систем: Сб. научн. трудов // Под ред.Г.А.Тимофеевой, д.ф.м.н. - Екатеринбург: УрГУПС.-№54(137).2006 - С.ЗЗ.

16. Бортаковский A.C. Аналитическое конструирование оптимальных регуляторов в классе логико-динамических систем // Международная конференция по дифференциальным уравнениям и динамическим системам, г. Суздаль, 2006. - Тезисы докладов. - Владимир: ВГУ, 2006, - С.47-49.

17. Бортаковский A.C. Оптимальное управление системами автоматного типа // Современные технологии в задачах управления, автоматики и обработки информации: труды XVI Международного научно-технического семинара. Сентябрь 2007, Алушта. - Тула: Изд-во ТулГУ, 2007. - С.11.

1 В. Бортаковский A.C. Оптимальное и субоптимальное управления пучками траекторий детерминированных непрерывно-дискретных систем // Международная конференция по математической теории управления и механике, г. Суздаль, 2009. - Тезисы докладов. - М: МИАН, 2009. - С.44-45.

19. Бортаковский A.C., Волокитин Д.А. Синтез оптимального позиционного управления линейными логико-динамическими системами // Вторая междуна-

родная конференция "Устойчивость и управление для нелинейных трансформирующихся систем" Москва-Россия 2000. Тезисы докладов. - М: Академия нелинейных наук, 2000. - С.46.

20. Бортаковский A.C., Волокигин Д.А. Оптимальное управление сближением космических летательных аппаратов в классе логико-динамических систем / Шестая международная конференция "Системный анализ и управление космическими комплексами", Евпатория, 2001. - Тезисы докладов. М.: МАИ, 2001.

21. Бортаковский A.C., Волокитин Д.А. Метод синтеза оптимального позиционного управления дискретной логико-динамической системой с линейной динамической частью // Межвузовский сборник научных трудов "Теоретические вопросы вычислительной техники и программного обеспечения". - Изд-во МИРЭА, 2003.-С.110-116.

22. Бортаковский A.C., Пегачкова Е.А. Оптимальное управление линейными логико-динамическими системами с квадратичным критерием качества // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и программного обеспечения". - М.: Изд-во МИРЭА, 2006. - С.56-61.

23. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Международная конференция по математической теории управления и механике, г. Суздаль, 2007. - Тезисы докладов. -Владимир: ВГУ, 2007. - С.18.

24. Бортаковский A.C., Пегачкова Е.А. Синтез оптимального управления линейными логико-динамическими системами // "Труды МАИ", №27. -http://www.mai.ru (25.04.2007)

25. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и программного обеспечения". - М.: Изд-во МИРЭА, 2008. - С.102-107.

26. Bortakovskii A.S. Sufficient conditions of optimality of logic-dynamical systems И Международная конференция по дифференциальным уравнениям и динамическим системам. Суздаль, 2000. - Владимир: ВГУ, 2000. - С.21.

27. Bortakovskii A.S. Synthesis of optimal automaton part of deterministic logic-dynamical system // IF AC Workshop: Modelling and Analysis of Logic Controlled Dynamic Systems. -Irkutsk: Inst. Syst. Dyn. and Control Theory Sib. Branch RAS, 2003.-C. 198-202.

28. Bortakovskii A. Optimal Control of Automaton Type Dynamical Systems // Дифференциальные уравнения и топология: Международная конференция, посвященная 100-летию со дня рождения Л.С.Понтрягина: Тезисы докладов. - М.: Изд. отдел фак-та ВМиК МГУ им. М.В.Ломоносова, 2008. - С.227.

29. Bortakovskii A.S., Pegachkova Е.А. Optimal automaton component synthesis of logic-dynamical system Н Международная конференция по дифференциальным уравнениям и динамическим системам, г.Суздаль, 2008: Тезисы докладов. - Владимир, изд-во ВГУ, 2008. - С.277.

30. Bortakovskii A.S., Volokitin D.A. Synthesis of the automaton part of optimal logic-dynamical system. // Journal of mathematical sciences. - 2005. - v.126. - №6. -p.1536-1541.

Монография

31. Пантелеев A.B., Руденко E.A., Бортаковский А.С. Нелинейные системы управления. - М.: Вузовская книга, 2008. - 312 с.

Учебные пособия

32. Семенов В.В. Пантелеев А.В., Руденко Е.А., Бортаковский А.С. Методы описания, анализа и синтеза нелинейных систем управления. - М.: Изд-во МАИ, 1993.-312 с.

33. Пантелеев А.В., Бортаковский А.С. Теория управления в примерах и задачах. - М.: Высшая школа, 2003. - 583 с.

36 Множительный центр МАИ (ГТУ)

Заказ OT08.OV 20f 0 г. ТиражЮО экз.

Оглавление автор диссертации — доктора физико-математических наук Бортаковский, Александр Сергеевич

Введение.

1. Необходимые условия оптимальности ЛДС.

1.1. Постановка задачи

1.2. Необходимые условия оптимальности.

1.3. Примеры применения необходимых условий.

1.4. Активная стабилизация спутника с учетом неэффективных затрат топлива.

1.5. Необходимые условия оптимальности ЛДС при мгновенных многократных переключениях автоматной части.

1.6. Выводы.

2. Достаточные условия оптимальности ЛДС.

2.1. Постановки задач.

2.2. Достаточные условия оптимальности.

2.3. Примеры применения достаточных условий

2.4. Достаточные условия оптимальности ЛДС при мгновенных многократных переключениях автоматной части.

2.5. Синтез оптимального управления линейными ЛДС с квадратичным критерием качества.

2.6. Выводы.

3. Оптимальное и субоптимальное управления пучками траекторий ЛДС.

3.1. Постановки задач.

3.2. Достаточные условия субоптимальности.

3.3. Достаточные условия оптимальности управления пучками траекторий линейных ЛДС с квадратичным критерием качества.

3.4. Выводы.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Бортаковский, Александр Сергеевич

Стремительное развитие математической теории оптимального управления началось с монографии [103]. Сейчас трудно даже оценить количество теоретических работ в этой области, хотя некоторое представление о современном состоянии математической теории дают материалы Международной конференции, посвященной 100-летию со дня рождения Л.С.Понтрягина (Москва, 2008). Приложения этой теории в технике, экономике и других областях невозможно перечислить. Только в области авиации и космонавтики Московский авиационный институт ежегодно проводит несколько конференций, включающих указанную тематику. Поэтому необходимо уточнить предмет исследования настоящей работы.

В монографии [103] была поставлена задача оптимального управления непрерывными системами, которые описываются обыкновенными дифференциальными уравнениями (дифференциальными включениями), и получен основной классический результат этой теории -принцип максимума Понтрягина. Наряду с непрерывными системами аналогичные задачи были сформулированы и решены для дискретных систем управления [14,104], движение которых описывается рекуррентными (разностными) уравнениями. Затем появились работы [37,56,126], в которых поведение объекта управления описывалось как непрерывными, так и дискретными переменными. Например, в непрерывно-дискретных системах (НДС) изменение состояния непрерывной части происходит непрерывно, согласно дифференциальным уравнениям, а изменение состояния дискретной части происходит дискретно, согласно рекуррентным (разностным) уравнениям. В дискретно-непрерывных или импульсных системах [60,63,78,89,131,148,149] вектор состояния изменяется либо непрерывно, в соответствии с дифференциальным уравнением, либо дискретным образом, совершая скачки, описываемые разностными уравнениями [14,67,95,104,131].

Наличие в одной системе управления процессов с разными характеристиками, которые реализуются непрерывными и дискретными сигналами, относит рассматриваемые системы к классу гибридных систем (hybrid systems). Следует признать, что в настоящее время термин "гибридные системы" перегружен [88]. Первоначально [140,145-147,151,153] модели таких систем включали непрерывные и дискретные (или логические) переменные (компоненты вектора состояния), причем непрерывные служили для описания, как правило, физических законов и принципов, а дискретные - для описания логических устройств, коммутаторов, цифровых автоматов и т.п. В настоящее время термин гибридные системы используется значительно шире, включая вопросы преобразования и обработки сигналов, хранения и передачи информации, а также вопросы формирования программного обеспечения.

К гибридным относятся логико-динамические системы (ЛДС), в которых дискретная часть описывается логическими переменными [62,111-115]. Логическая часть системы представляет собой автомат с памятью, управляющий динамической частью. Именно в таком узком смысле понимается рассматриваемая в диссертации модель логико-динамической системы. Многие работы, относящиеся к гибридным системам, посвящены разработке именно "логической составляющей" этого автомата: представление знаний, системы вывода теорем и т.п., вплоть до создания интеллектных компонентов системы управления (см. например, International Journal of Hybrid Intelligent Systems, материалы [152] Конгресса IF AC (Иркутск, 2003), а также [46]). Эти направления в диссертации не рассматриваются. Здесь термин "логическая часть" ЛДС используется примитивно, только в "автоматном" смысле, а именно: ЛДС - это динамическая система с автоматной частью (это название используют для классификации рассматриваемых систем акад. С.Н. Васильев, акад. А.Б. Куржанский). Причем переменные, описывающие состояние автоматной части будут необязательно булевы. Как правило, рассматриваются два случая: целочисленные переменные, либо переменные, принимающие действительные значения.

Для описания широкого класса дискретно-непрерывных систем используются динамические системы с импульсными управлениями [63,78,89,131]. Основой этого служат дифференциальные уравнения с мерами. Они задают универсальную форму описания траекторий как непрерывной, так и дискретной компонент системы. Наиболее полное отражение работ в этом направлении представлено в [89], где помимо необходимых и достаточных условий оптимальности рассмотрен также ряд других вопросов, например, существование решений и их устойчивости. Дискретная, импульсная составляющая ДНС описывает "сильные" воздействия на динамическую часть системы, приводящие к разрыву траектории движения. Напротив, логическая, автоматная часть ЛДС описывает работу бортового компьютера, управляющие сигналы которого оказывают "слабое" воздействие на динамическую часть, оставляя ее траекторию непрерывной. Траектории логической части — кусочно-постоянные. Конечно, для их описания можно применять дифференциальные уравнения с мерой. Однако это вряд ли целесообразно. Помимо усложнения математического аппарата для представления решений и вывода необходимых условия, из-за расширения класса управлений возникают проблемы существования и корректности решения оптимизационной задачи [89].

Важной составляющей гибридных систем являются переключательные системы switched systems), в частности, системы с переменной структурой [61]. В работах [132,149,

150] рассматриваются разные задачи стабилизации таких систем. Движение динамической части задается системой линейных дифференциальных уравнений, матрица коэффициентов которой зависит от дискретного параметра. Придавая различные значения этому параметру в 4 зависимости от текущего состояния объекта управления, получаем разные системы уравнений и, следовательно, разные траектории движения объекта. Статья [111], видимо, была первой работой, в которой рассматривалась задача оптимального управления переключательной системой. Объект управления описывается системой нелинейных дифференциальных уравнений, а логическая часть определяет ее правую часть, причем правая часть выбирается из некоторого конечного множества. Другими словами, автомат управляет движением объекта, выбирая ту или иную траекторию из конечного множества допустимых типовых траекторий. При этом оптимальная траектория составляется по кусочкам из набора типовых траекторий. Полученные в [111] достаточные условия оптимальности в диссертации уточняются и обобщаются. Однако, понимание логической части как модели автомата с памятью остается тем же самым [112—115]. В отличие от логико-динамической системы [111] движение системы с переменной структурой [67] описывается автоматом без памяти.

Разработанная автором математическая модель ЛДС применима для описания широкого круга многорежимных систем автоматического управления техническими комплексами, технологическими и экономическими процессами, а также бортовых оперативно-советующих систем управления движением летательных аппаратов [15,17-40,46,61,62,67,80,85,86,89,1-11115,119]. Поведение динамической части ЛДС описывается дифференциальными'уравнениями, а работа логической части, моделирующей автомат с памятью, — рекуррентными включениями или уравнениями или включениями. Логическая (автоматная) часть ЛДС характеризует операционную ситуацию, в которой происходит управляемое движение динамической части ЛДС, и может меняться дискретным образом в рамках одной операционной ситуации, либо изменять саму операционную ситуацию. В частности, такими соотношениями описывается движение летательных аппаратов, управляемых с помощью бортовых вычислительных комплексов [15,119]. Сформулируем кратко математическую постановку задачи [17] и приведем обзор методов, применяемых для ее решения.

Поведение модели объекта управления описывается соотношениями где х — вектор состояния динамической части системы, х е М"; у — вектор состояния логической (автоматной) части, у е Е"' (или у е Ът в зависимости от модели автомата); и — вектор управления, и е U с Шр; t - время, t е Т = [¿o^i] - промежуток времени функционирования системы. Для краткости изложения ограничения, накладываемые на уравнения (В.1),(В.2), а также некоторые дополнительные предположения во введении опускаются. Отметим только, что эти условия типичные для задач оптимального управления. В системе 5 x(t) = f{t,x{t),y(t\u(t)), y(t)eY{t,x{t\yit-0)),

B.l) (B.2)

В.1),(В.2): управление и(-) - измеримая ограниченная функция, траектория х(-) динамической части - абсолютно непрерывная, а траектория логической (автоматной) части - кусочно-постоянная, непрерывная справа функция, точки разрыва которой образуют конечное множество ¿Г тактовых моментов времени. Начальное состояние системы определяется условиями о) = *о> .У('о-0) = Л)- (В-3)

На траекториях системы задан функционал h

1= \f\t,x(t),y(t),u(t))dt+ Y, + (В.4) о теГ

Суммирование в выражении (В.4) производится по всем точкам xei разрыва функции у(-) это множество ¿Г конечное).

Требуется найти минимальное значение функционала (В.4) и оптимальный процесс d* = (х*(•), у*{•), "*(•)) > на котором это наименьшее значение достигается: = min/. (В.5)

Если оптимального процесса d* не существует, то ставится задача нахождения минимизирующей последовательности di = (*;(■)> >7 (•)»"/(')): lim I(di) = MI. (В.6)

-»СО

В задаче (В.1)-(В.5) логическая часть системы описывает работу автомата с памятью. Множество состояний автомата может быть неограниченно. Сигналы, протекающие в логической части системы, на самом деле, могут не иметь логической природы. Они необязательно описываются булевыми переменными. Поэтому логическую часть системы будем называть также автоматной частью (как в [46]), что точнее, а модель (В.1)-(В.2) - динамической системой с автоматной частью.

По сравнению с классической задачей оптимального управления непрерывными системами [103], здесь имеется дополнительное кусочно-постоянное управление >>(•), которое удовлетворяет рекуррентному включению. Если в правой части (В.2) отбросить зависимость от y(t — 0): y(t)eY(t,x(t)), (В.7) то получим обычное геометрическое ограничение на допустимые значения управления. Заметим, что включение (В.7) служит описанием автомата без памяти. Такая модель автомата соответствует системам управления с переменной структурой [61,62] и гибридным системам в работах [145-147,158].

Функционал (В.4) качества управления отличается от классического функционала Больца наличием суммы по точкам т разрыва функции у('). В частности, это могут быть

КаЧКИ ¿Г ° (т, Ф), у (у- 0), Я т)) = | у(х) - у(х - 0) | функции у(-). Эту величину можно рассматривать как "штраф" за переключение автоматной части. Если не учитывать эти штрафы, положив в (В.4) g0 = 0, получим обычный функционал качества [3,13,44,45,49,68,75,76,81,82,95,103].

Таким образом, задача (В.1)-(В.5) будет совпадать с классической задачей оптимального управления [103], если в (В.2) исключить зависимость от предшествующего состояния у(( - 0) логической части, т.е. использовать ограничение (В.7), соответствующее модели автомата без памяти, а в функционале (В.4) опустить сумму штрафов за переключение автоматной части.

Представляет интерес случай, когда в уравнении движения (В.1) отсутствует управление и(-): х(0 = /М0,Я0)- (В.8)

В этом случае управление динамической частью осуществляется исключительно выбором состояния >>(/) автоматной части. Заметим, что уже в [103] класс кусочно-постоянных управлений отмечался как вполне приемлемый. Действительно, задачу (В.6) поиска минимизирующей последовательности достаточно решать в классе кусочно-постоянных функций, поскольку любую измеримую функцию можно представить как предел последовательности кусочно-постоянных. Поэтому задача (В.8),(В.2)-(В.4),(В.6) также является обобщением классической задачи [103] из-за наличия рекуррентного ограничения на управление (если управлением считать у(-)), а также из-за учета в функционале штрафов за переключение управления.

Уравнение (В.8) в случае конечного множества состояний автоматной части: у(0 е {1,2,., /V} используется для описания переключательных систем. Поведение такой системы определяется выбором правой части уравнения движения. В задачах устойчивости и стабилизации, как правило, пространство состояний динамической части разбивается на n областей, в каждой из которых правая часть фиксирована. Во многих работах (например, в [147,150,158]) правая часть линейна, и поэтому каждой области фактически соответствует своя матрица коэффициентов системы уравнений. Применяются разные способы разбиения, отражающие техническую постановку задачи, например, при помощи линейных неравенств [158]. В [153] рассматриваются задачи робастного управления и стабилизации линейными переключательными системами.

Для описания автоматной части ЛДС вместо включения (В.2) можно использовать рекуррентное уравнение вида y(t) = g(t,x(0,y(t-0),v(t)), (В.9) где v - вектор управления автоматной частью, veFcl^. Штраф (t, x(t), y(t - 0), v(7)) в функционале (В.4) также зависит от управления v. Полагаем, что управление почти всюду равно нейтральному элементу ( v(/) = о ) и отлично от него только в точках разрыва функции у(-) (т.е. на ¿Г), при этом g(t,x,y,o) = у, g°(t,x,y,o) = 0. Модель (В.1), (В.9) эквивалентна модели (В.1),(В.2), а ее части становятся "симметричными": динамическая и логическая части имеют входные сигналы (управления и(-) и v(-) ) и выходные сигналы (траектории х(-) и у(-) ), которые действуют на соответствующие блоки. Функциональная схема такой системы изображена на рис.В.1: непрерывные сигналы изображены сплошными линиями (стрелками), дискретные - штриховыми, элемент "ключ" замкнут только в тактовые моменты времени теГ).

Заметим, что включение (В.2) определяет только возможные выходные сигналы автоматной части, не определяя самого автомата, а уравнение (В.9) кроме выходных сигналов фиксирует также и некоторую конструкцию автоматной части. На практике нужны обе модели в зависимости от наличия исходных данных об автоматной части.

Рис.В.1.

Постановка задачи (В.1),(В.9),(В.З)-(В.5) похожа на задачу оптимального управления непрерывно-дискретной системой [37]. Однако, в отличие от непрерывно-дискретных систем, изменение состояний дискретной части которых происходит в заранее заданные (тактовые) моменты времени, переключения логической (автоматной) части ЛДС может быть в произвольные моменты времени. Более того, выбор моментов, когда переключается автоматная часть, считается ресурсом управления и подлежит оптимизации. Если же в задаче управления ЛДС тактовые моменты зафиксировать, то получим задачу управления непрерывно-дискретной системой.

ЛДС можно рассматривать как дискретную [104] или многошаговую [55,56] систему, если в качестве дискретного времени взять номер переключения автоматной части (указано проф. М.М.Хрусталевым). При этом получается задача со свободным дискретным временем и подвижным (но не свободным) правым концом траектории, к которой известные необходимые условия [104] непосредственно неприменимы. Кроме того, в монографии [104] не рассматривается случай, когда множество допустимых значений управления конечное (как в переключательных системах) или является подмножеством Ът. Предлагаемый переход к многошаговой системе [55] скрывает движение динамической части, заменяя ее описание оператором. При этом достаточные условия теряют конструктивность.

Рассмотрим подробнее работы, наиболее близкие к диссертационной. Сначала приведем постановку задачи и результаты работы В.В. Семенова [111], который инициировал исследования автора диссертации в области ЛДС. Постановка задачи в [111] следующая:

1 х Дх, М) + g(x, и, t) % (?), а(0 = <р(*,и,0» я(0 = ВД0,<*('),v(0L X(i + Ai) = A(x(0,<y(0,v(i)], t\

J = G[x(tl),x(tl),tl]+ jFWT),u(x),x(T),v(T),T]^T->min, (B.10) o где 7t,a ,%,v — столбцы булевых переменных: % - внутреннее состояние конечного автомата, п - выход конечного автомата (определяет изменения правой части уравнения состояния динамической части), а - входной сигнал конечного автомата (полученный в результате преобразования в булевы значения непрерывных сигналов в динамической части), v -управление в логической части объекта; At — бесконечно малая положительная величина. Предполагается, что управления ы(-), v(-) принадлежат заданному классу допустимых управлений Q (все обозначения и предположения как в [111]).

С современной точки зрения задача (В. 10) является задачей управления переключательной системой, причем конечный автомат порождает конечный набор правых частей уравнения состояния динамической частью. В отличие от распространенного случая (В.8), в правых частях сохраняется управление и(-). Кроме того, в задаче (В. 10) учитывается преобразование вектора x(t) с действительными компонентами (выходной сигнал динамической части) в вектор а(/) с булевыми компонентами (входной сигнал логической части). Заметим, что 9 вопросам преобразования сигналов сейчас уделяется большое внимание [152]. В функционале (В. 10) по сравнению с (В.4) отсутствуют штрафы за переключения автоматной части. Для поставленной задачи в [111] получены достаточные условия в форме уравнения:

0 = , min \f(x,и,ъv,г) + [пТ0t)gT(x,u,t) +fT(х,и,t)]dЩх>+ П + w(0,v(0en[ дх

Af->0 j. + Afl 0 ЩХ} ^ 0 3 5(Д0 | (В.11) с граничным условием W(x,%(t +&t)j) = W(x,%,t) = G[x(t{),%{t{),ti]. Входящие в (В.11) дельта-функция, предельный переход, а также операция минимизации в функциональном пространстве Q, затрудняют понимание и препятствуют применению этого уравнения.

Более конструктивные достаточные условия в форме "уравнения Беллмана для гибридных систем" получены в [144]. Рассмотрим подробнее эти достаточные условия оптимальности, поскольку они довольно близки к предшествующей им работе [17] и последующим работам [25,27]. Постановка задачи в [144] следующая (все обозначения как в [144]):

0 = /9(о(*(0.и(0)> q(t) = v(x(t),q(t~),p.(t)), {f М

Axo,qo)= \lq(Xu)dt + Yu)>ч^к )> Ч(?к )) » (B.12) о где x(t) e JeR", u(t) e fiM c:- векторы состояния и управления в непрерывной части системы, q{t) е Q = {1,2,., N), p.(i) е Q^ - вектор состояния и входной сигнал в дискретной части системы (q(t~) ,q(t+) - пределы слева и справа соответственно). Пространство состояний X непрерывной части разбито на подмножества Sqr с!,в которых возможно переключение дискретной части из состояния q в состояние г. Функция s{-) > 0 определяет штраф за переключение автоматной части в момент времени tк = \,.,М. Начальное (*0>*7о) и конечное (xj-,q f) состояния заданы, а время /у свободно.

Уравнения для функции Беллмана имеют вид: dVJx)

0<—--fa(x,u) + L(x,n) Vxe X, и е QM, q^Q, дх 1 4

0<Vr(x)-Vq(x) + s(x,q,r) q,r<=Q:q*r,

0 = Vq/(xf)t (B.13) а оптимальное управление находится по формулам:

В. 14)

АО> Ч) = агё { (х) + },

В. 15) где у = у(х,д,ц).

По сравнению с [17] в задаче (В. 12) система стационарная, время не фиксировано, дискретная часть описывается уравнением, а не включением, множество состояний автоматной части конечно. Если не учитывать эти отличия, то соотношения (В.13)-(В.15) аналогичны полученным ранее условиям в [17], за исключением (В.15). Это условие определяет управление дискретной частью из условия минимума скачка функции Беллмана (приращения в фиксированный момент времени). В [17] для управления в автоматной части получено другое, более слабое достаточное условие. Оптимальное управление находится как минимум производной функции Беллмана (в силу системы) по тем управлениям, где скачок функции Беллмана минимален. В разд. 2 приводится пример 2.1, в котором "упрощенное" условие, аналогичное (В. 15), не позволяет однозначно получить оптимальное управление, а условие из [17]. определяет единственное оптимальное управление. Впрочем, эти довольно тонкие отличия проявляются, видимо, только в специальных примерах. Для большого круга задач, например, когда минимум в (В.15) единственный, условие в [17] можно заменить "упрощенным" соотношением (В. 15).

Вывод необходимых условий оптимальности для задачи (В.1)-(В.4) имеет некоторые отличия от обычно применяемых подходов [3,8,13,14,44,49,64,68,103,118]. Конечно, эти отличия касаются только вариаций траекторий у(-) автоматной части (для управления и(-) динамической части применяются обычные игольчатые вариации). Дело в том, что малые вариации траекторий автоматной части системы недопустимы для систем, в которых пространство состояний автоматной части несвязно. Например, если состояние автоматной части описывается вектором с логическими (булевыми) или целочисленными компонентами (уе%т), то малых вариаций таких векторов просто не может быть. К такому же выводу приходим в случае переключательных систем, "пространство состояний" автоматной части которых — конечное множество {1,2,., ./V} номеров типовых траекторий движения. Если же пространство состояний автоматной части связно (например, у е Кт ), то малые кусочно-постоянные вариации траекторий автоматной части оказываются допустимыми.

Игольчатые вариации траекторий автоматной части (т.е. конечные изменения состояний автоматной части системы на множестве малой меры) тоже не всегда допустимы. Эти вариации, как и в случае непрерывных систем, приводят к малым вариациям траектории динамической части системы. Однако, вариация функционала (В.4) оказывается конечной при наличии штрафов за переключения (т.е. при 0). Поэтому в общем случае в задаче (В.1)— (В.4) допустимы только вариации моментов переключения автоматной части, а также малые кусочно-постоянные вариации траекторий автоматной части в случае, когда у е К"7. При отсутствии штрафов (т.е. при g0 = 0) можно использовать игольчатые вариации траекторий автоматной части.

На рис.В.2 изображены допустимые вариации траектории логической части системы. Полужирными линиями обозначена оптимальная траектория У (0 > ' е Г, а светлыми - возмущенная траектория У(0 + 5у(0, (еТ. Вариации 8х^, 8x2 ДВУ* моментов переключения автоматной части указаны на рис.В.2,а, малые кусочно-постоянные вариации 3у(0, I еТ, изображены на рис.В.2,б.

8х2 «---->

8x1 1 1 1

5X0 о

1 ( б

X! Х| + 8х] т2 "с2+6т2 I а

Рис.В.2

Если пространство состояний логической части системы является дискретным (несвязным), например, когда компоненты вектора у являются целочисленными переменными у е Ът ), то малые кусочно-постоянные вариации 8X0 недопустимы. В этом случае остаются только вариации моментов переключения, которые приводят к слабым (неполным) необходимым условиям. Напомним, что принцип максимума представляет собой "полную систему соотношений" [103], позволяющих выделить из множества допустимых решений отдельные, вообще говоря, "изолированные" решения, удовлетворяющие всем сформулированным условиям. Применение только вариаций моментов переключения недостаточно для получения "полной системы соотношений". Как показывают примеры, выделяется множество подозрительных на оптимальность процессов, но это множество может быть бесконечным (например, счетным). Поиск оптимального процесса в этом множестве уже продолжается другими методами [47].

В результате применения указанных вариаций траекторий ЛДС в [28] выведены слабые необходимые условия оптимальности, которые в общем случае не позволяют однозначно найти оптимальный процесс, но ограничивают область поиска, отбрасывая часть неоптимальных процессов. В некоторых задачах оптимальный режим находится однозначно, аналогично применению принципа максимума для непрерывных систем.

При отсутствии штрафа (т.е. при = 0) необходимые условия для переключательных систем получены в работах [133,134], где для вычисления градиента функционала применяется вариация конечного числа моментов переключения. Заметим, что автоматная часть ЛДС представляет собой дискретную систему. Поэтому для нее принцип максимума, вообще говоря, не выполняется. Для динамической части (т.е. для оптимального управления и(-)) принцип максимума, разумеется, остается справедливым.

Большой интерес представляет исследование минимизирующих последовательностей в классе ЛДС. Минимизирующие последовательности (скользящие режимы) в классических задачах оптимального управления и вариационного исчисления приводят к счетному множеству переключений управления, которые происходят в разные, хотя и бесконечно близкие, моменты времени. Исследования показали, что оптимальные процессы в классе логико-динамических систем могут иметь новые, ранее не встречавшиеся, режимы с конечным или счетным числом мгновенных (т.е. происходящих в один и тот же момент времени) переключений автоматной части при фиксированном состоянии динамической части системы. Важным представляется тот факт, что эти новые режимы не являются редкими исключениями, напротив, они появляются в аналогах хорошо известных задач, например, в задаче управления линейными ЛДС с квадратичным критерием качества. Об открытии таких оптимальных режимов было заявлено на конференциях [23,24] в 2006 г. Затем почти все исследования ЛДС проводились автором с учетом этих режимов [25-27,29,38-40,42,137,138]. В отличие от работ других авторов, в [25,27,29] достаточные и необходимые условия получены с учетом мгновенных многократных переключений автоматной части. Поясним, о чем идет речь. Процесс с мгновенными многократными переключениями можно получить как предел последовательности {dj}J=i допустимых процессов d j = {xj(•),у j(■),Uj(■)) > в которых траектории

1 7 к yj(-) автоматной части имеют, например, К точек разрыва xj < Xj <. < тj . Причем эти точки разрывов функций уj(•) стремятся (при j —>оо) к одной точке г, сохраняя указанный порядок. Считаем, что предельная функция y(t) = lim y,(t), t еТ, в точке г является мноj-> 00 гозначной, принимающей К значений: у1 =yj(xlj), i = \,.,K, при этом точку т будем называть точкой многозначного разрыва. Например, на рис.В.3,а изображена кусочно-постоянная функция стремя разрывами в точках x-2s, т—е, т и значениями у0 = у(т-2е-0), у1 = y(i-2s), у2 =у(т-е), у3~у(х). При в-»+0 получаем кусочно-постоянную функцию с трехзначным разрывом в точке т (рис.В.3,6).

Автоматная часть в точке многозначного разрыва совершает К переключений, принимая последовательно состояния у(х - 0) = у0 ь^ / н». |-> ук = у(х), которые удовлетворяют рекуррентному включению (В.2): еУ(т,х(т),/'-1), i = l,2,.,K.

В функционале качества (В.4) такому разрыву соответствует сумма К gV^T),/-1,/). М

К многозначным разрывам следует отнести также и случай с бесконечным количеством переключений, который получается при К —> °о, если последовательность у1 сходится. В этом случае полагаем, что >>(т) = jh00 = lim у' (рис.В.З,в). Предполагаем, что допустимая

-»со траектория >>(•) автоматной части имеет конечное число точек многозначных разрывов. Заметим, что все эти мгновенные многократные переключения совершенно не влияют на траекторию динамической части системы, поскольку они происходят одновременно (на множестве меры нуль). У у3 / У У У У У У t-2s x-s а t А А

У/ со У i У а

I ♦ t t а -Н t б в Рис.В.З

Такие процессы, как показывают примеры, не являются исключениями, встречающимися только в специальных системах. Наоборот, они появляются в совершенно обычных задачах, в частности, в задаче управления линейными ЛДС с квадратичным критерием качества [23-25,33,35,36,38,39]. Эта задача аналогична хорошо изученной проблеме аналитического конструирования оптимальных регуляторов (АКОР) А.М.Летова [81]. Заметим, что процессы с мгновенными многократными переключениями в задачах управления непрерывнодискретными (или дискретными) системами не могут возникнуть, поскольку тактовые моменты времени в этих системах фиксированы.

Наличие положительного штрафа за переключение автоматной части является регуляри-зирующим фактором в задаче управления. Например, при фиксированной положительной величине штрафа последовательности допустимых процессов, приводящие к бесконечному количеству переключений автоматной части, являются неоптимальными. В частности, при наличии такого штрафа за переключение релейного управления невозможно появление скользящих режимов [3,45,54,55,76,118].

Кроме регуляризирующего влияния учет штрафа за переключение релейного управления делает классические решения ряда задач управления более практичными. Рассмотрим, например, задачу активной стабилизации спутника с минимальным расходом топлива [54]. Классическое решение поставленной задачи, полученное в [54], приводит к последовательности режимов торможения в окрестности положения равновесия, где угловая скорость максимальная. Торможение производится с максимальной тягой двигателя. Чем короче промежуток работы двигателя при каждом включении, тем больше таких включений необходимо сделать для гашения колебаний. Однако общие затраты топлива при этом уменьшаются. В пределе получаем бесконечную последовательность импульсных включений (на бесконечно малое время) двигателя с максимальной тягой, при этом общее время стабилизации неограниченно возрастает. Разумеется, что это управление, практически не реализуемое, является абстрактным, идеальным решением, показывающим предельные возможности (экономии топлива) данной математической модели.

Эту задачу можно рассматривать в классе ЛДС [41], учитывая, что каждое включение реактивного двигателя от его запуска до достижения максимальной тяги сопровождается расходом топлива и представляет собой немгновенный переходный процесс (как и выключение двигателя). Добавляя в критерий качества соответствующие штрафные слагаемые за включение (и выключение) двигателя, получаем задачу, в которой определяется оптимальное (конечное) количество запусков двигателя, а процессы, требующие бесконечного числа включений, отбрасываются как неоптимальные. Такая постановка задачи ближе к практике, чем классический вариант. Кроме расхода топлива в переходных процессах включения и выключения двигателя имеются и другие недостатки классического решения. Во-первых, в силу конструктивных особенностей реактивных двигателей малая продолжительность их работы приводит, как правило, к уменьшению точности коррекции траектории. Поэтому длительные промежутки работы двигателя обеспечивают меньшую погрешность, чем частые "мгновенные" включения/выключения двигателя. Значит, "импульсный" режим не годится из-за больших погрешностей при его реализации. Во-вторых, при каждом выключении химического реактивного двигателя часть топлива (горючего и окислителя) выбрасывается в пространство не полностью "сгоревшим". Эти остатки (как правило, активные химические вещества) затем оседают на солнечных батареях, снижая их производительность. Чем больше выключений двигателей, тем больше "загрязнение". Конечно, эти негативные явления трудно выразить в виде числовых характеристик (штрафов), чтобы учитывать в критерии качества.

Многие практические задачи оптимального управления приводят к релейным управлениям с конечным или бесконечным количеством переключений (например, задачи управления космическими и летательными аппаратами [52,53,76,118], задачи с эффектом Фуллера [65,122] и др.). Эти задачи лучше рассматривать в классе ЛДС, учитывая при помощи штрафных слагаемых, что любое переключение управления требует некоторых затрат. При этом задача регуляризируется, и ее решение становится более практичным.

Таким образом, задача (В.1)-(В.5) оптимального управления ЛДС, поставленная автором в 1992 г. в [17], была новой в теории оптимального управления. К настоящему времени достигнуты вполне исчерпывающие теоретические результаты: получены необходимые и достаточные условия оптимальности.

Необходимые условия оптимальности ослабляются в случае процессов с мгновенными многократными переключениями автоматной части. При недопустимости малых кусочно-постоянных вариаций 5у(-) приходим к системе неравенств для промежуточных состояний автоматной части ЛДС, что усложняет решение задачи.

Отметим, что с методической точки зрения (в случае однократных переключений автоматной части) доказательство проводится теми же средствами, что и доказательство принципа максимума. Вывод условий, относящихся к автоматной части, оказывается даже проще, поскольку множество допустимых вариаций значительно уже игольчатых. При этом задача (В.1)-(В.5), как показано выше, является более общей, чем классическая задача оптимального управления [103]. Для случая мгновенных многократных переключений вывод дополняется соответствующим предельным переходом.

Для получения достаточных условий оптимальности управления ЛДС использовался подход, развитый в работах Кротова В.Ф., Гурмана В.И. (например, [55,76]). Применение этого подхода к решению задачи синтеза оптимальных логико-динамических систем имеет новые особенности, связанные с дифференциальными свойствами синтезируемой функции. В рассматриваемой задаче функция цены, в отличие от функции Беллмана, может иметь разрывы, а в области непрерывности оказывается квазидифференцируемой [57,58,68,70, 107,108]. Это отражается в форме и в доказательстве условий оптимальности. Важным обстоятельством является наличие у оптимальных процессов мгновенных многократных переключений автоматной части, что усложняет структуру функции Беллмана и условия оптимальности. Для проблемы аналитического конструирования оптимальных регуляторов в классе логико-динамических систем на основе достаточных условий оптимальности были получены оптимальные законы замкнутого управления с учетом мгновенных многократных переключений автоматной части. Для динамической части оптимальное управление реализуется линейным регулятором, как и в классическом случае. Однако для логической части оптимальный закон управления находится как решение системы рекуррентных уравнений. В некоторых случаях оптимальный процесс имеет бесконечное число мгновенных переключений (происходящих в один и тот же момент времени), а оптимальный закон управления определяется в результате предельного перехода.

Вместе с задачей (В.1)-(В.5) управления при полной информации рассматривается задача управления ЛДС в условиях параметрической неопределенности. Предполагается, что состояние ЛДС в каждый момент времени точно не известно, а известно целое множество возможных состояний, т.е. речь идет об управлении пучком траекторий [4,79,93,95,98,114,154]. Синтез управления ЛДС производится с целью минимизации среднего или максимального значений показателя качества управления изолированной траекторией. Другими словами, синтезируется либо оптимальное гарантирующее [79] управление, либо управление, оптимальное в среднем [93]. Эти два подхода к задачам управления пучками траекторий непрерывных систем являются наиболее исследованными и важными для практики. Первый подход - минимаксный - происходит от дифференциальных игр [2,4,70,73,74,79,92,101,117,127, 129,154] и предусматривает нахождение управления, гарантирующего наилучший результат при наиболее неблагоприятном стечении обстоятельств. Второй подход - вероятностный [5, 11,44,69,77,86,93,98,99,105,106,121,129,143,157], при котором предполагается оценивать качество управления пучком траекторий средним значением функционала качества управления одной траекторией. Оба направления объединяются при вероятностно-гарантирующем подходе [85]. В диссертации рассматривается частный случай, когда в процессе функционирования никаких неопределенных воздействий на систему случайного или детерминированного характера нет, а пучки траекторий порождаются только неопределенностью начального состояния системы. Эти задачи обычно называют задачами с параметрической неопределенностью.

В теории позиционных дифференциальных игр принята гипотеза информированности, при которой не предполагается знание управления противника (внешнего воздействия), как в [2], однако считается возможным использовать в алгоритмах управления в каждый момент времени полную информацию о состоянии системы. В рамках принятой гипотезы информированности получены теоретические результаты, методы и приемы построения экстремальных конструкций, которые потом использовались и при более слабых условиях информированности. К этим результатам относятся: методы экстремального прицеливания, теорема об альтернативе в игре сближения-уклонения, необходимые и достаточные условия существования кусочно-гладкой цены игры, способы построения стабильных множеств, методы вычисления цены игры (см. [73,74,117] и другие работы школы акад. Красовского H.H.).

Другая гипотеза информированности заключается в том, что алгоритмы управления строятся на основе информации о множестве возможных в данный момент времени состояний системы. В [74] было показано, что выбором в качестве пространства позиций подходящего функционального пространства задачу гарантированного управления пучком траекторий можно свести к позиционной дифференциальной игре, однако такая игра, естественно, оказывается гораздо более сложной, чем игры с доступной точной информацией о состоянии системы. Выбор пространства позиций определяется формой описания множеств возможных состояний системы. Для описания таких подмножеств конечномерного пространства состояния использовались опорные функции [74,79], а также различные аппроксимации: параллелепипедами [70] или эллипсоидами [127]. Другой подход к построению алгоритмов управления состоит в получении оценки действительного состояния системы по множеству возможных состояний методами минимаксной фильтрации [78,85,86]. Применение различных аппроксимаций или оценочных процедур приводит к формированию субоптимальных алгоритмов управления.

Наиболее слабая гипотеза информированности - полное отсутствие дополнительной информации о состоянии системы, получаемой в процессе движения - соответствует задаче программного управления. Необходимые условия оптимальности гарантирующего управления получены для линейных [79] и нелинейных [4,93] систем. Достаточные условия оптимальности получены для линейных систем в [79] и для выпуклых задач в [154].

Перейдем к задаче оптимального в среднем управления, которая в диссертации понимается как частный случай задачи управления стохастическими системами при случайных начальных условиях и при отсутствии случайных воздействий в процессе движения. Наиболее сильная гипотеза информированности - предположение о доступной точной информации о состоянии системы - позволяет формировать закон управления с полной обратной связью, который находится в результате решения уравнения Беллмана для стохастических систем. Вопросам существования и единственности решения, а также приближенным методам решения этого уравнения посвящены работы [77,121,129]. Для линейных систем наиболее полные результаты в этой области представлены в работах [5,44]. Заметим, что при гипотезе полной информации оптимальное управление пучком складывается из оптимальных для каждой его траектории управлений, поэтому проблема описания, оценивания или аппроксимации множества возможных состояний здесь не возникает.

Задачу управления системой, динамика которой описывается стохастическими дифференциальными уравнениями, как правило, сводят к задаче управления решениями уравнения Фоккера - Планка - Колмогорова [106], описывающего эволюцию плотности вероятности случайного процесса. Этот прием описания позиции системы при помощи функции (в данном случае одномерной плотностью вероятности) характерен для задач управления системами с распределенными параметрами. При отсутствии случайных воздействий в процессе управления плотность вероятности удовлетворяет уравнению Лиувилля [93].

Наиболее слабая гипотеза информированности — отсутствие информации о текущем состоянии системы - используется в работах [4,69,93]. В них получены необходимые и достаточные условия оптимальности в среднем программного управления.

Перечисленные выше результаты относятся, в основном, к задачам управления непрерывными системами. Задачи оптимального гарантирующего и оптимального в среднем управлений ЛДС в условиях неопределенности, по-видимому, впервые обсуждались на конференциях [20,21]. Достаточные условия субоптимального управления получены в [27].

Для управления пучками траекторий ЛДС предлагается использовать оптимальное управление с обратной связью, в котором вместо неизвестного состояния системы подставляется его оценка (либо оптимальная гарантирующая, либо оптимальная в среднем). Таким образом, для управления пучком траекторий предлагается применять оптимальное управление для одной, специальным образом выбранной, траектории системы. Разумеется, что получаемое таким способом управление пучком является субоптимальным. Однако оно может оказаться удовлетворительным для практики. Такой подход к синтезу оптимального управления аналогичен применяемому в стохастических системах [80,96-99,109,110,121,125,143], когда для управления пучком траекторий используют оптимальное замкнутое управление для математического ожидания состояния системы. Обоснование этого метода опирается на теорему разделения [83,109], которая справедлива не для всех систем [75]. На практике такой подход часто применяется даже и без обоснования.

Представляют интерес задачи, в которых субоптимальное управление пучком оказывается оптимальным. Достаточным условием такого совпадения является гипотеза об оптимальности эффективных управлений [ 16,19-21,27]. Для пучка траекторий рассматриваются два множества программных управлений. Первое множество - множество оптимальных управлений - образуют оптимальные программные у правления для каждой изолированной траектории пучка. Второе множество - множество слабо эффективных управлений - включает такие программные управления, которые нельзя улучшить сразу для всех траекторий пучка. Равенство этих двух множеств, а именно в этом и состоит гипотеза об оптимальности эффективных управлений, является достаточным условием для того, чтобы субоптимальное управление пучком траекторий оказалось оптимальным. На основании этого подхода доказано, что субоптимальное в среднем или субоптимальное гарантирующее управления пучком траекторий линейной непрерывной системой с квадратичным критерием качества совпадают с оптимальными управлениями некоторыми траекториями пучка. Причем оптимальное в среднем управление совпадает с оптимальным управлением для траектории, исходящей из центра тяжести множества возможных начальных состояний [93]. Этот результат теперь распространен на ЛДС и непрерывно-дискретные системы [27,30-32].

Таким образом, в диссертационной работе решена новая, поставленная автором, проблема (В.1)-(В.5) оптимального управления ЛДС, имеющая важное теоретическое значение в области оптимального управления. Полученные теоретические результаты имеют практическую направленность и могут быть использованы при создании систем автоматического управления.

На защиту выносятся следующие основные результаты:

1) необходимые условия оптимальности управления ЛДС;

2) достаточные условия оптимальности управления ЛДС;

3) открытие нового типа минимизирующих последовательностей, приводящих к процессам с мгновенными многократными переключениями автоматной части;

4) достаточные условия субоптимальности и оптимальности управления ЛДС в условиях параметрической неопределенности.

Диссертационная работа состоит из введения, трех разделов основной части, заключения, списка использованных источников.

Заключение диссертация на тему "Оптимальное управление логико-динамическими системами"

3.4. ВЫВОДЫ

1. Разработана математическая модель важного класса гибридных систем управления в условиях параметрической неопределенности. Поставлены задачи оптимального и субоптимального управлений пучками траекторий детерминированной ЛДС. В качестве субоптимального управления пучком траекторий предлагается использовать управление, оптимальное для одной, специальным образом выбранной траектории.

2. Получены достаточные условия субоптимального в среднем и субоптимального гарантирующего управления пучком траекторий, в основе которых лежит предложенное автором обобщение функции Беллмана.

3. Показано, что для линейной ЛДС с квадратичным критерием качества субоптимальные управления оказываются оптимальными, что является нетривиальным обобщением известных результатов для линейных непрерывных систем.

ЗАКЛЮЧЕНИЕ

Основным итогом диссертационной работы является создание теории оптимального управления логико-динамическими системами и методов ее применения в новых актуальных приложениях, в том числе задачах авиационной и ракетно-космической техники, выразившееся в следующих научных результатах:

1. Разработана новая математическая модель логико-динамических систем, описывающая широкий класс гибридных систем автоматического управления, качество управления которых оценивается функционалом, учитывающим переключения логической части. Показано, что такая конструкция функционала отвечает потребностям практики.

2. Доказаны необходимые условия оптимальности логико-динамических систем, проведен анализ их применимости для синтеза оптимального программного управления.

3. Доказаны достаточные условия оптимальности логико-динамических систем, разработана методика их применения для синтеза оптимального позиционного управления.

6. Доказаны достаточные условия субоптимального в среднем и субоптимального гарантирующего управления пучком траекторий детерминированных логико-динамических систем. Показано, что для линейно-квадратичной задачи субоптимальные управления оказываются оптимальными.

7. Решена задача активной стабилизации колебаний спутника с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя.

Библиография Бортаковский, Александр Сергеевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Аграчев A.A., Сачков Ю.Л. Геометрическая теория управления. М.: ФИЗМАТЛИТ, 2005. 392 с.

2. Айзеке Р. Дифференциальные игры. М.: Мир, 1967. — 480 с.

3. Алексеев В.М., Тихомиров В.М., Фомин C.B. Оптимальное управление. — М.: Наука, 1979.-432 с.

4. Ананьина Т.Ф. Задача управления по неполным данным // Дифференциальные уравнения. 1976. - Т. 12. - №4. - С.612-620.

5. Аоки М. Оптимизация стохастических систем. М.: Наука, 1971. — 424 с.

6. Арутюнов A.B. К теории принципа максимума в задачах оптимального управления с фазовыми ограничениями //ДАН СССР. 1989. -Т.304. -№ 1. - С. 11-14.

7. Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. М.: Факториал, 1997.-254 с.

8. Арутюнов A.B., Магарил-Ильяев Г.Г., Тихомиров В.М. Принцип максимума Понтря-гина: Доказательство и приложения. М.: Факториал, 2006. 144 с.

9. Белецкий В.В. Движение искусственного спутника относительно центра масс. М.: Наука, 1975.-416 с.

10. Беллман Р. Динамическое программирование. М.: ИЛ, 1960. - 400 с .

11. Богуславский И.А. Прикладные задачи фильтрации и управления. М.: Наука, 1983. -400 с.

12. Болтянский В.Г. Достаточные условия оптимальности и обоснование метода динамического программирования // Известия АН СССР. Сер. Математика. 1964. — Т.28. - №3. - С.418-514.

13. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969.-408 с.

14. Болтянский В.Г. Оптимальное управление дискретными системами. — М.: Наука, 1973.-448 с.

15. Бортаковский A.C. Управление детерминированными системами в условиях неопределенности при оптимальности эффективных управлений / Управление и навигация ЛА в условиях параметрической неопределенности. М.: Изд-во МАИ, 1991. С. 18-23.

16. Бортаковский A.C. Достаточные условия оптимальности управления детерминированными логико-динамическими системами. // Информатика. Сер. Автоматизация проектирования. М.: ВНИИМИ, 1992. - Вып. 2-3. - С.72-79.

17. Бортаковский A.C. Оптимальное управление логико-динамическими системами // Научная сессия МИФИ-2000. Сб. науч. трудов. Т.2. М.: МИФИ, 2000. - С. 122-123.

18. Бортаковский A.C. Управление логико-динамическими системами в условиях неопределенности // Международная школа по динамическим и управляемым системам, г. Суздаль, 2001. Тезисы докладов. Владимир: ВГУ, 2001. — С. 12-17.

19. Бортаковский A.C. Оптимальное конструирование автоматной части логико-динамических систем // Второй международный конгресс "Нелинейный динамический анализ", г. Москва, 2002. Тезисы докладов. - М.: Изд-во МАИ, 2002. - С.104.

20. Бортаковский A.C. Достаточные условия оптимальности автоматной части логико-динамической системы // Известия РАН. Теория и системы управления, 2006, №6. С.77-92.

21. Бортаковский A.C. Субоптимальное управление логико-динамическими системами в условиях параметрической неопределенности // Автоматика и телемеханика. 2007. - №11. -С.105-121.

22. Бортаковский A.C. Необходимые условия оптимальности управления логико-динамическими системами // Известия РАН. Теория и системы управления, 2007, №6. -С. 16-33.

23. Бортаковский A.C. Необходимые условия оптимальности автоматной части логико-динамической системы // Тр. МИАН. 2008. - Т.262. - С.50-63.

24. Бортаковский A.C. Оптимальное и субоптимальное управления пучками траекторий детерминированных непрерывно-дискретных систем // Известия РАН. Теория и системы управления. 2009. -№1. - С. 18-33.

25. Бортаковский A.C. Оптимальное и субоптималыюе управления пучками траекторий детерминированных логико-динамических систем // Известия РАН. Теория и системы управления. 2009. - №6. - С.27-45.

26. Бортаковский A.C. Синтез логико-динамических систем на основе достаточных условий оптимальности // Известия РАН. Теория и системы управления. 2010.-№2 - С.54-68.

27. Бортаковский A.C., Волокитин Д.А. Синтез автоматной части оптимальной логико-динамической системы // Международная конференция по дифференциальным уравнениям и динамическим системам, г. Суздаль, 2002. Тезисы докладов. - Владимир: ВГУ, 2002. -С.39-40.

28. Бортаковский A.C., Пантелеев A.B. Достаточные условия оптимальности управления непрерывно-дискретными системами // Автоматика и телемеханика. 1987. - №7. - С.57-66.

29. Бортаковский A.C., Пегачкова Е.А. Синтез оптимального управления линейными логико-динамическими системами // "Труды МАИ", №27. http://www.mai.ru (25.04.2007)

30. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Международная конференция по математической теории управления и механике, г. Суздаль, 2007. Тезисы докладов. - Владимир: ВГУ, 2007. - С. 18.

31. Бортаковский A.C., Пегачкова Е.А. Синтез управления активной стабилизацией спутника на основе необходимых условий оптимальности логико-динамических систем // Вестник Московского авиационного института. 2008. - Т. 15. - № 2. - С.28-35.

32. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и программного обеспечения". М.: Изд-во МИРЭА, 2008. - С. 102-107.

33. Бортаковский A.C., Семенов В.В. Оптимальное конструирование траекторий детерминированных логико-динамических систем / Междувед. сб. науч. тр. "Проблемы математики в физико-технических и экономических задачах". М.: Изд-во МФТИ, 1993. - С.4-10.

34. Брайсон А., Хо-Ю-Ши. Прикладная теория оптимального управления. М.: Мир, 1972.-544 с.

35. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. - 624 с.

36. Васильев С.Н., Жерлов А.К., Федосов Е.А., Федунов Б.Е. Интеллектное управление динамическими системами. М.: Физматлит, 2000. 352 с.

37. Васильев Ф.П. Методы решения экстремальных задач. М.: Наука, 1981. - 400 с.

38. Вязгин В.А. К обоснованию достаточных условий оптимальности в методах Вейерштрасса и Гамильтона Якоби - Беллмана // Автоматика и телемеханика. - 1 984. -№4. - С.31-38.

39. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. Минск, Наука и техника, 1974. - 272 с.

40. Габасов Р., Кириллова Ф.М. Основы динамического программирования. Минск. Изд-во БГУ, 1975.-264 с.

41. Грачев Н.И., Евтушенко Ю.Г. Библиотека программ для решения задач оптимального управления // Ж-л вычислит, математика и матем. физики. 1979. — Т. 10. - №2. - С.367-387.

42. Гурман В.И. Об оптимальных траекториях реактивного аппарата в центральном поле. // Космические исследования. 1965. - T.III. - Вып.З. — С.368-373.

43. Гурман В.И. Об оптимальных переходах между компланарными эллиптическими орбитами в центральном поле // Космические исследования. — 1966. T.IV. - Вып.1. - С.26-39. 54. Гурман В.И. Вырожденные задачи оптимального управления. - М.: Наука, 1977. -304 с.

44. Гурман В.И. Принцип расширения в задачах управления. М.: Наука,1985. - 288 с.

45. Гурман В.И. Модели и условия оптимальности для гибридных управляемых систем // Известия РАН. Теория и системы управления. 204.-№4- С.70-75.

46. Демьянов В.Ф., Васильев JI.B. Недифференцируемая оптимизация. М.: Наука, 1981. - 384 с.

47. Демьянов В.Ф., Рубинов A.M. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. - 432 с.

48. Дубовицкий А.Я., Милютин A.A. Задачи на экстремум при наличии ограничений // Ж-л вычислит, математика и матем. физики. 1965. - т.5. - №3. - С.395-453.

49. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. -М.: ФИЗМАТЛИТ, 2000. 256 с.

50. Емельянов C.B. Системы автоматического управления с переменной структурой. -М.: Наука, 1967.-336 с.

51. Жук К.Д., Тимченко A.A., Даленко Т.И. Исследование структур и моделирование логико-динамических систем. — Киев: Наукова думка, 1975. 199 с.

52. Завалищин С.Т., Сесекин А.Н. Импульсные процессы. Модели и приложения. М.: Наука, 1991.-256 с.

53. Зеликин М.И. Оптимальное управление и вариационное исчисление. М.: Едиториал УРСС, 2004.-160 с.

54. Зеликин М.И., Борисов В.Ф. Синтез оптимальных управлений с накоплением переключений // Итоги науки и техники. Сер. Современная математика и ее приложения. Тематический обзор. 2002. - т.90. - С.5-189.

55. Иванов Н.М., Мартынов А.И. Управление движением космического аппарата в атмосфере Марса. М.: Наука, 1977. - 416 с.

56. Иванов В.А., Ющенко A.C. Теория дискретных систем автоматического управления. -М.: Наука, 1983.-336 с.

57. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. 480 с.

58. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. — М.: Наука, 1975.-432 с.

59. Кейн В.М. Оптимизация управления по минимаксному критерию. М.: Наука, 1985. — 248 с.

60. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.-280с.

61. Колмогоров А.Н., Фомин C.B. Элементы теории функций и функционального анализа. M.: Наука, 1972. 496 с.

62. Красовский H.H. Управление динамической системой. Задача о минимуме гарантированного результата. -М.: Наука, 1985. 520 с.

63. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. M.: Наука, 1974.-456 с.

64. Краснощеченко В.И., Крищенко А.П. Нелинейные системы: геометрические методы анализа и синтеза. М.: Изд-во МГТУ им. Баумана, 2005. - 520 с.

65. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.-446 с.

66. Крылов Н.В. Управляемые процессы диффузионного типа. М.: Наука, 1977. 399 с.

67. Куржанский А.Б. Оптимальные системы с импульсными управлениями // Дифференциальные игры и задачи управления. УНЦ АН СССР. - 1975. - С.131-156.

68. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.-392 с.

69. Лебедев A.A., Красильщиков М.Н., Малышев В.В. Оптимальное управление движением космических летательных аппаратов. М.: Машиностроение, 1974. - 292 с.

70. Летов A.M. Динамика полета и управление. М.: Наука, 1973. - 390 с.

71. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.Наука, 1972. -576 с.

72. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. М.: Наука, 1974. -696 с.

73. Лурье К.А. Оптимальное управление в задачах математической физики. М.: Наука, 1975.-478 с.

74. Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами. М.: Машиностроение, 1987. - 302 с.

75. Малышев В.В., Красильщиков М.Н., Карлов В.И. Оптимизация наблюдений и управления летательных аппаратов. М.: Машиностроение, 1989. 311 с.

76. Марков A.A. Некоторые примеры решений специального класса задач на наибольшие и наименьшие количества// Сообщ. Харьковск. мат. о-ва. 1887. Т.1.

77. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. М. Наука, 2004. - 493 с.

78. Моисеев H.H. Численные методы в теории оптимальных систем. М.: Наука. 1971. -424 с.

79. Натансон И.П. Теория функций вещественной переменной. М.: Гостехтеориздат, 1957.-552 с.

80. Никольский М.С. Приближенное вычисление наименьшей гарантированной оценки в линейных дифференциальных играх с фиксированной продолжительностью // Прикладная математика и механика. 1982. - Т.46. - №4. - С.691-693.

81. Овсянников Д.А. Математические методы управления пучками. Л.: Изд-во Ленингр. ун-та, 1980.-223 с.

82. Пантелеев A.B. Достаточные условия оптимальности управления дискретными детерминированными системами с ограниченным составом точных измерений // Автоматика и телемеханика. 2007. - №4. - С.67-78.

83. Пантелеев A.B., Бортаковский A.C. Теория управления в примерах и задачах. М.: Высшая школа, 2003. — 583 с.

84. Пантелеев A.B., Руденко Е.А., Бортаковский A.C. Нелинейные системы управления. М.: Вузовская книга, 2008. - 312 с.

85. Пантелеев A.B., Семенов В.В. Достаточные условия оптимальности управления детерминированными системами с ограниченным составом точных измерений // Автоматика и телемеханика. 1983. - №9. - С.67-75.

86. Пантелеев A.B., Семенов В.В. Синтез оптимальных систем управления при неполной информации. М.: Изд-во МАИ, 1992. - 192 с.

87. Параев Ю.И. Введение в стохастическую динамику процессов управления и фильтрации. М.: Сов. радио, 1976. - 184 с.

88. Первозванский A.A. Курс теории автоматического управления. М.: Наука, 1986. -616 с.

89. Петросян Л.А., Томский Г.В. Дифференциальные игры с неполной информацией. — Иркутск, Изд-во Иркутского ун-та, 1984. 187 с.

90. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1977. -332 с.

91. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз, 1961. — 392 с.

92. Пропой А.И. Элементы теории оптимальных дискретных систем. М.: Наука, 1973. -256 с.

93. Пугачев B.C. Теория вероятностей и математическая статистика. М.: Наука, 1979. -496 с.

94. Пугачев B.C., Синицын И.Н. Стохастические дифференциальные системы. Анализ и фильтрация. М.: Наука, 1990. - 632 с.

95. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980. -320 с.

96. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1982. - 144 с.

97. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1977. - 552 с.

98. Румянцев Д.С., Хрусталев М.М. Численные методы синтеза оптимального управления для стохастических динамических систем диффузионного типа // Известия РАН. Теория и системы управления, 2007, №3. С.27-38.

99. Семенов В.В. Динамическое программирование в синтезе логико-динамических систем // Приборостроение. 1984. №9. - С.71-77.

100. Семенов В.В., Бортаковский A.C. Оптимальное управление детерминированными логико-динамическими системами // Междувед. сб. науч. трудов "Проблемы математики в задачах физики и техники". М.: Изд-во МФТИ, 1992. - С. 135-140.

101. Семенов В.В., Бортаковский A.C., Руденко Е.А. Оптимальные управление и конечномерное оценивание состояния логико-динамических систем / Труды Второго международного симпозиума "ИНТЕЛС'96". М.: Изд-во РУДН-ПАИМС, 1996. - Т.1. - С.124-129.

102. Семенов В.В. Пантелеев A.B., Руденко Е.А., Бортаковский A.C. Методы описания, анализа и синтеза нелинейных систем управления / Учебное пособие. -М.: Изд-во МАИ, 1993.-312 с.

103. Семенов В.В., Репин В.М., Журина Н.Э. Алгоритмизация процессов управления летательными аппаратами в классе логико-динамических систем. М.: МАИ, 1987. - 50 с.

104. Сиротин А.Н. Об одном способе синтеза управления для класса дискретных систем с ограничениями // Известия РАН. Теория и системы управления, 2007, №4. С.43-55.

105. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.-288 с.

106. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.-488 с.

107. Федунов Б.Е. Проблемы разработки бортовых оперативно-советующих систем для антропоцентрических объектов // Известия РАН. Теория и системы управления. 1996. -№5. - С.147-160.

108. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985.-223 с.

109. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978. - 318 с.

110. Фуллер А.Т. Оптимизация релейных систем регулирования по различным критериям качества // Труды I Международного конгресса IF АС. М.: Изд-во АН СССР. - 1961. -С.584-605.

111. Хрусталев М.М. Необходимые и достаточные условия для задачи оптимального управления // Доклады АН СССР. 1973. - Т.211. - №1. - С.59-62.

112. Хрусталев М.М. Необходимые и достаточные условия в форме уравнения Беллмана //Доклады АН СССР. 1978. - Т.242. - №5. - С. 1023-1026.

113. Хрусталев М.М., Савастюк C.B. Условия оптимальности стохастических систем диффузионного типа в задачах с ограничениями на процесс управления-наблюдения // Доклады АН СССР. 1990. - Т.311. - №2. - С.291-295.

114. Чебыкин JI.C. Условия оптимальности дискретно-непрерывных систем // Оптимальное управление системами с неопределенной информацией. Свердловск: УНЦ АН СССР, 1980.-С. 132-140.

115. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука, 1988. 320 с.

116. Черноусько Ф.Л., Баничук Н.В. Вариационные задачи механики и управления. М.: Наука, 1973.-238 с.

117. Черноусько Ф.Л., Колмановский В.Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978. - 351 с.

118. Черноусько Ф.Л., Меликян A.A. Игровые задачи управления и поиска. М.: Наука, 1978.-270 с.

119. Цыпкин Я.З., Попков Ю.С. Теория нелинейных импульсных систем. М.: Наука, 1973.-414 с.

120. Agrachev A.A, Liberzon D. Lie-algebraic stability for switched systems // SIAM J. Control Optim. 2001. - v.40. - p.253-270.

121. Axelsson H., Boccadoro M., Egerstedt M., Valigi P., Wardi Y. Optimal Mode-Switching for Hybrid Systems with Varying Initial States // Journal of Nonlinear Analysis: Hybrid Systems and Applications. 2008. - Vol.2. - No.3. pp.765-772.

122. Axelsson H., Wardi Y., Egerstedt M., Verriest E. Gradient Descent Approach to Optimal Mode Scheduling in Hybrid Dynamical Systems // Journal of Optimization Theory and Applications. 2008. - Vol.136. -No.2. pp. 167-186.

123. Bortakovskii A.S. Sufficient conditions of optimality of logic-dynamical systems // Международная конференция по дифференциальным уравнениям и динамическим системам. Суздаль, 2000. Владимир: ВГУ, 2000. - С.21.

124. Bortakovskii A.S., Volokitin D.A. Synthesis of the automaton part of optimal logic-dynamical system. // Journal of mathematical sciences. 2005. - v. 126. - №6. - p. 1536-1541.

125. Brockett R.W. Hybrid models for motion control systems // Perspectives in the Theory and its Applications. Boston, Birkhauser, 1993. - p.29-53.

126. Cassandras C.G., Pepyne D.L., Wardi Y. Optimal control of a class of hybrid systems // IEEE Trans. Aut. Con. 2001. v.46. -N 3, P. 398-415.

127. Engell S., Frehse G., Schnieder E. Modeling, analysis and design of hybrid systems. -Springer, 2002. 504 p.

128. Fleming W.H. Optimal control of partially observable diffusions // SIAM. J. Control. -1968. v.6. -№2. - p.194-214.

129. Hedlund S., Rantzer A. Optimal control of hybrid systems // Proceedings of the 38th IEEE Conference on Decision and Control (Phoenix, AZ). 1999. - p.3972-3977.

130. Hybrid Systems / Ed. by R.L.Grossman, A.Nerode, A.P.Ravn, H.Rischel. Berlin, Springer, 1993. (Lect. Notes in Computer Science. - v.736).

131. Hybrid Systems. III. / Ed. by R.Alur, T.A.Henzinger, E.D.Sontag. Berlin, Springer, 1996. (Lect. Notes in Computer Science. - v. 1066).

132. H ybrid S ystems. V. / E d. b у P .Ahtsaklis, W .Kohn, M .Lemmon, A .Nerode, S .Sastry. -Berlin, Springer, 1999. (Lect. Notes in Computer Science. — v.1567).

133. Isaev K.V. Optimal control of discrete-continuous system // Kibern. Vychisl. Tek. -1988.-No. 79. — p.45-51.

134. Li Z., Soh Y., Wen C. Switched and impulsive systems: Analysis, design and applications. Berlin: Springer, 2005. - 271 p.

135. Liberzon D. Switching in Systems and Control. Berlin: Springer, 2003. - 252 p.

136. Matveev A.S., Savkin A.V. Qualitative theory of hybrid dynamical systems. Boston: Birk-hauser, 2000. 364 p.

137. Modelling and Analysis of Logic Controlled Dynamic Systems: IF AC Workshop. -Irkutsk: Inst. Syst. Dyn. and Control Theory. Sib. Branch RAS, 2003.

138. Savkin A.V., Evans R.J. Hybrid dynamical systems: Controller and sensor switching problems. Boston: Birkhauser, 2002. - 364 p.

139. Schmitendorf W.E. Minimax control of systems with uncertainty in the initial state and in the state equations. // IEEE Trans, on Autom. Control. 1977. -v.22. - №3. - p.439-443.

140. Silva G.N., Vinter R.V. Necessary conditions for optimal impulsive control problems // SLAM. J. Control and Optim. 1997. - v.35. -No. 6. -p.1829-1846.

141. Vinter R.B. New global optimality conditions in optimal control theory // SIAM. J. Control and Optim. 1983. - v.21. - №2. - p.235-245.

142. Wonham W.M. On the separation theorem of stochastic control. J. SIAM Control. 1968. - v.6. - p.312-326.

143. Xu X., Antsaklis PJ. On time optimal control of integrator switched systems with state constrains // J. of Nonlinear Analysis Special Issue on Hybrid Systems. 2005. - v.62. - p.1453-1465.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00