Приближенный синтез логико-динамических систем на основе необходимых и достаточных условий оптимальности

Пегачкова, Елена Александровна

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Приближенный синтез логико-динамических систем на основе необходимых и достаточных условий оптимальности

кандидата физико-математических наук: Пегачкова, Елена Александровна
город: Москва
год: 2012
специальность ВАК РФ: 05.13.01

Диссертация по информатике, вычислительной технике и управлению на тему «Приближенный синтез логико-динамических систем на основе необходимых и достаточных условий оптимальности»

Автореферат диссертации по теме "Приближенный синтез логико-динамических систем на основе необходимых и достаточных условий оптимальности"

На правах рукописи

Пегачкова Елена Александровна

ПРИБЛИЖЕННЫЙ СИНТЕЗ ЛОГИКО-ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ НЕОБХОДИМЫХ И ДОСТАТОЧНЫХ УСЛОВИЙ ОПТИМАЛЬНОСТИ

05.13.01 - Системный анализ, управление и обработка информации (авиационная и ракетно-космическая техника)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

005011553

9 0ЕВ 2012

Москва-2012

Работа выполнена на кафедре «Математическая кибернетика» в Московском авиационном институте (национальном исследовательском университете).

Научный руководитель:

доктор физико-математических наук, профессор Бортаковский Александр Сергеевич

Официальные оппоненты:

доктор физико-математических наук, профессор Грумондз Валерий Тихонович

доктор физико-математических наук, профессор Давыдов Алексей Александрович

Ведущая организация:

Институт программных систем им. А.К.Айламазяна РАН

Защита состоится «2» марта 2012 г. в 12 ч. 30 мин. на заседании Диссертационного совета Д 212.125.04 Московского авиационного института (национального исследовательского университета) по адресу: 125993, Москва, А-80, ГСП-3, Волоколамское шоссе, 4, Ученый совет МАИ.

С диссертацией можно ознакомиться в библиотеке Московского авиационного института (национального исследовательского университета).

Автореферат разослан «¿'■Т'» января 2012 г.

Ученый секретарь Диссертационного совета Д 212.125.04

кандидат физико-математических наук, доцен^^^е^-^-е^М.В. Ротаника

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Диссертационная работа посвящена разработке приближенных методов решения задач оптимального управления логико-динамическими системами и применению этих методов к задачам авиационной и ракетно-космической техники.

Актуальность работы. Исследование гибридных систем является одним из важных направлений современного развития теории и практики оптимального управления. К гибридным относятся системы, в которых непрерывно изменяющиеся компоненты, как правило, отражают физические законы, технологические или технические принципы, а дискретно меняющиеся - моделируют работу устройств управления, например, цифровых автоматов с памятью. Разные классы гибридных систем представлены в работах Емельянова C.B., Уткина В.И. (системы с переменной структурой); Васильева С.Н., Жука К.Д., Тимченко A.A., Федосова Е.А., ФедуноваБ.Е. (логико-динамические системы); Гурмана В.И., Савкина A.B., Семенова В.В., Antsaklis P.J., Brockett R.W., Evans R.J, Hedlund S., Liberzon D., Rantzer A., Rischel H. (переключательные системы).

Логико-динамические системы (ЛДС) можно также отнести к гибридным системам. Динамическая часть ЛДС, задающая движение объекта управления, описывается дифференциальными, а логическая (автоматная) часть, моделирующая работу устройства управления, - рекуррентными включениями или уравнениями. Такая модель применима для описания широкого класса многорежимных систем автоматического управления техническими комплексами, технологическими и экономическими процессами. Частным случаем ЛДС являются системы автоматного типа (CAT), поведение которых описывается рекуррентным включением.

ЛДС отличаются от непрерывно-дискретных систем (НДС) тем, что тактовые моменты времени, в которые происходят изменения состояния логической (автоматной) части ЛДС могут быть произвольными, а в НДС переключения дискретной части происходят в заранее заданные моменты времени. Выбор тактовых моментов считается ресурсом управления ЛДС и подлежит оптимизации. Каждое переключение автоматной части "оценивается", и его "стоимость" учитывается в критерии качества ЛДС. Это, как правило, оказывает регуляри-зирующее влияние на оптимальные процессы, исключая из их числа процессы с бесконечными переключениями.

Важной особенностью оптимизации ЛДС являются минимизирующие последовательности, приводящие к режимам с мгновенными многократными переключениями логической части (происходящими при фиксированном состоянии динамической части системы). Эти режимы не являются редкими исключениями, напротив, они появляются в аналогах хорошо известных задач, например, в задаче управления линейными ЛДС с квадратичным критерием качества.

К настоящему времени достигнуты вполне исчерпывающие теоретические результаты: получены необходимые и достаточные условия оптимачьности ЛДС. Используя эти условия, точное аналитическое решение можно получить

для узкого круга модельных задач. Большинство же задач невозможно решить точно и нужно применять численные методы. Известные методы, разработанные Моисеевым H.H., Черноусько Ф.Л., Тихоновым А.Н., Васильевым Ф.П., Евтушенко Ю.Г., Колмановским В.Б., Крыловым И.А., Федоренко Р.П. и др. для непрерывных или дискретных систем, нельзя применить непосредственно для ЛДС. Приближенные методы решения задачи оптимального управления ЛДС практически отсутствуют. Потребность в разработке таких методов определяется современными задачами проектирования сложных авиационных и ракетно-космических систем.

Целью работы является разработка приближенных методов синтеза ЛДС на основе необходимых и достаточных условий оптимальности ЛДС. В соответствии с целью работы были поставлены и решены следующие задачи:

1) вывод уравнений для синтеза оптимального позиционного управления линейными ЛДС с квадратичным критерием качества и разработка алгоритма приближенного решения этих уравнений;

2) вывод уравнений для синтеза оптимальной конструкции CAT и разработка алгоритма приближенного решения этих уравнений;

3) разработка алгоритма применения необходимых условий оптимальности ЛДС при отсутствии ограничений на вариации состояний логической части системы;

4) решение задач активной стабилизации колебаний спутника и вывода спутника на геостационарную орбиту с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя.

Общие методы исследования. Для решения поставленных задач использовались математическая теория управления, вариационное исчисление, теория дифференциальных уравнений, системный анализ, оптимизация, численные методы. Теоретические результаты получены на основе достаточных условий оптимальности ЛДС, предложенных Бортаковским A.C. Приближенное решение задач управления движением спутника найдено с использованием результатов В.И.Гурмана.

Научная новизна. Полученные в диссертационной работе основные результаты являются новыми, а именно: доказаны достаточные условия оптимальности позиционного управления линейными ЛДС с квадратичным критерием качества, доказаны достаточные условия оптимальности позиционной конструкции CAT, выведены уравнения для нахождения оптимального позиционного управления, разработан алгоритм применения необходимых условий оптимальности ЛДС, решены две прикладные задачи управления спутником с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя.

Практическая значимость диссертационной работы состоит в том, что были разработаны приближенные методы решения актуальных задач оптимального управления ЛДС, которые применимы в областях авиационной и ракетно-космической техники, в робототехнике и экономике. Создано программ-

но-алгоритмическое обеспечение для решения прикладных задач активной стабилизации спутника и вывода спутника на геостационарную орбиту с учетом неэффективных затрат топлива при включении и выключении двигателя.

Достоверность результатов представленных в диссертационной работе, подтверждена строгими математическими доказательствами. Диссертация содержит приближенные и аналитические решения примеров, подтверждающие теоретические результаты. Получены приближенные решения прикладных задач, полностью отвечающие физическим представлениям.

Апробация работы. Результаты диссертационной работы докладывались на 8 Международных конференциях, обсуждались на научных семинарах в Московском авиационном институте. Исследования были поддержаны РФФИ (гранты №№ 05-01-00458-а, 08-01-00157-а) и Министерством образования и науки РФ: АВЦП «Развитие научного потенциала высшей школы» 2009 - 2010 (проекты 2.1.1/2904, 2.1.1/13851); ФЦП "Научные и научно-педагогические кадры инновационной России" на 2009-2013 (Гос. контракт №16.740.11.0047 от 01.10.2010); грант Правительства Москвы 51/ст от 08.07.2008; ФЦП "Научные и научно-педагогические кадры инновационной России" на 2009-2013 гг. (Гос. контракт №02.740.11.0471). Была произведена государственная регистрация разработанных программ (свидетельство № 2011615464 и № 2011616295).

Публикации. Основные результаты диссертации опубликованы в статьях [1-3] в журналах, входящих в Перечень ВАК, в других изданиях [4-10], а также в 12 трудах научных конференций [11-22]. Всего по теме диссертации опубликовано 22 работы.

Структура и объем диссертации. Диссертация состоит из введения, трех разделов основной части, заключения, списка использованных источников (131 наименование) и четырех приложений. Работа изложена на 106 страницах, содержит 22 иллюстрации.

Во введении дается обзор известных задач управления гибридными системами, а также приближенных методов решения задач оптимального управления непрерывными или дискретными системами, указывается область проведенных исследований, обосновывается их научная новизна и актуальность, сформулированы цели и задачи диссертационной работы, представлены положения, выносимые на защиту, излагается краткое содержание диссертации.

В первой главе приведен алгоритм применения необходимых условий оптимальности ЛДС, описываемых соотношениями

где х, у - векторы состояния динамической и логической частей ЛДС, х е X с М", у е У с Кт ; и - вектор управления, и е V с Шр; I е Т = [ /0; Ц ] -

СОДЕРЖАНИЕ РАБОТЫ

х(0 = /(1,х(0,у(1)М0),

у{.1)е¥{1,х{ 0,>'(<-0)),

(1.1) (1.2)

заданный промежуток времени функционирования системы. Для краткости изложения теоретико-функциональные требования к встречающимся функциям, а также некоторые дополнительные предположения и ограничения в автореферате опускаются. Начальное состояние ЛДС задано начальными условиями

*('о) = *о; = (1.3)

Множество Ю(10,х0,у0) допустимых процессов образуют тройки функций (*(■),.КО*"('))> гДе "(О - измеримая ограниченная функция и:Т-*11; у(-) -непрерывная справа кусочно-постоянная функция у:Т-^¥, точки разрыва которой образуют конечное множество (тактовых моментов времени); .х(-) -абсолютно непрерывная функция х:Т^>Х, причем пара функций (*(•)> .КО) удовлетворяет начальным условиям (1.3) и при всех геГ - рекуррентному включению (1.2), атройка (■*(•)>Х'Х"(')) почти всюду на Т -уравнению (1.1).

На множестве ©(/о^о^о) допустимых процессов задан функционал:

/= + Р(х(11),у(11)). (1.4)

тег

Суммирование в выражении (1.4) производится по всем точкам т разрыва функции >•(-). Требуется найти минимальное значение функционала (1.4) и оптимальный процесс (х* (•),>>* (■),«*(•))> на котором это значение достигается.

На основании необходимых условий оптимальности ЛДС 1 разработан алгоритм сведения поставленной задачи к решению краевой задач для канонической системы дифференциальных уравнений с разрывными вспомогательными функциями.

Алгоритм применения необходимых условий оптимальности ЛДС при

неограниченных вариациях состояний логической части системы

1. Составить гамильтониан Н(\\1,1,х,у,и) = ^\\1 j (/,х.у,и)-/°(1,х,у,и).

2. Максимизируя гамильтониан по переменной и, выразить оптимальное управление через состояние системы и вспомогательные переменные

и{(, х, у, \]/) = а^ тах Я(\)/, Г, х, у, и).

иШ

3. Составить систему алгебраических уравнений связывающих состояния логической части системы с состояниями динамической части и вспомогательными переменными в тактовые моменты времени т0,..., Тд,:

1 Бортаковский A.C. Необходимые условия оптимальности управления логико-динамическими системами // Известия РАН. Теория и системы управления, 2007, №6. - С. 16-33.

Т*41

где \н{у(1),1,х(1),ук,и{- g:> (xм,x(xk),yk,yk+l)-

- 8(>{хк,х{хк),ук_^,ук) - "локальное приращение" функционала.

4. Составить краевую задачу, дополнив уравнения движения (1.1) с начальными условиями (1.3) сопряженной системой с терминальными условиями:

х(1) = /(I, х((), у( 0, "(0) > *('о) = .

4/(0 = - я,(\1/(0,/,л(0,К0,и(0). =

В этой системе используется управление м(/) = и(/,.г(0,Х0>чЧ0)> найденное в п.2, а состояния >>(г) = ^(т^), хк<Кхк+\, к = 0,1,...,ЛГ-1, логической части системы берутся, удовлетворяющие системе в п.З.

5. Дополнить систему дифференциальных уравнений, составленную в п.4, условиями скачков вспомогательных переменных

6. Записать уравнения для приращения гамильтониана в тактовые моменты времени:

+ Н(у(1к),тк,х{1к),у(тк),и)-Н{ц(тк),хк,х(хк),у(1к_1),и) = 0, к = 1,

7. Решить краевую задачу, полученную в п.4 с учетом условий в п.5,6.

Система 2п дифференциальных уравнений (п.4) дополнена в каждый из N тактовых моментов времени одним скалярным уравнением и двумя векторными уравнениями для нахождения тактовых моментов времени хк, состояний

у{хк), к = \,...,И, и скачков функции \у(-). Количество N тактовых моментов

времени при помощи необходимых условий установить нельзя. Эту величину нужно искать, например, путем перебора. Для реализации алгоритма применяются численные методы интегрирования дифференциальных уравнений и приближенные методы конечномерной минимизации, так как точное решение можно получить лишь в простейших примерах.

В разделе 1.2 диссертации рассмотрена задача активной стабилизации спутника. Движение спутника вокруг Земли происходит по круговой орбите. В плоскости орбиты ок совершает колебания вокруг центра масс. Для гашения этих колебаний используются реактивные двигатели, расположенные на штанге. Математическая модель колебаний спутника имеет вид

0(0 = ш, 6(/) = -к-8т20 + /-м, ?0 </</,,

где 0 - угол отклонения штанги от местной вертикали; со - угловая скорость вращения спутника; к, / - коэффициенты, зависящие от параметров спутника, /д = 0, - моменты начала и окончания процесса управления. Тяга двигателя и ограничена максимальным значением [/тах: | и | < Стах. Начальное и конечное состояния системы заданы:

Время окончания процесса управления фиксировано. Затраты топлива пропорциональны тяге двигателя

где )х - коэффициент, определяющий секундный расход топлива.

Требуется найти оптимальное управление, минимизирующее этот функционал (постановка задачи для непрерывной динамической системы).

Классическое решение поставленной задачи2 со свободным временем окончания представляет собой последовательность режимов торможения в окрестности положения равновесия, где угловая скорость максимальная. Торможение производится с максимальной тягой двигателя. Чем короче промежуток работы двигателя при каждом включении, тем больше таких включений необходимо сделать для гашения колебаний. Однако общие затраты топлива при этом уменьшаются. В пределе получаем бесконечную последовательность импульсных включений (на бесконечно малое время) двигателя, при этом общее время стабилизации неограниченно возрастает. Разумеется, что это управление, практически не реализуемое, является абстрактным, идеальным решением, показывающим предельные возможности (экономии топлива).

Задача активной стабилизации спутника рассматривалась в классе ЛДС, учитывая, что каждое включение реактивного двигателя от его запуска до достижения максимальной тяги сопровождается расходом топлива и представляет собой немгновенный переходный процесс (как и выключение двигателя). Добавляя в критерий качества соответствующие штрафные слагаемые за включение (и выключение) двигателя, получаем задачу, в которой определяется оптимальное (конечное) количество запусков двигателя, а процессы, требующие бесконечного числа включений, отбрасываются как неоптимальные. Такая постановка задачи ближе к практике, чем классический вариант.

В классе ЛДС кусочно-непрерывное управление и(1) заменяется управлением и(1) = 1/тзху(1), где кусочно-постоянная непрерывная справа функция >•(■): [0,<[]->[-1,1] определяет рабочее состояние двигателя: у = 0 - двигатель

6(0) = 0О, ш(0) = со0, 0(г,) = О, «0(4) = 0.

(1-5)

2 Гурман В.И. Вырожденные задачи оптимального управления. -М: Наука, 1977.

выключен; уф 0 - двигатель включен, а также направление и величину тяги. Качество процесса управления оценивается функционалом

4= [^гаах|>'«|^ + , (1-6)

Ц теЗЧп-))

где А. = 1 — величина "штрафа" за включение и выключение двигателя (что соответствует примерно 5% неэффективному расходу топлива). Суммирование в (1.6) происходит по всем точкам т разрыва функции у(-).

Для задачи минимизации (1.5) в классе непрерывных систем оптимальным оказался режим с 10-ю включениями двигателя. Для минимизация (1.6) в классе ЛДС оптимальным оказался режим с 3-я включениями двигателя.

В разделе 1.3 диссертации рассмотрена задача вывода спутника на геостационарную орбиту (ГСО). В начале движения спутник находится на низкой круговой орбите, с которой его необходимо перевести на ГСО. Уравнения движения спутника имеют вид

2 М и V

р = у, ф = ш, у = рсо -У — + -— .

Р 771Л/ V" + р Ш

ю г/ш

со = —— + —====, т = -1Ш, 10<1<1и Р т^ V + р'со

где р - полярный радиус; ф - полярный угол; V - радиальная составляющая скорости движения спутника; со - угловая скорость вращения спутника; и -величина тяги двигателя, ограниченная максимальным значением {/тах; т -масса спутника (с топливом); М - масса Земли; у - гравитационная постоянная; - коэффициент, определяющий секундный расход топлива. В начальный моменнт времени /0 = 0 состояние системы задано: р(0) = р0, ф(0) = 0, \'(0) = 0, ш(0) = ю0, тф) = т0. В фиксированный конечный момент времени ^ задан полярный радиус р(/1) = р1, а эксцентриситет е(^) = 0. Требуется найти оптимальный процесс, минимизирующий расход топлива:

'о

Классическое решение этой задачи оптимального управления непрерывной системой с нефиксированным временем окончания3 показывает, что активные участки траектории, на которых двигатель включается с максимальной тягой, находятся в окрестности перицентров, при этом продолжительность каждого активно участка стремиться к нулю, а их количество - к бесконечности. При-

5 Гурман В.И. Об оптимальных переходах между компланарными эллиптическими орбитами в центральном иоле // Космические исследования. - 1966. - Т.IV. - Вып. 1. - С.26-39.

меняя принцип максимума к задаче с фиксированным временем окончания, было получено приближенное решение. Оптимальным оказался процесс с 18-ю включениями двигателя: 6 включений в окрестности перигея и 11 - в окрестности апогея (см. рис.1, на осях откладывается расстояние в км).

В классе ЛДС кусочно-непрерывное управление n{t) заменяется управлением м(0 = i/maxiy(<) j где кусочно-постоянная непрерывная справа функция Х-):[0>']]—>[0,1] определяет рабочее состояние двигателя: у = 0 - двигатель выключен; уф 0 - двигатель включен, а также величину тяги. Качество процесса управления оценивается следующим функционалом

!>' (1.7)

to теГ(К0)

где к = 90 - величина "штрафа" за включение и выключение двигателя (что соответствует примерно 5% неэффективному расходу топлива). Суммирование в (1.7) происходит по всем точкам т разрыва функции у(-). При минимизации (1.7) в классе ЛДС оптимальным оказался режим с процесс с 6 активными участками: 4 участка в окрестности перигея и 2 в окрестности апогея (рис.2).

Расход топлива без учета неэффективных затрат составляет 15641 кг. Эта величина превосходит расход топлива 15628 кг, полученный при решении задачи в классической постановке. Однако, если в обеих постановках учитывать неэффективный расход, то в классическом варианте получим 17248 кг, а в классе ЛДС - 16181кг. Таким образом, экономия топлива составляет 1067кг. Кроме того, конструкция разгонного блока "Бриз-М", обеспечивающего выведение спутника на ГСО, позволяет производить не более 8 запусков двигателя, поэтому найденный для ЛДС процесс можно считать практически реализуемым, а в классическом варианте - нет.

Во второй главе рассматривается задача синтеза оптимального управления линейными ЛДС с квадратичным функционалом качества:

x(t) = A(lM/) + B(t)y{t) + C(tMO,

у{х) = г(т) + Вху( т - 0) + С>(т) ,

\[\xr (t)D(t)x(t) + xT(t)G(t)y(t) + \ит (t)Q(t)u(t) ] dt +

'о

+ £ [А.х + + ХГ(Т)С7Т>'(Х - 0) + 4ут(т)Р\у(х) +1 ^(т)0ту(т) ]+

теГ

+ ^ (/,)£,*(/,) + хТ (/, ) +1 / (/, ).

Эта задача обобщает классическую проблему аналитического конструирования оптимальных регуляторов (АКОР) А.М.Летова на ЛДС.

Важная особенность рассматриваемой задачи состоит в том, что оптимальными оказываются процессы с мгновенными многократными переключениями логической части4. Такой процесс получается как предел при е ~> +0 семейства процессов с однократными переключениями. На-

пример, на рис.3,а изображена траектория >>е(-) логической части ЛДС стремя

разрывами в точках т-2е, т-е, т и значениями =_у(т-2е-0),

1 1 з

у ~у{х-2г), у = у(х-е), у = у(т). При £->+0 получаем траекторию у(■)

с трехзначным разрывом в точке т (рис.3,б).

..о

У* У

т-2е 1-Е

6 ^ Рис.3

Множество Ю(1о,х0,у0) допустимых процессов пополняется процессами с конечным числом мгновенных многократных переключений логической части. В каждый тактовый момент времени те? логическая часть совершает £(т) переключений

^-ОЬ^^-.-^Р^Хт) (2.1)

под действием управлений

„(ВД)

согласно уравнению

Бортаковский A.C. Достаточные условия оптимальности автоматной части логико-динамической системы //

Известия РАН. Теория и системы управления, 2006, №6. - С.77-92.

уМ = А,х(х) + B,yltX) + CTvW, Ä: = 1,2,..., А'(т). (2.2)

Функционал оставшихся потерь при мгновенных многократных переключениях имеет вид <1

/0 = \l\xT(t)D{t)x(t) + xT (l)G(t)y{t) + W {t)Q(t)u(t)]dt + в

К{ т) 8<т £=1

+ i(vf )г (t)Otv« ] +1 je7" (/, )Dlx(t,) + )Gu(/,) +1/ (/, )Fxy{t]), (2.3) где суммирование производится по всем точкам разрыва функции у(-) на промежутке [Ö,/i].

Допустимое позиционное управление (u(t,x,y), vk(t,x,y)) для любых начальных условий

х(В) = , у(9 - 0) = , /„ < е < tx, (2.4)

порождает такой процесс (х(-),у(-),и(')>v(-))e®(0>*е>^е)> чт0 в точках непрерывности траектории у(-):

и(0 = и(*,*(0,Х0).

а в каждой точке те?", 0 < х, многозначного разрыва (2.1) переключения происходят согласно (2.2) с управлением

Требуется найти оптимальное позиционное управление u(t,x,y), vk(t,x,y), которое для любых начальных условий (2.4) порождают оптимальный процесс, минимизирующий функционал (2.3).

Теорема 1 (о решении проблемы АКОР в классе ЛДС). Функция цены е задаче АКОР в классе ЛДС, равная минимальному значению функционала оставшихся потерь (2.3)

<p(0)(f-0,*,>>) = min lt(d),

deD(t,x,y)

представляет собой нижнюю огибающую

Ф(0)(/-0, *,>>)= min qik\t,x,y), ■ k=0,1,...

семейства квадратичных образующих

<pw (/,*, у) = ^хТФк (0 * + xT%(t)y +1 / rt (t)y + Yjt('), где к = 0,1,2,...; причем:

-матрицы Фо(0. (0. П)(0 и скалярная функция Уо(0 удовлетворяют

на Т дифференциальным уравнениям:

ф0(О+Ф0ш(О+^7'(ОФо м+т ~ o0(t)c(tyrl(t)crma(i)=о,

%{0 + Ф0{0В(1) + АТ(1)%(0 + С(1)~Ф0(1)С(1)д-\0СТ(0%(()^0, (2.5) Г0(г) + ^ (t)B(t) + Вт- <{t)C(t)Q 1 {t)CT(t)%(t) = 0, Yo(0 = 0;

- в конечный момент времени выполняются терминальные условия'.

Ф0('1) = А. = = Уо(/,) = 0; (2.6)

- при любом фиксированном teT матрацы Фк(0> ^(0. Г*(/) и скалярная функция yk{t) удовлетворяют рекуррентным уравнениям:

Ф^)(0 = ФИ0 + ^(0Л + Af^{{t) + Af[Tk(t) + Ft]At +Dl-Ll(t)Kk(t)Lt(t), Уы (0 = {% (0 + Aj[Yk (0 + F, ]}В, + G,-LTk (t)Kk{t)Mk (?), rk+{{t) = B'f[rk(i) + Ft]Bt-&f[(t)Kk(t)Mk(t), (2.7)

Y*+l(0 = Y* (') + *■,> где k = 0,1,2,...; Kk(/) = {g, + C(r[rfc(t) + F,]C,},

W = Cf{V[(t) + [rk(t) + F,}At}, Mk{t) = Cj[Yk{t) + Ft]Bt;

- оптимальное управление динамической частью имеет вид

«С, у) = - Q"1 (0 сг (/) [Ф„(0* + ВДу]; (2.8)

- оптимальное управление автоматной частью имеет вид

v(k+1k/,x,y) = -Kk(t)[Lk(t)x+Mk(t)yl, к = 0,1,2,...; (2.9)

- оптимальное количество k(t,x,y) переключений автоматной части находится по формуле

k(t,x,y) = argmin(pw(/,x,jO, (2.10)

k=0,1,2,...

- функция <^°\t,x,y) удовлетворяет условию скачка

= (2.11)

В разделе 2.3 разработан алгоритм приближенного решения уравнений (2.5)-(2.11), основная идея которого состоит в следующем. На промежутке [*„,*,] задаются тактовые моменты времени t0 = tq <tj <...<zN = ty Только в эти моменты допускаются разрывы функции у(-), причем разрывы многократные. Решая рекуррентные и дифференциальные уравнения, строятся образующие функции цены, а затем в результате целочисленной минимизации ищется их нижняя огибающая (т.е. функция цены). Такой алгоритм приводит к субоптимальному решению, поскольку тактовые моменты фиксированы, а не свободны. Разработана программа приближенного решения задачи АКОР НДС для систем не выше второго порядка, применимость которой проверена на модельном примере.

В третьей главе рассматривается задача синтеза оптимальных CAT. Поведение детерминированной CAT описывается рекуррентным включением

y(x)eY(x,y(x-0)), (3.1)

где у - вектор состояния системы у е Y a Rm; т - момент изменения состояния (переключения) системы, теУ; ¿Г - конечное множество моментов переключений, ?cf; 7" = [/0;/j] - промежуток времени функционирования системы, t0, - моменты начала и окончания процесса управления заданы. Множество Y(t, у) задает совокупность тех состояний системы, в которые возможен переход из состояния у в момент времени t. Допустимыми процессами считаются непрерывные справа кусочно-постоянные функции у: Т -> У, удовлетворяющие начальному условию _ 0)= Л) и рекуррентному включению (3.1) при всех т £ W, в остальных точках t е Т \ $ функция >'(•) непрерывна. Функция у(-) определяет траекторию движения системы. Множество ©(/д^о) Допустимых процессов (траекторий) пополняется траекториями с многозначными разрывами. Предполагаем, что в каждой точке т е ¿Г система совершает конечное число переключений

у(х - 0) = (т) -> (т)->...-> (т) = у(х). (3.2)

Качество управления оценивается функционалом '1 Ш

l=F(y(h))+ \f\t,y(t))dt+ £ £ s\x,y{k-'\x-Q),y{k\x)), (3.3)

Г о xei *=]

где суммирование ведется по всем точкам т многозначных разрывов функции у(-), в каждой из которых система совершает К(х) мгновенных переключений

(3.2). Требуется найти оптимальную траекторию у*(-)еЮ(10,у0), минимизирующую функционал (3.3).

Вместе с задачей поиска оптимальной траектории рассматривается задача синтеза оптимальной позиционной конструкции CAT. Допустимой позиционной конструкцией CAT называется функция уОъу), которая для каждого начального условия

y(Q~0) = yQ,t0<Q<ti, (3.4)

порождает допустимую траекторию >'(i) = y(t,y(t -0)), 9<i</t. Требуется найти оптимальную позиционную конструкцию y(t,y) CAT, которая для каждого начального условия (3.4) порождает оптимальную траекторию, минимизирующую функционал оставшихся потерь

'1 Ш

h(y('))= F(y(h))+ jf°(t,y(t))dt+Y, £g°(T,y(*",)(T-0),y*)(T))s (3.5)

e 9<T k=1

где суммирование ведется по всем точкам т разрыва функции j(-) на отрезке [6,^], в каждой из которых система совершает К{х) мгновенных переключений (3.2).

Теорема 2 (достаточные условия оптимальности позиционной конструкции CAT). Если существуют функции t.y) и допустимая позиционная конструкция y^\t,y), удовлетворяющие условиям:

а) (At],y) = F(y)-,

б) с= Ф^\tjk\t,y)) + g°(',y,/k)(t,y));

в) 4><l°\t,y) + f0(t,y) = ö;

г) jv) = argш!п'{ф^"'-1 (Lv) + g° (i, >',v)};

veY(t,y)

д) k{t,y)GArgmin^k\t,y)-,

h=0,1,2,...

е)

где k = \,...,k{t,y), то позиционная конструкция y^\l,y) является оптимальной, при этом величина предела слева ф^^О-О,;^) равна минимальному значению функционала оставшихся потерь (3.S)

Ф(0)(6-0,Л)= min /еО*))-Я-^Шуо)

Конструкция у^\г,у) определяет оптимальную последовательность состояний системы в момент многократного переключения

где k = k(t,y) - оптимальное количество переключений системы из состояния y{t-0) = y.

Разработан алгоритм приближенного решения уравнений а)-е), аналогичный описанному в разделе 2.3.

В разделе 3.4 достаточные условия (теорема 2) применены к задаче синтеза оптимальной конструкции CAT с квадратичным критерием качества:

y(t)zRm,

I,0 (>'(•)) = ß / (0Д0Х0 dt + { / (/, )Fiy{tx) + 'o

те? k=1

Рассматриваемая задача аналогична проблеме аналитического конструирования оптимальных регуляторов (АКОР) А.М.Летова, но только для CAT. На основе теоремы 2 доказаны достаточные условия оптимальности CAT с квадратичным критерием качества (теорема 3).

Теорема 3 (о решении проблемы АКОР в классе CAT). Функция цены в задаче АКОР в классе CAT равная минимальному значению функционала оставшихся потерь

Фсо)(/-0,>0= min (3.6)

у()еЩ,у)

представляет собой нижнюю огибающую

Ф(0)и-0,у)= min фЩ,у) (3.7)

¿=0,1,...

семейства квадратичных образующих

<V{k\t,y) = \yTrk(t)y + lk(t), ¿ = 0,1,2,..., (3.8)

где Г^(0 - симметрическая неотрицательно определенная матрица размеров тхт, a y^(i) - скалярная функция, причем'.

-матрица Го(0 и скалярная функция у о (О удовлетворяют на Т дифференциальным уравнениям:

t0(t) + F(t) = 0, у0(/) = 0; (3.9)

- в конечный момент времени выполняются терминальные условия:

ro('i) = F,, Yo(/,) = 0; (3.10)

- при любом фиксированном t £ Т матрица Fj, (/) и скалярная функция у ¿(/) удовлетворяют рекуррентным уравнениям:

С) = -Qj Pkl(t)Qi+Qt, Yt+i(0 = r t(0 + Ä.„ (3-11)

где ¿ = 0,1.2,...; Pf.(t) = Г;.(/) + О, + Ft - симметрическая положительно определенная матрица-,

- оптимальная позиционная конструкция имеет вид

у{к+1\иу) = р;\т,у, к =0,1,2,...; (3.12)

)

- оптимальное количество k(t,y) переключений находится по формуле

k(t,y)=w%mm^k\t,y), (3.13)

¿=0,1,2,...

- функция удовлетворяет условию скачка

if(-0)(t-Q,y) = ^k(-''y))(t,y). (3.14)

Разработана программа приближенного решения уравнений (3.6)-(3.14) задачи синтеза оптимальной позиционной конструкции CAT с квадратичным критерием качества для систем не выше второго порядка, применимость которой проверена на модельном примере.

ОСНОВНЫЕ НАУЧНЫЕ РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ

НА ЗАЩИТУ

Основным итогом диссертационной работы является создание методов приближенного решения задач оптимального управления логико-динамическими системами и их применения в актуальных приложениях в области авиационной и ракетно-космической техники, выразившееся в следующих научных результатах:

1. Доказаны достаточные условия оптимальности позиционного управления линейными логико-динамическими системами с квадратичным критерием качества, выведены уравнения для нахождения оптимального управления, разработан алгоритм приближенного решения этих уравнений.

2. Доказаны достаточные условия оптимальности позиционной конструкции системы автоматного типа, выведены уравнения для нахождения оптимальной конструкции, разработан алгоритм приближенного решения этих уравнений.

3. Доказаны достаточные условия оптимальности систем автоматного типа с квадратичным критерием качества, получены уравнения для синтеза оптимального регулятора в классе систем автоматного типа.

4. Разработан алгоритм применения необходимых условий оптимальности логико-динамических систем при неограниченных вариациях состояний логической части системы.

5. Получено приближенное решение задачи активной стабилизации колебаний спутника с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя.

6. Получено приближенное решение задачи оптимального вывода спутника на геостационарную орбиту с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя.

Публикации в журналах перечня ВАК

1. Бортаковский A.C., Пегачкова Е.А. Синтез управления активной стабилизацией спутника на основе необходимых условий оптимальности логико-динамических систем // Вестник Московского авиационного ииститута - 2008, т.15, №2.-С.28-36.

2. Пегачкова Е.А. Методика приближенного синтеза оптимальных линейных логико-динамических систем // Вестник Московского авиационного института. - 2010, т. 17, № 3. - С.222-225.

3. Бортаковский A.C., Пегачкова Е.А. Синтез оптимального управления линейными логико-динамическими системами при мгновенных многократных переключениях автоматной части. /'/ Современная математика. Фундаментальные направления. 2011, № 42. - С.36-47.

Публикации в других изданиях

4. Пегачкова Е.А. Оптимальный вывод спутника на геостационарную орбиту с учётом неэффективных затрат топлива при включении и выключении двигателя // Электронный журнал "Труды МАИ", 2011. №47. (20.10.2011) -http://mai.ru/science/trudy/published.php

5. Пегачкова Е.А. Приближенный синтез оптимальных систем автоматного типа // Эл. журнал "Труды МАИ", 2011. №49. -

http://mai.ru/science/trudy/published.php

6. Бортаковский A.C., Пегачкова Е.А. Синтез оптимального управления линейными логико-динамическими системами // Электронный журнал "Труды МАИ", 2007. №27. -http;//\vww.inai.ni/science/trudv/published.php (25.04.2007)

7. Бортаковский A.C., Пегачкова Е.А. Оптимальное управление линейными логико-динамическими системами с квадратичным критерием качества // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и программного обеспечения". - М.: Изд-во МИРЭА, 2006. - С.56-61.

8. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и программного обеспечения". - М.: Изд-во МИРЭА, 2008. - С. 102-107.

9. Пегачкова Е.А. Приближенный синтез управления активной стабилизацией спутника на основе необходимых условий оптимальности логико-динамических систем // Обеспечение качества на всех этапах жизненного цикла изделия - М.: Изд-во МАИ-ПРИНТ, 2008. - С.301-305.

10. Пегачкова H.A. Комплекс программ для приближенного синтеза оптимальных линейных логико-динамических систем с квадратичным критерием качества // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и прогр. обеспечения". - М.: Изд-во МИРЭА, 2010. - С.169-174.

Доклады на научных конференциях

11. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Междунар. конф. по математической теории управления и механике, Суздаль, 2007. -Тезисы докладов. - Владимир: ВГУ, 2007.-С. 18.

12. Bortakovskii A.S., Pegachkova Е.А. Optimal automaton component synthesis of logic-dynamical system // Междунар. конф. по дифференциальным уравнениям и динамическим системам, Суздаль, 2008: Тезисы докладов. - Владимир: ВГУ, 2008. - С.277-278.

13. Пегачкова Е.А. Синтез автоматной части логико-динамической системы на основе необходимых и достаточных условий оптимальности // Междунар. конф. по математической теории управления и механике, Суздаль, 2009: Тез. докл. - М: МИАН, 2009. - С.130.

14. Псгачкова Е.А. Приближённый синтез оптимального управления стабилизацией спутника в классе логико-динамических систем // Тезисы докладов всероссийской конференции молодых учёных и студентов "Информационные технологии в авиационной и космической технике". Москва, 2008. -М.: Изд-во МАИ-ПРИНТ, 2008. - С.116-117.

15. Пегачкова Е.А. Синтез оптимальной линейной логико-динамической системы с квадратичным критерием качества. // Тезисы докладов 2-ой Всероссийской конференции молодых специалистов и студентов "Информационные технологии в авиационной и космической технике". Москва, 2009 - М.: Изд-во МАИ-ПРИНТ, 2009. - С.92-93.

16. Пегачкова Е.А. Синтез оптимальной автоматной части логико-динамической системы // Молодёжный симпозиум с международным участием "Теория управления: новые методы и приложения", г. Переславль-Залесский, сентябрь 2009: Тез. докл. - Переславль-Залесский: Изд-во "Университет города Переславля", 2009. - С.52-53.

17. Пегачкова Е.А. Лабораторный практикум "Синтез оптимальной линейной логико-динамической системы с квадратичным критерием качества" // VI Всероссийская конференция студентов, аспирантов и молодых ученых. Технологии Microsoft в теории и практике программирования. Москва, 2009. - Тезисы докладов. - М.: Вузовская книга, 2009 - С. 125.

18. Пегачкова Е.А. Комплекс программ для приближённого синтеза линейных логико-динамических систем // VII Всероссийская конференция студентов, аспирантов и молодых учёных «Технологии Microsoft в теории и практике программирования». Москва, 2010. - Тезисы докладов. - М.: Вузовская книга, 2010. - С.132-133.

19. Pegachkova Е.А. Synthesis of controlling of satellite moving on the basis of necessary optimality conditions of logic-dynamical systems // Междунар. конф. rio дифференциальным уравнениям и динамическим системам, Суздаль, 2010: Тез. докл. -М.: МИАН, 2010. - С.231.

20. Pegachkova Е.А. Approximate synthesis of optimal systems of automate type // Международная конференция по математической теории управления и механике, Суздаль, 2011. - Тезисы докладов. - М: МИАН, 2011. - С.243-244.

21. Бортаковский A.C., Пегачкова Е.А. Оптимальный переход спутника на геостационарную орбиту с учетом неэффективных затрат топлива // Международная конференция "Управление и оптимизация неголономных систем", г. Переславль-Залесский, 2011: Тез. докл. - Переславль-Залесский: Изд-во "Университет города Переславля", 2011. - С.11-13.

22. Пегачкова Е.А. Оптимальный переход спутника с одной орбиты на другую с учетом неэффективных затрат топлива // 10-я Междунар. конф. "Авиация и космонавтика-2011". Москва, ноябрь 2011: Тез. докл. - СПб.: Мастерская печати, 2011 - С. 94-95.

Подписано в печать:

26.01.2012

Заказ № 6562 Тираж -100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru

Текст работы Пегачкова, Елена Александровна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

МОСКОВСКИЙ АВИАЦИОННЫЙ ИНСТИТУТ (национальный исследовательский университет)

61 12-1/532

На правах рукописи

Иегачкова Елена Александровна

ПРИБЛИЖЕННЫЙ СИНТЕЗ ЛОГИКО-ДИНАМИЧЕСКИХ СИСТЕМ НА ОСНОВЕ НЕОБХОДИМЫХ И ДОСТАТОЧНЫХ УСЛОВИЙ

ОПТИМАЛЬНОСТИ

05.13.01 - Системный анализ, управление и обработка информации (авиационная и ракетно-космическая техника)

Диссертация на соискание ученой степени кандидата физико-математических наук

Москва 2012

СОДЕРЖАНИЕ

Введение........................................................................................................................................4

1. Синтез оптимального управления движением спутника на основе необходимых условий оптимальности логико-динамических систем........................................................24

1.1. Необходимые условия оптимальности логико-динамических систем..........................24

1.1.1. Постановка задачи.....................................................................................................24

1.1.2. Необходимые условия оптимальности.....................................................................29

1.1.3. Алгоритм применения необходимых условий оптимальности ЛДС.......................33

1.2. Активная стабилизация спутника с учетом неэффективных затрат топлива................36

1.2.1. Постановка задачи в классе непрерывных систем...................................................37

1.2.2. Применение принципа максимума. Результаты расчетов........................................38

1.2.3. Постановка задачи в классе ЛДС..............................................................................40

1.2.4. Применение необходимых условий оптимальности ЛДС. Результаты расчетов.... 41

1.3. Вывод спутника на геостационарную орбиту с учетом неэффективных затрат топлива.............................................................................................................................46

1.3.1. Постановка задачи в классе непрерывных систем...................................................47

1.3.2. Применение принципа максимума............................................................................49

1.3.3. Методика приближенного решения задачи..............................................................51

1.3.4. Результаты приближенного решения задачи для непрерывной системы................54

1.3.5 Постановка задачи в классе ЛДС...............................................................................56

1.3.6. Применение необходимых условий оптимальности ЛДС.......................................57

1.3.7. Результаты приближенного решения задачи для ЛДС............................................59

1.4. Выводы.............................................................................................................................62

2. Синтез оптимального управления линейными ЛДС с квадратичным функционалом качества...................................................................................................................................63

2.1. Постановки задач.............................................................................................................63

2.1.1. Задача синтеза оптимального программного управления........................................63

2.1.2. Оптимальные процессы с мгновенными многократными переключениями логической части ЛДС..............................................................................................64

2.1.3. Задача синтеза оптимального позиционного управления........................................66

2.2. Достаточные условия оптимальности.............................................................................67

2.3. Алгоритм синтеза субоптимального управления...........................................................71

2.4. Пример.............................................................................................................................73

2.5. Выводы.............................................................................................................................79

3. Синтез оптимальных систем автоматного типа.....................................................................80

3.1. Постановка задачи...........................................................................................................80

3.2. Синтез оптимальной позиционной конструкции системы............................................84

3.3. Алгоритм синтеза субоптимальной позиционной конструкции системы.....................86

3.4. Синтез оптимальной системы с квадратичным критерием качества............................89

3.5. Пример.............................................................................................................................93

3.6. Выводы.............................................................................................................................95

Заключение..................................................................................................................................96

Список использованных источников.........................................................................................97

Приложение А. Описание программного средства "Активная стабилизация спутника с учетом неэффективных затрат топлива"...............................................................................107

Приложение Б. Описание программного средства "Оптимальный вывод спутника на геостационарную орбиту с учётом неэффективных затрат топлива при включении и выключении двигателя"................................................................................................................112

Приложение В. Описание программного средства "Синтез оптимального управления линейными ЛДС с квадратичным функционалом качества"..................................................118

Приложение Г. Описание программного средства "Приближенный синтез системы автоматного типа с квадратичным критерием качества"........................................................127

ВВЕДЕНИЕ

Математическая теория оптимального управления начинает свое развитие в начале 50-х годов 20 века благодаря появлению практических задач, для которых классические методы вариационного исчисления были неприменимы. Особенно много таких задач было и остается в области авиационной и космической техники. При создании систем управления (СУ) летательными аппаратами (ЛА) исследуются возможности реализации наилучшего (оптимального) в том или ином смысле управления движением. Каждый этап полета современных ЛА поддерживается системами автоматизированного управления, либо осуществляется в автоматическом режиме. Качество управления оценивается различными критериями, выражающими разнообразные и многочисленные требования к функционированию СУ. Например, требования безопасности, экономичности, точности, быстродействия и т.п. При этом технические возможности и ресурсы используемых устройств и механизмов не беспредельны, а условия полета ограничены. Как правило, ограничения точно указаны в технических характеристиках и правилах эксплуатации. Примерами могут служить ограничения тяги двигателя, отклонения воздушных рулей, углов атаки и т.п.

Математической моделью движения ЛА служит управляемый динамический процесс [95], который может быть описан, как правило, при помощи дифференциальных и разностных уравнений, содержащих функции, выражающие управляющие воздействия. Качество управления задается функционалом, подлежащим оптимизации. Выбор оптимального управления, минимизирующего функционал качества, ограничен требованиями, отражающими технические характеристики устройств и условия эксплуатации. В отличие от вариационного исчисления [59,111] в задачах оптимального управления, как правило, имеются ограничения на значения управления (так называемые геометрические ограничения на управление). Это обстоятельство существенно усложняет процесс решения задач оптимального управления, делая их наиболее трудными задачами оптимизации. Дело в том, что поиск оптимальных управлений приходится вести среди разрывных функций, а в классическом вариационном исчислении управление (производная от искомой функции, задающей варьируемую кривую), как правило, непрерывная (даже гладкая) функция. Поэтому класс рассматриваемых управлений - это кусочно-непрерывные или кусочно-постоянные функции. К последним относятся и так называемые релейные управления.

Точное аналитическое решение можно получить для достаточно узкого круга задач оптимального управления. В основном это объекты управления, описываемые линейными дифференциальными уравнениями. Большинство же задач не имеют аналитического реше-

ния, поэтому для них применяются различные численные методы приближенного решения. Рассмотрим основные идеи и методики приметаемых алгоритмов.

Большинство приближенных методов можно разбить на три группы (см. рис.В.1). Первая группа - это методы, основанные на необходимых условиях оптимальности. Вторая группа - это методы, в которых применяются достаточные условия оптимальности. Третья группа - это методы, в которых задача оптимального управления аппроксимируется задачей конечномерной минимизации.

Рис.В.1

Рассмотрим эти группы методов применительно к классической постановке задачи оптимального управления [63,95]:

x(t) = f{t,x(t),u(t)), u(t)eU, tQ<t<tx-

Г(х(*0),*(*!)) = О, (В.1)

I = J f® (t,x(t\u(t))dt + F{x{tj)) min . 'o

Подробное функционально-множественное описание элементов задачи во введении опущено. Заметим только, что все предположения в задаче (В.1) обычные для теории оптимального управления детерминированными непрерывными системами.

Применение принципа максимума Понтрягина сводит решение задачи оптимального управления к решению двухточечной краевой задачи для системы дифференциальных уравнений (так называемая П - система или система Понтрягина)

x(t) = f(t,x(t),u(t)), y(t) = -Hx(W)J,x(t)Mt)), (В.2)

u(t) = argmaxH(\\f(t)J,x(t),u),

ueU

т о

где H(\\j,t,x,n) = \\i f(t,x,u)-f (t,x,u) - гамильтониан для задачи (В.1). Краевые условия Г(х(/д),х(7])) = 0 для системы (В.2) дополняются недостающими уравнениями вида A(jc(i0),x(i1),\|/(i0),\|/(i1)) = 0, полученными из условий трансверсальности. Приближенному

решению этой краевой задачи посвящено много работ [76,95]. Одним из первых был разработан метод последовательных приближений Ф.Л.Черноусько, И.А. Крылова [64]. Этот метод особенно эффективен при решении задач с фиксированным левым и свободным правым концами траектории. Краевое условие = 0 в (В.1) при этом заменяется равен-

ством x(/q) = Xq . В этом случае для уравнений движения имеются начальные условия, а для

уравнений сопряженной системы - конечные. Иногда [23,25] одна итерация этого метода может использоваться для проверки оптимальности полученного управления.

Процедура улучшения опорного управления u(t) состоит в следующем. Сначала решается задача Коши для системы уравнений движения с известным опорным управлением

*(0 = fit, 40), *(*о) = хо •

Получив конечное состояние Xj = х(^), вычисляем конечные значения вспомогательных переменных \j/j = ~F'X (xj). Затем решаем задачу Коши для системы

\|/(i1) = \|/1, x(tl) = xl. Система (В.З) интегрируется от конечного момента времени ij к начальному Iq . В процессе

интегрирования находим управление

u{t) = ъщт&хН (\y(t),t,x(t),u),

ueU

которое берем в качестве нового опорного управления.

Метод последовательных приближений имеет многочисленные модификации, отличающиеся процедурами варьирования управления [37,72]. В частности, если имеются подозрения на скользящий режим, нужно использовать более сложные процедуры получения нового опорного управления [37]. При вырождении принципа максимума, когда оптимальным является особое управление, в итерационной процедуре учитываются необходимые условия второго порядка [36].

К первой группе относятся также методы стрельбы, которые сводят решение краевой задачи для системы дифференциальных уравнений к решению системы алгебраических уравнений G(B,) = 0 относительно начальных условий £, = (x(iQ),i|/(ig)) для системы (В.2). Среди

методов численного решения возникающих при таком подходе систем алгебраических урав-

нений хороших результатов достигают при использовании различных модификаций метода Ньютона [61,65,66]. Как обычно, успех применения метода Ньютона существенно зависит от качества начального приближения, как правило, в задаче оптимального управления хорошее начальное приближение можно найти для траектории х(-), но не для управления //(■) и

вспомогательных переменных \|/(/0). Заметим, что нахождение матрицы (с,) частных

производных численное, поскольку функция Сг(£) задана "неявно". Это требует многократного решения задачи Коши для системы (В.З) при различных начальных условиях. Может оказаться, что отображение В, —» (?(£,) не является взаимно однозначным. В этом случае метод Ньютона "застревает", поскольку не существует обратной матрицы Эту трудность преодолевают при помощи регуляризации или псевдообращения. Еще одна неприятная особенностью системы (В.2) следующая. Подставляя в уравнения (В.2) управление

= аг§тахН(цг^,х,и), (В.4)

иеи

получаем систему

х(0 = /& х(0,■»>(*, х(0М0)), \К0 = -ях(у(0,*,х(0М*,х(0М0)),

для которой может утратиться не только единственность, но и существование решения задачи Коши. Дело в том, что функция (В.4) при некоторых /, х, \|/ может не удовлетворять условию Липшица. Чтобы "вернуть" единственность применяют такие аппроксимации множества и допустимых управлений, чтобы функция (В.4) оказалась липшицевой. Кроме того, вместо начальных условий £ = (х(^), в качестве искомых параметров выбирают дру-

гие, связанные с физической сущностью задачи, при этом удается параметризовать неоднозначные решения задачи Коши [103].

При создании методов, основанных на достаточных условиях оптимальности, разработчики могут преследовать разные цели, а именно:

- получить приближенное решение уравнения Беллмана;

- найти приближенно функцию Беллмана (или функцию Кротова);

- улучшить имеющееся позиционное управление.

Рассмотрим типичные приемы, применяемые для достижения указанных целей. Для приближенного решения уравнения Беллмана можно использовать метод характеристик [103]. Проще и эффективнее такой подход реализуется в тех задачах, в которых оптимальное управление

>у(7,х,фх) = аг§тах#(фх,?,х,г<) (В.5)

неи

можно выразить аналитически через фазовые координаты и производные функции Беллмана. Как правило, в задачах управления ЛА такое выражение для управления получить можно. Не редки ситуации, когда управление, например тяга двигателя, входит в уравнения движения, а следовательно, и в уравнение Беллмана линейно. В этом случае минимизация по управлению выполняется без труда и приводит к релейному закону. Подставив найденный закон управления в уравнение Беллмана, получаем задачу Коши для дифференциального уравнения с частными производными первого порядка, которое решается методом характеристик. Обычно, выделяются несколько характеристических полос, выходящих из заданных точек, а в остальных точках функцию Беллмана интерполируют или аппроксимируют.

Наиболее естественный подход для решения уравнений с частными производными - это сеточные методы. Сетка вводится по времени и состоянию, а уравнение Беллмана заменяется его дискретным аналогом. При выборе шагов сетки должны выполняться определенные рекомендации. В частности, шаг сетки по состоянию меньше (на порядок) шага сетки по времени. Дискретная аппроксимация уравнения Беллмана предъявляет высокие требования к объему памяти и быстродействию компьютера, необходимыми для решения задачи. Эти обстоятельства, затрудняющие реализацию метода, в литературе называют "проклятием размерности". Как правило, дискретной аппроксимацией пользуются, если имеются жесткие фазовые ограничения, при этом количество узлов сетки уменьшается.

Для аппроксимации функции Беллмана можно использовать ряды Фурье [30,80]. Подставляя ряд в уравнение Беллмана и находя проекции на базисные функции, получаем либо систему дифференциальных, либо алгебраических уравнений относительно коэффициентов ряда. Другая идея получения такой системы уравнений реализуется в методе Букреева В.З. Вместо равенства проекций, требуется выполнение уравнения Беллмана на специально выбранных кривых, например, на некоторых прямых, параллельных координатным осям. Большого опыта использования таких методов нет. Системы получаемых уравнений, обычно, решаются плохо [103].

Идея итерационного, локального улучшения управления [63,103] состоит в следующем.

Для задачи терминального управления (/° = 0) известный опорный процесс (х(7),г/(7)) локально улучшается. Для этого ставится задача минимизации вспомогательного функционала, который помимо терминального члена /•'(-*"(7] )) исходного функционала содержит дополнительные слагаемые, квадратичные по вариациям управления и траектории

Параметр а > 0 используется для регулировки величины вариации Ьи и для вогнутости га-

1 т1

мильтониана Н = \|// -^-абм М5г/. Уравнение для функции Кротова в окрестности опорного режима разлагается в ряд по фазовым координатам с учетом членов второго порядка. В результате получается система обыкновенных дифференциальных уравнений относительно значений функции Кротова и ее производных по х первой и второй степени на опорном режиме. Интегрируя эту систему от конечного момента времени к начальному, находится позиционное управление, которое затем используется при интегрировании уравнений движения от начального момента времени к конечному с нахождением нового опорного процесса.

В работах [4,5] разработан метод последовательного улучшения управления на основе достаточных условий оптимальности, являющихся аналогом условий Кротова. Построены вычислительные алгоритмы первого и второго порядков.

Методы, основанные на дискретной аппроксимации задачи оптимального управления, используют различные разностные схемы для замены дифференциальных уравнений рекуррентными. Процесс управления (х(/), u(t)), /q < / < /], заменяется конечной последовательностью значений (хх, ит) в узлах т сетки. Задача (В.1) минимизации в функциональном пространстве становится задачей конечномерной минимизации, для решения которой используются раз�

Похожие работы

Информатика, вычислительная техника и управление
05.13.00