автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Достаточные условия оптимальности управления дискретными системами автоматного типа

кандидата физико-математических наук
Коновалова, Анна Александровна
город
Москва
год
2015
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Достаточные условия оптимальности управления дискретными системами автоматного типа»

Автореферат диссертации по теме "Достаточные условия оптимальности управления дискретными системами автоматного типа"

На правах рукописи

Ке^7

Коновалова Анна Александровна

ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ ДИСКРЕТНЫМИ СИСТЕМАМИ АВТОМАТНОГО ТИПА

05.13.01 - Системный анализ, управление и обработка информации (авиационная и ракетно-космическая техника)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

2 5 ФЬВ ¿015

Гл

Москва-2015

005559466

Работа выполнена на кафедре «Вычислительная математика и программирование» Московского авиационного института (национального исследовательского университета).

Научный руководитель: доктор физико-математических наук,

доцент, ведущий научный сотрудник МАИ Бортаковский Александр Сергеевич

Официальные оппоненты: доктор физико-математических наук,

профессор, заведующий лабораторией механики управляемых систем ИПМех РАН Ананьевский Игорь Михайлович

кандидат физико-математических наук, старший научный сотрудник ИПУ РАН Румянцев Дмитрий Станиславович

Ведущая организация: ФГБУН «Институт программных систем

им. А.К.Айламазяна РАН»

Защита состоится 27 марта 2015 года в 10 ч. 00 мин. на заседании диссертационного совета Д 212.125.04 в Московском авиационном институте по адресу: 125993, Москва, А-80, ГСП-3, Волоколамское шоссе, 4.

Предварительный заказ пропусков по телефону: 8-499-158-40-90

С диссертацией можно ознакомиться в библиотеке МАИ или по ссылке: http://www.4url.ru/20497

Автореферат разослан «04 » 2015 г.

Отзывы на автореферат просим отправлять в 2-х экземплярах, заверенных гербовой печатью, по адресу: 125993, Москва, А-80, ГСП-3, Волоколамское шоссе, 4, Учёный совет МАИ.

Учёный секретарь диссертационного совета Д 212.125.04 кандидат физико-математических наук

Н. С. Северина

Общая характеристика работы

Актуальность работы. Современные системы автоматического управления летательными аппаратами (JIA) являются иерархическими. Цель управления, как правило, достигается в результате многоэтапного процесса при использовании разных режимов функционирования. Управление J1A в каждом режиме выполняется системой нижнего уровня иерархии, а переход от одного этапа к другому - системой более высокого уровня. На высшем уровне иерархии управление фактически состоит в переключении режимов. Такая организация процесса управления характерна для переключаемых систем. В современной теории управления и ее приложениях подобные системы образуют отдельный класс. Их исследование и применение идет с нарастающей интенсивностью.

К основным классам гибридных систем, в которых применяется управление с переключениями, относятся: переключаемые системы (Аграчев A.A., Гурман В.И., Савкин A.B., Antsaklis P.J., Brockett R.W., Evans R.J, Hedlund S., Liberzon D., RantzerA., Rischel H. и др.), системы с переменной структурой (Емельянов C.B., Барбашин Е.А., Уткин В.И. и др.), логико-динамические системы (Семенов В.В., Бортаковский A.C., Батурин В.А., Малтугуева Н.В. и др.), импульсные системы (Цыпкин ЯЗ., Куржанский А.Б., Завалищин С.Т., Сесе-кин А.Н., Дыхта В.А., Самсонюк О.Н., Li Z., Silva G.N., Soh Y., Vinter R.V., Wen С. и др.), а также частный случай импульсных систем - дискретно-непрерывные системы (Миллер Б.М., Рубинович Е.Я.).

Система автоматного типа (CAT) является составной частью каждой из перечисленных систем. Название CAT произошло от динамических систем с автоматной частью по терминологии акад. Васильева С.Н. и акад. Куржанско-го А.Б. Именно CAT управляет переключениями режимов работы сложных динамических систем. CAT описывается как устройство управления в форме автомата с памятью. Хотя работа CAT протекает в непрерывном времени, изменения ее состояний (переключения) происходят в некоторые дискретные (тактовые) моменты времени. Эти тактовые моменты не заданы заранее и определяются в процессе управления.

Исследования показали, что в оптимальных конструкциях автомата с памятью реализуются режимы с мгновенными многократными переключениями в фиксированный момент времени. Эти режимы являются новыми в теории управления и малоисследованными. Их можно считать абстрактной физически нереализуемой математической моделью процесса управления. Однако оптимальность таких процессов предъявляет существенные требования к быстродействию реальных систем управления, которые должны учитываться конструкторами. В противном случае, результаты работы CAT будут значительно хуже оптимальных. В импульсных и дискретно-непрерывных системах режимы с многократными мгновенными переключениями исключаются.

В диссертации достаточные условия оптимальности, основанные на принципе расширения КротоваВ.Ф., Гурмана В.И., распространяются на новый класс систем управления — класс систем автоматного типа. При этом используется новый метод построения функции цены (функция Гамильтона-Якоби-Беллмана, функция Кротова). Этот метод применяется для доказательства дос-

таточных условий оптимальности позиционного управления и вывода уравнений для нахождения оптимального управления с обратной связью. На его основе разработан алгоритм синтеза оптимальной CAT. Составлена программа численного решения задачи синтеза.

Новый метод сводит задачу синтеза оптимальной CAT к последовательности задач синтеза CAT с заданным максимально допустимым количеством переключений. Такая методика необходима для решения задач управления летательными аппаратами с ограниченным количеством включений реактивных двигателей.

Целью работы является доказательство достаточных условий оптимальности CAT и разработка на их основе метода синтеза позиционного управления. Для достижения цели необходимо решить следующие задачи:

1) сформулировать и доказать достаточные условия оптимальности управления CAT при однократных или мгновенных многократных переключениях;

2) разработать алгоритм синтеза оптимального позиционного управления CAT;

3) решить задачу синтеза оптимального позиционного управления следящей CAT;

4) решить задачу оптимального вывода спутника на геостационарную орбиту при ограниченном количестве включений двигателя.

Методы исследования. Для решения поставленных в диссертации задач использовались математическая теория управления, вариационное исчисление, теория дифференциальных уравнений, системный анализ, оптимизация, негладкий анализ, численные методы. Приближенное решение задачи управления движением спутника найдено с использованием результатов В.И.Гурмана.

Научная новизна. Полученные в диссертационной работе основные результаты являются новыми, а именно: введены новые понятия - условная функция цены и условное позиционное управление, из которых строятся функция цены и оптимальное управление; доказаны достаточные условия оптимальности CAT с однократными или мгновенными многократными переключениями; выведены уравнения для нахождения условных функций цены и условных позиционных управлений; разработан алгоритм синтеза оптимальных CAT с однократными или многократными переключениями; поставлена задача синтеза оптимальной следящей CAT, которая решена в одномерном случае; получено приближенное решение задачи оптимального вывода спутника на геостационарную орбиту при ограниченном количестве включений двигателя.

Практическая значимость диссертационной работы состоит в том, что был разработан алгоритм решения актуальных задач синтеза оптимальных CAT, который применим в областях авиационной и ракетно-космической техники, в робототехнике и экономике. Создано программное обеспечение для численного решения задачи оптимального вывода спутника на геостационарную орбиту при ограниченном количестве включений двигателя. Получено свидетельство о государственной регистрации программы для ЭВМ № 2014615592 (29.05.2014).

Достоверность результатов представленных в диссертационной работе, подтверждена строгими математическими доказательствами. Диссертация содержит приближенные и аналитические решения примеров, соответствующие теоретическим результатам. Получено приближенное решение прикладной задачи, полностью отвечающее физическим представлениям.

Апробация работы. Результаты диссертационной работы докладывались на следующих конференциях: 11-я Международная конференция «Авиация и космонавтика-2012» (Россия, Москва, 2012), «Международная конференция по дифференциальным уравнениям и динамическим системам» (Россия, Суздаль, 2012, 2014), «Международная конференция по математической теории управления и механике» (Россия, Суздаль, 2013); 13-я Международная конференция «Авиация и космонавтика-2014» (Россия, Москва, 2014), обсуждались на научном семинаре в Московском авиационном институте.

Работа поддержана грантом РФФИ № 12-08-00464-а: «Перспективные методы оценивания и управления дискретными и логико-динамическими системами с ограниченными ресурсами (2012-2014)» и заданием Минобрнауки № 1.1191.2014К: «Конструктивные методы оценивания и управления непрерывно-дискретными гибридными системами в условиях неопределенности».

Публикации. Основные результаты диссертации опубликованы в научных статьях f 1—4] в журналах, входящих в перечень ВАК, а также в трудах научных конференций [5-9]. Общее число публикаций - 9.

Структура и объем диссертации. Диссертация содержит введение, три главы, заключение и список используемой литературы. Работа состоит из 145 страниц, включая 46 рисунков, 3 таблицы и список литературы, содержащий 124 наименований.

Содержание диссертации

Во введении дано обоснование актуальности исследования изучаемой проблемы. Приведен обзор работ в данной области. Дана характеристика применяемых в диссертации методов исследования и полученных результатов. Сформулирована цель работы, аргументирована научная новизна и практическая значимость, приведено краткое содержание глав диссертации, сформулированы результаты, представляемые к защите.

В первой главе исследованы задачи синтеза оптимального программного управления и синтеза оптимального позиционного управления дискретными системами автоматного типа (CAT). Траектория CAT представляется непрерывной справа кусочно-постоянной функцией у:7*—»Rm, определенной на промежутке 7' = [Г0,/1]. Точки разрыва функции >'(•) образуют конечную возрастающую последовательность ¿Г1 = ¿Г1 (Х-)) тактовых моментов времени,

S"1 с Г. В каждый тактовый момент времени состояние CAT изменяется, происходит переключение состояния, а функция >•(■) имеет скачок. Такие траектории CAT будем называть траекториями с однократными переключениями. Типовая траектория CAT с однократными переключениями в четырех тактовых моментах времени zl,x2,t3,x4 изображена на рис.1.

Пусть поведение модели объекта управления описывается соотношениями

At) = gM'-0)Mt)). (1)

v(t)er{t,y<i-0)), (2)

где у — вектор состояния системы, yeYd K.m; v - вектор управления, V е V с Ш.4; 1 - время, t е Т = [f0, f, ] - промежуток времени функционирования

системы; g-.Tx.YxV -» R"1 - непрерывная функция при всех t, у

g{t,y,v) = y <=> v = o, (3)

где о - некоторый нейтральный элемент, oeV(t,y). При нейтральном управлении состояние системы сохраняется, так как g(t,y,o) = у. На рис.2 пунктирными стрелками и полужирными точками изображен график типового управления v(/) с нулевым нейтральным элементом, которое отлично от нуля только в четырех точках tj, т2, т3, т4.

УМ

ri

'о т1 Т2 Т3 Т4

Рис.1

eV(Tj) v(T2)

Tv(x4)

'от1

•IKK"' to

">о<""и!><""' >

;V(T3>

Рис.2

Начальное состояние CAT задано

y(t0-0) = y0. (4)

Множество ©'(/qj^q) допустимых процессов с однократными переключениями образуют пары функций (>'(•), v(0). где траектория >(•) - непрерывная справа кусочно-постоянная функция у:Т —>Y, точки разрыва которой составляют конечную возрастающую последовательность ¿Г1 = ¿Г1 (>'(-)) тактовых моментов времени, ¿Г1 с7"; а управление v(-) - функция v:T->V, всюду на равная нейтральному элементу (v(t) = o) и отличная от него только на ¿Г1. Функции >»(•) и v(-) всюду на Т удовлетворяют рекуррентному уравнению (1), включению (2) и начальному условию (4).

Рекуррентное уравнение (1) описывает систему в форме автомата с памятью. Из (3) следует, что при v(t) = o, т.е. всюду на Т\£{, уравнение (1) принимает вид y(t) = y(t - 0), реализуя условие непрерывности слева траектории у(-) системы. Предполагаем, что многозначное отображение t —> V(t,y) непрерывно справа по включению при всех t е [/0,/j) и всех у е Y.

На множестве допустимых процессов с однократными переключениями ©'(/0,у0) задан функционал качества процесса управления

i,0=\fMt))dt+ XsV.rtT-OJ.vtTW+FW/,)), (5)

где функции F:Y ^ R, / :ГхУ->К, g° : Тх Ух V -> R - непрерывны, суммирование ведется по всем точкам разрыва, причем

g°(t,y,v)>\> О при всех t, у, v*o. (6)

Требуется найти минимальное значение функционала (5) и оптимальный допустимый процесс d1 = (>>(-), vOK на котором это значение достигается

I.(dl)= min It(d). (7)

delfi(,0.y0) 'о

Предполагаем, что функционал (7) ограничен снизу на множество допустимых процессов. Чтобы исключить многократные переключения системы в фиксированный момент времени, достаточно предположить, что

g(t,y,r)=>g(t,g(t.j>.nn,

g0(r,y,v")<g°(t,y,v) + g°(t,y',v'), v'*o, v"*o, где У = g(t,у,v), g(t,y',v') = g(t,y,v").

Кроме задачи со свободным правым концом траектории и фиксированным временем в диссертации рассматриваются также задача с терминальным ограничением и задача с заданным максимальным допустимым количеством переключений.

Задача синтеза оптимального позиционного управления формулируется следующим образом. Позиционное управление v(t,y)e<V для любых начальных условий

M6-O) = J0, /0<е</р y0eY, (8)

порождает допустимый процесс (_v(-),v(-)) е ©'(9,^) с программным управлением v(t) = v(t,><(t - 0)), te^, где = ^ оо)- множество тактовых моментов времени на отрезке [9,Г,]. Требуется найти оптимальное позиционное управление v(t,y), которое для каждого начального условия (8) порождает оптимальный процесс e$)(Q,ye), минимизирующий функционал оставшихся потерь

'1

f0 = j f(t,y(t))dt+ (9)

0

В поставленных задачах количество точек разрыва допустимых траекторий заранее не задано, а определяется в процессе оптимизации. Эти же задачи рассматриваются также при заданном максимально допустимом количестве переключений.

Задачи синтеза оптимальных CAT являются новыми. Ранее для описания движения CAT применялись рекуррентные включения. Такая задача синтеза CAT не эквивалентна рассматриваемой в диссертации. При выводе достаточных условий оптимальности применяется новый подход поиска функции цены. Она строится при помощи вспомогательных (условных) функций цены. Условная функция цены определяется как минимальное значение функционала оставшихся потерь (9) на оптимальном процессе с не более чем к переключениями

q>k{t-Q,y) = min 1,(у(-)).

Значения условных функций цены образуют невозрастающую последовательность, которая сходится к функции цены

<p(i - 0, у) = min ф* (/ - 0, у) = ф*('"у) (/ - 0, у),

keZ+

где k(t,y)-asg min ф*(/-0,.у) = тт Arg min q>k(t-0,y) - оптимальное число

переключений (существование k(t,y) следует из положительности (6) затрат на переключение).

На основе принципа оптимальности Кротова В.Ф. доказаны достаточные условия оптимальности программного управления (теорема 1.1), которые сводятся к существованию невозрастающей последовательности условных функций цены. Теорема 1.1 используется для доказательства достаточных условий оптимальности позиционного управления (теоремы 1.2).

Теорема 1.2 (достаточные условия оптимальности позиционного управления). Если существуют невозрастающая последовательность функций ф* е Ф и допустимая последовательность условных позиционных управлений vk еТЛ k е Z+, удовлетворяющие условиям

Ф °(tvy) = F(y), (10)

<pk+1(t-0,y)=<pk(t,g(t,y,vk+\t,y))) + g0(t,y,vk+l(t,y)), (11)

^(t,g{l,y,vM(t,y))) + f(t,g(,t,yy+\t,y))) = 0, (12)

vk+\t,y)e Arg min [фk (t,g(t,y,v)) +f(t,g(t,y,v))], (13)

Ч'.У)

k(t,v) = min Arg min фА (/ - 0, y), (14)

ke Z+

где t e 7\ yef, то оптимальное управление с обратной связью имеет вид

v(t,y) = vk^\t,y), (15)

а функг/ия цены ф е Ф вычисляется по формуле

4>(t-0,y) = <?k{'-y)(t-0,y)= min It(d), (16)

deOh'.y)

т.е. предел слева условной функции цены равен минимальному значению функционала оставшихся потерь (9).

Здесь k(t,y) - наименьшее целое неотрицательное число, начиная с которого все члены невозрастающей последовательности <рк(t - 0,у) оказываются равными; Vk+l (t,y) - множество точек глобального минимума суммы функций

4>k(^g{l,y,v)) + g°(t,y,v) на множестве K*+I(i,>-) = {veI''(i,j')|(i,g(i,>',v))eni} по аргументу v. При t = t\ условие (13) заменяется на включение

v*+,(/,,jOeArg min [q>t(/1,s(/1,>,v)) + *0(/|,.y.v)]. (17)

veV

Из теоремы 1.2 следуют достаточные условия оптимальности позиционного управления при ограниченном количестве переключений (теорема 1.3). Эти условия отличаются от теоремы 1.2 тем, что последовательности условных функций цены и позиционных управлений конечные (число членов не превосходит максимально допустимого количества переключений).

На основе теоремы 1.2 разработан алгоритм синтеза оптимальной CAT.

Синтез заключается в построении условных функций цены <р° (/,>•), ф'(/>.)'), ф2(/,_у), ... и оптимальных условных позиционных управлений v'(i,>>), v2{t,y),... При этом используются образующие функции цены ф0(t,y), Ф¡((,у), %\(*>У), Ф2(',>'), <Р02(',У) ■■■ и образующие оптимального управления vQ(i,y) = o, Vj((,у), v2(t,y), ... Верхний индекс функций означает максимальное допустимое количество переключений, нижний - фактическое число переключений. Нижний индекс, начинающийся с 0, означает отсутствие переключений в данной позиции. Например, ф0 равна функционалу оставшихся потерь,

вычисленному на траектории, не имеющей переключений, ф( - функционалу, вычисленному на оптимальной траектории, имеющей одно переключение в момент времени I, ф0, - функционалу, вычисленному на оптимальной траектории, имеющей одно переключение после момента / и т.д.

Алгоритм синтеза оптимальной CAT Шаг 0. Находим функцию ф0 на области , интегрируя уравнение

4-%(t,y)+f(t,y) = o dt

с терминальным условием

4>0(h>y) = F(y)-

Полагаем, что ф°(?,у) = Ф0(/,у) и v°(t,y) = о для всех (г,у) е я0. Задаем к = 1. Шаг 1к. На области пк находим образующую функции цены

Ф к«,у) = min + (18)

и образующую позиционного управления

vk(t,y) = arg min [q>* '('.gC.^+gVjy.v)]. (19)

veVk(t,y)

Решая систему неравенств (при t < i,)

| vk(i,y)«vk-\t,y), (20)

[/С.яС.л vk C'^») - s^t>y> vk C..v)) * fC-y)'

уточняем область определения образующих (18), (19) - множество позиций кк, в которых происходит переключение. При t = tx второе неравенство в (20) не учитывается. Если данная система не имеет решений (пк = 0), то процесс построения условных функций цены и управления заканчивается. Если левая граница дкк совпадает с левой границей 5П всего пространства позиций, то пропускаем шаг 2, полагая nQk = 0.

Шаг 2к. Если система (20) совместна * 0), то находим образующую сpQk(t,y), интегрируя на области п0к (п0к - множество позиций, предшествующих лк)уравнение

¿ф ok(t,y)+f(t,y) = o at

с терминальным условием на левой границе 8пк области лк Шаг 3 к. Составляем условную функцию цены

<Р0к(1,У),(1,У)ет10к,

и условное позиционное управление

о, (t,y)enok,

vk(t,y), (t,y)enk,

vk~\t,y), (/,у)е/\(%ия4).

Процесс заканчивается, если пк = 0. Дополнительным условием окончания

может служить ограничение допустимого количества переключений, например, натуральным числом N. В этом случае, если к< N и то продолжаем

построение образующих с шага 1к, полагая к := к +1, иначе процесс заканчивается.

Синтезированное позиционное управление позволяет находить оптимальные процессы для любых начальных условий. Для этого нужно выполнить следующие действия.

1. Для заданной позиции (/,у)еП определяем оптимальное число переключений

<?\t,y) =

vk(t,y) =

Ä(f,^) = minArg min <j?k{t-Q,y). (21)

ke z+

Минимум ищется по всем условным функциям цены ф , которые определены в

заданной позиции (t,y) е пк.

2. Находим оптимальное управление

v( t,y) = vk^\t,y) и минимальное значение функционала /, оставшихся потерь (9)

min It{d) = ^''y\t-Q,y). (22)

rfeO1 (I,у)

Формулы (21) и (22), соответственно, изменятся, если максимально допустимое количество переключений равно N

k(t,y) = min Arg min q>k(t-0,y), min lt(d) = q>k{'-y)(t-0,y). k=0,\.....N de£>N(t,y)

Таким образом, можно найти оптимальное управление для любой позиции. Однако для получения оптимального программного управления достаточно определить оптимальное количество переключений N = k(t0,y0) для начальной позиции (¿q , ), а затем использовать условные управления для получения оптимального процесса

y,=,?(w.-l'v/)' v, =v'v-'+i(t,..у,^), (w,-i)6£ka'-,+i> где / = l,...,yv, у, =у(т;), v. = v(t,-), a t,,...,tv - возрастающая последовательность моментов переключений /0 = т0 < tj <... < тЛ, <. Момент т, /-го переключения определяется достижением левой границы дяjV_|+] области nN_M. В примере 1.1 решена задача синтеза оптимальной CAT

y{l) = y(t~0) + v(t),

v(/)e[-v('-0),+co), 1 , ,

О teS"

где 0 < / < 1, у> 0, ¡Г = £*(>'(•)) - множество точек разрыва кусочно-постоянной функции у(-). Требуется найти оптимальное позиционное управление, а также оптимальные процессы с начальными условиями: а) >'(-0) = 0.25; б) Я-0) = 0.75: в) Я-0) = 1-25.

Применяя разработанный алгоритм, получено оптимальное позиционное управление

о, х ь V \ Q,{t,y)£izv

где л, - множество позиций (!,у), в которых система совершает скачок в нулевое состояние. На рис.3 область Jtj, ограниченная прямой y = \-t и гиперболой

8(1 - t)y = 1 + 4(1 - /) , отмечена цифрой 1. В областях 0 и 01 система сохраняет свое состояние. Найденное позиционное управление порождает оптимальные траектории а, б, в (см. рис.3). Действительно, чтобы минимизировать интегральную часть функционала, нужно уменьшить значение y(t). Поэтому скачок лучше делать в нулевое состояние. Делать такое переключение в начальный момент времени может быть не выгодно, так как при t 0 затраты максимальные. Возможно, лучше подождать некоторое время, а затем сделать переключение. Таким образом, оптимальная траектория имеет не более одного переключения, что и подтверждается найденным решением.

В примере 1.2 решена задача синтеза оптимальной CAT y(t) = y(t-0) + v(t), v(t)e[-y(t- 0), 1-.К<-0)], 1

0 те?"

где 0</<l, у(/)е[0,1], v(()e[-l, 1], ^ = ^ = - множество точек

разрыва кусочно-постоянной функции у(-). Требуется найти оптимальное позиционное управление CAT и оптимальные траектории с начальными условиями: а) Я-0) = 0; б) 7(-0) = 0.8.

Смысловое содержание задачи: найти оптимальную кусочно-постоянную аппроксимацию у = y(t) линейной функции у = /. Чтобы уменьшить интегральную часть функционала, нужно увеличивать количество точек разрыва траектории j(-). Так как затраты на каждое переключение положительны (X. > 0), то количество разрывов оптимальной траектории будет конечное.

Применяя разработанный алгоритм, получено оптимальное позиционное управление

v\t,y) = 0,

Г 0, (г,_у) еП \ я1;

О ,(t,y)enQ2,

l(t,y) =

-y,(t,y) ея2,

/ (¡,у), (1,у) е П \ (л02 и л2). Области л0, л,,л01, л2,л02 определения образующих условных позиционных управлений обозначены на рис.4 цифрами 0, 1, 01, 2, 02 соответственно. Урав-

нения линий 1-10 указаны в диссертации. Найденное позиционное управление порождает оптимальные траектории а, б (см. рис.4).

В разд. 1.5 поставлена задача синтеза следящей CAT, выполняющей оптимальную кусочно-постоянную аппроксимацию заданной непрерывной траектории. Эта задача отличается от классической задачи аппроксимации тем, что качество аппроксимирующей кусочно-постоянной функции оценивается не только ее отклонением от непрерывной аппроксимируемой, но и количеством точек разрыва. Показано, что эта задача может быть решена при помощи разработанного алгоритма синтеза оптимальной CAT, приведена оценка сверху необходимого числа шагов. Разработана программа численного решения модельной задачи синтеза одномерной следящей CAT. Получены численные решения задач аппроксимации для трех разных непрерывных функций. Сравнение с точным аналитическим решением (для двух функций) показывает достоверность работы алгоритма.

В разд. 1.6 из необходимых условий оптимальности динамических систем с автоматной частью (частный случай ЛДС) выведены необходимые условия оптимальности CAT. Одним из условий является уравнение, которому удовлетворяют моменты переключения оптимальных траекторий CAT. Это уравнение может быть получено из уравнения для поверхности переключения, которое следует из достаточных условий оптимальности. Таким образом, установлена связь необходимых условий с достаточными.

В главе 2 рассматриваются оптимальные процессы с мгновенными многократными переключениями. Эти режимы являются новыми в теории управления и малоисследованными. Процессы с мгновенными многократными переключениями возникают как пределы последовательностей допустимых процессов с однократными переключениями.

Кусочно-постоянной непрерывной справа функции >-:[x0,x;v+1]^ Rm, имеющей N скачков и удовлетворяющей условию у(г0) = у0, поставим в соответствие набор ее значений y,-=ATj) в точках разрыва tj,...,^: _у(-) о {(т.,^),;' = 1,...,JV}, удовлетворяющий условиям

где i = \,...,N. Заметим, что такая функция является элементом конечномерного пространства (размерности (m + l)N).

Для последовательности кусочно-постоянных функций у"(-), п = 1,2,..., имеем у"(-)<г> {(i",y"),i = l,—причем <т", y"_t ■ Определим предельною функцию у(-)= lim у"(-), если существуют пределы у точек разрыва

т" —> ii и предельные значения функций у" —> у( , где /' = 1 ,...,N. Этот предельный переход обозначим у"(-)—>■(•)• Аббревиатура "кс" подчеркивает конечномерную сходимость. Неравенства (23) для предельной функции могут нарушаться. Если совпадают к точек разрыва т(. = т/+! = ...= т(.+Л1, считаем, что CAT совершает к мгновенных многократных переключений. Если совпадают значения у._j = У/, то переключения в момент нет. Важно отметить, что количество скачков в "кс" предельном переходе не может увеличиться, поэтому класс процессов, имеющих не более чем N переключений замкнут относительно "кс"-сходимости.

Поставленные во второй главе задачи отличаются от соответствующих задач первой главы множеством <D(tQ,yQ) допустимых процессов с мгновенными многократными переключениями. Формально это отличие заключается в том, что тактовые моменты времени образуют неубывающую последовательность /0 = т0 < Tj <... < Tyy < t//+| = /,, т.е. некоторые из них (или все) могут совпадать.

Формулировки теорем 2.1, 2.2, 2.3 аналогичны соответствующим теоремам главы 1. Доказательство условий оптимальности процесса управления (теорема 2.1) получается в результате применения "кс"-предельного перехода в доказательстве теоремы 1.1. Условия оптимальности позиционного управления (теорема 2.2) совпадают с соотношениям (10)—(15) теоремы 1.2 и отличаются условием (16), в котором множество D1(tQ,y0) заменяется на <D(t0,y0). Для доказательства теоремы 2.2 используется теорема 1.2. Из теоремы 2.2 следуют достаточные условия оптимальности позиционного управления при ограниченном количестве переключений (теорема 2.3). Эти условия отличаются от теоремы 1.3 множеством допустимых процессов.

Таким образом, теория для процессов с мгновенными многократными переключениями является продолжением теории с однократными переключениями. Это выражается в том, что алгоритм синтеза, разработанный для однократных переключений, оказывается применимым для задач с мгновенными многократными переключениями.

В примере 2.1 решена задача синтеза оптимальной CAT

где 0 < / < 1, _у> 0, = 3~(у(-)) - множество точек разрыва кусочно-постоянной

г(0е[тах{-Я<-0),-1},1],

(24)

функции >(■). Требуется найти оптимальное позиционное управление, а также оптимальные процессы с начальными условиями: а) >(-0) = 2.25; б) >(0.75-0) = 2.25.

Поставленная задача отличается от примера 1.1 условием (24), которое обеспечивает неотрицательность значения >(/) при ограниченности управления -1<у(/)<1. Применяя разработанный алгоритм, получено оптимальное позиционное управление v0 (?,>) = 0,

шах{->,-1}, (/,>)еяр кг ч ( -1, (/,>)< 0, (/,>)е ПХлр

V (/,>) =

V {1,У) У"1^,>),(',>)€П\тг*,

где П = [0,1] х [0,-foo) - пространство всех позиций; область я, определяется неравенствами l-f<><1.5 при 0</<0.5, y(i)^><y(0 + l при 0.5<t <0.5-Уз ; а область кк, к = 2,3,..., - неравенствами £-0.5<><£ + 0.5 при 0</<0.5, у(?) + к-\<у< у (Г) + к при 0.5 < t < 0.5л/3 . Здесь у (?) = + Щ-. На рис.5 области ж0, 71р 7t01, 7t2, 7i3, Jt4 определения образующих

условных функций цены и позиционных управлений обозначены полужирными цифрами 0, 1, 01, 2, 3, 4 соответственно. Найденное управление порождает оптимальные траектории а, б (см. рис.5). Каждая траектория имеет 3.5 двойное переключение в начальный момент времени.

В примере 2.2 решена задача синтеза оптимальной

CAT

>(/) = >(f-0) + v(f),

v(i) е [->(i - 0),+со), 2

1

/ = jV2(0dt + Xl^ +1V2'W)+ ilWO-'if ->min,

0 teS"

где 0</< 1,>>0, X. = 0.02, £" = £"(>(•)) - множество точек разрыва функции >(•). Требуется найти оптимальное 1.5 позиционное управление, а также оптимальные траектории с начальными условиями:

а) >(-0) = 2; б) >(0.25 - 0) = 0.65; в) >(0.3 - 0) = 0.9; 1 г) >(0.75-0) = 1.6.

Смысл задачи: найти кусочно-постоянную функцию, 0.5 минимизирующую функционал I. Чтобы минимизировать интегральную часть функционала, нужно уменьшить

значение >(/). Поскольку затраты на переключение со- 0 0.5

2

стояния не зависят от времени, то скачок лучше делать Рис.5

как можно раньше. В конечный момент времени нужно уменьшить отклонение

>(1) от единицы. Для этого, возможно, понадобится дополнительное переклю-

1.5

чение. Значит, типовая оптимальная траектория будет иметь разрывы в начальный и конечный моменты времени. Заметим, что затраты на переключение состояния зависят от квадрата управления (V2). Поэтому один большой скачок под воздействием управления 2у может оказаться хуже по затратам, чем два маленьких скачка под управлением V. Это означает, что у оптимального процесса в начальный и конечный моменты времени могут быть мгновенные многократные переключения.

Применяя разработанный алго-

1'

5__- 4__- ___—---У

0

| з , 01

1 * ,

! ! 03 !

! ! «4 : 1

0.2

0.4 0.6

Рис.6

11

ритм, получено численное решение задачи. На рис.6 области определения образующих условных функций цены и позиционных управлений обозначены цифрами 0,1.01,...,10. Оптимальные траектории а-г изображены стрелками.

В 3 главе рассматривается задача перевода спутника с опорной орбиты на ГСО. Опорная орбита - это низкая круговая околоземная орбита высотой 160 км, ГСО - высокая круговая орбита радиуса 42 000 км с периодом 24 часа. Типовая схема вывода, реализуемая разгонным блоком "Бриз-М" - трехимпульс-ная. Два импульса в окрестности перигея вытягивают орбиту, а третий импульс в окрестности апогея превращает эллиптическую орбиту в круговую. Конструкция и условия эксплуатации разгонного блока "Бриз-М" позволяют выполнить до 10 включений маршевого двигателя в ходе активной фазы полета (в течение 24 ч). Одно включение используется для доразгона после отделения от ракетоносителя. Требуется перевести спутник с опорной орбиты на ГСО с минимальным расходом топлива. Количество включений двигателя не более 9, активная фаза полета не более суток.

Задача вывода спутника на ГСО с минимальным расходом топлива при ограниченном количестве включений двигателя формулируется как задача оптимального управления непрерывно-дискретной системой с дискретной частью автоматного типа. Необходимые условия оптимальности сводят эту задачу к конечномерной минимизации. Активные участки оптимальной траектории располагаются в окрестности перицентра или апоцентра эллиптической орбиты. Количество перицентрических и апоцентрических участков задают схему полета, а продолжительность работы двигателя на каждом участке определяет траекторию. Реализуемая точность исполнения команд включения и выключения реактивного двигателя фактически задает шаг дискретности для автоматной части системы. Поэтому задача условной минимизации является дискретной (целочисленной).

Модель плоского движения космического аппарата в гравитационном поле Земли имеет вид

2vco и со са =--+ —. -, т = -\хи,

r m^]v2+r2 со2

где г — полярный радиус; <р — полярный угол; v — радиальная составляющая скорости; ю - угловая скорость; ме[0,{Утах] - величина тяги двигателя,

Umax = 20 ООО Н; ц = 3.07-10~4 с/м - коэффициент, обусловленный техническими характеристиками двигателя; ц£Утах =6.14 кг/с - максимальный секундный расход топлива; т - масса спутника; %Z ~ GM = 3.986748-1012 м3 / с2 - положительная постоянная.

В начальный момент времени /0 = 0 состояние системы задано

r(t0) = 6 578137 м, ф(/0) = 0 рад, v(/0) = 0 м/с, ш(Г0) = 1.1835-10"3рад/с, m(tQ) = 22170 кг. Время /гсо окончания процесса управления определяется параметрами ГСО

г(/гсо) = 42 164 137 м, v(/rco) = 0 м/с, ö(/rco) = 2.306 -Ю-8 рад/с. Качество управления оценивается функционалом

'гсо

/= f ци(/)Ж. (25)

Для учета количества включений двигателя предполагаем, что тяга задается соотношением н(/) = V'тахЯ0> гДе >"(0 - кусочно-постоянная на [/0,'ГСС)] функция, принимающая значения y(t) е [0,1]. Эти значения определяют состояние двигателя: либо y(l) > 0 - двигатель включен (при >-(/) = 1 тяга максимальная), либо y(t) = 0 - двигатель выключен. Точки разрыва функции >■(-) соответствуют изменению состояния двигательной установки. Для используемой модели маршевого двигателя максимальное допустимое число точек разрыва равно девяти. Функция >(•) играет роль управления.

Требуется найти оптимальный процесс вывода спутника на ГСО, минимизирующий расход топлива (25) при ограниченном количестве включений двигателя. Заметим, что ограничение на количество точек разрыва управления отличают рассматриваемую задачу от классической задачи оптимального управления. Эти соотношения характерны для дискретной системы автоматного типа (см. разд.1). В целом, поставленную задачу следует отнести к задачам управления динамическими системами с автоматной частью (см. разд. 1.6).

Применяя необходимые условия оптимальности динамических систем с автоматной частью (разд. 1.6), показано, что оптимальный процесс состоит из последовательности активных и пассивных участков, при этом задача сводится к задаче конечномерной условной минимизации. Учитывая результаты Гурма-

17

наВ.И., заключаем, что активные участки, на которых двигатель включается с максимальной тягой, располагаются в окрестностях перигея или апогея орбиты. Учитывая реализуемую точность исполнения команд включения и выключения маршевого двигателя (с точностью до секунды), решаемая задача условной минимизации становится дискретной. Исследуются различные схемы полета, удовлетворяющие ограничению: не более девяти включений маршевого двигателя в течение суток.

Для решения поставленной задачи составлена программа, получившая государственную регистрацию. Оптимизация каждой схемы сначала выполняется методом покоординатного спуска, а затем уточняется при помощи целочисленного перебора параметров. Для каждой схемы найдены минимальный расход топлива, оптимальные моменты включения и выключения двигателя, рассчитаны параметры переходных орбит, отклонения конечной орбиты от геостационарной. Проведен сравнительный анализ полученных результатов со штатной схемой, применяемой на практике.

Расчеты показали, что оптимальной является схема 4+1: четыре активных участка в окрестностях перицентров и один - в окрестности апоцентра (см. табл.1). Однако, по сравнению со схемой 2+1 (см. табл.2), применяемой на практике, выигрыш по затратам топлива составляет всего 0.3% от массы всего израсходованного топлива. Фактические затраты топлива на пяти активных участках (по схеме 4+1) будут даже больше, чем на трех (по схеме 2+1), поскольку каждое включение и выключение ДУ сопровождается неэффективными затратами топлива, что не учитывается рассматриваемой математической моделью.

Таблица 1. Схема 4+1 вывода спутника на ГСО

№ орбиты Параметры орбиты Активный участок

фокальный параметр, км эксцентриситет период обращения, ч место включения ДУ время работы ДУ, с

0 6578.1 0 1.47 П 478

1 7357.9 0.11689 1.78 П 479

2 8322.0 0.26119 2.33 П 481

3 9557.2 0.44576 3.60 П 540

4 11456.6 0.72800 10.52 А 634

5 42164.0 0.00208 23.93 Всего: 2612

Таблица 2. Схема 2+1 вывода спутника на ГСО

№ орбит ы Параметры орбиты Активный участок

фокальный параметр, км эксцентриситет период обращения, ч место включения ДУ время работы ДУ, с

0 6578.1 0 1.47 П 975

1 8382.3 0.25811 2.35 П 1026

2 11684.5 0.72290 10.58 А 619

3 42164.0 0.00176 23.93 Всего: 2620

Основные результаты, выносимые на защиту

1. Доказаны достаточные условия оптимальности систем автоматного типа, кусочно-постоянные траектории которых имеют произвольное конечное или заданное максимально допустимое количество однократных переключений [1].

2. Доказаны достаточные условия оптимальности систем автоматного типа, кусочно-постоянные траектории которых имеют произвольное конечное или заданное максимально допустимое количество мгновенных многократных переключений [4].

3. Выведены уравнения для нахождения условных функций цены и условных позиционных управлений, из которых строятся функция цены и оптимальное позиционное управление при однократных или мгновенных многократных переключениях [4].

4. Разработан алгоритм синтеза оптимальных систем автоматного типа с однократными или мгновенными многократными переключениями. Алгоритм проверен на модельных примерах с однократными и мгновенными многократными переключениями [3].

5. Обоснована применимость разработанного алгоритма для синтеза следящей CAT, выполняющей оптимальную кусочно-постоянную аппроксимацию заданной непрерывной траектории. Получена оценка сверху необходимого числа шагов. Разработана программа численного решения задачи синтеза одномерной следящей CAT [3].

6. Получено приближенное решение задачи оптимального вывода спутника на геостационарную орбиту при ограниченном количестве включений двигателя и заданной продолжительности активной фазы полета [2].

Публикации в журналах перечня ВАК

1. Бортаковский A.C., Коновалова A.A. Достаточные условия оптимальности дискретных систем автоматного типа // Известия РАН. Теория и системы управления, 2013.-№1. - С.18-44.

2. Бортаковский A.C., Коновалова A.A. Оптимальный вывод спутника на геостационарную орбиту при ограниченном количестве включений двигателя // Известия РАН. Теория и системы управления, 2013. - №6. - С.93-103.

3. Бортаковский A.C., Коновалова A.A. Вычислительная технология синтеза оптимальных дискретных систем автоматного типа // Вестник компьютерных и информационных технологий, 2013. -№11. - С.3-8.

4. Бортаковский A.C., Коновалова A.A. Синтез оптимальных дискретных систем автоматного типа при мгновенных многократных переключениях // Известия РАН. Теория и системы управления, 2014. -№5. - С.69-101.

Публикации по теме диссертации в других изданиях

5. Коновалова A.A. Оптимальное управление дискретными системами автоматного типа // 11-я Международная конференция «Авиация и космонавтика 2012». Москва, 13-15 ноября 2012 г. - Тезисы докладов. - СПб.: Мастерская печати, 2012.-С. 380-381.

6. Konovalova A.A. Synthesis of optimal determined discrete systems of automatic type // Международная конференция по дифференциальным уравнениям и динамическим системам, г.Суздаль, 2012: Тезисы докладов. — М.: МИАН, 2012. - С.209-210.

7. Konovalova A.A. Principles of synthesis of optimal determined discrete systems of automatic type II Международная конференция по математической теории управления и механике. - Суздаль, 5-9 июня 2013. - Тезисы докладов. -М: МИАН, 2013. С.261.

8. Konovalova A.A. Optimal injection of a satellite into geostationaiy orbit // Международная конференция по дифференциальным уравнениям и динамическим системам, г. Суздаль, 2014. - Тезисы докладов. - М: МИАН, 2014. - С.212.

9. Коновалова А. А. Вывод спутника на геостационарную орбиту в условиях параметрической неопределенности при ограниченном количестве включений двигателя // 13-я Международная конференция «Авиация и космонавтика -2014». 17-21 ноября 2014 года. Москва. Тезисы. - СПб.: Мастерская печати, 2014. —С.633-634.