автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Приближенные методы оптимального управления на основе принципа расширения и их приложение
Автореферат диссертации по теме "Приближенные методы оптимального управления на основе принципа расширения и их приложение"
РГО Ой
- I 01« 1996
На правах рукописи
БАТУРИН ВЛАДЙЗ:? А15КСАНДРОЗКЧ
ПРИЕШЭШЯ: МЕТОДУ ОГГГИМА/ЬНОГО ШРАВЛЕЮ® НА ОСНОВЕ ПРИШЛА РАсгзтенил И ИХ ПЯШПЕНИЕ
□5.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
Автореферат
диссертации на соискание ученой стешни доктора физико-математических наук
Иркутск - 1998
Работа выполнена в Иркутском вычислительном центре СО РАН
Научныя консультант доктор технических наук, профессор Гурман В.И.
Официальные оппоненты: доктор физико-математических наук, профессор Хрусталев М.М.
доктор физико-математических наук, профессор Дмитриев М.Г.
доктор технических наук, профессор Тятюшкин А.И.
Ведущая организация: Институт проблем управления РАН,
на заседании Диссертационного Совета Д 063.32.04 по защитам диссертаций на соискание ученой степени доктора наук в Иркутском государственном университете по адресу:
664003, г.Иркутск. бул.Гагарина, 20.
С диссертацией можно ознакомиться в библиотеке Иркутского государственного университета (бул.Гагарина, 24)
Автореферат разослан "(2- " 1996 г
Москва
Защита состоится
ч
Ученый секретарь Диссертационного Совета, доцент
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы. В теории оптимального управления накоплено много разнообразных результатов как теоретических, • так и прикладных, имеющих'характер приближенных или численных методов. Тем не менее вознгаающке в различных областях практики задачи настолько сложны и разнообразны, что для их эффективного решения существующих методов оказывается недостаточно, требуются новью, учитывающие особенности этих задач. Все это служит большим стимулом развития современных методов оптимального управления.
Имеется несколько четко выраженных направления, по которым развиваются эти методы. Одно ira них связано с обвдм подходе**., сформулированным в начале 60-х годов В.Ф. Кротовым в известных достаточных условиях оптимальности. В дальнейшем этот метод, соответствующим образом дополненный и осмысленный теоретически, получил название "принципа расширения". Смысл его состоэт в том, что исходная задача оптимизации со сложными связями заменяется другой (более простой), в которой те или иные связи игнорируются, при атом вторую задачу нужно сфор?лулировать так, чтобы её рзазкиэ удовлетворяло отброшенным связям. Тем сакым рожается и исходная задача. Оказшзгется, ото можно сделать далеко неедакстзоипым способом, что позволяет- приспосабливаться к специфике - конкретных задач или классов задач. В результате появляется возможность создания целой серии численных и приближенных методов.
■Особое внимание необходимо обратить но вырожденные задачи, .встрсчзхщося часто при исследовании экономических, зкодого-зко-номичоских, технических, медико-биологических и др. систсм. Они (задачи) имеют рпп сеобонносгои, которые связаны с отсутствием искомого олокоптя п классе допустимых, с неэффективностью общих иоооходаяих И ДОСТ'1 гечнмх условии локального оптимума, со СЛОЖНОЙ структурой поля огпкк-пымх упранло-пти. Наприкор, известное урав-
ненке Беллнана в таких задачах может не выполняться. Вычислительные процедуры, построенные специально для этого класса задач, укладываются в общую схему принципа расширения и рассматриваются с единых позиций при создании вычислительных методов. Всем этим и объясняется актуальность выбранной темы.
Цель работы - создание на единой основе (принцип расширения) итерационных приближенных методов решения задач оптимального управления, в том числе вырожденных задач и задач оптимального управления с параметрами, реализация этих методов в программной системе. Применение полученных алгоритмов для решения широкого круга прикладных задач: серии траекторных задач динамики полета вертолетов моделирование и исследование зколого-экономичэской модели региона и водной экосистемы на примере озера Байкал: рациональной эксплуатации рыбной популяции и других эколого-экояомических проблем.
Научная новизна. Все результаты, полученные в работе автором, являются новыми. Они состоят в следующем:
- разработаны алгоритмы улучшения первого и второго' порядка для регулярных задач оптимального управления. Доказаны теоремы о релаксационности методов, установлена связь с необходимыми и достаточными условиями сильного и слабого локального минимума. Разработана серш{ модификаций базовых алгоритмов и доказаны теоремы о сходимости;
- разработаны для систем' с неограниченным множеством скоростей штоды последовательных улучиений первого и второго порядка, доказаны теоремы о рэлаксационности алгоритмов;
- создана программная система, реализующая полученные автором ¡.зтоды;
- рзаона серия задач управления в траекторных моделях динамики
полота вертолетов;
решены задачи управления в экологических и эколого-экономических системах. К ним относятся : задача поиска оптимальных сценариев развития Байкальского региона по комбинированному зколого-экономкческому критерию; задача оценки антропогенной нагрузки на экосистему озера Байкал; задачи рациональной эксплуатации рыбноа популяции на прккера посольскоз расы Байкальского омуля; оценки воздействия загрязнения воздуха на здоровье населения промышленного города; управления лзеодобывающим предприятием.
Практическая ценность. , Разработанные алгоритмы, ш. модификации и программное обеспечение могут использоваться при решении широкого круга прикладных задач (технических, зкономичоских, природно-экономических и др.). Работоспособность и эффективность этих алгоритмов подтверждена рядом тестовых примеров, а также многочисленными задачами управления а траеюгорных моделях динамики полета вертолетов и эколого-зконо-мических моделях. Разработанные алгоритмы и программное обеспечерио внедрены на Ухтомском вертолетном заводе им. П.И.'Какова , в Научно-Исследовательском институте медицины труда и экологии человека СО АМН (г.Ангарск), использовались при подготовке концепции устойчивого развития Байкальского региона и при создании экологической программы Иркутской области.
Ап1>и(1?шия работы. Основные результаты работы докладывались и обсуждались на III Всесоюзной Чотаввскоа конференции по устойчивости диижония, аналитической механике и улрлгианга дтсхниэц (Иркутск, ]977), на IV Всесоюзной школе по оптимизации (Иркутск, 1978), на VII Нсосошний школе по оптимальному упршиянга (Неясно-нрек, и/Л)), нч уш Нсесоюном совещании но проблемам уирлвлания
(Таллинн, 1980), на Всесоюзной конференции по развитию производительных сил Сибири (Новосибирск, 1980), на х Всесоюзной конференции "Системное моделирование социально-экономических процессов" (Воронеж, 1980), на Всесоюзной школе-семинаре по математическому моделирования рационального использования природных ресурсов (Абрау-Дюрсо, 1980, 1988 ,1990), на iv Конференции по огггимально-му управлению в механических системах (Москва, 1982), на х Всесоюзной конференции "Совершенствование методологии управления социалистическим природопользованием" (Москва, 1983), на Конференции "Проблемы прогнозирования природных явлений" (Иркутск, 1884), на vii Всесоюзной конференции "Проблемы теоретической кибернетики" (Иркутск, 1985), на Всесоюзной конференции "Развитие производительных сил Сибири и задачи ускорения научно-технического прогрэс-са" (Красноярск- Барнаул, 1985), на vi Всесоюзном съезда по теоретической и прикладной механике (Ташкент, 1986), на vii, ix, х Сибирской школе - семинаре по методам оптимизации и их приложениям (Иркутск, 1987, 1985, Максимиха, 1992), на Ляпуновских чтениях (Иркутск, 1987), на Всесоюзном семинаре "Динамика нелинейных процессов управления" (Таллинн, 1987), на научно-практической конференции "Научно-технический прогресс и проблемы охраны природной среды в бассейне оз. Байкал" (Улан-Удэ, 1987), на Советско-Китайском симпозиуме 'Теология и экология бассейна реки Амур" (Благовещенск, 1989), на Международной школе-семинаре "Методы оптимизации И их приложения" (Иркутск, 1989), на iv Международной конференции "Проблемы комплексной автоматизации" (Киев, 1990), на Всесоюзном семинаре "Адаптация и оптимизация систем .на основе критерия обоб-црнной работы" (фрунзо-Чолпон-ата, 1990), на Всесоюзном сомикаре "Моделирование региональных систем" (Уфа, 1990), на Всесоюзной юксию - сомин чри "Анализ и мсщииронгшио околого пконимичоских
о-
систем" (Иркутск, 1991), на Международной конференции "Метода и программное обеспечение для управляемых систем" (Иркутск/ 1991), на семинаре Института математики Лодзинского "университета (Лодзь, 1991), на Мевдународном симпозиуме "Оптимальное управление механическими системами" (Москва, 1992), на Международном семинаре "Проблемы комплексной оценки риска для населения и окружающей среды в крупных промышленных регионах" (Москва, 1992), на Международном семинаре "Социально-экономические и экологические аспекты анализа риска" (Максимиха, 1892), на Конференции "Теоротическга и прикладные проблемы в экологии" (Бухара, 1992), на xix пколе-семинарз "Математическое моделирование в проблемах рационального природопользования" (Новосибирск, 1992), на Международной конференции по экологии Сибири (Иркутск, 1993), на Международной конференции "Сингулярные решения и возмущения в управляемых системах" (Пэрзс-лавль-Залесский, 1993, 1995), на ieee Международной конференции (Франция, 1993), на Международной конференции "Устойчивое развитие: Байкальский регион как модельная территория" (Улан-Удэ, 1994), на tims хххи конференции (Анкорида, США, 1994), на Сибирской конференции "Закономерности социального развития - ориентиры и критерии моделей будущего развития" (Новосибирск, 1994), на Всесоюзной конференции "Компьютерная логика, алгебра и интеллектов управление. Проблемы анализа устойчивости развития..и стратегической стабильности" (Иркутск, 1994), на Международной конференции "Устойчивость и управление для трансформирующихся нелинейных систем" (Москва, 1995), на и Международной конференции "Математические алгоритмы" (Нижний Новгород, 1995), на семинаре математического факультета Римского университета (Рим , 1995), на семинарах КПУ РАН, ИПС РАН, ИПМ РАН, ВЦ РАН, Ир ВЦ СОРАН, МЭСИ, в Красноярском и Томском государственных университетах. Иркутской государственной
экономической академии, кафедр теории систем и методов опгижизации Иркутского государственного университета.
Структура работы. Работа состоит из введения, семи глав (четырех теоретических и трех прикладных), заключения и списка литературы из 188 наименований.
СОДЕРИАНИЕ РАБОТЫ.
Во введении обосновывается актуальность темы диссертационной работы, характеризуется научная новизна и практическая ценность работы. Приводится краткий обзор результатов по приближенным катодам решения задач оптимального управления, описывается структура и приводится краткое изложение основных результатов диссертации.
Первая глава носит вводный характер. В ней излагается принцип расширения, понятие улучшения и метода локализации, постановки задачи оптимального управления для непрерывных и дискретных систем, основные сведения из теории вырожденных задач. В параграфе 3 изучаются свойства матричного уравнения Риккати, которые в дальнейшем используются при исследовании алгоритмов улучшения и условий локального минимума второго порядка.
глава 2 направлена на разработку методов сильного и слабого улучшения. В ней предложены алгоритмы первого и второго порядка и доказаны теоремы о релаксационности. Предложены процедуры построения локально-оптимального синтеза управления. Сформулированы теоремы о необходимых и достаточных условиях сильного и слабого локального минимума.
Рассматривается управляемая система
= т.х.и) (I)
на отрезке времени с заданными начальными условиями .
к(ъо>=х0 и ограничениями на управление ии)<?и, где хтейп- не-
прерывная и кусочно дифференцируемая вектор-функция, u(t)eRr- кусочно непрерывная вектор-функция.
Множество пар функция (x(t),u(t)>, удовлетворяющих па ре численны;' условиям, называют множеством до пу стаж и обозначают d. Предполагается, что d * в. «
Задан функционал
i
>
I = F(x(t4>) + J f°(t,х,u)dt. (2)
t
о
Задача состоит в поиске последовательности {(x(t),u(t)}c d
в ®
такой, что Кх ,и ) Inf I, з —» оо.
2 8
D
Рассматриваемой задач© <D,i) родственна следующая. Задан элемент n'eD, требуется наяти я51со, на котором Кп") < Кв1) (лучший, чей и1). Эта задача мсяэт иметь депосродственное практическое значениз с точки зрения совершенствования своаств того или иного реального объекта, представляемого в модели приблсзнком о1, а, с другой стороны, мокэт служить элементом итерационной процедуры последовательных улучшений для построения шшшизиру'яцзя последовательности в задаче (D,i>.
Разработка методов последовательных улучшении часто базируется на исследовании приращения функционала и ого различных аппроксимация. Если в аппроксимации приращения функционала требуется обеспечить малость по Дх ( либо по Ли), то соответствуй®^ алгоритмы принято называть методами сильного (слабого) улучшепня. Например, методы слабого улучшения - градгантпыэ.
Метод сильного улучшения. Пусть имоотся начальное приближение (xl(t),vx(t)). Обозначим Ha(t,x,f.u) - t> ftt.x.u) -- af°(t,x,u), sf^ct.x.p) = вир н'х(t,x.г.и), a«co.i] и введем
следующую noicropiiu-матричную систему дифференциальных уравнений:
(3).
(4)
(5)
(6)
где фи) - п-мерныа вектор, ои> - п*п-симметрическая матрица, Е-единичная матрица, производные функций ге" и н0, подсчшываюггся вдоль и.х^и.фсь)) и (£, х* соответственно.
Обозначим и(г,х,р) = аг»пах Н^Ъ.х.р.и).
Алгоритм.
1. Задается и = и1и), интегрируется "слева-направо" система х = ги.х.и1^)), х<ъ0) = хо, находится х1<г>.
2. Задается параметр алгоритма ае(о,1].
3. ' Интегрируется "справа-налево" система <3)-(6), определяются фи), ои).
4. Интегрируется система х = f(ь,x,ии,х,р)), хио)=хо, р = ф + осх-х'т) , тем самым находятся х"и) и и"и) =
йи,х"и>,фи)) + стинх1?и)-х1и)). ■
5. Если Кх",и")г1(х1,и1), то параметр а уменьшается и процесс повторяется от п.З.
Введем понятие-сильного локального минимума.
Пусть Р - множество допустимых исходной задачи и (х т, й"< ъ > > - допустимые траектория и управление. Определим множество: Р4<е) = {(х(Ъ), и(Ь))е р : |хс ъ) - х<1;)| < В, Ь е Т >.
Опройэлэниа I» Пару функций йт, йт>е о будем называть сильной локальной минималью, если существует такое е > 0, что I (х, й) 1 <х,и) для всех (хя), иипеи^о
Относительно постановки задачи с>удом предполагать выполнение сдодушмх условия:
] ('
(1°) функция i*4t,x,p) непрерывна и непрерывно дифференцируема дважды по х и р;
(2°) существует непрерывная и дважды дифференцируемая -по р,х функция 5(t,x,p) такая, что H(t,x,p,u(t,x,p))=sr(t,x,p).
Для формулировки свойства релаксационности рассмотрим два случая:
1. Начальное приближение (х1 (t) ,u*<t) ) Ев является экстремалью Понтрягина.
2. Начальное приближение удовлетворяет принципу максимума Понтрягина. .
Хеврона I. Пусть функция fco непрерывна и дважды дифференцируема, а функции я?( ■), Н(-) и u(t,x,p> удовлетворяют условиям (1°)-(2°), тогда, если (xI(t),uI(t>) ве является экстремалью Понтрягина, алгоритм определяет новое uIl(trn соответствующую траекторию x^tt), такие, что 1<х11,и")<к**,и1)..
Рассмотрим второй случай. Пусть при a-I u®(t) удовлетворяет принципу максимума. Тогда система (3)-(6) разделяется на два. Соотношения (4),(8) являются матричным уравнении Ршетати , которое, если имеет решение на всем отрезке [to,ti], то uI(t) не улучшается данным алгоритмом (выполнены достаточные условия сильного локального ¡кзшмука ). Рассмотрим случая, когда реиэнпэ сукэстзует на <t*, t4], t* >to. Послэдаее означает, что lin,! lo(t)i i = od, точку ъ* будем называть особой еочкон.
I -и
В- этом случае алгоритм улучшения имеет ввд:
1.Параметр а подбирается так, чтобы особая точка соипала с ъ0.
2. Наход5ггся симметрическая подаатрзда <f <яатр:шы о,
обладающая свойством lim |det(oI(t))l=œ. i-»t
о
3. Нэходагся лрздзл x=iim (а1)'1.
t->t
о
II
4. Решается система уъ-0' |ь|=е>о.
5. Интегрируется система:
х = fCt.x.uít.x.tjKtJ+mx-x^t))), te( tQ, t^ ], x = f(t0,x,u(t0,x,(|H(b',0)')), x(t0)=x0, тем самым находятся x"(t) и u" (t)=u(t,x,ф+о'(x*1 -xI(t))>.
6. Если KxII,uII)5:i(x1,uI), то параметр e уменьшается и процесс повторяется от п.4.
Теорема 2. Пусть управление ux(t) удовлетворяет принципу максимума и при а=1 уравнение Риккати .содержит особую точку t*6(t0>» тогда управление u1(t) улучшаемо данным алгоритмом.
Метод слабого улучшения. Предположим, что в задаче оптимального управления u=Rr. Пусть имеется начальное приближение (xI<t),uI(t)). Введем следующую векгорно-матричную систему дифференциальных уравнений:
Ф = " + <u + - <?>
° = - С- fy + <0 ^»«Cu- ci-^r1*
«(Н® + ^.d), (8)
их иф
(pet,) = - OF^x'Uj)>, att^) = - aFxx(xI(t1)) -
- (i-a)E, (9)
. Au(t,Ax) = - сн£и- (l-a)E)_1CH^+ (0H(Jw+ Нхи)'Дх], (10) гда ф(и - n-мерный вектор, d(t) - п*п-симметрическая матрица, Е-едишчная матрица, прозводные функции н" подсчитывагатсп
ВДОЛЬ (t,xr(t),(J)(t),uI(t)), Дх = x-x'ít).
Рассмотрим два случая.
А. Для начального управления "At) при a=i не выполнено
условие стационарности H^t.x'u) ,ф<ъ) ,ur( t > >*о.
в. Для упраапения u*<t> и соответствующей траектории x*(t)
при а=Х выполнено уело низ стационарности н с t ,х'< t) ,ф( t) ,u*( t > )~о,
IP.
усиленное условие Лежандра-Клебша Huu(t,x1(t),(J><t),u:*(t)><o, матричное уравнейив Риккати содержит особую точку t*e(to,t4]. Случай I.
1. Задается u=u* (t), интегрируется "слева-направо" система xsftt.x.^tt)), x(tD)=x0, находится x*(t). •
2. Задается параметр алгоритма ae(0,ib
3. Интегрируется "справа-налево" система <7)-(9), тем определяются фсt> и a(t).
4. Интегрируется система x=f<t,x,u) при- u=uz(t)+Au(t,Ax), Ax=x-x*(t), где ди вычисляется по формуле (10), тен самым находятся *"<t> Hu"(t)=u (t)+iu(t,x,I(t)-x'(t)).
5. Если KxII,uM)ii(xI,ul), то параметр a уменьшается и процесс повторяется от п.З.
Случай 2.
1.Параметр а подбирается так, чтобы особая точка совпала с tQ.
2. Находится симметрическая подматрица er* матрицы о,
обладающая свойством lim ldet(aI(t))l=oo. t-н
о
3. Находаггся предел x=iim'(о*(t))"'.
t-»t
о
4. Решается система %ь=о, |ь|=ё>о.
5. Интегрируется система:
X = f(t.x.u1(t)-Äu(t.Ax)), x(t0)=x0. Ах = X - Kit),
где Au определяется по формуле (10), при te(tQ,tt], а при t=to Au = -<H?U-a-a«)'^).
6. Если Нх",^' jiK*1,«1), то параметр е уменьшается н процесс повторяется от п.4.
Теорема 3. Пусть функция F<x> дважды даффороицируома, функции f(t.x.u) и tc'<t,x,ul дважлы дшкпронцируомы и упряплшио
u'it» y.mm.!!m ИЩИ!" г условия А либо Р, тощи алгоритм улучштот
управланю uI(t).
Локально-опсииальныи синтез управления. Пусть пара (?.(t), u(t)) удоаяэтворяэт достаточны!,! условиям сильного локального шгимуяа, т.е. выползая принцип максимума и соответствующее уравнение -Риккати имеет рэшэкиэ на всем отрезке [tQ,t ] при а=1. Алгоритм построения гфиближ8Нно-огггамального синтеза заключается в следующем. Находится решение, фи) сопряженной системы и o(t> матричного уравнения Риккати (4),(в). Формируется синтезирующее управление:
й(t,х) = arg max (ф' f(t,x,u) - f°(t,x,u>), (II)
UEU *
где фх= ф(t> + a<t) дх, дх = х - x(t>.
Утвэрэдзню I. Пусть u(t.x) - синтез, заданный формулой (II). Тогда его оценка есть величина о (ег). где е - радиус окрестности, в которой строится синтез (|дх| $ .
Мегаоды первого порядка. При реализации процедур улучшения второго порядка наиболее трудоемкий процесс интегрирование вспомогательных векторвд-матричныж систем для ф,ст. рассмотрим, к каши конструкциям алгоритмов можно пршти, если функцию ф(t,х) искать в линейном ввдэ, т.е. положив act)=o. Тогда система (3)-(6) преобразуется к системе вида: ф = - фс^) = - aFx(xI(ti)), ■
а- новое управление находится из интегрирования исходной системы
x=f<t,x,u(t,x.,<|>)), x(to)=xo.
Для алгоритма слабого улучшения вспомогательная система (7)-(9) преобразуется к виду:
ф = - Н? + - а-СОЕГ'н", ф<^>.= - aFK(xlUt>),
а формула для шдсчета прирашэния по управлению:
И
Новое управление. и траектория находится из интегрирования исходной системы:
x=f(t,x,uI+Au(t,x-xt(t)), x(t0)=x0.
Сходимость метода сильного улучшения. Пусть {xk.(t),uk(t)} -последовательность траектории и управления, генерируемая алгоритмом сильного улучшения.
Тоорэги 3. Пусть вектор-функция f<t,x,u) непрерывна по совокупности своих аргументов, функция щь.х.р) дважды непрерывно дифференцируема по х и р, функции F и н дваэды непрерывно дифференцируемы по х, функционал ограничен снизу, тогда последовательность, {хк < t), uk < t)} страмится к нылолнашю принципа максимума в сиыслэ
s
lim J (пах H(t,xk,ii>,u)-H(t,xk,(|\uk>)dt = О.
. UEU
k — ► со t
о
Теорзгга 4 . Пусть выполнены предположения Теоремы 9 и X, \F либо отрицательны, либо Ä.->c1<o, XF—»c2<o при к -+ со, гдз- X. Хг
максимальные собственные числа матриц «tK<t1xle,<|)) и -Fxx(хк(t4>) соответственно.
Тогда последовательность {хк,ик>, генерируемая данным алгоритмом, стремится к выполнению условия сильного локального минимума в смысле:
1. lim I ( max H(t,xk,$,u> - Н(Ъ,х'е,(|Уе,г1к) )dt = О.
k —♦ CD J UcU
2. Предельное уравнение Риккати имеет решение на [t^tj.
Далее в главе формулируются условия сходимости метода
слабого улучшения второго порядка. Разработан специальный метод улучшения второго порядка для задач с параллелепипедами
ограничениями, изучаются свойства релаксационности и сходимости предложенного алгоритма.
в третьей главе рассматривается задача оптимального управления
I=E(x(tt) tnf, о
D = {w=(x(t),u<t)):|| = f(t,x,u), x(t0)=x0> te^tt^,^] ,u(t)eU £ Er,x(t)eHn>,
в которой ынокество скоростей v<t,x)=f(t,x,U) неограничено. Функция x(t)- непрерызна и кусочно дифференцируема, u(t)-кусочно непрерывна.
1.S
В работах В.И.Гурмана предлокан метод исследования таких задач, который основан на редукции исходной задачи к некоторой вспомогательной, получившей название производной задачи, а сам штод - метода преобразований. В соответствии с этим методом вводится в рассмотрение предельный конус множества v :
п-
J? ,(t,x) = {1 « R : 3 {v- } с V : |v I - . со, av s\v I -» I. a >0 } ,
V в |'в* в * в *
из которого выделяется подконус ^'(t,x>'£ ^v(t,x) такой, что система
* (t,x) , (12)
■ р которой t играет роль параметра, имеет n-k - мерный гладкий
щггеграл t](t,x): т^ (t,x>i=o, 1« x'J'; Одновременно t)(t,x)
является интегралом системы:
в* к
= h(t,x), zeR , (13)
1. Гурман В, И. Вмрождв/лныа задачи оптимального управления. И.; Ньука, 1В77. 304 с.
2, Гуркмн О. И. Принцип расширения в задачах управления. - М. :
н*ук», юна, - гни с. ,,.
ю
где h=(hi.....h^ ) -базис линйной оболочки и удовлетворяет
линейной системе в частных производных: r^(t,x)h(t,x)=o. Исходная система заменяется производной системой:
dy
= TJK(t,x)f(t,x,u) + T}t(t,X), u 6 и, х S Q(t,y) = {х: у = î](t,x)>,
отсывак^шзй множество e=>d обобщенных решений исходной систем (игшульсных режимов).
Метод сального улучшения второго порядка реализуется пгетени-тельно к производной задаче, в которой аналитическое наховдешзз первых интегралов системы (12) заменяется слздуквдэа универсальной схемой их задания. Пусть задан элэкент (x(t),uct>)еЕ. Кз сущзст-вования интеграла системы (12) следует существование в пространстве (t.x) n-k+i параметрического многообразия s, проходяарго через точку (t0.x0) и ортогонального полю векторов (О,^.....ьк ). Находится рэшениэ х(2) системы (13) с начальным условием x(0)=x(t). Точки (t,x) x=x(z). zed* образуют k+i - керное многообразна в TxRn, которое пересекается с s в единственной точке (t,x(t)). При каждом t строится касательная плоскость Шп к сечению s(t) в точке x(t) с ортонормирюваннш! базисом а1 ( t ), где а1 ( t ) - непрерывное ортогональное дополнение к h<t,xI(t)) в пространстве (х). Тогда уравкэ-нкв плоскости мошт быть представлено в Параметрическом виде: х = xx(t) + AI(t) (у - у1(t)),
где у. - вектор координат точки,, лежащей на плоскости, в указанном базиса (n-k-вектор); у1(t) соответствует х1(t).
Обозначим через t.г,у) решепке системы (13) с начальным условием
%(t,0,y) = xx(t) + A1 (tMy'-y1 (t)). (14)
Для любого t е ï В T04Ite хх <t) dot СХу-Х,-! = • det [ А1 ( t.),
17
ьи.х'съш О по по строению начальной шюскости. Слэ-' довательЕо, существует е-окрэстность точки у1^), в которое <3еъ [ %у,%1 ]х=хи о>у) ^ о. Тем саша определяется множество
0Е = т,х) е X = хи.г.у). |у-уг(t> | < е, ъ « т,
г е йотД }, . (1Б)
в которой при каждом ь существует взаимно однозначное
соответствие х «> (у,г).Таким образом, каадоа точке начальной
плоскости ставится в соответствия единственное решзню систекы
(13) и наоборот. Тогда у- т)(ъ,х) есть интеграл системы (13). Его областью определения в пространстве <ъ,х) служит множество <ае , которое в дальнейшем будем называть е-слоем. В пространства и,у) ему соответствует е-трубка [у-у1(ъ)| < е .
В неявно заданной локальной производной задаче строятся конструкции алгоритма сильного улучшения.' Всо необходимые для построения алгоритма улучшения элементы интеграла - производные до третьего порядка включительно, находятся путем систематического дифференцирования тождества (13) и соответствующих начальных условий
(14), что приводит к дополнительной трехмерной апш.в дифференциальных .уравнений.
Алгорэты, содержащий поиск максимума обобщенного, гамильтониана не только на множестве управлений и, но и в е-слоо фазового пространства, будем называть нелокальным.
Алгоритм нелокального улучшения. Задается элемент ш1(Ъ> --(::*(ь), и'цце 8 и параметр алгоритма а«<о,1]. Вычисляется функционал кш1). Выбирается интегрируемая подсистема (12) и базис линейной оболочки^1"- ь = о^.....^) такой, что | = 1, ГТк. Производится операция о СЫ^.х'и^)^,—ог)], где о - ошратор
ортогоналюации, е,..... еп- набор единичных орт в В". Вводятся в
|мс(!мот|оииа произвольные п -к- мерная шкгор-'функция а:< г.поп-
К;
рэрывная вместе со своши производными гех, эгхх®1х, 8ХХХ. гг1хя и п - мерная вектор-функция 7<t,z,y), непрерывная вместе с про-1гаводными 7у, 'уя, 7уу, 7yr, "7„. Относительно œ(t,x) й 7(t,s,y) записывается следующая вспомогательная система уравнения: г>(Лг)
• = - Л(эех(Ь - h )); (16)
а»
{а а а а о и -к
= h, = hxh , 1 = 1,2, .... n ;
(17)
*t1
'y
= hX7V ; (18)
П1
■yy n
= £ T^h1 7 + hS
'V X * 'V * 1 ■
. 'y X. * 'y X 'yy
k= 1 X
с начальными условиями
Sx(t,X(t.O,y)) = A'(t), 8Et ( • ) = - A'Â(y - y*(t)> ;
A'hx.h' ' 3ix<'> = À' ;
®ixtx <'} " ■ St (A'\h'> ; (18)
ax.x,x (''^'(h^h'h h'h -h )h' ;
V j I J j I I J
7(t.O,y) = x (t) + A(t)(y -y'it)), 7l(-> = h(t,x(t))j 7y(t,0,y) = A(t), 7yy(■) = 0, 1 = 1,2.....n.
Здесь через A(t) обозначено непрерывное ортогональное дополнонга
К h(t,x (t)).
Уравнение (16) следует рассматривать как операторную запись системы уравнения для нахождашя элементов (производных) функции
19
гг(ь,х), опредшяекых последовательностью (17), например,
»сзе_ )
—х— = - (8Е (Ь - ь>) = - гг (ь-ь)-геь = - ае ь . .
х х , хх. хх. хх1
Элементы ■ функция й(ъ,х) и 7(ъ,г,у), полученные при интегрировании системы (1б)-(19) вдоль %{Ь,г,у>, имеют смысл соответствущих элементов интеграла *](ъ,х) и функцни %(ъ,г,у). Давзе последовательно выполняются следующю операции. I. Находятся у* и), А1(Ь), х*<ъ) из системы у* = гек(Ъ,х*(Ь)) £(Ъ,х*(Ь), и'Ш) + ^ (Ъ.х1^)) ; а
А*= - 11(Ъ,х*(Ъ)) [ Ь и.х'ип^'А'т ;
X &Х.
х* = А1 ('Ь)у1; = ЫЪ.х) ;
в(Лгг)
( 8 8 Л
ЛСЕШ - Ы), Л = | | ;
у*<*0) = 0 , А1^) = в [Ъио, х1^)), .....оп] ;
х*(Ъ0) = ххио), х = Х^(0,ух(Ъ)) = х*и);
ех(ъ,х1(ъ>) = (а1 (ъ))', аг^.х'т) = о.
2. Интегрируется система
ф = - а + оя; (20)
<п~к>
д = -(е4 + в о + сгв + ог о) + (1 - а)Е ; (21)
11 12 21 2 2
ф(^) = - X ; О(^) - - У - (1-Я) Е<п~к>; (22)
совместно с уравнениями (1В)-(1р). Здась ф<t)- (п-к)- вектор, о(ъ>-(п-к)х(п-к) - симметрическая матрица, Е<г,_к>- (п-к)«(п-к)
единичная матрица.Векторные и матричные функции .к24 »вг1 >
вгг,зависящие от и.хи.г.у'и) >,ф(Ъ)), а к, у от съ.хи^о,
у1<)>» вычисляются по определенным формулам, например,
20
^ = E Z X¿ . ■ х = Е .
/где z= V Pl [ tj| + E ( t¿ s? + r¿ x a4) ],
1=1 •• i 4=t q J q J j
S(t,%(.),P)= f(t,%(t,Z,y), Ü*(t,y.2,p})
и икают следующую размерность: .rf.s.st- (n-k)- вектора, «s21 »в2г •
У- (n-k)*(n-k) - матрицы.
Выражения для интегрирования уравнений .(20)-(22) содержат элементы вспомогательной систеш (16)-(19) и конструкции исходной задачи. Перед тем как воспользоваться этиш формулами, нужно проинтегрировать при каждом фиксированном . t вспомогательную систему вдоль решения х = %(t,B,yI(t))- уравнения (13) до точки а = 2 (t, у1 (t), tj)(t)). Тогда конструкции исходной задачи ПОДСЧИТЫВаЮТСЯ при х = %(t,z(t,yX(t), (¡>(t)), yT(t)), u = u(t,X('), г^ф), а элементы вспомогательной систеш. - в точке (t,yl(t), $(t)), a(t,yI(t), ijxt)), (ti-,yI,3(tt,y1)), где a(tt, у1) = arg min F (%(tt,z.y1)); zit.y1^) = are max <j)(t)'
. Z 3
[2x(t,%(t,z,y1)) f <t,2<«), ü(t,%(>), ae£ $)) + !£l(t,X('))]!
u(t,x,p) = arg max p'£(t,x,u) при p =ге^ф.
a u£u
3..Находятся y"(t). A"(t). x"(t) из систеш у = s^ít.xct.zít.y.pjj-fít.xío.üít.xo,®;?) + at<t,x<')) ;
•ix . . d . . x . öx
A =-h(t,x <t))l-^h(t,xI1(t))J'A <t)s x = A (t)y; =h(t,x)j
e< AS) Oz
( О O 4
=.-.A(®)<(h - h)); A « I } '
y(tQ) = O; A"(t0) = e Ch(t0,x1(t0)), e, .....en] i
• x"(t0) = x1«^); x = X(t.O.y) = x*(t) + rt'ttKy -y'(t)) ¡
ae^t.xtt.o.y)) = (A1 (t))'; ®t<«) = - < A* 11 >)' A* (y-yl (t)).
Здесь j> = ф + СГ(у - у1 (t)), z(t,y,p) = arg max p'CSe^ (t,X(t,z,y)) x
z
x f(t,x(-)), ü (t,x('), 3Bx p)) + ae^t.xt-))3,
z(t4,y) = arg min F(X(t4,z,y)).
z
Я
Тогда z (t> = z(t,yII(t),(j)(t) + o(t)(yII(t) - yx(t))) ,
u"(t> = ü(t,x(t,zII(t),yII(t)),®x(t{)(t) + a<t><yxx<t) - yx(t))),
zII(tl) = z<t ,y"(t )) ; x"(t) = X<t.z"<t>, y"(t)).
ii • 4. Вычисляется кш >. Если Ka") < KU ), то ш"=
<x"(t), u"(t)> берется в качестве ш" и начинается следующая
итерация. Если же ни"> > нш1), то параметр а уменьшается и
вычисления продолжаются с п.2.
Полученный метод наследует свойства алгоритма сильного
улучшения, сформулируем условия улучшаемоста в терминах исходной
задачи оптимального управления. ' •
Введем в рассмотрение следующие функции:
SfM(t,x,p*) = вир p*'f(t,x,u)
(функция ж (.)-• гамильтониан исходной задачи - существует при р*= р Rn"k) ;
Hlu>(t,y,p,z) = «*(t,X<t,z,y),T£p) + p'T}t (t,X(t,z,y));
Sf (t,y,p) = eup H"u>(t,y,p,z); zedon^x
(t ,y) = Inf'FiXit^z.y)). y,p e Rn~k, z e Rk.
zedon^ x »
Onpe/pjaHMö 2. Назовем элемент ш1 = (xx(<), ux(>)) e e регулярным для данного алгоритма, если не выполняются одновременно слэдуициа условия:
1°. u* < t) = are max (|)(t)' » (t.x'tt)) f (t.x'Cc), u);
UCiU
z*(t) = arg max <|)(t)' [3ex (t.Xit.z.y* <t))) x • zedont% x
x f(t,x('), u*(t)) + aet(t,%(•))] ;
zzltt) = arg min F (%(tt.z.y1)));
isdom %
1 ■ 1
aas ад
• X t
<p = - -ff , —T— = - sä h , ~~»1 - - as h. ;
T oz xx oz x l
yx = sx(t,x1(t))f(t,x1(t), ur(t)) +aet(t, x1 (t)) ; d „
Ax= - h (t.x^t))^ h (t,xI(t))J A1 (t) ;
x = А у ; = h (t,x); ф<t^ >= - X;
^(t.XU.O.y'it))) = (A1 (t))'; St(>) = 0;
yrit0) = 0; Az(t0) = e [h(tD, xr(t )), .....en] ;
xx(t0) = xx(t0) ; x = X<t.0.yI<t)) = xx(t).
2°. to- особая точка уравнения (21) при а = I.
Это означает» что регулярный элемент не долвен быть зкстрои-алью Понтрягина в производной задачэ с особой точкой уравнения Риккати в tQ.
1. Функции f(t,x,u), F(x> непрерывны и двазды непрерывно дифференцируемы по х,и и по х соответственно; £ непрерывна по t. Функция-h(t,x) непрерывно дифференцируема по t и дванда по х .
2. Существует е>о такое, что в в- слое (15) rankihtt.x))^, при кавдом фиксированном t выполняется условна интегрируемости ь1х(ъ.х)ь^ъ,х) - hjx<t.x)ht(t,x) = о. Иножоство Qa является инохяством полной управляемости для системы (13), т.о. из лхйоа точки множества qq мокло попасть в любую ого другую точку по траекториям системы (13).
3. Существуют попрорыпнап по t, нопрорыгшая и дназд напрпрышш диффоропцнруомая по z.y.p функция u*<t,y,z,p> т;иш,
ЧТО H<u> (t,y,p,z) = p'T}xf<t,X(t,z,y),u*(t,y,z,p)) + p"KJt(t,%<•)),
и непрерывные no t, непрерывно дифференцируемые по y,p и у -соответственно функции z(t,y,p), z(tt,у) такие, что.
«(t.y.p) = H<u'(t,y,p,a(t,y,p)); •^(t^y) = F(X<t,z<tl>y)).
Теореш 5. Пусть выполнены предположения 1-3.- Тогда алгоритм улучшает лзобоа регулярный элемент, на являющийся минималью в локальной производной задаче.
Далее в главе излагается алгоритм нелокального улучшения, в котором в качестве . начального приближения используется непосредственно кусочно непрерывная пара (xI(t),uI(t)), задащая импульсный режим. Ортонормированный базис a1 (t),-функции ф<t), a<t) будут терпеть разрывы в тех же точках, что и x'(t). Алгоритм дополняется расчетом скачка в' точках - разрыва. Сформулированы . достаточные условия относительной'оптимальности импульсного режима и на их основе предложена процедура построения, относительно-оптимального синтеза управления.
В б 4 третьей главы рассматривается задача, в которой . управляемая система имеет вид
= g(t,x) + h(t,x)u, jggj
n k
te [t0,t4l, x(t)e R , u(t)e R , x(t0>=xo, (24)
где x(t) - кусочно дифференцируемая функция, u(t) - кусочно непрерывная. На множестве D пар функций v=(x(t),u(t)), удовлетворяющих перечисленным условиям, задан функционал
I=F(x(t^)), (25)
который требуется минимизировать.
Относительно постановки задачи сделаны оаздузощие предположения:
1. функция F(x(tt)) дважды непрерывно дифференцируема;
2. функции s(t,x), h(t,x) непрерывно дифференцируемы по t и дважды ПО х;
3. матрица h удовлетворяет условию Фробениуса, т.о., если hl,...,hk - ее столбцы, то при любых i,d=i,k справедашы равенства: h.x(t,x) h^t.x) = hJx(t,x) h. (t,x>.
Дополнительно к системе (23) вводам уравнение
ff = и, z(to)=o (28)
и рассмотрим систему в частных производных
й = h(t-Xb. х|z-o = У- <27)
Пусть y=Tj(t,x,z) - набор независимых шрвых ютогрзлов спста-ш (27). ПэрейдЗм в задаче (24)-(25) от переменных (x,u) к переменный (y,z>. Рассмотрим полную производную по t в силу сжггёкы (23), (29)
от T)(t,x,z). Кмовм at у = t^s + т\ + ст^ъ + Используя
тождество т^ъ + т^ = о, получим задачу
g|=f(t,y,z), y(t0)=x0. (28)
I = r(y(tt ),о) Inf, (29)
где fit,у,s) = Tyt.XU.y.s)) g(t,X(t,y,s)) + T^ ( t ,x< t ,y, z) ), У(у(t^.s) = F(X(.tt,y(bt),e)), в - k- керныа параметр, y(t) -кусочно дифференцируемая функция (новая фазовая перегнанная), г(Ъ) - кусочно непрерывная функция (новая управляющая переменная).
В качестве базового алгоритма в задаче (28) - (29) используем катод слабого улучшения второго порядка гл.2. Его рэсппйровкэ в терминах исходной задачи приводит к следуксрэйу методу последовательных улучшения. Вводом в рассмотрение функцию
ни.х.ф.и) = ф в(ъ,х) + ф м*;,х>и и выражение 01
— Н=Н = (- НЬН+Н Н, + Н ,).
и. и. и. (Ь х и.х ф и,1 9
ас II I т I
которое понимается как полная производная от н в силу обычных
-
производных для х и фе т.е. когда нх = - ф, = х. Пусть даны два вектор-функции т.х.р) и ьи.х.р) размерности г. Через {И.ь} обозначал скобку Пуассона для функций и и ь, которая вычисляется по формуле: {й,ь> = нхьр - нл,х. Алгоритм.
1°. Пусть задано и1 (и, интегрируется система (23), получает-ч траектория
2°. Задаётся параметр алгорэтма ас (о,ц. 3°. Интегрируется вэеторно-ыатричная система
ф = - нх + оГ£!и1 )' ({ни,нц} - (1-а>Е) нц ,
(.(ЗЬ Jx Jф
• > » .
?= - «к,- - а-а)Е> -
Ыь .I* 1аъ J<9>
• 0
= - (?х + (Ь гк)х(Ь кххь + (1 -а)/а ю ьхе >а,
о(ь±) = - <г ХК + (Ь (Ь Рхкь + (1 -а>/а Е) <ь Рх)ха. 4°. Интегрируется система
бу= ({Н ,Н }-< 1-СОЕ) а)Оу).Оу(Ъ) = о,
тек самым получим функцию С(ь), которая будет разрывной функцией и
ЕС
вычисляться по формула:
г1 (г), t = -ь ;
О
_ | Аз( Ь ,0у( £)), t «
+ ^ Е) (Ь^ + (Ь Рх)х0У(^>),
л. —А *
гда з(Ъ,бу)=:г1{Ъ) + ({Н ,Н }-(1-а>Е) (Н +( + о>бу).
и и и 1сИ ]хЫъ
5°. По функции £(0 строится последовательность непрерывных функций £ (О по следующему правхыу. Пусть {т.}, 1=Т7р - кнопэство точек разрыва функции £(ъ), Обозначил = 1/ч, = т-
V ^ • V • Тогда
, Ъе [17 , <],
а + Ъ ^ , [1. . 1. ],
где ъ.= <£ (Т.) - с <а.))/(т. - т. ) , % ее.) - ь.гс .
6°. При достаточно больном д вычисляется новоо упрзшэнкэ и"и) = и*(ь) + ^ ^^<^) и соответствующая ему тргзктор:ш хпсъ).
7°. Сравнивается значения функционалов. Если х11 г I1. то параметр а уменьшается и процесс повторяется с п.2°.
Далее в данном параграфа рассматриваются алгоршмы дая случая, когда у матрица ыъ,х> кксотсп фиксированный минор размерности к, отликыа от нуля вдоль начального приближения, а таккэ когда и правую часть системы входят нелинейные слагаемые по управления.
В главе 4 содэрытся катоды улучшения второго порядка для задач оптимального управления с параметрами и для дискротпых управляемых систем. Эти алгоршш нашли прженияи» (гл. 0,7) в задачах идентификации математической модели порта-*-га, модели воз.чущошй . попппс. :жосистомм оз.И.чякпл, кп.дачо оцрпки гттрипогошюв нагрузки
на экосистему на модели межгодовоа динамики экосистемы оз. Байкал.
в главе 5 дано описание комплекса программ по идентификации математических моделей и методам решения задач оптимального управления. На серии тестовых задач проводятся вычислительные эксперименты и сравнение на них различных методов решения.
В шестая главе описывается решение задач управления и идентификации в траектория задачах динамики полета вертолетов, сложность которых существенно- различна от простейших по постановке задач до сложных нелинейных. Они различаются порядком исходной системы дифференциальных уравнений, сложность» правых частей, размерностью вектора управлений, количеством ограничений и другими характеристиками. В главе описаны решения следующих прикладных задач: максимизации изменения угла крена; разворот вертолета по курсу на режиме висения; маневры вертолета в вертикальной плоскости типа "горки" и "пикирования"; посадка вертолета с режима авторотации несущих винтов; посадка вертолета при отказе двигателя на исходном режиме горизонтального полета; задача идентификации коэффициентов по серии испытаний в модели движения вертолета. Для примера оценки сложности задач приведем одну из них. Движение вертолета в период
посадки описывается следующей системой дифференциальных уравнений: * &
ш VK - - х^сов в - Т ein г , и v = - х ein 0 + т сов а* - а, ,.
У В р. 1
\ '
(1) =--, " h = V
' у
Здесь Vx и vy - горизонтальная и верггикальная скорости вертолета, <34 - вое вертолета, h - высота полета, ш - угловая скорость вращения несущего винта, JBмомент инерции несущего винта, мк -
20
крутящий момент, х^ - сила сопротивления несущих элементов, т -тяга несущего винта, 0 - угол наклона траектории к горизонту, т -масса вертолета, а* - угол наклона автомата горекоса. Аэродинамические коэффициенты рассчитывается по следующим формула»:
( ш К)2 г к <ро {• з
~ — + —
2 3
С 01 3 -л
Т 3 ст% н р —ст = ^ а [ - + 1 + - ц2)] ,
V, з1п 1 - V, . В I ь
X = - = в1п 1 - V.. ,
В |.Ь
Ш й
V сое Т
э * |А = - = V со о 1 , 1 = 1 - в
0) И
/-г~т
6 = агсз!п - , = У < Ух + И)2 + \Г
V
р Ув 0.25 Ст
X = С 3 - , V = и К , и = -
зр х 1Ь I а I
а/а
( к* - Ц*)
"ЪгпЬ - [ ; С*Р,° < 1+ ^ КР + СхврйЭ]
ка =
"кгп - ( 1+ БЦ1) кр + С,прЦв]
СХВр 8 р Ш Н)
С,вр =---Г" ■ = ^ К"—---
% й* 2
** = 1-2 - схра ( г + у*г .) Л ст .
V, = V соо 1 , . V, = - V в!п X + и., те а в 1п
где к - радиус несущего винта, р - массовая плотность воздуха, V -скорость годата.и1 - скорость ветра, ст - коэффициент тяги несуще- ' го вшгга, аю- тангенс угла наклона коэффициента подъемной силы к углу атаки профиля, о - коэффициент заполнения несущего винта, К -коэффициент протекания, <р0 - угол общего шага Евсущего винта, 1 -угол кевду направлзнвэм равнодействующее силы винта и нормалью к траектории, «1<я- индуктивная скорость вне зоны воздушной подушки, • ка- коэффициент, учитывающий влияние близости земли на индукгивную скорость несущего винта, Охр- коэффициент профильного сопротивления, кр - коэффициент, учитывающий влияние формы лопасти на профильное сопротивление лопастей, ткгпЬ- коэффициент крутящего мо-шнта несущего винта на высоте в режима горизонтального полета, а|сгпм~ коэффициент крутящего момента несущего винта вне зоны воздушной подушки, в-у- коэффициент крутящего мокента, индуктивная скорость на высоте, аг - коэффициент, учитывающий концзвьге по- • терн лопастей вшгга, с - коэффициент профильного сопротивления на режима горизонтального полета, ц, - характеристическая скорость реншаа работы несущего винта, схвр, сх - аэродинамические козффйцвэнты, ■ в - площадь лобового сопротивления.
В математической модели зависимости ткгп = г (р.) и схр =
й(ст) определялись интерполированием функции одной переменной, а
зависимость икгпь= гг(Ц,ь) - интерполированием функции двух
переменных. В качеств© управляющих переменных рассматриваются
30
функции \л и фо, на которыэ наложены ограничения
т mln max >* « »
Vo s шlit) s ф , 1 < a (t) <1
*o * ' " mtn 4 ' max
а такаэ имейтея ограничения на шсоту патата и угол наклона автомата дарэкоса: , '
h . + 1.7 + L sln( г - Т) - h(t) < 0 , при h(t) г h ;
win *
1 - a* 2: О , при h(t) < h ,
h (t) > h . . .
mln •
Заданы ограничения на нокент посадки:
W ~К • b(tl)=h1
и функционал I = Ух (ti) , который требуется минимизировать.
Описанная модель шеет очень сложную, нелинейную структуру. Ет,о более усложняет работу с ней неявное описание некоторых козф|шдаэЕтов. Все это приводит к знач ггельным затратам вредна при ее репешш. Так, например, градиентный refofl потратил на ее рэкет» более 600 игорацка. Из-за нолнкойпости вычислвнш максимума функции н представляет собоа значительные сложности, поэтому в основном использовался метод первого порядка. С другоа стороны, этот метод ( как, впрочем, и граддантньа) попадал в так называем "овраг", что заметно уменьшало скорость сходимости. Методы второго порядка применять было не менее сложно, т.к. дифференциальное матричное уравнение Риккати приобретало свойство "¡кесткости" (и требовзло в Б-6 раз больше времени на реахшпэ). Таким образом, процедура решения задачи свелась к следующему: сначала работал метод слабого улучшения первого порядач, затоа при замедпении сходимости на одну~дво итерации пускался катод
первого порядка, использующий конструкции сильного улучшения. Окончательный результат уточнялся методом второго порядка.
Седьмая глава посвящена моделировании и исследованию эколого-экономических процессов. Первая из задач направлена на исследование взаимодействия природы и хозяйства Байкальского региона. В модели учитываются следующие процессы: рост производства, потребление продуктов , межрайонный обмен, самовосстановление и взаимное влияние природных ресурсов, их уменьшение в процессе производства и потребления, искусственное восстановление и перетоки, рост населения и уровня его Потребления. Регион рассматривается как территория, разбитая определенным образом на участки (районы), связанные транспортной сетью и путями возможной миграции ресурсов. При этом каждый участок описывается однотипной системой уравнений обобщенного динамического баланса :
Sv=Av+Bih-A""z+B<!"w+p, V=u, Z=w, 0<v<V, 0<z<Z,
R=Q( R-R* ) -Du-Cv-Fp-D'^WrF""' • L+Jz.
Здесь v(t) "-вектор выпусков продукции по всем технологиям в момент времени t; v<t) - вектор производственных мощностей; z(t> - вектор интепсивностей восстановления ресурсов, т.е.скорость изменения показателей щяфодаой среды под действием текущих восстановительных мероприятий; Z(t) -вектор мощностей природовосстановигельных отраслей; u(t),w(t) -скорости изменения мощностей v<t) и z<t>; s - матрица суммирования однотипных продуктов-, p(t> - вектор конечного непроизводственного потребления; hit) ~ вектор показателей состо-
м
пния природной с рода и ресурсов; r - noirrop непозмутенного состояния природной среда, Lit) • числчиность папмония.
И pad ело ибсуадлется подробно физический смысл щюффиционтоп
модели, методика информационного обеспечения, характеристики различных задач, ставится и решается задача оптимального управлзнил по комплексному эколого-экономическому критерия, смысл которого заключается в максимизации конечного потребления при ненарушении экологического равновесия. Полученное рзшенш сравнивается с другими сданариями развития. Основным практическим результатом создания модели Байкальского региона служит ее использование при разработке проекта Генеральной кондапции развития производительных сил в бассейне озера Байкал.
В §5 строится математическая модель водной экосистемы озера Байкал, которая записывается в терминах линейной системы даМерен-циальных уравнений, общей размерностью фазового вектора 880 (9 характеристик состояния экосистемы, 110 камер). С использованием алгоритмов идентификации и серии экспериментов модель была наполнена гшформацкэа. С учетом специфики уравнений разработана схема гарэ-кода от непрерывного описания к дискретному с шагом в I год, что гозволило наати решение задачи оценки максимально допустимо® антропогенной нагрузки на экосистему.
Сладующий параграф посвяшэн задаче рациональной эксплуатации эыбной популяции на примере посольской расы Байкальского омуля, ¿одели учитывают процессы рождаемости, смертности, миграции, юзрастную структуру и искусственное воспроизводство. Ставэтся н зээаэтся задача оптимальной эксплуатации с далыэ получения гтратегш вылова по времени, территории и возрасту.
>0 седьмом параграфа строится математическая модель влияния за-•рязнэний окруяаюаш среды на здоровье населения города на пршерэ •.Ангарска. Описывается технология идентификации модели, ставится [ решается задача определения максимально допустимой нагрузки, ргаодятся сценарные расчеты.
В §В рассматривается математическая модель лесозаготовительного предприятия, состоящая из двух блоков: уравнений, описывающих экономику предприятия, и уравнений динамики лесных ресурсов. Состояние древостоя описывается как по породному составу, так и по классам возраста. Приводятся результата расчетов по Иркутской области и отдельным лесхозам.
ЗАКЛЮЧЕНИЕ
Таким образом, в диссертационной работе получены следующие результаты и выводы.
1. Разработаны алгоритмы сильного и слабого улучшения второго порядка для задач оптимального управления со свободным правый концом. Предложен ряд модификаций этих алгоритмов и исследованы свойства рвлаксационности и сходимости. Для катода сильного улучшения показано, что алгоритм улучшает всякое управление, не удовлетворяющее условиям принципа максимума Понтрягина, а в случае выполнения принципа максимума и не существования решения соответствуюцэго уравнения Риккати на всем прокавдткэ врешни, алгоритм и в этом случав улучшает управданш. Для аягориша слабого улучшения доказаны аналогичные результаты, в которых условие принципа максимума заменено условием стационарности и усшэкньи условиэм Лэвандра-Клзбва.
2. Показано, что алгоритм сального (слабого) улучшения сгодится к выполнению условий сильного (слабого) локального кянгаука. На последних йтарацяяг алгорэтщ второго порядка задает лойалъно-охггнйзльныа синтез управления с оденной о<ег), где е -шиша трубки, в яотороз строится синтез.
3. Разработана катода первого и второго порядка для задач опгкзального управлэкия с неограниченным множеством скоростей на база штода прзобразованиа и катода сильного и слабого улучшения,
щеющих характер либо нелокального улучшения, лиЗо сильного улучшения. Исследованы свойства релаксационности штодов и при достаточно обида предположениях доказано, что алгоритмы улучшают любое управление, не являющееся относительно-оптимальным импульсным режимом.
4. Для задач оптимального управления с параметром и для дискретных управляемых систем, в частности, для задачи идентификации управляемой системы по серии испытаний, предложены метода по следоватальных улучшений второго порядка".
5. Создан комплекс программ, включающий в себя описанные в работе метода - и их модификации. В численных экспериментах продемонстрирована их работоспособность и эффективность. В частности для достижения разрывных решений в задачах с неограниченным множеством скоростей, реализуемых методом за одну итерацию, другие методы затрачивают значительное число итераций, а в некоторых задачах решения не достигают.
8. Полученные алгоритмы и программные средства использованы для решения прикладных задач управления на динамических моделях вертолета и на зколого-зкономических системах.
' 7. Решены следующие задачи управления и идентификации в траекторных задачах динамики полета вертолета : максимизации изменения угла крена; разворот вертолета по курсу на режиме висения; маневры вертолета в вертикальной плоскости типа Торки" и "пикирования"; посадка вертолета с рента авторотации несущи винтов: посадка вертолета при отказе двигателя на исходном режиме горизонтального полета; задача идентификации кооф^ищюнтов ш серии испытаний в модели движения Воркута.
8. На математической модели взашодоаствил природа и ховлистпп Плпкнльского шгионп подучены сцрнаруш ого рлзвлтил ггга
ко1кшжснощ? эколого-эконошческому критерию и прошдан сравнительный анализ с другими, разработанными эксшртзыи вариантами.
9. Метода вдзнтификацин по серии зкспэргЕзэнтов использовались дгя построения ыодели водной зкосистеш оз. Байкал, осущзствлзн переход к дискрэптоа модели ш&годовоа динашки, на шторой исследована задача антропогенное нагрузи!.
10. Построена модель популяции Байкальского омуля посольской раса. Весэякэ задачи огггшальноа стратеги: вылова показывает, что наилучший эффект достигается при интенсивном прокисла в лзтнкз кзсяцу в районе Селзнгинского мелководья в количество около двух клн. экземпляров рыб старших возрастных груш.
11. -Создана математическая кодель влияния загрязнений окрукаэдза среда на здоровье населения на примере города Ангарска. Проведен сравнительный анализ, различных антропогенны! нагрузок, в зависимости от экономического развития и затрат на охрану окруиаадэй среда. Получены оценки максимально допустимого воздействия. , .
12. Решена задача управления динамикой ласньа ресурсов. Расчеты, проведенные для отдельных лесхозов Иркутской области и в долом для области, показали, что заготовки древесины всех пород ' когут увеличиваться при выполнении ограничения на состояние лесов в заданный номент вреьюни. Зто означает, что необходимо более Обосиызанно планировать рубки отдельных пород, распределять лэсозаппошаг кевду лесхозами, намечать сроки ввода в эксплуатации новых лесных территория.
Основные результата диссертации опубликованы п следующих работах:
I. Батурин U.A. Построение и опрнкл приближенного сип-юза в
окрестности сильной локальной кянкмали // Числзннкэ гдтда1 оппгяоации и их примвнвшэ.- Иркутск, 1881,- С. 26-32.
2. Батурин В.Д., Викулов В.Е., Kispuenico Г.С. и .др4 Ресурс "Вода" // Взанаодеа'ствпэ природа и гозпаствэ Байкальского рэгпопа. - Новосибирск: Наука, IC3I. - С. 38-44.
3. Батурин В.Л., Соловьева Н.Г. Задача управлжш топудящзэа посольского омуля // Планировать п лрогнозвроватэ прнродао-окозоттческих систем.- Новосибирск: Наука, IC34.- С. 40-45.
4. Батурин В.А., Гурман В.И., Дроздовсхий Э.Е. и др. Модзлп управления природными рзсурс£",!и.- Г!.: Наука, IS3I.- 234 с.
5. Батурин В.А., Гурман В.И., Данилина Е.В. Улучпенпэ н относительная оптимальность ижульсньн рэтгаов // Теорзтичэскгэ н прикладные, вопросы оптимального управл)ния.- Иовокййрск: Наука, 1085.- С. I7I-I87.
6. Батурин В.А., Гурман В.И., Колжольникова Г.А. Пэрэход к ослабленной систеке и ее возяоиныэ пришяэпия // Нот» катода улучшения управляемых процэссоз.- Новосибирск: Kayna; !££??.- С. 30-33.
7. Батурин В.А., Гуриап В.И., Рзснка И.В. Метода второго порядка // Ноеыэ кэтоды улучсэния управляемых процзссов.- Новосн-б1фск: Наука, IB87.- С.60-65.
8. Батурин В.А., Гурман В.И., Хангурова Е.В,_Нэтод улучшения, основанный ка оценке инонестза дрстияшосга // Ноеиэ пэтода улучшения управляемых процзссоз.- Новосийзрск: Наука, IS87.- 0. 83-ва.
9. Батурин В.А., Гург,;аз В.И.,. Дянижна Е.В. Алгорэта нелокального улучшения // Ношэ готода улучгзняя управляешь процессов.- Новосибирск: Наука, 1037. - С.104-117.
10. Батурин В.А., Данилина Е.В., Сидоренко Г.В., Черкагпш А.К.
37
Задача нормирования нагрузки на лесной комплекс // Новыз катоды улучшения управляемых процессов.- Новосибирск: Наука, 1887.-С.160-163.
11. Батурин В.А., Бэшалханов И.А., Давешен Л.Ю. и др. Расширяющийся комплекс частных моделей // Системные исследования взаимодействия природы и хозяйства региона.- Иркутск: Изд-во Кркут. ун-та, 1880.- С. 58-83.
12. Батурин В.А., Хангурова Е.В. Катод приближенного решения задач оптимального управления на основе оценок ' множеств досткшыости // Динамика нелинейных процессов управления: Тез. докл. Всесоюз, семинара.- Таллинн, 1987.- С.120.
13. Батурин В.А., Гурман В.И., Колокольникова Г.А. и др. Настройка и калибровка методов улучшения // Метода улучшения в вычислительном экстарименте.- Новосибирск: Наука, 1887.- С. 37-47.
14. Батурин В.А., Данилина Е.В., Сидоренко Г.В. и др. Математическая модель динамики лесных ресурсов // Модели и катода антропогенных изменений геосистем.- Новосибирск: Наука, 1887.- С. 75-83.
15. Батурин В.А., Даржаева С.И., Шагядаэв К.Е. Методика определения параметров блока "Минеральные ресурсы" // Эколого-эконошческая стратегия развитая региона.- Новосибирск: Наука, 1880.- С. 55-58.
16. Батурин В.А. Задачи оптимального управления с параметром для дискретных систем // Методы решения задач теории управления на основе принципа расширения.- Новосибирск: Наука, 1890.- С. I03-II3.
17. Батурин В.А., Колокольникова Г.А., Москаленко А.И. Системные исследования, эколого-зкономическое моделирование взаимодействия природы и хозяйства региона // Проблемы комплексной
38
автоматизации: Тез. докл. IV Мевдунар. науч.-техн. конф.- Киев, 1990.- С.37-32.
18. Батурин В.А., Васильев С.Н., Лакеев, A.B. Исследование задачи гармонизации на зколого-зкономическоа модели // Тез. докл. Мевдунар. конф. по Экологии Сибири.- Иркутск, 1993.- 89 с.
19. Батурин В.А., Колокольнккоза Г.А., Урбанович Д.Е. Использование математических моделей для прогнозирования состоятся и ошнки безопасности региона в условиях возможности катастроф // Социально-экономические и зколопгеесккз аспекты анализа риска.-Иркутск: Йзд-во СЭй СО РАН, 1993.- С. 8-16.
20. Батурин В.А., Урбановкч Д.Е. Методика оценки последствия от технических и природных -катастроф на основе природно-зкономической модели // Математические проблеш экологии: Тез. докл. Всерос. конф.- Чита, 1994.- С. 15-16.
21. Батурин В.А., Розенраух Д.М., Урбанович Д.Е. Модель меж-годовоа динамики экосистемы озера Байкал // Компьютерная логика, алгебра и интеллектов управление. ПроГтемы анализа устойчивости развитая и стратегической стабильности: Сб. трудов Всерос. школы.-Иркутск, 1994.- Т.2.- С. 138-143.
22. Батурин В.А., Белозерцэва Н.В., Васильев С.Н., Григорян С.Д., Лэшрнко H.A., Иоусаков В.М., Розенраух Д.М., Семенов Г.Л. Модель влияния загрязнений окружающей среда на здоровье населения города // Компьютерная логика, алгебра и интоляэктноа управление. Проблемы анализа устойчивости развития и стратегической стабильности: Сб. трудов Всерос. школы.- Иркутск, 1994.- Т.2,- С. 174-185.
23. Батурин В.А., Гончарова Е.В. Метод последовательного удуч- . шонил для линойных управляемых систем // Компыег гордая логика, алтбрл и шгголлшспшо управления. Проломы аннлш.ч . устойчивости
раззггшя и стратегической стабильности: Сб. трудов Всерос. школы.-Иркутск, 1894.- Т.2.- С. 3-19.
' 24. Батурин В.Д., Починскзя Н.В. Численны® метод улучшения стационарных, но не оптимальных процессов // Компьютерная логика, алгебра и кнтехлэктноз управление. Проблемы анализа устойчивости развития и стратегической стабильности: Сб. трудов Всерос. школы.-Иркутск, 1884.- Т.2.- С. 20-28.
25. Батурин В.А., Урбанович Д.Е. Метода улучпешш второго порядка дая задач оипиалького управления // Кокпыогерная логика, алгебра и ¡штехшктпоэ управление. Проблемы анализа устойчивости развития к стратегической стабильности: Сб. трудов Всерос. школы.-Иркутск, 1834.- Т.2.- С. 27-33.
с
23. Батурин В.А., Урбанович Д.Е. Метод улучшения второго порядка в задачах с ограничениями на управление параллелапипедкого типа // Математические алгоритмы: Тез. Второй Мевдунар. кояф.-Ншний Новгород, 1995.- С. 7.
27. Васильев С.Н., Батурин В.А., Бычков И.В. и др. Интеллектуальное икфорзационно-картографическое обеспечение устойчивого развитая Байкальского региона // География и природные росурсы,-18В5.- №1.-0. 5-15.
28. Гурман В.И., Батурин В.А. Построение и охрнка приближенного синтеза оптимального управления // ■ Техническая кибернетика, 1078.- № 4.~ С. 183-18?.
29. Гурман В<И., Батурин В.А. Приближенный синтез оптимального управления с учетом дискретной оценки // Проблемы устойчивости додащия, аналитической механики и управления.- Новосибирск: Наука, ИГ/О,- 0. 2УО-297
30. Гурмлн В.И., Батурин В.А., Данилина Е.В. и др. ДГ[Х)Гиро-пат» и оптимизация при иеслодгшннии эколога-экономических моделей
// Системное моделирование, социально-экономических процессов: Тез. докл.- Воронеж, IS80.- C.I37.
31. Гурман "В.И., Батурин В.А., Константинов Г.Н. Общая структура модели // Взаимодействие природа и хозяйства. Байкальского региона,- Новосибирск: НЭука, IS8I.- С. 14-17.
32. Гурман В.'А., Батурин S.A., Данилина и др. Программ машинных зкспзрикзнтов и некоторые результаты // Взаимодействуй природа и хозяйства Байкальского региона.- Новосибирск: Наука, 1881.- С. 60-6S.
33. Гурман В.И., Батурин -В.А., Иванова Л.И. и др. Модель возмущений экосистемы оз. Байкал (модель "Байкал") и ее взаимодействие с модель» "Репин" // Взаимодействие природы я хозяйства Байкальского региона.- Новосибирск: Наука, 1831,- С. 66-79.
34. Гурман В.И., Батурин В.А., Иванова Л.И. и др. Методика оценки параметров модели "Байкал" // Взаимодействие npispo^a и хозяйства Байкальского региона.- Новосибирск: Наука, 1881.- С. 79-35.
35. Гурман В.И., Расина И.В., Батурин В.А. и др. Теоретические основы пакета прикладных программ по улучкншя рззшлоз и локальному сухатэзу управления // Па коты прияладак програнн. Методы и разработки.- Новосибирск: Наука, 1881.-.СЛС4-П2.
38. Гурман В.И., Расина И.В., Батурин В.А. и др. Дзстаточнкз условия относительного минимума в задачах улучшения и синтеза управления // Методы оптимизации и нх приложения,- Новосибирск: Наука, 1883.- С. 80-102.
37. Гураан В.й., Батурин В.А., Данилина Е.В. 1'отод послздоза-тэльных улучшений второго порядка в вырожденных задачах оптимального управления // Тез. докл. IV кшф. по сппаальнолу
управлении в механических системах.- М.„ 1882.- С. 88-67.
38. Щгаан В.К., Батурин В.А.» Дааилина Е.В. О системе зколо-го-зкоаоксячзских расчетов // Моделирование процессов в природно-зкономнчэсюш систеиах.- Ковоскбирск: Наука, 1882.- С. 5-20.
39. Гурман В.П., Батурин В.А., Расина Й.В. Приближенные методу оптимального упра&дания.- Иркутск: Кзд-во Крхут.ун-та, IB33.-178 С.
40. Гурман В.И,, Батурин В.А.. Дроздовский Э.Е. и др. Результаты системных исследований взаимодействия природа к хозяйства региона // Совершенствование методологии управления социалистическим природопользованием: Тез. докл. I Всесоаз. конф.- М., 1833.- С. 8-11.
41. Гурман В.И., Батурин В.А., Иванова Л.И. Модели уникальных объектов // Системные исследования взаимодействия природа и хозяйства региона.- Иркутск: Изд-во йркут. ун-та, 1903.- С. 51-58.
42. Гурман В.И.» Батурин В.А. Математические модели управления првродзыки ресурсами.- Иркутск: Изд-во йркут.ун-та, 1837.- 112 с.
43. Гурман В.И., Батуряз В.А., Нолохольникова Г.А. и др. Скстсзсйсз исслэдавгния Бзайаодзяствия природы и хозяйства региона // Геолэпгя п эколопш бассейна paid Ai,syp: Тез. докл.- Блзго-ЕЗЕЗЕСК, 1939.- С.48-50.
44. Гурман В .И., Батурин В. А., Роззнраух Д.М. Задача идентификации управляемого обьеюга по серии испытаний // Методы оштаи-зацин к и праяожэния: Тез. до]«.- Иркутск: Изд-во СЗИ, 1989.-С.72.
45. Гурман В. И., Батурин В. А.«» ■ Колокольникова Г. А. и др. Каткатичэскоэ кодэлированиэ природао-экопомических процессов (обзор) // Препринт НрВИ СО АН СССР.- Иркутск, 1990.- и 2.- 81 с.
40. Baturln V.A., DJvakov А.О., Urbnnovich D.E. Elaboration
42
experience and usage methods of control Improvement // Methoda and software for automatic control oyoteno: Summaries of papers IHACS/IFAC International workshop.- Irkutsk, 1991,- P. 10-11
47. Baturin V.A. Successive Improvement method In an optimal control problem with unbounded linear control function // Singular Solutions & Perturbations in Control Systems.- Peralavl-Zalesoky, Russia, 1993.- P. 7.
48. Baturin V.A., Belosertocva N.V., Rosenraukh D.M. One approach to modrlling of antropogenic factors impact on population health // Book of abstracts Th« international conference on Siberian ecology.- Irkutsk, Russia, 1993,- P. 56.
49. Baturin V.A. Second-order improvement method for linear unlimited control problems // Singular solutions and perturbations in control systems: Proceeding of International workshop.-Perealavl-Zalessky, 1995,- P. 11.
50. Baturin V.A., Urbanovich D.E. Modification of the 3trong improvement nathod for numerical solution of optimal control problem // Singular solutions and perturbations in control oy ¡stems: Proceedings of International workshop.- PereBlavl-Zolesaky, 1995,- P. 12.
51. Baturin V.A., Belozerteeva N.V. . Ef itnova N.V. . Hatorova H.I., Rosem-aukh D.M. On approach to asoecnlnf? air pollution Impact on children's sick rate // System Modelling Control.- Lodz, 1995.- Vol. 1,- P. 85-83.
52. Baturin V.A., Vaoiiilyev S.N., Lakeyev &.V. and others Ecolcgo-Economlc Models of the Lake Baikal Region Development // !!AT0 AS I Sfirier"», Patnorehip Sub-Serl«o, 2. Jinvlrennont. - Vol.8: Puntalr.nbl'? revelopnent of the Lake Baikal R«f?len.-Ppr in«■»• r-V«r 1 H"id**lb-ire . - 1S96. - P. 229-241.
53. Gurman J/ -1 .i, ßahilina E.V. , Baturin V.A., Kolokolnikova
proceeea // Book of abstracts The international conference on Siberian ecology.- Irkutsk, Russia, 1993,- P. 76-77.
54. Silow A., Gurman V.J., Stom D.J., Roaenraukh D.M., Baturin V.A. Mathematical models of lake Baikal ecosystem // Ecological modelling.- 1995.- Vol.82.- P. 27-39.
55. Vassllyev S.U., Baturin V.A., Lakeyev A.V. Ecologo -economic Mode and Solvability of Harmonization Problem // Proceeding of IEEE International conference of System.- France, 1993,- Vol.5.- P. 339-343.
I • ,
G.A., Urbanovich D.E. Mathematical modelling of nature economic
Подписано в печать II.06.96г.
Формат бумаги 60хЬ4/16. Усл.гюч.л. 2,0, Уч.изд.л. 2,0 Тираж 100 экз., заказ 341
Отпечатано на ротапринте СО РАН Вычислительного центра 664033, Иркутск - 33, ул.Лермонтова, 134.
-
Похожие работы
- Итерационные методы оптимизации управления на основе принципа расширения и достаточных условий оптимальности
- Дискретные задачи оптимального управления
- Модели и методы управления параметризованной структуры
- Приближенные методы моделирования и оптимизации управления на основе среднеквадратических аппроксимаций
- Эволюционные методы условной оптимизации в задачах поиска оптимального управления динамическими системами
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность