автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями

кандидата физико-математических наук
Румянцев, Дмитрий Станиславович
город
Москва
год
2009
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями»

Автореферат диссертации по теме "Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями"

На правах рукописи

Румянцев Дмитрий Станиславович

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ СТОХАСТИЧЕСКИМИ КВАЗИЛИНЕЙНЫМИ СИСТЕМАМИ С ИНФОРМАЦИОННЫМИ ОГРАНИЧЕНИЯМИ

Специальность 05.13.01 — Системный анализ,

управление и обработка информации (авиационная и ракетно-космическая техника)

Автореферат диссертации на соискание учёной степени кандидата физико-математических наук

Москва — 2009

003464267

Работа выполнена на кафедре Математической кибернетики Московского авиационного института (государственного технического университета).

Научный руководитель:

Официальные оппоненты:

доктор физико-математических наук, профессор

Хрусталёв Михаил Михайлович

доктор физико-математических наук, Сиротин Андрей Николаевич

кандидат физико-математических наук, Булатов Александр Вячеславович

Ведущая организация: Институт программных систем РАН

Защита состоится ",%jp " 2009 в -/ч. &Q мин. на заседании

Диссертационного совета Д 212.125.04 Московского авиационного института (государственного технического университета) по адресу: 125993, г. Москва, А-80, ГСП-3, Волоколамское шоссе, д. 4

С диссертацией можно ознакомиться в библиотеке МАИ.

Отзывы на автореферат, заверенные гербовой печатью организации, просьба направлять по указанному адресу в двух экземплярах.

Автореферат разослан " С^еМ/оЯ2009.

Учёный секретарь Диссертационного совета Д 212.125.04 кандидат физико-математических наук ^Ротанина М.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Диссертационная работа посвящена разработке методов оптимального управления стохастическими системами диффузионного типа в задачах с информационными ограничениями.

Актуальность исследований в этом направлении обуславливается необходимостью наиболее точного описания систем автоматического управления, реалистичным вариантом которого является стохастическое описание, учитывающее воздействие на объект управления случайных факторов, в предположении неполноты информации о состоянии. Предложенные в диссертации условия оптимальности для квазилинейных систем вносят существенный вклад в развитие этого направления теории оптимальных процессов, в частности, позволяют решать задачи управления линейными системами с мультипликативными возмущениями управления и со случайными возмущениями в матрицах уравнений системы.

Целью диссертационной работы является разработка методов синтеза оптимальных стратегий управления стохастическими квазилинейными системами в случае измерения части компонент вектора состояния при наличии ошибок измерения и ошибок реализации управления.

В соответствии с целью исследования были поставлены следующие задачи:

1. Получить конструктивные условия оптимальности в задачах синтеза стратегий оптимального управления:

- квазилинейными стохастическими системами при измерении части компонент вектора состояния;

- линейными стохастическими системами со случайными возмущениями в матрицах системы при измерении части компонент вектора состояния;

- квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления;

2. Разработать численные методы решения задач п.1;

3. Создать программное обеспечение для реализации численных методов;

4. Провести решение тестовых прикладных задач при различном уровне информированности с применением предложенных теоретических результатов.

Методы исследования. Для решения поставленных задач использовался метод функций Ляпунова-Лагранжа, наметившийся еще в ранних работах Хрусталёва М.М. при изучении проблемы оптимального управления частично наблюдаемым диффузионным процессом и получивший дальнейшее развитие в его работах по стохастическим дифференциальным играм с неполной информацией. Этот подход состоит в использовании совокупности функций, аналогичных вектор-функциям Ляпунова в теории устойчивости. Но в изучаемом круге проблем эти функции играют двоякую роль. С одной стороны, их применение так же, как функций Ляпунова, подменяет проблему изучения поведения траекторий динамической системы изучением поведения этих функций вдоль траекторий системы. С другой - они являются нелинейными нелокальными аналогами классических множителей Лагранжа, предназначенными для полного снятия ограничений. В связи с такой двойной ролью эти функции были названы вектор-функциями Ляпунова-Лагранжа.

Важным результатом применения векторных функций Ляпунова-Лагранжа является снятие всех нелокальных ограничений, в том числе и информационных, доведение условий оптимальности до совокупности уравнений (или неравенств) для этих функций и семейства конечномерных экстремальных задач, решаемых в фиксированный момент времени локально в каждой точке пространства состояний, аналогично тому, как это делается в условиях принципа максимума Понтрягина Л.С. или динамического программирования для классической задачи оптимального управления.

Научная новизна. Полученные в диссертационной работе результаты для квазилинейных задач с информационными ограничениями являются новыми, в частности, разработан метод синтеза оптимальных стратегий управления; поставлена задача синтеза оптимального управления и доказаны достаточные условия оптимальности; получены конструктивные соотношения для определения оптимального управления; предложено преобразование, позволяющее синтезировать оптимальное управление в случае, когда динамическая система управляется неточно и при реализации состояния системы имеются случайные ошибки измерения; разработаны методы численного решения задачи оптимального управления.

Необходимо отметить, что, как правило, исследователи ограничивались

изучением линейных систем с неполной информацией, в то время как квазилинейные системы в случае, когда каждая компонента управления может зависеть от своего набора компонент вектора состояния, ранее не были изучены.

Достоверность научных утверждений и выводов, представленных в диссертационной работе, подтверждена строгими математическими доказательствами, численными экспериментами, сравнением полученных результатов с уже существующими.

Практическая значимость диссертационной работы состоит в концептуальном подходе, позволяющем использовать полученные условия оптимальности для управления сложными техническими объектами, в том числе, многокомпонентными системами с децентрализованным управлением отдельных подсистем. Особенно актуален учёт случайных возмущений и недостаточной информации о состоянии для малых систем, для пико- и наноспутников, на которые зачастую невозможно установить дорогостоящие высокоточные системы измерения состояния и реализации управления.

Полученные в диссертации результаты могут быть использованы в профильных организациях при разработке и эксплуатации систем управления летательными аппаратами. При этом многие результаты имеют более широкую область применения. Теоретические результаты внедрены в учебный процесс на факультете Прикладной математики МАИ и преподаются студентам старших курсов кафедры Математической кибернетики.

Апробация работы и публикации. Существенные результаты диссертации получены в рамках программы "Развитие научного потенциала высшей школы" Министерства Образования РФ (per. N 4549, 2005 г.). Исследования поддержаны грантом РФФИ (N 06-08-00398). Основные результаты опубликованы в журнале "Известия РАН. Теория и системы управления" [1, 2], а также в [3, 4], обсуждались на международных конференциях [5]-[9] и научных семинарах Московского авиационного института в 2007 г.

Личный вклад автора. В [1], [5] разработаны достаточные условия оптимальности для квазилинейных стохастических систем при информационных ограничениях. В [2] созданы численные методы для

решения рассмотренных в [1], [5] задач. В [8] проведено обобщение для задач синтеза оптимальных стратегий управления в случае, когда динамическая система управляется неточно и при реализации состояния системы имеются случайные ошибки измерения, также сделано обобщение для задач синтеза оптимальных стратегий управления линейными системами, имеющих в матрицах неизмеряемые возмущения. Показано, что для таких задач могут быть использованы предложенные условия оптимальности. В [3], [6], [7], [9] выполнены численные расчёты и синтезировано оптимальное управление для прикладных задач.

Структура и объём работы. Диссертация состоит из введения, пяти глав, заключения и библиографического списка из 134 наименований. Работа изложена на 139 страницах машинописного текста, содержит 14 рисунков и б таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении даётся обзор известных методов оптимального управления динамическими системами с точки зрения доступности информации об объекте, обосновывается научная новизна проведенных исследований и актуальность получения новых результатов, сформулированы цель и задачи диссертационной работы, перечислены полученные в диссертации новые результаты, их практическая ценность, представлены положения, выносимые на защиту и описана структура диссертации.

В первой главе существенно используются результаты работ Хрусталёва М.М., в которых получены условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности о состоянии. В случае одного игрока задача преобразуется в задачу оптимального управления. На основании этих условий сформулированы новые достаточные условия глобальной оптимальности для стохастических динамических систем общего вида. Также модифицировано понятие экстремали в заданном классе управлений. Эти результаты получены совместно с Хрусталёвым М.М. и не выносятся на защиту.

В автореферате для простоты изложения не всегда оговариваются теоретико-функциональные требования к встречающимся функциям. Эти требования строго даны в основном тексте диссертации.

Процесс управления описывается системой уравнений Ито:

= /«(*> и(*> + 9и(*, х{г),и(г,я(*)))<й^(*), ^ ^

х{Ь0) = х0.

где £ £ Т = [¿о;¿1] - время; х = (х\,...,хп)т - состояние системы, г = 1 ,га; г^г - стандартный винеровский процесс, I = 1,и, и — (щ,...,ит)т £ и С Лт - управление. Здесь и далее по дважды встречающимся в произведении функций индексам проводится суммирование.

Введём функции, описывающие в момент t плотность распределения вероятности £ —► р*(Ь) = •) : Т —> Ср и управление < —> и*(Ь) — •) : Т —у V, где Ср - пространство дважды непрерывно дифференцируемых плотностей вероятностей на пространстве Яп, а V - множество, определяющее информационные ограничения. Будем предполагать, что начальное состояние хо определяется плотностью ро = р*(Ьо). Через О обозначим множество процессов управления г = (р*(-),и*(-)).

Ставится задача поиска минимума сI = ттг1(г), 2 € О и процесса — (р*(-),й*(-)) е Д на котором .7(2) = Л для заданного функционала 2 : £) —> й1, где

Пг) = £ + /дп Рс{х)р{Ь1,х)йх. (1.2)

Для системы управления существуют информационные ограничения, состоящие в том, что каждая компонента стратегии управления и(£,х) может зависеть от своего, назначаемого априори, набора компонент вектора состояния х. Эти ограничения отражают возможности получения информации о состоянии. Пусть определены функции (г,я) —> и{Ь,х) : Т х Яп Ят, сформируем новый вектор иа^,х) так, чтобы он состоял из компонент вектора управления, не зависящих от компоненты ха вектора состояния х на интервале Т, а — 1. щ, щ < п.

Одна из основных идей предложенного Хрусталёвым М.М. метода Ляпунова-Лагранжа состоит в замене поставленной задачи другой эквивалентной ей задачей посредством введения новых дифференциальных связей вида

—иа(г,х) = 0, а = 1~гц, х е Яп, оха

задающих информационные ограничения.

Для получения достаточных условий оптимальности вводится класс Ф вектор-функций Ляпунова - Лагранжа <р = (у?0, tp1,..., ip"1), где (t,q) —► <p°{t, q) :ТхСр R1, (t, x, ua, q) -»<pa(t, x, ua, q) :TxRnxRmxC% -» R1, a = 1,ni, удовлетворяющих заданным условиям. Функции <р°, ipa, а = 1,щ будем искать в форме

At,q)= J lP(t,x)q{x)dx, (1.3)

Л"

<pa(t,x,ua,q) = rpCi(t,x.ua), а = Т^тц. (1.4)

Здесь (t,x) -* ip°{t,x) :TxRn -* Rl, (t,x,ua) -* ipa(t,x,ua) : T x Rn x RJn" —> Д1, a = 1, щ - заданные функции. Строятся конструкции:

H{t, х, и, q) = fi + iXiX} ay + fc)q + <p"a,

B{t, u(-), q) = Q) + /л„ H(t, x, v{x),q)dx, G(q) = J^Fc(x)q(x)dx-<p°(thq),

где f - производная Фреше функции ip° по переменной q е Ср.

Для отыскания оптимального элемента г € D, т.е. такого, что J(z) = d

доказано утверждение:

Теорема 2. Если процесс 2 = (р*(-),«*(•)) £ D удовлетворяет

условиям . .. . ,„

B{t,u (t),p (t)) = minveVi„Gc}B{t,v,q), (1.5)

G(p*(i1)) = min9€C?G(9)> (1.6)

то он оптимален.

Определение 1. Процесс 2 = (p*(-),u*(-)) G D, удовлетворяющий совместно с функциями ip°, <ра, а = 1,п\ вида (1.3), (1.4) условиям

dB(t,u*(t),g) dq

B(t,u*(t),p*(t)) = minveVB(t,v,p*{t)): t£T\T0, (1.8)

— 0, t € Т\Г0, (1.7)

?=p*№

dG(q)

= 0, (1.9)

«=?•(<! )

дЯ

где д/дд - производная Фреше, будем называть экстремалью.

С учётом вида (1.3)-(1.4) функций <р конкретизируем функционал Н(1,х,и,д) в форме

#+(i,x, и,q) = (< fi + rP°XiXj dij + fc)q + фаХа.

Тогда из теоремы 2 легко следует теорема 3, на результатах которой базируются достаточные условия оптимальности для квазилинейных систем.

Теорема 3. Для того, чтобы процесс z = (p*(-),u*(-)) € D был экстремалью, необходимо и достаточно существование функций i/i°(t,x), ipa(t,x.ua), а = l,ni, удовлетворяющих определённым теоретико-функциональным требованиям, таких, что выполнены условия

H++{t,u*{t),p*{t)) = minvevH++{t,v,p*(t)), t € T\Tq, (1.10)

л

^°(i,®) + ft(t,®>u(i,i))=0> t € T\To, xGRn, (1.11) i>°(thx) = Fc(x), xeR", (1.12)

где

H++{t, v,q)= J H+{t, x, v{x), q{x))dx. (1.13)

Д"

В заключении первой главы приведём формулу, позволяющую получить точное значение критерия J(z) для любых плотностей вероятностей процесса.

Теорема 4. Если процесс 2 = (р*(-), и*(-)) € D и функции ф°(1,х), ipa(t,x,ua), а = 1,щ удовлетворяют условиям (1.11), (1.12), то справедливо равенство

J(z) = J^ijt o,x)po(x)dx, (1.14)

где ро(х) = p(to,x) - заданная начальная плотность распределения вектора состояния х.

Во второй главе исследуется задача оптимального управления стохастической квазилинейной системой с квадратичным критерием качества и информационными ограничениями. Сформулированы новые условия оптимальности. Проблема синтеза стратегии управления сводится к решению краевой задачи для системы обыкновенных дифференциальных уравнений типа Риккати.

Процесс управления описывается системой (1.1), в которой функции fi(t,x,u), gn(t,x,u) имеют вид

fi(t, х, и) = Ais(t)xa -f Bia(t)ua, (2.1)

gu(t, х, и) = GiU{t)xs + Fila(t)ua + Ca(t). (2.2)

Так же, как и в первой главе, каждая компонента стратегии управления u(t,x) может зависеть от своего, назначаемого априори, набора компонент вектора состояния х. Эти ограничения отражают возможности получения информации о состоянии.

Считается, что для рассматриваемого здесь процесса (1.1) плотность вероятности состояния p{t,x) существует и удовлетворяет уравнению Фоккера-Планка-Колмогорова с начальной плотностьюр^о, х) = Ро(х). Начальная плотность имеет математическое ожидание то, ковариационную матрицу Ко и считается заданной.

Для процесса z определён критерий качества управления (1.2), функции fc(t, х, и) : T х R" х Я™ R1, Fc{x) : Rn -> R1 которого имеют вид

fc(t,x,u) = ]-Dij(t)xiXj + Sai(t)xiUa + ^Eap(t)uaup,

с _ 1

F (х) — -QijXiXj,

где fc(t,x,u) - неотрицательная квадратичная форма, a {Eap(t)} -положительная матрица при всех t. Здесь и далее матрицы квадратичных форм считаются симметричными.

Управление для квазилинейной задачи ищется в линейном виде

иа = - (Pak{t)xk + La(t)), а = 1 ,m, к = (2.3)

где функции Pak{t) и La(t) подлежат определению.

Центральным и одним из основных результатов диссертации является следующая теорема.

Теорема 5. Для того, чтобы процесс (р*(-)> и*(-)) Е D для u*(t) £ V*, t G Т был экстремалью в смысле определения 1, достаточно существования функций m(t), K(t), P(t), L(t), H(t), 7(t), A¡(í), M¿j(f), i,j = l,n, удовлетворяющих условиям

^ = A«m-BL, (2.4)

at

^ = AuK + KAuT + r^KT^T + Q, (2.5)

at

где

Au = A- BP, Q = (C + T {m)) (C + T(m)f, Tt7s = Gils - £ FilaPas,

0=1

Tu(m) = T¿¡sms, Сц = - £ FuaLa + Сц,

Q=1

и

а также начальные условия для этих уравнений

m(ta) = m0, K{t0) = К0. (2.6)

Здесь Т^ - матрица размерности п х п, составленная из элементов ~Гц3, (i, s = 1 ,п), причём, в (2.5) ведётся суммирование по всем Л

+ 5FupMSkLaLfj - B.4<tL„Xs— ^ ^

-\{FsiaCki + Fk¡aCsi)MSkLa + \CslCklMak + ^Eaí)LaLp = 0,

^ - \Msk(GsliFkla + GkUFsla)La + \MakFslaFklßPaiLß + ¡FslaFklßPßiLaMsk+ +^(GsuCki + GkuCsi)Msk — \(FsiaCki + FkiaCs¡)PaiMak — BsaPQi\a + AS¿AS— —SaiLa + \EaßPaiLß -f \EaßPßiLa — BsaMisLa = 0,

(2.8)

^ + AIM33 + A"jM¡s - \Msk{GsliFkla + GkliFsla)Paj--\Mak{Gsl¡Fkla + GkljFsta)Pai + ~MskFsiaFki0PaiPßj + ±MakFsiaFkißPajPßi+ +Dij — SaiPaj — SajPai + \EaßPaiPßi + \EaßPajPßi+ +\MakGsuGkij + \MskGaijGku = 0

и условиям при Ь = ¿1

7(*х) = 0, А^О = 0, Мц{Ь) = 3) Матрицы Р и Ь в стратегии управления (2.3) имеют вид

Р =

Е + -(е + ет)

BTM + -R + S-HK~1 id

L =

-i

ВтХ + ~Т + НК~1гп

(2.9) (2.10)

(2.11) (2.12)

где

Rai = Msk(GsliFkia + GkliFsia), а = 1, m, i = Tji;

Ta = Msk(FslaCki + FklaCsl), а = Tjn\ (2.13)

@ij = FsliFkijMsk, i,j = Tjn. 4) Выполнено условие E + \ (6 + 6r) > 0.

Ненулевые элементы матрицы H = Л{Я*} находятся из системы уравнений

Л •

ВТЫ + ÍR + S- {А{Н*})К~г ¿i

= 0. (2.14)

Линейный оператор Л переводит матрицу К с элементами Ку в матрицу К с элементами Йу = Ку, если компонента щ стратегии управления не должна зависеть от компоненты х^, и ^ = 0 в противном случае.

Для синтеза оптимального управления с помощью этой теоремы необходимо решить краевую задачу для системы обыкновенных дифференциальных уравнений типа Риккати.

Оптимизация квазилинейных стохастических систем при наличии случайных погрешностей вектора состояния и реализации управления.

Пусть теперь динамическая система, заданная уравнениями (1.1), (2.1), (2.2), управляется неточно и при реализации состояния системы имеются случайные ошибки измерения:

хн{1)) = иа(1, хн{1))+ Ва (1) ■ Ш. а = Т7ш,

Здесь хУ, - наблюдаемые значения компонент вектора состояния и управления, соответственно, причём каждая компонента управления зависит от своего набора компонент хВ выражении (2.15) нет суммирования по повторяющимся индексам. Шумыэд(£), £а(£) определяются равенствами:

dm(t) _ d щ jt) _ т— dt~ Sí ' г~1>п>

dUt) = dWg (t) а = ГБ

(2.16)

где щ (t), wa (t) - стандартные винеровские процессы.

Дифференцируя (2.15) и используя (1.1), (2.1), (2.2), получим

dx? =

dt+

Aisxf - Ai3 A" r?, + - Вш B°

+ [güsx% - gils Л* 7h - Fila Ва + Filau% + Cu] dw¡+ A* d щ, (2.17) dr¡i = dv)i, d£a — dwa .

Т.о. за счёт введения новых переменных rji, к системе уравнений (1.1), (2.1), (2.2) добавляются уравнения (2.17). К расширенной задаче применимы полученные условия оптимальности.

Обобщение на случай неизмеряемых стохастических возмущений матриц системы

При тех же предположениях относительно динамической системы пусть теперь процесс управления описывается уравнениями Ито следующего вида:

Uí^i —

+ 3. + (B¡a(t) + Bila(t)^r)

dt + Cu{t)dwi,

где функции Áu3(t), Bi¡a(t) - ограниченные борелевские функции, заданные на интервале Т.

Нетрудно видеть, что это система вида (1.1), где функции fi(t,x,u), gu(t,x,u) определяются равенствами

fi(t, х, и) = Aia(t)xa + Bia(t)ua, gu(t,x,u) = Áüs(t)xs + Büa(t)ua + Cü(t).

Таким образом такая задача легко преобразуется к задаче, рассмотренной выше, путём выделения возмущений из коэффициентов сноса и перенесением их в коэффициенты диффузии. И функциям Gu3(t) будут соответствовать функции Ац3({), а функциям F,;a(¿) - функции Bun(t).

Теорема б. Если выполнены условия теоремы 5 и вектор состояния в начальный момент времени имеет математическое ожидание m(to) и ковариационную матрицу K(to), то значение критерия на экстремали вычисляется по формуле

J* = itr (М0К0) + ^mlМ0т0 + Аотоо + 70, (2.18)

где т0 = m(to), К0 = К (to), М0 = M(t0), А0 = (to), 70 = 7 (to)-

В третьей главе предлагается несколько схем численных методов поиска стратегий оптимального управления диффузионным стохастическим процессом при наличии информационных ограничений. В случае, когда уравнения управляемой системы линейны или квазилинейны, а критерий качества квадратичен, неформальные элементы методов поиска приобретают форму регулярных вычислительных процедур.

Приведём здесь один из численных методов, для которого в диссертации доказана теорема об улучшении критерия от итерации к итерации.

Метод 1'. Задаём управление u(t,x) = (u\(t, х), u%(t, х),..., um(t, х)), удовлетворяющее информационным ограничениям, произвольно или с помощью дополнительных соображений.

Шаг 1. Используя стратегиюи(Ь,х), находим функции 7(2), А(£), М(Ь), интегрируя (2.7) - (2.10).

Шаг 2. Подсчитываем значение критерия по формуле (2.18). Шаг 3. При фиксированных функциях 7(2), А(£), М(£) решаем задачу Коши (2.4) - (2.6), одновременно вычисляя при каждом ( £ Г в последовательно возрастающие моменты времени £ новое приближение стратегии используя (2.11) - (2.14).

Шаг 4. Полагаем и(1,х) = и+(<,х), ( £ Г, I £ Д" и переходим к шагу 1.

Итерации прекращаются по достижении необходимой точности по критерию вычисляемому на шаге 2 (сравниваются значения критерия на двух соседних шагах).

Четвертая глава содержит описание программного комплекса, который на основе метода 1' решает задачу оптимального управления стохастической квазилинейной системой управления с квадратичным критерием качества.

Программа обладает следующими характеристиками:

1. Описывает динамический объект и критерий качества управления при помощи матриц и скалярных величин, определяющих систему;

2. Задает измеряемые компоненты вектора состояния;

3. Синтезирует стратегии управления и моделирует поведение вектора состояния в зависимости от начальных условий;

4. Строит графики изменения всех расчётных величин и представляет их в табличном виде;

5. Рассчитывает критерий качества управления;

6. Позволяет параметризовать задачу, чтобы получать решение одной и той же задачи с разными входными данными;

7. Сохраняет результаты численного интегрирования в формате хш1, который сегодня является одним из общепринятых способов хранения структурированных данных.

На рис. 1 приведён экран с результатами расчётов одной задачи оптимального управления, подробно рассмотренной в основном тексте диссертации.

»Ь Расчет оптимального■управлрниийкз)

-101 х|

>> ь»

ш Начйльныеданные Е Результаты

» Итерация-1 ^=295.5562353575) В Итя>«>»2 (,>-285.5562553574) Я ш В Н Я Н(|] В НЫ

нп.и ваш

нпд нр.1] нвд ни Hp.1l нвд

Н[3.3|

Ш р

а 1. а; м

Ш 1аглЬйа Щ детта

В X в и

Время

« шшл

«1 0.48375

1=0.2 0.3135875

№3 1.2058064

(=0.4 1.3277542

«15 1.2103910

Ы16 0.8402087

«.7 0.1722451

№8 •0.791085!

Ь-0.9 ■2.035012

1-1 ■3.54В854:

1-11 -5.307472!

М.2 -7.244257:

1-1.3 ■9.317703!

1-1.4 •11.44285'.

1-1.5 ■13.559471

1-1.6 •1557455".

1-17 ■17.42204;

(-1.8 •1 а 012371

Рис. 1. Результаты расчётов

В пятой главе рассматриваются примеры задач управления различными техническими объектами, для решения которых используются полученные условия оптимальности. Анализируются случаи различной информированности о состоянии.

Решена задача демпфирования колебаний спутника Земли с использованием электромагнитных управляющих устройств. Проведен расчёт для различных случаев информированности о состоянии. В качестве компонент вектора состояния выбраны импульсы рч и углы (9;, г — 1,3 в орбитальной системе координат. В одном из вариантов расчёта импульсы могут измеряться неточно. Управление - это вектор магнитных моментов 11 = щ)Т, создаваемых спутником, которые взаимодействует

с магнитным полем Земли. Считается, что управление реализуется не точно, а со случайной погрешностью. Цель управления состоит в демпфировании колебаний. Критерием в этой задаче служит расход энергии в электромагнитном устройстве, при этом накладывается штраф за отклонение в конечный момент времени координат спутника от нулевых значений.

Предложенные решения прикладных задач демонстрируют

эффективность управления ЛА при различном составе измеряемых координат. Это позволяет сделать вывод о возможности применения разработанной теории для синтеза стратегий управления реальными техническими объектами.

Переходные процессы

Углы 61,62,63 измеряются точно, Измеряются три угла 62, импульсы Р1,Р2,Рз имеют

случайную ошибку измерений

Рис. 2. Изменение углов

Рис. 3. Изменение импульсов

Рис. 4. Изменение управления

РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ В диссертационной работе предложено решение проблем оптимального управления квазилинейными стохастическими системами диффузионного типа с информационными ограничениями, выразившееся в следующих результатах:

1. Получены конструктивные условия оптимальности и разработаны методы оптимизации стратегий управления, зависящих от известных компонент вектора состояния, в задачах управления

— стохастическими квазилинейными системами с квадратичным критерием качества;

— линейными стохастическими системами со случайными возмущениями в матрицах системы;

— квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления.

2. Разработаны три схемы численных методов поиска стратегий оптимального управления диффузионными стохастическими процессами при наличии информационных ограничений.

3. Для задач оптимального управления стохастической квазилинейной системой указанные в п. 2 схемы численных методов конкретизированы в виде конструктивно реализуемых вычислительных процедур.

4. Для решения задачи оптимального управления стохастической квазилинейной системой управления с квадратичным критерием качества создан программный комплекс, позволяющий численно решать поставленную задачу.

5. Проведена апробация предложенных теоретических результатов на тестовых прикладных задачах управления различными летательными аппаратами, решения которых демонстрируют применимость предложенной теории к задачам оптимального управления сложными техническими объектами.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ В ИЗДАНИЯХ, ВХОДЯЩИХ В ПЕРЕЧЕНЬ ВАК

[1] Румянцев Д.С., Хрусталёв М.М. Оптимальное управление квазилинейными системами диффузионного типа при неполной информации о состоянии // Изв. РАН. Теория и системы управления. -

2006. - N 5. - с. 43-51.

[2] Румянцев Д.С., Хрусталёв М.М. Численные методы синтеза оптимального управления для стохастических динамических систем диффузионного типа // Изв. РАН. Теория и системы управления. -

2007. - N 3. - с. 27-38.

[3] Хрусталёв М.М., Румянцев Д.С. Синтез стратегий оптимального управления гибким спутником при информационных ограничениях // Вестник МАИ. - 2008. - т. 15. - N 2. - с. 147-154.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ В ДРУГИХ ИЗДАНИЯХ

[4] Румянцев Д.С. Компьютерная программа расчёта оптимального управления квазилинейными системами диффузионного типа при информационных ограничениях // Промышленные АСУ и контроллеры - 2007. - N 9. - с. 28-32.

[5] Khrustalev М.М., Rumjantsev D.S. Optimal control for diffusion quasi linear processes with incomplete information about the state // Proceeding of the IFAC Workshop GSCP-2004 and satellite events. Pereslavl-Zalessky, Russia, September 21-29, 2004., - p. 123 - 131.

[6] Хрусталёв M.M., Румянцев Д.С. Оптимизация конструкции квазилинейного демпфера колебаний самолета при взлете и посадке // Тезисы докладов 3-ей Международной конференции "Авиация и космонавтика-2004", г. Москва, 2004. - 1 с.

[7] Khrustalev М.М., Rumjantsev D.S. Synthesis of optimal control strategy by damping a vibration of Earth satellite with a gravity-gradient stabilization

with incomplete information about the state // Proceeding of the 56-th International Astronautical Congress. - Fukuoka, Japan - October 17-21, 2005, - 5 pages.

Хрусталёв M.M., Румянцев Д. С. Оптимальное управление системами диффузионного типа при неполной информации о состоянии в случае неизмеряемых возмущений матрицы системы и наличии погрешностей вектора состояния и реализации управления // Тезисы докладов международного конгресса "Нелинейный динамический анализ 2007". -С.-Петербург. 4-10 июня 2007, - 1 с.

Khrustalev М.М., Rumyantsev D.S. Synthesis of optimal control strategy by damping a vibration of earth flexible satellite with a gravity-gradient stabilization with information constraints // Proceeding of the 58-th International Astronautical Congress. - Hyderabad, India - September 24-28, 2007, -8 pages.

Подписано в печать 14.01.09. Печ. л. 1,2. Тираж 100 экз. Заказ 5.

125080, Москва, Волоколамское ш., 11 Издательский комплекс МГУПП

Оглавление автор диссертации — кандидата физико-математических наук Румянцев, Дмитрий Станиславович

Список основных обозначений

Введение

1 Оптимизация стохастических систем с информационными ограничениями

1.1 Постановка задачи оптимального управления стохастическими системами диффузионного типа при наличии информационных ограничений.

1.2 Достаточные условия оптимальности

1.3 Локальные условия оптимальности первого порядка.

1.4 Техническое описание системы управления.

1.5 Выводы.

2 Оптимизация квазилинейных стохастических систем

2.1 Постановка задачи.

2.2 Условия оптимальности.

2.3 Оптимизация квазилинейных стохастических систем при наличии случайных погрешностей вектора состояния и реализации управления.

2.4 Обобщение на случай стохастических возмущений матриц коэффициентов линейной системы.

2.5 Выводы.

3 Численные методы синтеза стратегий оптимального управления стохастическими системами с информационными ограничениями

3.1 Численные методы поиска.

3.2 Управление скоростью сходимости.

3.3 Теоремы об улучшении критерия.

3.4 Квазилинейные задачи с квадратичным критерием.

3.4.1 Способы решения уравнения (2.23).

3.4.2 Алгоритмы численных методов оптимизации стратегии управления.

3.5 Примеры

3.6 Выводы.

4 Программное обеспечение для расчёта оптимального управления квазилинейными стохастическими системами

4.1 Общие сведения о программе.

4.2 Диалоговый интерфейс.

4.3 Выводы.

5 Примеры задач оптимального управления летательными аппаратами

5.1 Задача демпфирования колебаний спутника Земли с гравитационной стабилизацией.

5.2 Задача о стабилизации орбиты искусственного спутника 3емли

5.3 Выводы.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Румянцев, Дмитрий Станиславович

Диссертационная работа посвящена разработке методов оптимального управления стохастическими системами диффузионного типа в задачах с информационными ограничениями.

Актуальность исследований в этом направлении обуславливается необходимостью наиболее точного описания систем автоматического управления, реалистичным вариантом которого является стохастическое описание, учитывающее воздействие па объект управления случайных факторов, в предположении неполноты информации о состоянии. Предложенные в диссертации условия оптимальности для квазилинейных систем вносят существенный вклад в развитие этого направления теории оптимальных процессов, в частности, позволяют решать задачи управления линейными системами с мультипликативными возмущениями управления и со случайными возмущениями в матрицах уравнений системы.

Целью диссертационной работы является разработка методов синтеза оптимальных стратегий управления стохастическими квазилинейными системами в случае измерения части компонент вектора состояния при наличии ошибок измерения и ошибок реализации управления.

В соответствии с целью исследования были поставлены следующие задачи:

1. получить конструктивные условия оптимальности в задачах синтеза стратегий оптимального управления:

- квазилинейными стохастическими системами при измерении части компонент вектора состояния;

- линейными стохастическими системами со случайными возмущениями в матрицах системы при измерении части компонент вектора состояния;

- квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления;

2. разработать численные методы решения задач п.1;

3. создать программное обеспечение для реализации численных методов;

4. провести решение тестовых прикладных задач при различном уровне информированности с применением предложенных теоретических результатов.

Для решения поставленных задач использовался метод функций Ляпунова-Лагранжа, наметившийся еще в ранних работах Хрусталёва М.М. при изучении проблемы оптимального управления частично наблюдаемым диффузионным процессом и получивший дальнейшее развитие в его работах по стохастическим дифференциальным играм с неполной информацией [1, 2]. Этот подход состоит в использовании совокупности функций, аналогичных вектор-функциям Ляпунова в теории устойчивости. Но в изучаемом круге проблем эти функции играют двоякую роль. С одной стороны, их применение так же, как функций Ляпунова, подменяет проблему изучения поведения траекторий динамической системы изучением поведения этих функций вдоль траекторий системы. С другой - они являются нелинейными нелокальными аналогами классических множителей Лагранжа, предназначенными для полного снятия ограничений. В связи с такой двойной ролью эти функции были названы вектор-функциями Ляпунова-Лагранжа [1, 2].

Важным результатом применения векторных функций Ляпунова-Лагранжа является снятие всех нелокальных ограничений, в том числе и информационных, доведение условий оптимальности до совокупности уравнений (или неравенств) для этих функций и семейства конечномерных экстремальных задач, решаемых в фиксированный момент времени локально в каждой точке пространства состояний, аналогично тому, как это делается в условиях принципа максимума Понтрягина Л.С. или динамического программирования для классической задачи оптимального управления.

Фундаментом для метода Ляпунова-Лагранжа послужили работы Понтрягина Л.С. [3], Беллмана Р. [4], Кротова В.Ф. [5], Гурмана В.И. [6], в которых встречались те или иные фрагменты метода. Различные аспекты метода исследовались в [7]-[11] и более поздних работах [12]. Близкий методу функций Ляпунова-Лагранжа подход предлагается в [13].

Для описания динамической системы составляется ее математическая модель. Одно из основных требований, предъявляемых к модели, -наиболее точно описать функционирующий технический объект, для которого в реальной ситуации зачастую невозможно получать полную информацию о динамике системы, возмущениях, действующих на него и т.д. В результате возникает задача оптимизации с информационными ограничениями. Традиционно уделяется большое внимание методам решеиия задач оптимизации динамических систем, позволяющим определять непрерывное управление либо как функцию от начальных условий и времени (программное управление) [3], либо как функцию времени и текущих фазовых координат системы (синтез управления) [4]. Как уже отмечено, на практике существует обширный класс динамических систем, в которых информация о положении в фазовом пространстве является неполной и ограничена измерительным устройством, которым располагает система. Возможности управления такими системами существенно зависят от той информации, которая может быть получена путем измерения и обработки наблюдений. Поэтому в теории стали развиваться направления, связанные с решением задач оптимизации динамических систем в условиях неопределенности, например: управление пучками траекторий [14]-[27]; управление стохастическими системами [28]-[55]; управление системами с распределёнными параметрами, в том числе, с неполной информацией [56]-[64]; децентрализованное управление [65]-[72]; управление в антагонистических и коалиционных играх [73]-[78]; управление дискретными системами [6],[79]-[91] и т.д.

Проведем обзор известных методов оптимизации систем управления с точки зрения доступности информации об объекте. Вместе с методами управления стохастическими системами диффузионного типа будем также рассматривать методы управления: детерминированными системами, так как в определённой мере они являются частными случаями стохастических систем; системами с распределёнными параметрами, поскольку часто управление стохастическими системами сводится к детерминированной задаче управления решением уравнений в частных производных.

При наличии неопределенности в динамической системе есть три пути решения задачи синтеза стратегии управления.

В первом случае отыскивается управление, являющееся функцией наблюдаемых переменных. В этом случае находится структура стратегии управления, которая непосредственно зависит от наблюдаемого сигнала.

Второй путь связан с нахождением оптимального закона управления, который использует оценку состояния динамической системы. Эта оценка делается на основе имеющейся информации путём дополнительного построения фильтров (идентификаторов состояния). Именно она используется при построении управления в работах [93]-[105].

Третий путь является комбинаций первого и второго. В этом случае решается задача совместного отыскания оптимальной стратегии управления и оптимального фильтра, задающего оценку состояния динамической системы.

В данной работе принята постановка задачи, соответствующая первому пути.

Пусть для некоторой математической модели динамической системы с состоянием х G Rn, управлением и 6 Rm, временем t Е R1 требуется синтезировать стратегию управления и = u(t: ж), удовлетворящую цели управления. При этом известно, что наблюдается лишь часть компонент вектора х.

Для задач стохастического оптимального управления традиционным является поиск минимума математического ожидания функционала [15]. Однако, иногда рассматриваются и другие критерии [106, 107, 108]. Проблеме существования управления с неполной обратной связью посвящены работы [31]-[36]. Различные методы управления стохастическими системами с неполным вектором наблюдения описаны в работах [37]-[46]. Следует выделить работы У. Флеминга [45] и В.В. Семёнова [46], в которых получены необходимые условия оптимальности для стохастических систем с неполной обратной связью общего вида. Характерным в этих подходах является то, что исходная стохастическая задача сводится к детерминированной задаче управления решениями уравнения в частных производных. Эти работы нашли свое развитие в статьях А.В. Пантелеева, А.С. Бортаковского, Е.А. Руденко [17], [18], [50]-[54], [84]-[87], в которых сформулировано несколько вариантов достаточных условий оптимальности.

Вопросам оптимального управления системами с распределёнными параметрами при неполном измерении состояния посвящены работы из обзора [59].

Этот же вариант информированности имеет сходство с задачами построения фильтров в смысле их постановок. Поэтому приведём здесь ещё несколько замечаний, связанных с теорией фильтрации, основу которой, несомненно, заложили Калман и Бьюси [92]. Здесь можно выделить два направления. В подходе Р.Л. Стратоновича [93] основные проблемы, возникающие из стремления повысить точность оценивания, связаны с наличием большой размерности строящихся фильтров. В [94] B.C. Пугачёв обходит эти трудности путем фиксации структуры искомого фильтра и сосредоточения усилий на поиске ее неизвестных параметров. В работе [95] развивается этот путь в направлении поиска структуры фильтров.

Большое развитие получили методы оптимального управления несколькими взаимосвязанными динамическими системами с децентрализованным управлением. Структура управления таким комплексом систем строится на основе нескольких локальных управляющих устройств , причем каждый локальный регулятор uK(t,xK) управляет только локальным входом и контролирует только локальный выход хк: к — 1, су. Тем не менее, все эти устройства участвуют в управлении всей системой в целом [65] с вектором состояния х. С точки зрения информированности ситуация состоит в следующем. Для всего комплекса систем весь вектор состояния измеряется полностью, однако стратегия управления должна быть построена в децентрализованном виде, т.е. весь вектор управления и составляется из локальных стратегий uK(t, хк), где хк - локальный вектор состояния к-ой подсистемы, к = 1,сх. В этой области имеется большое количество работ. Для анализа структуры системы применяется метод декомпозиции [65, 66]. Качественный анализ синтезированного управления проводится с использованием векторных функций Ляпунова [67, 72]. Поскольку оптимального управления получить не удается, многие останавливаются на иоиске субоптимального управления [65]. Поэтому метод возмущений [68], так же как и его обобщение метод агрегирования [69], оказываются полезными в задачах синтеза децентрализованного управления динамическими системами, которые можно агрегировать более простыми структурами. Стоит отметить, что существует очень мало работ по децентрализованному управлению дискретными системами с неполной информацией [71].

Для дискретных систем управления с полной информацией разработаны многочисленные методы управления [79, 80]. Однако, имеется направление в теории оптимального управления, которое трактует этот вариант управления как синтез кусочно - постоянного управления при полных измерениях вектора состояния непрерывной модели системы в дискретные моменты времени [6]. С точки зрения информированности об объекте это означает, что информация о динамике системы доступна лишь в дискретные моменты времени, а во все оставшиеся моменты информация о системе отсутствует. Кроме того, управление в промежуточные между интервалами измерения время не может быть скорректировано и должно оставаться постоянным на каждом таком подынтервале.

Исследований, посвященных дискретным системам управления с неполной информацией, довольно мало. В качестве примеров работ в этом направлении можно привести [84]-[87], в которых предлагаются достаточные условия оптимальности частично дискретно наблюдаемых диффузионных процессов. Развитие направления, соответствующего этому варианту, проводится в работе [88], в которой стратегия управления базируется на основе дискретных наблюдений в различные моменты времени.

Важной задачей в теории управления стохастическими системами является задача получения численных методов синтеза оптимального управления. Этим вопросам посвящены работы [37]-[39]. Основной принцип, заложенный в этих методах, заключается в том, что, если имеется некоторая стратегия управления, то метод должен позволять найти такую стратегию, которая будет лучше относительно заданного функционала. Во всех случаях исследователи предлагают рассматривают дискретную аппроксимацию непрерывных систем, в связи с чем возникает эффект неустойчивости итерационных методов [40], а также вопрос об асимптотической сходимости методов последовательных приближений [41].

Другим эффективным методом синтеза является спектральный [42], основанный на алгебраической форме связей между характеристиками системы, позволяющий получать количественные характеристики по матрично-операторным формулам. Для этого направления создано алгоритмическое и программное обеспечение [43], получены достаточные условия оптимальности для систем со случайной структурой при неполной информации [44].

В диссертационной работе помимо общих условий оптимальности в задачах управления стохастическими квазилинейными системами с неполной обратной связью по состоянию представлены условия оптимальности в задачах синтеза стратегий оптимального управления линейными стохастическими системами с неизмеряемыми возмущениями в матрицах системы и информационными ограничениями, а также квазилинейными стохастическими системами при неточном измерении состояния и реализации управления в условиях информационных ограничений. Отметим результаты, достигнутые другими авторами в этом направлении. Существует группа работ, посвященных управлению системами со структурной неопределенностью, в которых удается либо синтезировать оптимальное управление [109] с использованием методов теории оптимального управления системами с распределёнными параметрами, либо исследовать робастность таких систем [110, 111]. В [112, 113] исследован вариант, когда случайным образом изменяется не структура динамической системы, а лишь отдельные её параметры.

Для более детального обоснования на содержательном уровне научной новизны получаемых условий оптимальности приведем исследуемую в главе 1 постановку задачи управления частично наблюдаемым диффузионным процессом. При этом во введении для простоты изложения не всегда будем оговаривать теоретико-функциональные требования к встречающимся функциям. Эти требования будут строго даны в основном тексте диссертации.

Процесс управления описывается системой уравнений Ито [28] dxi(t) = fi{t, x(t),u(t, x(t)))dt + gu(t, x(t), u(t, x(t)))dwi(t), x(t0) — x0. Здесь t £ T = [to',ti] С R1 - время; x — ., xn)T - состояние системы, i — 1 , n; ж о - случайный вектор; W[ - стандартный винеровский процесс, I = и = (ui,.,um)T 6 U С Rm - вектор управления; (i, х) —> u(t, х) : Т X Rn —> U С Rm - управление (стратегия управления процесса). Здесь и далее по дважды встречающимся в произведении функций индексам проводится суммирование.

Предполагается, что динамика плотности вероятности состояния удовлетворяет уравнению Фоккера-Планка-Колмогорова [28] dp(t, х) д д2 т^— = -faTlfifo xi х)1 + дд-.д^.К/^ х, u(t1 x))p(t> p(t0,x) =ро(х), где aij = gu gij/2.

Введём функции, описывающие в момент t плотность распределения вероятности t p*(t) = p(t, ■) : Т —> и управление t —> u*(t) = ■) : Т V, где Ср - пространство дважды непрерывно дифференцируемых плотностей вероятностей на пространстве а У - множество, задающее информационные ограничения (подробнее о множестве V см. § 1.4). Будем предполагать, что начальное состояние ж о определяется плотностью ро = р*(to). Через D обозначим множество процессов управления 2: = (р*('),и*(-)).

Ставится задача поиска минимума d — min2 J(z), z (Е D и процесса z = (р* (•),?!*(•)) Е -D, на котором J(z) — d для заданного функционала z J(z) : D Д1, где Г ( г

Jt0 J Rn

В диссертации рассматриваются задачи оптимизации динамических систем с информационными ограничениями, состоящими в том, что каждая компонента стратегии Ui(t,x), г — 1, тп управления может зависеть от своего априори назначаемого набора компонент вектора состояния, в общем случае своего для каждой компоненты.

Сформируем набор функций ua(t, х), а = l,ni, 774 < п. Каждая из функций ua{t,x) представляет собой совокупность всех компонент управления u(t,x) — (ui(t, х),., um(t, х))т, не зависящих от компоненты ха вектора состояния х £ Rn (подробнее см. § 1.4).

Одна из основных идей предложенного в [1, 2] метода Ляпунова-Лаграпжа состоит в замене поставленной задачи с информационными ограничениями другой эквивалентной ей задачей посредством введения x,u(t, x))p(t, x)dxdt + I Fc(x)p{t\,x)dx.

JR" новых дифференциальных связей вида

-—ua(t, ж) = 0, а = 1, пь х е Rn, дха д задающих информационные ограничения.

В [1, 2] получены условия оптимальности для случая, когда вероятностная мера, задающая распределение вектора состояния процесса, может не иметь плотность. Здесь рассматривается случай, когда эта мера имеет плотность q(-) € Ср.

Для получения достаточных условий оптимальности вводится класс Ф вектор-функций Ляпунова - Лагранжа tp = (</з°, уз1,., уз711), где t, q) уз°(*, q) :Т хСр Я1, (t, ж, иа, д) -> уза(£, ж, q):TxRnxRmX

Ср —>• Д1, а = удовлетворяющих определённым условиям [1, 2]. Строятся конструкции: где £ - производная Фреше функции (/9° по переменной q Е Ср.

Для отыскания оптимального элемента ~z Е jD, т.е. такого, что J(^) = d доказано утверждение:

Теорема. Если процесс z = (р*(■), и*(•)) Е D удовлетворяет условиям

H{t, ж, и, g) = fi + ^ aij + /с) q + уз! а а) = min^y,^ 5(4, б) Gtf(t1))=mmq€(?pG(q), то он оптимален.

Дадим определение экстремали, как это сделано в [2]. Эстремалью называется процесс {&*{-), и*{')) £ D, на котором выполняется условие Ь) и условие стационарности в экстремальной задаче а). Далее это определение будет несколько видоизменено, но его содержательный принцип останется тем же.

Характерной чертой представленных в теореме условий оптимальности является то, что операция минимизации по управлению производится локально в каждой точке фазового пространства так же, как и в условиях оптимальности для детерминированных систем [3]-[5]. Необходимые условия, полученные У. Флемингом [45], как и результаты работ [47], [55], не обладают этим свойством. Локальность операции минимизации по управлению позволяет разделить операцию нахождения оптимального управления и операцию поиска вектор-функции ip.

Эти возможности достигаются за счёт того, что в предлагаемой работе, как и в [1, 2], для ограничений информационного типа, представленных в виде дифференциальных связей, вводятся нелинейные функции (р1, ср2,., <£>П1, играющие роль множителей Лагранжа и имеющие достаточную степень свободы для поиска оптимального управления, удовлетворяющего информационным ограничениям. У. Флеминг в [45] так же, как и его последователи, не вводил функций типа множителей Лагранжа для информационных ограничений. Это приводило к тому, что объективно существующие дифференциальные связи, задающие ограничения, непосредственно входили в формулировки условий оптимальности.

В принципе, свойство локальности операции минимизации по управлению для ряда практических задач синтеза оптимального управления с неполной обратной связью, естественно, может оказаться не определяющим, и поэтому задача может быть решена средствами работ [17], [18], [45]-[47], [50]-[54], [84]-[87].

Более того, увеличение размерности пространства, в котором проводится операция минимизации по управлению и добавление функций типа Лагранжа, в принципе, может усложнить решение части конкретных практических задач. Однако, если рассматривать предлагаемый подход с точки зрения его приложения к задачам с более сложными ограничениями информационного типа, то это свойство оказывается принципиальным, например, в задаче синтеза децентрализованного управления. Таким образом, в прикладном плане этот подход может оказаться довольно перспективным.

Пусть теперь задача является квазилинейной, т.е. функции /;(£, ж, и), gu{t,x,u), fc(t:x:u): Fc(x) имеют вид fi{t, х, и) = Ais(t)xs + Bia(t)ua, gu(t, x, и) = Gus{t)xs + Fua(t)ua + Cu(t), f°(t,x,u) = ^Dij(t)xixj + Sai(t)xiUa + ]^Eap(t)uaup,

F (ж) — ~QijXiXj.

Считается, что для рассматриваемого здесь процесса плотность вероятности состояния p(t, х) существует и удовлетворяет уравнению Фоккера-Планка-Колмогорова с начальной плотностью p(to, х) = Ро(х). Начальная плотность имеет математическое ожидание то, ковариационную матрицу Kq и считается заданной.

Центральным и одним из основных результатов диссертации является следующая теорема.

Теорема. Для того, чтобы процесс z = (р*(•), и*(■)) Е D был экстремалью, достаточно существования функций га(£), K(t), P(t), L(t), H(t), 7(t), Xi (t), Mij(t), i, j — 1, n, удовлетворяющих условиям 1) dt dK dm Aum — BL, dt где

Au — A — BP, Q = (C + T(m)) (c + T(m)) , Tils = GiZs - £ FilaPaS:

ТП

Yij(m) = Сц = — FuaLa + Cjj, a=l а также начальные условия для этих уравнений m(t0) = wo, -К"(*о) = Яо

Здесь Т^ - матрица размерности п х п, составленная из элементов YfZs, s = l, п), причем, для Т« ведётся суммирование по всем Z. 2) \FsiaFkipMskLaLp — BsaLaXs— —\{FsiaCki + FklaCsl)MskLa + \CsiCkiMsk + \EapLaLp = 0, — \Msk(GsuFkia + GkliFsla)La + \MskFsiaFkipPaiLp + \FsiaFkipPpiLaMsk+ +\{GsuCki + GkuCsi)Msk — \{FaiaCki + FkiaCsi)PaiMsk — BsaPaiXs + AsiXs— —SaiLa + \EapP(xiLfj + ^EapPpiLa — BsaMiSLa = 0, + ArfMjg + AusjMis - \Msk(GsliFkia + GkliFsla)Paj--\Msk{GsijFkla + GkljFsia)Pai + \MskFslnFklpPMPPj + \MskFslaFklpPajPpi+

Dij Paj ^atj Pai 2 P Pfij "I- 2 P P^J Pfti

MskGsuGkij + \MskGsijGku = 0 и условиям при t — t\

7(*i) = 0, Ai(ti) = 0, Мфг) = Qij. 3) Стратегия управления выбирается в виде линейной функции от состояния системы: иа = — (Ракхк-I- La), а = 1, га, к = 1, п. Матрицы Р и L вычисляются по следующим формулам

-1

Е + I (е + 0Т) + + S - ЯАГ1

Z Z

L =

Е + i (в + @т) Z

Л-Ь-Г + Я^т где Msk(GsuFkla + GkuFsia), а = 1, т, i = 1, n;

Та = Msk{FslaCkl + FkiaCsi), а = 1, m;

0" = FsliFkijMsk, г, j = 1, т. 4) Выполнено условие Е + | (© + ©Г) > 0.

Ненулевые элементы матрицы Я = ЛЯ* находятся из системы уравнений

А<

E + l(Q + QT)

1 -1 ту—1

В1 М + -R + S - {АН*)К 0.

Здесь Л - линейный оператор структуры управления [2], который определён на множестве матриц размеров тп х п и принимает значения на том же множестве. Оператор Л переводит матрицу Н с элементами в матрицу К с элементами = К^-, если компонента щ стратегии управления не должна зависеть от компоненты Xj , и = 0 в противном случае.

Для синтеза оптимального управления с помощью этой теоремы необходимо решить краевую задачу для системы обыкновенных дифференциальных уравнений типа Риккати.

Полученные в диссертации условия оптимальности позволяют решать задачи оптимального управления линейными стохастическими системами со случайными возмущениями в матрицах системы и квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления.

Достоверность научных утверждений и выводов, представленных в диссертационной работе, подтверждена строгими математическими доказательствами, численными экспериментами, сравнением полученных результатов с уже существующими.

Апробация работы и публикации. Существенные результаты диссертации получепы в рамках программы "Развитие научного потенциала высшей школы" Министерства Образования РФ (per. N 4549, 2005 г.), а также поддержаны грантом РФФИ (N 06-08-00398). Основные результаты опубликованы в журнале "Известия РАН. Теория и системы управления" [126, 127], а также в [128, 129], обсуждались на международных конференциях [130]-[134] и научных семинарах Московского авиационного института в 2007 г.

Личный вклад автора. В [126], [130] разработаны достаточные условия оптимальности для квазилинейных стохастических систем при информационных ограничениях. В [127] созданы численные методы для решения рассмотренных в [126], [130] задач. В [133] проведено обобщение для задач синтеза оптимальных стратегий управления в случае, когда динамическая система управляется неточно и при реализации состояния системы имеются случайные ошибки измерения, также сделано обобщение для задач синтеза оптимальных стратегий управления линейными системами, имеющих в матрицах неизмеряемые возмущения. Показано, что для таких задач могут быть использованы предложенные условия оптимальности. В [127] разработаны численные методы. А в [129], [131], [132], [134] выполнены численные расчёты и синтезировано оптимальное управление для прикладных задач.

Диссертация состоит из введения, пяти глав, заключения и библиографического списка из 134 наименований. Работа изложена на 139 страницах машинописного текста, содержит 14 рисунков и 6 таблиц.

Заключение диссертация на тему "Оптимальное управление стохастическими квазилинейными системами с информационными ограничениями"

5.3. Выводы

Рассмотрены примеры задач управления различными летательными аппаратами. Разработанная теория позволяет эффективно управлять ДА при различном составе измеряемых координат, что делает вывод о возможности её использования для управления реальными техническими объектами.

Заключение

В диссертационной работе предложено решение проблем оптимального управления квазилинейными стохастическими системами диффузионного типа с информационными ограничениями, выразившееся в следующих результатах:

1. Получены конструктивные условия оптимальности и разработаны методы оптимизации стратегий управления, зависящих от известных компонент вектора состояния, в задачах управления стохастическими квазилинейными системами с квадратичным критерием качества; линейными стохастическими системами со случайными возмущениями в матрицах системы; квазилинейными стохастическими системами с неточно измеряемым вектором состояния и ошибками реализации управления.

2. Разработаны три схемы численных методов поиска стратегий оптимального управления диффузионными стохастическими процессами общего вида при наличии информационных ограничений.

3. Для задач оптимального управления стохастической квазилинейной системой указанные в п. 2 схемы численных методов конкретизированы в виде конструктивно реализуемых вычислительных процедур.

4. Для решения задачи оптимального управления стохастической квазилинейной системой управления с квадратичным критерием качества создан программный комплекс, позволяющий численно решать поставленную задачу.

5. Проведена апробация предложенных теоретических результатов на тестовых прикладных задачах управления различными летательными аппаратами, решения которых демонстрируют применимость предложенной теории к задачам оптимального управления сложными техническими объектами.

Библиография Румянцев, Дмитрий Станиславович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Хрусталёв М.М. Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности о состоянии

2. Достаточные условия равновесия // Изв. РАН. Теория и системы управления. 1995. N 6.

3. Хрусталёв М.М. Условия равновесия по Нэшу в стохастических дифференциальных играх при неполной информированности о состоянии1.. Метод Лагранжа // Изв. РАН. Теория и системы управления. 1996. N 1.

4. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз, 1961. - 392 с.

5. Беллман Р. Динамическое программирование. М.: Мир, 1974. - 207 с.

6. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. - 446 с.

7. Гурман В.И. Принцип расширения в задачах управления. -М.: Физматлит, 1997. 287 с.

8. Хрусталёв М.М., Савастюк С.В. Условия оптимальности стохастических систем диффузионного типа в задачах сограничениями на процесс управления-наблюдения // Доклады Академии наук СССР. 1990. - т. 311, N 2. - с. 291 - 295.

9. Хрусталёв М.М., Савастюк С.В. Оптимизация стохастических систем диффузионного типа с ограничениями на процесс управления наблюдения. I // Автоматика и телемеханика. - 1991. - N 7. -с. 89 - 97.

10. Хрусталёв М.М., Савастюк С.В. Оптимизация стохастических систем диффузионного типа с ограничениями на процесс управления наблюдения. II // Автоматика и телемеханика. - 1991. - N 8. -с. 94 - 101.

11. Хрусталёв М.М., Савастюк С.В. Достаточные условия оптимальности стохастических систем в задачах с ограничениями на процесс управления наблюдения // Статистические методы в теории управления ДА: Тем. сб. науч. тр. / МАИ. М., 1990. - с. 4 - 10.

12. Савастюк С. В. Оптимизация параметрически связанных стохастических систем со структурой децентрализованного управления // Оптимизация структур и параметров систем автоматического управления JIA: Тем. сб. научн. тр. / МАИ. М. 1991. с. 24 - 33.

13. Плотников М.Ю., Хрусталёв М.М. Условия глобальной оптимальности стратегий управления диффузионными процессами с возможностью обрыва траекторий при неполной информации о состоянии // Изв. РАН. Теория и системы управления. 2005. - N 1.

14. Москаленко А.И. Методы нелинейных отображений в оптимальном управлении. Новосибирск: Наука, 1983.

15. Куржанский А. Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 392 с.

16. Овсянников Д.А. Математические методы управления пучками. -Л.: ЛГУ, 1980. 228 с.

17. Кирин Н.Е. Метод оптимального демпфирования в задачах управления с неполной обратной связью // Вопр. мех. и процессов управления. Л. Изд-во Ленингр. ун-та. 1989. - Вып. 12. - с. 110 -117.

18. Семёнов В.В., Пантелеев А.В. Достаточные условия оптимальности управления ансамблем траекторий нелинейных динамических систем // Дифференциальные уравнения. 1985. - т. 21, N 4. - с. 628 -636.

19. Бортаковский А. С. Достаточные условия оптимальности управления пучками траекторий нелинейных детерминированных систем.- М., -1985. 22 с. - Деп. в ВИНИТИ 18.06.85, N 4291-85.

20. Kurzhanskii А.В, Filippova T.F. Dynamics of the set of viable trajectories to a differential inclusion: the evolution equation // Пробл. управл. и теории информ. (Problems of control and information theory). 1988. -т. 17, N 3, - c. 137 - 144.

21. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988. - 320 с.

22. Хрусталёв М.М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем. I // Автоматика и телемеханика. 1988. - N 5. - с. 62 - 70.

23. Хрусталёв М.М. Точное описание множеств достижимости и условия глобальной оптимальности динамических систем. II // Автоматика и телемеханика. 1988. - N 7. - с. 70 - 80.

24. Петров А. И., Минин В. В. Аналитическое конструирование регуляторов при неполных наблюдениях // Аналитические методы синтеза регуляторов: Тем. сб. науч. тр./ Саратов: СПИ. 1977. - с. 88 -104.

25. Куржанский А. В. О синтезе управлений по результатам измерений // Прикл. матем. и мех. (Москва). 2004. v. 68. -N 4.

26. Балашевич Н.В., Габасов Р., Кириллова Ф.М. Построение оптимальных обратных связей по математическим моделям с неопределенностью. // Ж. вычисл. матем. и матем. физ. 2004. 44, N 2.

27. Габасов Р., Кириллова Ф.М., Костюкова О.И. Синтез оптимальных управлений для динамических систем при неполной и неточной информации об их состояниях // Труды Математического инта РАН. 1995. - 211. - с. 140 - 152.

28. Третьяков В.Е., Целищева И.В., Шишкин Г.Е. Оптимальное управление системами с неполной и неточной информацией // Тр. Ин-та мат. и мех. УрО РАН. 1992. - 2.-е. 176 - 187, 228.

29. Пугачёв B.C., Синицин И.Н. Стохастические дифференциальные системы. М.: Наука, 1985. - 559 с.

30. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978 - 318 с.

31. Параев Ю.И. Введение в статистическую динамику процессов управления и фильтрации. М.: Сов. радио, 1976, - 184 с.

32. Ahmed N. U., Тео K.L. Existence theorem on optimal control of partially observable diffusions // SIAM J. Contr. 1974. - N 12(3). - p. 351 - 374.

33. Ahmed N. U. Existence of optimal band limited controls without convexity condition // Int. J. Contr. 1976. - N 31(3). - p. 201 - 215.

34. Ahmed N.U. Existence of optimal control for systems governed by Ito stochastic differential and functional equations // Not. Am. Math. 1975. -N 22(1). - p. 257- 260.

35. Benes V.E. Existence of optimal strategies based on specified information for a class of stochastic decision problems // SIAM J. Contr. 1970. -N 8(2). - p. 179 - 185.

36. Benes V.E. Existence of optimal stochastic control laws // SIAM J. Contr. 1971. - N 9(3). - p. 446 - 450.

37. Noussair E.S., Nababan S., Teo K.L. On the existence of optimal controls for quasilinear parabolic partial-differential equation //J. Optim. Th. & appl. 1981. - N 34(1). - p. 99 - 115.

38. Christopeit N. Optimal stochastic control with special information patterns // SIAM J. Contr. 1980. 18(5). - p. 559 - 575.

39. Davis M.H.A., Varaiya P. Dynamic programming conditions for partially observable stochastic systems // SIAM J. Contr. 1973. - p. 226 - 221.

40. Yavin Y Computation of suboptimal randomized strategies for steering the random motion of a point under partial observation // J. Optim. Th. & Appl. 1984. - N 44(1). - p. 159 - 179.

41. Васильев Ф.П. Лекции по методам решения экстремальных задач. -М.: Издательство Московского университета. 1974. - 374 с.

42. Колосов Г.Е. Синтез оптимальных автоматических систем при случайных возмущениях. М.: Наука. Главная редакция физико-математической литературы. - 1984. - 256 с.

43. Солодовников В.В., Семёнов В.В Спектральный метод расчёта нестационарных систем управления JIA. М.: Машиностроение 1975. -272 с.

44. Семёнов В.В., Рыбин В.В. Алгоритмическое и программное обеспечение расчета нестационарных непрерывно-дискретных систем управления JIA спектральным методом. М.: МАИ. - 1984. - 84 с.

45. Рыбаков К.А. Спектральный метод анализа и синтеза систем со случайной структурой. Диссертация на соискание уч. ст. к.ф.-м.п. -М.: МАИ, 2005.

46. Fleming W.H. Optimal control of partially observable diffusions // SIAM J. Control. 1968, v. 6, - N 2. - p. 194 - 214.

47. Семёнов В.В. Синтез алгоритмов управления нелинейными системами при случайных воздействиях с ограниченным составом точных измерений // Аналитические методы синтеза регуляторов: Тем. сб. науч. тр. / Саратов: СПИ. 1978. Вып. 3. - с. 3 - 20.

48. Mortensen R.E. Apriori open loop control of conditions time systems // Int. J. Control. 1966. - v. 3. N 2. - p. 113 - 127.

49. Florentin R.E. Optimal control of noisy system // J. of Control. 1962. v. 12.

50. Розенберг Г.С. Достаточные условия оптимальности динамических систем, описываемых стохастическими дифференциальными уравнениями // Автоматика и телемеханика. 1970. - N 12. - с. 59 - 67.

51. Пантелеев А.В. Синтез оптимального управления стохастическими системами с неполной непрерывной информацией // Математические задачи управления движущимися объектами: Тем. сб. науч. тр. / МАИ, М., 1987. - с. 16 - 22.

52. Пантелеев А.В., Семёнов В. В. Оптимальное управление вероятностными системами по неполному вектору состояния // Автоматика и Телемеханика. 1984. N 1. - с. 91 - 100.

53. Бортаковский А.С. Проекционно оптимальное управление детерминированными системами с неполной обратной связью // Новые задачи оптимизации авиационных систем: Тем. сб. научн. тр. / МАИ, М., -1989. - с. 4 - 10.

54. Рудепко Е.А. Синтез конечномерного алгоритма управления частично наблюдаемым стохастическим объектом / / Задачи стохастического управления: Тем. сб. научн. тр. / МАИ. М. -1986.

55. Пантелеев А.В. Оптимальное управление непрерывными системами при неполной непрерывной мгновенной информации о состоянии: Препринт/ МАИ. М., 1990. 55 с.

56. Katz S. Best endpoint control of noisy systems // J. of Electr. and Control. 1962. v. 12. - N 4. - p. 323 - 343.

57. Бутковский А. Г. Управление системами с распределенными параметрами (обзор) // Автоматика и телемеханика. 1979. N 11. -с. 16 - 65.

58. Бутковский А.Г. Обзор некоторых новых направлений, идей и результатов в проблеме управления системами с распределёнными параметрами // Изв. АН СССР, Техн. киберн. 1983. - N 2. - с. 112 -122.

59. Сиразетдииов Т.К. Оптимизация систем с распределёнными параметрами. М.: Наука, 1977. - 479 с.

60. Сиразетдинов Т.К., Дегтярев Г.Л. Синтез оптимального управления в системах с распределёнными параметрами при неполном измерении состояния (обзор) // Изв. АН СССР. Тех. кибернетика. 1983. - N 2. -с. 123 - 136.

61. Егоров А. И. Оптимальное управление тепловыми и диффузионными процессами. М.: Наука, 1978. 463 с.

62. Лионе Ж.-Л. Оптимальное управление системами, описываемыми уравнениями с частными производными. М.: Мир, 1972. 414 с.

63. Лурье К.А. Оптимальное управление в задачах математической физики. М.: Наука, 1975. 478 с.

64. Хрусталёв М.М. Достаточные условия оптимальности в задачах с ограничениями: Диссертация на соискание уч. ст. к.ф.-м.н., М.: МГУ, 1969.

65. Рафатов P.P. Исследование задачи оптимизации процессов переноса при неполных измерениях. // Мат. методы оптимиз. АН Респ. Кыргызстан. Ин-т автомат. Бишкек, 1992. - с. 65-78.

66. Шилъяк Д. Децентрализованное управление сложными системами: Пер. с англ. / М.: Мир, 1994. 575 с. - ISBN 5-03-003106-5.

67. Saberi A., Khalil Н. Decentralized stabilization of a class of nonlinear interconnected systems // Int. J. Control. 1982. - v. 36, N 5. - p. 803 -818.

68. Hahn W. Theory and application of Liapunov's direct method. Engle-wood. cliffs HJ: Pretice Hall, - 1963.

69. Kwatny H.J., Spare J.H., Massino F.M. Perturbation methods in the construction of model decomposition for large scale systems analysis. Drexel Univ. Rep. Aug. - 1977.

70. Davison E.J. A new method for simplifying linear dynamic systems // IEEE Trans. Auto. Control. 1968. AC - 13(2). Apr. - p. 214 - 215.

71. Vesely V. Decentralized control of linear dynamical systems with partial aggregation // Kybernetika. 1989. - v. 25. N 5. - p. 408 - 418.

72. Chammas A.B. Decentralized control of discrete time linear system with incomplete information // Int. J. Contr. - 1982. - N 36(4). - p. 575 - 587.

73. Мисриханов М.Ш. Аналитический синтез оптимального управления децентрализованными системами. // Современные методы управления многосвязными динамическими системами.: Сборник. Вып. 1 М.: ЭнергоАтомИздат. 2003. с. 615-623

74. Константинов Р.В. О линейной дифференциальной игре преследования с неполной фазовой информацией // Некоторые проблемы совр. матем. и их прил. к задачам физ. и мех. / Моск. физ.-техн. ин-т. М., 1995. с. 98-110.

75. Слепцов С. В., Третьяков В.Е. Линейно-квадратичная игра с неполной информацией // Тр. Ин-та мат. и мех. УрО РАН. 1992. -2. - с. 166-175,227.

76. Румянцев А.Е. Достаточные условия существования решения в линейных дифференциальных играх при неполной информации. // Проблемы динамического управления: Сборник научных трудов.

77. Вып. 1. МГУ. М.: Изд-во Фак. вычисл. матем. и кибернет. МГУ, 2005, с. 268-288

78. Пшеничный Б.Н. Об одной специальной задаче преследования при неполной информации // Кибернетика и системный анализ 1995. -N 2. - с. 106-112.

79. Жуковский В.И., Молоствов B.C. Многокритериальная оптимизация систем в условиях неполной информации М.: МНИИПУ, 1990. 112 с.

80. Докучаев Н.Г. Управление диффузией кордесовского типа с неполными наблюдениями в игровой задаче // Дифференц. уравн. -1996. 32, N 8. - с. 1051-1062.

81. Болтянский В.Г. Оптимальное управление дискретными системами. М.: Наука, 1973.

82. Пропой А.И. Элементы теории оптимальных дискретных систем. -М.: Наука, 1973. 256 с.

83. Чебыкин Л. С. Условия оптимальности дискретно-непрерывных систем // Оптимальное управление системами с неопределенной информацией: Тем. сб. науч. тр. / Свердловск: УНЦ АН СССР. -1980. с. 132 - 140.

84. Бортаковский А.С., Пантелеев А.В. Достаточные условия оптимальности управления непрерывно дискретных систем // Автоматика и телемеханика. - 1987. - N 7. - с. 57 - 66.

85. Андреева Е.А. Необходимые и достаточные условия оптимальности для дискретных управляемых процессов // Изв. АН СССР. сер. Техп. киберн. 1989. - N 2. - с. 183 - 190.

86. Пантелеев А.В. Синтез оптимального управления непрерывными стохастическими системами при неполной дискретной информации // Статистические методы в теории управления JIA: Тем. сб. науч. тр./ МАИ, М. , 1990. с. 10 - 19.

87. Пантелеев А.В. Достаточные условия оптимальности дискретного управления непрерывными детерминированными системами//Анализ и синтез систем управления JIA: Тем. сб. науч. тр. / МАИ, М., 1987. -с. 44 50.

88. Panteleyev A.V. Optimal control of continuous-time deterministic systems with incomplete discrete feedback //J. Optimiz. Theory and Appl. -1990. 64, N 3. - c. 557-571.

89. Руденко Е.А. Достаточные условия оптимальности конечномерного стохастического управления летательным аппаратом по дискретным измерениям // Новые задачи оптимизации авиационных систем: Тем. сб. научн. тр. / МАИ, М. 1989. с. 18 - 26.

90. Дарховский Б.С. Локально-оптимальная стабилизация при неполной информации // Автомат, и телемех. 1997. - N 4. - с. 144^154.

91. Гаврина О.М. Синтез дискретных регуляторов линейных систем при неполной обратной связи // Вестн. С.-Петербург, ун-та. Сер. 1. 1993. -N 3. - с. 8-13.

92. Заика Ю.В. Дискретная стабилизация динамических систем с неполной обратной связью // Вестн. С.-Петербург, ун-та. Сер. 1. -1992. N 3. - с. 24-31.

93. Kalman R.E., Вису R.S. New results in linear filtering and prediction theory // J. Basic Eng., Trans. ASME, Ser. D, 83, 1961 p. 95 - 108.

94. Стратанович P. JI. Условные марковские процессы и их применение к теории оптимального управления. М.: Изд-во МГУ, 1966.

95. Пугачёв В. С. Обобщение теории условно оптимального оценивания и экстраполяции // Докл. АН СССР. 1982. - т. 262, N 3. - с. 535 - 538.

96. Руденко Е.А. Оптимальная структура нелинейных фильтров конечного порядка: Препринт / МАИ. М., 1989 61 с.

97. Сейдж, Э., Меле Дж. Теория оценивания и ее применение в связи и управлении. М.: Связь, 1976. - 495 с.

98. Смирнов Н.В. Стабилизация билинейной нестационарной системы в случае неполной обратной связи // Вести. С-Петерб. Ун-та. Сер. 1. 2000, N 4, с. 28-34, 102.

99. Кирии Н.Е. Метод оптимального демпфирования в задаче терминального управления по неполной обратной связи с учётом возмущений // Ред. ж. Вестн. С.-Петербург, гос. ун-та. Мат., мех., астрон. СПб, 1997. - 15 е.: Деп. в ВИНИТИ 18.11.97, N 3366-В97.

100. Садомцев Ю.В., Иванов Д. В. Оптимальное управление в линейных системах при неполной информации о векторе состояний / Саратов. Гос. Техн. ун-т. Саратов, 1997. - 12 с. Деп. в ВИНИТИ 07.02.97, N 383-В97.

101. Ворохобко Ю.А., Лебедев А.Л. К теории построения оптимальных регуляторов в колебательных системах при неполной информации // Изв. АН СССР. Техн. кибернет. 1991. - N 6. - с. 87-93.

102. Stoorvogel Anton A., Saberi АН, Chen Ben М. Full and reduced-order observer-based controller design for ^-optimization // Int. J. Contr. -1993. 58, N 4. - c. 803-834.

103. Мартьянов А.С. Динамический метод невязки в задаче реконструкции входов при неполной информации //Ж. вычисл. мат. и мат. физ. 2005. 45, N 2.

104. Короткий А.И. О динамической реконструкции управлений и параметров в условиях неполной информации о системе // Дифф. уравн. -1999. 35, N 11, с. 1482-1486.

105. Newmann М.М. Optimal and suboptimal control using an observer when some of the state variables are not measurable // Int. J. Contr. 1969. -AC - 9. - N 3. - p. 281 -290.

106. Sarma V. V.S., Deekshatulu B.H. Optimal control when some of the state variables are not measurable // Int. J. Contr. 1968. v. 7. - N 3. - p. 251 -256.

107. Bensoussan A., J.H. van Schuppen Optimal control of partially observable stochastic systems with an exponential-of-integral perfomance index 11 SIAM J. Contr. 1985. - v. 23. - N 4.

108. Малышев В.В., Кибзун А.И. Новые методы высокоточного управления летательными аппаратами. М.: Машиностроение, 1987.

109. Сиротин А.И. Об условиях разрешимости класса задач управления дискретными системами с аддитивными случайными возмущениями // Изв. РАН. Теория и системы управления. -2003.- N 3. с. 17-29.

110. Соколов С.В., Щербень И.В. Синтез оптимального управления динамическими структурами // Прикл. матем. и мех. (Москва). -1999. 63, N 2 - с. 231-236.

111. Саг Xiu-Shan, Han Zheng-Zhi, Tang Hou-Jun Control Lyapunov stabilization of nonlinear systems with structural uncertainty // J. Shanghai Jiaotong Univ. Sci. 2005. - 10, - N 1, - p. 21-24.

112. Imai H. Robust output regulation for linear systems with structured uncertainly // Int. J. Contr. 1997. - 66, N 4. - c. 499-515.

113. Черноусъко Ф.Л. Оценка множества достижимости линейных систем с неопределенной матрицей // Докл. РАН. 1996. - 349, N 1. - с. 32-34.

114. Bismut J.M. Linear quadratic optimal stochastic control with random coefficients // SIAM J. Contr. 1976. - v. 14. - N 3.

115. Flemming W.H. Optimal control of partially observable diffusions // SIAM J. Control. 1968. т. 6. N 2.

116. Моисеев H.H. Численные методы в теории оптимальных систем., М.: Наука, 1971.

117. Беллман Р., Калаба Р. Квазилинеаризация и нелинейный динамический анализ // М.: Мир, 1968.

118. Семёнов В.В., Пантелеев А.В., Руденко Е.А., Вортаковский А.С. Методы описания, анализа и синтеза нелинейных систем управления. -М.: Изд-во МАИ, 1993. 312 с.

119. Крылов И.А., Черноусько Ф.Л. О методе последовательных приближений для решения задач оптимального управления. // Журнал вычислительной математики и математической физики. 1962, т. 2, N 6.

120. Савастюк С.В., Хрусталёв М.М. Оптимизация стохастических систем диффузионного типа с ограничениями на процесс управления-наблюдения // АиТ 1991. N 7,8.

121. Пантелеев А.В., Jlemoea Т.А., Вортаковский А.С. Оптимальное управление в примерах и задачах // М.: МАИ, 1992.

122. Киреев В.И., Пантелеев А.В. Численные методы в примерах и задачах.// М.: МАИ, 2000.

123. Малышев В.В. Спутниковые системы мониторинга, М.:, Наука, 2000.

124. Белецкий В.В. Движение искусственного спутника относительно центра масс, М.: Наука, 1965.

125. Белецкий В.В. Движение спутника относительно центра масс в гравитационном поле, М.: Наука, 1975.

126. Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами, М.: Машиностроение, 1987.

127. Румянцев Д.С., Хрусталёв М.М. Оптимальное управление квазилинейными системами диффузионного типа при неполной информации о состоянии // Изв. РАН. Теория и системы управления. 2006. - N 5. - с. 43-51.

128. Румянцев Д.С., Хрусталёв М.М. Численные методы синтеза оптимального управления для стохастических динамических систем диффузионного типа // Изв. РАН. Теория и системы управления. -2007. N 3. - с. 27-38.

129. Румянцев Д. С. Компьютерная программа расчёта оптимального управления квазилинейными системами диффузионного типа при информационных ограничениях // Промышленные АСУ и контроллеры 2007. - N 9. - с. 28-32.

130. Хрусталёв М.М., Румянцев Д. С. Синтез стратегий оптимального управления гибким спутником при информационных ограничениях // Вестник МАИ. 2008. - т. 15. - N 2. - с. 147-154.

131. Хрусталёв M.M., Румянцев Д. С. Оптимизация конструкции квазилинейного демпфера колебаний самолета при взлете и посадке // Тезисы докладов 3-ей Международной конференции "Авиация и космонавтика-2004", г. Москва, 2004. 1 с.