автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Диссипативность стохастических систем с функцией накопления, чувствительной к рискам
Автореферат диссертации по теме "Диссипативность стохастических систем с функцией накопления, чувствительной к рискам"
МАЗУРОВ АЛЕКСАНДР
На правах рукописи
ЮРЬЕВИЧ
ДИССИПАТИВНОСТЬ СТОХАСТИЧЕСКИХ СИСТЕМ С ФУНКЦИЕЙ НАКОПЛЕНИЯ, ЧУВСТВИТЕЛЬНОЙ К РИСКАМ
05.13.01 — Системный анализ, управление и обработка информации
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
- 3 ДЕК 2009
Нижний Новгород — 2009
003486056
Работа выполнена в. Арзамасском политехническом институте (филиале) Нижегородского государственного технического университета им.
Р. Е. Алексеева.
Научный руководитель:
доктор физико-математических наук, профессор Пакшин Павел Владимирович.
Официальные оппоненты:
доктор физико-математических наук, профессор Баландин Дмитрий Владимирович; кандидат физико-математических наук Бовырин Александр Владимирович.
Ведущая организация:
Институт проблем управления им. В.А.Трапезникова РАН (Москва).
Защита диссертации состоится 24 декабря 2009 г. в 14 часов на заседании диссертационного совета Д212.165.05 при Нижегородском государственном техническом университете им. Р. Е. Алексеева по адресу: 603950, Нижний Новгород, ул. Минина, 24, НГТУ, корпус 1, аудитория 1258.
С диссертацией можно ознакомиться в научно-технической библиотеке Нижегородского государственного технического университета им. Р.Е.Алексеева. ' ,
Автореферат разослан 18 ноября 2009 г.
Ученый секретарь диссертационного совета
кандидат технических наук
Общая характеристика работы
Объект исследования — аффинные по управлению дифференциальные системы Ито с квадратичной по управлению функцией запаса.
Предмет исследования — решение задачи обеспечения диссипативно-сти с функцией накопления, чувствительной к рискам, а также разработка основанного на данном свойстве диссипативности подхода к решению задач синтеза законов управления аффинными по управлению (детерминированными и стохастическими) системами с квадратичными по управлению критериями качества.
Актуальность темы. Теория чувствительности к рискам предложена в начале 1970-ых гг. D. Н. Jacobson и на сегодня является одним из интенсивно развивающихся направлений стохастической теории оптимального управления. Использующийся в теории экспоненциальный критерий качества позволяет строить регуляторы, зависящие от величины внешних возмущений, что обеспечивает определенные преимущества над классическими регуляторами в задачах управления. Модели с экспоненциальным критерием качества были эффективно применены в прикладных задачах наведения ракет, планирования производства в стохастических производственных системах, а также в групповых задачах и экономических задачах, что и предопределило название теории. В последние годы получен ряд результатов, на основании которых можно утверждать, что чувствительность к рискам связывает стохастический и детерминированный подходы к моделированию возмущений. Это дает возможность использовать теорию для синтеза систем управления с различными показателями качества.
С другой стороны, в современной теории управления достаточно широкое распространение приобрела теория диссипативности. Понятие дисси-пативной системы было заимствовано из физики; на языке физиков дис-сипативность означает склонность системы к потерям энергии, переданной ей из внешней среды. Математическая теория диссипативности впервые разработана J. С. Willems для детерминированных неавтономных систем
x(t\) = <М,/о,*о,и(0). y{tx) = r(x(h),u(t)),t е [Mo],
где х,и,у — векторы состояния, управления и выхода, а ф и л суть переходная функция и функция выхода. Теория характеризует поведение системы (1) на языке «вход»-«выход» с помощью т.н. функций запаса (обобщенная внешняя энергия) и накопления (обобщенная внутренняя энергия), которые для диссипативной системы удовлетворяют неравенству
5(*о) + [ ^{и(з),у{в))йв > Я^О (2)
Jto
(неравенство диссипации). Здесь 5(х) и т(и,у) — функции накопления и запаса, соответственно. Конкретные свойства диссипативной системы зависят от выбора функции запаса. Детерминированная теория диссипа-тивности была использована для решения задачи стабилизации (в т.ч. частичной), задачи устойчивости в смысле вход-выходных соотношений, задачи синтеза управления, обеспечивающего синхронизацию колебаний. Известны многочисленные примеры применения детерминированной теории диссипативности в прикладных задачах управления, в частности, задачах управления механическими и электротехническими системами (роботы, электрические двигатели и преобразователи), задачах управления судами, дизельными двигателями, химическими процессами, энергосистемами. Позднее несколько исследователей предложили варианты обобщения этой теории на класс стохастических систем управления, благодаря чему были решены актуальные задачи современной теории управления: для стохастических систем — стабилизация, синтез Иъ- и 7^оо-управления, синтез эргодического управления, синтез робастного управления, а для детерминированных систем — робастная одновременная стабилизация множества систем с неопределенными параметрами.
Тем не менее, в известных подходах к стохастической диссипативности не рассматривались зависимости функций накопления от интенсивности внешних возмущений («рисков»), моделируемых, как правило, с помощью винеровских процессов. Представляется актуальным объединение свойств чувствительности к рискам и диссипативности, т. е. обеспечение диссипативности с неотъемлемым свойством чувствительности к рискам функций накопления, а также исследование того, что может дать указанное свойство в задачах синтеза управления детерминированными и стохастическими системами.
Цель работы заключается в расширении классического свойства дис-синативности J. С. Willems на стохастические системы управления с естественной чувствительностью к рискам функций накопления, а также в разработке методов решения задач синтеза управления (детерминированными и стохастическими) системами по принципу сравнения со стохастической системой, обладающей указанным свойством диссипативности.
Задача исследования заключается в:
• обеспечении свойства диссипативности с функцией накопления, чувствительной к рискам, для аффинной по управлению дифференциальной системы Ито с квадратичной по управлению функцией запаса;
• выводе конструктивных критериев диссипативности с функцией накопления, чувствительной к рискам, для аффинной по управлению дифференциальной системы Ито с квадратичной по управлению функцией запаса;
• применении критериев диссипативности с функцией накопления, чувствительной к рискам, в задачах синтеза управления аффинными по управлению (детерминированными и стохастическими) системами с квадратичными по управлению критериями качества по принципу сравнения с аффинной по управлению дифференциальной системой Ито, обладающей указанным свойством диссипативности.
В качестве «классического» случая исследуются линейные дифференциальные системы Ито с функцией запаса в виде квадратичной формы, поскольку на сегодняшний день создано мощное программное обеспечение для решения линейных матричных уравнений и неравенств в среде MATLAB.
Методы исследования, применяемые в работе, относятся к теории стохастических дифференциальных уравнений, теории вероятностей, математической теории управления, теории матриц, теории дифференциальных игр и теории функционального анализа. Используются современные средства компьютерного моделирования.
Научная новизна.
1. Исследована и решена задача обеспечения диссипативности с функцией накопления, чувствительной к рискам (ФНЧР), для аффин-
ных по управлению дифференциальных систем Ито с квадратичной по управлению функцией запаса, сформулированы и доказаны достаточные условия (критерии) диссипативности в указанном смысле в терминах решения обобщенных неравенств Гамильтона-Якоби-Беллмана.
2. Доказаны связи свойства диссипативности с ФПЧР с инвариантной вероятностной мерой, чувствительностью к рискам, детерминированным "Ноо-управлснием, а также дифференциальными (детерминированными и стохастическими) играми.
3. Предложен единый подход к решению следующих задач управления:
а) задачи стабилизации стохастической аффинной по управлению системы в смысле существования единственной инвариантной вероятностной меры (задачи обеспечения эргодичности);
б) задачи синтеза субоптимального, чувствительного к рискам управления стохастической аффинной по управлению системой с экспоненциальным квадратичным по управлению критерием качества;
в) задачи ослабления возмущений для детерминированной аффинной по управлению системы с квадратичным по управлению критерием качества.
Подход использует принцип сравнения со стохастической аффинной по управлению системой, обладающей свойством диссипативности с ФНЧР с квадратичной по управлению функцией запаса.
Практическая ценность и рекомендации по использованию результатов. Полученные в диссертационной работе результаты могут использоваться для решения широкого круга практических задач синтеза динамических систем управления, как детерминированных, так и стохастических, с позиций теории диссипативности. Кроме того, представленный в данной работе подход и ее результаты расширяют традиционные сферы применения свойства диссипативности, свидетельствуя об его универсальности
при решении задач теории управления, и открывают перспективы для дальнейших исследований природы диссипативности. В линейно-квадратичном случае конечные результаты исследования сформулированы на языке линейных матричных неравенств и допускают эффективную проверку с помощью прикладного программного обеспечения среды МЛТЬЛВ, что предоставляет определенные преимущества при решении практических задач.
Достоверность и обоснованность положений диссертационной работы подтверждается строгим математическим выводом полученных соотношений, а также доказательством приведенных утверждений.
Личным вкладом соискателя в диссертацию и совместные публикации является формирование подхода к решению рассматриваемых задач, формулирование и доказательство теоретических результатов, разработка программного обеспечения, реализующего и иллюстрирующего данные результаты. Научному руководителю, д.ф.-м.н., проф. П. В. Пакшину, принадлежат постановки задач и общая схема исследования.
Апробация работы. Основные положения диссертации докладывались и обсуждались на VI Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2007); III Всероссийской молодежной конференции rio проблемам управления (ВМКПУ-2008) (Москва, 2008); XIV Всероссийской научно-технической конференции «Информационные системы и технологии (ИСТ-2008)» (Нижний Новгород, 2008); VII Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2008); IV Всероссийской школе-семинаре молодых ученых «Проблемы управления и информационные технологии (ПУИТ-2008)» (Казань, 2008); VIII Всероссийской научной конференции «Нелинейные колебания механических систем» (Нижний Новгород, 2008); XV Международной конференции по автоматическому управлению «Автоматика-2008» (Одесса, Украина, 2008); XV Всероссийской научно-технической конференции «Информационные системы и технологии (ИСТ-2009)» (Нижний Новгород, 2009); VIII Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2009); I Традиционной Всероссийской Молодежной Летней Школе «Управление, информация и оптимизация» (Переславль-Залесский, 2009).
Доклад на конференции «Будущее технической науки-2009» удостоен диплома второй степени. Диссертация удостоена диплома на Всероссийском конкурсе научных работ молодых ученых по теории управления и ее приложениям (Институт проблем управления им. В. А. Трапезникова РАН) за 2009 год в номинации аспирантов.
Публикации. По теме'диссертации опубликовано 12 работ, в том числе 2 статьи, из них 1 в журналах из перечня ВАК РФ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы, включающего 175 наименований. Работа изложена на 123 страницах, содержит 15 иллюстраций.
Работа выполнена при финансовой поддержке РФФИ (грант №08-01-97036_а).
Содержание работы
Во введении обоснована актуальность выбранной темы и сформулированы цель и задачи исследования.
В первой главе рассмотрены основные концепции современной теории чувствительности к рискам и связанные задачи управления.
Во второй главе приведен обзор современной теории диссипативности, включая становление детерминированной теории и известные подходы к ее обобщению на стохастический случай с указанием полученных результатов.
В третьей главе представлен новый подход к обобщению детерминированной диссипативности на класс аффинных по управлению дифференциальных систем Ито с квадратичной по управлению функцией запаса, благодаря которому получены функции накопления, чувствительные к рискам. В явном виде решена задача обеспечения диссипативности с ФНЧР и сформулированы достаточные условия диссипативности с ФПЧР. Как частный случай, рассмотрены линейные системы с функциями запаса в виде квадратичных форм, для которых получены критерии на языке линейных матричных неравенств, допускающие эффективную проверку с помощью современного программного обеспечения среды МЛТЬАВ. Даны примеры применения предложенных критериев в линейно-квадратичном случае.
Рассмотрим аффинную систему управления, заданную стохастическим дифференциальным уравнением Ито:
где € К" — вектор состояния, щ е Кр — вектор управления, Щ — стандартный т - мерный винеровский процесс па вероятностном пространстве (П,^,Р) с естественной фильтрацией ^¡У ^ 0), порожденной процессом УУ; до момента £ включительно. Символ е суть положительный параметр1, начальное состояние х детерминированное; /ь /2 и £> — заданные вектор-функция и матрицы-функции согласованных размерностей, соответственно.
Требуется определить, при каких условиях данная система диссипатив-на относительно квадратичной функции запаса2
а функции накопления чувствительны к вариациям параметра е.
Сформулированная задача является весьма нетривиальной; в результате естественного обобщения идей J. С. Willems на стохастические системы (3)—(4), т.е. такого обобщения, когда неравенство диссипации (4) без принципиальных модификаций выполняется в математическом ожидании относительно начальных условий системы (3), требуемые свойства чувствительности функций накопления к вариациям интенсивности е получены быть не могут. Покажем это, разобрав свойство диссипативности с функцией накопления без рисков.
Введем обозначение f(x,u) = f\{x) hix)u и будем считать функцию / непрерывной по переменным х,и. Пусть щ принадлежит классу U марковских относительно случайных процессов таких, что при щ € U существует единственное сильное решение Xt уравнения (3), которое является марковским процессом относительно Tt■ В частности, переменная щ мо-
'Параметр с следует рассматривать как интенсивность случайных возмущений {рисков), моделируемых с помощью винеровского процесса W,.
2J. С. Willems рассматривал фуикции запаса, зависящие от входных и выходных переменных — см. (2). Поскольку, как правило, выходная переменная определяется входным сигналом и состоянием, мы можем без всякой потери общности рассматривать функции запаса, зависящие от векторов х, и щ.
(
dxt = [/i(x() f2(xt)ut]dt eD(xi)d\Vt, xq = x, t e [0, +00)
(3)
L(xt, ut) = L0{xt) + \ui\2, Lo(xt) ^ 0,
(4)
жет быть марковским управлением щ = tp(xt), функция <р непрерывна. Предположим справедливость условий:
1). для любого fe = 1,2,... существует скаляр hk > 0 такой, что выполняется неравенство \f(x,<p(x)) — f(y,ip{y))\+e\D{x) — D(y)\ ^ hk\x -у\ для всех х,у € R", \х\ V |г/| < k (условие Липшица);
2). существует скаляр h > 0 такой, что неравенство \f(x, <р(х)) + sD(x)\ ^ h( 1 + |х|) справедливо для всех х £ Ж"
(условие линейного роста)',
3). неравенство D(x)Dr(x) > 0 верно для всех х € К" (условие эллиптичности).
Условия 1)-2) достаточны для существования единственного сильного решения (3), которое представляет собой марковский процесс в пространстве состояний М". При указанных условиях ии = ip(x) класс U ^ 0. Если верно условие 3), то система в локальном смысле управляема процессом Wf. Это существенно: мы говорим о (не)чувствителыюсти к рискам, и система должна быть зашумлена постоянно действующими возмущениями.
Обозначим через Ф|г([0, i],множество всех марковских управлений щ € U таких, что ИиИф^о,*]) = Е* J0' |и5|2 ds < +оо при произвольном 0 ^ t < +оо. Здесь Е* — оператор условного математического ожидания при начальном условии хо = я. Таким образом, Ф|-(о) задает множество допустимых управлений. Будем считать, что функция запаса (4) для любого допустимого управления ut удовлетворяет условию Ех /0 |Z.(xs, и5)| ds < +оо при любом 0 ^ t < со.
Определение 1. Система (3) с функцией запаса (4) называется диссипативной на [0,+оо) с функцией накопления без рисков, если существуют неотрицательная непрерывная функция накопления V : R" —> К+ и неотрицательная непрерывная функция увеличения запаса А*6' : R" —> Ж.+ такие, что интегральное неравенство диссипации
WV{xt) < V(x) + F/jf' [l(xs, Us) + Af>w] ds (5)
выполняется для любых 0 ^ t < +оо и всех решений системы (3) с допустимым управлением и начальным условием xq = х е К".
Предложенное определение — .один из вариантов естественного расширения определения детерминированной диссипативности J. С. Willems на стохастический случай. Новым по сравнению с известными определениями является использование функции увеличения запаса А{е) в подынтегральном выражении неравенства диссипации. Функция служит для учета шумового воздействия при передаче внешнего запаса в систему, название данной функции отражает се смысл.
Положим С2(М";Ж+) — множество дважды непрерывно дифференцируемых неотрицательных функций V : R" —> В данной главе сформулированы и доказаны следующие достаточные условия диссипативности с функцией накопления без рисков.
Теорема 1 (критерий диссипативности с функцией накопления без рисков). Пусть существует неотрицательная непрерывная функция V(x) € С2(К"; ), удовлетворяющая неравенству Гамильтона-Якоби-Беллмана (НГЯБ):
Vx(x)h(x) - L0(x) + А\Vx(x)f2(x)\2 < 0, х е R". (6)
Зная V, построим следующие функции:
= fr [VMD(x)Dt{x)] , (7)
Ш = \fIix)Vj(x). (8)
Тогда система (3)-(4) диссипативна на [0,+оо) с функцией накопления V без рисков, причем функция увеличения запаса и марковское управление, обеспечивающее указанную диссипативность, определяются (7) и (8).
Параметр е не включен в НГЯБ (6), и функции накопления не зависят от его величины. Для получения требуемых свойств чувствительности необходимо качественно модифицировать неравенство диссипации (5).
Рассмотрим неравенство:
F/ ехр (xt) < ехр У(е)(х) + Е* j* [b{xs, ИД + Л<с)(xs)] ехр Vй (xs)ds. (9)
Определение 2. Система (3)-(4) называется диссипатшной на [0, |~оо) с функцией накопления, чувствительной к рискам (ФНЧР), если существуют неотрицательная непрерывная функция накопления 1/<0 : К" -> К+ и неотрицательная непрерывная функция увеличения запаса А^ : М" —» такие, что неравенство (9) выполняется для любых 0 ^ / < + оо и всех решений системы (3) с допустимым управлением и начальным условием Ха — х € К".
Будем считать (9) интегральным неравенством диссипации с ФНЧР. Имеет место следующее утверждение.
Теорема 2 (критерий диссипативности с ФНЧР). Пусть для некоторого е > 0 существует неотрицательная непрерывная функция е С2(Е";К+) такая, что при х е М" верно обобщенное неравенство Гамильтона-Якоби-Беллмана (ОНГЯБ):
УрШх)-Щх) + \ |к(£)МЫ*)|2 -I- 2<Г2\у^(х)П(х)\2^ < 0. (10) По его решению построим следующие функции:
- ^ [У£(х)0(х)0Т(х)] , (11)
{е)М = ЫШе)Т(х). (12)
П 2
Тогда при интенсивности рисков е система (3)-(4) диссипативна на [0,+оо) с функцией накопления чувствительной к рискам, причем функция увеличения запаса и марковское управление, обеспечивающее диссипативность с указанной функцией накопления, определяются формулами (11) и (12).
Принципиально важно, что ОНГЯБ (10) для стохастической диссипативности в новой трактовке (9) с использованием экспоненциальной функции отличается от НГЯБ (6) для стохастической диссипативности без рисков (5) дополнительным слагаемым ^ У^(х)0(х) , которое включает интенсивность рисков е. Получены явные зависимости функции накопления и управления, обеспечивающего диссипативность в новой трактовке, от интенсивности е, выраженные соотношениями (10), (12). Данный результат
позволяет говорить о чувствительности к рискам функций накопления (и соответствующего управления) при диссипативности в форме (9); подобные свойства в рамках известных обобщений стохастической диссипативности ранее не были выведены и образуют новую концепцию диссипации.
В третьей главе также рассмотрен классический для теории управления, линейно-квадратичный случай:
/,(*,) = Ахи ЬЫ) = В, П(х1] = О, Ц(Х1) = х10х1, 0. (13)
При конечном параметре е и управлении и = <р(х) = Кх, где К — некоторая матрица, условия 1)-2) очевидны. Если матрица Д ^ 0, то справедливо и условие 3). С практической точки зрения важны не обращающиеся в нуль функции /-оМ; далее будем считать <3 > 0. В этом случае функция накопления есть неотрицательно-определенная квадратичная форма
= 2(£) = г(с)Т > 0, (14)
которая принадлежит С2(К";Е+). ОНГЯБ (10) сводится к обобщенному квадратичному матричному неравенству Риккати (ОКМНР)
Лт2(е) I 7{е)Л -<Э-г{€\ВВт + 2е2Ш Vй < 0 (15)
относительно Функция (11) превращается в константу:
4е}(*) = £2ь[г<е>олт]. (16)
Управление (12), которое обеспечивает диссипативность системы (3)-(4), (13) с функцией накопления (14), чувствительной к рискам, определяется
и = Вт1®х = у^М- (17)
ОКМНР (15) трансформируется в линейную структуру благодаря стандартной Теореме Шура. Поскольку ВВТ 2е2ООт > 0, (15) эквивалентно
7^ (ВВТ + 2 е2ООт)~1
> 0, 2(£) = > 0. (18)
Таким образом, исследователь может с легкостью установить, является ли конкретная система (3)-(4), (13) диссипативной с функцией накопления (14), чувствительной к рискам, а также вычислить функцию увеличения запаса (16) и марковское управление (17), обеспечивающее диссипативность, с помощью современных решателей ЛМН. В диссертации для
решения ЛМН применяются интерфейс УАЬМ1Р и решатель БеБиМ!, созданные для среды МАТЬАВ.
Для системы (3),(4),(13) при диссипативности с функцией накопления без рисков (5) имеют место аналоги формул (10)-(12):
В четвертой главе устанавливается связь диссипативности с ФНЧР с чувствительностью к рискам, а также с дифференциальными играми и ^(»-управлением. Показано, что свойство диссииативность с ФНЧР имеет отношение к свойству эргодичности. Благодаря установленным связям предлагается единый подход к решению задач синтеза систем различной структуры и расширяется круг задач управления, допускающих решение с позиций свойства диссипативности. Приведены примеры для линейно-квадратичного случая.
На практике часто представляет интерес задача обеспечения эргодичности (задача стабилизации стохастической системы в смысле существования и единственности инвариантной вероятностной меры). Рассмотрим задачу обеспечения эргодичности управлением и = <р{х) случайного процесса, определяемого (3). Пусть в является сг-алгеброй борелевских множеств К", а -к{1,х,С) ~ переходной функцией процесса (3) при и — ф(х). Инвариантная мера процесса (3) при и = <р(х) (если таковая существует) определяется формулой
и обладает тем свойством, что из равенства е С} = /л<ДС), ^ > О следует равенство Р{л:г еС} = т > Будем считать, что если мера
(19) существует, то удовлетворяет условию Е^{|х|2} = /н„ |х|2/х^(с(д;) < 4-оо.
Предположим, что решение неравенства (10) в некотором шаре {х : \х\ > г} удовлетворяет условию
лтг+гл-<э -\ гввтг < о,
и в77.x — (,32 (х).
(19)
У{е)(*) ^ О,
а также
В данной главе доказано следующее утверждение.
Лемма 1. Допустим, что при некотором е > 0 справедливо обобщенное неравенство Гамильтона-Якоби-Ееллмана (70) для функции V(е) £ С2(№л;Е'). Зная его решение построим функции (11) и (12). Кроме того, допустим, что функция Lo(x) для достаточно больших х удовлетворяет неравенству3
j\V^(x)D(x) |2 ^ l + fr^WßWD^Wl+LoW + llV^W^WI2. (20)
Тогда при управлении (12) существует единственная инвариантная мера (19) случайного процесса, определяемого (3).
В линейно-квадратичном случае (13) ограничение (20) на рост функции Lq(x) выполняется при достаточно больших х, если и только если матрица Q такова, что
О < Q < Z(i)(2e'1DDT -BBT)Z<£>. (21)
Лемма 1 связывает диссипативность с ФНЧР и инвариантную вероятностную меру.
Перейдем к корреляции диссипативности с ФНЧР и чувствительности к рискам. Рассмотрим аффинную стохастическую систему
f dxt = [/!(*,) + h{xt)ut\dt + D(xt)dWt, (22) .
| xa — x, t 6 [0, oo).
Объект (22) — частный случай модели, изученной Т. Runolfsson. Обозначения совпадают с (3). Для управления и = и(х) и заданного скаляра 7 > О определим чувствительный к рискам критерий качества
J(u) = lim ilnE'exp С (IM + • (23)
I \Т JО J
Требуется минимизировать (23) на множестве допустимых управлений U:
J* = inf J(u). (24)
ueU
3Привсдстюс условие — ограничение на рост функции La(x).
Пусть f{x,u) = /1 (jc) -f- /2(x)w удовлетворяет условию Липшица no x,u:
3kuk2>0: If(x,u) -f(y,v)I ^h\x~y\-Vk2\u-v\ Vx,y £ R", Vu,v e Mp.
Предположим, что функция D(x) удовлетворяет условию Липшица по х, а функция L(x,u) = Lq{x) + \и\2 непрерывна по х и и, ограничена снизу и обладает тем свойством, что множества {(х, и) : L{x, и) < k} компактны для каждого k £ (0,00).
Рассмотрим автономную версию системы (22) при f(x,u) = }{х) и будем считать, что выполнены следующие условия:
Л1). Марковский процесс х;, определенный соотношением (22) при [(х,и) = f(x), имеет единственную инвариантную меру /л;
Л2). Для любого открытого множества С с Rn переходная функция ir(t,x,C) указанного процесса xt удовлетворяет условию Нт,_>со || 7г(f, ■, С) - ц{С) ||2= 0;
ЛЗ). Существует величина т> 0 и функция q(r,x,y) такие, что:
i) q(r,x, у) > 0 для ц и почти всех у е R",
ii) -к(т,х, dy) = q(r,x,y)ii(jdy),
iii) для любого скаляра е > 0 существует скаляр 5 > 0 такой, что
|| q(r,x, ) - q(r,x,-) ||i= /R„ |q(r,x,y) ~ q{r,x,y)\n{dy) < e при \x — x\ < 6.
Определим класс Ö как функции u(x) : R" — > Rp такие, что:
a). u(x) удовлетворяет условию Липшица;
b). для замкнутой системы (22) с управлением и(х) верны Л1)-Л3);
c). J{u) существует для любого начального состояния х.
Пусть и G Ü. Определим вспомогательную стохастическую систему
dxvt = [/(*?, u(xD) + D{xvt)v{x\)\di -t- D(x»)dWt, (25)
где v : R" R4. Обозначим через Aa,v производящий оператор процесса (25), через £u — множество тех v при фиксированном и, для которых
существует мера ри<и и счетное плотное всюду множество Qu G С2(Ж") такие, что соотношение
/ (Au,vh){x)nu,v{dx) = о
J Н"
справедливо для всех h G Qu. Сделаем дополнительное предположение:
d). для замкнутой вспомогательной системы (25) с управлением и(х) £ О существует неотрицательная функция w G C2(R") такая, что
i) lim^|...>0Q w(x) -- оо равномерно по |х|;
ii) равномерно по v G £u : lim|x(_100 (х) = -со.
Закон управления и(х), удовлетворяющий условиям a)-d), будем называть допустимым и обозначать u G 15. Т. Runolfsson доказана следующая
Теорема 3. Для задачи (22)-(24) допустим справедливость условий а)~ d). Тогда верно равенство:
т - inf sup [ (\l{x, u(x)) - putv{dx). (26)
DeS„ J®" \T 1 J
Таким образом, задача синтеза оптимального управления (22)-(24) эквивалентна стохастической дифференциальной игре (26), (25). Выражение (26) можно записать в виде
J* - inf sup \ли^ф(х) + \Цх, и) - Ых)\Л , (27)
I 71 г J
а оптимальные стратегии равны
■о* = 0Т(х)фТх(х), (28)
и" = - (29)
где ^(а:) — цена данной игры, принадлежащая области определения Au,v. В четвертой главе показано, что при замене переменных
ф{х) = \v{x), (30)
(27) сводится к
\Ух(х)ЬШ2 - ~\Ух(х)0(х)\2
- О, (31)
7
Г = \1г[Ухх(х)0(х)йт(х)}. (32) 7
Закон управления (29) принимает вид
= -\Ц{х)УтЛх). (33)
Если мы ослабим (31) до нестрогого неравенства
1 < 0 (34)
Н(хШх)+10(х)
ЩхШх)\2 - ~\%(х)П(х)\'
Г
и на основе решения У(х) неравенства (34) построим функции ^7* и и* по формулам (32)—(33), то получим субоптимальиос решение <?(и*) < ^7*. В четвертой главе сформулирована и доказана
Теорема 4. Предположим, что выполнены условия критерия диссипа-тивности с ФНЧР, причем функция Ьо(х) удовлетворяет условию
0<10М<||1/(е)М/2(Х)|2. (35)
Кроме того, допустим справедливость условий Теоремы 3 в отношении задачи (22)-(24), а также положим
7 = е-1. (36)
Тогда функция увеличения запаса (И) и марковское управление (12), обеспечивающее диссипативность системы (3)-(4) с ФНЧР, определяют согласно формулам
и* = (37)
Г = 2А^ (38)
как субоптимальное решение задачи синтеза оптимального, чувствительного к рискам управления (22)-(24), так и субоптимальную стратегию и субоптимальную цену стохастической дифференциальной игры (26) для вспомогательной системы (25).
Формулы (35)-(38) устанавливают связь диссинативности с ФНЧР с чувствительностью к рискам и стохастическими дифференциальными играми. В линейно-квадратичном случае (13) указанные связи сохраняются, формулы аналогичны приведенным ранее. Условие (35) сводится к
О <<2 ^^ВВ7^'. (39)
Свойство диссинативности с ФНЧР может служить для синтеза робаст-ного 7^00-управления. Рассмотрим детерминированную аффинную систему:
i ¿(0 = /,(*(/)) + [2(x(t))u(t) + D(x(t))№. (40)
| х(0) =-- xq ~j- 0, t £ [0,оо),
где х,и,£ — векторы состояния, управления и возмущения, заданные на гильбертовых пространствах Г^.Г^Г^ с размерностями n,k,l. Состояние xq произвольно (дополнительное возмущение). Для (40) введем критерий качества
/>00
Х(Ы,0 = / (¿o(*(s))-Mu(s)lVs. ¿о ^ о (41)
j о
Необходимо для заданного скаляра -у > 0 найти закон управления
и® = ^(х), (42)
такой, что при любых £ G Г{,*о G 1R" выполняется неравенство
^Ч£К72[||£||2-НОЫ], (43)
где qo{xo) > 0 — заданная функция, |]£|| = |^(s)|2iis — норма на Эта постановка принадлежит Т. Ba§ar, Р. Bernhard и называется задачей ослабления возмущений (задачей синтеза робастного 74сгуправления).
Т. Ва§аг и Р. Bernhard показали, что решение задачи (40)-(43) можно построить с помощью решения вспомогательной дифференциальной игры с мягким ограничением и нулевой суммой с функцией цены
lW(u,0-X(",0-72Hel|2-72io(xo). (44)
Первый игрок стремится минимизировать (44) с помощью стратегии и = г]^(х), в то время как второй — максимизировать (44) с помощью
стратегии £ = и^уЦх). Уравнение Лйзекса для верхнего значения игры (40), (41), (44) — функции — имеет вид
inf sup ■
dV
Ь)
[¡еГ„
ес-Г£
дх
-[/iW +/2 (х)и + -f -L(x,u) - flei2 - 0. (45)
Вместо уравнения Лйзекса (45) рассмотрим неравенство Лйзекса
т{ зир
8V
Ь)
иеГ„ £rTt I дх Оптимальные стратегии равны
lh(x) + k(x)u + Д (*)£] + L(x, и) - 72|$|2 < 0. (46)
1 dVb)T
1 ..-2n77 -aV
е = h~2DT(x)-
дх
1 яТ7(7)Г
а (46) трансформируется в dV(l) 1
.T/W
dV
дх
-k(x)
-7
av
(7)
дх
'П(х)
<0.
Если решение неравенства (49) удовлетворяет условию sup {y(7V) -7%to} - о,
хеЖа
(47)
(48)
(49)
(50)
то (48) — решение приведенной задачи ослабления возмущений.
В четвертой главе сформулировано и доказано следующее утверждение.
Теорема 5. Предположим, что выполнены условия критерия диссипа-тивности с ФНЧР, причем функция Ь0(х) удовлетворяет (35). Кроме того, допустим, что функция-решение ]/^(х) ОНГЯБ (10) удовлетворяет ограничению
(51)
sup
xeR'
а параметры ей 7 связаны
(7 л/2)-
(52)
Тогда марковское управление (12), обеспечивающее диссипативность системы (3)-(4) с ФНЧР, определяет согласно формуле
~ -<р? (53)
как решение задачи ослабления возмущений (40)-(43), так и субоптимальную стратегию детерминированной дифференциальной игры с мягким ограничением и нулевой суммой с функцией цены (44) для системы (40)-(41).
Теорема 5 устанавливает связь свойства диссипативности с функцией накопления, чувствительной к рискам, с детерминированными 11а0-унравлением и дифференциальными играми.
В линейно-квадратичном случае рассуждения о связи данных свойств по-прежнему имеют место. При этом
УЬ\х) = хТг^х, ч0(х) - хт<20х. (54)
_лл
Ограничение 5ирхеК„ -1Яо{х)} = 0 можно записать в форме
Т^о-^^О. (55)
Таким образом, на основании Леммы 1 и Теорем 4, 5 в четвертой главе диссертации предложен единый подход к решению стохастической задачи стабилизации в смысле единственной инвариантной вероятностной меры, стохастической задачи синтеза субоптймалыюго управления, чувствительного к рискам, а также детерминированной задачи ослабления возмущений. Фундаментом единого подхода служит свойство диссипативности с ФНЧР; используется принцип сравнения со стохастической системой, обладающей данным свойством диссипативности.
Четвертая глава также содержит примеры численной реализации предложенного подхода в среде МЛТЬАВ для линейно-квадратичного случая.
В заключении диссертации подведены итоги осуществленных исследований и намечены возможные направления дальнейшей работы.
На защиту выносятся
1. Решение задачи обеспечения диссипатипности с функцией накопления, чувствительной к рискам, как одной из вариаций обобщения классической диссипативности но J. С.Willems на класс аффинных по управлению дифференциальных систем Ито с квадратичными по управлению функциями запаса.
2. Связи свойства диссипативности с функцией накопления, чувствительной к рискам, со свойством чувствительности к рискам, дифференциальными играми и 7¿оо-управлением.
3. Использующий свойство диссипативности с ФПЧР единый подход к решению следующих задач управления:
а) стохастической задачи стабилизации аффинной по управлению системы в смысле единственной инвариантной вероятностной меры;
б) стохастической задачи синтеза субоптимального управления, чувствительного к рискам, для аффинной но управлению системы с экспоненциальным квадратичным по управлению критерием качества;
в) детерминированной задачи ослабления возмущений для аффинной по управлению системы с квадратичным по управлению критерием качества.
Список публикаций по теме диссертации
Статьи, опубликованные в рекомендованных ВАК изданиях
[1] Мазуров, А. 10. Диссипативность стохастических дифференциальных систем с функцией накопления, чувствительной к рискам, и задачи синтеза управления [Текст] / Л.Ю.Мазуров, II. В.Пакгаин // Известия РАН. Теория и системы управления. — 2009. — № 5. — С. 34-46.
Статьи, опубликованные в других изданиях
[2] Mazurov, A. Stochastic dissipativity with risk-sensitive storage function and related control problems [Текст] / Л. Mazurov, P. Pakshin // ICIC Express Lett. - 2009. - V. 3. - No. 1. - P. 53-60.
Материалы конференций
[3] Мазуров, Л.Ю. Диссипативныс динамические системы [Текст] / Л.Ю.Мазуров // Будущее технической науки. Тезисы докладов VI Международной молодежной научно-технической конференции. — II. Новгород: Изд-во НГТУ, 2007. - С. 82.
[4] Мазуров, А. 10. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам [Текст] / А. 10. Мазуров // Труды III Всероссийской молодежной конференции по проблемам управления ВМКПУ-2008. - М.: Изд-во ИПУ РАН, 2008. - С. 45-46.
[5] Мазуров, Л.Ю. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам [Текст] / Л.Ю.Мазуров // Информационные системы и технологии ИСТ-2008. Тезисы докладов XIV Международной научно-технической конференции. — II. Новгород: Изд-во НГТУ, 2008. -С. 231-232.
[6] Мазуров, Л. 10. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам [Текст] / Л. 10. Мазуров // Будущее технической науки. Тезисы докладов VII Международной молодежной научно-технической конференции. — II. Новгород: Изд-во НГТУ, 2008. - С. 48-49.
[7] Мазуров, А. 10. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам, и робастная Woo-стабилизация [Текст] / А.Ю.Мазуров // Проблемы управления и информационные технологии ПУИТ-2008. Материалы IV Всероссийской школы-семинара молодых ученых. — Казань: Изд-во КГТУ, 2008. — С. 264267.
[8] Мазуров, Л. 10. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам [Текст] / Л.Ю.Мазуров // Нелинейные колебания механических систем. Труды VIII Всероссийской научной конференции. — II. Новгород: Изд-во ИНГУ, 2008. — С. 231-236.
[9] Мазуров, Л.Ю. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам, и робастная 7^оо-стабилизация [Текст] / А. 10. Мазуров // Лвтоматика-2008. Материалы XV Международной конференции rio автоматическому управлению. — Одесса: Изд-во ОНМЛ, 2008. - С. 332-335.
[10] Мазуров, А. 10. Диссипативность дифференциальных систем Ито с функцией накопления, чувствительной к рискам, и стохастическая задача синтеза субоптималыюго управления [Текст] / Л.Ю.Мазуров // Информационные системы и технологии ИСТ-2009. Тезисы докладов XV Международной научно-технической конференции. — II. Новгород: Изд-во НГТУ, 2009. - С. 305-307.
[11] Мазуров, Л.Ю. Диссипативность систем Ито с функцией накопления, чувствительной к рискам, и дифференциальные игры [Текст] / А. 10. Мазуров // Будущее технической пауки. Тезисы докладов VIII Международной молодежной научно-технической конференции. — Н. Новгород: Изд-во НГТУ, 2009. - С. 81.
[12] Мазуров, Л.Ю. Диссипативность управляемых диффузионных процессов с функцией накопления, чувствительной к рискам, и синтез систем различной структуры [Текст] / Л. 10. Мазуров // Управление, информация и оптимизация. Тезисы докладов I Традиционной Всероссийской Молодежной Летней Школы. — М.: Изд-во ИПУ РАН, 2009. - С. 20-24.
Подписано в печать 10.11.2009 г. Формат 60x84/16. Усл. печ. л. 1,5. Бумага офсетная. Печать офсетная. Заказ 5608. Тираж 100. Отпечатано в ОАО «Арзамасская типография». 607220, Нижегородская область, г. Арзамас, ул. Пландина, 8.
Оглавление автор диссертации — кандидата физико-математических наук Мазуров, Александр Юрьевич
Введение
1 Современная теория чувствительности к рискам
1.1 Ключевые этапы развития.
1.1.1 Первые результаты.
1.1.2 Обобщение на другие классы систем и применение в прикладных задачах управления
1.1.3 Установление связей с детерминированной теорией ро-бастного Нсо-управления.
1.2 Выводы.
2 Современная теория диссипативности
2.1 Детерминированные системы управления.
2.1.1 Первые результаты.
2.1.2 Дальнейший прогресс теории.
2.2 Стохастические системы управления.
2.2.1 Стабилизация и £2-упРавление.
2.2.2 Мультидиссипативность и робастное управление.
2.2.3 Эргодическое управление.
2.2.4 Теория'Ноо-управления.
2.2.5 Одновременная стабилизация множества детерминированных систем с неопределенными параметрами
2.3 Выводы
3 Стохастическая диссипативность с функцией накопления, чувствительной к рискам
3.1 Основные результаты.
3.1.1 Диссипативность с функцией накопления без рисков
3.1.2 Диссипативность с функцией накопления, чувствительной к рискам
3.1.3 Линейная система с функцией запаса в виде квадратичной формы.
3.2 Примеры.
3.2.1 Скалярная линейная система с квадратичной функцией запаса.
3.2.2 Численная оценка верхней границы области допустимых интенсивностей в линейно-квадратическом случае
3.3 Выводы.
4 Диссипативность с функцией накопления, чувствительной к рискам, и задачи синтеза систем различной структуры
4.1 Основные результаты.
4.1.1 Задача стабилизации в смысле существования единственной инвариантной вероятностной меры.
4.1.2 Задача синтеза субоптимального управления, чувствительного к рискам, и стохастическая дифференциальная игра.
4.1.3 Задача ослабления возмущений и детерминированная дифференциальная игра.
4.2 Примеры.
4.2.1 Скалярная линейная система с квадратичной функцией запаса.
4.2.2 Линейная система с функцией запаса в виде квадратичной формы.
4.3 Выводы.
Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Мазуров, Александр Юрьевич
Данная диссертационная работа посвящена решению задачи обеспечения диссипативности с функцией накопления, чувствительной к рискам, для стохастических систем управления, а также основанному на этом свойстве единому подходу к решению задач синтеза законов управления детерминированными и стохастическими системами по принципу сравнения.
Актуальность темы. Чувствительность к рискам была введена в пионерской работе D. Н. Jacobson [90] при решении т. н. «задачи линейно-экспоненциально-квадратичного регулятора» (LEG problem). Оказалось, что использование экспоненциального критерия качества позволяет получить регулятор, который зависит от статистики (ковариационной матрицы) аддитивного гауссовского шума. Таким образом, «принцип полной эквивалентности» оптимальных управлений, который имеет место в задачах линейно-квадратичного регулятора и линейно-квадратичного регулятора с гауссовским шумом [41], не выполняется. Позднее новый регулятор был эффективно применен при решении прикладных задач наведения ракет [149], экономических задач [89], групповых задач (team problem) [150], задач «синтеза попятного регулятора» (backstepping controller design) [131] и синтеза адаптивной следящей системы (adaptive tracker) [39], а также задач планирования производства в производственных системах [174]. Именно благодаря экономической интерпретации это направление в теории управления получило название теории чувствительности к рискам.
Исследования 90-х гг. прошлого века показали, что теория чувствительности к рискам служит «мостиком» между стохастическим и детерминированным подходами к моделированию возмущений. В частности, в книге [44] доказано, что «задача ослабления возмущений» (disturbance attenuation problem), как один из примеров синтеза робастного управления детерминированными системами, эквивалентна дифференциальной игре «с мягким ограничением» (soft-constrained differential game). Стохастической альтернативой является указанная выше задача LEG, которая сводится к аналогичной игре. В результате дальнейшего анализа были установлены похожие связи между стохастическим и робастным подхо-дамр1 к задаче ослабления возмущений в более общих случаях (нелинейные системы или неквадратичные критерии качества) [64,166,167]. Связь задачи синтеза чувствительного к рискам управления и стохастических дифференциальных игр была выявлена авторами [137] и [44].
В настоящее время теория чувствительности к рискам представляет собой интенсивно развивающееся направление теории управления и достаточно мощный инструмент решения задач управления (см., например, [57,108,109]).
С другой стороны, в современной теории управления широкое распространение получила теория диссипативности. Понятие диссипативных систем было заимствовано из физики. Говоря физическим языком, диссипативная система теряет часть энергии, переданной ей извне (например, электрическая энергия рассеивается на резисторах в виде тепла)1. Математическая теория диссипативности была впервые предложена для детерминированных динамических систем J. С. Willems в работах [158,159]; было доказано, что диссипативность тесно связана с устойчивостью по Ляпунову. Дальнейшие исследования продемонстрировали эффективность теории диссипативности при решении задач стабилизации нелинейных детерминированных систем управления [26, 53, 56, 82, 85,124], а также при решении прикладных задач управления роботами [126], электрическими двигателями [58], электрическими преобразователями [145], судами [71], дизельными двигателями [94], химическими процессами [147], энергосистемами [133] и других задач.
Успехи детерминированной теории диссипативности привели в последние годы к интенсификации исследований по обобщению данной теории на стоха
Роль внутренней энергии в теории диссипативности выполняют функции накопления, в то время как роль внешней энергии, поступающей в систему — функции запаса. стические системы. Были предложены многочисленные варианты построения подобных обобщений, благодаря которым были развиты методы решения целого ряда задач управления: для стохастических систем — стабилизация [70] и синтез С.2-управления [35], синтез 7^2-управления и робастного управления [152], синтез эргодического управления [49], синтез Т^оо-управления [142,175], для детерминированных систем — робастная одновременная стабилизация множества систем с неопределенными параметрами [23, 24].
Таким образом, применение понятия диссипативности позволяет создать удобный математический аппарат для исследования и синтеза широкого класса динамических систем. Тем не менее, следует отметить, что ни в одной из предложенных вариаций обобщения классической диссипативности на стохастические системы явно не рассматривались зависимости функции накопления от интенсивности возмущений («рисков»), которые, как правило, моделируются с помощью винеровских процессов.
В связи с вышесказанным актуальным является объединение свойств диссипативности и чувствительности к рискам; это предполагает, с одной стороны, анализ возможности обобщения диссипативности на стохастические системы с неотъемлемой чувствительностью к рискам функций накопления, а также, в случае положительного результата, исследование того, что могут дать в задачах синтеза управления функции накопления, чувствительные к рискам.
Цель работы состоит в расширении классического свойства диссипативности по J. С. Willems на класс стохастических систем управления с естественной чувствительностью к рискам функций накопления, а также в разработке методов решения задач синтеза управления (детерминированными и стохастическими) системами по принципу сравнения со стохастической системой, обладающей указанным свойством диссипативности.
Задача исследования заключается в:
• обеспечении свойства диссипативности с функцией накопления, чувствительной к рискам, для аффинной по управлению дифференциальной системы Ито с квадратичной по управлению функцией запаса;
• выводе конструктивных критериев диссипативности с функцией накопления, чувствительной к рискам, для аффинной по управлению дифференциальной системы Ито с квадратичной по управлению функцией запаса;
• применении критериев диссипативности с функцией накопления, чувствительной к рискам, в задачах синтеза управления аффинными по управлению (детермииированными и стохастическими) системами по принципу сравнения с аффинной по управлению дифференциальной системой Ито, обладающей указанным свойством диссипативности.
В качестве «классического» случая исследуются линейные дифференциальные системы Ито с функцией запаса в виде квадратичной формы, поскольку на сегодняшний день созданы мощные программные средства для решения линейных матричных уравнений и неравенств в среде МАТЬАВ.
Методы исследования, применяемые в работе, относятся к теории стохастических дифференциальных уравнений, теории вероятностей, математической теории управления, теории матриц, теории дифференциальных игр и теории функционального анализа. Используются современные средства компьютерного моделирования.
Научная новизна.
1. Исследована и решена задача обеспечения диссипативности с функцией накопления, чувствительной к рискам (ФНЧР), для аффинных по управлению дифференциальных систем Ито с квадратичной по управлению функцией запаса, сформулированы и доказаны критерии диссипативности в терминах решения обобщенных неравенств Гамильтона-Якоби-Беллмана.
2. Доказаны связи свойства диссипативности с ФНЧР с инвариантной вероятностной мерой, свойством чувствительности к рискам, детерминированным Ноо-управлением, а также с дифференциальными (детерминированными и стохастическими) играми.
3. Предложен единый подход к решению следующих задач управления: а) задачи стабилизации стохастической аффинной по управлению системы в смысле существования единственной инвариантной вероятностной меры (задачи обеспечения эргодичности); б) задачи синтеза субоптимального, чувствительного к рискам управления стохастической аффинной по управлению системой с экспоненциальным квадратичным по управлению критерием качества; в) задачи ослабления возмущений для детерминированной аффинной по управлению системы с квадратичным по управлению критерием качества.
Подход использует принцип сравнения со стохастической аффинной по управлению системой, обладающей свойством диссипативности с ФНЧР с квадратичной по управлению функцией запаса.
Практическая ценность и рекомендации по использованию результатов.
Полученные в диссертационной работе результаты могут использоваться для решения широкого круга практических задач синтеза динамических систем управления, как детерминированных, так и стохастических, с позиций теории диссипативности. Кроме того, представленный в данной работе подход и ее результаты расширяют традиционные сферы применения свойства диссипативности, свидетельствуя об его универсальности при решении задач теории управления, и открывают перспективы для дальнейших исследований природы диссипативности. В линейно-квадратичном случае конечные результаты исследования сформулированы на языке линейных матричных неравенств и допускают эффективную проверку с помощью прикладного программного обеспечения среды МАТЬАВ, что предоставляет определенные преимущества при решении практических задач.
Достоверность и обоснованность положений диссертационной работы подтверждается строгим математическим выводом полученных соотношений, а также доказательством приведенных утверждений.
Личным вкладом соискателя в диссертацию и совместные публикации является формирование подхода к решению рассматриваемых задач, формулирование и доказательство теоретических результатов, разработка программного обеспечения, реализующего и иллюстрирующего данные результаты. Научному руководителю, д.ф.-м.н., проф. П. В. Пакшину, принадлежат постановки задач и общая схема исследования.
Апробация работы. Основные положения диссертации докладывались и обсуждались на VI Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2007); III Всероссийской молодежной конференции по проблемам управления (ВМКПУ-2008) (Москва, 2008); XIV Всероссийской научно-технической конференции «Информационные системы и технологии (ИСТ-2008)» (Нижний Новгород, 2008); VII Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2008); IV Всероссийской школе-семинаре молодых ученых «Проблемы управления и информационные технологии (ПУИТ
2008)» (Казань, 2008); VIII Всероссийской научной конференции «Нелинейные колебания механических систем» (Нижний Новгород, 2008); XV Международной конференции по автоматическому управлению «Автоматика-2008» (Одесса, Украина, 2008); XV Всероссийской научно-технической конференции «Информационные системы и технологии (ИСТ-2009)» (Нижний Новгород,
2009); VIII Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2009); I Традиционной Всероссийской Молодежной Летней Школе «Управление, информация и оптимизация» (Переславль-Залесский, 2009).
Доклад на конференции «Будущее технической науки-2009» удостоен диплома второй степени. Диссертация удостоена диплома на Всероссийском конкурсе научных работ молодых ученых по теории управления и ее приложениям (Институт проблем управления им. В. А. Трапезникова РАН) за 2009 год в номинации аспирантов.
Публикации. По теме диссертации опубликовано 12 работ, в том числе 2 статьи, из них 1 в журналах из перечня ВАК РФ.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения и списка литературы, включающего 175 наименований. Работа изложена на 123 страницах, содержит 15 иллюстраций.
Заключение диссертация на тему "Диссипативность стохастических систем с функцией накопления, чувствительной к рискам"
Выводы
Зависимость функций накопления от интенсивности случайных возмущений позволяет связать диссипативность с инвариантной вероятностной мерой, чувствительностью к рискам, дифференциальными играми и %оо-управлением.
Благодаря установленным связям решение задачи обеспечения диссипа-тивности с ФНЧР можно эффективно использовать при решении задач синтеза управления: стохастической задачи стабилизации в смысле единственной инвариантной меры, стохастической задачи субоптимального, чувствительного к рискам управления, а также детерминированной задачи ослабления возмущений. Для этого необходимо наложить дополнительные ограничения на функцию запаса. Таким образом, предложен единый подход к решению данных задач с позиций диссипативности. Как следствие, расширен круг задач, которые можно эффективно решать с помощью концепции диссипативности.
В линейно-квадратичном случае предложенный подход к решению вышеупомянутых задач синтеза управления значительно упрощается и допускает численное решение благодаря применению аппарата линейных матричных неравенств (ЛМН).
Заключение
В диссертационной работе получены следующие новые научные результаты.
1. Исследована и решена задача обеспечения диссипативности с функцией накопления, чувствительной к рискам, для аффинных по управлению дифференциальных систем Ито с квадратичной по управлению функцией запаса, доказаны критерии диссипативности в терминах решения обобщенных неравенств Гамильтона-Якоби-Беллмана.
В линейно-квадратичном случае конечные результаты сформулированы на языке линейных матричных неравенств, что позволяет применять современное эффективное программное обеспечение для численного решения задачи обеспечения диссипативности с функцией накопления, чувствительной к рискам.
2. Доказаны связи диссипативности с функцией накопления, чувствительной к рискам, с инвариантной вероятностной мерой, чувствительностью к рискам, детерминированным -управлением, а также с дифференциальными (детерминированными и стохастическими) играми.
3. В результате установленных связей предложен единый подход к решению следующих задач управления: а) задачи стабилизации стохастической аффинной по управлению системы в смысле существования единственной инвариантной вероятностной меры (задачи обеспечения эргодичности); б) задачи синтеза субоптимального, чувствительного к рискам управления стохастической аффинной по управлению системой с экспоненциальным квадратичным по управлению критерием качества; в) задачи ослабления возмущений для детерминированной аффинной по управлению системы с квадратичным по управлению критерием качества.
Подход использует принцип сравнения со стохастической аффинной по управлению системой, обладающей свойством диссипативности с функцией накопления, чувствительной к рискам, относительно квадратичной по управлению функции запаса.
Таким образом, расширен круг задач управления, которые допускают решение с позиций свойства диссипативности.
Актуальной задачей на ближайшую перспективу может стать обобщение новых результатов в трех направлениях: исследование в качестве объекта управления неаффинных дифференциальных систем Ито, либо аффинных дискретных стохастических систем, либо аффинных дифференциальных систем Ито со скачкообразным изменением структуры.
Библиография Мазуров, Александр Юрьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Баландин, Д. В. Синтез законов управления на основе линейных матричных неравенств Текст] / Д. В. Баландин, М. М. Коган. — М.: Физматлит, 2007.
2. Барабанов, Н. Е. Частотная теорема (лемма Якубовича-Калмана) в теории управления (обзор) Текст] / Н. Е. Барабанов, А. X. Гелиг, Г. А. Леонов и др. // Автоматика и телемеханика. — 1996. —№ 10. — С. 3-40.
3. Вентцель, А. Д. Курс теории случайных процессов Текст] / А. Д. Вентцель. — М.: Наука, 1996.
4. Дезоер, Ч. Системы с обратной связью: вход-выходные соотношения. Пер. с англ. Текст] / Ч. Дезоер, М. Видъясагар. — М.: Наука, 1983.
5. Демидович, Б. П. Лекции по математической теории устойчивости Текст] / Б. П. Демидович. — М.: Наука, 1967.
6. Дынкин, Е. Б. Марковские процессы Текст] / Е. Б. Дынкин. — М.: Физмат -гиз, 1963.
7. Зубов, В. И. Теория оптимального управления Текст] / В. И. Зубов. — Л.: Судостроение, 1966.
8. Ито, К. Диффузионные процессы и их траектории. Пер. с англ. Текст] / К. Ито, Г. Маккин. — М.: Мир, 1968.
9. Липцер, Р. Ш. Теория мартингалов Текст] / Р. Ш. Липцер, А. Н. Ширяев. — М.: Наука, 1986.
10. Мазуров, А. Ю. Диссипативные динамические системы Текст] / А. Ю. Мазуров // Будущее технической науки. Тезисы докладов VI Международной молодежной научно-технической конференции. — Н. Новгород: Изд-во НГТУ, 2007. — С. 82.
11. Мазуров, А. Ю. Диссипативность стохастических систем с функцией накопления, чувствительной к рискам Текст] / А. Ю. Мазуров // Труды III Всероссийской молодежной конференции по проблемам управления ВМКПУ-2008. — М.: Изд-во ИПУ РАН, 2008. — С. 45-46.
12. Миллер, Б.М. Теория случайных процессов Текст] / Б.М.Миллер, А. Р. Панов. — М.: Физматлиг, 2002.
13. Оксендаль, Б. Стохастические дифференциальные уравнения. Введение в теорию и приложения. Пер. с англ. Текст] / Б. Оксендаль. — М.: Мир, 2003.
14. Пакшин, П. В. Диссипативность диффузионных процессов Ито с марковскими переключениями и задачи робастной стабилизации Текст] / П. В. Пакшин // Автоматика и телемеханика. — 2007. —№ 9. — С. 38-55.
15. Пакшин, П. В. Экспоненциальная диссипативность диффузионных процессов случайной структуры и задачи робастной стабилизации Текст] / П. В. Пакшин // Автоматика и телемеханика. — 2007. —№ 10. — С. 134-154.
16. Поздяев, В. В. Аналитические критерии разрешимости систем линейных матричных неравенств второго порядка: дис. канд. физ.- мат. наук: 05.13.01 Текст] / В. В. Поздяев. — Н. Новгород, НГТУ, 2007.
17. Полушин, И. Г. Пассивность и пассификация нелинейных систем Текст] / И. Г. Полушин, А. Л. Фрадков, Д. В. Хилл // Автоматика и телемеханика. — 2000. —№ 3. — С. 3-37.
18. Попов, В. М. Гиперустойчивость автоматических систем Текст] / В. М. Попов. — М.: Наука, 1970.
19. Флеминг, У Оптимальное управление детерминированными и стохастическими системами: Пер. с англ. Текст] / У Флеминг, Р. Ришел. — М.: Мир, 1978.
20. Фрадков, А. Л. Синтез адаптивной системы стабилизации линейного динамического объекта Текст] / А. Л. Фрадков // Автоматика и телемеханика. — 1974. —№ 12. — С. 96-103.
21. Фрадков, А. Л. Квадратичные функции Ляпунова в задаче адаптивной стабилизации линейного динамического объекта Текст] / А. Л. Фрадков // Сиб. мат. журнал. — 1976. —№ 2. — С. 436-446.
22. Хасьминский, P. 3. Устойчивость систем дифференциальных уравнений при случайных возмущениях их параметров Текст] / Р. 3. Хасьминский. — М.: Наука, 1969.
23. Чурилов, А. Н. Исследование линейных матричных неравенств. Путеводитель по программным пакетам Текст] / А. Н. Чурилов, А. В. Гессен. — Спб.: Изд-во С.-Петерб. ун-та, 2004.
24. Ширяев, А. С. Управление колебаниями нелинейных систем в смысле заданного неотрицательного функционала Текст] / А. С. Ширяев // Докл. РАН. — 1999. —Т. 365. —№ 4. — С. 468-470.
25. Albertini, F. Small parameter limit for discrete-time partially observed risk-sensitive control problems Текст] / F. Albertini, P. Dai Pra // SIAM J. Control Optimization. — 1998. — V. 37, No. 1. — P. 1-32.
26. Aliyu, M. D. S. Dissipative analysis and stability of nonlinear stochastic state-delayed systems Текст] / M. D. S. Aliyu // Nonlinear Dynamics and Systems Theory. — 2004. — V. 4. — P. 243-256.
27. Anderson, B. D. O. A system theory criterion for positive real matrices Текст] / В. D. О. Anderson // SIAM J. Control. — 1967. — V. 5. — P. 171-182.
28. Anderson, B. D. O. The small-gain theorem, the passivity theorem and their equivalence Текст] / В. D. О. Anderson //J. Franklin Inst. — 1972. — V. 293. — P. 105-115.
29. Arimoto, S. Control Theory of Nonlinear Mechanical Systems: A Passivity-based and Circuit-theoretic Approach Текст] / S. Arimoto. — Oxford: University Press, UK, 1996.
30. Arslan, G. Risk-sensitive adaptive trackers for strict-feedback systems with output measurements Текст] / G. Arslan, T. Ba§ar // IEEE Trans. Autom. Control. — 2002. — V. 47. — P. 1754-1758.
31. Artstein, Z. Stabilization with relaxed controls Текст] / Z. Artstein // Nonlinear Analysis, Theory, Methods & Applications. — 1983. — V. 7, No. 11. — P. 1163-1173.
32. Athans, M. The role and use of the stochastic linear-quadratic-Gaussian problem in control system design Текст] / M. Athans // IEEE Trans. Autom. Control. — 1971. — V. 16. — P. 529-552.
33. Baras, J. S. Robust and Risk-Sensitive Output Feedback Control for Finite State Machines and Hidden Markov Models Текст] / J. S. Baras, M. R. James // Isr 1994-63, University of Maryland, Maryland, 1994.
34. Barron, E. N. Total risk aversion, stochastic optimal control and differential games Текст] / E. N. Barron, R. Jensen // Appl. Math. Optim. —1989. — V. 19. — P. 313-327.
35. Ba§ar, T. Ti00-Optimal Control and Related Minimax Design Problems: A Dynamic Game Approach Текст] / Т. Ba§ar, P. Bernhard. — Birkhauser: Boston, Bazel, Berlin, 1995.
36. Bensoussan, A. Optimal control of partially observable stochastic systems with an exponential-of-integral performance index Текст] / A. Bensoussan, J. H. van Schuppen // SLAM J. Control Optimization. —1985. — V. 23, No. 4. — P. 599-613.
37. Bensoussan, A. General finite-dimensional risk-sensitive problems and small noise limits Текст] / A. Bensoussan // IEEE Trans. Autom. Control. — 1996. — V. 41. — P. 210-215.
38. Bensoussan, A. Min-max characterization of a small noise limit on risk-sensitive control Текст] / A. Bensoussan, H. Nagai // SIAM J. Control Optimization. — 1997. — V. 35, No. 4. — P. 1093-1115.
39. Berghuis, H. A passivity approach to controller-observer design for robots Текст] / H. Berghuis, H. Nijmeijer // IEEE Trans, on Robotics and Automation.1993. — V. 9, No. 6. — P. 740-754.
40. Borkar, V. S. A note on stochastic dissipativeness Текст] / V. S.Borkar, S. K. Mitter // Directions in Mathematical Systems Theory and Optimization, Lecture Notes in Control Inform. V. 286. Springer: Berlin. — 2003. — P. 41-49.
41. Boyd, S. Linear Matrix Inequalities in System and Control Theory Текст] / S. Boyd, L. El Ghaoui, E. Feron, V. Balakrishnan. — Philadelphia: SIAM, 1994.
42. Brogliato, B. Adaptive motion control of robot manipulators: a unified approach based on passivity Текст] / В. Brogliato, I. Landau, R. Lozano-Leal // Int. J. Robust Nonlinear Contr. — 1991. — V. 1. — P. 187-202.
43. Brogliato, B. Dissipative Systems Analysis and Control: Theory and Applications Текст] / В. Brogliato В., R. Lozano, B. Maschke, O. Egeland. — London: Springer, 2007.
44. Byrnes, C.I. Passivity, feedback equivalence, and the global stabilization of minimum phase nonlinear systems Текст] / C.I.Byrnes, A.Isidori, J. C. Willems // IEEE Trans. Autom. Control. — 1991. — V. 36. — P. 1228-1240.
45. Byrnes, С. I. Losslessness, feedback equivalence and the global stabilization of discrete-time nonlinear systems Текст] / С. I. Byrnes, W. Lin // IEEE Trans. Autom. Control. — 1994. — V. 39. — P. 83-98.
46. Cavazos-Cadena, R. Controlled Markov chains with risk-sensitive criteria: Average costs, optimality equations, and optimal solutions Текст] / R. Cavazos-Cadena, E. Fernandez-Gaucherand // Math. Methods Oper. Res. — 1999. — V. 49. — P. 299-324.
47. Chellaboina, V. S. Exponentially dissipative nonlinear dynamical systems: A nonlinear extension of strict positive realness Текст] / V. S. Chellaboina, W. M. Haddad // Math. Problems in Engineering. — 2003. — V. 1. — P. 25-45.
48. Da Lio, F. Finite time-horizon risk-sensitive control and the robust limit under a quadratic growth assumption Текст] / F. Da Lio, W. M. McEneaney // SIAM J. Control Optimization. — 2002. — V. 40, No. 5. — P. 1628-1661.
49. Dawson, D. M. Nonlinear Control of Electric Machinery Текст] / D. M. Dawson, J. Ни, Т. C. Burg. — Marcel Dekker, 1998.
50. Fan, C.-H. Centralized and decentralized solutions of the linear-exponential-Gaussian problem Текст] / C.-H. Fan, J. L. Speyer, C. R. Jaensch // IEEE Trans. Autom. Control. — 1994. — V. 39. — P. 1986-2003.
51. Fleming, W. H. Risk sensitive control and differential games Текст] / W. H. Fleming, W. M. McEneaney // Springer Lecture Notes in Control and Info. Sci. V. 184. Springer-Verlag: New York. — 1992. — P. 185-197.
52. Fleming, W. H. Risk sensitive control with ergodic cost criteria Текст] / W. H. Fleming, W. M. McEneaney // Proc. of the 31st IEEE Conf. on Decision and Control. — Tucson, Í992. — V. 2. — P. 2048-2052.
53. Fleming, W. H. Optimal investment models and risk sensitive stochastic control Текст] / W. H. Fleming // Math. Finance. IMS Vol. Math. Appl. V. 65. SpringerVerlag: New York. — 1995. — P. 75-88.
54. Fleming, W. H. Risk-sensitive control on an infinite time horizon Текст] / W. H. Fleming, W. M. McEneaney // SIAM J. Control Optimization. — 1995. — V. 33, No. 6. — P. 1881-1915.
55. Fleming, W. H. The risk-sensitive index and the %2 and 1-Loo norms for nonlinear systems Текст] / W. H. Fleming, M. R. James // Math. Control Signals Systems. — 1995. — V. 8. — P. 199-221.
56. Fleming, W. H. Risk-sensitive control of finite state machines on an infinite horizon I Текст] / W. H. Fleming, D. Hernández-Hernández // SIAM J. Control Optimization. — 1997. — V. 35, No. 5. — P. 1790-1810.
57. Fleming, W. H. Risk-sensitive production planning of a stochastic manufacturing system Текст] / W. H. Fleming, Q. Zhang // SIAM J. Control Optimization. — 1998. — V. 36. — P. 1147-1170.
58. Fleming, W. H. Risk-sensitive control of finite state machines on an infinite horizon II Текст] / W. H. Fleming, D. Hernández-Hernández // SIAM J. Control Optimization. — 1999. — V. 37. — P. 1048-1069.
59. Florchinger, P. A stochastic version of Artsteins theorem Текст] / P. Florchinger // Proc. of the 41st IEEE Conf. on Decision and Control. — Las Vegas, 2002. — P. 1888-1889.
60. Florchinger, P. A passive system approach to feedback stabilization of nonlinear control stochastic systems Текст] / P. Florchinger // SIAM J. Control Optimization. — 1999. — V. 37. — P. 1848-1864.
61. Fossen, T. Nonlinear Backstepping Design: Application to Mechanical Systems and Ship Control Текст] / T. Fossen. —N.Y.: Springer-Verlag, 1999.
62. Fradkov, A. L. Introduction to Control of Oscillations and Chaos Текст] / A. L. Fradkov, A. Yu. Pogromsky. —Singapore: World Scientific, 1998.
63. Fradkov, A. L. Control of oscillations in Hamiltonian systems Текст] / A. L. Fradkov, I. A. Makarov, A. S. Shiriaev, O. P. Tomchina // Proc. of the 4th European Control Conf. — Brussels, 1997. Paper No. 328.
64. Gauthier, J. P. Stabilisation des systemes nonlinearies Текст] / }. P. Gauthier, Bornard G. // Outilset methodes mathématiques pour l'automatique., Ed. by I. D. Landau, C.N.R.S., 1981. — P. 307-324.
65. Glover, K. State-space formulae for all stabilizing controllers that satisfy an norm bound and relations to risk sensitivity Текст] / К. Glover, J. C. Doyle 11 Systems Control Lett. — 1988. — V. 11. — P. 167-172.
66. Glover, К. Minimum entropy and risk-sensitive control: The continuous time case Текст] / К. Glover // Proc. of the 28th IEEE Conf. on Decision and Control. — Tampa, 1989. — P. 388-391.
67. Haddad, W. M. Dissipativity theory and stability of feedback interconnections for hybrid dynamical systems Текст] / W. M. Haddad, V. S. Chellaboina // Math. Problems in Engineering. — 2001. — V. 7. — P. 299-335.
68. Haddad, W. M. Nonlinear impulsive dynamical systems. Part I: Stability and dissipativity Текст] / W. M. Haddad, V. S. Chellaboina, N. A. Kablar // Probl. Int. J. Control. — 2001. — V. 74. — P. 1631-1658.
69. Haddad, W. M. Vector dissipativity theory for large-scale impulsive dynamical systems Текст] / W. M. Haddad, V. S. Chellaboina, Q. Hui, S. Nersesov // Math. Problems in Engineering. — 2004. — V. 10. — P. 225-262.
70. Haddad, W. M. Thermodynamic stabilization via energy dissipating hybrid controllers Текст] / W. M. Haddad, V. S. Chellaboina, Q. Hui, S. G. Nersesov // Proc. of the 44th IEEE Conf. on Decision and Control. — Seville, 2005. — P. 48794884.
71. Hernández-Hernández, D. Risk sensitive control of Markov processes in countable state space Текст] / D. Hernández-Hernández, S. J. Marcus // Systems Control Lett. — 1996. — V. 29, No. 3. — P. 147-155.
72. Hill, D.J. The stability of nonlinear dissipative systems Текст] / D.J.Hill, P. J. Moylan // IEEE Trans. Autom. Control. — 1976. — V. 21. — P. 708-711.
73. Hill, D. J. Stability results for nonlinear feedback systems Текст] / D. J. Hill, P. J. Moylan // Automatica. —1977. — V. 13. — P. 377-382.
74. Hill, D. J. Stability criteria for large-scale systems Текст] / D. J. Hill, P. J. Moylan // IEEE Trans. Autom. Control. — 1978. — V. 23, No. 2. — P. 143-149.
75. Hill, D. J. Connections between finite-gain and asymptotic stability Текст] / D. J. Hill, P. J. Moylan // IEEE Trans. Autom. Control. — 1980. — V. 25. — P. 931936.
76. Hill, D. J. Dissipative dynamical systems: Basic input-output and state properties Текст] / D. J. Hill, P. J. Moylan // J. Franklin Inst. — 1980. — V. 309, No. 5. — P. 327-357.
77. Hill, D. J. General instability results for interconnected systems Текст] / D. J. Hill, P. J. Moylan // SIAM J. Control Optimization. — 1983. — V. 21, No. 2. — P. 256— 279.
78. Hill, D. J. Dissipativeness, stability theory and some remaining problems Текст] / D. J. Hill // Analysis and Control of Nonlinear Systems. Eds. С. I. Byrnes,
79. C. F. Martin, R. E. Saeks. North-Holland: Amsterdam. —1988. — P. 443-452.
80. Howard, R. A. Risk-sensitive Markov decision processes Текст] / R. A. Howard, J. A. Matheson // Manage Sci. — 1972. — V. 18. — P. 357-370.
81. Jacobson, D. H. Optimal stochastic linear systems with exponential performance criteria and their relation to deterministic differential games Текст] /
82. D. H. Jacobson //IEEE Trans. Autom. Control. — 1973. — V. 18. — P. 124-131.
83. James, M. R. Asymptotic analysis of nonlinear stochastic risk-sensitive control and differential games Текст] / M. R. James // Math. Control Signals Systems. — 1992. — V. 5. — P. 401-417.
84. James, M. R. Risk-sensitive control and dynamic games for partially observed discrete-time nonlinear systems Текст] / M. R. James, J. S. Baras, R. J. Elliott // IEEE Trans. Autom. Control. —1994. — V. 39. — P. 780-792.
85. James, M. R. Partially observed differential games, infinite-dimensional Hamilton-Jacobi-Isaacs equations, and nonlinear control Текст] / M. R. James, J. S. Baras // SIAM J. Control Optimization. — 1996. — V. 34. — P. 1342—1364.
86. Jankovic, M. Constructive Lyapunov control design for turbocharged diesel engines Текст] / M. Jankovic, M. Jankovic, I. Kolmanovsky // Proc. of the 17th American Control Conf. — Philadelphia, 1998. — P. 1389-1394.
87. Jurdjevic, V. Controllability and stability Текст] / V. Jurdjevic, J. P. Quinn //J. Diff. Equations. — 1978. — V. 28. — P. 381-389.
88. Kaise, H. Bellman-Isaacs equations of ergodic type related to risk-sensitive control and their singular limits Текст] / H. Kaise, H. Nagai // Asympt. Anal. — 1998. — V. 16. — P. 347-362.
89. Kaloupsidis, N. Stability improvement of nonlinear systems by feedback Текст] / N. Kaloupsidis, J. Tsinias // IEEE Trans. Autom. Control. — 1984. — V. 29. — P. 364-367.
90. Kanellakopoulos, I. Nonlinear and Adaptive Control Design Текст] / I. Kanellakopoulos, P. V. Kokotovic, M. Krstic. — N.Y.: Wiley, 1995.
91. Khasminskii, R. Z. Ergodic properties of recurrent diffusion processes and stabilization of the solution to the Cauchy problem for parabolic equations Текст] / R. Z. Khasminskii // Th. of Prob. and its Appl. — 1960. — V. 5. — P. 179196.
92. Kokotovic, P. V. Singular Perturbations and Asymptotic Analysis in Control Systems Текст] / P. V. Kokotovic, A. Bensoussan, G. Blankenship, Eds // Lecture Notes in Control and Inform. Sciences Series. V. 90. Springer-Verlag:Berlin. —• 1987.
93. Krainak, J. Static team problems — Part I: Sufficient conditions and the exponential cost criterion Текст] / J. Krainak, J. Speyer, S. Marcus // IEEE Trans. Autom. Control. — 1982. — V. 27. — P. 839-848.
94. Krainak, J. The dynamic linear exponential Gaussian team problem Текст] / J. Krainak, F. Machell, S. Marcus, J. Speyer // IEEE Trans. Autom. Control. — 1982. — V. 27. — P. 860-869.
95. Kumar, P. R. On the optimal control of stochastic systems with an exponential-of-integral performance index Текст] / P. R. Kumar, J. H. Van Schuppen //J. Math. Anal. Appl. — 1981. — V. 80. — P. 312-332.
96. LaSalle, J. P. Dissipative systems Текст] / J. P. LaSalle // Ordinary Differential Equations, 1971 NRL-MRC Conf., L. Weiss, Ed. —New York: Academic, 1972.
97. Lee, К. K. Remarks on smoof feedback stabilization of nonlinear systems Текст] / К. К. Lee, A. Araposthatis // Systems Control Lett. — 1988. — V. 10. — P. 41-44.
98. Lin, W. Kalman-Yakubovich-Popov lemma, state feedback and dynamic output feedback in discrete-time bilinear systems Текст] / W. Lin, С. I. Byrnes // Systems Control Lett. — 1994. — V. 23. — P. 127-136.
99. Lin, W. Passivity and absolute stabilization of a class of discrete time nonlinear systems Текст] / W. Lin, С. I. Byrnes // Automatica. — 1995. — V. 31. — P. 263268.
100. Liu, Y. Output feedback control design for strict-feedback stochastic nonlinear systems under a risk-sensitive cost criterion Текст] / Y. Liu, Z. Pan, S. Shi // IEEE Trans. Autom. Control. — 2003. — V. 48. — P. 509-513.
101. Liu, Y. Practical output-feedback risk-sensitive control for stochastic nonlinear systems with stable zero-dynamics Текст] / Y. Liu, J. Zhang // SIAM J. Control Optimization. — 2006. — V. 45. — P. 885—925.
102. Lofberg, I. YALMIP: A Toolbox for Modeling and Optimization in MatLab Электронный ресурс] / J. Lofberg // Proc. of the CACSD Conf. — Taipei, 2004. http://control.ee.ethz.ch/~joloef/yalmip.php
103. Mazurov, A. Stochastic dissipativity with risk-sensitive storage function and related control problems Текст] / A. Mazurov, P. Pakshin // ICIC Express Lett. — 2009. — V. 3. — No. 1. — P. 53-60.
104. McEneaney, W. M. Connections between Risk-Sensitive Stochastic Control, Differential Games and -Control: The Nonlinear Case Текст] / W. M. McEneaney // Doctoral thesis, Brown University, Providence, RI, 1993.
105. McEneaney, W. M. Uniqueness for viscosity solutions of nonstationary Hamilton-Jacobi-Bellman equations under some a priori conditions (with applications) Текст] / W. M. McEneaney // SIAM J. Control Optimization. — 1995. — V. 33. — P. 1560—1576.
106. McEneaney, W. M. Risk-sensitive control of nonlinear systems (Parts 1 and 2) Текст] / W. M. McEneaney // SIAM Activity Group in Control and Systems Theory Newsletter. — 1996. — V. 4. —No. 1 and 2.
107. McEneaney, W. M. Infinite time-horizon risk sensitive systems with quadratic growth Текст] / W. M. McEneaney, K. Ito // Proc. of the 36th IEEE Conf. on Decision and Control. — San Diego, 1997. — P. 3413-3418.
108. Moylan, P. J. Nonlinear regulator theory and an inverse optimal control problem Текст] / P. J. Moylan, B. D. O. Anderson // IEEE Trans. Autom. Control. —1973. — V. 18. — P. 460-465.
109. Moylan, P. J. Implications of passivity in a class of nonlinear systems Текст] / P. J. Moylan // IEEE Trans. Autom. Control. — 1974. — V. 19. — P. 373-381.
110. Nagai, H. Bellman equations of risk-sensitive control Текст] / H. Nagai // SIAM J. Control Optimization. — 1996. — V. 34. — P. 74-101.
111. Navarro-López, E. M. Implications of dissipativity and passivity in the discrete-time setting Текст] / E. M. Navarro-López, D. Cortés, E. Fossas-Colet // Proc. of the 15th IFAC World Congress. — Barcelona, 2002. — V. 15, Part 1.
112. Navarro-López, E. M. Dissipativity, passivity and feedback passivity in the nonlinear discrete-time setting Текст] / E. M. Navarro-López, E. Fossas-Colet // Proc. of the 15th IFAC World Congress. — Barcelona, 2002. — V. 15, Part 1.
113. Navarro-López, E. M. Dissipativity and feedback dissipativity properties of general nonlinear discrete-time systems Текст] / E. M. Navarro-López, H. Sira-Ramires, E. Fossas-Colet // Eur. J. Control. — 2002. — V. 8, No. 3. — P. 265-274.
114. Navarro-López, E. M. Feedback passivity of nonlinear discrete-time systems with direct input-output link Текст] / E. M. Navarro-López, E. Fossas-Colet // Automática J. IFAC. — 2004. — V. 40, No. 8. — P. 1423-1428.
115. Navarro-López, E. M. Several dissipativity and passivity implications in the linear discrete-time setting Текст] / E. M. Navarro-López // Math. Problems in Engineering. — 2005. — V. 6. — P. 599-616.
116. Nicklasson, P. J. Passivity-based control of the general rotating electrical machine Текст] / P. J. Nicklasson, R. Ortega, G. Espinoza-Perez // Proc. of the 33rd IEEE Conf. on Decision and Control. — Orlando, 1994. — P. 4018-4023.
117. Ortega, R. Adaptive motion control of rigid robots: a tutorial Текст] / R. Ortega, M. W. Spong // Automatica. — 1989. — V. 25, No. 6. — P. 877-888.
118. Ortega, R. On passivity-based output feedback global stabilization of Euler-Lagrange systems Текст] / R. Ortega, A. Loria, R. Kelly, L. Prali // Int. J. Robust Nonlinear Contr . — 1995. — V. 5, No. 4. — P. 313-325.
119. Ortega, R. Passivity-based Control of Euler-Lagrange Systems Текст] / R. Ortega, A. Loria, P. Nicklasson, H. Sira-Ramires. — London: Springer, 1998.
120. Pan, Z. Backstepping controller design for nonlinear stochastic systems under a risk-sensitive cost criterion Текст] / Z.Pan, T. Ba§ar // SLAM J. Control Optimization. — 1999. — V. 37. — P. 957—995.
121. Peaucelle, D. User's Guide for SeDuMi Interface 1.04 Электронный ресурс] / D. Peaucelle, D. Henrion, Y. Labit, K.Taitz // 13th September, 2002. http://www.laas.fr/~peaucell/SeDuMiInt.html
122. Pogromsky, A. Yu. Passivity based damping of power system oscillations Текст] / A. Yu. Pogromsky, A. L. Fradkov, D. J. Hill // Proc. of the 35th IEEE Conf. on Decision and Control. — Kobe, 1996. — P. 3876-3881.
123. Pogromsky, A. Yu. Synchronization and adaptive synchronization in semipassive systems Текст] / A. Yu. Pogromsky // Proc. of Int. Conf.: Control of Oscillations and Chaos. — St. Petersburg, 1997. — P. 64-68.
124. Runolfsson, T. Stationary risk-sensitive LQG control and its relation to LQG and Tioo -control Текст] / Т. Runolfsson // Proc. of the 29th IEEE Conf. on Decision and Control. — Hawaii, 1990. — P. 1018-1023.
125. Runolfsson, T. Risk-sensitive control of Markov chains and differential games Текст] / Т. Runolfsson // Proc. of the 32nd IEEE Conf. on Decision and Control. — San Antonio, 1993. — P. 3377-3378.
126. Runolfsson, T. Risk-sensitive control of stochastic hybrid systems on infinite time horizon Текст] / Т. Runolfsson // Math. Problems in Engineering. — 2000. — V. 5. — P. 459-478.
127. Runolfsson, T. Robust control of discrete-time hybrid systems with uncertain modal dynamics Текст] / Т. Runolfsson // Math. Problems in Engineering. — 2004. — V. 3. — P. 197-208.
128. Saberi, A. Global stabilization of partially linear composite systems Текст] / A. Saberi, P. V. Kokotovic, H. J. Sussmann // SIAM J. Control Optimization. — 1990. — V. 28. — P. 1491-1503.
129. Sepulchre, R. Constructive Nonlinear Control Текст] / R. Sepulchre, M. Jankovic, P. V. Kokotovic. — London: Springer, 1997.
130. Shaked, U. H^ control for nonlinear stochastic systems: The output-feedback case Электронный ресурс] / U. Shaked, N. Berman 11 Preprints of the 16th IFAC World Congress. CD-ROM. — Prague, 2005. — P. 1-6.
131. Shiriaev, A. S. Control of oscillations in lossless nonlinear systems Текст] / A. S. Shiriaev // Proc. of the 1st Int. Conf. on Control of Oscillations and Chaos. — St. Petersburg, 1997. — P. 136-137.
132. Shiriaev, A. S. Control of oscillations in affine nonlinear systems Текст] / A. S. Shiriaev // Proc. of the 5th IFAC Conf. on Systems Structure and Control. — Nantes, 1998. — V. 3. — P. 789-794.
133. Sira-Ramires, H. Passivity-based control of DC to DC converters Текст] / H. Sira-Ramires, R. Ortega // Proc. of the 34th IEEE Conf. on Decision and Control. — New Orleans, 1995. — P. 3471-3476.
134. Sira-Ramires, H. Passivity-based controllers for the stabilization of dc-to-dc power converters Текст] / H. Sira-Ramires, R. Ortega, R. Pérez-Moreno, M. Garcia-Esteban // Automatica. — 1997. — V. 33. — P. 499-513.
135. Sira-Ramires, H. Passivity-based control of nonlinear chemical processes Текст] / H. Sira-Ramires, M. I. Angulo-Núñez // Int. J. Control. —1997. — V. 68. — P. 971-996.
136. Speyer, J. L. Optimization of stochastic linear systems with additive measurement andprocess noise using exponential performance criteria Текст] / J. L. Speyer, J. Deyst, D. H. Jacobson // IEEE Trans. Autom. Control. —1974. — V. 19. — P. 358366.
137. Speyer, J. L. An adaptive terminal guidance scheme based on an exponential cost criterion with applications to homing missile guidance Текст] / J. L. Speyer // IEEE Trans. Autom. Control. — 1976. — V. 21. — P. 371-375.
138. Speyer, J. L. A decentralized team decision problem with an exponential cost criterion Текст] / J. L. Speyer, S. Marcus, J. Krainak // IEEE Trans. Autom. Control. — 1980. — V. 25. — P. 919-924.
139. Thygesen, U. H. Robust Performance and Dissipation of Stochastic Control Systems Электронный ресурс] / U. H. Thygesen // PhD thesis, Dept. of Mathematical Modelling, Technical University of Denmark, http://www.imm.dtu.dk, 1998.
140. Van der Ploeg, F. Risk-sensitive stabilization policy: complacency and neurotic breakdown Текст] / F. Van der Ploeg. — preprint, 1983.
141. Van der Ploeg, F. Economic policy rules for risk-sensitive decision making Текст] / F. Van der Ploeg // Zeitschrift für Nationalökonomie. —1984. — V. 44. — P. 207-235.
142. Van der Ploeg, F. Risk and linear-quadratic stabilization Текст] / F. Van der Ploeg // Economics Lett. — 1984. — V. 15. — P. 73-78.
143. Van der Schaft, A. J. £2~Gain and Passivity Techniques in Nonlinear Control Текст] / A. J. Van der Schaft. — London, U.K.: Springer-Verlag, 2000.
144. Willems, J. С. The Analysis of Feedback Systems Текст] / J. C. Willems. — Cambridge: MIT press, 1971.
145. Willems, J. C. Dissipative dynamical systems. Part I: General theory Текст] / J. C. Willems // Arch. Rational Mech. Analysis. — 1972. — V. 45. — P. 321-351.
146. Willems, J. C. Dissipative dynamical systems. Part II: Linear systems with quadratic supply rates Текст] /}. С. Willems // Arch. Rational Mech. Analysis. — 1972. — V. 45. — P. 352-393.
147. Willems, J. C. Mechanisms for the stability and instability in feedback systems Текст] / J. C. Willems // Proceedings IEEE. —1976. — V. 64, No. 1. — P. 352-393.
148. Whittle, P. Risk-sensitive linear/quadratic/Gaussian control Текст] / P. Whittle // Adv. Appl. Prob. — 1981. — V. 13. — P. 764-777.
149. Whittle, P. Optimization over Time: Dynamic Programming and Stochastic Control Текст] / P. Whittle. — John Wiley: New York, 1982-1983.
150. Whittle, P. A Hamiltonian formulation of risk-sensitive linear-quadratic-Gaussian control Текст] / P. Whittle, J. Kuhn // Int. J. Control. —1986. — V. 43. — P. 1-12.
151. Whittle, P. Entropy-minimising and risk-sensitive control rules Текст] / P. Whittle // Systems Control Lett. — 1989. — V. 13. — P. 1-7.
152. Whittle, P. Risk-Sensitive Optimal Control Текст] / P. Whittle. — John Wiley: New York, 1990.
153. Whittle, P. A risk-sensitive maximum principle Текст] / P. Whittle // Systems Control Lett. — 1990. — V. 15. — P. 183-192.
154. Whittle, P. A risk-sensitive maximum principle: the case of imperfect state observation Текст] / P. Whittle // IEEE Trans. Autom. Control. — 1991. — V. 36, No. 7. — P. 793-801.
155. Wonham, W. M. Liapunov criteria for weak stochastic stability Текст] / W. M. Wonham // J. Diff. Equations. — 1966. — V. 2. — P. 195-207.
156. Wonham, W. M. A Liapunov method for the estimation of statistical averages Текст] / W. M. Wonham // J. Diff. Equations. —1966. — V. 2. — P. 365-377.
157. Youla, D. C. Bounded real scattering matrices and the foundations of linear passive network theory Текст] / D. C. Youla, L. J. Castriota, H. J. Carlin // IRE Trans. Circuit Theory. — 1959. — V. 4, No. 1. — P. 102-124.
158. Zames, G. On the stability of nonlinear, time-varying feedback systems Текст] / G. Zames // Proc. Nat'l Electr. C. — 1964. — V. 20. — P. 725-730.
159. Zames, G. On the input-output stability of nonlinear time-varying feedback systems. Part I: Conditions derived using concepts of loop gain, conicity, and positivity Текст] / G. Zames // IEEE Trans. Autom. Control. — 1966. — V. 11, No. 2. — P. 228-238.
160. Zhang, Q. Risk sensitive production planning of stochastic manufacturing systems: A singular perturbation approach Текст] / Q. Zhang // SIAM J. Control Optimization. — 1995. — V. 33. — P. 498-527.
161. Zhang, W. State feedback control for a class of nonlinear stochastic systems Текст] / W.Zhang, B.-S.Chen // SIAM J. Control Optimization. — 2006. — V. 44. — P. 1973-1991.
-
Похожие работы
- Анализ устойчивости и синтез стабилизирующих управлений для нелинейных разностных систем
- Резонансные свойства детерминированных математических моделей и устойчивость функционирования технических систем с гистерезисными нелинейностями
- Основы теории систем автоматического управления с изменяющейся конфигурацией
- Качественный анализ движений дискретных динамических систем
- Динамические блоковые модели экосистем
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность