автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:О задаче оптимального управления наблюдением

кандидата физико-математических наук
Кривонос, Ирина Юрьевна
город
Киев
год
1991
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «О задаче оптимального управления наблюдением»

Автореферат диссертации по теме "О задаче оптимального управления наблюдением"

: ; 3 Г

Академ;::; ::ау:; Украины Ордена Ленина Институт кибернетики имени В. Л1. Глушкоза

На празаи рукописи

КРИВОНОС Ирина Юрьевна

УДК 517.977.8

О ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НАБЛЮДЕНИЕМ

05.13.16 — применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

Ккез 1391

Работа выполнена в Институте кибернетики имени В. М. Глушкова АН Украины.

Научный руководитель: член-корреспондент АН Украины

ПШЕНИЧНЫИ Б. Н.

Официальные оппоненты: доктор физико-математических

наук ЯЦЕНКО Ю. П.,

кандидат физико-математических наук АСЛАНЯН А. А.

Ведущая организация: Институт математики АН Украины.

Защита состоится «--» -— 19 г. в

часов на заседании специализированного совета Д 016.45.01 при' Институте кибернетики имени В. М. Глушкова АН Украины по адресу:

252207 Киев 207, проспект Академика Глушкова, 40.

С диссертацией можно ознакомиться в научно-техническом архиве института.

л о10 9/

Автореферат разослан «-Ъ/^-/- 19 ' г

ода.

Ученый секретарь специализированного совета

СИНЯВСКИП В. Ф.

ОБЩАЯ. ХАРАК1'ЕРИСТИ1СА РАБОТЫ

........... ^Актуальность теш. Задачи построения оценок неизвестных параметров по результатам неполных измерений привлекают постоянное внимание исследователей. . Хотя предмет теории наблюдения и фильтрации известен достаточно широко, и многие положения отой теории приобрели характер классических результатов, интерес к такого ро- • да задачам не ослабевает благодаря широкой областч их применения, включающей, в частности, экономику, военное дело и теорию автоматического управления.

Работы Н.Н.Красовского и ряда зарубежных авторов привели к значительному возрастанию публикаций, посвященных изучению минимаксного, или гарантированного, подхода к построению'оценок неизвестных параметров и фазовых состояний динамических систем по результатам измерений при наличии • неопределенных возмущений. Основные результаты для задач минимаксного оценивания получены в работах А.Б.Куржанского, Ф.Л.Черноусько, Б.Н.Пшеничного, О.И.Никоно-ва, Т.О.Филипповой, В.Г.Пскотило, Б.И.Ананьева, А.Г.Наконечного, К.Кириченко, а также других авторов.

Развитие теории гарантированного наблюдения для линейных систем позволило перейти к изучению задач оптимизации измерений или шинирования эксперименте. Связь минимаксных в классических стохастических оценок позволяет применить в рамках гарантированного . подхода как стандартные методы теории планирования эксперимента, так и некоторые другие результаты, связанные с оптимизацией процесса наблюдения. Тем не менее, задачам планирования эксперимента и оптимизации процесса наблвдения в минимаксной постановке посвящено относительно небольшое число работ, среди кстог'х необходимо отметить работы М.И.1^сева, В.И.Карлова,. М.Н.Красильщикова-, В.3.Малышева и др.

В диссертационной работе рассматривается специальная задача управления процессом наблюдения в предположении, что возмущения удовлетворяют квадратичным ограничениям, а параметры измерителя определяются выходом управляемой динамической системы. Такая постановка представляется естественной е том случае, когда наблюдения выполняются с движущегося объекта либо зависят от динамически изменяющихся параметров внешней среды. Кроме того, к рассматриваемой проблеме сводится поиск оптимального входного сигнала в задачах линейной идентификации.

Целью настоящей работы является исследование вопросов оптимизации процесса'наблюдения, получение необходимых условий оптимальности и построение оптимальных динамических измерителей с нулевым а ненулевым начальным условием.

Методы исследования. Основу математического исследования составили методы выпуклого и функционального анализов,а также результаты теории оптимального управления и теории минимаксного наблюдения для линейных динамических систем.

'Научная новизна. Сформулированы задачи построения оптимального динамического измерителя, или задачи оптимизации процесса наблюдения с различными критериями (задачи 1-Ы). Доказана теорема о существовании решения этих задач.

Получены необходимые условия экстремума для задач управления процессом наблвдения, -которые гарантируют оптимальный выбор способа найлвдения^. .

Доказана теорзма о структуре оптимальных динамических измерителей. Получены решения задач -об оптимальном управлении процессом наблюдения для случая а - , которые свелись к задачам на собственные- значения матрицы информационного эллипсоида Р .

Практическая ценность. Работа является частью широкой программы научных исследований ведущихся' в Институте кибернетики имени В.Ы.Глушкова АН Украины по теме "Разработка теории и численных методов оптимального -управления системами переменной структуры с неполней информацией".

Результаты диссертационной работы могут быть использованы при решении задач управления динамическими системами и оптимизации процесса наблюдения.

Апробация работы. Основные результаты работы докладывались на Всесоюзной школе-семинаре молодых ученых (г.Киев, 1989), на УИ Всесоюзной конференции "Управление в механических системах" (г.Свердловск, 1990), на семинарах отдела вычислительных методов Института кибернетики имени В.М.Глушкова АН Украины.

Публикации. Но теме' диссертационной работы опубликовано 5

работ^

Структура работы. Диссертационная работа состоит из введения, двух глав, разбитых на 7 параграфов,и списка литературы.

- 3 -

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность рассматриваемых вопросов, сделен краткий обзор имеющихся результатов, сформулированы новизна и цели исследований. Кратко изложено содержание диссертации.

Первая глава посвящена исследованию задач оптимизации процесса наблвдения. Здесь также приведены необходимые условия экстремума, которые гарантируют оптимальный выбор способа- наблюдения.

В параграфе 1.1 приводится постановка задач оптимизации процесса наблюдения, или задач построения оптимального динамического измерителя.

Цусть £ - неизвестный вектор параметров, оценка которого осуществляется на основе наблюдений сигнала

+1(ь) , ¿£и„Т]. (I)

Здесь СИ. и) - известная, непрерывная по ^ матрица размерности (п.*к) ; На,Г] - интервал наблюдения; { - неопределенные возмущения, информация о которых исчерпывается включением .

где .г, - эллипсоид в пространстве

¿.Ж Т1:

¿.[¡О):

т»

- симметрическая, положительно определенная на- Н,,Т]

матрица.

Звездочкой здесь и ниже обозначается транспонирование.

Предполагается, что матричная функция &-(■) не фиксирована и может изменяться в соответствии с уравнением

Здесь £(&(•) , Ш') ■ • ) - непрерывная матричная функция, зависящая от управляющего параметра и (•) , причем

u(-) ¿ 11 с L? UojL (4)

Объект, описываемый уравнения».',и (I) - (4), будем называть управляемым динамическим измерителем.

Сформулированы задачи построения оптимального динамического измерителя, или задачи оптимизации процесса наблюдения, исходя из минимизации неопределенности в определении В .

При фиксированном уО) множество векторов 0 , удовлетворяющих соотношениям (I), (2), называется информационным множеством, совместимым с реализовавшимся сигналом"(.Кург.анскяй А.Б., 1977).

В рассматриваемом случае информационное множество представляет собой эллипсоид

£ (90,P)={e^R'í:(&-eSP(6-a)^-Li}> (5)

параметры которого определяются следующими соотношениями :

Т

в^Р'-oi, р- Р(сьО))- Icl(í) b}(t)c£(-t)til,

т т (6) d=Jct(é)V(¿)y(¿)&, liaJy*(-t)ylé)d¿ - cCP'Jd.

■LÍ io

Размеры информационного эллипсоида и, следовательно, ошибка минимаксного оценивания определяются" матрицей Р и величиной к- , которая зависит от реализовавшегося сигнала. Но определяет-

ся еыхоцом управляемой динамической системы (о), (4), то есть зависит от управления U (■) . По логике минимаксного подхода выбор оптимального управления í¿>(') в (3) необходимо проводить при наихудшей возможной реализации неопределенных параметров. Известно , что наименее благоприятный для наблюдателя сигнал дает . Следовательно, если ъ качестве оценки вектора 9 будет выбирать-ел центр 9с эллипсоида (5), (6), то максимально возможные ощибки оценивания будут принадлежать эллипсоиду

E.-E(o,p)r(¿*R*: ¿*P

Наиболее распространенными скалярными величинами, характеризующими размеры Е* , являются максимальнее собственное число, след и детерминант матрицы Р"

Таким образом, имеют смысл следующие задачи оптимизации процесса наблюдения. Л

Задача I. Определить допустимое управление w/fc U<zL¿ и соответствующее решение си (■) уразнекия (3), минимизирующее максимальное собственное число матрицы Р

Задача П. Определить допустимое управление с: L^ítt.T] и соответствующее решение а»0) уравнения (3), минимизирующее определитель матрицы Р"1 .

Задача II1. Определить допустимое управление ÍU(-) ¿ ti. с с и соответствующее решение Си>() уравнения (3), мини-

мизирующее след матрицы Р~х .

Для удобства рассматриваются эквивалентные задачи максимизации определителя и минимального собственного числа матрицы Р .

В настоящей работе задачи I-Ш изучаются в предположении, что к* I (используются скалярные наблюдения), p'(é)-I,

j(OL,UL, t)«A(á0L + B(é)Ut ' (v)

АО и ВС) - непрерывные на Í¿-0,TJ матрицы размерности (п*п.) и (ttxni) , соответственно; I - единичная матрица; IÍ - выпуклое слабо компактное множество в íio.T] . Предполагается также, что система (3), (?) вполне управляема.

В этих предположениях обосновывается утверждение Теорема I.I. Решение задач I-lii существует. В параграфе 1.2 исследуются дифференциальные свойства функций, определяющих критерии з задачах 1-Ш.

Через обозначаются величина детерминанта

и минимального собственного числа матрицы- Р(Л.(■)) , ссотвстст-венно, a LícU-í} - след обратной матрицы Р 1 (cl(■))

Теорем з 1.2. функции D(-) И Ц ) Ll lh,TJ —* R дифференцируемы по Фрешо во всех точках Оо(-) , для которых матрица Р, - Р(си> (■)) не вырождена. При этом

¡j(<lo(-))(L)- XóhtP.-g-OsU),

¿' (си (■)) (¿) - - X Po x- cu (0.

Функция В (Си )) , используя соотношение Релея, представляется в виде

Е(&(■))-$$ Е М-)),

т

Здесь

Ып. У) , (8)

где А тАлЯг- минимальное собственное число матрицы Р0 .

Тоорсмя 1.3. Производная Фреше функции Е (V, (Х>(-)) по а(•) ■ д течке а» (■) определяется выражением

Е Ь, си>(Ш ° гп*а, и), и ко,п.

Воспользовавшись результатами (Пшеничный Б.Н., 1982), доказывается , Теорема 1.4. функция

Е- (аО))-- Е'(&(■))

является

квазидифференцируемой и включение £¿6) £ дЕ„ (ао( )) эквивалентно существованию векторов % £ Уо и чисел > ; таких, что

Центральное место в первой главе занимает третий параграф, в котором приведена теорема- о необходимых условиях экстремума.

Теорема 1.5. Пусть Си>() - оптимальный динамический измеритель (решение одной из задач 1411). Тогда выполняются соотношения

У(т) = --АЧ£"М<г) -Ha.lt) , у(т)~о,

<9>

Матрица И определяется Еырэженияш для кьазидкфференциа-ла функционалов Е-(■) , D- (•)'-!>(•) и L0) . В соответствии с этим дая задачи I

И - л 1 к % ч{ ,

(10)

где Ti , Hi- и I определены в теореме 1.4;

(id

для задачи Пи

M-zp* <«>

для задачи Ш.

Вторая глава посвящена построению оптимальных динамических измерителей в случае, когда

A(l)~0 , В(i)*I , i.'O ,

гт . , №) U -1 U( )e Cloj]: Ju*(±)u/i)ca - a J .

L 1 о

В параграфе 2.1 приведена теорема о необходимых условиях экстремума при выполнения соотношений (13).

Показана инзариантность оптимальных динамических измерителей относительно ортогональных преобразований.

Особый интерес представляет тот факт, что благодаря инвариантности задачи оптимизации процесса наблюдения сводятся к зада,- . чам на собственные значения матрицы Р .

В параграфе 2.2 дается яредстзаленио оптимального д:шт-ческого измерителя для задач I-L1.

Теорема 2.2. Пусть 0U (•) - решение задач I ьли П/или 11!. Справедливо представление

cu()~SwO) eL^LOJ], . Wi(i) = Сс tin- fat-t + Ъ) , I ¿lo,TJ, ViTtV- - UU-i)f , i- л, Ш)

lluf(o)ll « ( £ £ )f/i ~ IIcull, •

где к-с - натуральные числа; 8 - ортогональная матрица, для которой ,СЧ> ~ £-У(0) .

Замечание I. Так как В,М°М.Р0 для кавдой из матриц

_ М , определенных соотношениями (9) - (II), то ортогональная матрица Л* , использованная в доказательстве теоремы, одновременно приводит к диагональному виду и матрицу £•

причем, как следует из определения матрицу Р„ , все ^ >О .

Замечание 2. Компоненты &*(•) решения СиО) задачи I, II, или Ш линейно независимы на 10,71 .

Рассмотрены особенности задачи I.

Леша 2.2. Пусть Ол (■) - решение задачи I и множество определено соотношениями (6), (8), (13). Тогда

сШп. {Уо У/а»}} »ц.

Следствие 2.2, Если &>(■) - решение задачи I при ,

то

а -ры-А-АЛ, х.>О.

Таким образом, информационное множество, совместимое с реализовавшимся сигналом, при выбора в качестве оптимального измерителя для задачи I . &>(•) представляет собой шчр (если Си>-0 ) или эллипсоид вращения.

Построению оптимальных динамических измерителей при нулевом начальном условии посвящен параграф 2.3.

Теорема 2.3. Если Ои>(-) определяет оптимальный измеритель в задаче I при (Хо "О , то справедливо представление (14)о

г1 г* ¿¿аТ ,

Аналогичные утверждения справедливы и для задач П и Ш, Отличия лишь в выражениях для коэффициентов Сг в представлении (14), которые определяют соотношение меаду полуосями эллипсоидов -

информационных множеств - при оптимальном наблюдении.

Теорема 2.4. Пусть Ол^О , Цо(-) - оптимальный измеритель в задаче П (!11). Тогда справедливо представление (14) с

Ъ-о.

В параграфе 2.4 результаты предыдущих разделов этой главы используются при решении задач о построении оптимального динамического измерителя с ненулевым начальным условием. . '

3 этом случае для решения задач 1-Ш имеет место представление (14), однако величины Ct, Ус, определяются сложнее.

Справедливо утверждение, уточняющее теорему 2.2. Введено обозначение CJiT*Vc(l)

Теорема 2.5. Пусть <Хо ¥ О , (Х»( ) - решение задачи I, II или Ш. Справедливо представление

a, U)-Sura), i6 L о, т],

-j)), L'i/l,..., Yl,

где г 70 iVl'Uifi) - первые з порядке возрастания неотрицательные корни уравнения

vtej. ir= г , . (16)

S - ортогональная матрица, для которой а.е = S vs{o) . При этом величины Сс , 2 и собственные значения Xl матрицы Р„ = Р (Ол (■)) удовлетворяют уравнениям

С* <ж1п(г)£(ъ) = - L* ,

Z Ci* со}'- v,с (z) дс (г) - ¿Та1 , (тп

Сш1\fell) - W ;

С=1 п,

I

где

+ _i__v;l+zl+¿.

coi'- Vi (г) " "

(18)

Для построения оптимальных измерителей потребуются следующие утверждения, которые имеют к самостоятельное значение.

Лемма 2.3. Функция v¿ - y¿ (ï) является дифференцируемой при 2 , причем

¿J£ = _^ , / - / i и

ctí t^ + t'+i л,/.,..., п. .

Ле»,"А1а 2.4. Пусть в соотношениях (18) в качестве vc ( Z) выбраны первые в порядке возрастания неотрицательные решония уравнения (16). Уравнение

У ¿j(19) h №

имеет единственное неотрицательное решение £ («О при всех <¿ > _ = -^—^Íí—Ü # ¡ipjj дхом г (4» ) = С

Решение задачи I исследуется при различных значениях //0»//г . Теорема 2.6. Дусть О ^ II ,

I,- решение уравнения (19) при ¿= ■ ¡¡£¡¡1- . v¡(ip\ i = Тогда оптимальный измеритель <Х, (■) в задаче I представляется в зидз (15), где

' г.иаЛ1)Ы1+1:) ff Л" ■ Li I fe / '

При этом

£=РСаЛ ))-ЛЛ , + г.иаЛ')(£ ь-/)".

Теорема 2.7. Цусть НО,,//1 > Зв = ^ТКТТТГГ • 1огда оптимальный измеритель Ол(-) для задачи I представляется в виде

си(1)= Sur(i) , ±6 [о,т],

См ,

ьГсМ-й т (и-0Я С = Ш1 ~ Г1 '

$ - ортогональная матрица, для которой си =5ы(о) (

Теорема 2.6. Пусть Ол( ) - оптимальный 'измеритель в задаче П, Оо Ф 0 , ъ >0 • Тогда справедливо представление (15) при

Г 1 (1Т&1 + )>Ш11)(ус1 + 2г) ~ л Ы1+1г-2+ V) V-1 '

где г и У удовлетворяют системе трансцендентных уравнений

•с

I

К »ОоЦ1

Ы -г + ^ ¿7дг + У'/йв/г

Теорема 2.9. Пусть <2«Л) - оптимальный измеритель в аа",ячг. ж, О , г »£? . Тогда справедливо представлен^5 (!;")) при

— —

где 2 и ^ удовлетворяют системе трансцендентных уравнений

у ((у-11 г*-г) + г-1)) (V к

V"__№__/:а°"1 V

Основные результаты работы

1. Сформулирозаны задачи построения оптимального динамического измерителя (задачи 1-И), или задачи оптимизации процесса наблюдения, з предположении, что возмущения удовлетворяют квадра-тячкым ограничения:.", а параметры измерителя определяются выходом управляемой динамической системы. Доказана теорема о существовании решения этих задач.

2. Получены необходимые условия экстремума для задач управления процессом наблюдения. Изучены дифференциальные свойства функций, определяющих критерии в задачах 1-Ш.

И. Обоснована инвариантность оптимальных динамических измерителей относительно ортогональных преобразований.

4. Доказана теорема о структуре оптимальных динамических измерителей. Получены решения задач 1-Ш для случая й - и. , которые свелись к задачам ка собственные значения матрицы информации онного эллипсоида Р , При кулевом начальном условии получены явные -аналитические соотношения.

Ь. Построены оптимальные динамические измерители для задач 1-Ш с ненулевым начальным условием. Исследован вид информационного вллиисоидв при различиях значениях ИОл!!^ и получены

явные аналитические соотношения для решения задачи I. Для задач II и III приведены системы трансцендентных уравнений.

Основное содержание диссертации изложено в следующих работах.

1. Пшеничный Б. П., Покоти.ю В. Г., Кривонос И. Ю. Об оптимальном управлении оценкой параметров // Докл. АН Украины. Сер. А. — 1989. — №7. — С. 20—22.

2. Кривонос И. IO., Покотнло В. Г., Пшеничный Б. Н. Об оптимизации процесса наблюдения // Прикладная математика и механика. — 1990. — Т. 54, вып. 3. — С. 384—388.

3. Кривонос И. IO., Покотило В. Г. Об оптимальных программах параметрической идентификации //' Седьмая Всесоюз. конф. «Управление в механических системах»: Тез. докл. — Свердловск, 1990.— С. 64.

4. Кривонос И. 10., Покотило В. Г. Построение оптимальных динамических наблюдателей. — Киев, 1991. — 32 с. — (Препр. / АН Украины. Институт кибернетики; 91-13).

5. Кривонос И. Ю. Построение оптимальных процессов наблюдения // Кибернетика. — 1991. — №5. — С. 177—179.

Поди, п печ. 23.12.91. Формат 60X84/16. Бум. писч. «О». Офс. печ. Усл. печ. л. 0,93. Усл. кр.-отт. 0,93. Уч.-изд. л. 0,94. Тираж 100 экз. Заказ 1951. Бесплатно.

Редакционно-нздательскин отдел с полиграфическим участком Института кибернетики имени В. М. Глушкова АН Украины 252207 Киев 207, проспект Академика Глушкова, 40