автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Нелинейные оценки в задачах идентификации и управления стохастическими системами

кандидата физико-математических наук
Кнопов, Александр Павлович
город
Киев
год
1996
специальность ВАК РФ
05.13.17
Автореферат по информатике, вычислительной технике и управлению на тему «Нелинейные оценки в задачах идентификации и управления стохастическими системами»

Автореферат диссертации по теме "Нелинейные оценки в задачах идентификации и управления стохастическими системами"

Національна академія наук України Інститут кібернетики імені В. М. Глушкова

РГ Б ОД

1 5 ДЕК І398 н

На правах рукопису КНОПОВ Олександр’ Павлович ,

НЕЛІНІЙНІ ОЦІНКИ В ЗАДАЧАХ ІДЕНТИФІКАЦІЇ ТА УПРАВЛІННЯ СТОХАСТИЧНИМИ СИСТЕМАМИ

СЇ.Я'ІЇ

01.05.01 — теоретичні основи інформатики та кібернетики (математична кібернетика)

Автореферат дисертації на здобуття наукового ступеня кандидата фізико-математичних наук

Київ 1996

Дисертацією є рукопис.

Робота виконана в Інституті кібернетики ім. В. М. Глушкова НАН України.

Науковий керівник: доктор фізико-математичних наук, професор ЧИКРІИ А. А.

- Офіційні опоненти: доктор фізико-математичних наук,

Провідна організація: Київський національний університет ім. Тараса Шевченка.

о • * £2 МіСґіс#* //^

Захист відбудеться « -——■ 199^ р. о ----------------

год. на засіданні спеціалізованої вченої ради Д 01.39.02 при7 Інституті кібернетики імені В. М.. Глушкова НАН України за адресою:

252022 Київ 22, проспект Академіка Глушкова, 40.

З дисертацією можна ознайомитися в науково-технічному архіві інституту.

професор ГУПАЛ А. М., кандидат фізико-математичних наук

КУК ю. в.

Автореферат розісланий «■

/6

Учений секретар спеціалізованої вченої ради

СИНЯВСЬКИЙ В. Ф.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ .

Актуальність проблеми. При сучасному розвитку науки й техніки однією з основних проблем в теор" оптимального управління є підвищення якості роботи систем за реальних умов їх функціонування. Як правило, об’єкт управління зазнає різні впливи, які складаються як із корисних, так і шумьвих сигналів, цп накладені на корисні. Виникає необхідність оптимального у певному стосунку виділення корисного сигнал"' або його розпізнавання, що баз-ється на викривлених спостереженнях. Теорія оптимального управління, розпізнавання та класифікації за наявності випадкових впливів в наш час швидко розвивається, і в цьому велика заслуга А.М.Колмогорова, Н.Вінера, У.Гренандера,

Н.Н.Красовського, В.С.Пугачова, М.М.Моісеєва, Я.З.Ципкіна,

О.^.Куржанського, І.І.Гіхмана, А.В.Скорохода, І.А.Ібрагімс^а, М.В.Крилова, •\А.Парвозванського, Ю.А.Розанова, Р.ь.Хасьмінсь-кого, ААФедельбаума, А.М.Ширяєва, В.А.Якубовича та інших. В теперішній час досить повно розвинено теорію оцінювання та управління для лінійних систем з зосередженими параметрами, але теорію нелінійної ідентифікації та управління для систем із зосередженими та розподіленими параметрами розвинено ще не досить В той же час такі системи описують багато важливих фізичних процесів, що виникають у теорії розпізнвання образ"' , гідроакустиці, гідрології та інших областях. Ось чому розвиток математичних методів вирішення так. х задач досить актуальною, проблемою. ‘

Мета роботи: розвиток математичних методів ідентифікації та управління для параметричних і непараметричних моделей при наявності шуму з невідомим розподілом.

Методика дослідження. У цій роботі використовувались методи функціонального аналізу, оптимізації в нескінченновимірних

просторах, теорії випадкових процессів та ма.ематичної статистики.

Наукова новизнг. В роботі систематично досліджуються задачі ідентифікації та розпізнавання для стохастичних систем з розподіленими параметрами, Досліджені моделі нелінійної та непараметричної ідентифікації для широкого класу ^стем, на які накладаються адитивні та мультиплікативні випадкові перешкоди. Одержані твердження, що стосуються асимптотичної поведінки оцінок невідомих параметрів, які .іожуть бути й елементами деякої нескінченновимірної множини. Зокрема, доведено їх сильну ; пушність, асимптота ;ну нормальніст,., слабку збіжність функціоналів від оцінок. Наведено умови існування та єдиності оптимального управління для систем із значеннями в нескінченновимірному просторі.

Теоретична та практична цінність роботи. Результати дисертаційної роботи вносять вагомий внесок у теорію нелінійного оцінювання та управління при наявності мультиплікативних та адитивних перешкод. Розроблені методи можуть бути ефективно використані при обробці результатів експериментів у геології, екології, акустиці, теорії розпізнавання образів тощо.

Апробація роботи. Основні результати іяисертації доповідалися на сем іарах в Інституті кібернетики ім. В.М.Глушкова НАН України, Київському національному університеті ім. Т.Г.Шевченка, конференції молодих учених в Інституті кібернетики ім. В.М.Глушкова НАН України, міжнародній конференції пам’яті 1.1.; іхмана.

Публікації. Основні результати роботи викладені у публікаціях [1-6].

Структура й обсяг роботи. Робота складається з вступу, чотирьох розділів, поділених на 10 параграфів, та списку літератури з 60 найменувань. Загальний обсяг роботи складає $0 сторінок.

ЗМІСТ РОБОТИ

У вступі аналізується стан проблеми, обгрунтовується актуальність, теорзтична та практична цінність досліджуваної тематики, виділяється коло основних задач та ціль дослідженні. Сформульовано основні наукові положення, що виносяться до захисту.

У першому рс^ділі •‘Параметричні моделі ідентифікації стохас-тичних систем" досліджуються проблеми .оцінювання нелінійних параметрів при наявності адитивної' та мультиплікативної перешкод. Перша частина розділу присвячена оцінюванню невідомого параметра, що входить до функції зсув стохастичного диференціального рівняння нелінійно. Розглядається клас квази-стаціонарних процесів та доводиться сильна слушність та асимп тотична нормальність оцінок найменших квадратів. У другій частині рооділу розглядається інший клас задач ідентификації. Припускається, що на вхідний сигнал системи накладено мультиплікативну та адитивну перешкоди. Сам сигнал лінійно залежить від невідомих параметрів, які слід оцінити оптимальним чином. В задачах розпізнавання особливу роль через свої численні застосування мають дослідження, що стосуються систем з розподіленими параметрами. Обмежимося двовимірним випадком, розгляд випадку більшої розмірності здійснюється аналогічно. Перший параграм має характер вступу. В другому параграфі розглядається така молель спостереження:

5(о0,г)- т(о„,г)+ Іл(/,т )с/£(т ), І є[0,і],

де 0„ — невідомий параметр, т(в,г) та Л(/,г) — функції відомого вигляду, |(/’) — процес з ортогональними приростами. Необхідно за спостереженням [5(ои,/),гє[о,г]} оцінити о0. У подальшому припускається, що випадковий процес 5(о„,/) є квазистаціонарним за визначенням, наведеним у роботі. Як критерій для

оцінювання невідомого параметра 90 є© розглядається метод

найменших квадратів, а саме Qr(e)-y/[,s(e0,f)-т(е,/)]!£Л. Величину

• ' ' ' ‘ 0

ог, що задог-ільняє співвідношенню minQr(e) - QT(er), вибираємо

за оцінку б0. Справедливе твердження.

Теорема 1.1. Нехай при довільному о є© випадковий процес 5(о,/) є квазистаціонарним та виконуються такі умови:

' І Т 2 ' ‘

1) існує limy/[m((i,r)- т(о0,г)]‘Л - V\„ ,В0);

' ' о

2) m{Q,t) * /я(0о,/) пр.- в » й0; '

3) Цо,,/)- /ф,,г|s ф,-а,{, де стала с не залежить від /,0,,0Г

Тоді />|рт- ofl|-1.

Якщо о0 — внутрішня точка множини 0, то за деяких додаткових умов, що стосуються збіжності інтегралів від функції гф,і) та двох її" перших похідних за аргументом 0, можна довести, що величина л/Г(ог - о0) слабко збігається до гауссової величини з нульовим середнім та дисперсією заданого вигляду.

У третьому г зраграфі вивчаються властивості оцінок найменших квадратів для невідомих параметрів функції регресії, що спостерігається з мультигтікативною та адитивною перешкода- їй. Модель спостереження має вигляд

де а, — невідомі параметри, <г4(*.0 — відомі функції, §(*, /) та іі(.і,/) — однорідні та ізотропні у вузькому сенсі випадкові поля. Будемо вважати, що виконуються такі припущення:

1. Нехай (іх-(и.....,и„) — н^оір дійсних чисел, (<£,(*./)....<Г„(.м))—

фіксований набір • дійсних неперервних

s

функцій в R2, <р'- (у....,ф„). Позначимо

- jjcfl(s,i)dsilt,

C(r,,r;) - {См):г. s s1 + r1 s r, j, G'lr) - {(s,f):s: + t2 s r:},

0(r) - (al(r)5 J* , <prM - 0'K(4v).

1a. Для деякого L > о та будь-яких ііЬи та г>0 справедлива нерівність ■

! «Г'(г) max ■

U/jCGir) /*

1 б. Для деякого L > 0 при довільних s, t та г > о IJJ<P' (S, + у, tx + |/|)ср' ’ (S,, і, )<*, dr, - В[JT, /)

з;.эякою матрицею S(s,r) - ,, елементи якої — неперервні

від (і.г) функції, а 5(0,0) — додатно визначена. -

1в. Функції <р, U,t) — лінійно незалежні на множинах додатної міри Лебега. .

2. Випадкові поля i(j,/) та гі(і,г) —однорідні та ізотропні у вузькому сенсі, Еї(ї,і) - a, Eq(s,r) - 0 і кожне з них задовольняє умові сильного перемішування : , sup !/>(^й)-?(Л)Я(ВЬ<|.И^,Р))5~,

^ЄА(5).вЄА(/“) - а

де S, п є R" ,\(S) — о-алгебрі, породжена випадковим полем {5(s,»),(s,f)e5} або (гі(і,/),(і,()є5’- відповідно,

d(S, f) - inf{i!jc - >’!, х eS,y є F}, <j>0— функція дійсного аргумента rftl), ДЛЯ ЯКОЇ ф((/) t о При d -* =С.

3. £|с(ї,г)!?*' <*, £"(п(і,/|2'6 < =С, Ь>~. кореляційні функції

Н{г) - £[* (і, і) - а][с (0,0) - а] та Л,(г) - £п(.г,?)п(0,0), г + і2 - г2 такі, ЩО

[гЕ{г)ііг та //ДМл- є скінченними величинами.

0 0

4. Випадкове поле |(і,г) є гауссовим.

Оцінка найменших квадратів має вигляд

а(ґ) - Г~'(г)//у)ф(и.і'ІЛЛ,

бй)

де г(г)— матриця, що визначена рівністю , .

г(г)- Дч^и.уЫи- у)’?(м. . ■

. біг)

Справедливі твердження:

Теорема 1.2. Нехай виконані умови 1-4. Тоді

/>|іітсР(г) - сР| - 1.

Теорема 1.3. Нехай виконані умови 1-4. Тоді розподіл вектора 2^(/-)[оР(а)-сГ] при л -* ос слабко збігається до нормального розподілу вгз середнім 0 та матрицею коваріацій Р - г'7/г~', де матриця Н має еигляд

2ч *

И - //гК,(г)[я(г) + а:]В(гсо5<р,г5иіср)Лї/ср.

' 0 0 . . . ■

У другому розділі “Моделі нелараметричної ідентифікації за скінченним числом спостержень або реалізацій” розглядаються задачі оцінювання математичного сподівання, що є елементом деякої компактної множини функцій простору 4- Тут необхідно підкреслити, що у оагатьох моделях, які зустрічаються на практиці, не вдається параметризувати невідому функцію, але її все одно необхідно визначити якмога точніше. за деяким набором її спостережень у скінченній кількості точок або кривих.

Наприклад, у двовимірному випадку модель, що розглядається, можна інтерпретувати як задачу про оцінювання сигналу визначене о виггіяду, що подається об’єктом у дискретному числі точок площини з випадковими помилками.

Інша інтерпретація моделі полягає у тому, що сигнал, який подається, може спостерігатися у різні моменти часу у вигляді незалежних реалізацій. Обидві ці моделі виникають при розв’язанні задач розпізнавання невідомих об’єктів у радіолокації, гідроакустиці та ін.

Перший параграф має вступний характер. У другому параграфі досліджуються оцінки найменших квадратів для функції регресії, що спостерігається у суміші з адитивною перешкодою на прямій. Сформулюємо задачу чіткіше.

1. Нехай К - {х(/),г є[о,і]} — компактна в сенсі збіжності в Ц множина дійсних функцій, що задовольняє таким умовам:

a) Іх(/)| і 1, де |х(0І2 - .1 Х2(і)с1г; ■

. • 0

b) х(і) може мати скінченну кількість точок розриву першого роду та задовольняє в інтервалах неперервності рівномірній умові Ліпшиця |х(0-л(л)| ^ с)/, -с:], причому стала с не залежить від функції х та точок і, і

2. Для кожного п г і — незалежні випадкові величини,

що задовольняють умовам

a) £=„, - 0;

b) £[?о„Ґ • °2 < *. £[іо„Г “7 .

Припустимо, що для фіксованої функції а„ є К спостерігаються

випадкові величини .Ть - + ;,„0ід ІЛ.

На основі х„„ вимагається оцінити невідому функцію а0 є А'. Як оцінку а0 будемо розглядати оцінку а„ найменших квадратів. Величина а, — елемент з К, що визначається співвідношенням

Оскільки множина К компактна, мінімум досягається. Можна довести, що а„(г) можна обрг..'и сепарабельним рчпадковим процесом. Справедливі твердження:

Теорема 2.1. Нехай виконані умови 1 та 2. Тоді

- о|- і.

Теорема 2.2. Нехай виконані умові; і, 2, а також

1) а0 є внутрішньою точкою множини к;

2) £І5о„Г - V <*.

/

Тоді послідовність випадкових процесів л/л/[а,,(н)-а0(и)]Л/ слабко

0 . '

збігається при п — * до стандартного вінеровського процесу.

У третьому параграфі досліджуються непараметричні оцінки функції регресії, що побудовані за скінченним числом незалежних реагзацій. Зробимо такі припущення. .

1. Нехай К - /),($,г) є О - [о,і]3} — компактна в сенсі збіжності

в и множина дійсних функцій, що задопльняе умовам

а) І;л(і,/)!; а і, де |}л-(5,г)|‘ -/]*•’.

* 0 О -

б) л(5,<) за другою змінною може мати скінченну кількість точок розриву пер :ого роду та задовольняє в інтервалах неперервності рівномірній умові Ліпшиця:

]А-(л,/:)-.ф./,;| і с)/, ' .

де с не залежить від функції х та точок (5,/,) і (і, г,).

2. £,„(*), Оііїі, о для кожного л* І,- незалежні

випадкові процеси, що задовольняють таким умовам:

а) при і * у процеси {;„(*)} і стохастично еквівалентні в

широкому ~ьнсі; ' ’ '

у

б) £^о,(і)-0 при Оії а і; .

в) £§„„(*)§;„(/) - (5,/) є о з неперервною на О функцією

ЇМ.

Припустимо, ідо для фіксованої функції а0 є К спостерігаються з випадковий 1 помилками'» розтини, що відповідають відрізкам у о

з ординатами - для Оі/і л, тобто

П

На основі спостережень {*,„(.*)} вимагається оцінити функцію

а„ЄК. -

Як оцінку для а„ будемо розглядати оцінку а„ методу найменших квадратів. Величина а„ є елемент із К, визначений співвідношенням

. _ _ і . _ 2

ДГ^О)^

■V / У'12

Оскільки множина К компактна, мінімум у лівій частині (1) досягається. Можна довести, що а„(.м) можна вибрати сепзра-бельним випадковим полем. Справедливі твердження:

Теорема 3. Нехай виконані умови 1, 2 та <ч <00 • Тоді

ітІсх.М-«,(*./)!-о}-і.

Теорема 2.4. Нехай виконані умови 1, 2 та умови

1) а0 Є внутрішньло ТОЧКОЮ МНОЖИНИ К\

2) *и<».

Тоді послідовність випадкових полів слабко збігається до

гауссового поля в D з нульовим середнім і кореляційною функцією

Г R(u,v)dudv min(r,

* 0 О

У четвертому параграфі досліджується інший клас оцінок — так звані проекційні оцінки. Припускається, що оцінювана, функція а(/)

має випіяд а(г) - ^ауфу(;), де числа aj задовольняють умові ^“*0 + ju) < L, р >і, L> о Введемо позначення: '

Припускається, що функції <ру(г) в інтервалі [0,і] обмежені та задовольняють умові Ліпшиця. Має місце твердження:

__J_ .

Теорема 2.5. Для оцінки а;(/) при N~n2f'' маємо співвідношення

л_ , -

lim sup £ViJP "Jljaj^(/) — ot '/)jj sc.

«-■* (І6АҐ ' ' ' ■

Аналогічний результат спостерігається і в двовимірному випадку.

Припускається, що є скінченна кількість спостережень

**”" " а°(л’и) + ^""’ 0 s ' s 0 s / s де Z”m — послідовність серій дійсних випадкових величин,

незалежних у кожній серії, £?'" - 0, £рГІ" “ °: • Задача полягає в оцінюванні функції а0 єК. Нехай

т

%<*ГчіМ> ЇЙ5-'''"2 -//“М-ї.Ф.л-

Со оо

Припускається, що функції 9,(5,/) в області [о,і] х[о,і] обмежені та задовольняють умові Діпшиця. Справедливе твердження:

Теорема 2.6. Нехай N ~( ' 5. Тоді.

/ п'тг ' (2)

Ііт Біір£ ~Т~~~л |^уи0-а л,/)| <с.

У заключній частині параграфу розглядаються проекційні оцінка у випадку, коли спостеоігається скінченна кількість незалежних реалізацій невідомої функції регресії з адитивним шумом. У цьому випадку для проекційної оцінки також має місце оцінка типу (2).

У третьому розділі “Задача управління рішенням стохастичного ДИфереНЦІаЛЬНОГО РІВНЯННЯ У ГІЛЬберТОВСМу ПРОСТОРІ” рОЗГЛЯ-даЄІ иСЯ задача управління функцією зсуву наступного диференціального рівняння зі значеннями у гільбертовому просторі Н:

де (и',,гє[0,7’]) — вінеровський процес на ймовірнісному просторі (£2, \ Р) зі значення..,и й деякому імовірнісному просторі Я., керування м-(»„іе[о,Т]) та функція зсуву / —

неупереджувапьні функціонали від керованого процесу | зі значеннями в просторі керуючих впливів и та гільбертовому просторі Н відповідно. Вимагається знайти у деякому класі припустимих законів керування ІІ керування и' - («;(|),г є [0,7']),

Г

що мінімізує критерій £/с(м)л, де функція втрат с —

- 0 . -

неупереджувальний числовий функціонал.

Рішення рівняння розуміється у слабкому сенсі. В роботі наведено необхідну й достатню умову існування слабкого рішення рівняння (3). Припускатимемо, що ^ і), /є[0,г], хєст — банаховому простору неперервних функцій, В — о-алгебра борелевських підмножин [о,7], А(—о-алгебра підмножин Сг, породжена циліндрами з основами на [0,Г]. Вважатимемо, що функція витрат с(і,х) є Вх А, - вимірною, неупереджувальною та задовольняє умові 0 * с(г,х) * £ < *. Основний результат розділу полягає у наступному:

Теорема 3.1. Існує и єи, таке, що

Т Т

£„./с(^Уг-тіпЕ,/с(ї,!)Л. •

0 -Є ' 0 .

Четвертий розділ дисертації має прикладний характер. У ньому поставлені мйякі задачі, для вирішення яких виникає необхідність дослідження проблем, описаних у попередніх розділах.

ОСНОВНІ РЕЗУЛЬТАТИ РОБОТИ

1. Досліджені нелінійні моделі регресії для динамічних систем з адитивним білим шумом. Наведені твердження про сильну слушність та асимптотичний розподіл запропонованих оцінок.

2. Досліджена нестаціонарна нелінійна модель регресії для стохастичної системи з розподіленими параметрами. Наведено явний вигляд оцінок, що має просту структуру, доведено ряд оптимальних властивостей.

3. Вирішені задачі непараметричної ідентифікації за спостереженнями у скінченній кількості точок або скінченному наборі траєкторій. Довегзні твердження про слабку збіжність функціоналів від оцінок до деякого гауссового процесу або поля.

4. Досліджені проекційні оцінки в нелараметрпчних моделях регресії, наведена швидкість збіжності оцінок до істинної функції.

5. Досліджена задача оптимального управління для стохастичк лго рівняння в гільбертовому просторі. Одержані умови існування та єдиності оптимального управління.

У спільній роботі з П.С.Кноповим пошукувачем доведені теореми про слушність та асимптотичний розподіл наведених оцінок.

Основні положення дисертації опубліковані в таких працях:

1. Кнолов А.П. Об оценке коэффициентов регрессии с минимальной дисперсией// Методы и программные средства оптимизации, моделирования и создания вычислительных систем.— Киев: Ин-т кибернетики им. В.М.Глуиикова АН Украины, 1990.—.С. 31-33.

2. Кнопов А.П. О состоятельности оценки нелинейного параметра функции регрессии по ее наб 'юденио в смеси с аддитивным шумом// Стохастические задачи теории оптимизации и надежности.- - Киев: Ин-т кибернетики им. В.М.Глушкова АН Украины, 1993.— С. 50-J4.

3. Кнопов А.П. Об одном обобщении закона больших чисел для квазистационарных процессов// Методы управления и принятия решений в условиях риска и неопределенности.— Киев, Ин-т кибернетики им. В.М.Глушкова АН Украины, 1993.— С. 50-54.

4. Кнопов А.П. Об одной нелинейной оценке функции регрессии// Кибернетика и системный анализ. — 1994.— №4,— С. 111-116.

5. Кнопов А.П. О слабой сходимости мер, индуцированных непараметрическими оценками функции регрессии// То же. — 1995.- №2.—С. 131-137.

6. Knopov P.S Kt.jpov А.Р. On a non-parametric estimator for a regression function from a Hilbert space// Random Oper. and Stoch. Equ.— 1995.—3. №2.— P. 153-160.

Кнопов А.П. Нелинейные оценки в задачах идентификации и управлений стохастическими системами. Рукопись. Диссертация на соискание ученой степени кандидата физико-математических наук по специальности 01 .o'S.ot — теоретические основы информатики и кибернетики (математическая кибернетика). Ин-т кибернетики им. В.М.Глушкова НАН Украины. Киев, 1996.

Работа посвящена исследованию нелинейных оценок в стохастических системах с сосредоточенными и распределенными параметрами. Для нелинейных оценок получены условия сильной состоятельности и асимптотической нормальности оценок. Для непа-раметрическиу моделей регрессии получены утверждения о сильной состоятельности и слабой сходимости функционалов от оценок к некоторой гауссовской функции. Для управляемых стохастических сис эм доказана теорема о существовании и единственности оптимального управления из некоторого допустимого класса.

Knopov А. P. Non-linear estimators in stochastic system identification and control problems. Manuscript. Thesis for r. degree of Candidate of Science (Ph.D.) in Physics and Mathematics in speciality

01.05.01 — Informatics and Cybernetics Theoretical Basis

(Mathematical Cybernetics). V.M.GIushkov Institute of Cybernetics of NAS of Ukraine. Kiev, 1996.

. This paper is devoted to in stochastic systems with concentrated and distributed parameters investigation. For the non-linear estimators the strong consistency and asymptotic normality conditions are obtained. For non-parametric regression models the statements about the functionals of the estimators strong consistency and weak convergence to a Gaussian regression function are proved. For the stochastic systems under control the existence and uniqueness theorem for the optimal control from some admissible class is proved.

Ключові слова:

оцінка, стохастична система, випадковий процес, нормальність, слабка збіжність, оптимальне управління.’