автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Задачи фильтрации и управления в дискретно-непрерывных системах с неопределенностью
Автореферат диссертации по теме "Задачи фильтрации и управления в дискретно-непрерывных системах с неопределенностью"
На правах рукописи
Миллер Григорий Борисович
ЗАДАЧИ ФИЛЬТРАЦИИ И УПРАВЛЕНИЯ
В ДИСКРЕТНО-НЕПРЕРЫВНЫХ СИСТЕМАХ С НЕОПРЕДЕЛЕННОСТЬЮ
05.13.01 — Системный анализ, управление и обработка информации
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Москва — 2006
Работа выполнена в Московском авиационном институте (государственном техническом университете).
Научный руководитель:
Научный консультант:
Официальные оппоненты:
Ведущая организация:
доктор физико-математических наук, профессор Панков Алексей Ростиславович
кандидат физико-математических наук, доцент Борисов Андрей Владимирович
доктор технических наук,
профессор Рубинович Евгений Яковлевич
кандидат физико-математических наук, доцент Руденко Евгений Александрович
Институт проблем передачи информации РАН
Защита состоится "£L" г. в 1L ч. мин. на заседании
Диссертационного совета Д212.125.04 при Московском авиационном институте (государственном техническом университете) по адресу: 125993, Москва, А-80, ГСП-3, Волоколамское ш., 4, Ученый совет МАИ.
С диссертацией можно ознакомиться в библиотеке МАИ.
Автореферат разослан IWb г.
Ученый секретарь Диссертационного совета, кандидат физико-математических наук
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Объект исследования. В диссертационной работе изучаются задачи оптимальной фильтрации и управления в дискретно-непрерывных динамических системах с априорной неопределенностью.
Актуальность темы. Интерес к различным проблемам оценивания и управления в стохастических динамических системах на протяжении последнего полувека стабильно растет. Прежде всего, это связано с общим повышением наукоемкости всех сфер человеческой деятельности, а также критической значимостью тех ее областей, в которых полученные результаты по оцениванию и управлепию находят свое применение: мониторинг и управление техническими, экологическими и социальными объектами, проектирование новых образцов техники, обработка информации в информационно-телекоммуникационных системах, оптимизация деятельности в области страхования и финансов и многое другое. Помимо этого, в последние годы наличие необходимого математического аппарата, а также развитие и доступность средств вычислительной техники позволили описывать и моделировать такие сложные реальные явления, которые еще в недавнем прошлом казались недоступными ни в плане построения адекватной математической модели, ни в плане решения для нее задач оценивания и оптимизации.
Тем не менее, практические проблемы в областях навигации и управления, телекоммуникаций, физики плазмы, сейсмологии, распознавания образов, финансовой математики и пр. указывают на наличие широкого класса стохастических динамических систем наблюдения, для которых задачи оценивания и управления еще не решены. Отличительная черта этих систем заключена в наличии неопределенности, которую можно подразделить на два типа:
а) полное или частичное отсутствие априорной информации о распределении или о статистических характеристиках случайных процессов — возмущений/шумов в системе;
б) способность динамической системы случайным образом менять свою структуру.
Помимо указанных неопределенностей, непосредственному применению известных результатов из области оптимального оценивания и управления препятствует и наличие наблюдений, производимых в случайные, не зависящие от наблюдаемого процесса моменты времени и в присутствии шумов с неизвестными или неточно заданными параметрами.
Указанные обстоятельства делают разработку методов оптимального оценивания (в частности, фильтрации) и управления в дискретно-непрерывных системах в условиях неопределенности, весьма актуальной.
Одним из наиболее продуктивных подходов к исследованию систем,
в которых отсутствует полная информация о распределениях возмущающих процессов, является минимаксный (гарантирующий) подход, заключающийся в определении такой стратегии оценивания или управления, качество которой при наихудшем на множестве неопределенности сочетании неизвестных параметров будет наилучшим по сравнению с другими стратегиями. Таким образом, имеет место игровая постановка, в которой критерий качества оценивания или управления минимизируется по одному параметру (алгоритму фильтрации или управления) и максимизируется по другому (неопределенным параметрам модели).
Первые исследования стохастических систем с применением минимаксного подхода связаны с именами Б.Ц. Бахшияна, И.Я. Каца, H.H. Красовского,
A.Б. Куржанского, М.Л. Лидова, Я.З. Цыпкина, Ф.Л. Черноусько, П.Е. Элья-сберга, A. Wald, Р. Huber. В дальнейшем для динамических стохастических систем этот подход применялся в работах Б.И. Ананьева, Г.А. Голубева, М.И. Гуссва, А.И. Кибзуна, М.Н. Красилыцикова. В.В. Малышева, А.И. Ма-тасова, А.Г. Наконечного, А.Р. Панкова, Б.Т. Поляка. Е.Я. Рубиновича, Г.А. Тимофеевой, В.И. Ширяева, L. El Ghaoui, C.J. Martin, M. Mintz, J.M. Morris, H.V. Poor, S. Verdû.
В большинстве работ, связанных с применением минимаксного подхода, осуществляется прямой синтез минимаксного фильтра или стратегии управления, что в общем случае является трудноразрешимой задачей. Особенно сложной эта задача является для стохастических дифференциальных и дифференциально-разностных систем, поэтому для них необходима разработка иных методов решения задач минимаксной фильтрации и управления. Реальную возможность получить явные уравнения фильтров и управляющих стратегий дает подход, основанный на переходе к двойственной задаче. Применение такого подхода к задачам минимаксного оценивания было начато относительно недавно в работах А.Р. Панкова, К.В. Семенихина,
B.Н. Соловьева, C.J. Martin, H.V. Poor, S. Verdü.
Системам со случайной структурой также посвящено значительное число исследований. Обычно в качестве разрывных процессов, задающих программу смены структуры, рассматривались процессы, обладающие марковским свойством. Изучению задач анализа, оценивания и управления марковскими скачкообразными процессами посвящены ставшие уже классическими работы Е.Б. Дынкина, R. Boel, М.Н.А. Davis, H.J. Kushner, P. Varaiya, W.M. Wonham и др. Первая попытка придать диффузионным процессам свойство случайной смены структуры принадлежит Р.Л. Стратоновичу. В дальнейшем к исследованиям диффузионных процессов со скачками обращались И.И. Гихман, Р.Ш. Липцер, A.B. Скороход, А.Н. Ширяев, J.L. Menaldi и др. При детальном рассмотрении систем со случайной струк-
турой выделился некоторый подкласс, характеризующийся тем, что систему наблюдения можно декомпозировать таким образом, чтобы выделить автономный марковский процесс переключений. Обычно этот процесс недоступен прямому наблюдению, однако от него может зависеть структура остальных уравнений состояния и наблюдений, а также входящие в них возмухцающие процессы. Из-за такой особенности указанный подкласс динамических систем получил название скрытых марковских моделей (СММ). Теория СММ имеет многочисленные приложения, включая управление запасами и финансами, общими динамическими системами, управление в системах передачи данных, обработку сигналов, алгоритмы распознавания речи. В настоящий момент теория развивается благодаря работам A.B. Борисова, В.В. Домбровского, И.Я. Каца, Б.М. Миллера, В.В. Моттля, И.Б. Мучника, П.В. Пакшина, Y. Bar-Shalom, К. Barboza. F. Dufour, R.J. Elliott, M.D. Fragoso, L.R. Rabiner, W.J. Runggaldier, C. de Souza, G. Yin.
В монографии Липцера и Ширяева1 приведена формула условного математического ожидания одного квадратично интегрируемого семимар-тингала относительно другого. Данная формула является теоретическим базисом для решения любой задачи оптимального в среднеквадратическом смысле оценивания. Однако, из-за своей общности данный результат не может быть непосредственно применен при решении конкретных задач оценивания, поэтому актуальной является проблема «локализации», т.е. получения соответствующих формул, применимых в случае конкретной системы наблюдения.
Цели и задачи работы.
1. Решить задачу оптимальной в среднеквадратическом смысле фильтрации случайного процесса, заданного линейными разностными или дифференциальными уравнениями по дискретным и непрерывным наблюдениям в условиях априорной неопределенности в описании вторых моментов возмущающих процессов в уравнениях состояния и наблюдения.
2. Решить задачу оптимальной в среднеквадратическом смысле фильтрации марковского процесса с дискретным временем по комплексным косвенным наблюдениям, содержащим зашумленные и точные компоненты.
3. Решить задачу оптимального среднеквадратического управления в линейной дифференциальной системе с неопределенными интенсивностями шумов в уравнениях состояния и наблюдения.
4. Исследовать частную задачу оптимального управления скрытой марковской моделью с конечным числом состояний по наблюдениям считающего процесса.
1Липцер P.I11., Ширяев А.Н. Теория мартингалов.—М.: Наука, 1986.
5. Разработать численные методы решения указанных задач фильтрации и управления и применить их для решения прикладных задач.
Методы исследования. Для исследования теоретических проблем использовались методы теории вероятностей, теории случайных процессов, теории мартингалов, функционального анализа, теории двойственности, методы условной оптимизации. Для исследования прикладных задач использовались методы компьютерного моделирования.
Научная новизна.
1. Решены задачи фильтрации и управления в линейных разностных и дифференциальных неопределенно-стохастических системах с интегральным среднеквадратическим критерием качества. Найдены достаточные условия, при которых минимаксное решение однозначно определяется решением двойственной задачи.
2. Для решения двойственной задачи фильтрации и управления в линейных системах с параметрической неопределенностью разработан итерационный численный метод и доказана его сходимость.
3. Найдено решение задачи оптимальной в среднеквадратическом смысле фильтрации состояний специального марковского процесса, порожденного марковской цепью с конечным числом состояний.
4. Поставлена задача стохастического оптимального управления скрытой марковской моделью по наблюдениям считающего процесса. Получены необходимые условия оптимальности управления в форме стохастического принципа максимума. В одном частном случае оптимальное управление получено в явном виде.
5. Полученные теоретические результаты применены к задаче прогнозирования параметров движения летательного аппарата и задачам передачи данных по каналам связи.
Практическая значимость. Полученные результаты позволяют решать прикладные задачи фильтрации и оптимизации из области экономики и телекоммуникаций, задачи обработки сигналов и изображений, задачи оценивания параметров и управления движением летательных аппаратов.
Апробация работы. Результаты диссертационной работы обсуждались на
следующих научных конференциях и симпозиумах: 43-я Международная конференция IEEE по управлению и принятию решений CDC-2004, (Багамские о-ва, Нассау, 2004); 9-ая и 10-я Международные конференции «Системный анализ и управление» (Украина, Евпатория, 2004 и 2005), 4-ая Международная конференция «Идентификация систем и задачи управления» SICPRO-2005, (Москва, 2005); 16-й Международный конгресс IFAC (Чехия, Прага, 2005); 2-я Научная сессия Института проблем информатики РАН (Москва, 2005); 24-я Международная конференция IEEE по системам передачи данных
ШРОСОМ-2004, (США, Майами, 2004); 3-я Международная конференция по проблемам управления (Москва, 2006), а также на научных семинарах под руководством проф. А.И. Кибзуна (МАИ) и проф. Э. Альтмана (ШЫА, Франция).
Диссертация была поддержана грантами РФФИ К8 02-01-00361, №05-01-00508, ШТАБ №У8Р 04-83-3623, грантом Москвы 2005, проектом 1.5 программы ОИТВС РАН «Фундаментальные основы информационных технологий и систем» и выполнялась в рамках программы «Котутель» (СоШеНе) на основании соглашения о совместном прохождении аспирантуры между Московским авиационным институтом (руководитель проф. А.Р. Панков) и университетом Ниццы (ХЛЧСА, Франция, руководители проф. Э. Альтман, проф. К. Авраченков).
Публикации. Основные результаты диссертации опубликованы в пяти статьях [1-5], в отчете по НИР [6], в сборниках трудов [Т—10] и тезисах [11-14] научных конференций.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, приложения, заключения и списка литературы (146 источников). Объем диссертации —130 м.п.с.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность исследуемой проблемы, сформулированы цель и задачи диссертационной работы, перечислены полученные в диссертации новые результаты, обоснована их теоретическая и практическая ценность, описана структура диссертации.
В первой главе рассмотрены и решены задачи оптимальной линейной фильтрации в условиях неопределенности в различной постановке.
Рассматривается следующая система наблюдения на интервале £ € [0, Т]:
с! Уг = агУ1 с1£ + Ъь&ти у0 = 0, (1.1)
= ъугдЛ + го = 0, (1.2)
С* = /кУгк + Vк, (1.3)
где 6 1р — фазовый вектор системы; € — вектор непрерывных наблюдений в момент £ е [0, Т]\ 6 М9 — вектор дискретных наблюдений в заранее известные фиксированные моменты времени 0 ^ ¿1 < ¿2 < • • • < ^ < Т; го4 € Шг — центрированный процесс с ортогональными однородными прирахцениями, т.е.
cov(wt, гот) = 7„, тт(£, г), Е [гу4] = 0; (1.4)
v¡c — центрированный стационарный в широком смысле векторный белый шум с cov(í/fc,i/fe) = матричные функции at> bt, ct и dt известны и имеют кусочно-непрерывные по t компоненты; Д — известные матрицы.
Относительно матрицы интенсивностей yw предполагается, что Е € Г,а С RrXr, где множество Г™ состоит из неотрицательно определенных матриц. Ковариационная матрица 7„ также известна лишь с точностью до принадлежности некоторому множеству положительно определенных матриц: 7„ € Г„ С М9*9. Кроме того, предполагается, что
а) существует константа Cw > 0 такая, что для любого t G [0,Т] и любого ц 6 Ы\ = 1
inf n*dt7wdin ^ Cu..; (1.5)
б) существует константа Cv> 0 такая, что для любого tk и любого ¡л 6 R9:
IHI = i
inf ^ cv. (1.6)
-у„ег„
Пусть 7 = diag(7tu,7v) — блочно-диагонапьная матрица, включающая в себя все неизвестные параметры уравнепия динамики фазового вектора (1-1) и уравнений наблюдения (1.2), (1.3). Множество
Г = {diag(7 til) 7,): . 7ui с * tu» iv е г,} (1.7)
называется множеством неопределенности модели (1.1)—(1.3).
Пусть yt — линейная неупреждающая оценка для yt по наблюдениям Zdc = {^r.Cfc = O^r^ t\ tk ^ í}, вида
Ш = Р{г*Лс)=}дс{г,т)&гт+ £ gd(t,tk)Ck. (1.8)
0 k;tk^t
Далее предполагается, что оператор оценивания F принадлежит множеству JF, которое образуют фильтры вида (1.8).
Пусть Pw — закон распределения процесса wt в (1.1) и (1.2), a Pv — совместный закон распределения случайных величин щ, к = 1,... ,N в (1.3). Пусть также совместное распределение Р = (Pw, Pv) 6 V, где V — класс всех возможных пар распределений (Pw,Pv), удовлетворяющих условию 7 е Г из (1.7).
Для каждого Р € V качество оператора оценивания F(-) определяется величиной интегрального среднеквадратического критерия
J(F,P) = E
SüZtbdt
о
(1.9)
где & = Ш — у г ~ ошибка оценки в момент Ь € [О, Т]; Е< — неслучайная известная матричная весовая функция с кусочно-непрерывными компонентами, Е* = Е£ и Е4 >: 0 (неотрицательно определена), t £ [О, Г].
Известно, что Е [£*Е4£4] = 1т(Е4Е [&£*])> поэтому в силу Е = О
3(Р, Р) = J(F, 7) = / ЗДг, (1.10)
о
где Я4 = 7) = соу(£4,£4) — ковариационная матрица ошибки
Для оптимизации фильтра по критерию (1.10) предлагается использовать минимаксный подход, состоящий в решении следующей задачи:
Г е аг^твир 7(^7). (1-И)
Задача (1.11) называется прямой задачей минимаксной оптимизации, а Р — минимаксным фильтром. В некоторых специальных случаях, например, при наличии максимального элемента на множестве неопределенности, задача (1.11) имеет явное аналитическое решение, однако в общем случае она является трудноразрешимой, поэтому вместо прямого синтеза минимаксного фильтра предлагается использовать двойственную задачу:
7 € альтах .7° (7), (1-12)
Ч€Г
где <7° (7) называется двойственным критерием и определяется следующим образом:
.7° (7)= ш^ОДт). (1.13)
Смысл решения двойственной задачи состоит в выборе такого сочетания неизвестных параметров распределения возмущений, при которых оценка, оптимальная по выбранному критерию качества, будет наименее точной. Другими словами, такое сочетание параметров является «наихудшим» на выбранном классе. Оказывается, что при выполнении некоторых условий, минимаксный оператор оценивания выражается через решение двойственной задачи, а именно, Р 6 aгgmin 3{Р, 7).
Предположим, что известны истинные значения — матрицы интенсивности шумов в (1.1), (1.2) и 0„ — матрицы ковариаций в (1.3). Тогда оператор фильтрации Р 6 Т, минимизирующий критерий (1.10), не зависит от Е{ и определяется соотношениями:
= + - адсИ), (1.14)
р[^к+1)(в) = (П^к+1)(в)с; + ЬЛ^УМГ1, (1.15)
к[^к+1)(в) = а^кЛк+1)(9) + 1#к'*к+1)(в)а; + ььв№ь;-
где Ь е ^куг/с+г), к = О, £о = 0, £дг+1 = Т. Начальные условия для
дифференциальных уравнений (1.14) и (1-16) в начальный момент времени £0 = 0, а также в моменты измерений задаются по формулам
=о,
д^+Одо = _ /ъдодд?;—4*>(0), А = 1.....лг,
(1.17)
(1.18)
где
= (1.19)
В дальнейшем оператор фильтрации вида (1.14)—(1.19) будет обозначаться как
Пусть Г содержит более чем одну точку. В диссертационной работе показано, что функционал 1(9,7) = 3(Ев(9), 7) может быть представлен в следующем виде:
/(0,7) = И#(0)7], (1.20)
где Н(9) — непрерывная функция, явный вид которой приведен в лемме 1.7 диссертации.
Представление (1.20) позволяет получить аналитическое выражение для двойственного функционала (1.13), показать его непрерывность по параметру 7 и доказать существование решения двойственной задачи (1.12).
Теорем а 1.8. Пусть Г^ иТ„ — выпуклые компакты неотрицательно определенных матриц, удовлетворяющие условиям (1.5) и (1.6), тогда
а) двойственный функционал .7° (7) имеет явный вид
3°(>у) = И#(7)7]; (1.21)
б) решение 7 двойственной задачи (1.12) существует.
В следующей теореме определена седловая точка (Ё, 7) в задаче фильтрации (1.1)—(1.3), (1.10).
Теорема 1.9. В условиях теоремы 1.8 пара (Ё, 7), где Ё = 7), образует седловую точку критерия 3(Р, 7) на Тх Г. При этом гарантированное значение 3 критерия равно 3 — 3°(7).
Следствие 1.3. Оператор Ё = 7) является минимаксным оператором линейной фильтрации на Р х Г.
В диссертационной работе задача минимаксной фильтрации по интегральному критерию решена также для систем более частного вида:
1) для случайного процесса, заданного стохастическим дифференциальным уравнением (1.1)
— по непрерывным наблюдениям (1.2);
— по дискретным наблюдениям (1.3);
2) для случайного процесса, заданного стохастическим разностным уравнением, по дискретным наблюдениям.
Во всех этих задачах вторые моменты шумов предполагались известными лишь с точностью до принадлежности некоторым выпуклым множествам неопределенности. Для всех моделей получено представление вида (1.20) для функционала 1(0,7) = 3(Рор1(в), 7), где — оператор оптимальной
фильтрации в модели с фиксированными вторыми моментами шумов, равными в (леммы 1.1—1.6). С помощью указанного представления найден аналитический вид двойственного функционала, доказано существование решения двойственной задачи (теоремы 1.1, 1.3, 1.6), получены теоремы о седловых точках критерия, ал алогичные теореме 1.9 (теоремы 1.2, 1.4, 1.7).
В первой главе также рассмотрена задача фильтрации дискретного процесса со случайной структурой. Процесс может функционировать в конечном числе режимов, переключение между которыми происходит под управлением марковской цепи с конечным числом состояний:
если 9г ф
е\_ххи если е1 = в1-х и 14 = 1, (1.22)
У*-!, если 04 = 0е_х и ф 1,
где
1) У* (Е М1 — состояние системы в момент времени Ь, Уо = в£Хо\
2) {0} — марковская цепь с конечным множеством состояний 5дг = = {ех,..., едг}, где е^ 6 К" — единичные векторы, известными начальным распределением ро и последовательностью переходных матриц Pi = = 11^11^=1;
3) — последовательность независимых одинаково распределенных случайных векторов У1 = со1(и£,..., у^), компоненты которых также независимы и имеют распределение Бернулли с параметрами =
4) {^¿(ОЬ г = 1,..., N — набор плотностей распределений;
5) — последовательность, образованная независимыми одинаково распределенными ^-мерными случайными векторами, независимые компо-
ненты которых имеют плотности фг(-)'- ^ = со1(х£,..., х^), х\ ~ 'Фг(-), г = = 1.....
6) последовательности {К}, и марковская цепь 9 независимы в
совокупности.
Уравнение (1.22) состояния процесса допускает следующее более удобное для анализа представление:
У% = А(6г-1,ви + В{вг-ивиУг)Хг,
где
вфг-ивьЪ) = [1 - ^^-1(1 - в;_м]о;. Предполагается, что доступны следующие наблюдения:
гц = ь
Процесс щ 6 Ж1 представляет собой косвенные незашумленные наблюдения, а & € К1 — косвенные наблюдения состояния в присутствии шумов е1. Ошибки наблюдения — независимые одинаково распределенные случайные величины с плотностью распределения <ре(и).
Необходимо отметить, что зависимость уравнений наблюдения от состояния марковской цепи определяет нерегулярный характер поступления наблюдений: в зависимости от коэффициентов Аг и функций с^(-), &(•) возможны случаи, когда наблюдения поступают в случайные моменты времени, зависящие от значений марковской цепи и процесса У^.
Задача оптимальной фильтрации состоит в определении условного математического ожидания вектора = со1(0*, Уь) относительно сг-алгебры 0% — сг{г)т,£т, т = 1,...,£}, образованной всеми наблюдениями до момента времени £. Решение этой задачи при некоторых ограничениях на функции оч(у) и описывается следующей теоремой:
Теорема 1.10. Пусть / — произвольная ограниченная борелевская
функция, тогда наилучшая в среднеквадратическом смысле оценка филъгпра-N
ции процесса /(Уе,04) = Е равна
г=1
/(Уив<) = Е[НУи0г)\дг} = ( £ ¡ф^гШь) £ / А(и)$(и)<1и. (1.25)
\Аг=1 К / г=1 К
Функции и ф\(-), i,k = 1,..., АГ, £ е N могут быть вычислены с
помощью рекуррентных алгебраических уравнений, приведенных в диссертационной работе.
(1.23)
(1.24)
Во второй главе рассмотрены и решены задачи оптимального управления в условиях неопределенности в различной постановке.
Рассматривается линейная стохастическая модель управления с непрерывным временем:
dVt = atytdt + Atutdt + btdwt> y0 --= 0, (2.1)
d zt — ctytdt + dtdwt, z0 — 0, (2.2)
где t £ [0,T], yt E Rp — вектор состояния системы; zt € IR9 — вектор наблюдения; ut GM.1 — вектор управления; wt € Мг —- центрированный случайный процесс с ортогональными однородными приращениями, удовлетворяющий (1.4).
Как и в первой главе, предполагается, что все коэффициенты системы известны и имеют кусочно-непрерывные по t компоненты. Матрица интен-сивностей 7,j, = 7 из (1.4) принадлежит некоторому априорно известному множеству неотрицательно определенных матриц: 7 € Г С R' *г.
Пусть щ — неупреждающее линейное по наблюдениям управление для системы (2.1),(2.2):
t
щ = U(Zt) = f g(t,r)dzT. (2.3)
о
В (2.3) через U обозначен линейный оператор управления, g(t,T) — его весовая функция, Zt = {гт, 0 ^ г ^ t}. Класс неупреждающих линейных по наблюдениям управлений будет далее обозначаться через U.
Пусть Р — закон распределения процесса wt в (2.1), (2.2), а V — класс всех возможных распределений, удовлетворяющих (1.4) при условии 7 Е Г.
Для каждого Р € V качество управления щ определяется величиной интегрального среднеквадратического критерия
J(U, Р) = Е
т
f {y*tQi{t)yt + u*tQ2(t)ut)dt + yfQ0yT о
(2.4)
где Qo, Qi(t) и в любой момент времени t € [0,Т] являются
неслучайными известными матрицами, причем Qo Ь 0, Qi{t) >z 0, Q2{t) >~ >- 0. Кроме того, предполагается, что Qi(t) и Qj(i) являются кусочно-непрерывными.
В силу линейности уравнений (2.1), (2.2), а также предположения (2.3), критерий J(U, Р) зависит только от параметра 7, т. е. J([/, Р(7)) = J(U, 7), причем для J(U, 7) в работе приведено аналитическое представление.
Пусть множество Г содержит лишь один элемент в. В этом случае модель (2.1), (2.2) не содержит неопределенности, а 7 = в.
Тогда управление U, доставляющее минимум критерию (2.4) при произвольном распределении Р удовлетворяющем (1.4) при 7 = в, задается следующими формулами:
ut = -Ltyu (2.5)
где yt — наилучшая линейная несмещенная оценка для yt по наблюдениям
Zt = {гг,0^г
Lt = Q;\t)A*tSt, -St = a;St + Stat + Qi(t) - StAtQ^x(t)A*tSu ST = Qo-
Если выполняется условие невырожденности шумов в наблюдениях, аналогичное (1.5), то наилучшая линейная несмещенная оценка yt определяется следующими уравнениями:
id
I У
dyt = atytdt + Atutdt + Kt(9)(dzt - ctytdt)y Уо = О,
(2.7)
Кг(в) = (Д4(0)с* + (2.8)
Г йг(6) = аМв) + Ъ(в)а; + Ьг0Ъ1 - К^Ьвд^КНб), , .
Далее оператор управления вида (2.5)—(2.9) будет обозначаться и о (9).
Пусть Г не является одноточечным, т.е. модель (2.1), (2.2) содержит априорную неопределенность. Для решения задачи оптимального управления использован игровой подход, в рамках которого найден минимаксный по ./(£7,7) на Ы х Г оператор управления II,
С/£ axgmmsup J(í/,7), (2.10) иеи -уег
для чего осуществлен переход к двойственной задаче (1.12), где (7) — двойственный функционал (7) = mí^J(U,/y).
Показано, что функционал 1(6,7) = J(Uo(6),')') может быть представлен в виде (1.20), где Н(в) — непрерывная функция, явный вид которой приведен в лемме 2.1 диссертации. Из представления (1.20) следуют явное выражение для двойственного функционала ^(7), аналогичное (1.21), и существование решения двойственной задачи. Следующее утверждение явно описывает седловую точку (С/, 7) критерия (2.4).
Теорем а 2.2. Пусть Г = Гц, — выпуклый компакт неотрицательно определенных матриц, удовлетворяющий условию (1.5), тогда пара (II, 7), где 7 — решение двойственной задачи, а О = С/о (7) оператор управления
(2.5),(2.6) при 0 = 7, образует, седловую точку критерия J(U,7) на U х Г. При этом гарантированное значение критерия (2.4) можно вычислить по формуле J = J°(7)-
Следствие 2.1. Оператор U — Uo(7) является минимаксным оператором линейного управления на 1А х Г.
Во второй главе также рассматривается задача стохастического оптимального управления скрытой марковской моделью по наблюдениям считающего процесса.
На вероятностном пространстве {il, J*7, Р} определен управляемый скачкообразный двухкомпонентный процесс {Xt,Nty t 6 [О, Т]} с кусочно-постоянными непрерывными справа траекториями. Ненаблюдаемый процесс переключений состояния системы Xt € Sn — {ei,...,en}, где е, G Rn — единичные векторы, и доступный наблюдению управляемый считающий процесс Nt G N = {0,1,...} описываются следующей системой стохастических дифференциальных уравнений:
t
Xt = XQ + f A(s,us)Xsds + Mt, (2.11)
0
t
Nt = f (c* Xs)usds + vu (2.12)
0
где Xq - начальное условие; A(t,u) непрерывна по обеим переменным; управления и(-) — положительные непрерывные справа и имеющие конечные пределы слева функции, измеримые относительно потока сг-алгебр Tf*, порожденного наблюдениями до момента времени f; Mt —- {A/tl,..., Л/"} и z/t — квадратично-интегрируемые мартингалы, с известными квадратическими характеристиками; коэффициенты с(е») = с* > 0 определяют интенсивность переходов для считающего процесса TV*.
Целью задачи оптимизации является максимизация критерия
J[U(-)]=E
т
f fo(u3,Xs)ds - kNT о
(2.13)
где к — некоторая константа, а /о (и,х) — /о (и)х — функция полезности. Компоненты вектора /о(и) = со!(/о(и, ех),..., /о(и, еп)) можно трактовать как функции полезности для каждого из состояний е,, г = 1,..., п процесса
Предполагается, что функции /о(-,е¿) являются монотонно возрастающими, строго вогнутыми и для любых с > 0 и е, удовлетворяют условию Пт[/0(и,ег) — си] = -со.
иТоо
В работе выполнено преобразование данной задачи к стандартной задаче управления по полным данным с помощью перехода к переменным тт\ = = Е [XI | J-^], i = 1,...,п, удовлетворяющим уравнениям нелинейной фильтрации (теорема 2.3), найдены достаточные условия оптимальности (теорема 2.4).
Практическое использование этих результатов требует решения уравнения динамического программирования, что при больших размерностях вектора состояния является весьма трудной задачей. Кроме того, зависимость возмущающего процесса от управления усложняет моделирование и численный анализ данной проблемы. С помощью обобщенной гирсановской замены меры (работы Л. Гальчука1. Р. Липцера и А. Ширяева2) для задачи (2.11), (2.12), (2.13) получена эквивалентная постановка задачи оптимального управления, в которой возмущающий процесс не зависит от управления (теорема 2.5). Для этой задачи сформулированы необходимые условия оптимальности управления в виде стохастического принципа максимума (теорема 2.6). Для одного частного случая, когда матрица А не зависит от и, получен явный вид управления, удовлетворяющего принципу максимума (замечание 2.7).
В третьей главе приведен алгоритм численного решения двойственных задач минимаксной фильтрации и управления в моделях с априорной параметрической неопределенностью. Доказанные утверждения о существовании решений этих задач, а также общий вид двойственного функционала позволяют получить единый алгоритм для решения всех указанных задач и доказать его сходимость.
Двойственный функционал имеет общий вид (1.21), где 7 € Г принадлежит выпуклому множеству неопределенности, а Н(-) — непрерывная функция (явный вид Н(-) приведен в диссертации для каждой модели в леммах 1.1, 1.3. 1.5, 1.7, 2.1). Двойственная задача (1.12) решается численно с помощью следующей итерационной процедуры:
Алгоритм 3.1.
1) Положить s = 0, выбрать произвольную начальную точку £ Г.
2) Вычислить Hs = H(-ys) и решить задачу обобщенного линейного
программирования 7S £ argmaxtr [//37].
7er
3) Вычислить 5S = tr [HaAys], где A*ys =7s —Если Ss ^ 0, mo 7 = *ys и процесс поиска завершен. Если 5S > 0, то перейти к следующему шагу.
4) Решить задачу однопараметрической оптимизации
1 Галъчук Л. И. Обобщение теоремы Гирсанова о замене меры на случай полумартингалов со скачками // Теория вероятностей и ее при-мепепия—1977—Т. 22, № 2.-С. 279—294.
2Liptser R.S., Shiryaev A.N. Statistics of Random Processes—New York: Springer-Verlag, 1978.
As e argmax J° (7* + ^Ъ) • Ae[o,ij
5) Положить 7s+i = 7's + ASA7S, увеличить на единицу и вернуться к шагу 2).
Пусть р(х, X) — расстояние от точки х £ Rn до множества X сМп. Далее приведено утверждение о сходимости последовательности {7S} ко множеству решений двойственной задачи Го = argmax J° (7).
тег
Теорема 3.1. Пусть выполнены условия существования решения двойственной задачи (1.12) (теоремы 1.1, 1.3, 1.6, 1.8, 2.1), тогда
1) если итерационный процесс останавливается после конечного числа итераций s*, то 7S- £ Го и J — tr[//(7s.)7s-],
2) если же s 00, то р(7в,Г0) -»0 u tr[//(7s)7s] —» Jy.
В четвертой главе приведены примеры, иллюстрирующие полученные в диссертационной работе теоретические результаты.
Модельные примеры 4.1-4.4 иллюстрируют применение алгоритма 3.1 и теорем о седловых точках критериев качества (теоремы 1.2, 1.4, 1.7, 1.9, 2.2).
В примере 4.5 рассмотрена задача определения параметров движения неуправляемого летательного аппарата в турбулентной атмосфере по косвенным наблюдениям, которые производятся в известные фиксированные моменты времени. Предполагается, что моменты второго порядка шумов в наблюдениях заданы с точностью до принадлежности некоторым множествам. Нелинейные уравнения движения и наблюдения линеаризуются в окрестности невозмущенной траектории и исходная задача сводится к задаче минимаксной фильтрации системы вида (1.1), (1-3) по интегральному среднеквадратическому критерию качества. Для полученной задачи с помощью алгоритма (3.1) найдены наихудшие сочетания параметров возмущающих процессов, получены гарантированные значения критерия, приведены уравнения минимаксного фильтра, а результаты оценивания траектории движения летательного аппарата проиллюстрированы графиками ошибок оценки.
В примере 4.6 результаты по оптимальной фильтрации специального дискретного процесса, порожденного марковской цепью с конечным числом состояний, применены к задаче оценивания текущих параметров канала передачи данных под управлением наиболее распространенного в локальных и глобальных вычислительных сетях протокола TCP (transmission control protocol). Предполагается, что канал может находится в конечном числе состояний, переключение между которыми происходит под управлением некоторой марковской цепи. Наблюдению доступен параметр RTT (round-trip time) — время между отправкой пакета данных и получением подтверждения о его получении. Предполагается, что измерения RTT происходят в присут-
ствии шума и только при определенных состояниях канала, соответствующих успешной доставке пакета адресату. Проблема фильтрации состояния канала и параметра RTT сводится к задаче оптимальной фильтрации состояний специального марковского процесса вида (1.23), (1.24), решение которой определяется теоремой 1.10. Предложенные оптимальные оценки сравниваются с результатами применения стандартного алгоритма оценивания, реализованного в современных версиях TCP.
В примере 4.7 рассматривается задача нелинейного стохастического управления скоростью передачи данных. Предполагается, что состояние соединения описывается управляемым скрытым марковским процессом с конечным множеством состояний, а наблюдаемый поток сообщений о потерянных или испорченных при передаче пакетах описывается считающим процессом, интенсивность которого зависит как от текущей скорости передачи данных, так и от ненаблюдаемого состояния соединения. Целью управления является максимизация целевой функции, которая представляет собой функцию полезности скорости передачи данных минус стоимость потерь информации. На основе результатов по управлению процессом с конечным множеством состояний, полученных в главе 2, а именно, теоремы 2.6 и замечания 2.7, получены оптимальные стратегии управления потоком данных. Качественное поведение оптимального управления сравнивается с известными субоптимальными схемами работы протокола передачи данных TCP.
В приложении приведены доказательства всех вспомогательных утверждений, использованных для вывода основных теорем.
Основные положения диссертации, выносимые на защиту.
1. Вид минимаксного фильтра для линейной дискретно-иепрерывной стохастической системы с неопределенными моментами второго порядка распределений возмущающих процессов (теоремы 1.8, 1.9).
2. Методика с.к.-оптимального оценивания состояния специального дискретного процесса, порожденного марковской цепью с конечным числом состояний, по зашумленным и незашумленным косвенным наблюдениям (теорема 1.10).
3. Вид минимаксного управления для линейной стохастической дифференциальной системы с неопределенной интенсивностью возмущающих процессов (теорема 2.2).
4. Алгоритм численного решения двойственной задачи минимаксной фильтрации для линейной дискретно-непрерывной неопределенно-стохастической системы и двойственной задачи минимаксного управления для линейной неопределенно-стохастической дифференциальной системы (алгоритм 3.1 и теорема 3.1).
Основные положения диссертации опубликованы в следующих работах:
1. Панков А. Р., Миллер Г. Б. Минимаксная линейная рекуррентная фильтрация неопределенно-стохастических последовательностей по интегральному критерию // Информационные процессы. — 2001. — Т. 1. Л"» 2. — С. 150-166.
2. Миллер Г. Б., Панков А. Р. Фильтрация случайного процесса в статистически неопределенной линейной стохастической дифференциальной системе /7 Автоматика и телемеханика. — 2005. — 1. — С. 59-71.
3. Борисов А. В., Миллер Г. Б. Анализ и фильтрация специальных марковских процессов в дискретном времени II: Оптимальная фильтрация '/ Автоматика и телемеханика. — 2005. — № 7. — С. 112—125.
4. Миллер Г. Б., Панков А. Р. Минимаксная фильтрация в линейных неопределенно-стохастических дискретно-непрерывных системах // Автоматика и телемеханика. — 2006. — № 3. — С. 77-93.
5. Миллер Г. Б., Панков А. Р. Оптимизация управления в линейных стохастических дифференциальных системах с неопределенными параметрами возмущений // Информационные процессы. — 2006. — Т. 6, № 2. — С. 131-143.
6. Miller В. M., Avrachenkov К. Е., Stepanyan К. V., Miller G. В. Flow control as stochastic optimal control problem with incomplete information / INRIA Research Report № 5239. — Sophia Ântipolis, 2004.
7. Borisov A. V., Miller G. B. Hidden markov model approach to TCP link state tracking // Proc. 43-rd IEEE Conf. Decision and Control (CDC'2004). — Nassau: 2004. —Pp. 3126-3137.
8. Pankov A. R., Miller G. B. Minimax filter for statistically indeterminate stochastic differential system // Proc. 16-th IFAC World Congress. — Prague: 2005.
9. Miller В. M., Avrachenkov К. E., Stepanyan К. V., Miller G. B. Flow control as stochastic optimal control problem with incomplete information // Proc. IEEE Conf. Computer Communications (IXFOCOM'2005). — Miami: 2005.
10. Miller В. M., Avrachenkov К. E., Stepanyan К. V., Miller G. B. Hidden markov model based flow control in TCP/IP networks // Тр. IV Междунар. конф. «Идентификация и задачи управления» (SICPRO'2005). — M.: 2005.— С. 742756.
11. Панков А. Р., Миллер Г. Б. Минимаксная фильтрация в статистически неопределённых линейных дифференциальных системах // Тезисы докладов IX-й Междунар. конф. «Системный анализ и управление». — Евпатория: 2004, — С. 120-121.
12. Борисов А. В., Миллер Г. Б. Фильтрация состояний специальных марковских процессов // Тезисы докладов Х-й Междунар. конф. «Системный анализ и управление». — Евпатория: 2005. — С. 150.
13. Борисов А. В., Миллер Р. Б. Скрытая марковская модель передачи данных по протоколу TCP /./ Тезисы докладов 2-й Научной сессии Института проблем информатики РАН. — М.: 2005,— С. 74-76.
14. Miller G. В., Pankov A. R. Minimax control in statistically uncertain stochastic differential system // Тезисы докладов III-й Международной конференции по проблемам управления (МКПУ'2006). — Т. .1. — М.: 2006. - С. 73.
Принято к исполнению 25/08/2006 Исполнено 29/08/2006
Заказ № 565 Тираж: 100 экз.
ООО «11-й ФОРМАТ» ИНН 7726330900 Москва, Варшавское ш.. 36 (495) 975-78-56 (495) 747-64-70 www.autoreferat.ru
Оглавление автор диссертации — кандидата физико-математических наук Миллер, Григорий Борисович
Введение
1. Фильтрация в системах с неопределенностью
1.1. Фильтрация процесса заданного ЛСРУ по дискретным наблюдениям
1.1.1. Описание модели.
1.1.2. Задача оптимальной фильтрации.
1.1.3. Задача оптимальной фильтрации в условиях неопределенности
1.2. Фильтрация процесса заданного ЛСДУ по непрерывным наблюдениям
1.2.1. Описание модели.
1.2.2. Задача оптимальной фильтрации.
1.2.3. Задача оптимальной фильтрации в условиях неопределенности
1.3. Фильтрация процесса заданного ЛСДУ по дискретным наблюдениям
1.3.1. Описание модели.2б
1.3.2. Задача оптимальной фильтрации.
1.3.3. Задача оптимальной фильтрации в условиях неопределенности
1.4. Фильтрация процесса заданного ЛСДУ по дискретно-непрерывным наблюдениям
1.4.1. Описание модели.
1.4.2. Задача оптимальной фильтрации.
1.4.3. Задача оптимальной фильтрации в условиях неопределенности
1.5. Фильтрация процесса в системе со скрытой марковской моделью
1.5.1. Описание модели.
1.5.2. Задача оптимальной фильтрации.
2. Оптимизация систем с неопределенностью
2.1. Управление в линейных непрерывных неопределенно-стохастических системах.
2.1.1. Описание модели управления
2.1.2. Задача оптимального управления.
2.1.3. Задача оптимального управления в условиях неопределенности
2.2. Управление в неопределенных системах со скрытой марковской моделью
2.2.1. Описание модели.
2.2.2. Задача оптимального управления.
2.2.3. Необходимые условия оптимальности.
3. Численные методы 62 3.1. ЧМ решения двойственной задачи фильтрации и управления.
4. Примеры
4.1. Модельные примеры.
4.2. Спуск JIA в турбулентной атмосфере.
4.3. Задача слежения за состоянием канала передачи данных.
4.4. Задача управления потоком данных.
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Миллер, Григорий Борисович
Данная диссертационная работа посвящена решению задач фильтрации и управления дискретпо-пепрерывпыми стохастическими процессами в различных динамических системах с априорной неопределенностью. Рассматриваются системы двух видов: с параметрической неопределенностью и с неопределенностью в виде скрытой марковской модели (СММ).
В первом случае предполагается, что некоторые параметры системы не известны, но заданы о точностью до принадлежности некоторым множествам, называемым далее множествами неопределенности. Методы решения задач оценивания и управления в таких системах можно разделить на два класса: адаптивные и минимаксные.
Адаптивные методы заключаются в совместной фильтрации/управлении в системе и оперативной идентификации (уточнении по нарастающему объему наблюдений) неизвестных параметров системы [47,49,57,70,72,74,87,91,104,105,114,128]. Минимаксный подход заключается в определении такой оценки, качество которой при наихудшем на множестве неопределенности сочетании неизвестных параметров будет наилучшим по сравнению с другими оценками [14,48]. Таким образом, имеет место игровая постановка, в которой критерий качества оценивания или управления минимизируется по одному параметру (алгоритм фильтрации или управления) и максимизируется по другому (неопределенные параметры модели).
Большое количество результатов по минимаксной фильтрации и управлению получено для детерминированных динамических систем. Для случая дискретной динамики наиболее общая модель рассматривалась в работе Д. Бертсекаса и И. Рудза [68], где предполагалось, что состояние системы в любой момент времени есть некоторая в общем случае нелинейная функция состояния па предыдущем шаге, управляющих воздействий и возмущений. Наблюдения также предполагались нелинейно зависящими от состояния и возмущений. При этом вектор, составленный из начальных условий и всех возмущений из уравнений состояния и наблюдения предполагался неизвестным, но принадлежащим некоторому известному множеству. Для такой системы предлагалась минимаксная постановка задачи оптимального управления: требовалось найти последовательность управляющих воздействий, минимизирующую критерий, представляющий собой супремум некоторой нелинейной функции состояния и управления по всем неизвестным параметрам. В качестве решения предложен алгоритм, основанный на решении задачи динамического программирования. Похожие системы изучались также Витсенхаузеном, Швеппе, Гловером в [65-67,86,131,141]. Непрерывные нелинейные модели изучались и В. Шмитендорфом в (130], где приведены достаточные условия минимаксности управления для динамической системы заданной дифференциальным уравнением с неизвестным начальным условием и для системы с неизвестным ограниченным параметром в уравнении состояния. Кроме названных работ по фильтрации детерминированных системах следует отмстить работы Дж. Морриса [113], А. Матасова [102], Г. Голубева, О. Муравлева и В. Писарева [18], И. Каца и Г. Тимофеевой [27], Верду и Пура [137], Витсенхаузена [142], Р. Габасова, Ф. Кирилловой и Т. Песецкой [15], де ла Пены, Аламо, Рамиреса и Камачо [77], а также монографию А. Куржанского [28] посвященную минимаксной нестохастической фильтрации Калмана, где возмущения предполагаются детерминированными неопределенными ограниченными последовательностями.
Наиболее общих результатов для стохастических моделей, в которых неопределенными чаще всего являются статистические параметры возмущающих процессов, удается достичь для стационарных систем, оптимизируемых в установившемся режиме. В этом случае используются в основном спектральные методы. Основные результаты в этой области принадлежат О. Куркину, Ю. Коробочкину, С. Шаталову, В. Пуру, Лузу, Вастоле, Даррагу, И. Петерсепу, В. Угриновскому, А. Савкину, Мо-хеимани [29,96,112,122,129,135]. Минимаксные варианты алгоритма калмановской фильтрации, обладающие свойством робастности к отклонению истинных момент-ных характеристик от расчетных, разрабатывались Дж. Моррисом, С. Мартином, М. Минцем, В. Пуром, С. Кассамом, Б. Бахшияном, Р. Назировым, П. Эльясбергом, JI. Эль Хаои, Дж. Галафьоре в [5,25,81,100,113]. Следует отметить книгу И. Каца [26], посвященную апостериорному минимаксному оцениванию в стохастических системах. Для моделей частного вида теория минимаксной априорной фильтрации изучалась в работах А. Матасова, А. Борисова, А. Панкова, М. Минца, Г. Голубева, О. Муравлева, В. Писарева, Д. Йохансена [18,89,102,111,117], статистически неопределенные модели, описываемые стохастическими дифференциальными уравнениями, рассматривались Б. Ананьевым, Ю. Орловым, М. Басиным, О. Куркиным, Ю. Коробочкиным, С. Шаталовым, А. Матасовым, Г. Бобриком, А. Голованом, А. Борисовым, А. Панковым в [3,7,12,29,102,115]. Кроме задач фильтрации в стохастических системах со статистической неопределенностью следует упомянуть и тесно связанные с ними задачи управления: нестационарные линейные дискретные стохастические системы исследовались Филлисом в [120], линейные дифференциальные системы — Б. Ананьевым в [2], Е. Рубиновичем в [126] рассматривались системы, заданные стохастическими дифференциальными уравнениями с мерой.
В ряде работ помимо неопределенности в возмущающих воздействиях (детерминированных или случайных), присутствует и структурная неопределенность: например, в линейной модели, рассмотренной в [100] коэффициенты уравнений не известны точно, но ограничены принадлежностью некоторым множествам. В [121] и [83] коэффициенты линейной системы выбираются из фиксированного набора в зависимости от состояния некоторой марковской цепи, матрица переходных вероятностей которой не задана. Кроме названных, необходимо отметить [132], где рассмотрена линейная динамическая нестохастическая дифференциальная система с коэффициентами, зависящими от ограниченных неизвестных функций, [76,144], где изучаются непрерывные детерминированные системы с неопределенностью в коэффициентах уравнений состояния и наблюдения, [41], где исследуется стохастические дифференциальные системы с неопределенностью в коэффициентах уравнения.
В большинстве из указанных выше работ моменты наблюдения фиксированы и неслучайны. В тоже время существует широкий класс динамических систем, в которых измерения производятся в случайные, независящие от наблюдаемого процесса моменты времени и часто только среднее время появления этих наблюдений песет информацию о некоторых характеристиках состояния. Одной из первых работ, где рассматривались задачи фильтрации для такого типа процессов была работа Воне-ма [143], полученные им уравнения известны как фильтр Вопема. Задачи управления и наблюдения стохастическими системами с дискретным изменением состояний и наблюдениями в случайные моменты времени рассматривались в работах А. Яшина (53—55], Воэлн и Варайи [G9], Вана и Дэвиса [140], П. Бремо [73], М. Маритона [9{J], и дали начало новому направлению в теории оптимального стохастического управления, известному как управление процессами со скрытыми марковскими моделями (СММ) или Hidden Markov Models (НММ) по западной терминологии [75,79]. Данная теория имеет многочисленные приложения, включая управление запасами и финансами, общими динамическими системами, управление в системах передачи данных, обработку сигналов [23,35,51,63,64,75,79,80,84,123,127,146], . Наиболее общие результаты получены, однако лишь для линейных систем, в которых использование скрытых марковских моделей позволяет моделировать спонтанные изменения как динамических так, и шумовых характеристик системы, при этом могут наблюдаться как зашумленные параметры системы, так и некоторые события, свидетельствующие о происхождении изменения, по не дающие никакой определенной информации о характере изменения. Уравнения фильтрации, которые возникают в этом случае, являются комбинацией уравнений для апостериорных вероятностей состояний и уравнений для оценки параметров модели [79,109,139]. В случае линейных систем для задач с квадратичным критерием качества можно решить и задачи оптимального управления, в которых оптимальный закон управления остается линейным, однако уравнения Риккати для цены и точности оценок модифицируются добавлением дополнительных членов [83,99].
Диссертационная работа состоит из четырех глав и приложения.
Заключение диссертация на тему "Задачи фильтрации и управления в дискретно-непрерывных системах с неопределенностью"
Заключение
В диссертационной работе решены задачи фильтрации и управления в некоторых системах с априорной неопределенностью. Для задач с параметрической неопределенностью применен минимаксный подход. Для решения задачи минимаксной оптимизации использован метод, основанный па переходе к двойственной задаче: минимаксный оператор оценивания или управления строится как оптимальный, рассчитанный на наименее благоприятное сочетание параметров модели. Данный метод позволил получить аналитическое выражение минимаксных операторов через решение двойственной задачи. Для решения последней разработан численный алгоритм.
Для задачи оптимальной фильтрации дискретного процесса, порожденного марковской цепью с конечным числом состояний по косвенным наблюдениям, на основе классического подхода к исследованию скрытых марковских моделей, а именно с помощью мартингального представления ненаблюдаемого процесса и процесса наблюдений, получены явные рекуррентные соотношения для оценок.
Для задачи оптимального управления дискретно-непрерывной стохастической системой со скрытой марковской моделью по неполным данным, путем преобразования к эквивалентной форме задачи управления для системы с кусочно-детерминированными траекториями, получены оптимальные стратегии, выраженные через уравнение динамического программирования. На основе методологии вывода условий оптимальности, предложенной в работах Кабанова и Эллиотта с учетом единственности решения стохастического уравнения в обратном времени для сопряженной переменной, выяснена структура оптимального управления. Более того, в одном практически важном случае, когда состояние марковской цепи не зависит от управления, получен явный вид управления, удовлетворяющего принципу максимума.
В диссертации решены следующие задачи:
1) Поставлены и решены задачи минимаксной фильтрации и статистически неопределенных системах, описываемых линейными дифференциальными и разностными стохастическими уравнениями.
2) Сформулирована и решена задача минимаксного управления в статистически неопределенной линейной дифференциальной системе.
3) Получены условия разрешимости исходных минимаксных задач через решение двойственной задачи, для решения которой предложена сходящаяся итерационная процедура.
4) Поставлена и решена задача оптимальной фильтрации дискретного процесса, порожденного марковской цепыо с конечным числом состояний по косвенным зашумленным и незашумленным наблюдениям.
5) Поставлена задача оптимального управления дискретно-непрерывной стохастической системой со скрытой марковской моделью, для которой получено решение в виде решения уравнения динамического программирования. В случае, когда состояние порождающей марковской цепи не зависит от управления, получен явный вид управления, удовлетворяющего принципу максимума.
Обозначения
•)* оператор транспонирования; (•)-1 — оператор обращения;
•)+ оператор псевдообращения но Муру-Пенроузу [1|; tr[i4] — след матрицы А; кег[Л] - ядро операто])а А;
Аз — матрица такая, что Аз Аз — А; co1(j4i,., Ап) — колонка из векторов (матриц) А\,., Ап-, diag(^i,., Ап) — блочно-диагональная матрица с А\,., Ап на главной диагонали; diag(u) = diagu — диагональная матрица с элементами вектора v на главной диагонали;
А ® В — кронскерово произведение матриц А и 5; А У В — матрица А — В неотрицательно определена; Ау В — матрица А — В положительно определена;
А^ В (А ^ В) — матрица А поэлементно больше либо равна (меньше либо равна) матрицы В\
А> В (А < В) — матрица А поэлементно больше (меньше) матрицы Б; х|| — евклидова норма вектора х € М"; а, 6) — скалярное произведение векторов а и 6; ~ 7Г — случайная величина (вектор) £ распределена по закону 7г;
Б [х] — математическое ожидание случайного вектора х;
D [х] — дисперсия случайной величины х; cov(x, у) = Е [(.х - Е [х])(у — Е [?/])*] — ковариация случайных векторов х и у, со[К] — выпуклая замкнутая оболочка множества точек V; argmin/(х) — множество точек глобального минимума /(х) на множестве X; хех argmax f(x) — множество точек глобального максимума /(х) на множестве Х\ хех
0 — пустое множество; А П В — пересечение множеств А и В; A U В — объединение множеств А и В\ р{х,Х) = inf ||х - у\\ — расстояние от точки х € Шп до множества X С Мп; уех
А/, N)t — взаимная квадратическая характеристика мартингалов Mt,Nt\
M)t = (M,M)t — квадратическая характеристика мартингала Л/; R — множество вещественных чисел; R+ — множество положительных вещественных чисел; N — множество натуральных чисел;
С" — пространство п раз непрерывно дифференцируемых функций; В(А) — борелевская сг-алгебра подмножеств множества А; сг(Л) — наименьшая ст-алгсбра, содержащая систему подмножеств Л (ст-алгебра порожденная Л); сг(^) — наименьшая сг-алгебра, относительно которой измерим случайный элемент £ (ст-алгебра порожденная £);
Q = Qx V Q2 — наименьшая а-алгебра такая, что Q1 С Q и Q2 С Q.
ЛСРУ ЛСДУ мц смм чм
ЛА
СКО
AIMD
ECN RTO RTT TCP/IP
Сокращения линейные стохастические разностные уравнения линейные стохастические дифференциальные уравнения марковская цепь скрытая марковская модель численные методы летательный аппарат среднеквадратическое отклонение additive increase multiple decrease, схема управления скоростью передачи данных протокола TCP, заключающаяся в ее линейном увеличении между сигналами о перегрузке и мультипликативном уменьшении при поступлении такого сигнала explicit congestion notification, явное определение состояния перегрузки retransmission timeout, время, в течение которого отправитель ожидает подтверждения на посланный пакет round-trip time, время между отправкой пакета и получением подтверждения о его получении
Transmission Control Protocol / Internet Protocol, семейство протоколов управления потоками данных
Библиография Миллер, Григорий Борисович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Альберт А. Регрессия, нсевдоинверсия и рекуррентное оценивание. Москва: Наука, 1977.
2. Ананьев Б. И. Минимаксные регуляторы для статистически неопределенных управляемых систем // Изв. ЛИ СССР. Техн. кибернетика. — 1989.— № 4.— С. 105-115.
3. Ананьев Б. И. Минимаксная линейная фильтрация многошаговых процессов с неопределенными распределениями возмущений // Автоматика и телемеха-пика. 1993. - № 10. - С. 131-139.
4. Балакришиан А. В. Введение в теорию оптимизации в гильбертовом пространстве. — Москва: Мир, 1974.
5. Бахшиян Б. Ц., Назиров Р. Р., Эльяеберг П. Е. Определение и коррекция движения. — Москва: Наука, 1980.
6. Бахшиян Б. Ц., Соловьев В. Н. Применение теоремы двойственности к задаче оптимального гарантирующего оценивания // Космические исследования. — 1990.-Т. 90, № 2.
7. Бобрик Г. И., Голован А. А., Матасов А. И. Фильтр Калмана при гарантирующем подходе к решению задачи топографической привязки // Автоматика и телемеханика. — 1997. — № 10. — С. 34-47.
8. Борисов А. В., Миллер Г. В. Анализ и фильтрация специальных марковских процессов в дискретном времени I: Мартингальное представление // Автоматика и телемеханика. — 2005. — № б. — С. 114-125.
9. Борисов А. В., Миллер Г. Б. Анализ и фильтрация специальных марковских процессов в дискретном времени II: Оптимальная фильтрация // Автоматика и телемеханика. — 2005. — № 7. — С. 112-125.
10. Борисов А. В., Миллер Г. Б. Скрытая марковская модель передачи данных по протоколу TCP // Тезисы докладов 2-й Научной сессии Института проблем информатики РАН. М.: 2005. - С. 74-76.
11. Борисов А. В., Миллер Г. Б. Фильтрация состояний специальных марковских процессов // Тезисы докладов Х-й Междунар. конф. «Системный анализ и управление». — Евпатория: 2005. — С. 150.
12. Борисов А. В., Панков А. Р. Минимаксная фильтрация в динамических системах, описываемых стохастическими дифференциальными уравнениями с мерой // Автоматика и телемеханика. — 1998.— № 6.— С. 139-152.
13. Боровков А. А. Математическая статистика. Дополнительные главы. — Москва: Наука, 1984.
14. Валъд А. Статистические решающие функции. Позиционные игры. — Москва: Наука, 1967.
15. Габасов Р., Кириллова Ф. М., Песецкая Т. И. Реализация в реальном времени оптимальных обратных связей по выходу для линейных систем в условиях неопределенности // Изв. РАН. Теория и Системы Управления. — 2005. — № 4. С. 44-56.
16. Галъчук Л. И. Обобщение теоремы Гирсанова о замене меры на случай полумартингалов со скачками // Теория вероятностей и ее применения. — 1977. — Т. 22, № 2. С. 279-294.
17. Гихман И. И., Скороход А. В. Управляемые случайные процессы. — Киев: На-укова думка, 1977.
18. Голубев Г. А., М.)равлев О. В., Писарев В. Ф. Линейная рекуррентная фильтрация динамических процессов с дискретным временем при частичной информации о возмущающих процессах // Автоматика и телемеханика. — 1989.— № 12. С. 49-59.
19. Григорьев Ф. П., Кузнецов Н. А., Серебровский А. П. Управление наблюдениями в автоматических системах. — Москва: Наука, 1986.
20. Девис М. X. А. Линейное оценивание и стохастическое управление. — Москва: Наука, 1984.
21. Доброленский Ю. Динамика полета в неспокойной атмосфере. — Москва: Машиностроение, 1969.
22. Жакод Ж., Ширяев А. Н. Предельные теоремы для случайных процессов,— Москва: Физматлит, 1994.
23. Завьялова Т. В., Кац И. Я., Тимофеева Г. А. Об устойчивости движения стохастической системы со случайным условием скачка фазовой траектории // Автоматика и телемеханика. — 2002.— № 7.— С. 33-46.
24. Зангвилл У. Нелинейное программирование. Единый подход. — Москва: Сов. радио, 1973.
25. Кац И. Я., Тимофеева Г. А. Модифицированный метод невязки в статистически неопределенной задаче оценивания // Автоматика и телемеханика, — 1994.— № 2. С. 100-109.
26. Куржаиский А. Б. Управление и оценивание в условиях неопределенности.— Москва: Наука, 1977.
27. Куркин О. М., Коробочкин Ю. В., Шаталов С. А. Минимаксная обработка информации. — Москва: Эпсргоатомиздат, 1990.
28. Ланкастер П. Теория матриц. — Москва: Наука, 1973.
29. Липцер Р. Ш., Ширяев А. Н. Статистика случайных процессов. — Москва: Наука, 1974.
30. Миллер Г. Б., Панков А. Р. Фильтрация случайного процесса в статистически неопределенной линейной стохастической дифференциальной системе // Автоматика и телемеханика. — 2005. — № 1. — С. 59-71.
31. Миллер Г. Б., Панков А. Р. Минимаксная фильтрация в линейных неопределенно-стохастических дискретно-непрерывных системах // Автоматика и телемеханика. — 2006. — № 3. — С. 77-93.
32. Миллер Г. Б., Панков А. Р. Оптимизация управления в линейных стохастических дифференциальных системах с неопределенными параметрами возмущений // Информационные процессы. — 2006.— Т. б, № 2,— С. 131-143.
33. Пайков А. Р., Миллер Г. Б. Минимаксная линейная рекуррентная фильтрация неопределенно-стохастических последовательностей по интегральному критерию // Информационные процессы. — 2001. — Т. 1, № 2. — С. 150-16G.
34. Панков А. Р., Миллер Г. Б. Минимаксная фильтрация в статистически неопределённых линейных дифференциальных системах // Тезисы докладов 1Х-й Междунар. конф. «Системный анализ и управление».— Евпатория: 2004.— С. 120-121.
35. Панков А. Р., Семенихип К. В. Минимаксная идентификация неопределенно-стохастической линейной модели // Автоматика и телемеханика,— 1998.— № 11.- С. 158-171.
36. Панков А. Р., Семенихип К. В. Методы параметрической идентификации многомерных линейных моделей в условиях априорной неопределенности // Автоматика и телемеханика. — 2000. — А'2 5. — С. 7G-92.
37. Пелевин А. Робастная стабилизация линейного объекта при неопределенных параметрах модели // Изв. РАН. Теория и Системы Управления. — 2003. — № 1. С. 40-46.
38. Пугачев В. С., Синицын И. Н. Стохастические дифференциальные системы. — Москва: Наука, 1990.
39. Пшеничный Б. Н. Необходимые условия экстремума. — Москва: Наука, 1982.
40. Ройтенберг Я. Н. Автоматическое управление. — Москва: Наука, 1978.
41. Рокафеллар Р. Т. Выпуклый анализ. — Москва: Мир, 1973.
42. Флеминг У, Ришел Р. Оптимальное управление детерминированными и стохастическими системами. — Москва: Мир, 1978.
43. Фомин В. Н. Рекуррентное оценивание и адаптивная фильтрация. — Москва: Наука, 1984.
44. Хьюбер П. Робастность в статистике. — Москва: Мир, 1984.
45. Цыпкин Я. 3. Основы информационной теории идентификации. — Москва: Наука, 1984.
46. Ширяев А. Н. Вероятность. — Москва: Наука, 1989.
47. Эллиотт Р. Д. Стохастический анализ и его приложения. — Москва: Мир, 1986.
48. Юшкевич А. А. Управляемые марковские модели со счетным множеством состояний и непрерывным временем // Теория вероятностей и ее применения. — 1977. Т. 22, .\« 2. - С. 222-241.
49. Яшин А. И. Фильтрация скачкообразных процессов // Автоматика и телема-хаиика. 1970. - № 5. - С. 52-58.
50. Яшин А. И. Конструктивные алгориты оптимальной нелинейной фильтрации.1.// Автоматика и телемаханика. — 1975.— № 11.— С. 33-39.
51. Яшин А. И. Конструктивные алгориты оптимальной нелинейной фильтрации.1. // Автоматика и телемаханика. — 1975.— № 12.— С. 108-113.5G. Allman М., Paxson V., Stevens W. TCP congestion control I j RFC. 1999. no. 2581.
52. Alspach D. A parallel filtering algorithm for linear systems with unknown timevary-ing noise statistics // IEEE Transactions on Automatic Control. — 1974. — Vol. AC-19, no. 5.-Pp. 552-556.
53. Altman E., Avrachenkov K., Barakat C. A stochastic model of TCP/IP with stationary random losses // Computer Communications Review. — 2000. — Vol. 30, no. 4. — Pp. 231-242.
54. Altman E., Avrachenkov K., Barakat C. TCP in presence of bursty losses // Performance Evaluation. 2000. - Vol. 42, no. 2-3. - Pp. 129-147.
55. Altman E., Avrachenkov K., Barakat C., Dube P. TCP over a multi-state Markovian path // Goto K., Takahashi Y., Takagi H. Performance and QoS of next generation networking. New York, NY: Springer-Verlag, 2000. - Pp. 103-122.
56. Athuraliya S., Low S. Optimization flow control with Newton-like algorithm // Telecommunication Systems. — 2000. — Vol. 15, no. 3-4. — Pp. 345-358.
57. Barakat C. TCP/IP modeling and validation // IEEE Network. 2001. - Vol. 15, no. 3. - Pp. 38-47.
58. Bar-Shalorn Y, Campo L., Li X. R. Control of Discrete-time Hybrid Stochastic Systems. — San Diego: Academic Press, 1996.
59. Bar-Shalom Y., Li X. R. Multiple-model estimation with variable structure // IEEE Trans. Autom. Contr. 1996. - Vol. 41, no. 4. - Pp. 478-493.
60. Bertsekas D. P. Control of uncertain systems with a set membership description of the uncertainty: Phd dissertation / Dep. Elec. Eng., Mass. Inst. Technol. — Cambridge, 1971.
61. Bertsekas D. P., Rhodes I. B. On the minimax feedback control of uncertain dynamic system // in Proc. of IEEE Conference on Decision and Control (CDC'1971).— Miami, USA: 1971.- Pp. 451-455.
62. G7. Bertsekas D. P., Rhodes I. B. Recursive state estimation for a set-membership description of uncertainty // IEEE Transactions on Automatic Control. — 1971. — Vol. AC-16. — Pp. 117-128.
63. Bertsekas D. P., Rhodes I. B. Sufficiently informative functions and the minimax feedback control of uncertain dynamic systems // IEEE Transactions on Automatic Control. 1973.-Vol. AC-18, no. 2,- Pp. 117-124.
64. Boel R., Varaiya P. Optimal control of jump processes // SI AM Journal on Control and Optimization. — 1977. — Vol. 15.- Pp. 92-119.
65. Bohlin T. Four cases of identification of changing systems // System Identification: Advances and Case Studies / Ed. by R. K. Mehra, D. Lainiotis. — Academic Press, 1976.
66. Borisov A. V., Miller G. B. Hidden markov model approach to TCP link state tracking // Proc. 43-rd IEEE Conf. Decision and Control (CDC'2004).- Nassau: 2004.-Pp. 3126-3137.
67. Brelanger P. Estimation of noise covariance matrices for a linear time-varying stochastic process // Automatica.— 1974. — Vol. 10.— Pp. 267-275.
68. Brimaud P. M. Point processes and queues. — Berlin: Springer-Verlag, 1981.
69. Carew В., Brelanger P. Identification of optimum filter steady-state gain for systems with unknown noise covariances // IEEE Transactions on Automatic Control. — 1973.- Vol. AC-18, no. 6. Pp. 582-587.
70. Dumas V., Guillemin F., Robert P. A Markovian analysis of AIMD algorithms // Appl. Probability. 2002. - Vol. 34, no. 1. - Pp. 85 111.
71. Elliott R. J., Aggoun L., Moore J. B. Hidden Markov Models: Estimation and Control. — Berlin: Springer-Verlag, 1995.
72. Elliott R. J., Malcolm W. P., Tsoi A. HMM volatility estimation // Proceedings of the 41th IEEE Conference on Decision and Control. — Las Vegas: Omnipress, 2002. Pp. 398-404.
73. El Ghaoui L., Galafiore G. Robust filtering for discrete-time systems with structured uncertainty // IEEE Transactions on Automatic Control— 2001.— Vol. AC-4G, no. 7.
74. El Karoui N., Huang S. J. A General Result of Existence and Uniqueness of Backward Stochastic Differential Equations //El Karoui N., Mazliak L. Backward stochastic differential equations. — Longman, 1997. — Pp. 27-36.
75. Fragoso M. D., Baczynski J. Optimal control for continuous-time linear quadratic problems with infinite Markov jump parameters / / SI AM Journal on Control and Optimization. 2001. - Vol. 40, no. 1. - Pp. 270-297.
76. Genon-Catalot V., Jeantheau Т., Laredo C. Stochastic volatility models as hidden Markov models and statistical applications // Bernoulli. — 2000. — Vol. 6, no. 6. --Pp.1051-1079.
77. Gilbert E. N. Capacity of a burst-noise channel // Bell System Techn. J. — 1960. — Vol. 39. Pp. 1253-1265.
78. Glover J. D., Schweppe F. C. Control of linear dynamic systems with set constrained disturbances // IEEE Transactions on Automatic Control — 1971. —Vol. AC-16.— Pp. 411-423.
79. Hilborn C., Lainiotis D. Optimal estimation in the presence of unknown parameters // IEEE Transactions on Systems, Science, and Cybernetics. — 1969. — Vol. 5, no. l.-Pp. 38-43.
80. Jacobson V. Congestion avoidance and control // Computer Communication Review.- 1988.- Vol. 18, no. 4,- Pp. 314-329.
81. Johansen D. E. Solution of a linear mean square estimation problem when process statistics are undefined // IEEE Transactions on Automatic Control — 1966. Vol. AC-11, no. l.-Pp. 20-30.
82. Kashyap R. Maximum likelihood identification of stochastic linear systems // IEEE Transactions on Automatic Control — 1970. —Vol. AC-15, no. 1.— Pp. 25-34.
83. Kelly F. P. Mathematical modelling of the Internet // Engquist В., Schmid W. Mathematics Unlimited 2001 and Beyond.— Berlin: Springer Verlag, 2001. — Pp. 685-702.
84. Kelly F. P., Maulloo A., Tan D. Rate control in communication networks: Shadow prices, proportional fairness and stability // J. Oper. Research Society. — 1998. — Vol. 49, no. 3. Pp. 237-252.
85. Kunniyur S., Srikant R. End-to-end congestion control: Utility functions, random losses and ECN marks //in Proc. of IEEE INFOCOM'OO. Tel Aviv, Israel: 2000.
86. Liptser R. S., Shiryaev A. N. Statistics of Random Processes. — New York: Springcr-Verlag, 1978.
87. Looze D. P., Poor V., Vastola K. S., Darragh J. C. Minimax control of linear stochastic systems with noise uncertainty // IEEE Transactions on Automatic Control. — 1983. Vol. AC-28, no. 9. - Pp. 882-888.
88. Low S. H., Lapsley D. E. Optimization flow control, I: Basic algorithm and convergence // IEEE/ACM Trans. Networking.- 1999.- Vol. 7, no. 6.- Pp. 861-874.
89. Low S. H., Paganini F., Doyle J. C. Internet congestion control // IEEE Control Systems Magazine. 2002. - Vol. 22, no. 1. - Pp. 28-43.
90. Mariton M. Jump Linear Systems in Automatic Control.— New York: Marcel Dekker, 1990.
91. Martin C. J., Mintz M. Robust filtering and prediction for linear systems with uncertain dynamics: a game-theoretic approach // IEEE Transactions on Automatic Control. 1983. - Vol. AC-28. - Pp. 888-896.
92. Massoulie L., Roberts J. Bandwidth sharing: Objectives and algorithms // IEEE/ACM Trans. Networking.- 2002.- Vol. 10, no. 3.- Pp. 320-328.
93. Matasov A. I. Estimators for uncertain dynamic systems. — Dordrecht: Kluwer Academic Publishers, 1998.
94. Mathis M., Semke J., Mahdavi J., Ott T. The macroscopic behavior of the TCP congestion avoidance algorithm // Computer Communication Review. — 1997. -Vol. 27, no. 3.-Pp. 67-82.
95. Mehra R. К. On the identification of variances and adaptive Kalman filtering // IEEE Transactions on Automatic Control — 1970. — Vol. AC-15, no. 2. — Pp. 175184.
96. Mehra R. K. Approaches to adaptive filtering // IEEE Transactions on Automatic Control. 1972. - Vol. AC-17. - Pp. 903-908.
97. Miller В. M., Avrachenkov К. E., Stepanyan К. V., Miller G. B. Flow control as stochastic optimal control problem with incomplete information / INRIA Research Report № 5239. — Sophia Antipolis, 2004.
98. Miller В. M., Avrachenkov К. E., Stepanyan К. V., Miller G. B. Flow control as stochastic optimal control problem with incomplete information // Proc. IEEE Conf. Computer Communications (INFOCOM'2005). Miami: 2005.
99. Miller В. M., Avrachenkov К. E., Stepanyan К. V., Miller G. B. Hidden markov model based flow control in TCP/IP networks jI Тр. IV Междунар. конф. «Идентификация и задачи управления» (SICPRO'2005). М.: 2005.- С. 742-756.
100. Miller В. М., Runggaldier W. J. Kalman filtering for linear systems with coefficients driven by a hidden markov jump process // Systems & Control Letters. — 1997. — Vol. 31, no. 2.-Pp. 93-102.
101. Miller G. В., Pankov A. R. Minimax control in statistically uncertain stochastic differential system // Тезисы докладов III-й Международной конференции по проблемам управления (МКПУ'2006). — Т. 1.- М.: 2006.- С. 73.
102. Mintz М. A note on minimax estimation and Kalman filtering // IEEE Transactions on Automatic Control. — 1969. — Vol. Correspondence. — Pp. 588-590.
103. Moheimani S. 0. R., Savkin A. V., Petersen I. R. Minimax optimal control of discrete-time uncertain systems with structured uncertainty // Dynamics and Control. 1997. - Vol. 7, no. 1. - Pp. 5-24.
104. Morris J. M. The Kalman filter: a robast estimator for some classes of linear quadratic problems // IEEE Transactions on Information Theory. — 1976. — Vol. IT-22. — Pp. 526-534.
105. Myers K., Tapley B. Adaptive sequential estimation with unknown noise statistics // IEEE Transactions on Automatic Control. 1976. Vol. AC-21.- Pp. 520-523.
106. Orlov Y., Basin M. On minimax filtering over discrete-continuous observations // IEEE Transactions on Automatic Control — 1995. — Vol. 40.— Pp. 1623-1626.
107. Padhye J., Firoiu V., Towsley D., Kurose J. Modeling TCP Reno performance: a simple model and its empirical validation // IEEE/ACM Transactions on Networking. 2000. - Vol. 8, no. 2.
108. Pankov A. R., Borisov A. V. Optimal filtering in stochastic discrete-time systems with unknown inputs // IEEE Transactions on Automatic Control. — 1994. — Vol. AC-39.- Pp. 2461-2464.
109. Pankov A. R., Miller G. B. Minimax filter for statistically indeterminate stochastic differential system // Proc. 16-th IFAC World Congress. — Prague: 2005.
110. Pankov A. R., Siemenikhin К. V. Minimax estimation of random elements with application to infinite-dimensional statistical linearization // Тр. II Междунар. конф. «Идентификация и задачи управления» (SICPRO'2003). — Москва: 2003. С. 1277-1290.
111. Phillis У. A. Optimal estimation and control of discrete multiplicative systems with unknown second-order statistics // J. Optim. Theory and AppL— 1990.— Vol. 64, no. l.-Pp. 153-168.
112. Pierce B. D., Sworder D. D. Bayes and minimax controllers for a linear system with stochastic jump parameters // IEEE Transactions on Automatic Control — 1971. — Vol. AC-16, no. 4. Pp. 300-307.
113. Poor V., Looze D. P. Minimax state estimation for linear stochastic systems with noise uncertainty // IEEE Transactions on Automatic Control — 1981. — Vol. AC-26, no. 4. Pp. 902-906.
114. Rabiner L. R. A tutorial on hidden markov models and selected applications in speech recognition // Proceedings of the IEEE. — 1989. — Vol. 77, no. 2. — Pp. 257286.
115. Ramakrishnan K., Floyd S., Black D. The addition of explicit congestion notification (ECN) to IP // RFC.- 2001. no. 3168.
116. Ramakrishnan K., Jain R. A binary feedback scheme for congestion avoidance in computer networks with connectionless network layer // ACM Trans. Computer Systems. 1990. - Vol. 8, no. 2. - Pp. 158-181.
117. Rubinovich E. Y. Minimax generalized linear-quadratic stochastic control problem with incomplete information // Singular solutions and perturbations in control systems. Russia, Pereslavl-Zalesskiy: IFAC Proc. Ser., 1997,- Pp. 185-189.
118. Runggaldier W. J. Jump Diffusions Models // Handbook of Heavy Tailed Distributions in Finance / Ed. by S. T. Rachev. — North-Holland: Elesevier, 2003.— Pp. 169—209.
119. Sangsuk-Iam S., Bullock Т. E. The discrete-time Kalinan filter under uncertainty in noise covariances // Stochastic digital control system techniques / Ed. by С. T. Leon-des. — San Diego: Academic Press, 1996.— Pp. 363-415.
120. Savkin A. V., Petersen I. R. Minimax optimal control of uncertain systems with structured uncertainty // Internal J. Robust Nonlinear Control — 1995. — no. 5. -Pp. 119-137.
121. Schmitendorf W. E. Minmax control of systems with uncertainty in the initial state and in the state equations // IEEE Transactions on Automatic Control — 1977. — Vol. Short papers. Pp. 439-443.
122. Schweppe F. C. Recursive state estimation: Unknown but bounded errors and system inputs // IEEE Transactions on Automatic Control — 1968.— Vol. AC-13.— Pp. 22-28.
123. Speyer J. L., Shaked U. Minimax design for a class of linear quadratic problems with parameter uncertainty // IEEE Transactions on Automatic Control — 1974. — Vol. Technical Notes and Correspondence. — Pp. 158-159.
124. Tang S., Li X. Necessary conditions for optimal control of stochastic systems with random jumps // SI AM J. Control Optim. 1994. - Vol. 32, no. 5. - Pp. 14471476.
125. Tanimoto S. A duality theorem for max-min control problems // IEEE Transactions on Automatic Control 1982,- Vol. AC-27, no. 5. - Pp. 1129-1131.
126. Ugrinovskii V. A., Petersen I. R. Minimax LQG control of stochastic partially observed uncertain systems // SIAM J. Control and Optim. — 2001. — Vol. 40, no. 4. — Pp. 1189-1226.
127. Vandelinde V. D. Robust properties of solutions to linear-quadratic estimation and control problems // IEEE Transactions on Automatic Control — 1977. — Vol. AC-22, no. 1.
128. Verdu S., Poor H. V. Minimax linear observers and regulators for stochastic systems with uncertain second-order statistics // IEEE Transactions on Automatic Control 1984. - Vol. 29, no. 6. - Pp. 499-511.
129. Verdu S., Poor H. V. On minimax robustness: A general approach and applications // IEEE Transactions on Information Theory. — 1984. — Vol. IT-30, no. 2.
130. Wang E., Hajek B. Stochastic Processes in Engineering Systems.— New-York: Springer-Verlag, 1985.
131. Wan С. В., Davis M. H. A. Existence of optimal controls for stochastic jump processes // SIAM Journal on Control and Optimization. — 1979. — Vol. 17. — Pp. 511-524.
132. Witsenhausen H. S. Minimax control of uncertain systems / Mass. Inst. Technol., Report № ESL-R-269. Cambridge, I960.
133. Witsenhausen H. S. A minimax control problem for sampled linear systems // IEEE Transactions on Automatic Control — 1968.— Vol. AC-13. — Pp. 5-21.
134. Wonham W. M. Some application of stochastic diffcrntial equations to optimal nonlinear filtering // SIAM Journal on Control. 1965. - Vol. 2. - Pp. 347-369.
135. Xu J.-M., Yu L. An LMI approach to guaranteed cost PI control of linear uncertain systems // in Proc. of 43-rd Conference on Decision and Control (CDC'2004).— Bahamas, Nassau: 2004. Pp. 2165-2170.
136. Yazwinsky A. N. Stochastic processes and filtering theory. — New York and London: Academic Press, 1970.
137. Zhou X. Y, Yin G. Markowitz's mean-variance portfolio selection with regime switching: a continuous-time model // SIAM Journal on Control and Optimization. 2003. - Vol. 42, no. 4. - Pp. 398-404.
-
Похожие работы
- Разработка и исследование алгоритмов и устройств совместной фильтрации параметров многоуровневых импульсных коррелированных сигналов
- Математические модели и фильтрация состояний динамических систем с модульной структурой измерительного комплекса
- Алгоритмы и устройства фильтрации дискретно-непрерывных сигналов, устойчивые к действию негауссовских помех
- Оценивание и распознавание состояний стохастических систем по непрерывно-дискретным наблюдениям с памятью
- Совместная оценка параметров шумоподобных сигналов в устройствах быстрого поиска и кодовой синхронизации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность