автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Минимаксные методы оценивания и оптимизации процессов в неопределенно-стохастических системах
Автореферат диссертации по теме "Минимаксные методы оценивания и оптимизации процессов в неопределенно-стохастических системах"
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ИНСТИТУТ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)
о '''Г4!-]
На правах рукописи удк 519.21:62-50
ПАНКОВ Алексей Ростиславович
МИНИМАКСНЫЕ МЕТОДЫ ОЦЕНИВАНИЯ
И ОПТИМИЗАЦИИ ПРОЦЕССОВ В НЕОПРЕДЕЛЕННО - СТОХАСТИЧЕСКИХ СИСТЕМАХ
05.13.01 - Управление в технических системах
автореферат диссертации на соискание ученой степени доктора физико-математических наук
Москва - 1998
Работа выполнена на кафедре теории вероятностей Московского государственного авиационного института (технического университета)
Научный консультант:
доетор физико-математических наук А.И. Кнбзун
Официальные оппоненты:
доктор физико-математических наук А-В. Назин
доктор физико-математических наук А.В. Пантелеев
доктор технических наук И.Н. Синицын
Ведущая организация: Институт проблем передачи информации РАН
Защита состоится « » У1 1998 г. в 11 часов на заседании диссертационного Совета Д 053.18.05 Московского государственного авиационного института по адресу: 125871, Москва, ГСП, Волоколамское шоссе, 4
С диссертацией можно ознакомиться в библиотеке Московского государственного авиационного института.
Автореферат разослан «_»_1998 г.
Отзывы просим направлять в двух экземплярах, заверенных печатью, по адресу: 125871, Москва, ГСП, Волоколамское ш., 4, Ученый Совет МАИ
Ученый секретарь
диссертационного Совета
доктор физико - математических наук
Марков
Общая характеристика работы
Актуальность проблемы. В настоящее время математические методы бработки информации в целях оптимизации процессов в сложных системах оказали свою эффективность при решении разнообразных прикладных за-ач управления техническими, экономическими и другими реальными систе-[ами. Развитие математической теории управления идет в направлении все олыпего усложнения применяемых моделей и методов для достижения адек-атного описания реальных процессов и повышения надежности получаемых гратегий обработки информации и формирования процессов управления. Ес-и на начальной стадии развития теории управления превалировали клас-нческие детерминированные модели, то дальнейшие теоретические исследо-ания и результаты практического использования полученных методов и ал-эритмов показали, что для адекватного описания реальных процессов несводимо использовать модели, органической частью которых являются неоп-еделенные параметры и сигналы, значения и поведение которых заранее ельзя достоверно предсказать. Последнее привело к созданию стохастиче-кой теории управления и развитию сопутствующих вероятностно-статисга-еских методов и алгоритмов обработки информации. Естественно, основные силия были направлены на получение оптимальных по некоторым крите-иям методов идентификации, фильтрации и управления. Оптимальные ме-эды для регрессионных моделей и моделей временных рядов изучались в ра-отах А_Алберта, Т.Авдерсона, В.Н.Вапника, У.Гренандера, Е.З.Демиденко, [.А. Ибрагимова, А.Кашьяпа, М.Кендалла, АСтьюарта, Р.З.Хасьминского, .Pao, Э.Хеннана, для конечномерных динамических систем - в работах .Беллмана, В.Боркара, Р.Винтера, М.Х.АДэвиса, И.Е.Казакова, Р.Калмана, -АКрасовского, Х.Кушнера, РШЛипцера, М.Б.Колмановского, Н.В.Кры-эва, Б.М.Мяллера, П.В.Пакшина, АВ.Пантелеева, Е.Парду, В.С.Пугачева, .Ришела, В.Рунггаддиера, В.В.Семенова, Р.Л.Стратоновича, Э.Сейджа, '.Флеминга, М.М.Хрусталева, АН.Ширяева, Р.Эллиота, а для бесконечно-ерных систем - в работах Н. Ахмеда, АБенсуссана, АБалакришнана, АЮ. еретеннихова, М.М.Лаврентьева, В.С.Пугачева, И.Н.Синшхьша, Ю.П. Пыть-за, АВ. Скорохода, АМ. Федотова, Р. Куртэйн, А Причарда, АН. Тихонова.
Важнейшей причиной, затрудняющей использование оптимальных ме-эдов стохастического оценивания и управления, является отсутствие необ-одимой априорной информации о параметрах моделей и вероятностных ха-акгеристиках возмущений. Последнее явилось причиной повышенного ин-:реса к исследованию задач оценивания и оптимизации процессов в стохас-1ческих системах с априорной неопределенностью. В настоящее время формировались два основных подхода к разработке методов исследования 4стем указанного типа: минимаксный и адаптивный.
Суть первого состоит в том, что для обобщенных параметров модели ормируется некоторое множество неопределенности их значений и харак-
геристак, после чего задача оценивания и управления решается оптимальным образом в предположении, что реализован «наихудший» элемент указанного множества. При определенных условиях такое решение существует, а алгоритм его реализации обладает гарантирующими свойствами. Систематически минимаксный подход начал использоваться в работах А-Вальда, П.Хубера, Н.Н.Красовского, ААЛСуржанского, МЛ.Лидова, Я.З.Цыпкина, Ф.Л.Черно-усько, П.Е. Эльясберга. Полученные общие результаты нашли свое развитие в работах БЛ-Ананьева, Б.Ц.Бахшияна, Т.Башара, В.Вавде-Ливде, Смерду, ГАГолубева, М.И.Гусева, И-Я.Каца, А.И.Кибзуна, М.Б.Колмановского, А.П. Коростелева, М.НЛСрасилыцихова, ДЛуза, В .В.Малышева, А.И. Мата-сова, М. Минца, Дж.Морриса, АГ.Наконечного, В.ГЛокотило, Б.ТЛоляка, ВЛура, В.Н.Соловьева, В.ИЛ1иряева, ЕЛза.
Второй подход к решению задач оценивания и управления в условиях априорной неопределенности, называемый обычно адаптивным, основан на восстановлении неизвестных вероятностных. характеристик стохастических параметров модели, необходимых для построения оптимальных оценок и соответствующего управления. При определенных условиях оказывается, что адаптивная оценка асимптотически эквивалентна оптимальной оценке, однако требует для своего построения существенно меньший объем априорных данных, что достигается за счет более полного и гибкого использования имеющейся измерительной информации. Фундаментальные результаты по адаптивным методам оценивания и управления получены в работах Б. Андерсона, Я.Бар-Щалома, Г.Гудвина, Л.Льюнга, А.В.Назина, М.Б.Невельсона, К.Осгрема, А-СЛозняка, Б.ТЛоляка, В.Г.Репина, Дж.Саридиса, Т.Содер-стрема, В.Г Сраговича, ГЛ.Тартаковского, В .Н.Фомина, Р.З.Хасьминского, Я.З.Цыпкина. Как правило, адаптивные методы фильтрации, идентификации и управления оказываются нелинейными, что существенно затрудняет анализ их неасимптотических свойств. С другой стороны, если для конкретной модели удается строго обосновать процедуру адаптации, то получаемые оценки и стратегии управления могут бьггь существенно более эффективными, чем минимаксные (использующие только априорную информацию). Представляется актуальным как с теоретической, так и с прикладной точек зрения использовать идеи адаптации при разработке минимаксных алгоритмов оценивания и управления с целью повышения эффективности последних в использовании эмпирических данных.
Вторая проблема в реализации оптимальных методов - их сложность. Если для линейных гауссовских систем проблема оптимального оценивания и управления имеет решение, пригодное для практической реализации, то для линейных негауссовских и нелинейных систем уравнения оптимальной фильтрации в настоящее время не поддаются реализации на ЭВМ в полном объеме. Это объясняется тем, что в общем случае для апостериорного распределения фазового вектора модели отсутствует конечномерная система достаточных статистик, т.е. оптимальный нелинейный фильтр является бесконеч-
номерным. Последнее означает, что сложная нелинейная стохастическая система управления является, фактически, статистически неопределенной даже при наличии полной информации о характеристиках параметров и возмущений последней. Таким образом, актуальной является проблема построения конечномерных алгоритмов нелинейной фильтрации и управления, являющихся оптимальными в минимаксном смысле. В работе развито соответствующее направление, базирующееся на теории условно-оптимальной нелинейной фильтрации В.СЛугачева и методах минимаксной оптимизации неопределенно-стохастических систем.
Анализ имеющихся результатов по оптимизации неопределенно-стохастических систем управления показывает, что минимаксные методы имеют важнейшее значение для теории и практики управления сложными техническими системами. Дальнейшая разработка минимаксных методов оптимизации указанных систем является актуальной, так как имеется значительное число проблем, требующих как теоретического исследования, так и разработки соответствующих численных методов и алгоритмов. Некоторые из указанных проблем перечислены ниже.
Целью работы является решение следующих теоретических и прикладных проблем в области минимаксной оптимизации неопределенно-стохастических систем (НСС) управления:
1) построение теории минимаксной идентификации НСС, параметры которых могут бьпъ произвольных типов (неслучайные ограниченные и неограниченные, случайные с полностью или частично неизвестными распределениями), а сами системы - сингулярными (с вырожденными возмущениями и случайными параметрами); исследование асимптотических свойств минимаксных оценок параметров НСС; построение адаптивных минимаксных оценок;
2) разработка новых эффективных конечномерных алгоритмов оценивания и управления в нелинейных статических и динамических моделях и линейных негауссовских моделях с использованием минимаксного подхода;
3) создание методов рекуррентного оценивания процессов в динамических НСС, дающих ввозможность учитывать не только априорную, но и текущую измерительную информацию о значениях неопределенных параметров и входных процессов в модели динамики системы;
4) разработка и исследование методов оценивания случайных элементов со значениями в бесконечномерных пространствах в условиях априорной статистической неопределенности; построение минимаксных алгоритмов оценивания и оптимизации процессов в динамических НСС с бесконечномерным пространством состояний;
5) разработка численных методов и алгоритмов минимаксного оценивания и управления, пригодных для практического использования в многомерных нелинейных системах.
Решение вышеперечисленных проблем позволяет существенно расширить область обоснованного применения минимаксных методов оценивания и оптимизации, повысить их эффективность и прикладное значение.
Методы исследований. В работе используются методы теории вероятностей и математической статистики, теории случайных процессов, теории игр, оптимизации, функционального анализа, а также методы компьютерного статистического моделирования.
Научная новизна. В работе получены новые теоретические результаты в области минимаксной оптимизации неопределенно-стохастических систем, среди которых отметим следующие:
1) построены минимаксные оценки параметров многомерной линейной неопределенно-стохастической сингулярной регрессионной модели при различных уровнях информированности о природе оцениваемых параметров и характеристиках возмущений;
2) исследованы асимптотические свойства минимаксных оценок и предложены способы адаптации алгоритмов минимаксного оценивания:
3) разработан метод условно-минимаксной нелинейной фильтрации процессов в нелинейных разностных и дифференциальных стохастических системах, предложены численные методы синтеза условно-минимаксных фильтров;
4) построен алгоритм робастной условно-минимаксной рекуррентной фильтрация процессов в системах с аномальными ошибками наблюдений;
5) решена задача минимаксного управления в линейной системе с нега-уссовскими возмущениями, доказан аналог теоремы разделения для минимаксной стратегии управления;
6) разработаны методы и алгоритмы фильтрации и сглаживания процессов в линейных стохастических динамических системах с частично наблюдаемыми неопределенными входными воздействиями;
7) решена задача минимаксного оценивания случайных элементов со значениями в сепарабельных гильбертовых пространствах в условиях неполной априорной информации о распределениях оцениваемого и наблюдаемого элементов;
8) построен алгоритм рекуррентного оценивания статистически неопределенных процессов в гильбертовых разностных системах, найдена оптимальная в минимаксном смысле стратегия управления.
Практическая ценность полученных результатов состоит в том, что они являются основой для создания эффективного программно - алгоритмического обеспечения ЭВМ, предназначенного для обработки информации и принятия решений в условиях значительной априорной неопределенности в описании параметров и процессов в моделях исследуемых систем . Последнее
характерно для большинства прикладных задач, связанных с обработкой результатов летных испытаний, управлением движением ЛА, эксплуатацией сложных измерительных комплексов, обработкой изображений, планированием экспериментов при исследовании новой техники.
Апробация работы. Результаты работы докладывались на Всесоюзной конференции «Перспективные методы планирования эксперимента при исследовании случайных процессов и полей» (Севастополь, Россия, 1985 г.), Симпозиуме IFAC по стохастическому управлению ( Вильнюс, Литва, 1986г.), Международной конференции по стохастическому анализу (Кембридж; Великобритания, 1987г.), Всесоюзной конференции «Непараметрические и робаст-ные методы в кибернетике и информатике» (Томск, Россия, 1990г.), Всесоюзной школе-семинаре «Динамика, управление полетом и исследование операций» ( Клин, Россия, 1990г.), на 30-й (Брайтон, Великобритания, 1991г.), 34-й (Нью-Орлеан, США, 1995г.) и 35-й (Кобе, Япония, 1996г.) Международных конференциях ШЕЕ по принятию решений и управлению (IEEE CDC), Международной конференции IFAC по системному анализу и управлению (Нант, Франция, 1995г.), 3-й Европейской конференции EFAC по управлению (Рим, Италия, 1995г.) и Международной конференции IFAC SSPCS-97 (Переяславль-Залесский, Россия, 1997г.) а также на научных семинарах под руководством проф. Б.В.Гнеденко (МГУ, мех.-мат.), акад. В.С.ГГугачева (ИПУ РАН), акад. С.В. Емельянова (МГУ, ВМК), проф. Н.А. Парусникова (МГУ, мех-мат.), проф. И.Н.Синицина (ИЛИ РАН), проф. В.В. Малышева (МАИ), проф. АЛ. Кибзуна (МАИ), проф. MJCA. Дэвиса (Imperial College, Лондон), проф. В.Б.Колмановского (МИЭМ).
Публикации. Основные результаты диссертации опубликованы в 30 научных работах, список которых приведен в конце автореферата.
Структура и объем работы. Диссертация состоит из семи глав, списка литературы и приложения. Общий объем работы - 235 м.п.с. В основной текст включены 10 таблиц и 2 рисунка. Библиография - 230 названий.
Краткое содержание работы
В первой главе , которая носит вводный характер , обсуждаются проблемы оптимального и минимаксного оценивания параметров стохастических систем. Показано, что переход от оптимальных методов к минимаксным обусловлен значительной априорной неопределенностью в описании параметров исследуемых систем, являющейся типичной для большинства прикладных задач оценивания и управления. Приведен обзор результатов по оптимальным методам оценивания и управления в статических и динамических системах, описаны основные подходы к постановке и решению задач минимаксной оптимизации алгоритмов оценивания и управления, а также сформулированы
некоторые актуальные , но нерешенные проблемы в области разработки минимаксных методов . В конце главы приведен обзор основных результатов диссертации.
Вторая глава посвящена постановке и решению проблемы минимаксного оценивания параметров обобщенной многомерной линейной регрессионной модели в условиях неполной априорной информации о вероятностных характеристиках параметров и возмущений модели . Исследованы асимптотические свойства минимаксных оценок , а также изучена проблема адаптации последних с целью повышения гарантированной точности процедуры оценивания.
Рассматривается модель наблюдения следующего вида
y = Hu+TS-KD (2.1)
где у е R4 - вектор наблюдений; и- неопределенный вектор параметров; случайный вектор (СВ) параметров ; со -СВ возмущений.
По наблюдениям (2.1) необходимо оценить СВ хе Rp вида
х=Аи+В4 (2.2)
В (2.1),(22) H,*F,A и В - известные конечномерные операторы соответствующих размеров.
Задача оценивания х по у решается при различных предположениях о законе распределения вектора неопределенно - стохастических параметров р = col[u,^,oo] , определяющего модель (2.1),(2.2). В общем случае мы предполагаем , что Fp е?р, где Fp - распределение р , а - класс допустимых распределений . Пусть % - класс допустимых операторов оценивания для х по у (т.е для Vit е К => х = я(у) -допустимая оценка для х по у). Предположим также, что на ТС ®7р задан некоторый функционал J(7t, Fp ) , характеризующий точность оценки %(у) при каждом Fp е ?р (оценка те(у )тем точнее, чем меньше J (jt,Fp)).
Определение 2.1 Оценка х= я(у) е Л , называется (J, К ) -минимаксной на классе неопределенности ?р, если
äs aigmin sup j(jc,Fp) (2.3)
яб7С Fpe?p
Если Зэге7£, удовлетворяющий (2.3), то задача минимаксного оценивания разрешима, (возможно, неединственным образом) . Для существования Ü необходимо, чтобы вектор х был идентифицируем по у операторами л еТГ. ':
Определение 2.2 Вектор х в (2.2) идентифицируем по наблюдениям у в (2.1) операторами пе% на классе неопределенности 7Р, если
ЗпеП : sup j(Ä,Fp)<oo (2.4)
s
Рассмотрим конкретные предположения о характеристиках модели (2.1), (2.2), критерии j(-) и классе распределений , позволяющих получить
явные выражения для х = л(у). В качестве критерия точности оценивания j(rc,Fp) будем использовать функционал среднеквадратических потерь общего вида:
j(;t,Fp) = EFJ|X-7i(y)|£}, УдеЛ^е?,,, (2.5)
где ЕРр {.}- оператор усреднения по распределению Fp; ||х||| = х*Ех, Е
(т.е. 2 = Е*,2£0)- произвольная весовая матрица.
Пусть и - неопределенный неограниченный детерминированный вектор; Е{4} = т5,Е{ю} = та-известны; = cov{4,<|} е U5, V<£ = cov{oo,ca} е ии , где Uj-.U^- произвольные наборы матриц из Q такие, что ЗС е U?,Q е иш: V| ^Qwra VV| e е Ua. Пусть также cov {ю} = 0 .В этом
случае Fz е ,где % = col[^,co], a Fx-распределение СВ х - Класс всех распределений Fp неопределенно- стохастического вектора (НСВ) р = col[ и, %], удовлетворяющих сформулированным ограничениям, обозначим ^р" . Далее через Лк будем обозначать класс аффинных преобразований СВ у ; Н+ -псевдообратная по Муру - Пенроузу матрица .
Теорема 2,1 Пусть Fp е и выполнено условие
Е^АН+Н = Е^А, (2.6)
тогда
а) х идентифицируем по у операторами из Лк (линейно идентифицируем);
б) (J, j^) - минимаксная на классе оценка х = я(у) имеет вид
x = D(C,Q)(y-,Fm§-mia)+Bш?, (2.7)
где
|d(c,q)=ah+(i - v7 v7+) + вст* (vy v;)+
в) для VFp e выполнено :
EFp jsK(x_x)j = 0 , Ks = cov{(x-x)(x-x)} £ К, где k = (b-d4,)c(r-d4')* +dqd* , d=d(c,q) (2.9)
r) wwVFpe?p(1) =>j(i,Fp)^ sup j(*,Fp) = J = tr[lK],
f e?cl)
Пусть теперь вектор u считается произвольным СВ с неизвестными характеристиками , удовлетворяющий условию e{||u||2} < оо , а предположения
о СВ % - неизменны. В этом случае Бр е .Обозначим через П класс боре-левских преобразований ЯЧ-»ЯР.
Теорема 2.2 Пусть € , выполнено (2.6), а также Уу2 =ТСТ*+д>0, тогда
а) х идентифицируем по у операторами из П;
б) (^П) -минимаксная на классе оценка х = я(у) имеет вид
* = ^»(С, (^(у-Уп^ - тв) +Вт?, (2.10)
где
0(1)(С^) = АН®+ВСЧ'Х2(1-НН®)
'Н® = (Н*Уу-2Н)+Н*Уг-2 ' (2'И)
Из (2.10),(2.11) следует, что п е -¿А,т.е. х - аффинная оценка. Таким образом, в случае Бр е и V2 > 0 аффинный оператор тс является лучшим среди всех возможных ( линейных и нелинейных) операторов оценивания.
Пусть теперь и - неопределенный детерминированный вектор, а У?2 6 Щ, Ущ е ЗРщ , где Щ, ЯУа - некоторые заданные множества неотрицательно определенных самосопряженных матриц (в общем случае - без экстремальных элементов С и <2). Обозначим класс соответствующих распределений ?1г).
Теорема 2.3 Пусть Щи - выпуклые компакты, и выполнено (2.6), тогда
а) (I, Лк) - минимаксная на классе оценка х = я(у) существует и имеет вид
х = Б(К§,Ка)(у-Тш?-т<в) + Вт?, (2.12)
где
- (I - НН"1-^ , + К« Д5 6 Щ , Я» 6
б) матрицы , Ищ существуют и определяются из условия
'(К,,Кв)б а^тах (2.13)
i(r5,r.)=t{s{(B - M^R^B - M^)' + m^mj, j}
m?a ="d(r4fre);
в)для VFpe^3) =>EFp[l^(x-x)) = 0, EPp (||x-x|!|}s! = l(R?)Ra))
Вышеприведенные результаты относятся к случаю, когда относительно вектора и нет никакой априорной информации. Рассмотрим теперь случай, когда u = col[u!, u2 ], причем подвектор ut удовлетворяет априорному ограничению
и, е^1)={и:||и-и(10)|^ц; и,п[0) б Rn> ;ц<« } (2.14)
Пусть р= col[uj ,u2,5,co] = col[u,x] > тогда Fp е ?р0) означает, что
Uj е , и2 е Rra* , Fx 6 , где определено выше. Критерий y(^,Fp) , к € , Fp е 7р0) качества оценки х = я(у) имеет вид у (я. fp) - |е нр {(х - я(у))( х- я( у))"} | , (2.15)
т.е. 7(71, Fp) -спектральная норма матрицы вторых начальных моментов
ошибки Дх = х-х оценки х.
Модель наблюдений (2.1),(2.2) представима в виде |x=AiU,+A2U2+B4
lyaH^+HjUa+TS+iD 1'
Теорема 2.4 Пусть х,у определены в (2.16), критерий оптимальности 7(0 - в(2.15), тогда
1) для идентифицируемости х по у операторами из j1a на классе ?р0) необходимо и достаточно, чтобы
А2Н}Н2=А2 (2.17)
2) - минимаксная на 7р'0' оценка х = я(у) , к е Лк имеет вид
х = D(0) (С, D)[y -(Н, u(,0) + тш)] +A[uj0) + Вт§ (2.18)
где
d<0) (с, d) = а2 щ (i - ■v7v; )+(рА jS-1 н j + вст*)(vy Vy* )\
3)для VFp e7p°' выполнено
7(S,Fp)<y= sup 7{jc,Fp) =
у??
= ||n(a1-gh1)s"1(a1 -ghi)*+(b-g4,)c(b-g4')"+gqg*|
где О = Б(0)(С,С}).
Заметам, что в условиях теоремы 2.4 оценка х является смещенной, если ц> 0. Модель (2.16) имеет более общий характер , чем модель (2.1), (2.2), однако критерий оптимальности у(я,Рр) для (2.16) - менее общий , чем критерий 1(я,рр) для модели (2.1), (2.2).
Для изучения асимптотических свойств минимаксных оценок рассмотрим модель наблюдения
Уп-ВД +Тпе2 +оп , п= 1,2..., (2.19)
где (^-неопределенный неслучайный вектор; 02 -СВ с частично известными характеристиками :Е{92}= 0,соу{62,92} ^ С, где шп-СВ с характеристиками е{шп} = 0,солг{ооп,(оп}^Р111 , гдерп е^>,п= 1,2.... Предполагается, что С и - известны, а сйт[уп] = п. Если указанные ограничения выполнены, то ££ е ЯГ» где ¥£ - распределение НСВ рп = со1[е,<ап] ,е=со1[е,,е2] ,<ме] = р.
Пусть 1„(я,РР) = Ерр ¡|е-Яп(у)|2}, где я„ е а -класс
линейных операторов Я11 , л = 1,2....
Из утверждения теоремы 2.1 следует, что - минимаксная на
классе ?пр оценка 9 = я п (у„) для 9 по уа имеет вид
0п = «РпЧ + )+Ф^Уп . (2-20)
где ФП=[НП,Т11] , ^=(^[0,0]. Пусть , Хтах[1] = тах(е,1:е),
Теорема 2.5 Пусть -> <=о при п ® , тогда
Д9П =9П -§п—^->0 при п->оо .
Обозначим Ап = Ф*„ФП = {а§°1, Бп = ^[с!^ ,...,а(рп)] , где
,(п) Г (п)]М • ,
Следствие 2.1 Утвеждение теоремы 2.5 остается в силе, если
а) ЗХд > 0 : ^ равномерно по п ;
б) 3?»о >0 , по <« : Уп > по ^.щш
в) с1п = тт^ё^ | —> оо при п -> оо .
Модель (2.19) допускает произвольную корреляцию компонент вектора шума соп. Приведем наиболее важные частные случаи формирования со„. Рассмотрим векторную модель наблюдений с белошумной помехой:
У^Х^е+О», г =1,2.....Т, (2.21)
где У1 е - вектор I -го наблюдения; X, е ;ерхг - известная матрица регрес-соров ; - центрированный белый шум, соу{0( , £2{} £ <3 е
9 = со1[вх ,б2 ] е - НСВ параметров модели. Пусть ут = со1[У(.....У? ] ,
Фг =со1[Х1,...,Хт] , шт =со![Оь...,йт] , тогда (2.21) совпадает с (2.19), где п = Тг, С>п=1т®С>-
Следствие 2.2 Пусть выполнены условия б), в) следствия 2.1 , тогда а) , -¿^^-минимаксная на ^г оценка §т имеет вид
ет =[Ф;(1т®д-1)Ф^.+у0+]"1Фх(1т®д-1)ут (2.22)
б) 0т -0——> 0 при т —> со .
Для описания корреляционной зависимости ошибок наблюдений в модели (2.19) рассмотрим обобщение модели (2.21): Уг = Х*{9+Уг
Л, (2.23) % = Ев*^ к=1
где {Вк - набор матриц, удовлетворяющих условию асимптотической устойчивости модели случайного процесса (СП) {Ус} : ч ]
= 0 ,то [20|<1 • (2.24)
если det
IrZo - ZBkzrk
q ч
Введем обозначения : Xt(B) = Xt - £Х,_кв£ ; Y,(b) = Yt - ^B^Y,^ ;
lc-1 k=l
Фт(В) = col[XÎ(В).....Хт(В)] ; Wt(B,Q) = a4(B)(lT®<Г1)Фт(В);
yT(B) = col[Y1(B)>...,YT(B)] ; АТ(В) = Ф;(В)ФТ(В) = WT(B,Ir);
DT(B) = diag[d1T(B).....dpT(B)] ; dw(B) = [akk(B)]^ ,
k = l.....p; DT = DT(0).
Теорема 2.6 Пусть модель (2.23) удовлетворяет (2.24), а также
1) {£2t}-независимые СВ с распределениями Ft(u) такими, что E{Qt} = О, cov{Qt,Qt} = Q > 0 , Q-известна;
2) sup J||u||2 dFt ( u) -» 0 при а -> 00 , u eRr
Kllulax
3) cov (в, 0} = diag[O, С] = V0-известная матрица; E{ôj =col{91,0}, cov{9,Qt} = 0 , t = l,2,...
4) *<mm[Dr]-»«> "P" T-»«;
n
5) От Хт^Хт^Бт1 0 при Т-» ®;
6) ЗТ0<оо,Хо>0 : ^шл при УТ£Т0 .тогда
а) линейная минимаксная оценка ёт (В, д) имеет вид : ёт(в,д)=[о4(в)(1т®д-1)Фг(в)+у0+]+Ф;(в)(1т®д-1)ут(в) (2.25)
б) пусть Бг - распределение СВ 4т = (В, д)(бт -б), тогда
при Т —> о» (2.26)
Очевидно, в силу условий 4) - 6) теоремы 2.6 условие (2.26) означает, что 8Т -8—-—>0 при Т—.
В случае , когда параметры |Вк ^ , д модели (2.23) неизвестны, построение оценки 9т(В,д) в явном виде невозможно. Однако в этой ситуации можно построить адаптивную минимаксную оценку б^1 = ге^ (ут), я?1 е Пт где Пт - класс борелевских (нелинейных) операторов, такую, что
-ёт(в,д))—при т-»«>, (2.27)
где {В,д} - истинные (неизвестные) параметры модели (2.23).
Из теоремы 2.6 следует, что -в)—Т-»а>,
что означает: оценка имеет асимптотическую точность, совпадающую с точностью минимаксной оценки 9Т(В, д), построенной в условиях наличия существенной априорной информации о модели шума (2.23). В работе показано, что
ё?1 =[с^(вт)(1т®дт1)Фт(вт)+У5-]+<14(вт)(1т0д^)ут(вт)
где {Вт, дт} - некоторые подходящие оценки для {В, д}, построенные по наблюдениям {у?} . Доказано, что в условиях теоремы 2.6 оценка является состоятельной, а ее погрешность Аб^ = б^1 - 6 - асимптотически нормальной.
В третьей главе рассматривается проблема нелинейного рекуррентного оценивания процессов в разностных и дифференциально - разностных стохастических системах управления в условиях неполной априорной информации о вероятностно - статистических характеристиках указанных процессов. Целью исследования являются аналитическое конструирование рекуррентных конечномерных нелинейных алгоритмов фильтрации в системах указанного типа и построение соответствующих стратегий управления. Алгоритмы оценивания и управления строятся посредством непараметрической оптимизации операторов оценивания и управления на некоторых подходящих априорных классах
операторов с использованием минимаксного критерия оптимальности. Соответствующие алгоритмы оценивания случайных процессов (СП) далее называются условно- минимаксными нелинейными фильтрами (УМНФ) .
Введем следующие обозначения: р -СВ с распределением Fp , m - известный неслучайный вектор ,dim[p] = dim[ m] ; - заданное множество неотрицательно - определенных самосопряженных матриц. Пусть Г(ш, щ) -множество всех распределений СВ р таких, что mp = Е{р} = т, Vp = cov{p,p} е 1VS. Если 3Sp е Щ : для VS е 7ei => S ^ Sp , то Г( т, = Ро (m,Sp) ; если же = {SP} - одноточечное множество, то Г( ш, ) = Р (m,S р) (т.е. Р^ m, S р) -семейство всех возможных распределений с заданным средним m и ковариацией SP) . Обозначим также N(m;S) = F^ - гауссовское распределение с mp = m и Vp = S . Очевидно, N(m;S) е .если
Рассмотрим структуру УМНФ применительно к разностной нелинейной стохастической системе уравнений общего вида:
Уп =<Pn(yn-i.un,wn), и = 1,2,..; у0=Л, (3.1)
где уп - фазовый вектор системы, {wn) - СП, описывающий возмущения модели динамики; {и„} - процесс управления; т] - СВ начальных условий. СП {уп} доступен наблюдению по схеме
Zn = Vn(yn.vn), п= 1,2.., (3.2)
где zn- СВ косвенных наблюдений в момент n; {vn} - СП, описьшающий ошибки наблюдений. Далее обозначается = col[zi,.., zn] - массив данных (результатов наблюдений).
Для построения УМНФ введем две структурные функции алгоритма: £n(y,u) - базовая прогнозирующая функция (БПФ) и £n(y,z) - базовая корректирующая функция (БКФ). Предположим, что построена УМНФ-оценка Ул-1 Л113 Уп-t по Z(n-1). Базовый прогноз (БП) у„ для yn по Z(n_1) имеет вид
Уп =4п(Уп-1»"п(2(п_1))) (3.3)
Условно-минимаксным нелинейным прогнозом для уп по у„ называется СВ
Уп=5п(уп), an(Oeaigmin sup ЕрХ |||уп-a(yn)|*j, (3.4)
а6' Fjerfmi;»^)
где Fnx-распределение СВ Хл = col[yn,yn], ^ = |a(-):E|||a(y„)f |<qo|,
m„ и - известны; Е е - весовая матрица, S„ = cov{Xn ,Х„}.
Предположим, что оператор й„ условно-минимаксного прогнозирования существует, тогда можно построить УМНФ-оценку ул для уа, используя Уп и zn.
Условно-минимаксной нелинейной оценкой фильтрации для у„ по .называется СВ у„ = yn + ßn(vn), • (3.5)
где ßn е arg min sup Е J||yn -yn -ß(vn)f ße* . ( . 1 1
Vn = Cn ( У a, zn ), - распределение CB Y„ = col[yn - yn, zn],
* = {ß(0 :E||ß(vn)i}<4 S* = cov{Y„,Yn}.
УМНФ-оценка yn является, таким образом, оптимальной в минимаксном смысле непараметрической коррекцией З'п с использованием БКФ vn = Сп(уп»2п)- Подчеркнем, что / и? - классы операторов, включающих как линейные, так и нелинейные преобразования. Если оптимальный оператор ßn также существует, то рекуррентная процедура УМНФ для СП (3.1) по наблюдениям (3.2) имеет вид:
[уп^М^СУп-ьМг**-0))} (з.б)
lyn = yn+ßn(Uyn.zJ), п = 1,2,..; у0=Л, (3.7)
где fi - некоторое начальное условие для процесса |уа}.
Из приведенных определений следует что УМНФ ищется на классе рекуррентных алгоритмов типа "прогноз-коррекция" с использованием непара-мегрической оптимизации структуры фильтра по минимаксному критерию, что позволяет сократить до минимума объем необходимой априорной информации о совместном распределении СП {уп} и {уп}. Выбор указанной структуры фильтра позволяет весьма естественным образом строить подходящие БПФ и БКФ для алгоритма УМНФ.
Процедура аналитического синтеза УМНФ базируется на следующем утверждении о минимаксном оценивании случайных векторов, имеющем самостоятельное значение. Пусть задана матрица S е :
S = {Sy }2. , s„esiixl1, S^esi^2, 1 = U+12. Обозначим
x(x;S) = S12Sj2x + (m1-S12SÎ2m2) eR1' для VxeR1*, (3.8)
Ks) = tr[z(s
n -S12S22S*2)], где I e S^1**1 - весовая матрица. (3.9)
Пусть col[^j где ^ - СВ, оцениваемый по наблюдениям \г, Fç -распределение а П - класс борелевских отображений R1* —» R'1. Пусть также
is
1р(я) = sup jf^.F;.), 1Г(*)=» sup j(*,F?), (3.10)
FjgPoimi) F$er(m;3?s)
j(«,F5) = EF5{|4,-^2)||2J( Vxen, (3.11)
Теорема 3.1. Пусть F,») определен (3.11), тогда
1) (J, П) - минимаксная на классе Р0 (m; Sp) оценка для по Е,г имеет вид
(3.12)
где •;•) определен в (3.8);
2) если Щ, - выпуклый компакт в Д?^, тогда (J, П) - минимаксная на классе
Г( ш; Щ) оценка имеет виц
h-*rfe)=*(52;Sr). Sr е aig maxI(S), (3.13)
Setts,
где I(S) определен в (3.9);
3)для VZ E{5l-ip(42)} = E{41-M^)} = 0;
4)для VF5 e P0(m;SP) => j(ip,F?)^Ip(ip) = I(Sp); для VF4 e Г(ш;Щ) => j(*r>F5) £1г(яг) = l(sr);
5) пары {ip,A/(m;Sp)| и {ir,A/(m;Sr)} являются седловыми точками критерия j(jt,F§)HaIT®Po(m;Sp) иП®Г(т;^) соответственно.
Используя утверждение теоремы 3.1, можно при определенных условиях найти аналитически функции ап(0 и (Jn(0, определяющие УМНФ (3.6),(3.7).
Пусть для п = 1,2... найдутся константы , и конечные функционалы C?(w),Cn(v) такие, что
1)k(y,u,w)f ^CS(w)(l+[|y||2+|u||2), E{CS(wn)}<«3;
2)|(?n(y,u)f SCijl + jyf+Iuf);
За)]|c„Су,z)|2 * C§ (1+|yf ) равномерноnozeR4;
зб)|5пЫ|1^с|(1+М2^Ы2).
lk(y,v)r^C^(v)(l + ||yf), е|Сд(уп)| <со; 4){w„},{vn} -дискретные белые шумы, E(|wnf +|vnf ] <=o, {wn}, {vn} и Tl - независимы.
Теорема 3.2. Пусть условия 1), 2), За) или 36), 4) выполнены для всех yeRP, z е Ri. Пусть также E||unf]< от, е[|т||2 } <«, а у0 = Efa}, тогда:
1) решение задач (3.4), (3.5) для Г^т*;«^, ) » Р(т*;8*) и
Р^Шд^п) существует при каждом а = 1,2..., причем ап(Уп) = Рп7а+4; РпК) = Нпуп+Ьп, (3.14)
где
Рп = соу{уп,уп}соу*{уп,уп}, ^=Е{Уп}-РпЕ{уп}; (3.15)
Н„ =соу{уп-уп,уп}соу+{уп,уп}, Ьп = -НпЕ{уп}; (3.16)
2) приУп^О Е{уп-уп} = Одля
К„ = соу{уп - уп ,у„ - уп} = соу{у„,уп} - Р„ соу{Уп,уп} -Ндсоу^.уп-у^}.
Для систем управления более частного вида, чем (3.1), (3.2), условия существования УМНФ могут быть ослаблены. Рассмотрим модель дискретной нелинейной диффузии
У^ФпМУо-ьО+ФпЧул-ьИпКп. п= 1,2...; у0=т], (3.17) и нелинейную аддитивную модель наблюдения
2п=Ч/п(Уп)+*п, (3.18)
где {\уп }, {уп } и Г1 - гауссовские.
Теорема 3.3. Пусть СП {уп,гп} удовлетворяет (3.17), (3.18), и для каждого п;> 1 найдутся ап, : 0^ап, Хп <оо такие, что
|^(у,и)||+|ф^(у,и)|+|^(у,и)|^аа(1+|у|х- +Ци||х"), ||м;п(у)||^п(1+«уГ); ^МИ^НуГ»
Тогда, если для Ут >1 Е ||ип ¡ш | <оо и у0 = Е {11}, утверждения теоремы 3.2 остаются в силе.
Пусть теперь ковариации Б* = сот{Хп,Хп}, 8д = соу{Уп, Уп} векторов Х„ = со1[уп,у„], У„ = со1[уц-у„,уп]известны с точностью до принадлежности, соответственно, множествам Ю%х и Ю^,, которые являются выпуклыми
компактами. В этом случае в условиях теоремы 3.2 УМНФ для модели (3.1), (3.2) существует и имеет вид
[уп = у„+н^п(уп.2„)+ь5, Уо=Е{л} где РВ8-3И3&, ^=Е{уп}-Р„5Е{4п(у„-1,ип)}.
H*=S12S2+2, h|=-HSE{?n(yn,Za))t
s = {Sij ]2. eargmaxl(s); S = is« }2. eargnuacKS), 4j=1 Sew., ' 1J=1 Sew
На практике типичной является ситуация, когда динамика системы описывается дифференциальными уравнениями, а наблюдения - дискретны во времени. Соответствующая модель имеет вид
dy{t) = a(y(t))dt+b(y(t))dw(t), у(0) = т]
2n = cn(y(tn))+vn, п = 1,2...,
где w(t) - стандартный винеровский СП.
Базовый прогноз y(t) для y(t), t е (t„_btn) имеет вид y(t) = 4n(yn_i)> где Ук = y(tk), к й п. Условно-минимаксный прогноз y(t) определяется из условия у( t) = ant (y(t)), где
a„,t(-)eargmin sup E(|y(t)-at(y(t))f |, (3.21)
Fi,tep(m;.t;s;,t)
^ = jat(-):Ej|at(y(t))f }<oo,t€(tn_!,tn]j; F*t = Ffxf,] - распределение CB X„ = col[y(t),y(t)], Sjj., = cov{x^,X„}.
Условно- минимаксная коррекция y(tn) = y(tn) + Pn(vn) определяется из
(3.5), где г(тУ;Я?^ pfm^Sj;).
Приведем условия существования и структуру УМНФ для модели (3.20). Пусть о(у) = {су(у)| = b(y)b* (у), а ui[v(y)] - дифференциальный производящий оператор:
4v(y)] = (a(y),w(y))+|tr[o{y)a2v(y)/5y2], (3.22)
где у е Rp, a V(y): Rp -»R1.
Теорема 3.4. Пусть а( у). b(y) непрерывны на Rp и вьшолнены условия
а) для каждой ограниченной области Д с Rp 3 К( Д) < ао : ||a( х) - а( у)| +1Ых) - b(y) J ^ К( Д)||х - у||, V х, у е Д';
б)для V mS 1 3pm<oo:^[l+||x||2ra]spin(l+!|x|[2m), xeRp
в)||4Цу)||<A|(t)(i+ly||x«), A«(tUn<«; r)||cn(y)|| + i|Cn(y,z)||<An(l + i|yf" An <oo.
Если y(0) = E{tj}, to УМНФ для (3.20) существует и имеет вид
y(t) = Fn(t)y(t) + fn(t), te^.tj
Fn(t) =cov{y(t)y(t)}cov+ {y(t),y(t)j; f„(t) = E{y(t)}-Fn(t)E{yn(t)}; y(t) = y(t)+In(t)(Hnvn+hn), te(tn_btn],
11, если ti-^t^.tn), Hn =cov{y{tn)-y(tn),vn}cov+{vn,vn}, hn =-HaE{vn}. Оценка y( t) - несмещенная и имеет ковариацию ошибки
y [К,(t)- Hncov{vn,y(tn)-y(t„)j, t = tn, где К у (t) = Ky (t)—F„ (t) cov {y( t), y( t)}, Ky(t) = cov{y(t),y(t)} <«.
В общем случае УМНФ-оценка является локально-минимаксной. Однако для линейных систем наблюдения можно доказать, что она является также и глобально-минимаксной. Пусть модель наблюдения описывается линейным разностными уравнениями:
ТУш-1 =a„yn+w„+wn, п = 0,1,2,...; у0 = т] lzn = cnyn+vn+vn, где {wn}, {va} - известные неслучайные процессы. Пусть
WN = col[w0,...,wN], VN =col[v0,...,vN], QN =coI[ti,Wn,Vn].Тогда Qn - вектор стохастических параметров модели (3.23). Предположим, что Е {Qn } = col[m„ ,0.....0] = mN,
Rn=ccjv{Qn,Gn } = diag[R11,Rw(0),...>Rw(N),RT(0),...,Rv(N)]^ <;RN =diag[Rn,Rw(0),...,Rw(N),Rv(0),...,Rv(N)], где Rn- известная матрица, m>j - известный вектор. Если F§ = F[Qn ] - закон распределения QN, то Fn е Р0 (mN; RN ). Пусть также Пм - класс борелев-ских операторов оценивания yN по Оценка уп для yn по Z(n) будет минимаксной на классе 5?n =P0(mn;Rn), если Зфп е Пп: для V<pn € Пп
sup EFo{|yn-9n(zW)|fEj< sup Ера j||yn-<pn(Z(n))||*) (3.24)
где yn = фп(г(п)), Б 6 Шц- весовая матрица.
Теорема 3.5. Пусть БПФ и БКФ имеют вид ^„(yn-i) = Уп-ь
£ п(Уп>2п) =2П
— спУп — vn> тогда оценка УМНФ удовлетворяет (3.24) и определяется рекуррентными соотношениями
Уп = Уп+»п(2„-спуп-уп), Рп=(1-»аСп)Рп, (3-25)
где»п=Рпс;(спРпс;-»-Яу(п))\ n = 0,l,..„
Уп+1 = апУп + wn, Pn+1_= anPna; + R w (п) (3.26)
с начальными условиями у0 = гпл, Р0 = Rn.
Ошибки Ду„ = Уп-Уп, Ду„ = УП-Уп прогноза уп и оценки уп обладают свойствами:
Е{Ауп} = Е{Ауп} = 0; с0у{Ду„,Дуп} <;?„; соу{Дуп,Дуп}<;Рп. '
Результат теоремы 3.S использован для построения минимаксного варианта обобщенного рекуррентного МНК. Показано, что соответствующая оценка относится к классу ридж-оценок параметров регрессии, обладающих повышенной устойчивостью к мулътиколлинеарносги модели.
Построена также минимаксная рекуррентная процедура оценивания процесса в системе с линейной структурой и мультипликативными шумам вида:
|УП+1 = апУп +wn +<Pa(yn)wn; Уо= Л Un = СпУп + vn +Ч'п(Уп)уп Рассмотрим теперь проблему минимаксного и условно- минимаксного управления линейной неопределенно-стохастической системой при негауссов-ских возмущениях:
|Уп+1 =a„yn+bnun+wn+wn, уо="П; . .
U„ = cny„+vn+vn, n = 0,l,...N.
где {u„} - управление вида un = vyn(z(n)), где E||nia(z(n))|21 <<м. Пусть
Un = col[u0,...,un] = xFn(z(n)), тогдаТп - стратегия управления. По-прежнему, - закон распределения QN = col[ri, WN, VN ].
Критерий качества управления UN зависит от и F" и имеет вид
j(^,F1?)=E[|(iyioi-T„yB-t,uji;> +!„.£. )+iy^-TN+1yN+1;i;^ J ^
где{у(п0),Тп,1п>дп,Ап} - известны.
Требуется найти стратегию управления 4$:
saigmin sup j(TN,F£), (3.29)
где HN - класс допустимых стратегий управления, a - класс допустимых распределений вектора Q^, описанные выше.
Теорема 3.6. Пусть ~ Po(m>i; ). а стратегия управления
Tn =col[i|/o°)(-),...,4'N^(')] определяется соотношениями
4?^Л2Н = -Кп(<*пУп + Рп)> п = 0,1,...,N, (3.30)
где
Kn=b;sIRlbn+t;Qntn+An; an = b;sn,ia„+t;QnTn;
I sn - anSn+ian + T*QnTn - a*K*an; SN+i = TN+IQn+1Tn+1 ;
k=a;sn+1 +T'Qny(n0) +a;Kißn-a*nS1№lwn; sN+1 -Т5+Л>ыУ(1м; оценка yn вычисляется рекуррентно по формулам (3.25), где jVm-i =(an~bnKJctn)^n +wn-b„KJßn> „
Тогда
JiiK.FÄ)
для VF° и WN eS,rfleF$ = W(mN; KN ). При этом стратегия Ч^ удовлетворяет (3.29), а распределение F$ является наихудшим для задачи управления: е arg шах
inf J^N.Fg).
Из теоремы 3.6 следует, что в рассматриваемом случае для минимаксной стратегии управления в модели (3.27) по критерию (3.28) на классе неопределенности P0(mN;RN) справедлив принцип достоверной эквивалентности: i40) = ч4°'(Уп)» где - оптимальная стратегия управления в модели с
полной информацией, а у л - минимаксная оценка для уп по
ZK
Несколько иная ситуация имеет место в случае, когда е г( m>i; ), где выпуклый компакт. В этом случае минимаксная стратегия управления определяется соотношениями (3.30)-(3.33), где матрица RN определяется из условия:
fN
Ztr[a;KJ;anPn +Sn+1Rw(n)]+tr[s0RI,]
(3.34)
R^J е агатах
где {Рп}^_0 для произвольной е определяется из уравнений
Pп=[I-PnC;(cnPnc;+Rv(n))+cn]pn, Р^а^а^^п), Р0 = 1Ц
Решение задачи (3.34) существует, но зависит от параметров критерия (3.28), поэтому принцип достоверной эквивалентности здесь нарушается (оценка уп не является минимаксной, а "настраивается" на конкретное N и последовательности весовых матриц {<2П,АП}).
В конце третьей главы изучается проблема робастной фильтрации и управления в системе (3.27), где наблюдения {гп} содержат выбросы. Для этой задачи построена явно условно-минимаксная стратегия оценивания СП {уп} и указана соответствующая стратегия условно-оптимального управления.
Заметим, что несмотря на линейность модели (3.27) и квадрагичность критерия (3.28), в данном случае как стратегия управления! так и оценка являются нелинейными по наблюдениям. Пусть в (327) плотность вероятности СВ v„ имеет вид
fv> (х) = (l-5n)g(x/m0(a);Do(n))+6ng{x/mi(n);Di(n)), (3.35) где g(x/m;D) - гауссовская плотность со средним m и ковариацией D > 0; Sn е [0,1] - вероятность выброса на а-ом шаге; {m0(n);D0(n)} - параметры номинального шума; (m^nhD^n)) - параметры аномального шума. В этом случае алгоритм условно-минимаксного управления описывается соотношениями (3.30X3.33), где уп - УМНФ-оценка для у„ вида
?п = УП+Нпуп+Ьп> (3.36)
а вектор коррекции vn вычисляется по следующим формулам:
v.-(l-x(e,))xi«(«ll)+x(ea)x<i>(8ll)
х(„° -пц(п)), i = ОД;
' х(«в) - в.4» (.,)[(!-8,)f<» (en)+Snf<'> (8а)]'1, (3-37)
Ы = g(e„ /оц ( а); спРпС; + Dj ( п)), j = еп =z„-cnyn-vn; Рл =an_1P„_ia^1 + Rw(n-1), где Pn_i - ковариационная матрица УМНФ-оценки для y„_i, построенной по наблюдениям
Выбор коррекции вида (3.37) обеспечивает повышенную устойчивость стратегий управления и оценивания к наличию аномальных ошибок в канале наблюдения. В случае, если выбросы отсутствуют (5П = о), формулы (3.36), (3.37) превращаются в (3.25).
В четвертой главе исследуются методы оценивания процессов в линейных неопределепно-стохастичесхих системах (НСС), описываемых разностными и дифференциальными уравнениями, в правых частях которых присутствуют не только стохастические возмущения, но и неопределенные (неслучайные) возмущающие процессы, наличие которых существенно меняет природу динамической системы. В отличие от классического случая, когда процедура оценивания базируется на использовании априорной информации о неопределенных возмущениях, мы изучаем случай, когда указанная информация отсутствует, однако имеются дискретные или непрерывные косвенные наблюдения компонент входного процесса. При определенных условиях эта дополнительная информация позволяет построить весьма точные рекуррентные оценки процесса на выходе НСС.
Модель НСС с дискретным временем имеет вид ïxt=atxt_h+btut+Çt, t= h,2h,....; h>0; lx0 = V 1 '
Zî
где xt - фазовый вектор НСС; {ut { - неопределенный неслучайный входной процесс; - СП с
Е{4,} - St, cov{§t = 0 при t * т, covfo Д,} » С? k Ct, г де = С,' £ О - известная матричная функция; v - неопределенный неслучайный вектор начальных условий. ^ • •
Модель наблюдения за СП {xt} и неопределенным процессом (НП) {ut} имеет вид
zt - v|/txt +-nt, t = h,2h,...., *
где у о - наблюдение начального условия v; |yt} - косвенные наблюдения НП |ut}; [zt} - наблюдения СП (xt}; {<Dt}»{Titнекоррелированные дискретные белые шумы:
E{cot} = 0, Е{rjt} = 0, cov{<Bt,mt} = Q? cov{Tit,^t} = Pt° *Pt; Центрированный CBoq0 некоррелнрованс {fflt.'Ht}» причемcov{<a0,m0} = 1<5o-Пусть Nt =col[4i„...,4t,<D0,(ah,...,fflt^h,.-.^t] -св стохастических параметров модели (4.1), (4.2), тогда E{Nt} = col[4t.---.4t .0,...,0] = m^ - известный вектор; cov{Nt,Nt} = Rk ^Rjj «<Hag[5h,...,Ct.Qo.-".<5t A.....
Вектор неопределенных параметров модели (4.1 ), (4.2) имеет вид Ut = col[v, ub,..., ut ], причем на него не накладываются какие-либо априорные ограничения.Наконец, Щ = со1[уо»Уь»—»yt>zh»"»zt] -НСВнаблюдений, доступных к моменту t.
Если Ft - закон распределения Nu то Ft е Я = Po(niN ;Rm). Пусть - класс
всех аффинных преобразований вектора наблюдений Щ.
Оценка фильтрации xt = i xt е ^ является минимаксной, если
sup j(*t,Ut,Ft)s sup j(«t,Ut.Ft). (4.3)
U, Лей Ut;Fte?t
где j(*t.Ut.Ft)-EK,{||xt-«t(«i)|^J. St = Z"iO, (4.4)
Заметам, что априори не предполагается, что xt может быть вычислена рекуррентным образом.
Структура алгоритма минимаксного оценивания в модели (4.1), (4.2) описана в следующей теореме.
Теорема 4.1. Пусть выполнены условия
a)St^bt<ptq>t=Z^bt, t=h,2h,....;
3) ФоФо =1.
тэгда
1) СП {xt} линейно идентифицируем по наблюдениям {щ}, а минимаксная оценка xt вычисляется по формулам
x,=atxt_h + bt9?(l-VtVt+)yt+5»
kt =at^t-hat + btcpt"Vt(l- Vt'bVt)(bt<pt'Vt)*
xt =xt + ktviin'tMt+ Pt)+(zt-Vtx)
,kt = kt - kt4/J (vtktVt + Pt)+ Wtkt с начальными условиями
X0=cp$(l-V0V0+)y0; k0=9SV0(l-V0+VoX<PoVo)\ (4-6)
где Vt = , vt=(l-<pt<tf)vt, t = 0, h,...;
2) оценка xt является 2^несмещенной: E js^2 (xt - xt) J = 0, а ковариация ее ошибки равномерно no |Ut,Ft] ограничена сверху:
kt =cov{xt -xt,xt -xt} 5 kt, t = 0, h,2h,....;
3) оценка xt является минимаксной на классе всех 2, -несмещенных (возможно, нелинейных) оценок для xt по Щ.
Предположим, что помимо |ut} в уравнении динамики (4.1) присутствует процесс {vt J, относительно которого имеется априорная информация:
xt = atxt_h+btut + Btvt+^t> t= h,2h,..., (4.7)
где при всех t = hJZh,.... выполнено
VtStvt<;l, где St = SJ >0. (4.8)
Предполагается, что в модели наблюдения (4.2) второе уравнение принимает вид
у, =<ptut+Otvt+oot. (4.9)
В данном случае минимаксная оценка xt = At( щ), %t s uif фильтрации определяется из условия
7cteargmin sap EF, {(xt-*t(*0)(xt-«t(*0) il (4Л0)
{и,);{у«}ЛЛ 1 n ^
Теорема 4.2. Пусть выполнены условия теоремы 4.1, тогда xt вычисляется по формулам (4.5), (4.6), где xt и kt имеют вид: fxt =atxt_h + Atyt+4,°
lkt=atkt_har+(Bt-AA)S7,(Bt-AtOt)4AtQtA,t+Ct,
где
At = bt9i(l-VtVt+) + BtS7^(vtVt',)+> Vt = (l-q>tq>f )vt.
При этом точность оценки xt определена соотношением
|eFi |(xt -xt)(xt -xJ'll^Xjn^kt], t = 0,h......при любых допустимых
{ut,vt} и VFte?t.
Предположим, что имеются наблюдения npH-t = 0>h,2h,...,T, где Т -момент окончания сеанса измерений, тогда для V t й Т можно определить минимаксную оценку сглаживания х* = зч т(я'г) для СП {xt} в (4.1) по наблюдениям ЯРр в (4.2):
sup j(^t,T>Ux,Fx)й sup j(ttix,UT,Fx), V«tiTe^
Оценка xj отличается от xt тем, что для ее построения используются все наблюдения на [0,Т], а не только предшествующие моменту t. Для построения оценки х* будет использована, помимо xt, оценка х[ фильтрации в "обратном" времени:
= at+h(xt+h ~ 't+tJt+h ~4t+h)
% = af+h(kU + li+hQt+h(lU)* +Ct+h)(a^h)*, (4Л2)
a x^, kt определяются из(4.5) с заменой xt, kt на k[ . Начальные условия для (4.12) имеют вид
х^ =<pi(l-VTVi)yT; k{ =<p}VT(l-WVT)(cpiVT)' (4.13)
В (4.12), (4.13) обозначено:
a? =(at)-1, Vt Vt =(l-<pt<pt)Vt, Ц =b^f(l-VtVt+).Очевидно,
xf - минимаксная оценка для x, по наблюдениям на [t,T], а х[ - на [t+h,T]. Оказывается, что оценку х* можно построить, оптимально скомбинировав оценки фильтрации х,их[в "прямом" и "обратном" времени.
Теорема 43. Пусть выполнены условия теоремы 4.1, а также За{ = (at) 'при всех t е (0,Т) и ФтФт -1 = 0. тогда
1) при V t е [0,Т] х? = Я( Т(л>г) определена соотношением
x?=(l-e(t))xt+e(t)xtr, e(t) = kt(kt+kt)+ (4.14)
где xt, kt определены в (4.5), (4.6), а , kf - в (4.12), (4.13);
2) при V t е [0,Т] (х, - х? )| = 0, а
kj^covfxt-xj.xt-x^^k^kt-ttikt + kifkt = (l-s(t))kt
3) sup j(iitjT,UT,FT) = tr{stkts}
Оценка сглаживания xf существенно точнее оценок фильтрации xt, х{ в силу использования не только прошлых измерений Щ, но и "будущих" - щг. Сама же процедура построения х® предполагает лишь наличие алгоритма рекуррентной фильтрации (4.5), (4.6).
Пусть теперь НСС описывается системой стохастических дифференциальных уравнений
fdx, =a(t)x,dt+b(t)utdt+d4t, t 6 [0,Т] [х0 =v
где {ut} - неопределенный входной процесс; {£,,} - СП с ортогональными приращениями, } = и дифференциальной ковариацией C(t). Модель наблюдения имеет вид
fdyt =<p(t)utdt + d(Bt; у0 =<p0v+coo [d2t=4Xt)xtdt+d^,, 1 ;
где {cot}, {rjt} - центрированные СП с ортогональными приращениями и дифференциальными ковариациями
Q(t) и P(t); Е{оо0 } = 0, cov{œ0 ,са0} = Q0. Относительно (4.15), (4.16) предполагается:
a.l) {их }г=0 б - классу локально интегрируемых по Лебегу на [0,t], t 5 Т матричных функций;
а.2) при V t е [0,Т] C(t) £ C(t), Q(t) £ Q(t), P(t) ^ P(t), где Q(t), C(t) 6 , F(t) e ■R> ; компоненты функций Q(t), P(t) и C(t) - кусочно-непрерывны и известны для V t e [0,T]; a.3) v - неизвестный неслучайный вектор; а.4) Qo û Qo £ » Qo " известна;
a.5) матричные функции a(t), b(t), <p( t), xjXt) имеют кусочно-непрерывные компоненты; " кусочно-гладкая функция на [Q, Т]; а.6) СП {Çt}, {oot}, } и СВ ш0 независимы в совокупности. Пусть pt = col[oo0, }. {«г }x=0, fTlx }x=0] " случайный элемент (СЭ) с распределением Ft e где - класс всех распределений, удовлетворяющих а.1)-а.б). Пусть также Щ = col Jy0, {ух , {zt }'=Q J - СЭ, определяющий всю совокупность наблюдений на [0,t], Рассмотрим класс Л* аффинных преобразований СЭ fet
где а',1' - линейный оператор: е||а^ ( Wt)J } < °°> А*2* - квадратично интегрируемая на [0,Т] вектор-функция.
7.7
где
Минимаксная аффинная оценка х1 для XI по Щ определяется из условия:
тцеащтах зир ЕР, (|х,(4.17)
где е - весовая матрица; {у, ит, ^} = |у е Яр; {и^ е Яг'00; ^ е 7\]. Теорема 4.4. Пусть для (4.15), (4.16) вьтолнены условия а.1 )-а.6), а
V V
также для каждого [О,Т] Ь(г)ф+ (1)ч>(1) = ЬШ,
тогда
1) Х[ существует и определена системой стохастических дифференциальных уравнений
ей» =а(1)х1Л + 1(1)ау1 +к(1)Ч/-(1)р-1(т)[<±г1 -цММ*] <ЙЕ, /Л = аМк, + к, а* (0 +1(1)5(1)1* (1) + СМ - (4.18)
Уравнения (4.18) решаются с начальными условиями
х0=Я>®Уо; ко~ФоЗо(Фо)*
где = Ф$|1 -^ (I~ФоФо)Ъо2
2) при VIе [О,Т] е|е^(х1-х()| = 0, к4 = соу{х4-х{,х4-х4}^к,;
3) для V V е , е^, {их е Л}00 вьшолнено
ЕР( |||х( | ^ } = Ге ,где Г{ - гарантированная точность оценки.
Для чисто неопределенной дифференциальной модели (4.15) (т.е. при. С(0 = 0) построен алгоритм двухфильтрового сглаживания процесса {х£}, аналогичный описанному в теореме 4.3. В четвертой главе также изучены связи между алгоритмами минимаксной линейной фильтрации и с.к.- оптимальной линейной фильтрации. Показано, что уравнения (4.5) и (4.11) являются в некотором смысле " предельными" уравнениями стохастической фильтрации в случае исчезновения априорной информации о некоторых компонентах входных возмущающих процессов.
Пятая глава посвящена изучению проблемы оценивания и оптимизации случайных элементов (СЭ) и случайных процессов (СП) со значениями в сепарабельных гильбертовых пространствах (ГП). Указанная проблема представляет как теоретический, так и прикладной интерес, так как ее решение по-
зволяет с единых позиций рассмотреть не только классические задачи оценивания и управления в конечномерных системах, но также охватить системы, описываемые стохастическими интегральными и интегро-дифференциаль-ными уравнениями, системы с распределенными параметрами и т.д. Особенность постановки задачи оценивания состоит в том, что вероятностные характеристики как оцениваемого, так и наблюдаемого СЭ известны лишь частично, что не позволяет в данном случае использовать методы оптимального оценивания и управления.
Для дальнейшего изложения нам понадобятся обозначения: Н£ - сепара-бельное вещественное ГП, 1 = 1,2,...; ГП случайных элементов со
значениями в Н, заданных на полном вероятностном пространстве,
М^Ш) = кэ {(б,9)н Ц^ - норма СЭ 9 в -¿2(Н), - распределение 9;
(Н) - семейство неотрицательно-определенных самосопряженных ядерных операторов из Н в себя, т.е. таких В е -¿(Н^Нз), что
со
=*г(В] = Ц|(вк,Век) |<оо, где {ек} - базисв Н,а ^(Н15Н2) -к=1
пространство линейных ограниченных операторов В: Н] -» Н2; С(Н1,Н2) -пространство всех непрерывных (возможно, нелинейных) отображений из Н^ в Н2; Л/Н(ш;й.)-<т-аддитивная гауссовская мера (гауссов схое распределение со средним т е Н и ковариационным оператором Я е -^(Н) ), заданная на борелевской а-алгебре пространства Н.
Рассмотрим модель наблюдения: пусть ^€^2(^1),Эе-^Нг), где всюду далее 4 - наблюдаемый СЭ, а 9 - оцениваемый по наблюдениям Пусть также Е{£} = е Н], Е{9} = ш0 6 Н2 - известные элементы, а е ^(Н^.Кд е ^(н2) - ковариационные операторы. В этом случае = соу{9,^} е ^(НьНг) - оператор Гильберта-Шмидта. Пусть •П = со1[9,§] - СЭ со значениями в ГП Н3 = Н!®Н2 с характеристиками
тч = со1[т0, пц] ^{л к^)»при4«* е4(нз) •
Предполагается, что точно не известен, однако заданы операторы
11 =
и я»
Ке ^в?
J
такие,что ЯДе/[(Н3)и
В 5 И,, ¿Я о 1Це[11,Я]. В принятых условиях СЭ т] индуцирует на Н3 о-аддитивную меру с распределением Ер . Обозначим через семейство всех распределений Е,,
СЭ "л с заданным тч и R,, е [R, R] . Соответствующие семейства маргинальных распределений Fe и F^ обозначим и
Определение S.1 Оценка 0 для 0 по £ является допустимой обе ©, если найдется последовательность операторов оценивания {\j/„ }"=1 такая, что
1. 6c(hj,h2) , п=1,2,...;
2. для VF? е ^ при всех п = 1,2,... е -¿2(нг)
3. ->0 при в-»« (т.е. § = 1£т.уп(ф. Классу © допустимых оценок соответствует класс Ч* измеримых операторов оценивания: = 8 6 © для VF5 е ]. Заметим, что класс Ч* является весьма широким и включает в себя как линейные, так и нелинейные операторы оценивания.
Пусть е 4х - произвольный допустимый оператор оценивания, тогда критерий качества оценки 0 = ч^Н) имеет вид
С5-1)
Определение 5.2 Оценка 0 = , ф 6 Ч* называется минимаксной по критерию , если выполнено :
sup j(\ji,F4)s sup j(vj/,Ft,) для V^ef (52)
Если существует хотя бы одна оценка 0 = , удовлетворяющая (52), то фе argmin sup jfxy.F,,), (5.3)
или § е argmin sup Ef 1||9-В|2 / Л (5.4)
вев 1 1''
Следующая теорема описывает структуру минимаксной оценки 0 =
и дает характеризацию седловой точки (F,,) критерия J^Fii) наТ®^.
Теорема 5.1 Пусть СЭ т) = col[0,|] имеет распределение F^ е Пусть также задана последовательность {vj/n , определяемая по формуле
Vn(4) = m9 + Re5(K§+rnl)4(4-m5) , (5.5)
где уп 4-0 при п —* «. Тогда
а) 30 е © и у е Ч" такие, что § = и |§-ФпООЦ^н ) ПРИ п->® ;
б) пара (ф, F4) , где F,, =А/н (m^iR,,) является седловой точкой критерия
j(V,F„) на У® Я,;
в) критерий качества J = j(v|;,Fn) оценки 8 = при VF,, е удовлетворяет ограничениям J ^ J й J , где
HEe-QE*-EetQ'+QRtQ*|^(Hi) , J = ||R9>Q=*V4+
a R£ - оператор, псевдообратный к R ? е .¿f (Н i ) ;
г) величина J определяет гарантированную точность оценивания:
min max J|ui,Fn)= max min J(u/,F„ ) = J.
ЧкгЧ» F,, e?n v ц> РЛ67Л 4164» 1 Ц >
При выводе оценки 9 = априори не предполагалась линейность алгоритма оценивания. Однако , из утверждения теоремы 5.1 следует , что ф(%) = К(4) + к , где К е ¿(н1 ,Н2), а к е Н2 -неслучайный элемент. Таким образом, минимаксная оценка 6 оказалась аффинной . Это, в свою очередь, означает, что переход к нелинейным стратегиям оценивания может лишь понизить гарантированную точность оценки СЭ 9 по наблюдениям
В общем случае R^ £ -¿(Hi,H2) , так как . Однако,
в ряде случаев оказывается, что оператор Ree R£ - ограничен, тогда из (5.5) следует, что
Ösme + KesKife-m«) (5.6)
__ А
Например , если оператор - конечномерный , то 0 удовлетворяет (5.6). Наоборот, если R9 - конечномерный и существует замыкание G = cl[R05 ] , то G € ^(Н!,Н2) , а оценка 0 имеет вид:
0 = m0 +g(|-т?) для VF? е Условие Rn <, Rn не является необходимым для корректной постановки задачи минимаксного оценивания и может быть ослаблено. Пус-rbR^ е X, где ЙГ-семейство ковариационных операторов со следующим свойством : 3Rn е X такой , что если G(^) = l.i.m.KeJ^s +Yjj) > Tn , то
n—>oo
для VR,, e "К вьшолнено :
tr[GRnG*]^tr[R9-Re4R?+^5] , wG = [l;-G] , тогда оценка 0 = m9 + G(^) является минимаксной на Фп , где Фл - класс распределений СЭ т\ таких, что Е{"п} = m^ = col[m^,m6], R^ = cov{r|,г)} е X,
Формула (5.5) задает последовательность бесконечномерных аппроксимаций оценки 0 = • В практических приложениях может оказаться более удобной конечномерная аппроксимация вида
4>n(ä;) = m9+Re^?n(4-m§) (5.7)
где - рп ортопроектор на подпространство Ьп СН1 , порожденное конечным набором {е^ системы векторов {е^ , образующий базис Кару-нена-Лоэва (базис собственных векторов оператора Л^).
Теорема 5.2 Пусть т] имеет распределение е ^ • Если последовательность оценок |бп} имеет вид 8П = , где фп определено в (5.7) , то 1. ¡.т. 6П =9 = г|)(9) , где 6 - минимаксная оценка для 0 в смысле (5.5).
П—>оО
В разделе 5.4 главы 5 рассмотрены различные приложения результатов теорем 5.1, 52 к исследованию конкретных моделей:
- построена минимаксная оценка в бесконечномерной линейной регрессионной модели со случайными гильбертовыми параметрами;
- метод статистической линеаризации распространен на случай нелинейных преобразований гильбертовых СЭ;
- построен бесконечномерный аналог условно - минимаксного алгоритма идентификации параметров нелинейной регрессии.
В разделе 5.5 рассмотрены минимаксные алгоритмы оценивания в дифференциальных негауссовых системах: построен алгоритм минимаксного сглаживания траекторий динамической системы по интегральному критерию и синтезирован алгоритм минимаксной рекуррентной фильтрации в стохастической дифференциальной системе общего вида с вырождением шума в канале наблюдения.
В заключение главы 5 результаты теоремы 5.1 использованы для построения условно - минимаксного нелинейного фильтра для гильбертовой системы наблюдения с дискретным временем
|х1 = а(Х4_1) + Ь(Х1_1)^ , 1-1,2,...; Х0-л; (5 8)
Ы =<р(хО +ч<хО^ + Ц^ти ,
где ¡Х(, У4}- СП со значениями в некотором ГП Н. Показано, что если |а( х))|+])Ь( х)||+|<р( х) ||+|чК х) ||+|ц-( х) )| £ К1(1+||х||) , где нормы вычисляются в соответствующих ГП значений операторов в правой части (5.8), а базовые прогноз и коррекция имеют вид
Х, = а(Хм) ,у1-Б(Х„У») ,
где ||а(х)||+|ь(х,у)| £ К! (1+Цх|+||у||) , то УМНФ для (5.8) существует и определяется соотношениями:
Хх = т? -йл-т-КрСн.? +1п1)~1{Х1 - го?)
а-*» 4 ' 4 '
% =х1+1л.ш.кр(к];+бп1)"1(у1-т1[) , Хо = Шо
П->«0
где уп,8п40 при п->®, т? = Е{сц}, Я? =соу{а1,а1}, Я?3 =соу{а1,Р1}, а Д ( = Х( - Х( -ошибка условно - минимаксного прогноза.
Рассмотрена также задача оптимального в минимаксном смысле управления по квадратическому критерию в линейной бесконечномерной разностной системе, аналогичная рассмотренной в главе 3 (но при стандартном виде критерия качества). Показано, что для минимаксного управления справедлив принцип разделения: минимаксное управление имеет вид = где
- оператор, задающий оптимальное управление в невозмущенной системе с полной информацией, а Х( - минимаксная оценка, вычисляемая по рекуррентным операторным соотношениям, определяющим минимаксный вариант бесконечномерного фильтра Калмана.
Шестая глава имеет прикладной характер: в ней рассмотрены практические проблемы реализации разработанных методов минимаксного оценивания и управления на ЭВМ, приведены результаты численного моделирования процессов оценивания и их сравнение как с другими субоптимальными методами оценивания и управления, так и с оптимальными методами. Подробно рассмотрены методы численного синтеза условно - минимаксных фильтров на ЭВМ методом статистического моделирования.
В разделе 6.1 описана процедура построения адаптивной минимаксной оценки закона движения ЛА а условиях неполной информации о вероятностно
- статистических характеристиках ошибок измерений средств траекшрного радиотехнического измерительного комплекса. Приведены результаты моделирования, показывающие потенциальные возможности повышения точности результатов обработки результатов летных испытаний при использовании адаптивных алгоритмов, описанных в главе 2.
В разделе 6.2 описаны численные процедуры определения параметров УМНФ посредством априорного совместного моделирования уравнений динамики системы и уравнений динамики оценки с последующей статистической обработкой результатов моделирования. С целью получения эталона для сравнения различных субоптимальных методов фильтрации построена процедура с.к. - оптимальной рекуррентной нелинейной фильтрации, основанная на численном решении уравнения для ненормированной апостериорной плотности (дискретный аналог уравнения Закаи) с помощью сплайн - аппроксимации специального вида (метод явной аппроксимации А.И.Гребенникова). Рассмотрен также алгоритм численного интегрирования стохастических дифференциальных уравнений, используемый при синтезе УМНФ для непрерывно -дискретной системы наблюдения.
В разделе 6.3 приведены результаты использования методов разд.6.2 для построения условно- минимаксных и оптимальных фильтров для нелинейных разностных и дифференциальных систем, для решения задачи идентификации параметров модели движения ЛА в нелинейной постановке и идентификации модели нелинейных вибраций. Также рассмотрены задачи робастной фильтрации процесса в линейной разностной стохастической системе по наблюдениям с выбросами и соответствующая задача робастного минимаксного
зз
управления. Численные расчеты показали высокую эффективность условно -минимаксных стратегий управления и оценивания: точность алгоритмов практически совпадает с оптимальной при существенно меньших вычислительных затратах.
В разделе 64 рассмотрены практические результаты использования методов минимаксной рекуррентной фильтрации при наличии неопределенных входных возмущений, описанных в главе 4. В частности, решена задача оценивания в реальном времени параметров движения КА по результатам комплексных наблюдений (совместная обработка внешнетраекгорных и телеметрических данных). Использование вашего подхода позволило построить весьма простую, но адекватную модель движения КА, и найти оценки интересующих нас параметров движения, практически не уступающие по точности оценкам, построенным в условиях полной информации о модели движения КА. Рассмотрены как результат фильтрации, так и результаты двухфильтро-вого сглаживания результатов наблюдений, проведен анализ точности соответствующих оценок.
Наконец, в разделе 6.5 приведены некоторые результаты непараметрической фильтрации фрагментов изображений, подвергнутых как функциональному, так и стохастическому искажению. Для оценивания изображений использовались методы минимаксного оценивания случайных элементов со значениями в гильбертовых пространствах
Результата многочисленных расчетов, часть которых приведена & главе б , показывают высокие точностные характеристики разработанных методов оптимизации и оценивания параметров и процессов а разнообразных стохастических системах при весьма умеренных объемах вычислений (в сравнении с оптимальными методами). Особо следует отметить малую чувствительность минимаксных методов к значительным вариациям законов распределения (и их параметров) возмущений в моделях динамики и процессов наблюдения, что существенно расширяет потенциальные области обоснованного применения вероятностно - статистических методов для обработки информации и принятия решений в условиях априорной неопределенности.
Седьмая глава является заключительной: в ней подведены итоги проведенного исследования, сформулированы основные результаты и намечены некоторые возможные направления дальнейших исследований.
Заключение
На защиту выносится следующий комплекс результатов по оцениванию и оптимизации процессов в неопределенно - стохастических системах:
1) теория минимаксной идентификации многомерных линейных неопределенно-стохастических сингулярных регрессионных моделей;
2) методы адаптации минимаксных оценок параметров многомерных регулярных линейных регрессионных моделей общего вида;
3) теория условно - минимаксной нелинейной фильтрации процессов в нелинейных разностных и дифференциально-разностных стохастических системах управления;
4) методы линейного минимаксного и нелинейного условно-минимаксного оценивания и управления в разностных линейных стохастических системах с негауссовскими возмущениями:
'5) теория оптимальной фильтрации и сглаживания случайных процессов в линейных динамических системах с частично наблюдаемыми неопределенно -стохастическими входными воздействиями;
6) решение проблемы минимаксного оценивания случайных элементов со значениями в сепарабельных гильбертовых пространствах в условиях априорной статистической неопределенности;
7) совокупность вычислительных алгоритмов идентификации, фильтрации, сглаживания и оптимизации процессов для неопределенно-стохастических систем управления.
Основные результаты диссертации опубликованы в работах:
1. Панков АР. Оптимизация алгоритмов оценивания параметров стохастических систем в условиях неопределенности //Автоматика я телемеханика, 1985, № 7, с.110-119.
2. Панков АР. Параметрическая идентификация регулярной компоненты векторного нестационарного случайного процесса // Труды 2-й Всесоюзн. конф. по пер-спект. методам анализа и планир. экспер., Севастополь, 1985, ч.1, с.73-75.
3. Панков АР. Методы идентификации регрессионных моделей в условиях неопределенности - В кн.: Задачи стохастического управления. М.: Изд-во МАИ, 1986.
4. Pankov A.R., Skuridin AM. Data processing' under a'priori statistical uncertainty //Proceed. 2-d IFAC Symp. on Stochast Contr.- Oxford: Pergamon Press, 1987,v.2, pp. 97-101
5. Панков АР., Борисов A.B. Фильтрация для систем с неизвестным управлением .- В кн.: Непараметрические методы в киберн. и информатике - Томсх: ТГУ, 1990, т.2, с.417-421.
6. Панков АР. Рекуррентное оценивание траекторий динамических систем с помощью регрессионных нелинейных фильтров .- В кн.: Статистические методы в теории управления JIA М.: Изд-во МАИ, 1990, с.45-53.
7. Панков АР. Синтез условно-минимаксных фильтров для нелинейных стохастических систем методом моделирования.- В кн.:Динамика, управление полетом и исследование операций, Труды 3-й Всесоюзн. школы-семинара, Клин, 1990.
8. Борисов А.В., Панков АР., Сотский Н.М. Фильтрация и сглаживание в неопределенно-стохастических системах с частично наблюдаемыми входными воздействиями // Автоматика и телемеханика, 1991, № 3, с. 85-95.
9. Панков АР., Борисов АВ., Сотский Н.М. Методы и алгоритмы оптимального оценивания состояний неопределенно-стохастических систем. -Препринт. М.:Изд-во МАИ, 1991,43 с.
10. Панков АР. Условно-минимаксная фильтрация процессов в нелинейных стохастических системах .-В кн.: Управление нелинейными системами, вьш. 4.-М.: Изд-во ВНИИСИ АН СССР, 1991, с.40-49.
11. Панков АР., Борисов АВ. Оптимальная фильтрация в неопределенно-стохастических системах с частично наблюдаемыми входными воздействиями // Автоматика, 1991, Ка 6.
12. Pankov AR., Borisov AV. Optimal signal processing for uncertain - stochastic systems // Proceed. 30-th IEEE CDC, Brighton, UK, v.3,1991.
13. Pankov AR., Borisov AV. Process estimation in uncertain-stochastic systems // Advances in Model. Analysis, AMSE Press, 1992, C, v.32, n.1, pp. 1-12.
14. Борисов АВ., Панков АР., Сотский H.M. Минимаксное оценивание в линейных дифференциальных неопределенно-стохастических системах // Автоматика и телемеханика, 1992, Ks 4, с.57-63.
15. Панков АР. Рекуррентная условно-минимаксная фильтрация процессов в разностных нелинейных стохастических системах// Известия АН СССР, сер. Техническая кибернетика, 1992, № 3, с.63-70.
16. Панков АР., Босов АВ. Робастное рекуррентное оценивание процессов в стохастических системах// Автоматика и телемеханика, 1992, № 9, с.102-109.
17. Pankov AR. СопсШопаЦу-тшкпах nonlinear filter for differential system with discrete observations // Advances in Model. Analysis., AMSE Press, 1993, B, v.28, nl, pp.31-39.
18. Панков АР. Стратегии управления в линейной стохастической системе с не-гауссовсюши возмущениямиАвтоматика и телемеханика, 1994, № 6, с. 74-83.
19. Pankov AR., Bosov AV. ConditionaDy-minimax algorithm of nonlinear system state estimation // IEEE Trans. Autom. Control, 1994, v. AC-39, n.8, pp.1617-1620.
20. Pankov AR., Borisov AV. Optimal filtering in stochastic discrete-time systems with unknown inputs // IEEE Trans.Autom.Control, 1994, v. AC-39, n. 12, pp.2461-2464.
21. Pankov A.R., Borisov AV. A solution of the filtering and smoothing problems for uncertain-stochastic dynamic systems // Intern. J. Control, 1994, v. 60, n.3, pp. 413-423.
22. Панков АР., Борисов АВ. Минимаксные процедуры статистического оценивания в гильбертовых пространствах // Доклады РАН, 1995, т.345, № 6, с. 727729.
23. Borisov А.V., Pankov A.R. Minimax statistical estimation procedures in infinite dimensional spaces // Proceed. EFAC Conf. System Structure and Control, Nantes, France, 1995, pp. 49-54.
24. Панков АР., Босов АВ. Конечномерные алгоритмы оценивания состояний нелинейных стохастических систем // Вестаик МАИ, 1995, т.2, вып. 2, с. 44-51.
25. Borisov A.V., Pankov A.R. Condidonally-minimax filtering for infinite-dimensional nonlinear stochastic systems // Proceed 3-D Europ.Control Conf., Roma, Italy, 1995, v.3, pp.2154-2158.
26. Borisov A.V., Pankov A.R. Conditionally-minimax filtering and control in infinite dimensional stochastic systems // Proceed. 34-Th IEEE CDC, New Orleans, USA, 1995,v.l,pp.87-92
27. Босов A.B., Панков АР. Алгоритмы управления в системах с перключающи-мися каналами наблюдения И Изв. РАН, сер. Теория и сист. управления, 1996, № 2, с. 98-103.
28. Борисов АВ., Панхов А.Р. Проблемы минимаксного оценивания случайных элементов в гильбертовых пространствах // Автоматика и телемеханика, 1996, № 6, с. 61-76.
29. Босов А.В., Панков АР., Овсянко Д.Е. Алгоритмы нелинейной фильтрации процессов в линейных системах случайной структуры // Космические исследования, 1996, т.34, №6, с. 641-650.
30. Pankov AR-, Bosov А V. Recursive estimation in nonlinear discrete-continuous stochastic systems // Proceed. 3-D IF AC Intern. Workshop SSPCS-97,1997, pp. 150152.
n
Текст работы Панков, Алексей Ростиславович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
/
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ АВИАЦИОННЫЙ ИНСТИТУТ ( ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)
ПАНКОВ Алексей Ростиславович
МИНИМАКСНЫЕ МЕТОДЫ ОЦЕНИВАНИЯ
И ОПТИМИЗАЦИИ ПРОЦЕССОВ В НЕОПРЕДЕЛЕННО - СТОХАСТИЧЕСКИХ СИСТЕМАХ
05.13.01 - Управление в технических системах
Диссертация на соискание ученой степени доктора физико-математических наук
На правах рукописи удк 519.21 :62-50
Москва - 1998
СОДЕРЖАНИЕ
1. Введение.......................................................... 4
2. Минимаксное оценивание в неопределенно-стохастических регрессионных моделях..........................................................
2.1 Постановка задачи.................................................
2.2 Минимаксные оценки на классах распределений Щ1 и ^ ........... 22
2.3 Минимаксные линейные оценки на классах распределений ЩЬ и ^ ... 31
2.4 Минимаксная идентификация неопределенно-стохастической регрессии при ограничениях на параметры... ^....................................... 36
2.5 Асимптотические свойства минимаксных оценок.......................... НЪ
2.6 Адаптивные минимаксные оценки для модели с авторегрессионными шумами................................................................. 5Z
3. Условно-минимаксное оценивание и управление в динамических системах......60
3.1 Постановка задачи..................................................бо
3.2 Минимаксное оценивание случайных векторов.........................
Зл *гг и о V 1 о и
.3 Условно-минимаксныи нелинейный фильтр для разностной стохастической динамической системы................................................... ю
3.4 Условно-минимаксный нелинейный фильтр для непрерывно-дитскретной системы................................................................?б
3.5 Минимаксная фильтрация в линейных и квазилинейных системах.........%0
3.6 Структурные функции условно-минимаксного нелинейного фильтра..... 88
3.7 Робастная фильтрация процесса в линейной разностной стохастической системе................................................................ 92
3.8 Минимаксное управление в линейных негауссовских системах...........95*
3.9 Алгоритмы управления по наблюдениям с выбросами...................102
4. Минимаксное оценивание процессов в линейных неопределенно- стохастических системах................................................................................................Ю8
4.1 Модели неопределенно-стохастических систем..........................{0%
4.2 Проблемы оценивания процессов в неопределенно-стохастических системах Щ
4.3 Минимаксное оценивание в разностных неопределенно-стохастических системах................................................................ПН
2
4.4 Минимаксная фильтрация процессов в разностных стохастических системах................................................................i29
4.5 Минимаксное оценивание в неопределённол-стохастических дифференциальных системах........................................................ цъ
5. Минимаксное оценивание случайных элементов в гильбертовых пространствах............................................................ 443
5.1 Постановка задачи и основные распределения.......................... МЪ
5.2 Решение задачи минимаксного оценивания.............................
5.3 Аппроксимации минимаксных оценок.................................15Ц
5.4 Оценивание в бесконечномерных регрессионных моделях................iSg
5.5 Оценивание процессов в линейных негауссовских стохастических дифференциальных системах.............................................. 46Ц
5.6 Условно-минимаксная фильтрация гильбертовых стохастических последовательностей..........................................................................................................171
5.7 Минимаксное оценивание и управление в линейных разностных системах
6. Численные методы и алгоритмы минимаксного оценивание и управления. ...................................................................4Z0
6.1 Минимаксное оценивание закона движения JIA в условиях априорной неопределенности...................................................... 18 О
6.2 Алгоритмы синтеза условно-минимаксных и оптимальных фильтров для нелинейных стохастических систем........................................ 18?
6.3 Апробация алгоритмов условно-минимаксной фильтрации и управления. Ш
6.4 Алгоритмы фильтрации и сглаживания процессов с неопределенными входными воздействиями.................................................20?
6.5 Непараметрическая минимаксная обработка фрагмента искаженного изображения...............................................................2 Ah
7. Заключение..........................................................213
Литература..........................................................222
Приложение. Основные обозначение и сокращения........................2.ЪЧ
1. Введение
В настоящее время математические методы обработки информации в целях оптимизации процессов в сложных системах доказали свою эффективность при решении разнообразных прикладных задач управления техническими, эко-номи-ческими и другими реальными системами. Развитее математической теории управления идет в направлении все большего усложнения применяемых моделей и методов для достижения адекватного описания реальных процессов и повышения надежности получаемых стратегий обработай информации и формирования процессов управления. Если на начальной стадии развития теории управления превалировали классические детерминированные модели, описываемые алгебраическими соотношениями, обыкновенными дифференциальными уравнениями, уравнениями в частных производных, интегральными соотношениями и другими аналогичными моделями [4, 57, 107, 116, 195 ], то дальнейшие теоретические исследования и результаты практического использования полученных методов и алгоритмов показали, что для адекватного описания реальных процессов необходимо использовать модели, органической частью которых являются неопределенные параметры и сигналы, значения и поведение которых заранее нельзя достоверно предсказать. Последнее привело к созданию стохастической теории управления и развитию сопутствующих вероятностно-статистических методов и алгоритмов обработки информации. Естественно, основные усилия были направлены на получение оптимальных по некоторым специальным критериям методов идентификации, фильтрации и управления. Указанные критерии явно учитывают вероятностно-статистический характер решаемой задачи, а реализация оптимальных алгоритмов обработки информации предполагает наличие необходимого (достаточно большого) объема априорной информации о вероятностных характеристиках случайных параметров и возмущений как в модели исследуемой системы, так и в модели, описывающей систему сбора и регистрации информации, необходимой для организации управления. Методы оптимального оценивания в статических (регрессионных) конечномерных моделях описаны в [1, 12, 16, 28, 32, 69, 103, 108 ], результаты
М
по оптимальной идентификации моделей временных рядов изложены в [5, 63, 109, 111, 183]. Для моделей динамических систем, описываемых линейными разностными и дифференциальными стохастическими уравнениями, при условии линейности модели наблюдения наиболее эффективным алгоритмом оценивания является фильтр Калмана [ 30, 55, 76, 86,107,113 ], а для нелинейных моделей - фильтр Кушнера-Стратоновича или Закаи [ 62, 86, 96, 121, 138, 153, 184]. Указанные базовые алгоритмы и их обобщения и разновидности позволяют синтезировать оптимальные стратегии управления, реализуемые в условиях неполной информации о фазовом векторе управляемой системы, причем для линейных динамических систем, квадратичного критерия качества управления и в предположении гауссовости распределения шумов в модели динамики системы и ошибок наблюдений, соответствующие стратегии управления могут быть найдены аналитически [ 30, 40, 57, 76, 107, 108 ]. В настоящее время существенные усилия прилагаются к распространению указанных оптимальных методов оценивания и управления на системы с бесконечномерным фазовым вектором, которые позволяют описать динамику процессов в абстрактных (гильбертовых и банаховых) пространствах [ 88 - 90, 105, 117 -119, 128, 129, 135, 169, 171, 181, 195 ]. В основном, правда, исследования сосредотачиваются на линейных статических и динамических системах наблюдения - управления, а нелинейная теория находится в существенно менее развитом состоянии. Наряду с задачами оценивания и управления также исследуются проблемы оптимального выбора плана эксперимента с целью повышения точности оценок параметров, сигналов и снижения затрат на управление [4,32, 65,196 ].
Если для линейных конечномерных систем проблема оптимального оценивания и управления имеет решение, пригодное для практической реализации, то для нелинейных систем уравнения оптимальной фильтрации являются весьма сложными и в настоящее время не поддаются реализации на ЭВМ в полном объеме. Заметим, что и для линейных динамических моделей, содержащих неизвестные параметры или имеющих случайную структуру, оптимальные алгоритмы оценивания относятся к специальному классу задач нелинейной фильтрации [13, 14, 24, 31, 39, 57, 70, 77, 114, 163], а соответствующие алгоритмы опти-
5
малыюго управления по квадратическому критерию с конечным горизонтом труднореализуемы вследствие наличия дуального эффекта [13, 14, 57, 95]. Основная сложность в задаче оптимального нелинейного оценивания и управления состоит в том, что в общем случае для соответствующей оценки состояния системы отсутствует конечномерная система достаточных статистик для апостериорного распределения состояния системы. Таким образом, даже для конечномерной нелинейной системы управления уравнения фильтрации являются бесконечномерными [ 62, 78, 127, 138, 140, 141, 146 ]. Для некоторого очень ограниченного класса моделей существуют конечномерные оптимальные нелинейные фильтры [ 127, 137, 179, 193 ], однако в общем случае задача нелинейной фильтрации является бесконечномерной [146 ]. Для практической реализации алгоритмов фильтрации и управления в нелинейном случае предложен ряд приближенных конечномерных алгоритмов (субоптимальных методов фильтрации и управления), таких как линеаризованный и расширенный фильтры Калмана, фильтры второго порядка, гауссовские фильтры [ 17, 39, 54, 55, 64, 65, 96, 136, 139, 174, 183, 184, 192, 193 ]. Все они в той или иной степени используют процедуры линеаризации, конечномерной параметризации и нормальной аппроксимации [ 38, 86, 97 ], что приводит в конечном итоге к неадекватности применяемых моделей и расходимости процесса фильтрации, вызванных наличием неучтенных возмущений и ошибочной спецификацией законов распределения оценок и управляющих сигналов. Например, эвристические обобщения на нелинейный случай теории оптимальной линейной фильтрации Калмана приводят к алгоритмам, дающим в общем случае существенно смещенную оценку фазового вектора системы [166], о величине которой нельзя судить по параметрам самого алгоритма фильтрации. Кроме того, указанные методы оценивания не обладают какими-либо глобальными или локальными оптимальными свойствами, что, естественно, приводит к снижения эффективности процессов управления, базирующихся на использовании субоптимальных методов оценивания.
В свете сказанного, весьма актуальной является задача построения конечномерных алгоритмов нелинейной фильтрации с улучшенными свойствами ( например, локально оптимальных), не являющихся эвристическими обобще-
ниями фильтра Калмана или результатом упрощения уравнений типа Кушнера-Стратоновича или Закаи. Один из возможных подходов был предложен В.С.Пугачевым, который привел в дальнейшем к созданию целого класса алгоритмов условно-оптимальной нелинейной фильтрации и управления [79, 80, 84, 86, 87, 94, 96, 175], занимающих промежуточное положение между субоптимальными и оптимальными методами фильтрации сигналов в нелинейных стохастических системах управления.
Основной проблемой в реализации оптимальных методов оценивания и управления, помимо их сложности, является отсутствие полной априорной информации о параметрах моделей и вероятностных характеристиках возмущений. Зачастую нет четкой информации о том, можно ли считать параметр модели случайным или следует трактовать его как неопределенный детерминированный. Но даже в случае, когда есть основания считать, что параметры модели являются случайными, у нас обычно нет достоверной информации о точных значениях их вероятностных характеристик ( законов распределения, моментных характеристик, ковариаций с другими параметрами и т.д.). Более того, есть основания считать, что во многих задачах, для которых найдены оптимальные решения, условия реализации последних практически никогда не выполняются. Например, шумы наблюдений практически всегда содержат аномальные значения (выбросы), что не позволяет обоснованно использовать предположение об их га-уссовости [ 34, 110, 111 ]. Кроме того, оптимальные методы оценивания и управления являются весьма чувствительными даже к незначительным отклонениям от принятых допущений, в условиях которых и были получены указанные методы [ 9,16,69,110,111].
Приведенные выше факты явились причиной повышенного интереса к исследованию задач оценивания и оптимизации процессов в системах с априорной неопределенностью. В настоящее время сформировались два основных подхода к разработке методов исследования систем указанного типа: минимаксный и адаптивный.
Суть минимаксного подхода состоит в том, что для обобщенных параметров модели формируется некоторое множество неопределенности их значений и
Г
характеристик, после чего задача оценивания и управления решается оптимальным образом в предположении, что реализован «наихудший» элемент указанного множества. При определенных условиях такое решение существует, а алгоритм его реализации обладает гарантирующими свойствами [ 9, 52, 59 - 61, 110, 125 ]. Таким образом, задачи оценивания и управления при данном подходе решаются с помощью методов теории игр. Впервые в задачах классической математической статистики указанную идею в достаточно развитой форме реализовал А.Вальд [15]. В силу плодотворности игрового (т.е.минимаксного) подхода, в дальнейшем были получены глубокие и разнообразные результаты по минимаксной параметрической и непараметрической статистике [ 12, 32, 37, 68, 70, 185 ], весьма полный обзор последних результатов в этой области приведен в [126]. Для указанного круга задач обычно параметры модели считаются неопределенными неслучайными и принадлежащими некоторым ограниченным областям конечномерного пространства, а модели - стохастическими с неизменными во времени вероятностными характеристиками, которые полностью или частично известны. Минимаксному оцениванию бесконечномерных параметров при известных характеристиках стохастической модели наблюдения посвящено существенно меньше работ, которые в основном связаны с проблемой решения некорректных задач со случайными ошибками в данных [37, 56, 91, 104, 105,122]. При идентификации и оптимизации линейных регрессионных моделей использовались различные подходы к минимаксному оцениванию, связанные с разными способами описания возмущений. Так, в работах [52, 59 - 61, 66, 71] использовалась детерминированная модель возмущений с некоторым фиксированным множеством неопределенности, описывающим допустимые значения самих возмущений, а не их характеристик. В работах [ 9, 10,61, 66, 98,99, 182 ] неопределенные параметры модели считались неслучайными и неограниченными, а возмущения - стохастическими с частично известными характеристиками. Для этого случая наиболее общие результаты получены для задачи линейного несмещенного минимаксного оценивания значения линейного функционала на конечномерном евклидовом пространстве параметров. Проблема минимаксного оценивания случайных параметров в конечномерных статических моделях с ап-
8
риорной неопределенностью изучалась в работах [36, 100, 150, 158, 186, 188], а в бесконечномерных моделях - в [73, 74, 91, 105, 151, 154, 172 ]. В основном рассматривались линейные модели и линейные стратегии оценивания. Некоторые результаты для нелинейных моделей получены в [92]. Минимаксное оценивание конечномерных параметров в бесконечномерных моделях наблюдения для случая детерминированных шумов, принадлежащих априорным множествам неопределенности, изучалось в работах [25, 26, 82, 154]. Минимаксным методам планирования эксперимента посвящены работы [65, 82]. Особое внимание при исследовании методов идентификации статистически неопределенных моделей было уделено робастным методам оценивания [16, 34, 69, 110, 111, 114, 150 ], которые даже для линейной модели наблюдения реализуются в виде нелинейных алгоритмов, а минимаксные свойства оценок проявляются в асимптотике.
Для решения проблем управления особый интерес представляют методы оптимизации и оценивания процессов в динамических системах, описываемых разностными и дифференциальными уравнениями в конечномерных и бесконечномерных пространствах в условиях неполной априорной информации о характеристиках модели динамики системы и процесса наблюдения. Методы оценивания и управления в динамических системах с детерминированными возмущениями изучались в работах [ 8, 47, 51, 72, 108, 112, 173 ], и проводимые исследования были нацелены на получение аналогов оценок фильтра Калмана и соответствующих стратегий управления по неполным данным. Для специальных критериев эффективности процедур оценивания и управления была развита Ню -теория [81, 124, 125, 178 ], �
-
Похожие работы
- Минимаксное параметрическое оценивание в линейных обобщенных неопределенно-стохастических регрессионных моделях
- Методы минимаксного оценивания в многомерных линейных моделях наблюдения при наличии геометрических ограничений на моментные характеристики
- Алгоритмы оптимального оценивания в стохастических системах в условиях априорной неопределенности
- Методы робастной оптимизации стратегий в линейных стохастических моделях
- Методы минимаксно-статической оптимизации и оценивания в линейно-квадратичных моделях
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность