автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Методы инвариантного погружения и аппроксимации в рестриктивных задачах управления и фильтрации
Автореферат диссертации по теме "Методы инвариантного погружения и аппроксимации в рестриктивных задачах управления и фильтрации"
5 и .4
2 1 АПР 1993
МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи УДК 519.95
ПОДДУБНЫЙ ВАСИЛИЙ ВАСИЛЬЕВИЧ
МЕТОДЫ ИНВАРИАНТНОГО ПОГРУЖЕНИЯ И АППРОКСИМАЦИИ В РЕСТРИКТИВНЫХ ЗАДАЧАХ УПРАВЛЕНИЯ И ФИЛЬТРАЦИИ
Специальность 05.13.16 - "Применение вычислительной техники, математического моделирования и математических методов в научных
исследованиях"
Автореферат диссертации на соискание ученой степени доктора технических наук
Томск — 1998
Работа выплнена в Томском государственном университете.
Официальные оппоненты:
Доктор технических наук, профессор Ивановский Р.И. Доктор технических наук, профессор Тарасенко В.П. Доктор технических наук, профессор Рубан А.И.
Ведущая организация: Центральный научно-исследовательский институт "Электроприбор" (г. Санкт-Петербург)
Защита состоится 21 мая 1998 года в 14 часов на заседании Диссертационного совета Д.063.53.03 при Томском государственном университете по адресу: 634050, г. Томск, пр., Ленина, 36.
С диссертацией можно ознакомиться в научной библиотеке Томского госудаственного университета.
Автореферат разослан 27 марта 1998 года.
Ученый секретарь Диссертационного совета,
кандидат физико-математических наук , ^
/х
Б.Е.Тривоженко
/
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы.
Проблема оптимальной фильтрации состояний динамических систем и рекуррентных процессов по наблюдениям, поступающим в темпе реального времени, является чрезвычайно важной в задачах траекторных измерений, обработки навигационной информации, управления подвижными объектами и во многих других приложениях. Для стохастических систем и процессов решение этой проблемы сводится к вычислению в каждый данный момент текущего времени апостериорного (байесовского) среднего, обеспечивающего минимум полной среднеквадратической ошибки фильтрации состояния. В частном случае линейных стохастических систем и процессов с известными параметрами эта задача блестяще решается алгоритмами фильтра Р.Калмана. Однако в общем случае нелинейных стохастических систем и процессов (в том числе с неизвестными постоянными или случайно изменяющимися параметрами, включаемыми в расширенное пространство состояний) не удается построить замкнутую систему дифференциальных или рекуррентных соотношений, позволяющую точно вычислять байесовские апостериорные средние состояний и параметров в текущем времени. В этом случае приходится строить алгоритмы приближенного решения задач оптимальной фильтрации и идентификации (адаптивные, параллельные, "пульсирующие" фильтры и др.).
Проблема оптимальной фильтрации особенно усложняется в условиях априорной неопределенности, когда неизвестные состояния, параметры и даже наблюдения не могут быть описаны стохастическими моделями. В этом случае теряет смысл понятие полной (байесовской) среднеквадратической ошибки фильтрации и не могут быть построены соответствующие апостериорные средние. При этом само понятие оптимальности требует уточнения. Если известно, что неопределенные воздействия, параметры и наблюдения принадлежат некоторым замкнутым областям (компактам) соответствующих евклидовых пространств, решение задачи оптимальной фильтрации может быть получено на основе методов теории дифференциальных игр (Н.Н.Красовский). Оно сводится к построению для каждого момента текущего времени информационных множеств, совместимых с наблюдениями. Оптимальная опенка фильтрации (а также сглаживания и предсказания) оказывается оценкой множественного включения (А.Б.Куржанский). В качестве оптимальной точечной оценки берут обычно чебышевский центр информационного множества, мпнимакс. обеспечи-
вающий гарантированное качество оценивания, независимо от действ! тельно реализовавшихся неопределенных возмущений из ограниченног замкнутого множества их возможных значений. Аналогичным образом ре шается задача фильтрации и в условиях частично стохастических моделей когда состояния и наблюдения могут содержать как стохастические, так ] неопределенные (но подчиняющиеся указанным ограничениям) комшнен ты возмущений (И.Я.Кац, А.Б.Куржанский).
В рамках гарантирующего подхода возможна не только минимаксна стратегия. Любая стратегия, не выводящая условно-байесовскую оцснк; за пределы информационного множества, является допустимой и услов но оптимальной. Например, возможна стратегия, рассчитанная на мак симально правдоподобные значения неопределенных возмущений в преде л ах заданных ограничений. Такая стратегия позволяет оценивать ("от с леживать") истинные значения неопределенных возмущений. При доста точно высокой точности этого оценивания (более высокой, чем для оценки определяющей чебышевский центр информационного множества в мини максной стратегии) действительная точность фильтрации состояния мо жет быть существенно повышена по сравнению с минимаксной стратеги ей. Естественно, точность такого подстраиваемого ("адаптивного") фи ль тра всегда выше (по определению), чем точность затрубленного фильтра рассчитанного на "наихудшую", наименее благоприятную реализацию не определенных возмущений. Методы фильтрации состояний динамически; систем и рекуррентных процессов с одновременной настройкой ("адапта цией") на неопределенные возмущения при наличии ограничений типа не равенств до настоящего времени практически не были разработаны и ис следованы.
Диссертационная работа посвящена разработке конструктивных ме тодов синтеза и исследованию эффективности алгоритмов совместной условно-байесовского рекуррентного оценивания состояний и максималь но правдоподобного оценивания неопределенных ограниченных возмуще ний применительно к динамическим системам и рекуррентным продес сам, стесняемым ограничениями типа неравенств и в дальнейшем назы ваемым рестриктивными, на основе использования принципа максимум; Л.С.Понтрягина и методов инвариантного погружения и аппроксимации Результаты диссертационной работы применимы также к решению зада1 синтеза оптимального программного управления.
Работа выполнялась в соответствии с тематическими планами научно исследовательских работ Томского государственного университета, Коор
дотационными планами АН СССР на 1976-1985 г.г. по проблемам 1.10.3 (тема 1.10.3.2.2), 1.10.4 (темы 1.10.4.2а,б) гос.регистращш 77019134, 01830062805), планами важнейших НИР, проводимых в 1986-1995 г.г. по заказам-нарядам Минвуза России (Л'з.Л» гос.регистрации 01860125631, 01950001753).
Целью настоящей работы является построение и исследование рекуррентных алгоритмов совместной оптимальной фильтрации состояний и неопределенных ограниченных воздействий в рестриктивных динамических системах.
Методы исследования. При выполнении диссертационной работы использовались методы теории оптимальных процессов, математического анализа, теории дифференциальных и разностных уравнений, теории аппроксимации, вычислительной математики, теории вероятностей и математической статистики, а также методы математического моделирования.
Научная новизна.
В работе впервые систематически исследованы вопросы совместной условно-байесовской и максимально правдоподобной рекуррентной фильтрации состояний и неопределенных ограниченных воздействий для рестриктивных динамических систем и рекуррентных процессов. На основе развития методов инвариантного погружения и аппроксимации разработаны новые, не требующие применения процедур последовательных приближений конструктивные методы решения двухточечных краевых задач оптимизации и фильтрации рестриктивных рекуррентных процессов, позволяющие повысить эффективность решения задач фильтрации состояний линейных и нелинейных динамических систем в условиях априорной неопределенности. Получены точные и приближенные (использующие методы коллокации, наименьших взвешенных квадратов невязок и др., а также методы пошаговой аппроксимации линейными, степенными, гиперболическими функциями, полиномами Эрмита и др.) алгоритмы решения рестриктивных уравнений инвариантного погружения. На их основе построены точные и приближенные рекуррентные алгоритмы рестриктив-ной фильтрации. В частности, построен не имеющий аналогов алгоритм рестриктивной фильтрации неопределенного ограниченного тренда интенсивности пуассоновского потока. Предложена конструкция нового типа полиномиального сплайна - рестриктивного сплайна, занимающего промежуточное положение между обычными полиномиальными сплайнами соседних целочисленных дефектов, что позволяет существенно повысить
о
гибкость сплайн-аппроксимации данных.
Практическая певность.
Применение разработанных методов и алгоритмов рестриктивной филь трации и рестриктивной сплайн-аппроксимации в системах траектории) наблюдений, навигационных, океанографических и других технических си стемах позволяет повысить эффективность обработки информации и точность определения состояний систем в условиях априорной неопределенности.
Внедрение результатов работы.
Результаты работы, реализованные в рамках НИР " Розыск-МВО". "Репортер-РВО", "Рулевой-РВО" в виде математических моделей функционирования навигационных систем в условиях априорной неопределенности, алгоритмов и программ комплексной обработки навигационной информации и исследования навигационных систем, использованы в в/ч 62728 при исследовании перспективных технических систем навигации и океанографии и при разработке технических заданий на НИР и ОКР по созданию таких систем. Это позволило повысить обоснованность и оперативность принимаемых решений при разработке перспективных систем морской навигации.
Результаты работы, реализованные в рамках НИР "Ботаника", "Руан-МСП", "Ригведа-МСП", "Уссури" в виде математических моделей функционирования навигационных систем, алгоритмов и программ обработки навигационной информации при стохастических и нестохастических возмущениях, подчиняющихся ограничениям, использованы в ЦНИИ "Электроприбор" (г.Санкт-Петербург). Научно-технический эффект от внедрения результатов диссертации состоит в повышении точности обработки навигационной информации в условиях априорной неопределенности.
Результаты работы, реализованные в виде комплекса программ имитационного моделирования "ИСМОНД" (589.АШЯ.21-01), использованы в ЦНИИ "Дельфин" (г.Москва) для автоматизации разработки стендовых и государственных испытаний изделия "Лидер". Комплекс "ИСМОНД" рекомендован к использованию для контроля этого изделия в процессе се-, рийного производства и предпоходной подготовки.
Кроме того, материалы исследований используются в учебном процессе при чтении курса лекций "Основы теории управления" и проведении лабораторного практикума по этому курсу на персональных компьютерах для студентов специальности 22.04.00 "Программное обеспечение вычислительной техники и автоматизированных систем" в Томском государ-
.твенном университете и при выполнении курсовых и дипломных работ :тудентов.
На защиту выносятся следующие положения.
1. Постановка и способ решения проблемы совместного оптимального :татистического оценивания состояний и априорно неопределенных огра-гаченных возмущений для динамических систем и рекуррентных процессе.
2. Развитие метода инвариантного погружения применительно к ре-:триктивным двухточечным краевым задачам оптимизации рекуррентных процессов.
3. Разработка точных методов решения уравнений инвариантного погружения для двухточечных краевых задач оптимизации рестриктивных рекуррентных процессов и построение точных алгоритмов рестриктивной фильтрации.
4. Разработка конструктивного математического аппарата пошагового отображения и пошаговой аппроксимации решений уравнений инвариантного погружения и разработка на его основе приближенных алгоритмов фильтрации рестриктивных рекуррентных процессов.
5. Построение алгоритма максимально правдоподобной рестриктивной фильтрации тренда интенсивности пуассоновского потока.
6. Разработка конструкции нового типа полиномиального сплайна -рестриктивного сплайна, занимающего промежуточное положение между обычными полиномиальными сплайнами соседних целочисленных дефектов.
Апробация работы.
Основные результаты диссертационной работы докладывались и обсуждались на следующих научно-технических форумах:
I Всесоюзная школа-семннар по непараметрической статистике (Томск, 1973); VI Всесоюзная конференция по теории копирования и передачи информации (Томск, 1975); IV Международный симпозиум по теории информации (Ленинград-Репино, 1976); Всесоюзная конференция "Теория адаптивных систем и ее применения" (Ленинград, 1983); IV Всесоюзная школа-семинар по непараметрическим и робастным статистическим методам решения задач технической кибернетики (Томск. 1983): IV Всесоюзная конференция "Проблемы научных исследований в области изучения и освоения Мирового Океана" (Владивосток, 1983); XII школа-се.мйнар по адаптивным системам (Могилев, 1984); Всесоюзный симпозиум "Математическое обеспечение для автоматизации исследований, идентификации и пла-
нкрования экспериментов" (Харьков, 1984); Республиканская конференция "Исследование путей повышения эффективности сетей связи и сетей ЭВМ" (Гродно, 1985); Республиканская конференция "Методы и программное обеспечение обработки информации и прикладного статистического анализа данных на ЭВМ" (Минск, 1985); Отраслевая научно-техническая конференция "Проблемы, методы и опыт создания автоматизированных систем управления связью" (Москва, 1985); V Всесоюзная школа-семинар по непараметрическим и робастным статистическим методам (Шушенское, 1985); VI совещание-семинар по непараметрическим и робастным методам статистики в кибернетике (Томск, 1987); Всесоюзная научно-техническая конференция "Техническое и программное обеспечение комплексов полунатурного моделирования" (Гродно, 1988); VII Всесоюзный семинар по непараметрическим и робастным статистическим методам в кибернетике и информатике (Иркутск, 1990); II Всесоюзная научно-техническая конференция "Микропроцессорные системы автоматики" (Новосибирск, 1990); Всесоюзная конференция "Статистические проблемы управления" (Вильнюс, 1990); III Всесоюзная школа-семинар "Динамика, управление полетом и исследование операций" (Клин, 1990); Республиканская научная конференция "Математическое и программное обеспечение анализа данных" (Минск, 1990); Всесоюзная научно-техническая конференция "Идентификация, измерение характеристики имитация случайных сигналов" (Новосибирск, 1991); Республиканский семинар "Статистический синтез и анализ информационных систем" (Севастополь, 1991); Украинская Республиканская школа-семинар "Вероятностные модели и обработка случайных сигналов и полей" (Черкассы, 1991); Региональная научно-техническая конференция "Автоматизация исследования, проектирования и испытаний сложных технических систем и проблемы математического моделирования" (Калуга, 1991); IMAGS/IFAC International Workshop "Methods and Software for Automatic Control Systems" (Irkutsk, 1991); International Workshop "Control System Synthesis: Theory and Application" (Novosibirsk, 1991); Всероссийская научно-техническая конференция с международным участием "Информационно-управляющие и вычислительные комплексы на основе новых технологий. Наука и маркетинг" (Санкт-Петербург, 1992); Первая Всесибирская конференция по математическим проблемам экологии (Новосибирск, 1992); I Совещание "Новые направления в теории систем с обратной связью" (Уфа, 1993); Научная конференция с международным участием "Проблемы электротехники" (Новосибирск, 1993); Научно-техническая конференция с международным участием "Проблемы техники
технологии XXI века" (Красноярск, 1994); VIII Международный симло-аум по непараметрическим и робастным методам в кибернетике (Красно-рск, 1995); The Scientific Conference on Use of Research Conversion Results l the Siberian Institutions of Higher Education for International Cooperation SIBCONVERS'95) (Tomsk, 1995); III Международная научно-техническая онференпия "Микропроцессорные системы автоматики" (Новосибирск, 996); II Сибирский конгресс по прикладной и индустриальной математике (ИНПРИМ-96) (Новосибирск, 1996).
Структура и объем диссертации.
Диссертация представляет собой опубликованную монографию [1] и филожение, включающее документы о внедрении. Монография состоит 13 введения и шести глав. Объем монографии - 17.25 деч.л. Библиография :одержит 60 названий.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность проблемы, сформулирована цель исследований, дана характеристика полученных в работе результатов, определена научная новизна и практическая значимость работы.
Первая глава носит постановочный характер. В ней вводится в рассмотрение класс обобщенных нелинейных рекуррентных рестриктивных процессов с неопределенными переменными ограниченными возмущениями (или управлениями), для которого ставятся задачи оптимизации (оптимального статистического оценивания в условиях априорной неопределенности и оптимального программного управления) по аддитивным выпуклым критериям. Для задач оценивания это - критерии наименьших взвешенных квадратов и критерии максимального правдоподобия и максимального условного апостериорного распределения. Последний критерий эквивалентен обобщенному (дополняемому требованием одновременного максимально правдоподобного оценивания неопределенных мешающих параметров) условно-байесовскому критерию среднего риска при квадратичной функции потерь, если мода условного распределения и условное апостериорное среднее совпадают (или близки). Приводятся необходимые (в соответствии с дискретным принципом максимума Л.С.Понтрягина) условия оптимальности в форме рестриктивных двухточечных краевых задач (РДТКЗ).
Рассматривается п-мерный рекуррентный процесс, состояние которого
в каждый момент дискретного времени t + 1 описывается уравнением ®<+1 = + ^ (¿ = 0,Т-1), хо,%1е£", (1)
где /¿(я«, «г) - известная п-вектор-функция со значениями из вещественного п-мерного евклидова пространства ш1 и щ - не стесняемые и стесняемые ограничениями п- и т-векторы возмущений (или управлений) из Е" и Ет соответственно. Предполагается, что принадлежат выпуклому компакту Щ из Егп (в частности, прямоугольному параллелепипеду):
щ€ЩС Ет, = {иг : < 4, 4 > 0, »' = V™}; (2)
Пусть - априорная оценка начального состояния, {г(} - последовательность наблюдений за состоянием процесса
®о = «о+&; * = М*0 + «* (^й4); ¿обЯ", 6 Ек. (3)
Векторы гиг, предполагаются случайными (например, гауссовыми), независимыми, с независимыми во времени значениями, нулевыми средними и известными корреляционными матрицами (¿1 и Я( соответственно (кратко: € Л/"(0,<5<б<,1')> ^ £ ^(0,Л(б( (.)). Аналогично для ошибки £о априорной оценки начального состояния хо'- £о £ ^(0,Р0).
Задача оптимального в среднеквадратическом смысле оценивания последовательности х(-) состояний х1 на интервале времени [0,Т] по последовательности наблюдений ц при фиксированной последовательности и(-) воздействий щ сводится к нахождению последовательности условных апостериорных математических ожиданий х(г(-),и(-)) = М{х(-)]г(-),«(-)}, что в условиях неопределенности значений и(-) в ограниченной замкнутой области £/(•) приводит к последовательности множественных включений «(■*(•)) 6 %(*{•),&(•)) = Щ-)}, где Х(г(-),Щ-)) - последова-
тельность информационных множеств, совместимых с наблюдениями. При минимаксном подходе (А.Б.Куржанский и др.) в качестве последовательности £(г(-)) точечных оценок выбирается последовательность £*(•) чебышевских центров информационных множеств,
В предположении близости моды и математического ожидания апостериорного условного распределения -Р(х(+1|г(-), «(•)) (а для гауссовского апостериорного условного распределения это всегда так) задачу отыскания последовательности условных апостериорных математических ожиданий можно заменить эквивалентной задачей отыскания последовательности максимальных значений плотности условного апостериорного распределения. Тогда задача условно-оптимального оценивания состояния становится экстремальной задачей для любой монотонной функции от этой
шотности (например, логарифма). Нахождение максимума этой функции одновременно и по состояниям х1, и по неопределенным ограниченным воз-лупхениям щ позволяет "отслеживать" эти возмущения и при достаточно зысокой точности "слежения" увеличить точность оценивания состояния зо сравнению с минимаксным подходом. Так как оценки возмущений не зыходят при этом за. пределы компактов 111) оценки состояния не выходят за пределы информационных множеств.
Для задач оптимизации процесса (задач оптимального программного управления) векторы и/4 - неограничиваемые, но штрафуемые с матрицей СЦ^1 компоненты управления. Векторы щ из [7( в этом случае - допустимые ограниченные управления, XI - желаемая траектория процесса. Критерий оптимизации - минимум в некотором смысле отклонения траектории процесса от желаемой при возможно меньших энергетических затратах на управление.
Таким образом, математически обе задачи (оптимального экстремального оценивания и оптимального программного управления) могут быть сформулированы одинаково: при ограничениях в виде равенств (1) и неравенств (2) найти оптимальные последовательности {и*}, {го*}, доставляющие наибольшее значение функционалу
т г-1
/г = ^(гоко) + Е М2^-2«) + £ ■ 1(«< е Щ —
4=1 <=0
Т-1
= ^оЫ^З) + X) Л(а^^и^ш) =» эир ; (4)
<=0
|г1+1) = + -1(111 6 Щ-\-UJtiwt); (5)
1С«. 6 и<) 4 (1. •
4 ' (0, если щ £
Здесь ?/.'((«() • 1(гг( £ ¡У«) - регуляризирующая (или штрафная) функция, применяемая в задаче оптимального статистического оценивания в случае вырождения задачи оптимизации (отсутствия зависимости исходного целевого функционала от щ) и для привлечения дополнительной априорной информации о предполагаемом значении щ, а в задаче оптимального программного управления - для уменьшения энергетических затрат на управление. В частности, 9о(^око) = "гИ10 — ^оПр-1' (М1<120 = ф, = -11КЩ-,, =
Задача (4) - типичная некласспческая задача оптимизации, удовлетворяющая принципу максимума Л.С.Понтрягпна. Функция Гамильтона этой
задачи, по определению, имеет вид:
®t(Ai+i,«t,tii,ti»f) = + [Мхищ) +«/,], (7)
где Л( 6 Ел - переменная, сопряженная (по Гамильтону) вектору состояния Х( € Еп. При выполнении ряда известных условий необходимые условия оптимальности оценок состояний и возмущений процесса (1) выражаются рестриктивной двухточечной краевой задачей (РДТКЗ) оптимизации вида:
£i+1| т = at{xtlT, ХцТ) = ft{xtiT, щ1Т) + щ{7, (t = 0,Г- 1), (8)
<W|T = ßt(xt|Т) \\т) = АГГ(2(1г, ~ д«+1(<*((£1|Т, \|r)lzi+i)» (9) с граничными условиями
= ^о + ДА0|т, Vir = 0, (Ю) где Üj)t определяется рестршсгивным отображением
|и*|Г, если м*|Г £ £7/,
arg sup Н((А(+МГ, £t(T, «¡,м7{1г), если u*t]Tg.Uu (n)
utEbdV,
bdUt - граница области Ui, ицт — &tißtir3 "i|r) й<|г) Щ\т = Qt АТт{хцт, Щ\т) А<|г> (12)
At(xt,u,) =-—-, В^хищ) =-ФА*) =-d^' ^
При линейной /i1+i(-) и квадратичной <£>(•):
= Ht+ixt+i, gi+1(xt+i|2i+i) = (zt+1 - Я<+1 Xt+i). (14)
В главе рассмотрены уравнения РДТКЗ, представленные не только в приведенной выше гамильтоновой форме, но и в форме, использующей теорему Куна-Таккера.
Проблема состоит в том, что эта РДТКЗ даже в простейшей линейно-квадратичной постановке (линейный процесс, квадратичный целевой функционал) является существенно нелинейной из-за наличия ограничений на щ и не распадается (как в случае линейной ДТКЗ) на пару задач Копш, решаемых в прямом и обратном времени. В общем случае она допускает решение только методами последовательных приближений (по "управлениям" , по сопряженным переменным, по граничным условиям - методы "стрельбы" и т.п.), что приемлемо для решения задач оптимального
фограммного управления, но совершенно неприемлемо для задач рестрик-гивной фильтрации из-за катастрофически быстрого нарастания объема требуемых вычислений с ростом длительности процесса и объема посту-1ающих данных.
Во второй главе на основе применения метода инвариантного погружения Р.Беллмана-Р.Калабы в форме, пригодной для рестриктивных П.ТКЗ, развивается оригинальный общий метод рекуррентного решения нелинейных рестриктивных двухточечных краевых задач оптимизации, альтернативный методу последовательных приближений. Метод основан на концепции пошаговой аппроксимации решений точных уравнений инвариантного погружения РДТКЗ и реализуется аналогично методу прогонки (одна рекуррентная прогонка в прямом времени для нахождения финальных значений оптимального процесса, что достаточно для решения задачи оптимальной нелинейной фильтрации, и одна рекуррентная прогонка в обратном времени - для окончательного решения задачи оптимального статистического оценивания, т.е. для построения оценок сглаживания, и задачи оптимального программного управления). Подчеркнем, что в отличие от традиционно применяемых приближенных форм уравнений инвариантного погружения (Э.Сейдж, Дж.Мелса) здесь используется их точная рекуррентная форма. Рассмотрены различные критерии аппроксимации и условия сходимости аппроксимирующих решений к точным решениям уравнений инвариантного погружения.
В соответствии с общей схемой метода инвариантного погружения РДТКЗ (8)-(13) сначала погружается на интервале [0,Т] в семейство РДТКЗ с произвольным (не нулевым, в отличие от (10)) граничным условием АГ|Г = Ат- Финальное значение решения этой РДТКЗ становится некоторой функцией гт{\т) параметра \т и в точке Аг = 0 дает финальное значение решения исходной РДТКЗ:
= т(Аг), ^т|г = гг(0). (15)
Затем семейство РДТКЗ, определенных на интервале [О, Г], погружается в семейство РДТКЗ, определенных на расширенном интервале [О,Т + 1], с соблюдением условий инвариантности; погружения, т.е. таким образом, чтобы новая РДТКЗ оказалась продолжением прежней. Для новой РДТКЗ
^г+1|Г+1 = ^т+ь гг-щг-н = гт+1(Ат+х). (16)
Условия инвариантности погружения имеют вид:
^г|г+1 = ^т, = /М^пт+ь Аг), £г|г-и = >"Г(Аг). (17)
Уравнение Аг+1 = Рт(гт{Ат)> Ат), связывающее граничные условия обеих задач, будем называть уравнением согласования граничных условий.
Из соотношений (15)—(17) получаем для задачи оптимального рестрик-тивного оценивания систему рекурсивных уравнений инвариантного погружения:
гг+1(Лт+1) = ат(гт(Ат), Ат) = /т(тт(Ат), иТ]Т+1(Аг)) + -шт|т+1(Ат). (18)
Аг+1 = Рт(гт(Хт),Хт) = А^г(гт(Хт), иГ|г+1(Аг)) ■ Ат—
- дг+1(аг(гг(Ат),Аг)|гг+1) (Т = 0,1,2,...) .(19)
I
с начальным условием
г0(А0)=^ + РоАо, (20)
причем .
\ щт|т+1(лт), если и'т1т+1 е ит,
иГ|Г+1(Дт) = < агг 5ир ит{ит), если и'т,г+1 <£ 11т, ^
V иу&кШг
%Чт+1 = Вт(гт{Ат), «т]г+1)' ^гГ(гт(Аг),«г|г+1) • ^т, (22)
■шТ|Т+1(Аг) = <?г АуТ(гт(Аг),г4,т+1(Ат)) • Ат. (23)
Система уравнений инвариантного погружения может быть представлена также в форме тождества до А^:
Гг+1(Дг(гт(Аг), V) = ост{гт{Хт), А г), г0(А0) = 4 + -РоАо- (24)
Оптимальные финальные значения (фильтрационные оценки) всех переменных полностью определяются решением уравнений инвариантного погружения:
5т+1|Г+1 = гх+1 (0) = от(гх(^г)> Х*т), (25)
иГ|Г+1 = 'иТ|Т+1(гт(А^),Ар), (26)
ы?т|т+1 = Ят ^тТ(гг(Ат), иТ|Г+1(гт(Ау.),А^)) • Х*т, (27)
где А£) - ближайший к нулю корень уравнения согласования граничных условий
0т(гг(Ат),Ат) = О, (Г = 0,1,2,...). (28)
К сожалению, точные решения уравнений инвариантного погружения найти в общем случае не удается. Однако рекурсивная система уравнений инвариантного погружения (18)-(20) с учетом (21)-(23) позволяет (в
принципе) последовательно отображать любое множество Ло С Еп векторов До из пространства финальных значений сопряженных переменных и соответствующее ему множество /?о = Хд + РоЛо С Я" векторов го(До) из пространства финальных значений состояний в последовательность множеств Лу С Еп и Ит(Ат) С Еп векторов Ау и гу(Л^) (Т = 1,2,...) из этих же пространств. При этом, в силу существования и единственности решения РДТКЗ, на каждом шаге Т процесса отображения найдется множество Лт, содержащее нулевой вектор, которому соответствует вектор 5Х|т = т(0) £ Ят- Этот вектор является искомым финальным значением оптимальной опенки состояния, соответствующим нулевому финальному значению сопряженной переменной.
В работе сформулирована и доказана фундаментальная теорема, определяющая условия практической применимости изложенного выше принципа пошагового отображения пространств сопряженных переменных для построения решения уравнения инвариантного погружения и отыскания последовательности оптимальных фильтрационных оценок или оптимальных финальных состояний рестршстивного процесса.
Теорема 1 (О вложениях компактов, содержащих нуль-вектор). Пусть отображение (19) непрерывное и растягивающее и пусть существует вектор Ат € Е", отображаемый соотношением (19) в куль-вектор (X? - корень уравнения согласования граничных условий Рт(^т) — 0). Тогда:
1) существует выпуклый компакт Ат С Еп, содержалшй нуль-вектор и целиком принадлежащий своему образу Ат+х С Е", определяемому отображением' (19);
2) диаметр такого компакта не менее длины вектора Ау.
Теорема открывает конструктивную возможность построения алгоритмов последовательного (пошагового) решения уравнений инвариантного погружения методами его пошаговой аппроксимации во вложенных ограниченных областях, содержащих нуль-вектор и имеющих размеры, определяемые решением уравнения согласования граничных условий.
На начальном шахе Т = О решение уравнения инвариантного погружения точно известно: г0(Ао) = Хд 4- РАо. Для приближенного представления (аппроксимации) решения гт(\т) на последующих шагах Т = 1,2,... предлагается использовать наборы конечного числа М линейно независимых скалярных базисных функций векторного аргумента Ат, образующих М-вектор-функции фт{\т) = (Фт(^т)> ■ ■ • > $т квадратично интегриру-
емые с вероятностным весом <№г(Ат):
(ФтФт) = { #(Аг)^т(Аг)^т(Аг) < С». (29)
Базисные функции выбираются из некоторой полной, не обязательно ортонормирований, системы линейно независимых функций. Аппроксимация решения на произвольном шаге Т,
гт{\т,ат) = атфт[Хт) (Т = 1,2,...), (30)
определяется п х М-матрицей ау коэффициентов разложения решения по выбранному базису. Невязка рекурсивного уравнения инвариантного погружения (24) в любой точке Ат линейно зависит от коэффициентов аппроксимации на шахе !Г + 1:
£т+1(Аг,ат+0 = ?г+1(/М?т(Аг), Ат), ат+0 - ат(М^г)> Ат) =
= ат+1'Фт+1 (Ат(гг( Ат)> Аг)) - ат{гт{\т), \т). (31)
Минимизация невязок в соответствии с некоторым критерием в подходящим образом выбранных областях Ат С Еп (в соответствии с теоремой о вложениях выпуклых компактов) обеспечивает оптимальность коэффициентов в смысле этого критерия и приводит к рекуррентной схеме их вычисления.
В работе исследованы различные методы минимизации невязок уравнения инвариантного погружения (метод взвешенных невязок Галеркина-Петрова, метод наименьших взвешенных квадратов невязок, метод кол-локалщи, методы интерполяции, комбинированные методы и др.). Все они основаны либо на требовании обращения в нуль невязок уравнения в заданном наборе точек (методы коллокации), либо на минимизации различных интегральных выпуклых функционалов от невязок (методы Галеркина-Петрова, методы наименьших взвешенных квадратов и др.). Исследования показали, что вычислительная устойчивость метода коллокации существенно зависит от выбора узлов коллокации. и может оказаться недостаточной при неудачном выборе узлов. Наибольшей вычислительной устойчивостью обладают методы Галеркина-Петрова и их частный случай - метод наименьших взвешенных квадратов невязок (НВК). Для этого метода имеем:
ат+1 = ал^ аЫ Е£+1 (АГ, О^Оет-И^Г, аг+1)^г(Аг), (32) откуда получаем линейное уравнение для ат+\ и, разрешая его, находим: ат+1 = (атФ^Ш) ■ (•Фт+гШФтЛРтУ1. (33)
Относительная погрешность аппроксимации:
ет+1 4 «|£т+1|2)/(Ы2})1/2 0 при м <х>. (34)
3 итоге получается следующая схема пошагового построения решения: на дате Т = 1 по известной на начальном шаге Т = 0 линейной го(Ло) при известном £()|0 = го(0) = Хд находится корень ЛЦ уравнения согласования граничных условий, по которому строится область аппроксимации Лд или подбираются параметры распределения с?^о(А0), выбирается базисный М-вектор ^(А^, по формуле (33) находится матрица а\ коэффициентов аппроксимации, по формуле (31) находится ^(Л]) и гщ = п(0); на шаге Т = 2 по известной теперь г^Л^ выполняется та же последовательность операций до получения: Г2(Л2) и х2р = Г2(0), и т.д. Контроль точности ведется на каждом шаге до формуле (34), и при необходимости проводятся повторные вычисления с расширенным до размерностп М + 1, М 4- 2;... базисом.
В третьей главе исследуется важный частный случай общего подхода, развитого в предыдущей главе, - линейная пошаговая аппроксимация решений уравнений инвариантного погружения. Для общего случая произвольных нелинейных рестриктивных задач фильтрации здесь не обнаруживается никаких особенностей - все соотношения предыдущей главы просто конкретизируются, принимают более "прозрачный" вид. Однако для линейно-квадратичных рестриктивных задач фильтрации такая аппроксимация приводит к особому классу фильтров - перестраиваемых ("адаптивных") рестриктивных фильтров Калмана. В зависимости от способа настройки коэффициентов линейной аппроксимации (критериев минимизации невязок уравнений инвариантного погружения) появляются фильтры Калмана с различными алгоритмами перестройки параметров (смещения и матрицы ковариаций возмущений) в процессе работы.
Проведенные в работе исследования показали, что линейная аппроксимация решения уравнения инвариантного погружения с высокой точностью приближает это решение к истинному в области аппроксимации, определяемой теоремой о вложениях выпуклых компактов, и вносит незначительную методическую ошибку в фильтрационную оценку состояния, хотя за пределами этой области решение существенно нелинейно.
Все соотношения этой главы следуют из предыдущей в частном случае линейного базиса
• Фт+^т+О = ^г+ь- • •' ¿т+1(Ат+1) = = 1. (35)
Линейная аппроксимация гу+ДАг-и) по методу НВК приводит к следующим общим соотношениям:
гг+1(Ат+1) = Хт+11т+1 + Рт+цт+1^т+1', (36)
5г+1|г+1 = (ат) - Рт+\\т+\{Рт), (37) Рт+х\т+1 = <(<*г - (<*т))(Рт ~ (Рт))т) ((Рт - (Рт))(Рт - (Рт))т}~1; (38)
гт(\т) = £г(г + Р-цт^Т, (39)
аг = ат{хт\т + Рт\т^т, Ат), Рт = Рт(%т\т + Рт\т^т, Аг). (40)
2ою = го|о = а:?! Рщ = (41) Погрешность линейной аппроксимации (по невязке уравнения инвариантного погружения):
ег+ДАт) = %ч-1|г+1 + Рт+цт+Фт{^т) ~ аг(Аг)5 (42)
(|ет+1|2) = (\А*т\2) - Ьг((АатЛР^){А/ЗтАр^-1{АатА^)т), (43)
Ааг = сиг - («г). А/?г = Рт~ (Рт)■ (44) В частном случае линейно-квадратичной рестриктивной задачи:
аг(Ат) = (Аг£г|г + ВтЩт+1 (V)) +- (ЛТ-Рг[ТА£ -Ь Ят)^тТ\т, (45)
Дг(Аг) = АуТАг - - Нг+1аг(Ат)], (46)
*о|о = ®010 = ®о, Рою = Ро, ' (47)
{ "Т1г+1(лг)> если г4,т+1 € Пт,
«Т1Т+1(Аг) = < ^ 5гф Нг(«г), если £ ит, I48) I а теьЗс/т
г4|Г+1(Лг) = (49)
Финальные состояния (фильтрационные оценки) определяются перестраиваемым алгоритмом Калмана:
£Т+1|Т+1 = АтХ^Т + Рт+1|Г+1-Н'г+1'^Г+1('гТ+1~
-Я?+1Ат1т|т) (Т = 0,1,2,...), (50)
+ (Т = 0,1,2,...), (51)
^010 =.^, ' -Ро|о = Ро- (52)
выражение для матрицы (¿¿т достаточно громоздко и здесь не приво-[ится. Эта матрица характеризует "эквивалентный" шум, обусловленной наличием неопределенного ограниченного возмущения и?, и опреде-[яется видом функции ит^т+1(Хт), т.е., по-существу, видом и качеством >ценки этого возмущения. В крайних случаях отсутствия ограничений ст —» оо: "х|т+1(^т) = и^|Г+1(Л7'), С}0т = В^БгВ^) или отсутствия геопределенных воздействий (су = 0: ит[т+\(^т) = 0, С)0т — 0) уравнения фильтрации переходят в обычные уравнения фильтра Калмана.
Область аппроксимации определяется соотношениями:
Зт(Хт) = ~ ~~ Нт+1[Ат£т\т+
4- АТРТ]ТУТ -+- ЯтАтТУт 4- Втит[т+1{Х'Т)}} = 0, (53) Ц. = Атт{1 + Н^^Нт+МтРт^ + Рг)]-1-
• - Нт+1[Атхт\т + -Вт^САт)]}- (54)
<(4)2}1/2=7 |А?'| (55)
Л$. = {Ат : А1Т 6 [-7|А?'|,7|^г|] (» = М")}. 7 ~ 0-5 -г 1.5. . (56)
Аналогичные соотношения получены также для других методов аппроксимации (коллокации, комбинированных методов и др.) при использовании как гамильтоновой формы уравнений РДТКЗ, так и формы, основанной на теореме Куна-Таккера. При этом: рассмотрены как случаи, когда Нт+\Вт ф 0 (возмущения и? "наблюдаемы"), так и случаи, когда Нт+\ВТ = 0 (возмущения ит "ненаблюдаемы", т.е. имеется лаг наблюдаемости, "скользящий" режим).
Полученный в этой главе основной результат - "адаптивная" рестрик-тивная калмановская структура алгоритмов оптимальной фильтрации для линейно-квадратичных рестриктивных задач оценивания - не является неожиданным: условно-оптимальная байесовская оценка состояния линейного процесса при фиксированной (как бы известной) реализации ограниченного возмущения при гауссовских флуктуационных шумах в системе и наблюдениях является условным апостериорным средним состояния процесса (или, что то же, положением максимума условного апостериорного распределения состояния). А это значит, что условная фильтрационная оценка удовлетворяет уравнениям фильтра Калмана, записанным для фиксированной реализации возмущения и(-). Подставляя в эти уравнения максимально правдоподобную фильтрационную опенку возмущения
"г|г+1 £ ит, получим уравнения "адаптивного" рестриктивного фильтра Калмада:
2т+1|г+1.= {Атхт\т + Втйт\т+1)+
+рт+цт+1Н$+1щ.и*т+1 - НТ+\{АТХТ\Т + втиТ\Т+1)), х0|0 =
^г+1|г+г = С*" — Кт+1Нт+1)Рт+1Ю
Кт+1 = Рт+цт Нт+1 (Нт+х Рт+1 |т#т+1 + Ят+1)~\
Рт+цт = АтРт\тА1 + (¿т, Рою = Ро- (57)
Поскольку опенка возмущения йТ|Г+1 € С/т по любому из рассмотренных в этой главе алгоритмов на каждом шаге Т 4-1 оказывается пропорциональной невязке наблюдений гт+\ — Нт+\(Атхт\т + Дг%|г+1) с матричным коэффициентом пропорциональности, изменяющимся в зависимости от того, в какую часть области и? (внутреннюю или граничную) попадает оценка, уравнения фильтрации (57) приводятся к эквивалентной форме (50)-(52).
Представленные в этой главе "адаптивные" рестриктивные модификации фильтра Калмана широко использовались при реализации результатов работы в рамках НИР, упомянутых во введении, при разработке алгоритмов и программ комплексной обработки навигационной информации и исследовании перспективных навигационных систем. Приведем в качестве иллюстрации некоторые результаты моделирования навигационного комплекса (НК), содержащего-инерциальную навигационную систему (ИНС) полуаналитического типа, корректируемую относительным лагом (ОЛ). Моделировалась динамика ошибок счисления основных навигационных параметров - широты, отшествия, северной и восточной составляющих скорости, курса, а также ошибок углов горизонтирования платформы ИНС, составляющих вектора скорости ухода осей ИНС, неучтенных составляющих скоростей изменчивых течений, составляющих вектора гравитационных аномалий, ошибок акселерометров, установленных на платформе ИНС (всего 16 навигационных параметров, составляющих вектор состояния НК). Моделировалась также динамика ошибок О Л и псевдоизмерения, поступающие на обработку от относительного лага. При моделировании и обработке данных предполагалось, что неучтенные составляющие изменчивых течений порождаются неопределенными нестохастическими ограниченными процессами. Их "истинные" значения располагались при моделировании на одной из границ. Остальные компоненты вектора возмущений НК и ошибок наблюдений (ОЛ) предполагались стохастическими гауссовыми (такими они и моделировались). Обработка производилась
" адаптивным" рестриктивным фильтром и минимаксным фильтром. Результаты обработки показали, что оба фильтра хорошо демпфируют шуле-ровскде колебания ошибок счисления, но рестршстивный фильтр к тому же довольно хорошо оценивает вектор нестохастических возмущений (оценки сосредоточены вблизи истинных значений, а в 70-80% случаев совпадают с ними) и в связи с этим значительно точнее (в 2-3 раза) оценивает основные навигационные параметры, уменьшая их смещение.
В четвертой главе на примере решения задачи оптимизации линейного скалярного рестршстпвного управляемого процесса с постоянным параметрами иллюстрируется применение развитых в предыдущих главах методов пошаговой аппроксимации решения уравнений инвариантного погружения. Для этого процесса удалось получить точное решение уравнений инвариантного погружения, что позволило провести непосредственный анализ качества методов пошаговой аппроксимации, проследить их сходимость и т.д. В главе приводится конечный алгоритм точного решения задачи оптимизации и в сравнении с ним и между собой рассматриваются различные алгоритмы линейной и полиномиальной (основанной на системе полиномов Эрмита) аппроксимаций решения. Изложение сопровождается подробными численными примерами.
Исходные соотношения, касающиеся постановок задач, эквивалентны приведенным в главе 1, но более просты:
хг+1 = Ах{ 4- щ + ш, (4 = 0,Т-1), 0 < А < 1, (58)
щ 6 и = {щ : < с (с> 0,г =0,Г- 1)}, (59)
з = -1(хо - х-^р,-1 -1 ыч - г о2*-1 -1 ЕК'д-1 + и^-1), (60)
- ¿4=1 * £=0
1д, ¿1,..., 2т, Ро~1,11~1, - заданы. Более простой вид имеет также
РДТКЗ оптимизации:
Х1+цт - Лхг]т + щ]г + ЯА^Хцт (< = 0,Г-1), (61)
Х+1\т = Л-%т-В.-1(2М-ЛХ11Т-Щ1т-(ЗА-1\цт) (* = 0,Г-1), (62) А*|т = Р0~Чщт - хЗ), Ат\т = 0» (63)
(64)
ицТ = 5А~1Хцт (65)
{и*|Т, если |и*|Т| < с,
С51^и*|Г, если К*,т| > с,
и уравнения инвариантного погружения:
гг+1(Аг+1) = Лгг(Лг) + иТ|Т+1(Лг)+дА-1Лг (Т = 0,1,2,...), (66)
Ат+1 = А^Хт+Е-ЧАгт^+иптЛЛ^+СЭА^Ат-гтЛ (Т= 0,1,2,...),
(67)
П)(Ао) = хЪ + Р0Х0, (68)
«трчЛМ = ( п * 6СЛИ '."Н " С' (6Э)
1+4 ( С5^пи^г+1(АГ), если > с,
"г|Т-ц(лт) = 5А-1,А11Т. (70)
Теорема 2 (О точном решсшш уравнений инвариантного погружения). При с>0и0<5<оо решение уравнения инвариантного погружения (66) на каждом шаге 1 + 1 выражается неубывающей ломаной (линейным сплайном) вида ■
г,+1(А<+1) = [г£\ + Рш ■ (А<+1 - А« )] • 1(А,+1 <
+ 2('£М[г& + ~ 3 ~ ' 1(^1 < < дан
¿=1 А4+1 — А,+1
+ + • (*+1 - А^Г »)] • 1(А(+1 > (71)
где 1(0) - индикатор условия П с четным числом 2(* + 1) точек излома (узлов сплайна)
< А[+\ < ... < А& < ... <
и значениями
_(1) < _(2) < < _М < < (2(4+1))
в этих точках (узлах), получающимися упорядочиванием в порядке возрастания отображений соответственно по формулам (67), (66) 2i точек излома (/ = 1,22)} решения г((А(), полученного на предыдущем шаге, и двух дополнительных точек = ±сА5-1, причем тангенсы углов наклона полубесконечных внешних отрезков ломаной Р4+1 удовлетворяют рекуррентному уравнению Рпккати вида
Ъ+^^Ъ + СЯ^+В-1)-1 (4 = 0,1,2,...) (72)
с начальным условием Ро-
В сравнении с точным решением исследованы алгоритмы линейной и нелинейной (полиномиальной) пошаговой аппроксимации.
Для линейной пошаговой аппроксимации гг(Аг) = %т\т + Рт\т^т {Т = 0,1,2,...) уравнения фильтрации имеют вид подстраиваемого фпльтра Калмана и по форме ничем не отличаются от приведенных в предыдущей главе. Единственное отличие состоит в том, что в скалярном случае удается получить точное аналитическое решение уравнения согласования граничных условий.
Для полиномиальной пошаговой аппроксимации в качестве базиса представления решения уравнения инвариантного погружения использовалась полная система ортонормированных с квадратично-экспоненциальным весом полиномов Эрмита:
4П)(ЛГ) = ЯП(АГ), п = 0,1,2,..., Т =1,2,..., (73)
, со
— / е-х?Нп(\т)Нгп(\т)с1\т = 2пп\8пт (п,т = 0,1,2,...); (74)
ГЛП ы
г(тЛ(*Т+ 0 = Е
вт+1,1'Д(Аг+1); (75)
1=0
4+\(АГ) = 4+\С»г(АГ)) - ат(Аг). ■ (76)
Для использования в полной мере свойства ортогональности полиномов Эрмита при аппроксимации решения методом наименьших взвешенных квадратов невязок в качестве весовой выбиралась функция
¿РГ(АГ) = —е_^(Ат)^(Дг). (77)
Vя"
В этом случае
<к£.\|} = Е 2*г! (ат+1,02 - 2 £<атЯ;(/?т)К+1,; + (4), (78) «=0 1=0
1 оо .. оо
(атН{) 4 — / аГ(/Зт)#,(/?г)е-^/?Г, (4) = / аЦРтК^/Зт,
» " —оо
(79)
аг+и = ^(атЯ«), = 1>г+1.ДО) (¿ = 0^У). (80)
* г- ¿=а
Поскольку коэффициенты аппроксимации не зависят от .¡V, повышение точности решения легко достигается простым добавлением слагаемых в выражения для гг1\(А-г+1)
и При N — 1 получается оптимальная
линейная аппроксимация. при ¡V ~ 2 - квадратичная, и т.д.
Моделирование точных и аппроксимационных оценок показало, что в области аппроксимации, определяемой теоремой о вложениях компактов, ряды (80) очень быстро сходятся. Линейное приближение дает основной вклад в фильтрационную оценку состояния процесса (ошибка - порядка 1-2%). Квадратичное приближение обеспечивает еще более высокую точность (ошибка - меньше 0.1%). Сравнение с минимаксным фильтром показало выигрыш рестриктивного фильтра по точности на 20-30%, а с обычным фильтром Калмана - в 2 раза.
В пятой главе рассматривается пример построения рестриктивного алгоритма фильтрации с использованием существенно нелинейной пошаговой аппроксимации решения уравнения инвариантного погружения. Решается задача максимально правдоподобной фильтрации переменной интенсивности пуассоновского потока, подверженного медленному тренду с ограниченной скоростью изменения интенсивности. Применением дискретного принципа максимума Л.С.Понтрягина задача сводится к нелинейной рестриктивной двухточечной краевой задаче оценивания, для выделения из которой задачи фильтрации используется метод инвариантного погружения с пошаговой нелинейной аппроксимацией решения (в данном случае удобной оказывается гиперболическая аппроксимация).
Постановка задачи:
р(2|Ш) = п^-' (* = о7Г); (81)
тгц+1 =гщ+щ, Ы<с, (i = 0,r-l), (82)
rnt > 0, и, > -ттц, (t = 07Г), (83)
Ut = {ut: -miu(mi,<н) < Щ < с«} (t = 0,Г- 1). (84)
т 1т-1 J = X(ztlnm(— mt) — — XI "о $ > 0—параметр регуляризации. (85) i=o 2 i=о
РДТКЗ оценивания:
"Ц+ЦГ = + Щ\Т1 (86)
Аж|т = \цТ +1 - 2Ш/(тцТ + йцт), (87)
= ч}(1 ~ А0|г) > 0, Аг|г = 0, (88)
— тш(т*|г, ct), если и(*|Г < — min(rni|r, с^); щт — • u(*1T, если — пйп(т,|Т, ct) < и*цТ < с(; (89)
с(, если и*|Г > Ct,
«?|Г = 5**|Т (< = 0,Г-1). (90) 'равнения инвариантного погружения:
гт+1(/?т(Ат)) = ат(Ат) (Т = 0,1,2,...), (91)
го(Ао) = 20/(1 - А0) (А0 > 1), (92)
ат(Ат) = гх(Аг)+мТ|Т+1(Аг), /?г(Ат) = Ат + 1-2Г+1/ат(Аг), (93)
I— ш1п(гг(Ах), сх), если ^т)г-и(^) < — пип(гх(Ах), сх); и"т)т+1, если - тш(гх(Аг), ст) < ицТ+1(\т) < ст;
ст, если иХ|Х+1(Ах) > ст,
(94)
иг|т+1 = 5т Ат- (95)
Фильтрационная оценка: тХ|Х = гт(0)- Особые точки уравнения инвариантного погружения: Ат — Т + 1, Ат < Ат. Гиперболическая пошаговая аппроксимация л нелинейный рестриктивный алгоритм фильтрации:
гг(Ат) = Яггг/(1 - Рт|тАт), Аг<Аг = Т + 1 (Т = 0,1,2,...); (96)
™о|о = го, -Рою = 1; (97)
РХ1ХАТ = 1, Рт,х = 1/(Т + 1) (Т = 0,1,2,...), .(98)
МАт) = Ат + 1 - 2Т+1 /йт(Ат), (99)
ат(Хт) = тх1т/( 1 - Рт|тАт) + %|т+1(Аг)> (Ю0)
I— пиц(гх(Ат),ст), если 5тАт < тщ(гх(Ат), ст); 5ХАХ, если — пиа(гт(Ах), сх) < 5ХАХ < сх;
ст, если 5хАт > сх;
(101)
тх+1|т+1 = ах(Ах), Дг(Ах) = 0. (102)
' &т+цт+1 = ЪТ{Т/{1-РТ\ТУт) + йТ[Т+х(А1) (Т = 0,1,2,...) (103)
А^+1-гт+1/[^т|т/(1--Рг|гА^)+йГ|Х+1(Ах)] =0, Ах < Ат = Т + 1. (104)
В случае предельно жестких ограничений (сх = 0) оптимальная фильтрационная оценка интенсивности переходит в текущее среднее арифметическое наблюдений. Наоборот, в отсутствие ограничений (сх = оо) фильтрационная оценка интенсивности вырождается в наблюдения, которые никак не обрабатываются.
В шестой главе предлагается к рассмотрению и исследуется новый тип полиномиальных сплайнов - рестриктивные сплайны. Конструкции
этого типа сплайнов обобщают известные и отличаются от них тем, что в условия сопряжения элементов сплайна в его узлах вводятся ограничения (типа неравенств) на величину максимально допустимого скачка сопрягаемой производной соответствующего порядка (обычные сплайны не содержат таких ограничений). Показало, что в случае отсутствия ограничений рестриктивный сплайн переходит в обычный сплайн некоторого дефекта, а в случае предельно жестких ограничений - тоже в обычный сплайн, но дефекта, на единицу меньшего. Меняя силу ограничений изменением границ неравенств, можно плавно регулировать степень гладкости рестриктивно-го сплайна, получая маргинальные конструкции, промежуточные между обычными сплайнами соседних дефектов. Показано, что задача построения коэффициентов рестриктивного сплайна сводится к рестриктивной двухточечной краевой задаче, для решения которой можно пользоваться любыми известными методами. Подробно рассмотрены рестриктивные кубические сплайны дефектов 1 и 2. Применение таких сплайнов расширяет возможности сплайн-аппроксимации данных.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. В рамках гарантирующего подхода поставлена проблема совместного условно-байесовского рекуррентного оценивания состояний и максимально правдоподобного оценивания априорно неопределенных ограниченных возмущений'« динамических системах и рекуррентных процессах, стес-
. няемых ограничениями типа неравенств и называемых рестриктивными. Показано, что решение этой проблемы позволяет повысить точность фильтрации состояний рестриктиввых процессов по сравнению с минимаксными процедурами гарантирующего подхода благодаря уменьшению априорной неопределенности возмущений в ходе их максимально правдоподобного оценивания.
2. Показано, что решение проблемы совместного оптимального статистического оценивания состояний и априорно неопределенных ограниченных возмущений для динамических систем и рекуррентных процессов может быть получено на основе применения принципа максимума Л.С.Понтрягина и приводит к нелинейным рестршстивным двухточечным краевым задачам (РДТКЗ) оптимизации.
3. Показана применимость метода инвариантного погружения Беллмана-Калабы к рестриктивным двухточечным краевым задачам оптимизации рекуррентных процессов. Получены точные рекурсивные формы рестрик-
явных уравнений инвариантного погружения для РДТКЗ, представлен-ых как в гамильтоновой форме, так и в форме уравнений Куна-Таккера.
4. Разработан конструктивный математический аппарат пошагового гображения пространств сопряженных переменных и пошаговой аппрок-ямации решений рестриктпвных уравнений инвариантного погружения, [а его основе разработана общая схема построения приближенных алго-итмов фильтрации состояний рестршстивных рекуррентных процессов.
5. Сформулирована и доказана теорема о вложениях выпуклых компак-ов, содержащих нуль-вектор. На ее основе предложен механизм построим минимально необходимых для решения задач рестриктивной филь-■рации областей аппроксимации решений рестршстивных уравнений ин-ариантного погружения.
6. Разработана структура рекуррентных алгоритмов полиномиальной юшаговоп аппроксимации решений рестриктпвных уравнений инвариант-гого погружения на основе представления решений разложениями по про-[звольным полным системам линейно независимых квадратично интегри->уемых (с весом) функций. Получены и исследованы конкретные алго->итмы аппроксимации, построенные на основе различных методов минимизации невязок рестриктпвных уравнений инвариантного погружения в )бласти аппроксимации (методов Галеркина-Петрова, наименьших взве-пенных квадратов невязок, коллокации, комбинированных методов и т.д.). Исследованы вопросы сходимости и вычислительной устойчивости алгоритмов.
7. Для линейно-квадратичных рестршстивных задач оптимизации получен рестриктивный алгоритм фильтрации в форме подстраиваемого на каждом шаге дискретного времени ("адаптивного") рестриктивного фильтра Калмана. Показана оптимальность этой структуры алгоритмов рестриктивной фильтрации для рассматриваемого класса задач. При реализации результатов работы алгоритмы этого класса использовались для построения алгоритмов комплексной обработки навигационной информации в условиях априорной неопределенности применительно к перспективным системам морской навигации и показали более высокую точность выработки основных навигационных параметров (широты, долготы, курса, скорости) по сравнению с минимаксными фильтрами.
8. Для скалярных линейных рестриктпвных процессов построен конечный алгоритм точного решения рестриктпвных уравнений инвариантного погружения и на его основе получен точный алгоритм рестриктивной фильтрации. С его помощью проведен сравнительный анализ различных
приближенных алгоритмов рестрихтивной фильтрации, исследована их сходимость, точность и т.д. В частности, такой анализ проведен для алгоритмов фильтрации, использующих в качестве базиса систему ортогональных с квадратично-экспоненциальным весом полиномов Эрмита.
9. Построен не имеющий аналогов алгоритм максимально правдоподобной рестриктивной фильтрации медленного тренда интенсивности пуас-соновского потока, использующий существенно нелинейную (гиперболическую) пошаговую аппроксимацию решения уравнения инвариантного погружения.
10. Разработана конструкция нового типа полиномиального сплайна -рестриктивного сплайна, занимающего промежуточное положение между обычными полиномиальными сплайнами соседних целочисленных дефектов. Подробно исследованы структуры рестриктивных кубических сплайнов дефектов 1 и 2. Применение этого типа сплайнов позволяет существенно расширить возможности сплайн-аппроксимации данных.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Целиком диссертация опубликована в виде монографии [1] и частями также в ряде статей и докладов:
1. Поддубный В.В. Методы инвариантного погружения и аппроксимации в рестриктивных задачах управления и фильтрации. - Томск: Изд-во Том. ун-та, 1993. - 276 с.
2. Поддубный В.В., Якупов Р.Т. Об одном подходе к автоматизации проектирования сложных информационно-измерительных систем для динамических объектов. //Автометрия. - 1977. - № 3. - С. 136-140.
3. Казанков М.А., Поддубный В.В. Обработка информации с учетом знания предельно возможных погрешностей навигационных измерений. //Записки по гидрографии. - 1980. - № 204. - С. 7-12.
4. Андрюшин О.Ф., Лязшчев Г.Й., Цоддубный В.В. Имитационная; цифровая система для отработки элементов математического обеспечения океанографических комплексов. //Вопросы судостроения, серия "Общетехническая". - 1983. - Вып. 74. - С. 3-11.
5. Андрюшин О.Ф., Ляпичев Г.Й., Поддубный В.В. Имитационное моделирование автоматизированного сбора геофизических и гидрометеорологических данных океанографическим комплексом. //Вопросы судостроения, серия " Общетехническая". - 1983. - Вып. 74. - С. 12-18.
6. Куликов А.И., Поддубный В.В. Оптимальное управление расхождением судов. //Судостроение. - 1984. - № 12. - С. 22-24.
7. Андрюпшн О.Ф., Ляпичев Г.И., Поддубный В.В. Моделирование на-иг анионных измерений в имитационной системе сбора океанографической нформации. //Судостроительная промышленность. - 1987. - Сер. 8. - №
0. - С. 64-71.
8. Поддубный В.В. Рестриктпвные сплайны для обработки данных. /Изв. ВУЗов. Физика. - 1992. - N° 9. - С. 128-135.
9. Поддубный В.В., Рожкова C.B. Сравнение эффективности нелинейных алгоритмов фильтрации по знаковым критериям. //Изв. ВУЗов. Финка. - 1995. - > 9. - С. 130-139.
10. Андрюпшн О.Ф., Ляпичев Г.И., Поддубный В.В., Головчинер М.Н., 1отолов А.Б. Имитационная система моделирования океанографических и хавигадионных данных ИСМОНД. - Севастополь: Изд-во МГИ АН УССР, .985. - 60 с.
11. Поддубный В.В., Сибилев В.Д. Оценка обобщенных сил в линей-юй динамической системе по наблюдениям вектора состояний. //Труды "ФТИ, вып. 60, ч. 2. - Томск: ТГУ, 1974. - С. 174-179.
12. Поддубный В.В., Сибилев В.Д. Совместная оценка состояний и обобщенных сил в линейной динамической системе. //Труды СФТИ, вып. 60,
1. 2. - Томск: ТГУ, 1974. - С. 169-173.
13. Поддубный В.В/, Тривоженко Б.Е. О некоторых статистических свойствах многомерных дважды стохастических пуассоновских процессов. //Математический сборник, вып. 2. - Томск: ТГУ, 1975. - С. 178-183.
14. Поддубный В.В., Сибилев В.Д. О регуляризованных оценках входных сигналов линейного марковского канала. //VI конференция по теории кодирования и передачи информации /Доклады. Часть VI. Статистическая теория передачи сообщений. - М.-Томск: Наука, 1975. - С. 103-108.
15. Поддубный В.В., Сибилев В.Д. Об оптимальном восстановлении входных функций линейного марковского канала, принадлежащих подмножеству пространства Соболева. //IV Международный симпозиум по теории информации /Тезисы докладов. Часть 1. - М.-Л.: Наука, 1976. - С. 112-114.
16. Поддубный В .В., Сибилев В.Д. О регуляризованном оценивании состояний и переменных параметров динамических систем. //Оптимизация систем управления и фильтрации. - Томск: ТГУ, 1977. - С. 91-96.
17. Поддубный В.В., Сибилев В.Д. Регуляризовадная оценка состояния дискретной стохастической системы при наличии нестохастического входного воздействия. //Оптимизация систем управления и фильтрации. - Томск: ТГУ, 1977. - С.. 97-105.
18. ПоддубныйВ.В., Сибилев В.Д. Нелинейный итерационный алгоритм оценивания состояний линейной динамической системы при наличии неизвестных входных воздействий. //Оптимизация систем управления и фильтрации. - Томск: ТГУ, 1977. - С. 106-110.
19. Поддубный В.В., Сибилев В.Д. Адаптивная регуляризованная фильтрация в дискретной линейной системе при нестохастических плавных возмущениях. //Математическая статистика и ее приложения, вып. 5. -Томск: ТГУ, 1979. - С. 12-22.
20. Поддубный В.В., Сибилев В.Д. Об адаптивном регуляризованном оценивании последовательностей с евклидовой нормой приращений в некоррелированном гауссовом шуме. //Математическая статистика и ее приложения, вып. 6. - Томск: ТГУ, 1980. - С. 94-101.
21. Поддубный В.В. Рестриктивное рекуррентное оценивание. //Математическая статистика и ее приложения, вып. 9. - Томск: ТГУ, 1983. - С. 156-173.
22. Поддубный В.В., Соколова В.О. Адаптивное оценивание состояний динамических систем с ограниченными управлениями. //Всесоюзная конференция "Теория адаптивных систем и ее применения" /Тезисы докладов и сообщений. - М.: Наука, 1983. - С. 54-55.
23. Андрюпшн О.Ф., Ляхшчев Г .И., Поддубный В.В. Восстановление стационарных геофизических полей на основе сплайн-аппроксимации. //IV Всесоюзная конференция "Проблемы научных исследований в области изучения и освоения Мирового Океана": Гидрофизические поля океана и методы их исследования, ч.2. /Тезисы докладов. - Владивосток: ДВНЦ АН СССР, 1983. - С. 123-124.
24. Поддубный В.В. Адаптивная фильтрация в рестриктивных системах. //XII школа-семинар по адаптивным системам, г.Могилев, 1984. /Тезисы докладов. - Минск: Изд-во Белорус, ун-та, 1984. - С. 81.
25. Куликов А.И., Поддубный В.В., Якупов Р.Т. Оптимальное управление подвижным объектом по вероятностному критерию в стесненных условиях. //Оптимизация систем управления и фильтрации. - Томск, 1984 /Деп. в ВИНИТИ 5.04.85, № 2323-85 деп.
26. Куликов А.И., Поддубный В.В. Метод возможных направлений в задаче синтеза оптимального управления подвижным объектом в стесненных условиях. //Оптимизация систем управления и фильтрации. - Томск. 1984 /Деп. в ВИНИТИ 5.04.85, N° 2323-65 деп.
27. Ляпичев Г.И., ПоддубныйВ.В. Сплайн-аппроксимация экспериментальных кривых и поверхностей при наличии ошибок координатной прп-
вязки измерений. //Автоматизация статистической обработки данных. -Новосибирск: НЭТИ, 1985. - С. 3-15.
28. Поддубный В.В. Адаптивное рестриктивное рекуррентное оценивание последовательностей с ограниченными приращениями. //Автоматизация статистической обработки данных. - Новосибирск: НЭТИ, 1985. - С. 23-33.
29. Поддубный В.В. Об адаптивной рестриктивной фильтрации переменной интенсивности пуассоновского потока. //Исследование путей повышения • эффективности сетей связи и сетей ЭВМ /Тез. докл. конф. (г.Гродно, январь 1985г.). - Минск: Изд-во Белорус, ун-та, 1985. - С. 132.
30. Поддубный В.В. Рестриктивный анализ трендов временных рядов. //Методы и программное обеспечение обработки информации и прикладного статистического анализа данных на ЭВМ. /Тез. докл. конф. (Минск, декабрь 1985). - Минск: Изд-во Белорус, ун-та, 1985. - С. 87-88.
31. Поддубный В.В. Рестриктивная фильтрация тренда интенсивности пуассоновского потока как задача оптимального управления. //Проблемы, методы и опыт создания автоматизированных систем управления связью /Тез. докл. научно-техн. конф. - М.: Изд-во Минпромсвязи, 1985. - С. 60.
32. Сибилев В.Д., Поддубный В.В. Адаптивный регуляризованный фильтр первого порядка. //Ред. ж. "Изв. АН СССР. Техн. кибернетика". - М., 1985, 25 с. /Деп. в ВИНИТИ 17.12.85, № 8704-85 деп.
33. Поддубный В.В. Рестриктивная фильтрация линейных скалярных процессов с полиномиальной интерполяцией решений уравнений инвариантного погружения. //Математическая статистика и ее приложения, вып. 10. - Томск: ТГУ, 1986. - С. 184-195.
34. Поддубный В.В., Куликов А.И. Метод возможных направлений в задачах безопасного расхождения судов. //Ред. ж. "Изв. АН СССР. Техн. кибернетика". - М., 1987, 21 с. /Деп. в ВИНИТИ 10.06.87, № 4221-В87.
35. Поддубный В.В., Куликов А.И. Синтез оптимального управления движущимся объектом с фиксированным конечным состоянием при незаданных начальных условиях. //Сиб. физ.-техн. пнет. - Томск, 1987, 17 с. /Деп. в ВИНИТИ 19.11.87, № 8201-В87.
36. Поддубный В.В. Нелинейная рестриктивная фильтрация с пошаговой интерполяцией решений рекуррентных уравнений инвариантного погружения. //VI совещание-семинар по непараметрическим и робастным методам статистики в кибернетике /Доклады, часть 2. - Томск: Изд-во ТГУ, 1987. - С. 343-358.
37. Поддубный В.В., Тихонова Т.Г. Рестриктивное робастное МНК-
оценивание. //Оптимизация систем управления и фильтрации. - Томск, 1988, с. 92-97. /Деп. в ВИНИТИ 30.12.88, № 9225-В88.
38. Ляшгчев Г.Й., Поддубный В.В. Программный имитатор входных данных океанографического комплекса. //Весоюзн. науч.-техн.конф. "Техническое и программное обеспечение комплексов полунатурного моделирования", Гродно, 27-29 сент. 1988. /Тездокл., ч.2. - М.: 1988. - С. 176.
39. Поддубный В.В. Рестриктивная сплайн-ашгроксимадия эмпирических зависимостей. //Непараметрические и робастные статистические методы в кибернетике и информатике /Материалы VII Всесоюзн. семинара. - Томск: ТГУ, 1990. - С. 438-448.
40. Поддубный В.В. Пошаговая оптимизация рестриктивных рекуррентных процессов. //Микропроцессорные системы автоматики. /Тез.докл. II Всесоюзн. науч.-техн. конф., г.Новосибирск, 17-18 мая 1990г., ч.1. - Новосибирск: СНИИМ, 1990. - С. 52-53.
41. Поддубный В.В. Рестриктивное обнаружение разладок случайного процесса при наличии тренда. //Статистические проблемы управления, вып. 89. - Вильнюс: ИМК Лит. АН, 1990. - С. 232.
42. Поддубный В.В. Рестриктивные кинематические модели движения ЛА и последовательные алгоритмы выработки оптимальных программных траекторий. //Динамика, управление полетом и исследование операций. /Третья Всесоюз. школа-семинар, г.Клин, 22-30 сент. 1990г. /Тезисы докладов. - М.: Изд-во МАИ, 1990. - С. 53-54.
43. Поддубный В.В. Рестриктивные сплайны. //Математическое и программное обеспечение анализа данных. /Тез. докл. Респ. науч. конф., г.Минск, декабрь 1990г. - Минск: Изд-во БГУ, 1990. - С. 18.
44. Поддубный В.В. Рестриктивное обнаружение быстрых изменений параметров сигналов. //Статистический синтез и анализ информационных систем. /Тез. докл. семинара, Севастополь, 16-18 мая 1991г. - Севастополь: Изд-во СПИ, 1991. - С. 82.
45. Поддубный В.В. Рестриктивное обнаружение существенных изменений параметров сигналов. //Вероятностные модели и обработка случайных сигналов и полей /Тез. докл. Укр. Респ. школы-семинара, Черкассы. 16-21 сент. 1991г. - Черкассы: ЧФ КПИ, 1991. - С. 61.
46. Поддубный В.В., Васильцева Н.И. Устойчивое моделирование оптимальных программных траекторий при ограниченных управлениях. //Автоматизация исследования, проектирования и испытаний сложных технических систем и проблемы математического моделирования. /Тез. докл. per. науч.-техн. конф. - Калуга: ЦНТИ. 1991. - С. 5.
Я5>
47. Poddubny V.V. Step-by-Step Approximation Method for Solving a Problem of Modelling on Optimal Programmed Trajectory. //IMAGS/IFAC International Workshop Methods and Software for Automat. Control Systems. /Summary of Papers, Irkutsk, SU, Sept. 3-5,1991. - Irkutsk: Irkutsk Computer Center of USSR Acad, of Sci., 1991. - pp. 27-29.
48. Poddubny V.V. Step-by-Step Approximation Method for Solving the Restrictive Two-Point Boundary Problem of the Programmed Control. //Control System Synthesis: Theory and Application. /Proc. of the International Workshop, Novosibirsk, USSR, 27 May-1 June, 1991. - Novosibirsk: Inst, of Electr. Eng., 1991. - pp. 65-70.
49. Поддубный В.В. Методы инвариантного погружения в задачах оптимизации рестриктивных процессов. //Информационно-управляющие и вычислительные комплексы на основе новых технологий. Наука и маркетинг. /Тез. докл. Всерос. НТК с международным участием, СПб, 4-5 сент. 1992. - СПб: Изд-во СПбИАП, 1992.
50. Поддубный В.В. Рестрихтивная обработка данных экологического мониторинга. //Математические проблемы экологии. /Тез. докл. Первой Всесиб. конф. по математическим проблемам экологии, Новосибирск, 23-25 июня 1992г. - Новосибирск: Изд-во ИМ СО РАН, 1992. - С. 76-77.
51. Поддубный В.В. Оптимизация систем управления с рестриктивной обратной связью. //Новые направления в теории систем с обратной связью. /I Совещание. Уфа, май-июнь 1993г. /Тез. докл. - М.: Изд-во ИПУ РАН, 1993. - С. 20-21.
52. Поддубный В.В. Комбинаторный синтез оптимальных ограниченных управлений. //Проблемы электротехники. Секция 3 "Автоматика" /Науч. конф. с международным участием. Новосибирск, 20-22 окт. 1993г. /Тез. докл. - Новосибирск: НГТУ, 1993. - С. 18-21.
53. Поддубный В.В., Васильцева Н.И. Синтез оптимального рестрик-тивного управления по скользящему критерию. //Автоматическое управление объектами с переменными характеристиками: Межвуз. сб. науч. трудов, вып. 2. - Новосибирск: НГТУ, 1993. - С. 56-64.
54. Поддубный В.В. Анализ точности алгоритмов рестриктивной фильтрации. //Проблемы техники и технологии XXI века /Тез. докл. науч,-техн. конф. с международным участием. Красноярск. 22-25 марта 1994г. -Красноярск: Изд-во КГУ, 1994. - С. 17.
55. Poddubny V.V., Roshkova S.V. Restrictive Algorithms for Complex Processing of the Navigation Information. //The Scientific Conference on Use of Research Conversion Results in the Siberian Institutions of Higher
Education for International Cooperation (SIBCONVERS'95). Abstracts. -Tomsk: Tomsk State Academy of Control Systems and Radioelectronics, 1995 - p.32.
56. Поддубный B.B., Рожкова C.B. Интервальная фильтрация состоя ний линейной стохастической динамической системы. //Микропроцессор ные системы автоматики. /Материалы III Междунар. науч.-техн. конф. 19-24 февраля 1996г., г.Новосибирск. - Новосибирск: НГТУ, 1996. - С. А22 А24.
57. Поддубный В.В. Рестриктивные сплайны. //Второй Сибирский кон гресс по прикладной и индустриальной математике (ИНПРИМ-96) /Тези сы докладов. - Новосибирск: ИМ СО РАН, 1996. - С. 228-229.
58. Поддубный В.В., Рожкова C.B. Комбинаторный метод точного ре шения двухточечных краевых задач оптимизации рестрнктивных рекур рентных процессов. //Второй Сибирский конгресс по прикладной и инду стриальной математике (ИНПРИМ-96). /Тезисы докладов. - Новосибирск ИМ СО РАН, 1996. - С. 229.
Тираж 100 экз.
О I
Текст работы Поддубный, Василий Васильевич, диссертация по теме Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
МЕТОДЫ ИНВАРИАНТНОГО ПОГРУЖЕНИЯ И АППРОКСИМАЦИИ В РЕСТРИКТИВНЫХ ЗАДАЧАХ УПРАВЛЕНИЯ И ФИЛЬТРАЦИИ
V
<&0 'ГУ Г х-х■ он
Томский ордена Октябрьской Революции и ордена Трудового Красною Знамени государственный университет им. В.В.Куйбышева
В .В .Поддубцый
МЕТОДЫ ИНВАРИАНТНОГО ПОГРУЖЕНИЯ И АППРОКСИМАЦИИ В РЕСТРИКТИВНЫХ ЗАДАЧАХ УПРАВЛЕНИЯ И ФИЛЬТРАЦИИ
Росс
Гоезечиост" ОЪ - г,г №
^ухксудилу--еу:-с/Суу
^ с-гт^е---ч
ШДАТЕЛаСШОТОМСКОРаунМВЕКШВТА
Томск-1993
УДК 519.95
Поддубный В. В. Методы инвариантного погружения и аппроксимации в рестриктивных задачах управления и фильтраадй. -Томск: Изд- во Том. ун-та, 1993 -
Развивается новый подход к численному решению задач оптимизации ж фильтрации многомерных нелинейных рестриктивных' (стесняемых ограничениями тнпа неравенств) рекуррентных кро-ткссов. Подход основан на пошаговой аппроксимации подходящей - - -> \ ой функдий (полиномами, элементарными или специальны-'П/^гциями) решений уравнений инвариантного погружения же-ж рестриктивных двухточечных краевых задач оитимнза-гожение шшгастряруется численным решением некоторых ггамизации я фильтрация (для линейщхго управляемого "а, пауссоновского потока, рестриктивных сплайнов). ' математиков-прикладников, разработчиков, математике-^ "беспечения систем управления и фильтрации.
Рецензент - профессор Ю. И. 17 а р а с в
- % ,
18ВМ 5-7511-0258-4 ^ г, ^ _ П0
п 1402050000 0 Э ^ ^ 1 ^ 1
1.77(012) 92
© Поддубный В.В., 1993
ВВЕДЕНИЕ
Реккурентные многошаговые процессы, определенные на счетном множестве скалярного параметра или дискретного времени, играют важную роль в различных областях науки, техники, производства.
В общем случае такие процессы нелинейны, нестационарны, многомерны. Если процесс обладает достаточным количеством степеней свободы, чтобы можно было сознательно управлять им с целыр достижения желаемого качества его поведения, возникает задача оптимизации процесса (задача синтеза оптимального программного управления и соответствующей: ему оптимальной программной траектории). Если же процесс находится целиком во власти неконтролируемых внешних воздействий, непредсказуемо изменяющих его состояние, так что сознательное управление процессом невозможно, может возникнуть только задача .наблюдения за его состоянием и выделения информации о состоянии и параметрах процесса из наблюдений, обычно искажаемых ошибками (задача оценивания, фильтрации и идентификации). Если неконтролируемые факторы действуют на управляемый процесс, возникает смешанная задача наблюдения за процессом и управления им (задача идентификации, фильтрации и оптимального позиционного управления). I
При этом во многих случаях существуют ограничения на возможности управления или поведение некоторых компонен т вектора состояния процесса или его параметров, которые могут быть ограничены некоторыми пределами или изменяться достаточно медленно, так что ограниченными оказываются скорости их изменения (приращения за один шаг). Такие процессы будем называть рестриктивными [40], то есть подчиняющимися ограничениям. Задачи их оптимизации существенно более сложны, чем задачи оптимизации процессов, не стесняемых ограничениями.
Различают два типа ограничений: на переменные состояния (фазовые ограничения) и на их приращения, параметры, управления, воздействия (в широком смысле - ограничения на "управления").
В данной книге рассматриваются только рестрикгивные рекуррентные процессы с ограничениями на обобщенные управления и такие задачи их оптимизации, для_которых справедлив классический "дискретный" принцип максимума Л.С.Понтряшна [6,41].
Предметом изучения в данной книге являются рестрикгивные двухточечные краевые задачи (РДТКЗ), к которым приводит решение первых двух из перечисленных выше типов задач оптимизации. Эти РДТКЗ в соответствии с "дискретным" принципом максимума Л.С.Понтряшна выражают необходимые (а иногда и достаточные) условия экстремума (именно: максимума), выпуклого целевого функционала на траекториях рекуррентного процесса с ограничениями на управления в виде Системы выпуклых неравенств, удовлетворяющих условиям регулярности Слейтера. Не нарушая общности, будем считать, что задача оптимизации сформулирована таким образом, что финальное значение (на правом конце траектории оптимального процесса) сопряженной (по Гамильтону) векторной переменной обращается в Вуль-векгор. .
Точных аналитических методов решения таких задач не существует. Обширная литература, обзор которой провести здесь не представляется возможным, предлагает разнообразные численные методы решения рестрйктивных (в том числе с фазовыми ограничениями) ДТКЗ. Главное место среди них занимают различные методы последовательных приближений (по управлениям, сопряженным переменным, граничным условиям и т.п.), использующие многократную прямую и обратную прогонку решения для каждого заданного интервала дискретного времени (параметра) существования процесса [см., например, 41,54 и др.]. При реализации этих методов возникает ряд трудностей. Одна из них состоит в том, что система уравнений ДТКЗ оптимизации, как правило, неустойчива в вычислительном отношении [54]. Эта трудность усугубляется еще и тем, что при последовательном увеличении длительности интервала прогонки вычислительные затраты нарастают по квадратичному закону, в связи с чем практическое
применение методов последовательных приближений ограничивается интервалами интегрирования (в дискретном времени), определяемыми возможностями используемой вычислительной техники.
В то же время многие прикладные задачи оптимизации рестриктивных процессов (в частности, задачи нелинейной фильтрации или выработки последовательности оптимальных программных траекторий) требуют решения РДТКЗ на неограниченно Возрастающих интервалах дискретного времени. Методы последовательных приближений здесь уже не подходят.
Недавно А.А.Сухановым [50] предложен изящный метод решения нелинейных ДТКЗ - метод "движущейся мишени", сводящий исходную ДТКЗ к последовательности задач Кош и с изменяющимся начальным условием и увеличивающимся интервалом интегрирования (в непрерывном или дискретном времени). Этот метод обладает очевидными преимуществами перед традиционными методами последовательных приближений, так как устраняет один из их недостатков - необходимость решения в процессе прогонок неустойчивой системы уравнений ДТКЗ. Однако и этот метод требует все возрастающих вычислительных затрат с ростом интервала времени интегрирования. Кроме того, он не приспособлен к решению рестриктивных ДТКЗ, в которых не обеспечиваются требуемые условия дифференцируемости.
Определенный выход из затруднения, на наш взгляд,, открывает широко известный метод инвариантного погружения, позволяющий сводить двухточечные краевые задачи к задачам Кош и для функциональных уравнений [см., например, 44]. Как oi мечает Ц. На [38], "концепция инвариантности впервые была ненолг.зована.для преобразования граничной задачи в задачу Konai В.А Лмбардумяном [3] при изучении процессов рассеяния в акпосфцх:. Чандрасекар [57] распространил такой подход на задачи о переносе лучистой энергии и назвал его "принципом инвариантное! и". В последующие годы этот подход интенсивно изучался и обобщался Бе.-ыманом; Калабой и их коллегами [см. 59,60] й получил свое современное название "метод инвариантного погружения".
Суть метода в случае ДТКЗ с дискреншм временем состоит в том, что исходная ДТКЗ нотружается оирелел! ьным образом в более общую Д'1 КЗ, образующую нарамефнческоо семейство,, содер-
жагцее исходную ДТКЗ в качестве элемента. Эта более общая ДТКЗ отличается от исходной тем, что финальное значение сопряженной (по Гамильтону) переменной принимаем не нулевое, а произвольное значение из евклидова пространства соответствующей размерности, образующего пространство параметров. Связь решений последовательности таких обобщенных ДТКЗ между собой выражается рекуррентным функциональным уравнением (уравнением инвариантного погружения) с известным начальным условием, то есть задачей Коши для него. Значение решения уравнения инвариантного погружения в нулевой точке пространства параметров дает точное финальное значение решения исходной ДТКЗ и переводит ее в задачу Коши, решаемую в "обратном" направлении.
К сожалению, точных общих методов решения рекуррентных функциональных уравнений инвариантного погружения не существует, за исключением тривиального частного случая линейных нерестрикгавных ДТКЗ, для которых уравнение инвариантного погружения линейно и линейно его решение, а задача отыскания коэффициентов этого решения (и тем самым - финальных значений решения исходной ДТКЗ) сводится к решению рекуррентных уравнений типа уравнений фильтра Калмана. В случае нелинейных нересгриктивных ДТКЗ широко используется только линеаризированная форма уравнений инвариантного погружения [19,44,58], приводящая к приближенному решению, зачастую довольно грубому. Последнее обстоятельство, по-видимому, послужило основание»! для резкой критики метода инвариантного погружения в некоторых работах отечественных авторов [см., например, 51]. Кроме того, в традиционной (линеаризированной) форме метод инвариантного погружения неприменим к рестриктивным ДТКЗ, в которых не обеспечиваются требуемые для линеаризации условия дифференцируемости.
Оказывается, однако, что в точной своей форме метод инвариантного погружения не требует выполнения каких-либо условий дифференцируемости и лепсо распространяется на случай рестриктивных ДТКЗ, приводя к задаче Коши для рестрикпшног© рекуррентного функционального уравнения инвариантного погружения. Если бы на каждом шаге дискретного времени удалось построить точное решение этого уравнения, мы имели бы
возможность на одной прямой прогонке рекуррентно получать последовательность финальных значений оптимального процесса и свели бы рестриктивную ДТКЗ к последовательности задач Копти, решение которых в "обратном" времени позволило бы получить полное решение рестриктивной ДТКЗ.
Однако единственное, что можно сделать, применяя метод инвариантного погружения для решения рестриктивных (вообще - нелинейных) двухточечных краевых задач, это попытаться построить хотя и приближенное, но возможно более точное решение уравнения инвариантного погружения на каждом шаге процесса решения.
В данной книге предлагается проводить пошаговую аппроксимацию решения этого уравнения подходящей системой функций (полиномами, элементарными или специальными функциями), расширяя базис аппроксимации до тех пор, пока не будет обеспечена достаточная точность решения уравнения инвариантного догружения в области аппроксимации. Иными словами, базис аппроксимации должен выбираться таким образом, чтобы, например, невязка уравнения инвариантного погружения на каждом шаге в соответствующей области аппроксимации была в определенном смысле достаточно малой. Области аппроксимации на всех шагах решения должны быть выпуклыми, и выбирать их следует в пространстве параметров, характеризующих семейства расширенных (обобщенных) РДТКЗ на этих шагах, таким образом, чтобы на каждом шаге значение параметра, соответствующее исходной РДТКЗ (то есть нуль-вектор), являлось внутренней точкой этой области, а размер области был бы не меньше величины, обеспечивающей попадание нуль-вектора внутрь соответствующих областей аппроксимации на всех последующих шагах построения решения (теорема о вложениях выпуклых компактов, содержащих цуль-век-торы).
Такой подход позволяет на одной прямой прогонке находить с заданной точностью все финальные значения оптимального процесса, а на последовательности однократных обратных прогонок получать с соответствующей точностью полное решение рестриктивной ДТКЗ оптимизации.
Остановимся кратко на содержании глав.
В главе 1 вводится понятие рестриктивного рекуррентного процесса и содержатся постановки задач оптимизации для таких про-цессов(задача оптимального программного управления и задача экстремального оценивания), приводится формулировка "дискретного" (для дискретного времени) принципа максимума Л.С.Пон-трягина и выписываются необходимые условия оптимальности в форме соответствующих рестриктивных двухточечных краевых задач, а также условия существования и единственности их решения. Рассмотрены различные частные случаи, в том числе рестриктивные линейно-квадратичные задачи оптимизации.
Глава 2 посвящена подробному изложению метода инвариантного погружения рестриктивных ДТКЗ оптимизации в дискретном нремени. В ней приводятся различные формы представления уравнений инвариантного погружения, исследуются общие свойства решений этих уравнений и формулируется Принцип пошаговой аппроксимации их решения. Приведены различные способы полиномиальной аппроксимации решений, включая методы минимизаций взвешенных невязок уравнения инвариантного погружения и методы коллокации. Рассмотрены вопросы сходимости и точности полиномиальной аппроксимации.
Глава 3 посвящена построению и исследованию требующих минимального базиса линейных рестриктивных алгоритмов пошаговой аппроксимации уравнений инвариантного погружения и нахождения финальных состояний оптимизируемого процесса и его фильтрационных оценок. Эти простейшие алгоритмы аппроксимации, которые можно рассматривать как первые приближения к решению задача аппроксимации на каждом шаге, во многих случаях обеспечивают достаточно хорошее качество решения. Приведены различные формы линейных рестриктивных алгоритмов аппроксимации, включая структуры, минимизирующие невязки уравнений инвариантного погружения, коллокационные формы алгоритмов, алгоритмы с автополстоойкой по параметрам Куна-Таккера, алгоритмы с ла -..''■■
горе оптимизации- линейною скаля I ( мое о процесса подробно асслешт-ют .. I 11 ой,аппроксимации, основанной на с и < 1 1 гдуются качество аппроксимации,
скорость сходимости алгоритмов, точность решения задачи оптимизации и тд,
Глава 5 иллюстрирует возможности решения задачи нелинейной рестриктивной фильтрации на основе существенно нелинейной пошаговой аппроксимации решения уравнения инвариантного по-1ружения. Рассматривается задача максимально правдоподобной фильтрации переменной интенсивности пуассоновского потока, Подверженного медленному тренду с ограниченной скоростью изменения интенсивности. Алгоритм фильтрации строится на основе гиперболической пошаговой аппроксимации решения уравнения Инвариантного погружения. Приводится простой численный пример.
Глава б посвящена новому направлению применения рестриктивных рекуррентных процессов - построению рестриктивных полиномиальных сплайнов. Это новый тип сплайна, не встречавшийся в литературе. Он занимает промежуточное положение между обычными сплайнами соседних целочисленных дефектов. Рассматриваемые в этой главе конструкции промежуточных (маргинальных) рестриктивных сплайнов позволяют плавно переходить от обычного сплайна некоторого дефекта к обычному же сплайну соседнего дефект а через все промежуточные состояния путем изменения допустимых пределов скачка производной в _ соответствующем рестриктивном условии сопряжения элементов сплайна. Обычные сплайны, как известно, с изменением дефекта изменяют свои свойства скачкообразно.
Подробно рассмотрены рестриктивные кубические сплайны дефектов 1 и 2 и рекуррентные алгоритмы их построения. Приведен численный пример простейшей двухзвенной рестриктивной сплайн-аппроксимацию
1. ЗАДАЧИ РЕСТРИКТИВНОЙ ОПТИМИЗАЦИИ ПРИ АДДИТИВНЫХ КРИТЕРИЯХ И НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ В ФОРМЕ РЕСТРИКТИВНЫХ ДВУХТОЧЕЧНЫХ КРАЕВЫХ ЗАДАЧ
В этой главе вводится в рассмотрение класс, обобщенных нелинейных рекуррентных рестриктивных процессов с переменными ограниченными управлениями (или возмущениями) и неизвестными начальными условиями, для которого ставятся задачи оптимизации (программного управления и статистического оценивания) по аддитивным выпуклым критериям и приводятся необходимые условия оптимальности в форме РДТКЗ. Особенностью формулировок ДТКЗ является выделение в них начальных условий, связывающих Неизвестные априори начальные значения ¡канонически сопряженных переменных, что необходимо для последующего применения к решению ДТКЗ рекуррентных структур метода инвариантного погружения, и концентрация внимания на рестриктивносги (подчинении ограничениям типа неравенств) задач оптимизации. Материал главы опирается на формулировки дискретного принципа' максимума Л.С.Понтрягина, принятые в работе А.И.Пропоя [41].
1.1. Постановка задач оптимизации для рестриктивных рекуррент
-
Похожие работы
- Исследование двухточечных краевых задач оптимизации рестриктивных процессов
- Исследование и применение рестриктивных В-сплайнов
- Математические модели и фильтрация состояний динамических систем с модульной структурой измерительного комплекса
- Структурно-алгоритмические методы и средства инвариантных преобразований для систем управления технологическими процессами
- Аппроксимационная сплайновая фильтрация сигналов систем с нестационарными возмущениями
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность