автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Исследование двухточечных краевых задач оптимизации рестриктивных процессов

кандидата технических наук
Рожкова, Светлана Владимировна
город
Томск
год
1996
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Исследование двухточечных краевых задач оптимизации рестриктивных процессов»

Автореферат диссертации по теме "Исследование двухточечных краевых задач оптимизации рестриктивных процессов"

Томский Государственный Университет

РГ5 ОД

^ ¡'Л^ г> г»

Г/,';! ¡«^

На правах рукописи

РОЖКОВА СВЕТЛАНА ВЛАДИМИРОВНА

УДК 519.95

ИССЛЕДОВАНИЕ ДВУХТОЧЕЧНЫХ КРАЕВЫХ ЗАДАЧ ОПТИМИЗАЦИИ РЕСТРИКТИВНЫХ ПРОЦЕССОВ

05. 13. 16 - Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Томск 1996

Работа выполнена на кафедре прикладной математики Томского государственного университета.

Научный руководитель: кандидат физ.-мат. наук,

доцент В.В. Поддубный

Официальные оппоненты:

доктор технических наук, профессор A.M. Кориков, кандидат физ.-мат. наук, доцент С.Э. Воробейчиков

Ведущая организация: Новосибирский

государственный технический университет

Защита состоится " ЛС " _199бг. в ^ —

часов на заседании Диссертационного Совета Д 063.53.03 при Томском государственном университете по адресу: 634050 г.Томск -50, проспект Ленина 36, Томский' государственный университет.

С диссертацией можно ознакомиться в Научной библиотеке Томского государственного университета.

Автореферат разослан "__"_ 1996г.

Ученый секретарь Диссертационного Совета кандидат физико-математических наук, доцент

.Е. Тривоженко

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Методы оптимального оценивания параметров в темпе поступления измерительной информации широко применяют в различных областях науки и техники (в задачах фильтрации сигналов, навигации самолетов, спутников, судов и других движущихся объектов, в задачах траекторных измерений и т.п.).

На практике часто встречаются задачи оптимального оценивания параметров, стесненные всевозможными ограничениями. Различают два типа ограничений: на переменные состояния (фазовые ограничения) и на их приращения, параметры,'управления, воздействия (в широком смысле - ограничения на "управления"). Наиболее частыми ограничениями являются принадлежность параметров замкнутым ограниченным областям их определения, ограничения типа неравенств и, как вырожденный случай,- типа равенств и т.д. Такие процессы называются рестриктивными, то есть подчиняющиеся ограничениям.

В соответствии с принципом максимума Л.С. Понтрягина двухточечная краевая задача (ДТКЗ) оптимизации процессов управления и фильтрации выражает необходимые (а иногда и достаточные) условия их оптимальности. При наличии ограничений на управления и состояния такие процессы трудно поддаются оптимизации. Задачи их оптимизации существенно более сложны, чем задачи оптимизации процессов, не стесненных ограничениями, в силу их существенной нелинейности.

В настоящее время наибольшее распростронение при решении задач оптимизации рестриктивных ДТКЗ получили численные подходы. Обычно здесь применяются методы последовательных приближений (по управлениям, по начальным или финальным условиям, по состояниям, по сопряженным переменным и пр.). В процессе последовательных приближений производится многократная двухсторонняя прогонка решения ДТКЗ. что приводит к большим вычислительным затратам. Также недавно У. Бадамом и Д.Цоодолом был получен вариант комбинированного алгоритма решения рестриктив-ной ДТКЗ. Суть алгоритма состоит в сочетании идеи двух ранее известных алгоритмов, использующих методы пикаровских приближений и градиентного спуска. Особенностью этих процедур оценивания является итеративный поиск экстремума целевой функции, зависящей от всего объема наблюдений выборки. Это существенно ограничивает возможности использования итеративных алгоритмов оценивания (необходимость запоминания всей выборки). Во многих приложениях объем выборки не фиксирован, а растет в ходе наблюдений, и требуется последовательно (рекуррентно) уточнять оценку по мере поступления новых данных (задача фильтрации).

Кроме того, имеется ряд подходов к решению рестриктивной ДТКЗ оптимизации, альтернативных методу последовательных приближений. Это методы инвариантного погружения и пошаговой аппроксимации. Метод инвариантного погружения позволяет сводить ДТКЗ к задачам Коши для функциональных уравнений. В общем случае точное решение рекуррентных функциональных уравнений инвариантного погружения не известно, лишь задача оптимизации линейного скалярного рестриктивного управляемого процесса является единственным известным примером, допускающим точное решение соответствующих уравнений.

В работах В.В. Пбддубного развивается новый подход к численному решению задач оптимизации многомерных нелинейных ре-стриктивных рекуррентных процессов. Подход основан на пошаговой аппроксимации подходящей системой функций (полиномами, элементарными или специальными функциями) решений уравнений инвариантного погружения нелинейных рестриктивных ДТКЗ оптимизации. Такой подход позволяет на одной прямой прогонке находить с заданной точностью все финальные значения оптимального процесса, а на последовательности однократных обратных прогонок получать с соответствующей точностью полное решение рестриктивной ДТКЗ оптимизации.

Задачей диссертации была разработка точных алгоритмов рестриктивной фильтрации. Для решения этой задачи использовалась идея проверки конечного числа гипотез о характере локализации компонент вектора оптимального управления относительно интервалов их возможных значений (на нижней границе интервала, на верхней границе интервала или внутри интервала). Второй задачей данной работы является исследование точности разработанных методов и алгоритмов. Из-за нелинейности алгоритмов рестриктивной фильтрации оценить абсолютную и относительную (сравнительную) эффективность представляется достаточно сложной проблемой, поскольку аналитические оценки эффективности в этом случае построить практически никогда не удается. Исследование эффективности алгоритмов фильтрации методами статистических испытаний (Монте-Карло) требует слишком много времени и вычислительных ресурсов в силу обычно большой длительности реализаций, их нестационарности, высокой размерности вектора состояния фильтрационных оценок и поэтому редко может быть проведено практически. Кроме того, могут быть неизвестны законы распределения возмущений в системе и каналах наблюдений, из-за чего проблема статистических испытаний становится неопределенной.

Помимо случая, когда неизвестное управление находится внутри некоторого интервала, интересна ситуация, когда и матричные параметры также лежат внутри интервала, то есть являются интер-

вальными. Поскольку при построении алгоритмов оптимизации и фильтрации обычно требуется обращение таких матриц, задача еще более усложняется, так как не совсем ясно, что понимать под обращением интервальной матрицы. Поэтому третьей задачей диссертации ставилось исследование возможностей интервальной фильтрации состояний линейных динамических процессов без решения задач обращения интервальных матриц.

Работа выполнялась в соответствии с планами важнейших научных исследований в рамках госбюджетной НИР "Развитие системных средств автоматизации и разработка математического и програмнно-технического обеспечения, исследования и оптимизации управляемых систем, информационных процессов и деятельности человека-оператора" ( шифр "Информатизация" ), выполняемой СФТИ по единому заказу-наряду 1991-1995 г.г., гос. регистрация № 01.9.50001753, а также НИР "Разработка методов, алгоритмов и правил обработки навигационной информации и управления в навигационно-управляющих комплексах судов и летательных аппаратов в сложных навигационных условиях" ( шифр "Навигатор" ), выполняемой СФТИ по межвузовской научно-технической программе "Конверсия и высокие технологии, 1994-1996 г.г.".

Цели работы: 1) Разработка точных (не приближенных) конструктивных методов решения задач фильтрации рестриктивных процессов при различных предположениях о характере априорного распределения неизвестных управлений (или возмущений с априорно ограниченными значениями, приращениями т.д.). 2) Разработка методики сравнения эффективности нелинейной фильтрации. В силу того, что ошибки фильтрации в общем случаи не являются независимыми, требуется соответствующая модификация известных тестов проверки гипотез против односторонних альтернатив, уместных в данном случае. 3) Разработка подхода к решению задачи фильтрации состояний линейной динамической системы с интервальными параметрами и неизвестными ограниченными управлениями. 4) Проверка предложенных алгоритмов оценивания методом имитационного моделирования.

Результаты по решению перечисленных выше задач выносятся на защиту.

Научная новизна результатов, полученных в диссертации, состоит в следующем: 1) Предложены точные (не приближенные) алгоритмы рестриктивной фильтрации, позволяющие находить решение задачи оптимизации функции Гамильтона рестриктивной ДТКЗ за конечное число шагов. При этом алгоритм оценивания управления сводится к комбинаторной процедуре проверки гипотез о возможных значениях только вектора финальных оптимальных управлений, поэтому алгоритмы рестриктивной фильтрации характеризуются ли-

нейным ростом объема вычислений с увеличением времени наблюдения I1 (Зт гипотез на каждом шаге), в отличие от алгоритмов полного перебора гипотез, которые требуют проверки ЗтТ гипотез, то есть приводят к экспонециальному росту обьема вычислений. 2) Предложена схема сравнения эффективности нелинейных алгоритмов по разности абсолютных значений ошибок фильтрации с использованием одновыборочных критериев знаков и знаковых рангов с бутстреп-рандомизацией. Данная методика может быть использована в исследованиях, направленных на выявление относительных преимуществ и недостатков тех или иных алгоритмов нелинейной фильтрации в одних и тех же условиях.

Методика исследования. В работе используются методы теории вероятностей и математической статистики, теории случайных процессов, оптимизации, математического анализа, имитационного моделирования.

Теоретическая ценность работы: разработаны точные алгоритмы решения рестриктивных ДТКЗ оптимизации.

Практическая ценность работы. Предложено и исследовано несколько подходов к построению алгоритмов фильтрации рестриктивных рекуррентных процессов, не требующих использования методов последовательных приближений.

Реализация результатов работы. Полученные в диссертационной работе результаты использовались в Красноярском государственном университете при чтении учебного курса "Обработка изображений".

Апробация работы. Основные результаты докладывались и обсуждались на VIII Международном симпозиуме по непараметрическим методам в кибернетике (г. Красноярск, октябрь 1995г.), на Международной научно-технической конференции по использованию результатов конверсии науки в вузах Сибири для Международного сотрудничества (Сибконверс'95) (г. Томск, октябрь 1995г.), на III Международной научно-технической конференции "Микропроцессорные системы автоматики" (г. Новосибирск, февраль 1996г.), на Международной конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-96" (г. Москва, апрель 1996г.), на Втором Сибирском конгрессе по прикладной и индустриальной математике (ШРШМ - 96) (г. Новосибирск, июнь 1996г.), а также на семинарах и конференциях в Сибирском физико-техническом институте.

Публикации. Основное соддержание диссертации опубликовано в 6 печатных работах.

Структура и обьем работы. Диссертация состоит из введения, 4 глав и заключения, списка литературы, насчитывающего 85 наименований. Общий объем работы - 125 страниц, включая 25 рисунков, 9 таблиц и 1 справку об использовании результатов.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении показана актуальность проблемы, содержится краткий обзор работ по проблемам, связанным с рассматриваемыми в диссертации задачами, формулируются цели работы. Основные результаты работы изложены в 4 главах.

ГЛАВА 1 РЕСТРИКТИВНАЯ ФИЛЬТРАЦИЯ

В п. 1.1 главы содержится постановка задачи совместного оценивания состояний и неизвестных возмущающих и управляющих воздействий в линейной динамической системе с дискретным временем по данным линейных наблюдений за состоянием, искаженных белым шумом.

Рассматриваются линейные рекуррентные стохастические управляемые процессы, описываемые в дискретном времени t уравнением:

хг+1 = Atxt + Вгщ + ¿ = 0,1,2,..., (1)

где хг - п-вектор состояния процесса со значениями из вещественного евклидова пространства 7£п; щ - т-вектор ограниченных управлений, принимающих значения из выпуклого компакта \]х евклидова пространства Лт\

щеиг с пт. (2)

Пусть £/<-прямоугольный параллелепипед:

£/, = {и\ : \и\\ < с\, с\ > 0, г' = ¿ = 0,1,2,..., (3)

где верхний индекс г означает номер компоненты вектора.

Вектор и>1 € Т1п описывает случайные белые возмущения процесса, распределенные с плотностью р((и!1), в частности, по гаус-совскому закону N(0, С? с нулевыми средними и неотрицательно определенной корреляционной матрицей (¿¡г' символ Кронекера).

Лгхх + Вхи( - п-вектор-функция со значением из определяющая невозмущенную эволюцию процесса из начального состояния х0, распределенного по известному закону с плотностью р4(:го|:Гд), в частности, - по нормальному закону М(хц,Р0) со средним х*0 и ковариационной матрицей Р0.

Матрицы Аг и Б/ и вектор ограничений с( считаются известными.

Пусть в последовательные моменты времени I = 1,2,...,Т над процессом х( производятся линейные наблюдения искаженные ошибками измерений

гг = Нгхг + уи г = 1, Т,

(4)

где х%- ¿-вектор измерений со значениями из 7г/4 - ¿-вектор статистически независимых для разных I случайных величин, распределенных по некоторому известному закону с плотностью в частности, - по нормальному закону N(0,Лг<5((<) с нулевыми средними и положительно определенной корреляционной матрицей IIг (к < п).

Наблюдения оставаясь статистически независимыми для разных £, описываются условной плотностью вероятности р((г(|х(), (< = 1,Г). Матрица Я% считается известной.

Ставится задача: при независимых в совокупности х0, wt, гг(, и(, I > 0 по результатам наблюдений гх на интервале t = 0,1,2...Т найти оптимальные (в среднеквадратическом смысле) оценки неизвестных состояний процесса х1, возмущений и управлений щ.

Особенностью этой задачи является ее рестиктивность, состоящая в требовании удовлетворять стесняющим ограничениям (3).

В п. 1.2-1.4 разработаны точные алгоритмы решения задач фильтрации таких процессов при различных предположениях о характере априорного распределения неизвестных управлений иг.

Предложенные рестриктивные алгоритмы построены на основе метода максимума апостериорного распределения состояний, возмущений и управлений или условного (при неизвестных фиксированных управлениях) апостериорного распределения состояний и возмущений. Необходимые условия максимума выражаются, в силу "дискретного" принципа максимума Понтрягина, нелинейной двухточечной краевой задачей оценивания.

При этом для нахождения максимума функции Гамильтона используем алгоритм проверки гипотез о попадании управления щ внутрь области или на ее границу. Суть его состоит в том, что вследствие наличия ограничений на управления вида (3) на каждом шаге процесса построения решения для каждой компоненты вектора оценки управлений предусматривается проверка трех гипотез относительно попадания ее в допустимый интервал или выхода соответственно на нижнюю или верхнюю границы интервала (для алгоритма с релейным управлением только на нижней или верхней границе области). Вводится система булевых т-векторов-индикаторов (логических условий) е[+\ позволяющих представлять аналитически проверяемую гипотезу. Компоненты вектора которым соответствуют компоненты вектора оценки управлений, принимающие, согласно рассматриваемой гипотезе, значения на нижней границе интервала, приравниваются единице, остальные - нулю. Аналогично для вектора - по отношению к верхней границе интервала, и для вектора е^ - по отношению к области внутри интервала (компоненты этого вектора принимают значения, равные еди-

нице, если соответствующие компоненты вектора оценки управления попадают, согласно гипотезе, во внутреннюю область интервала, остальные компоненты приравниваются нулю).

Теперь оценку ицТ вектора управления можно аналитически представить в виде:

Щт = 4*4 + (5)

(для алгоритма с релейным управлением

Щ т = 4*4), (6)

где г>,|Т - вектор пониженной размерности, составленный из компонент вектора иг\т, попадающих (в соответствии с рассматриваемой гипотезой) во внутреннюю область интервала допустимых значений управлений, /,(±) = 4+) - 4~\ 4+) - /((_) =

- диагональные булевы матрицы; Г^ = зрН1(е^) - булева матрица специальной структуры (матрица "расщепления" вектора е^),

такая, что Г{0)Уцт - 40)йцт, 4°} = <^(е^0)).

Это позволяет производить целенаправленный перебор гипотез и избавиться от экспонециального роста числа проверяемых гипотез с ростом длительности Т интервала наблюдения, как при полном переборе гипотез для всех моментов дискретного времени. Предложенные алгоритмы фильтрации характеризуются линейным ростом объема вычислений с увеличением времени наблюдения Т, что уже приемлемо с практической точки зрения.

Комбинаторный алгоритм рестриктивной фильтрации с регуляризацией

Пусть вектор щ является случайным в 1]% и подчиняется невырожденному усеченному распределению с плотностью рг(щ\щ 6 ГЛ), в частности, - усеченно-гауссовскому распределению N(0, £

иг) с нулевым средним и положительно определенной диагональной матрицей параметра разброса 5(.

Получаемая двухточечная краевая задача при фиксированной последовательности гипотез о значениях векторов управлений линейна, и следовательно может быть точно решена методами инвариантного погружения или прогонки с проверкой гипотез о размещении компонент вектора управления на дискретном множестве возможных значений. Воспользуемся методом инвариантного погружения.

Тогда комбинаторный алгоритм фильтрации определяется уравнениями:

2т+1|т+1 = [Атхт]т + Вт(1 - КтЗт1)Ут}+ + Рт+1|Г+1Ят+1Д^1{гт+:1 - НТ+1[АТХТ\Т + Bt(I-KtSt Х)УТ]}, (7) Ъ+цт+i = [(ATPT]TA'T + BTKTB'T + QT)-1 + H^+lR^+1HT+1}-1, (8)

где

УТ = (4+) - 4->)ст, (9)

кт = rPir^'s^r™)-1^, (Ю)

с начальными условиями

а;0|о = ®S,ío|o = Ра- (11)

Гипотетическая фильтрационная оценка управления при этом имеет вид:

ut\t+i = Ут + Кт[В'тАт1'\*т - бт'ут), (12)

где

ау = A'TH!r+lRT+1(zT+1 — Ht+iXt+i\t+i)- (13)

Соотношения (7)-(11) позволяют рекуррентно вычислять ít+i|t+i и Pt+i\t+i через хт\т и Рт\т при фиксированной на каждом шаге Т гипотезе, начиная с начального условия ж0|о = £o> ^о|о = Ро- При каждом вычислении фильтрационных оценок Ít+i|t+i и ит\т+1 гипотетическая оценка Ut\t+i проверяется на принадлежность области, соответствующей проверяемой гипотезе. Если в результате решения получится, что йт\т+1 при рассматриваемой гипотезе не попадает внутрь области, гипотеза исключается из дальнейшего рассмотрения (в этом, собственно, и состоит ограничительный механизм рестриктивной фильтрации). В противном случае ^tjt+i удовлетворяет гипотезе и остается претендентом на оптимальное решение. Гипотезы-претенденты и соответствующие им оценки управлений и состояний затем проверяются на оптимальность с точки зрения обеспечения максимума функции Гамильтона:

Мт - 1 ~~ HT+I(AtXt\t + QTAyl'\*T + Btut\t+I)]'RT+I[ZT+I-

- HT+i(ATxT\T + QTAy1'X*T -f BTuT¡T+1)] - \-u'T{T+lS^uT\T+l. (14)

Выбирается та гипотеза, которая соответствует максимальному значению Нт-

Комбинаторный алгоритм фильтрации при релейном управлении

Пусть щ - ш-вектор неизвестных релейных управлений, таких,

что:

^ = {и;:|«;| = с;, с;>о, ¿ = 1,т}, ¿ = 0,1,2,..., (15)

то есть вырожденный случай ограничений (3). Предполагается, что щ могут изменяться во времени независимо и случайно, принимая [в силу ограничения (15)] только граничные значения с априорно одинаковыми вероятностями.

По отношению к оценкам состояний процесса этот метод обеспечивает минимальную условную (при фиксированном управлении) дисперсию оценивания, так как получаемые оценки совпадают с байесовскими оценками (апостериорными средними). По отношению же к оценкам дискретных управлений метод обеспечивает минимум полной вероятности ошибки, так как реализует критерий идеального наблюдателя Зигерта-Котелышкова.

Поскольку для линейных процессов рестриктивная двухточечная краевая задача оптимизации при фиксированной последовательности гипотез о значениях векторов управлений линейна, следовательно она может быть решена точно методами прогонки.

В результате комбинаторный алгоритм фильтрации определяется уравнениями:

Входящий в уравнение фильтрации (16) вектор йТ\т+1 имеет вид:

с начальными условиями

хо\а — ^о' -^0(0 — Ра-

(18)

Йт|Т + 1 - (-4|т+1 -4|Т+1К-

(19)

Фильтрационная оценка возмущения п;т:

^Т|Т+1 = ЯтН'т+\ Дт + 1(ЛТ + 1 - НТ+1ХТ + цт+1).

Соотношения (16)—(19) позволяют рекуррентно вычислять хт+i|t+i и Pt+i\t+i через хт\т и Рт\т при фиксированной на каждом шаге Т гипотезе, начиная с начального условия í0|o = а?о> -Fo|o = Ро-При каждом вычислении фильтрационных оценок Ít+i|t+i и Щ\т+1 гипотезы-претенденты и соответствующие им оценки управлений и состояний проверяются на оптимальность с точки зрения обеспечения максимума функции Гамильтона:

Нт — —-[зт+1 - Ht+i(ATXT\T + Втит\T+i + WT|T+I)]'-Rt+I[zT+I-

- Нт+1(Атхт\т + Втит|Г+1) + üT|T+i]- (21)

Выбирается та гипотеза, которая соответствует максимальному значению Нт-

Комбинаторный алгоритм фильтрации при наличии скользящего режима

Пусть щ - m-вектор управлений, подчиняющийся ограничениям (3), но о характере априорного распределения ничего не известно.

Максимизация по щ приводит к задаче линейного программирования:

m

+ (22)

где верхний индекс означает номер компоненты, А<|т - п-вектор, сопряженный (по Гамильтону) n-вектору xt+i\T. Тогда

=c«sign(5;At+i|T)(,) (¿ = 1». (23)

Сначала проверяем гипотезы о принадлежности управления границе интервала:

[2$. = (B'tXt+llrf > 0] и [и% = (B't\t+1{Tf < 0].

Если одна из них верна, то принимает соответствующее граничное значение. Если же обе гипотезы отвергнуты, тогда соответствует решение, при котором (B'tXt+i\Tf ^ = 0, то есть решение лежит на поверхности разрыва. Движение по поверхностям разрыва принято называть скользящим режимом.

При этом и1\т может быть представлена в виде (5).

Тогда функцию и уравнения поверхности разрыва можно представить так = Т):

&г\т = ~ Нт+1хт+цт+1} = 0. (24)

Комбинаторный алгоритм фильтрации определяется уравнениями: ^ ^

®т+1|т+1 = (Атхт\т + ВТ1Т ст)+

+ Рт+1\т+1Нт+111т1+1[гт+1 ~ Нт+1(Атхт1т + Вт^ст)], (25)

где'

Рт+1|т+1 — Рт+1\т+1 + (Е — Рт+цт+хН'т+хЩ-ХхНт+^ВтГ^ У.

X М^Г^В'Т{Е - Рт+цт+1 Хт+1^11Ят+1). (26)

Мт = Г^ В'тН'т+1К^1¥1[Кт+\—Ят+1Рт+1|т+1Яу+1]Ду^1)Ят+1БтГ^°\

(27)

-Рт+1|Г+1 = {(ЛТРТ|ТА^ + Ят)'1 + Н'т+1Кт\1Нт+1} (28)

£т|т+1 = 4±}ст + Г?)М?фВ'тН'т+11Ы1(Е-- Ят+гРт+1|Т+1Дг^) - ЯТ+1(АТ£Т|Т + Ят4±}ст]- (29)

ГЛАВА 2 СРАВНЕНИЕ ЭФФЕКТИВНОСТИ НЕЛИНЕЙНЫХ АЛГОРИТМОВ ФИЛЬТРАЦИИ ПО ЗНАКОВЫМ КРИТЕРИЯМ

Данная глава посвящена исследованию эффективности нелинейных алгоритмов фильтрации (в том числе рестриктивной). Оценка абсолютной и относительной (сравнительной) эффективности алгоритмов нелинейной фильтрации представляется достаточно сложной проблемой, поскольку аналитические оценки эффективности в этом случае удается построить крайне редко. Исследование алгоритмов методами статистических испытаний (Монте-Карло) связано с большими затратами времени и поэтому не всегда приемлемо. Кроме того, при неизвестных законах распределения возмущений в системе и каналах наблюдения проблема статистических испытаний становится вообще неопределенной.

В этих условиях остается использовать процедуры анализа эффективности по единичным (достаточно длинным) реализациям

фильтрационных оценок. В силу того, что ошибки фильтрации в общем случае не являются независимыми, требуется соответствующая модификация известных тестов проверки гипотез против односторонних альтернатив, уместных в данном случае, или разработка новых тестов.

Предлагается использовать для сравнения эффективности алгоритмов нелинейной фильтрации простые знаковые и ранговые тесты, не требующие знания закона распределения ошибок фильтрации.

Использованы свободные от распределения процедуры проверки гипотез о независимости выборочных значений (по критерию Кен-дэла); знаковые тесты с выдачей доверительного интервала для вероятности превышения нуля; процедуры критерия знаковых рангов Вилкоксона с обычной оценкой и оценкой Ходжеса-Лемана для медианы и выдачей для нее доверительного интервала, проверкой гипотезы о симметрии распределения относительно неизвестной медианы, симметризацией распределения, рандомизацией выборки бутстреп-методом и проверкой независимости выборочных значений бутстреп-выборки по критерию Кендэла. Формулировки непараметрических процедур соответствуют принятым в монографии Холлендера и Вулфа.

Приводятся примеры сравнения эффективности алгоритмов ре-стриктивной и загрубленной калмановской фильтрации. Минимаксный фильтр Калмана, обеспечивающий в этих условиях минимум максимальной ошибки фильтрации, рассматривает неизвестные управления щ как случайные белые возмущения с наихудшим возможным распределением, дающим максимальную дисперсию с2 (распределение сосредоточено на границах интервала возможных управлений с одинаковыми вероятностями).

Проведено численное моделирование (в скалярном случае) процесса х( при различных режимах управления и различных уровнях стохастического воздействия на процесс. Дисперсии Q и R изменялись в широких пределах ( от 10 до 10). Интервал моделирования Т = 100. Исследования показали, что комбинаторные рестриктив-ные алгоритмы заметно более точны при малых уровнях возмущений и незначительно уступают загрубленному калмановскому при больших возмущениях.

Разработано программное обеспечение, реализующее предложенные комбинаторные рестриктивные алгоритмы фильтрации и схему сравнения эффективности алгоритмов, включающее в себя 13 автономных модулей. Программы написаны на языке Turbo Pascal. Данное программное обеспечение также использовалось для комплекной обработки навигационной информации.

ГЛАВА 3 ИНТЕРВАЛЬНАЯ ФИЛЬТРАЦИЯ СОСТОЯНИЙ ЛИНЕЙНОЙ СТОХАСТИЧЕСКОЙ ДИНАМИЧЕСКОЙ СИСТЕМЫ

Рассматривается проблема фильтрации в дискретном времени состояний линейной стохастической динамической системы с интервальными матричными параметрами и неизвестными ограниченными управлениями по линейным наблюдениям с интервальной матрицей коэффициентов, то есть А, В - интервальные матричные параметры, II - интервальная матрица коэффициентов.

Известно, что при фиксированных значениях матриц А, В, Н и управлений щ алгоритм оптимальной (с минимальной дисперсией) фильтрации состояний системы выражается уравнениями фильтра Калмана. В случае интервальных матриц и управлений уравнения фильтра Калмана переходят в уравнения множественного включения, обобщающие на случай интервальных систем уравнения фильтрации в условиях неопределенности: векторы хх для всех £ = 0,1,2,... становятся элементами множеств Хи матрицы А, В, II - интервальные (т.е. множества), вместо и1 фигурирует множество (интервальный вектор) возможных значений ограниченных управлений.

В силу нелинейности преобразования интервальных матриц и векторов множества X, (/ = 1,2,...) в общем случае не будут выпуклыми, несмотря на выпуклость исходных множеств-интервалов, определяющих интервальные матрицы и векторы. Вследствие этого исследовать динамику множеств Xt и определять гарантированную точность фильтрации на каждом шаге дискретного времени довольно трудно.

Предлагается оценка сверху множеств Хг, основанная на пошаговом покрытии множеств Хг выпуклыми множествами, образованными расширением множеств Х± до их выпуклых оболочек и пошаговым отображением выпуклых оболочек с последующим пошаговым расширением результата до выпуклой оболочки.

На практике рассматривались одномерный и двухмерный случаи с различными данными: когда только матрица динамики или матрица передачи управления или матрица наблюдения является интервальной; когда матрица динамики и матрица наблюдения или матрица динамики и матрица передачи управления являются интервальными и т.д. Показано, что оценка состояния по фильтру Калмана для множественного включения является довольно хорошей и лежит между оценками идеального фильтра (если бы матрицы были известны точно) и фильтра Калмана для центральных значений интервальных матриц.

ГЛАВА 4 РЕСТРИКТИВНЫЕ АЛГОРИТМЫ КОМПЛЕКСНОЙ ОБРАБОТКИ НАВИГАЦИОННОЙ ИНФОРМАЦИИ

В данной главе построены и исследованы комбинаторные алгоритмы для комплексной обработки навигационной информации.

Стохастические модели, традиционно используемые при описании возмущений НК, представляются, однако, не вполне адекватными физической реальности, по крайней мере для некоторых из этих возмущений. Конечно, нет оснований отвергать стохастическую природу собственных, быстро изменяющихся, флуктуационных ошибок навигационных измерений. Однако медленно изменяющиеся процессы, приводящие к уходу осей гиростабилизированной ИНС, а тем более поля гравитационных аномалий и изменчивые течения рассматривать как чисто стохастические, да еще и гауссовские, весьма проблематично. В самом деле, гауссовские стохастические модели возмущений ИНС могут порождать теоретически как угодно большие значения возмущений. Однако на практике, в режиме нормального функционирования ИНС, ни низкочастотные ошибки акселерометров, ни низкочастотные же скорости собственных уходов осей ИНС не выходят за определенные, обычно довольно узкие пределы, то есть являются ограниченными величинами с неизвестными, строго говоря, распределениями. Это тем более справедливо в отношении неоднородностей гравитационного поля Земли, плавно изменяющихся от точки к точке, ограниченных по самой своей природе и, вообще говоря, неизвестно, как распределенных. Точно так же адекватность чисто стохастического описания изменчивых скоростей морских течений физической реальности представляется спорной.

Поэтому целесообразно расширить модель возмущений НК, допустив в ней наличие таких неопределенных возмущений, относительно которых нельзя сказать, какими статистическими характеристиками они обладают, а можно лишь утверждать, что они либо сами ограничены по модулю, либо ограничены по модулю их производные (приращения), а в остальном они произвольны (неопределенны).

Проведено численное моделирование морского навигационного комплекса (16-го порядка) с ИНС полуаналитического тина с двумя акселирометрами, корректируемого относительным лагом. При математическом моделировании функционирования комплекса предполагалось, что неизвестные наблюдателю изменчивые скорости течений подчиняются геометрическим ограничениям.

Показано, что в широком диапазоне условий рестриктивные комбинаторные алгоритмы фильтрации являются робастными и более точными (иногда в несколько раз) по сравнению с минимаксными фильтрами Калмана.

ЗАКЛЮЧЕНИЕ

Основные научные положения, выносимые на защиту, сводятся к следующему:

1. Получен точный комбинаторный алгоритм фильтрации ре-стриктивных рекуррентных процессов, когда неизвестные управления щ подчиняются усеченно-гауссовскому распределению.

2. Получен точный комбинаторный алгоритм фильтрации ре-стриктивных рекуррентных процессов, когда неизвестные управления щ принимают граничные значения.

3. Получен точный комбинаторный алгоритм фильтрации ре-стриктивных рекуррентных процессов, когда о характере априорного распределения управления ut ничего не известно.

4. Разработаны непараметрические методы и процедуры сравнения эффективности нелинейной (в том числе рестриктивной) фильтрации.

5. Проведено численное моделирование (в скалярном случае) комбинаторных алгоритмов при различных режимах управления и различных уровнях стохастического воздействия на процесс.

6. Построены и исследованы комбинаторные алгоритмы для комплексной обработки навигационной информации, показавшие их высокую эффективность.

7. Разработана общая схема построения фильтрационных оценок состояний линейных стохастических динамических процессов с интервальными параметрами и неизвестными управлениями на основе алгоритмов множественного включения с использованием комбинаторных методов. Проведено численное моделирование.

8. Разработано программное обеспечение, реализующее предложенные алгоритмы.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Поддубный В.В., Рожкова C.B. Сравнение эффективности нелинейных алгоритмов фильтрации по знаковым критериям. //Изв. ВУЗов. Физика. - 1995 - N9. - с.130-139.

2. Poddubny V.V., Roshkova S.V. Restrictive Algorithms for Complex Processing of the Navigation Information //The Scientific Conference on Use of Research Conversion Results in the Siberian Institutions of Higher Education for International Cooperation (SIBCONVERS'95). Abstracts. - Tomsk: Tomsk State Academy of Control Systems and Radioelectronics, 1995. - p.32.

3. Поддубный В.В., Рожкова C.B. Рестриктивные алгоритмы комплексной обработки навигационной информации. //Труды Международной конференции по использованию результатов конверсии

науки в вузах Сибири для международного сотрудничества (СИБКОНВЕРС'95). Томск. 4-6 октября 1995.

4. Поддубный В.В., Рожкова C.B. Интервальная фильтрация состояний линейной стохастической динамической системы. // Материалы III Международной научно-техническая конференции "Микропроцессорные системы автоматики". - Новосибирск: НГТУ. 1996.

- с. А22-А24.

5. Рожкова C.B. Рестриктивная фильтрация. // Тезисы докладов Международной конфренции студентов и аспирантов по фундаментальным наукам "Ломоносов -96" МГУ. Москва. 12-14 апреля 1996.

6. Поддубный В.В., Рожкова C.B. Комбинаторный метод точного решения двухточечных краевых задач оптимизации рестриктивных рекуррентных процессов. // Тезисы докладов Второго Сибирского Конгресса по Прикладной и Индустриальной Математике (INPRIM

- 96). Новосибирск. 1996. - с. 229.