автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Минимаксное оценивание и управление в дискретных динамических системах с неполной информацией

доктора физико-математических наук
Шориков, Андрей Федорович
город
Челябинск
год
1997
специальность ВАК РФ
05.13.18
Автореферат по информатике, вычислительной технике и управлению на тему «Минимаксное оценивание и управление в дискретных динамических системах с неполной информацией»

Автореферат диссертации по теме "Минимаксное оценивание и управление в дискретных динамических системах с неполной информацией"

| $ ¡.¡ь<1 Ь;;/

На правах рукописи

ШОРШСОВ Андрей Федорович

МИНИМАКСНОЕ ОЦЕНИВАНИЕ И УПРАВЛЕНИЕ В ДИСКРЕТНЫХ ДИНАМИЧЕСКИХ СИСТЕМАХ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ

05.13.18 - теоретические основы математического моделирования, численные- методы а комплексы программ

Автореферат диссертации'^ соискание ученой степени доктора физико - математических наук

Челябинск 1997

Работа выполнена в Уральском государственном экономическом университете.

Официальные оппоненты: до1?тор физико-математических вяувг, '

профессор В.И.Максимов; доктор физико-математических наук, профессор В.Ю.Тертычный; доктор технических наук, профессор ВЛЛНираев.

Ведущая организация - Уральский государственный университет им. АЖГорького.

Защита состоится «/£/» 1997 г. в «-¿У » час. на

заседании диссертационного совета Д 064.19.03 по защите диссертаций на соискание ученой степени доктора наук при Челябинском государственном университете по адресу: 454136, г. Челябинск, ул.Братьев Каширнных, 129.

С диссертацией можно ознакомиться в библиотеке Челябинского государственного университета.

Автореферат разослан

Ученый секретарь диссертационного совета

V г л

доктор физ.-мат. наук, профессор С . Г.А.Свиридюк.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Предмет исследования. Диссертационная работа связана с изучением и разработкой методов и алгоритмов моделирования задач гарантированного управления .и оценивания в нелинейных дискретных динамических системах при наличии неопределенности в форме неуправляемых параметров и сигналов, дающих неполную информацию о фазовых состояниях систем. Подход, положенный в диссертации с основу построения моделей таких задач управления и оценивания, базируется на принципе гарантированного результата. При таком подходе неконтролируемым параметрам системы и ошибкам измерения сигнала предписывается поведение, ухудшающее показатель качества процесса, в соответствии с которым формируются процедуры управления или оценивания. Моделирование получаемой неполной информации о фазовом состоянии конкретной системы осуществляется с помощью конструирования нового фазового пространства, имеющего более сложную структуру. Выбранный подход приводит к рассмотрению задач моделирования процессов управления и оценивания в нелинейных дискретных динамических системах с неполной информацией в рамках теории оптимального гарантированного управления и оценивания.

Актуальность темы. Математические задачи управления динамическими системами, изменение состояния которых описывается уравнениями различных типов, представляют собой хорошо развитую область исследований. Фундаментальные ее результаты получены в работах Л.С.Понтрягина, Н.Н.Красовского, В.Г.Б5лтянского, Р.В.Гам-крелидзе, Е.Ф.Мищенко, Р.Веллианя, Р.Калмана и др. Вместе с тем потребности практики и прежде всего задачи, возникающие в механике , физике, технике, экономике, биологии и т.д., привели к расширению круга.задач, рассматриваемых в рамках теории управляемых процессов. Так, в классических постановках задач этой теории изучались системы, в которых органам управления доступна полная информация об их текущих ; состояниях и данные системы не подвержены действию каких-либо возмущений. В то же время в реальных технических и других управляемых системах наиболее распространена ситуация, когда поступающая информация позволяет оценить только некоторую область возможных состояний системы, в которой имеются неконтролируемые параметры. Большое число работ

посвящено исследованию систем, где оценка состояний системы и учет неопределенных факторов основываются на знании их вероятностны;« характеристик. На практике же часто•возникают задачи управления механическими и другими объектами при наличии в математических моделях таких объектов возмущений и неопределенностей, информация о которых исчерпывается знанием ограничивающих их множеств и результатов измерений сигналов. При этом не исключено, что данные параметры могут реализоваться наихудшим для управляющей стороны.образом. Тогда естественным становится подход к оцениванию качества управления в таких системах, связанный с получением оптимального гарантированного (минимаксного) результата.

Становление '■ теории оптимального гарантированного управления относится к началу 60-х годов и связано с именами советских и зарубежных математиков Н.Н.Красовского, Л.С.Понтрягина, Р.Айзек-са, У.Флеминга. Крупный вклад в развитие этой теории внесли Э.Г.Альбрехт, В.Д.Батухтин, Р.Беллман, А.Брайсон, Р.В.Гамкрелид-зе, В.И.Жуковский, М.И.Зеликин, А.Ф.Клейменов, А.Н.Красовский,

A.Б.Кряжимский, А.Б.Куржанский, Дж.Лейтман,"П.-Л.Лионе, В.И.Максимов, А.А.Меликян, Е.Ф.Мищенко, М.С.Никольский, Г.ОльсДер, Ю.С.Осипов, .А.Г.Пашков, В.С.Пацко, Н.Н.Петров, Л.А.Петросян,-Г.К.Пожарицкий, Б.Н. Пшеничный, А.И.' Субботин, Н.Н.Субботина,

B.Е.Третьяков, В.Н. Ушаков, А. Фридман, Хо Ю-Ши, А.Г.Ченцов, Ф.Л.Черноусько, А.А.Чикрий, Р.Эллиотт и многие другие.

Данная работа относится к одному из разделов теории оптимальных процессов - задачам управления и оценивания (наблюдения) в динамических системах по результатам измерений в присутствии возмущений. Важным классом этого раздела являются задачи в дискретных (многошаговых) динамических системах, функционирующих в условиях неполной информации. Результаты, полученные при решении таких задач, могут использоваться как при моделировании реального. динамического процесса, так и при управлении конкретными механическими системами.

Для рассматриваемых в данной работе задач управления-наблюдения принята минимаксная постановка, восходящая к работам Н Н.Красовского 1,8 и получившая дальнейшее развитие в исследованиях А.Б.Куржанекого 3 и др. (см. 2,3 и библиографию к ним). В рамках этого подхода Н.Н.Красовским, А.Б.Куржанским и их учениками изучен широкий класс задач управления и оценивания в ус-

ловиях конфликта и неопределенности. Ряд принципиальных результатов в данной области теории управления и оценивания получен в работах Б.И.Ананьева, Д.Бертсекаса, Р.Габасова, М.И.Гусева, И.Я.Каца, Ф.М.Кирилловой, A.B. Кряжимского, М.С. Никольского, О. И. Никонова, B.C. Осипова, В. Г. Покотило, E.H. Пшеничного, А.И. Субботина, Т.Ф.Филипповой, Ф. Л.Черноусько, В.И.Ширяева, Ф.Швеппе (см. 2-4 и библиографию к ним).

В предлагаемой работе исследуются задачи минимаксного управления и оценивания в динамических системах, описываемых нелинейными дискретными уравнениями. При этом предполагается, что в задании правых частей уравнений, описывавших динамику конкретной системы, начальных условиях и в канале измерений присутствуют априори неопределенные параметры (в том числе и управляемые) , статистическое описание которых отсутствует и известны только ограничивающие их множества. Качество рассматриваемых в работа процессов оценивается различными функционалами (достаточно общими) , определенными на реализациях соответствующих информационных множеств 2,3(т.е. на множествах состояний системы, совместимых с имеющейся информацией). Формализация изучаемых задач и их решение основываются на общем подходе к исследованию проблем управления и оценивания в условиях неопределенности, который предло-

12 3

жен в работах Н.Н.Красовского ' , А.Б.Куржанского и развит в работах их учеников (см. 2-4 и библиографию к ним).

Следует отметить, что изучение вопросов управления и оценивания в дискретных динамических системах помимо их самостоятельного значения ,особенно важно вследствие использовании компьютеров для решения задач, формализуемых непрерывными математическими моделями. Так, при решении задач механики управляемого полета, конструировании адаптивных управляющих регуляторов и преобразующих информацию фильтров возникает необходимость перехода

1 Красовский H.H. К теории управляемости и наблюдаемости линейных динамических систем // Прикл. математика и механика. 1964. Т. 28, вып. 1. С. 3-14.

2 Красовский H.H. Теория управления движением. М.: Наука, 1968.

3 Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.

* Красовский H.H. , Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

от непрерывных систем к дискретным.

Цель работы состоит в изучении теоретических проблем матема-тичесжого моделирования задач минимаксного управления и оценивания для нелинейных дискретных динамических систем с неполной информацией, разработке общих схем и численных методоц их решения, а также -программного обеспечения, позволяющего моделировать их действие на компьютере.

Методы исследования. В основе разрабатываемых в диссертации методов лежат концепции теории оптимального гарантированного управления и оценивания в условиях неопределенности, используются понятия и результаты из теории игр, теории оптимального управления, функционального анализа, линейного и выпуклого математического программирования.

Научная новизна. Полученнные в диссертации результаты являются новыми. Среди них отметим следующие.

1. Изучена многошаговая задача апостериорного минимаксного оценивания для нелинейной дискретной динамической системы с разделенными движениями в условиях неполной информации и ограничения- на действие измерителя, формализация которой имеет вид апостериорного е-минимаксного фильтра. На основе введенного понятия информационно-сопряженной (И-сопря»енной) системы, которая представляет собой последовательность одношаговых операций, использующих всю доступную для наблюдателя информацию, исследована структура основных элементов данной задачи и предложены конструктивные методы построения информационного множества рассматриваемого процесса и на его базе - выходных параметров апостериорного с-минимаксного фильтра.

2. Исследована многошаговая задача программного минимаксного управления-наблюдения для нелинейной дискретной динамической системы с разделенными движениями и неполной информацией. Для ее решения предложена конструкция, основу которой составляет построение множества допустимых программных управлений наблюдателя, гарантирующих ему результат управления-наблюдения, не превышающий заданного значения критерия процесса.

3. В целях решения многошаговой задачи позиционного минимаксного управления в классе нелинейных дискретных динамических систем с разделенными движениями и неполной информацией .предложена конструкция построения с-оптимальной стратегии, сочетающая прямые и попятные * процедуры, основывающиеся на решениях вспомога-

тельных программных задач минимаксного управления.

4. Для достаточно общего класса дискретных динамических систем с неполной информацией предложен численный алгоритм моделирования решения задачи апостериорного минимаксного оценивания и разработано (совместно с В.А.Тюлюкиным) программное обеспечение для персонального компьютера, реализующее его действие.

5. Предложены конструктивные методы решения задач апостериорного минимаксного оценивания, программного и позиционного минимаксного управления по неполным данным для общего класса нелинейных дискретных динамических систем с неразделенными движениями .

Теоретическая и практическая ценность. Полученные в диссертации результаты развивают теорию задач оптимизации гарантированного оценивания и управления для нелинейных дискретных динамических систем с неполной информацией. Они могут служить основой вычислительных алгоритмов оценивания состояния и управления для дискретных динамических систем, функционирующих в условиях неопределенности. Предложенный численный алгоритм решения задачи апостериорного минимаксного оценивания для достаточно сбщей дискретной динамической системы с неполной информацией и соответствующее ему программное обеспечение могут быть использованы при проведении опытно-конструкторских работ по моделированию функционирования информационно-управляющих систем реальных механических объектов. Полученные в диссертационной работе результаты были -использованы при выполнении ряда прикладных работ по темам НИР Института математики и механики УрО РАН '- Военно-космической академии им. А.Ф.Можайского МО РФ, в/ч 30895 и отражены в 12 научно-технических отчетах и 5 публикациях за период с 1973 по 1987 гг.

Апробация работы. Результаты диссертационной работы докладывались на Всесоюзной конференции "Динамическое управление" (Свердловск, 1979), всесоссюзных конференциях по оптимальному управлению в механических системах .(Москва,1982; Казань, 1985; Львов, 1988), Всесоюзном семинаре "Эволюционное моделирование и обработка данных радиофизического эксперимента" (Москва, 1984), VI Всесгозном съезде по теоретической и прикладной механике (Ташкент, 1986), XII Уральской региональной конференции "Функционально-дифференциальные уравнения и их приложения" (Пермь, 1988), III Международном семинаре "Негладкие и разрывные задачи упраа-

ления и их приложения" (С.-Петербург, 1995). Результаты, составившие содержание диссертации, обсуждались на научных семинарах отделов динамических систем (руководитель семинара - чл.-корр РАН А.И.Субботин), оптимального управления (руководитель семинара - академик РАН А.Б.Куржанский) и управляемых систем (руководитель семинара - профессор А.Г.Ченцов) Института математики и механики УрО РАН, а также в Институте проблем управления РАН (руководитель Межведомственного совета по управлению движением кораблей и специальных подводных объектов-академик РАН И.В.Пран-гишвили), в Военно-космической академии им. А.Ф.Можайского МО РФ (руководитель семинара - профессор JI. А. Майборода) и в С.-Петербургском государственном университете (руководитель семинара -профессор Л. А. Пнтросян)..

Публикации. По теме диссертации опубликовано более 26 работ. Список основных публикаций приводится в конце автореферата, Результаты, вошедшие в диссертацию, получены автором. В совместных работах [17,18,22], содержание которых частично изложено в § 15, 16 (при описании общей схемы и численного алгоритма построения области достижимости наблюдаемого объекта)', автору принадлежат постановка задачи и основные идеи алгоритма. В совместной работе (11] автору принадлежат основные результаты работы и она идейно примыкает к содержанию главы III.

Структура и объем работы. Диссертация состоит из введения, пяти глав, разбитых на 20 параграфов, одного Приложения и библиографического списка, включающего 177 наименований. Общий объем диссертации составляет 241 стр. машинописного текста.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы исследования, дан краткий обзор научных направлений и результатов, относящихся к рассматриваемым в работе вопросам, изложены основные результаты диссертации, а также сообщены сведения о публикациях и апробации работы. - <■

Первая глава (§ 1-4) посвящена исследованию многошаговой задачи апостериорного минимаксного оценивания для нелинейной дискретной динамической системы с разделенными движениями в условиях неполной информации и ограничения на действие измерителя. Полученный и этой главе результаты основываются на работах 2-4.

В § 1 вводятся обозначения и определения, которые используются во всем тексте работы. Отметим среди них наиболее употребляемые : Д

=■ - равно по определению;

N - множество всех натуральных чисел ( Н = { 1,2,3,. . . , »-и 1); Ъ - множество всех целых чисел (г = _{ -<»,..., -3 ,-2 ,-1,0,1,2 . 3_____+« }) ;

для 16 Ъ, г (¿а ^171 ™ ( Ь: Ъе 1, и будем назы-

вать Т77 целочисленным промежутком;

й1- множество всех действительных чисел включая элементы (+ю) и (-и) ;

для пе N. п-мерное евклидово пространство, элементы которого будем представлять в виде векторов-столбцов, даже если из экономии места они записаны в строчку (предполагается, что Я;" содержит элементы, у которых хотя бн одна из координат принимает значение +« или -м, в частности, содержит элемент вида (■(-»,+», ...,+«) 4 х'п>);

-' I ' V----со '

п

для хе И", П х И - евклидова норма вектора х в Пп;

п

для пе Н,- ТТТ с 2 (з.3,)), символом Э (Т7У) будем обозначать

п

метрическое пространство функций целочисленного аргумента ч> ТТТ -» Пп, в котором метрика р задается соотношением

п

Р (»! (•).р (О) « тах_ II ® (Ъ) - р Ш 11п

п ^ I , .) "

((«>,(-),(Р,(-))б Б (ТТТ) х й (Г7о)),

12 п и

__ Г.

а символом сопр(3 (1,,})) - множество всех непустых компактных, в

п

смысле этой метрики, подмножеств пространства 3 (ТТТ);

п

' для пе N. целочисленных множеств А£ Ъ, В£ г (А р| В = г) и функций р (•)« 8 (А), р (')е Э (В)

1 п 2 л

Р (О о ю (•) - ( ¥>(•): р(Ое Э (лив),

12 г.

V Ье А, - ^Ш, V Ъб В, <р(Ь) » Ч>гШ).

и будем говорить, что р(-) = ?> С • ) о есть склейка функций

9 (•) и © (•) на множестве С = А II В; 1 2

В 5 2 определяются основные элементы, необходимые для формализации нелинейной многошаговой задачи апостериорного минимаксного оценивания в форме е-минимаксного фильтра и приводится ее постановка.

Пусть на заданном целочисленном промежутке времени О,Т = = 10,1,2,...,Т} (Т>0) рассматривается динамическая система, которая состоит из двух управляемых объектов. Динамика объекта I, управляемого наблюдателем, описывается дискретным рекуррентным уравнением вида

y(t+l) - fll>(t, y(t), u(t)), (1)

динамика объекта II, управляемого наблюдаемым, описывается уравнением

z'(t+l) - f(2)(t, z(t), v( t)). (2)

Здесь Ье О,T-l; уе Rr и ze R* - фазовые векторы объектов I и II соответственно (г, se N); u(t) и v(t) - векторы управляющих воздействий (управлений) наблюдателя и наблюдаемого соотбетственно, стесненные' зада'яными ограничениями

u(t)e Р , v(t)e Q ; (3)

Ps6 comp(Rp), Qts comp(R4) (p,q e N);

вектор-функции f(l): Ö.T-l x Rrx Rp-> Rr и f(2): ö,T-i x Rsx

* R4—-» R" для всех te 0,T-1 непрерывны по совокупности переменных (у, и) и (z, v) соответственно.

Процесс оценивания фазовых состояний объекта II осуществляется в следующих информационных условиях.

Предполагается, что для любого момента времени ге 1,Т измеряются и запоминаются: у(0)-у - начальное фазовое состояние объекта I; ц(•)°{u(t)] Q t - история реализации управления объектом I; и( • )=(u(t) ] (u(t)e Rm; me N; ы(0) = uö - фиксирован) - история реализации сигнала, значения которого <j(t) формируются в соответствии с нелинейным дискретным соотношением

i g(t, y(t), z(t), ?(t)), (y(t), z(t))e Г, l)(t) - \ (4)

i (y(t), z(t))« г,

где £(t) - ошибка измерения, удовлетворяющая заданному ограничению

?(t)e D^ D « comp(Rl) (1« H); (5)

вектор-функция g: 0,Т х Rrx' R*x R1 -> R° для всех te О,T не-

прерцйна по совокупности переменных (у, z, С); множество Г е е comp(Rr* R") и ограничивает действие измерителя; символом ы^-'будем обозначать факт отсутствия сигнала в момент времени t, т.е. полагая, например, u(t) .....+ю)'е Rm в случае,

когда нарушается ограничение на действие измерителя, а именно при (y(t), z(t))< Г,

В процессе оценивания известно также множество Z(0)-Z (7^ <= е comp(R*)) возможных начальных состояний объекта II, которое не противоречит начальному сигналу uq, и известны уравнения и ограничения (1) - (5). Пусть на фиксированном целочисленном промежутке времени О, # s О,Т (0<г>) (всюду далее будем называть его просто промежутком) реализовались управление и(■)=[и(Ь)} и сигнал ы(-)» {w(t) ] ■ Тогда цель процесса апостериорного

минимаксного оценивания (конструирования апостериорного минимаксного фильтра) на содержательном уровне можно сформулировать следующим образом. По информации, имеющейся к моменту времени i>, требуется определить наименьшую гарантированную (в минимаксном смысле) оценку фазовых векторов z(ot) объекта II, совместимых с данной информацией (здесь момент времени ае О,Т и фиксирован в рассматриваемом процессе ; близость векторов оценивается нормой в R*).

Строгая математическая постановка задачи апостериорного минимаксного оценивания, отвечающая поставленной цели, Судет дана ниже. В связи с этим введем ряд определений.

На основании ограничения (3) определим множество Р(х~3)е

е corap(S (х,tf-l)) допустимых программных управлений и(-) = р _

°(u(t) ] т 1>_1 на промежутке x.tfs 0,Т (г<Д) следующим соотношением:

-P(x~â) = (u( • ) : u( • )е S (х>-1), V te u(t)«= P }

p i

Аналогично По ограничениям (3), (5) определяются множества

Q(x,i>) e comp(S (x,ij-l)) и D(x с compCS (x+l,i5) ) допустимых ч i

программных управлений v(•) - {v(t)}g— и допустимых ошибок измерений £(•) - (Ç(t))t£r^i соответственно.

Обозначим fi(x,i»)c Sb(t+1 множество всех возможных в силу (1) - (5) реализаций ь>( ■ )-(o(t)) g сигнала (4) на промежут-

ке тТ^ (u(t)e R"). Назовем набор w(x) = {т. u(-), «о(-)Ь= Ü7T х х Р(т75) х П(х ,<») т-позицией процесса фильтрации в многоиаговой сис7еме (1) - (5), или просто r-позицией, полагая, что к(0)= = {О, у , Z* 1, где z'* а (Z*s Z ) есть множество состояний объ-

" О О О 0 0

екта II, совместимых с начальной информацией. Определим также множество W(x) = (хJ х Р(0,т) х ЙШТх) всех возможных х-лозиций (Й(0) »(ио: wo={0,yo,Zo)€ (О) х Rrx corap(R")}),

Далее, для фиксированных числа tf^Ctf; « s •■>) ^ (а: а > tf)] ^

промежутка г,<>S 07Т (r<i>), т-позиции w^(x)= {т, u,(-),

е W(i), управления u(•)е Р(т,0) и сигнала ы(-)е ¿KxTtf) вводится

множество R(DTi>7, w.(x), и( • ) ы( • ) пар (z , v( • )) e Z* х __(X * тг ^ о о

х Q(0,i>a) , совместимых с информацией, полученной на промежутке П715. На основании этого множества вводится также множество Z^"' (0,i»~, н. (т), u(-), - информационное множество 2,3

процесса апостериорной минимаксной фильтрации на промежутке т, отвечающее фиксированному моменту времени ае О,Т и набору (w.(t), u (.•) ,и( - ))е Й(т)хР(т,в)хП(г,1>), которое представляет собой множество возможных состояний z(a) объекта IX, не противоречащих имеющейся информации. Тогда определим следующее многошаговое отображение

F'°" : Й(т) х Р(т~5) х П(тТ») -> (в) х Rr х 2я",

_ . _

которое любому набору (w#(x), u(-), и(-))е W(x) х P(r,iS)x fi(x,t>) (n,(t)= (г, ut(') , «,(•))) ставит в соответствие набор элементов

Р^'Ч*)- (i», у("'(>»), z"4a)*)e U) к Rr х 2я', а именно:

,р<°>(#) = F(0" (w.(r), u(-), u(-)),

ГДе « , "

у ° (*>)*= уо, и( •)), и( •) - u.(-) D и( •);

z'"4<x)* - г^ЧоТйГ, w>(x), u(-), u(-))*. Здесь у^(О, \3, уо, u('))e Rr есть сечение в момент времени tf движения объекта I на промежутке 0,i>, порожденного парой (у ,и(-)). Далее, пусть

Е_: Н(т) х P(tTS) х fi(r~5) -> W(i>)

есть отображение, которое любому набору ( мф(т), и(-), ы(-))е е Й(т)х Р(т*Т5)х П(т,л) ставит в соответствие tf-позицию [й,

u(-), ы(-))е W(e), а именно

& Е_(w,(T), u(-), ыС•)).

- р

где n,(r) » [t, uf{'), и,!-))^ u(0 - u,(0 □ u( •), u( •) -

m

-=> w. ( • ) а и ( • ) .

Тогда, учитывая предыдущие определения, апостериорным е-мини-максным фильтром на промежутке т,0 для динамической системы (1) - (5), функционирующей на промежутке О,Т, будем .называть многошагозое отображение;

:т£ аир 1ги2С2>в , г*а.

Фи'с> : и(т) х рсгтаг; х п(хгг) —► йс») * н*х и1,

которое любому набору (и (т), и С•); ы(-))е №(т) х П(т,Л)

и-числу с > О ставит в соответствие набор -

З^'ЧтТЗ, и.(т). и(.), и(-)))е х Я'х Я1 по формуле " . .

♦ А ф"'с,(„.(-с), й(Л, о(.)>.

а г~5

Здесь »'*'(«) - Е (н (т), и(-), и(•)), вектор (г*^')* - чебы-тТЗ " т

бышевский е-центрэ информационного множества г<в)(а)^ * и (.для

2(,,(«)* - в: (г<с>)^ & . ..+,)'« Я*) , а число

1».(х), и(.),«<■)) 6 г">(г;(в,(<1)^) - значение величины

чебышевского радиуса 3 этого множества и эти элементы являются

выходными параметрами фильтра Ф("'с'. Напомним, что для любого

, . г75

множества Ъа И* число г (г) есть значение величины чебышевского радиуса множества 2, если оно определяется соотношением

г-и.

Ниже даются другие названия элементов и в^"' (т.д, «.(г),

и(•), и(•)), отвечающие минимаксное/ характеру этих оценок информационного множества 2<в'(а)* .

Вектор будем называть с-минимаксной (е-оптимальной

гарантированной) оценкой информационного множества ' СО, , *».(т). и(-)..«(•))* , а число «¿"(тТ*. »».(г), и(-), о(-)) - минимаксной (оптимальной гарантированной) погрешностью фильтра

ф</>.С)

Сформулируем следующую нелинейную многошаговую задачу апостериорного с-минимаксного оценивания (фильтрации).

Задача 2.1. Для любого фиксированного набора ( *гж(т), и(-), и(-))сИ(г) х Р(т,«>) х Й(т,1»), соответствующего многошаговому динамическому процессу (1) - (5), и известного в конце промежутка времени т,б£ О,Т (т<л) и числа с>О требуется определить выходные параметры апостериорного с-минимаксного фильтра Ф'а,с'а виде последовательности одношаго.вых операций. г

Отметим, что попытки построения фильтра ф'",с) только на ос-

нова определяющих его соотношений (путем, например, аппроксимации фигурирующих в них множеств и подбора совместимых с имеющейся в распоряжении наблюдателя информацией реализаций априори неопределенных параметров движения объекта II с помощью тотального варьирования переменных) приводят к нереализуемым в принципе объемам арифметических операций даже для простейших модельных задач.

Рекуррентная общая схема решения поставленной задачи 2.1 описывается в следующем параграфе данной работы.

В первой части § 3 вводится понятие информационно-сопряженной (И-сопряженной) системы, которая является основой для построения информационного множества рассматриваемого процесса Ьценивания. На основе И-сопряженной системы доказывается ряд вспомогательных утверждений, касающихся структуры информационных множеств. Во второй части этого параграфа предлагается общая схема решения сформулированной многошаговой задачи минимаксного оценивания, сводящаяся к решению последовательности только одношаговых оптимизационных задач.

Зафиксируем промежуток времени т,г> £ 0,Т- (т<й) . Областью достижимости управляемой системы (2), (3), соответствующей паре (г, 2(т))б О,Т-1 х 2й на момент времени в (йв ТТТ), аналогично а'4-будем газывать множество

гСт), Л) & Ыв); г(в)« Я*, V и Т+Г75,

/"г((;}-*са)(Ь-1, г(Ь-1), у(Ъ-1)), я(г)«2(т>,'уи-1)«0г).

Учитывая' это определение и предположения, которые сделанн относительно элементов системы (2), (3), отметим следующие свойства:

1) если г(х)е сотр(11"), то г(т), в)« сотр(й*>; >

2) г(г), г) - с^и-!. Ш-1), о,' где ги-1) &

& (х, 2(.х), Ъ-1). Ье т7Г~5. • Отсюда следует, что, многошаговая задача построения области достижимости в (т, г(г), 1») сводится К'решению рекуррентной после-дсвательности одношаговых задач''построения областей достижимости в^и-!, ги-х), t), гя т+г,<>.

• , Далее, для любых фиксированных состояния у(Ь)е Яг Не О, _ . • . «

наборов ги-1))« х 2й и а+1х 2В

Ссе.<о-1). сигнала ыСОе И" (Ъе 07?) и множества А<; й* определим в силу (2) - (5) следующие множества:

й (1+1, ги+1>, Ъ) ^ с2(Ъ> : а(Ъ)е Л" ,

3 У(Ъ)« <Э, 2(Ь+1)

■(2)

(Ь, г(0, V(ъ))е гс)1;

Н(у(0, о(О) £ Ы^: ги)с И",

- g(t, у(Ъ), z(t}, £(0), СШ«

КГ(у(г), А) ^ ЫО: гШе А, (у(0, г(О)« Г).

Тогда для фиксированных числа ав 0,Т, х-поэиции иф(х) (х,и>(-), «.(•))« И(т) (и(0)-{0, у , го)), реализаций управле-

ния и(•)- (и(1;)).

е Р(х,д) и сигнала <»>(•)- {«(■(;).)

с П(х,»)) (ы(0)->«о), учитывая предыдущие определения, сконструируем набор ¿¿"(»ЬС», у,в)(в). г<в'(а)^)е Ых 1Гх 2К по сле-следующим рекуррентным формулам:

га)-

(н>) к 1 (ш )

- У'" * С Ъ-1> . и(И-1)). Ье ГГо

(у<в>(0) « уо> й(-) » и,(-) о и(-)); .

IV 2о П Н(у0. «„)}■ П КГСУ0- V- ио *

V КгЧ> V- _ Л-т-О,^ ио _ {¿(г) 2и-1), о) пн(у(,'Ш, ы(ъ>) п

П кг(у("(ь). £((;>), Ье Т~5, * <УВ>

(¿(•) -«.(•) а м(О), &^(Ъ-1,21а-1) , Кг(у'в>и), Z(t)), te Т73. «(О-и

в (Ь-1, 2(Ъ-1), t), Ъе 1>+1, а (а>1>) ;

(6)

(7)

(ш)

2(Ъ), Ъв (аы»),

О (8)

в (Ъ+1, ¿(1+1),г) Л'гсъ), . . . ,а(а<*) .

Назовем построенную систему рекуррентных одношаговых соотношений (6)-(8) информационно-сопряженной (И-сопряженной) для ди~ намической системы (1) - (5).

С учетом предыдущих определений и условий, которые оговорены для системы (1)-(5), доказывается справедливость следующего утверждения.

Теорема 3.1. Для любой возможной в силу (1) - (5) реализации набора (и.(г), u(-), и(-))е Й(г) х РСхТ») * Й(тГЗ) (к„(г) - {т, и.СО, *».(■))), соответствующего промежутку t,i)s 0,Т (t<tf), многошаговое отображение F<n> конструируется с помощью И-сопряжен-

^

ной системы рекуррентных одношаговых соотношений (6) - (8), а именно:

?<•>;>»)-(.>. у'-Чл), Z 1в>(и)Ъ - Г(0° (w.(T), u(-).'•«(•)) -

. % - Со/у'-Чо), ¿""(ос)^) -При эг1ом информационное множество (ü,i»a, we(r), u(-),

<*>(•))£ - Zl'Ча)** e (Z* - Z(0)), и если для всех t« ТТ5: ü(t) # * u{tt> (u(■) - u.(-) о u(-)). ы ф u(B\ то оно является непустым

о * О ее

компактом пространства R*.

'• Дал«1в, пусть для любой возможной в силу (1) - (5) реализации набора (w.(т), ц(-), ы(-))е W(x) х х П(г7»), где пт(т) -

-1 {т, и.(-), и, С О) - т-позиция системы в момент т б U,t>-1 (x<tf» sT), ij-поэиция »'"'(ü) - (ö, u(-), u(O)« определяется с

помощью,соотношения ' ,

w<e,(tf) - Е (w,(r). U(-), U(-)).

T ,1? _ .

Для построенного в"соответствии с (6)-(8) множества Z (а)т* в, где йе Ü7T, определим вектор Я" и число а^" * (т ,

ц( •), w(•)) из решения следующей одношаговой минимаксной задачи:

inf . аир « z^'n + с А.

ze « Z («)x ze « Z

. , : Ä ¡«"(т^, и (t). u('), ц>\-)) С (OO). (9)

Тогда в работе доказывается следующее утверждение,

Теорема 3.2. Апостериорный е-минимаксный фильтр Фс*,с> для

хТЗ

многошаговой задачи 2.1 определяется рекуррентными одношаговими соотношениями (6) ~ (8),. решением задачи, задаваемой (9), и лю-

бой возможной в силу. (1) - (5) реализации набора (и.(г), и(-), <*>(■))• И(т) х Р(тТ5) х (и.(г) - (т, и„(0, ставит

в- соответствие набор ¡¡¡¿" ,с) (0) - {ис<"(Л), «¿"'(тТЗ,

и„(т), и(•),о(•)))е х И'х И1, а именно:

-•Ф(*'с,(*.(т). и(-). *(•)) - .

01 а

Причем имеем - и «¿''(тТ*. п,(т), и(-), и( •)) -

- *.(т), и( •); ы(-)).

Доказательство этого утверждения основывается на выводах из теоремы 3.1 и приведенных выше конструктивных построений.

Отметим, что на базе теорем 3.1, 3.2 можно разрабатывать конструктивные алгоритмы, моделирующие действие фильтра Ф("'С) на

промежутке времени г,д £ 0,Т (т<<»), т.е. решать многошаговую задачу 2.1 апостериорного с-минимаксного оценивания фазовых состояний гЫ) (асе 0,У) объекта II в момент а.

Из результатов этого параграфа видно, что решение задачи 2.1 основывается в большей степени на построенной здесь И-сопряжен-ной системе (6) - (8), формирующей ^последовательность наборов С г. ¿"Чо; г(,,)и)£)е ш X ЯГХ 2П , и ОТЗГ, путем обработки всей имеющейся в данном процессе информации. Это в йвога очередь позволит использовать И-сопряженную систему в качестве основного элемента для решения других задач минимаксного оценивания и управления по неполным Данным, рассмотренных в главах II и III.

В § 4 исследуется модельная многошаговая задача апостериорного минимаксного оценивания. Решение ее проводится по схеме, погорая предложена в § 3. Здесь же представлены результаты моделирования решения этой задачи на компьютере.

Вторая глава (§ 5-8) посвящена исследованию задач минимаксного программного 2-4 управления и оценивания (управления-наблюдения) в условиях неполной информации такл'ё для дискретной динамической системы .(1) - (5).

Отметим, что в данной главе исследуется класс многошаговых динамических систем, в которых резуз>ьтат наблюдения существенно зависит от выбора управления наблюдателя, и предлагается программно, по минимаксу, управлять этим процессом. Полученные результаты основываются на исследованиях г~*.

В § 5 приводится постановка нелинейной многошаговой задачи программного минимаксного управления-наблюдения для дискретной

динамической системы (1) - (5), описанной в § 2. Исследуются свойства всех основных элементов этой задачи и приводятся конструктивные схемы их формирования.

На заданном промежутке времени О.Т (Т>0) рассмотрим динамическую систему (1) - (5). Тогда для фиксированных промежутка х,i> с СГ.Т (х < в), заданного момента времени ае 0,í и х-позиции w.(t)-{-i, u.(-), u.(-))e W(x) (w.(0) - w*- {0,yq,Z*}) цель программного минимаксного управления-наблюдения для системы (1)-(5) на содержательном уровне можно сформулировать следующим образом.

Целью наблюдателя в рассматриваемом процессе управления-наблюдения; является, на основе имеющихся у него управляющих и информационных возможностей, организация программного' управления процероом оценивания и обработки имеющейся информации в системе

о

(1) - (5) таким образом, чтобы в конце промежутка т£ 0,Т имелась иозможность определения векторов z'e>(a)6 RB, которые бы наилучшим в минимаксном смысле образом оценивали вектор z(a)e б R*, реализовавшийся (если а * »> ) или способного реализоваться (е;ли а > ú ) в момент времени os О,Т (а - фиксирован). При этом программное управление должно быть организовано так, чтобы оптимизировать (минимизировать) гарантированный результат процесса оценивания, т.е. с расчетом на возможность реализации самых неблагоприятных для наблюдателя начального состояния объекта II, егс- управляющих воздействий и ошибок измерений сигнала.

Строгая постановка задачи, отвечающей поставленной цели управления-наблюдения в системе (1) - (5), будет сформулирована ниже. Для этого прежде дадим описание ряда необходимых понятий, которые формально определяются в диссертации.

Вводится множество П(г~5, w„(x), u(O) с Ó(t^) допустимых реализаций сигнала (4) на промежутке х,йс 0,Т, соответствующее т-позиции w.(x)-(x, u.('), u,(-)]e W(x) и программному управлению наблюдателя и( •)« Р(г,t>) а также следующее множество

/П(х7*, w„(x), w.íx), u(-))ru(-)e P(x73)).

Далее вводится множество Wir, w.(x), u(-))c W(tf) допустимых реализаций »-позиций, соответствующих х-позиции w^íx)« W(x) и фиксированному программному управлению наблюдателя u(-) е Р(гТЗ). Пусть '

VKx, w.(x), 4, P(xT5))-ÍVi(t:,*„(т) u(-)), и(-)е Р(х73)). Тогда на основании теоремы 3.2 для т-позиции w^fx)* W(0, w*, х,

u.(-)) и фиксированных ае 0, реализации управления наблюдателя u(-)e P(r,i>) и сигнала и(-)е П(т,й, ».(т), и(-)) на промежутке г,i> для любого с>0 апостериорный с-минимаксный фильтр

Ф<вС| на выходе формирует набор ф'' •с' (т>) - (и''Ч»), (z'c')*, х75 01 а т

в' (г w_(т),'и(>), ы( •))), а именно

д »

ф<в'е>(ч.(т). и(-), ы(-)) - ¿1в,сЧ»> - *'в,сЧо).

При этом в соответствии с теоремой 3.1 имеем

4„e,(F7а, и.(г), и(-), «(•)> - г"Чг"Ча)*) -

- r""(z'e,(CrTT-, к (г), и(-), и(0>?> ■

СС ОС * X

Для оценки качества управления-наблюдения на промежутке т з многошаговой системе (1)-(5) введем функционал 5: W(r)xP(r75)x хП(т,1>) -» Rl следующим соотношением:

i(w.( т), u(-), <j( •)) ^ ¡¿"ЧтТЗ, и.(г), u (*), <u(0) ^

А г'-Чг'-Ча)*), (10)

где ¿<'Ча)* - w.(r), u( ■ ), u(O)* . Пусть

c|"4i~5) - inf sup 5(и.(т), u(-). u(-)).

u(-)e P(rT5) u(-)e n(r~5, w.(x), u(•))

Тогда на основании изложенного определенную ранее цель программного минимаксного упраьления-наблюдения можно переформулировать в виде решения следующей задачи.

. Задача 5.1. Для фиксированного промежутка времени х ,1» с 0,f, т-позиции и.(тг) - {т, U.(-), и.(-))б W(0, w*, г, и.(-)) (и.(О) -- w* » [О, у , Z*)) и произвольного числа с > О требуется найти е-оптимальное программное управление наблюдателя и^*Ч • )eP(r ,i>) , которое удовлетворяет соотношению

sup 3(и#(т), и^'(-), <■>{■)) a cj"4rT9) + с, (11)

и(-.)б П(г75, w,(t),' u^e)(->> '5

где функционал 5 определен соотношением (10).

Число с|аЧт,1>) будем называть оптимальным гарантированным значением результата процесса программного минимаксного управления-наблюдения для динамической системы (1) - (5).

Отметим, что для фиксированных т-позиции w^(x)e W(x), управления uCO« Р(т,0) и сигнала u(-)« Й(хТЗ) значение функционала в вычисляется на основании теоремы 3.1 конструктивно, так как конструктивно строится информационное множество Z 1 (а)^ -'

w,(x), u(-), "(•))*..

В этом же параграфе предлагается конструктивная (в форме выполнения последовательности одношаговых операций) схема построения множества 0(r,tf, »» (т), и( ■ ) )с S (т+1,0) , которое'Позволя-* ®

ет конструктивно формировать другой важный элемент задачи 5.1 -множество n(r75t w.(x), u(-)) всех допустимых на промежутке г сигналов <а( • ) - {u(t)J^ • согласованных с т-позвцией w^(x)

и управлением наблюдателя и ( ■ ) . А именно, доказывается следующее вспомогательное утверждение. -

Лемла 5.2. Для фиксированного промежутка времени г,û s 0,Т (x<t>), х-позиции w#(x) - {х, ш,(-)} « W(0, w", х, P(ÜTT))

(w.(0) - w*- (0, y , Z*} ) и управления наблюдателя u(-)e P(x~3) множество сигналов ß(x,tf, w#(x), u(-)) с П(х75) конструируется с помощью одношаговых операций, а именно

П(хТЗ, w.(x), u(-)) - fi(x7tf, w.(t), u( • ) ). При этом, если и * и'*' и для всех se 1,х : ь>.(в) * ыСш), и для

О so * оо

всех t«i т+1 :

Kr(Ç("(t), G(t)) - G(t), где - yt(0~l, y0, u( • )) ; û(-) - u.(-) о u(-) и G(t) -

- Gt(t-l,G(t~l),t>\ G(x) - Z* - Z<# ' (x)g - Z^'CöTx, Tf*, u.(),

, то множество fl(x73, w,(x), u(-)) является непустым компактом пространства S (x+l,t>).

И

В § 6 формулируется , и решается вспомогательная многошаговая задача программного минимаксного управления с неполной информацией, которая является основой решения не только задача 5.1, но и многошаговой задачи позиционного минимаксного управления процессом оценивания (управленияткаОлюдения), исследуемой в главе. III данной работы.

Рассмотрим динамическую систему (1) -s (S), зафиксируем промежуток времени х"73 s OTT (х<«) и множество программных управлений наблюдателя U(x,a) с Р(х,$). Для любых х-погиции *<,(х) -(г, м.(-). w.(-)U W(0, и*, х, Р(07х)) (w.(0)- и*- (О, yQ, 2*],

2*-2(0)) и управления- и(-)е и(т,£) будем предполагать, что множество П(т79,>»е(т), и(-))« сотрСЭ (х+1,1>)) (это возможно, в частности, для задачи 5.1 в силу леммы 5.2). Тогда для функционала д(иш(т), и(•), и(О) с неотрицательными и ограниченными сверху значениями, который определен для г-позиций »»,(г)б г, Р(0,г)), управлений наблюдателя и(-) « и(т ,■») и сигналов П(х,1>, и.(т), и(-))« сотр(3- (г+1,1>)) предположим, что он полунепрерывен сверху по переменной •) на мномножестве П(т~5, и(->>. _

Пусть

с^'^СтТЗ) & 1п£ шах ц(и.(т), и(•),'и(■))■

и(•)« и(тТ^) ы(-)« 0(тТЗр и.(г), и(-)) Сформулируем следующую нелинейную многошаговую задачу программного с-минимаксного управления с неполной информацией.

Задача 6.1, Для динамической системы вида (1) - (5), фиксированного промежутка времени С 0,Т (т<1)), г-позиции >»#(г) -" [г, ижС •)", и„(•))« И(0, и*, г, Р(07?)), функционала д, оценивающего качество управления в этой системе, и произвольного числа с > О требуется найти е-оптимальноо программное управление наблюдателя и^в)(-)« и(т,й), которое удовлетворяет соотношению

шах Д(".(т), и^® ' ( • ), о(О) - с.

ы(.)« П(г7г, ».(г), и^'(О)

Число сбудем называть оптимальным гарантированным результатом для задачи 6.1.

Основным, элементом решения задачи 6.1 является построение в работе для любого заданного числа с« [0,+») такого множества Ь. (т,1»,и_.(т), с)с и(т,1>) управлений наблюдателя и (• )е и(т75),

3 .О

что если

^ (с: с« [0,+«.), ЦСгТЗ, с) * и}, (12)

то доказывается справедливость следующего утверждения.

Теореил 6.1. Для числа которое определено соотно-

шением (12), и произвольного числа с > 0 множество управлоний наблюдателя ^(тТЗ, к.(-с), + с)) « «, и только оно

является множеством е-оптимальных программных управлений для задачи 6.1, а оптимальный гарантированный результат

В § 7 предлагается общая схема решения задачи 5.1 программного минимаксного управления-наблюдения, которая сформулирован^ в § 5. Отметим, что решение этой задачи основывается на решении вспомогательной задачи 6.1 программного минимаксного управления с неполной информацией, рассмотренной в предыдущем параграфе, которая формулируется уже с функционалом S, определенным в силу (10), и на "утверждениях теорем 3.1, 3.2 и леммы 5.2, дающих в распоряжение инструмент конструктивного построения всех элементов задачи 5.1. Результаты этого параграфа используются в дальнейшем в главе III при решении задачи позиционного минимаксного управления-наблюдения.

На основании описанной в этом параграфе конструктивной схемы решения задачи 5.1 вводится также понятие программно-управляемого е-минимаксного фильтра для системы (1) - (5).

В § 8 рассматривается модельная одношаговая задача управления-наблюдения, решение которой проводится в соответствии с результатами данной главы.

В третьей главе (§ 9-12) для нелинейной многошаговой системы с неполной информацией (1) - (5) на основе результатов работ 2-4 формулируется и решается задача 9.1 позиционного 2-4 минимаксного управления процессом оценивания (управления-наблюдения), в которой критерием качества этого процесса является функционал 5, заданный соотношением (10) при т~5 - 0,Т (Т>0). Предлагаемое решение осноЕ!ывается на решении более общей задачи 9,2 позиционного минимаксного управления с неполной информацией. В свою очередь для решения этой задачи предлагается рекуррентная конструкция', сочетающая прямые и попятные процедуры, базирующиеся на решении вспомогательных программных задач'минимаксного управления типа задачи 6.1. Полученные результаты иллюстрируются на многошаговой модельной задаче управления процессом наблюдения. Отметим, что вопросам попятного построения множеств, на основе которых решаются задачи позиционного минимаксного управлениясв условиях полной информированности, посвящены работы 5~12..

s Айзеке Р. Дифференциальные игры. М.: Мир, 1967.

6 Беллман Р. Динамическое программирование. Ы.: Изд-во иностр. лит., 1960. , .

7 Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. М-: Наука, 1969.

Рассмотрим многошаговую динамическую систему (1) - (5), в которой наблюдатель распоряжается выбором управления u(t)s Р te 0,Т-1, на заданном промежутке времени О,Т (Т>0) и находится в условиях информированности, оговоренных в §2. Тогда на промежутке 0,Т наблюдателю требуется так организовать выбор управления u(-) - (u(t)l __(для всех te 0,Т-1, u(t) е Р ) объек-

teo.T-i 1 том I в позиционном режиме' и в этом же режиме - обработку возможных в силу (1) - (5) реализаций сигнала и(-) - fu(t)) _

teo, т

совместно со всей другой имеющейся информацией о процессе, чтобы наилучшим образом, в минимаксном смысле, оценить возможные реализации z(.a)e R* (а е 0,Т - фиксированный момент времени) фазового вектора объекта II.

. Используя результаты работ 2"4 и предыдущих глав данной работы, можно формализовать эту задачу следующим образом.

Назовем допустимой стратегией управления-наблюдения U наблюдателя отображение U â u(w(t)), t« О,T-l, ставящее в соответствие любой возможной реализации ^позицу.и w(t) - {t, u (•), wt(О}е W(t) ( w(0) - w* â {0, yo, Z^J 6 W(0)) множество U(w(t)) векторов u(t)e P . Множество всех допустимых стратегий управления-наблюдения обозначим символом .

Далее, сигналом, отвечающим уравнению измерителя (4), начальной позиции «о , допустимой стратегии U - U(w"(t)) e U ,

te G,T-l, w*(t) - {t,u*(-),u (•)) e W(t) и заданным z* e Z , » „ • „ „ . ° ° v (•) e Q(0,T) и Ç (•) e E(0,T), будем называть такую функцию

ы(-)« Ô(0,T), для которой существует управление и*(-)е Р(0,Т) со

свойствами:

8 Красовский H.H., Субботин А.И.,Ушаков В.Н. Минимаксная дифференциальная игра// Докл. АН СССР. 1971. Т.206, N2. С.277-280

9 Понтрягин Л.С. О линейных дифференциальных играх. I // Докл. АН СССР. 1967. Т.174, N 6. С. 1278-12SO.

10 Пшеничный Б.Н. Структура дифференциальных игр//Докл. АН СССР. 1969. Т.184, N 2. С. 285-287.

11 Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения// АН СССР. Техн. кибернетика. 1980. N 4. С. 29-36.

12 Федоренко Р.П. О задаче Коши в теории преследования // Журн вычисл. математики и мат. физики. 1969. Т.9, М5.С. Ю36-Ю45

1) V te 1 ,T, cj(t) удовлетворяет уравнению (4) при y*(t) -- У, «TT, уо, u*(-)), z*(t) - ztCrJTT, z*, v*(-)) и e*(t);

2) V te Ü7T=1, u"(t)e U(w*(t)), w*(t) - (t, u*(•), ut(-)l «

e W(0, w*. t, u*(-))c W(t), o t

где z t (0,' T , z*, v*(-))e R" есть сечение в момент времени t движения объекта II на промежутке О ,Т, порожденного" парой (z*,

v"(-))', v.*(0)-«*, u*(-) - lu*(x)] _ и ы (•) - 1ы(г>] _

xeo,t-i rei,t

(te T7T=T).

Обозначим множество таких сигналов О.(О,Т, и*, z , v (•), __i о о ф

£*(■), U) s ñ(ü7T). Тогда множество сигналов 0 (0,í, ио, U) £ s ñ(0,T). отвечающих начальной позиции и* и допустимой стратегии Ü6 Uj, определим соотношением

П^СГТ, U) - { ñj (OTT, w*. zo, v(-), U),

zoe z*. v(.)« Q(ö7T), £(■)« H(Ü7T)].

Пусть

с^ЧПТТ) 4 inf sup ä(w*, U , u(-)).

Ue Uj u(-)e CljinTT. w*,U)

Здесь для позиции и* - w"(0) - (О, у , Z*] е Н(0) , управления u<-)s P(ÖTT) и сигнала ы(-)е П(07Т, wQ, u(-)) значение функционала 6 : Й(О) х Р(0,Т) х ñ(0,T) -> R1 определяется соотношением (10) при т- 0,Т, а именно

а(и*, u(-), 'u(-)) - ä'e>(ö7T, и* u(-), u(-)) -

о et О

Ä r""(Z<e,(a)*). -

где Zte'(a)T ~ Z'"'(Ö,T , и*, u(•), u(-))T - информационное мно-о ос о£ о о г

жество процесса управления-наблюдения для динамической системы (1) - (5), которое на основании теоремы.3.1 конструктивно формируется с помощью одношаговых операций (6) - (8); Се 0,Т -фиксированный момент времени. . .

Сформулируем следующую нелинейную многошаговую задачу позиционного минимаксного управления-наблюдения для динамической системы (1) - (5).

Задача 9.1. Дана начальная позиция n*- [О, у Z*)e W(0) для процесса управления-наблюдения в дискретной динамической системе

(1) - (5) и произвольное число с > О. Требуется найти, с-оптима-льную стратегию управления-наблюдения ' - U^*'(w(t)) с , w(t) - (t,ut( ■),"(•)} a W(t), ta 0/Г-1 (w(0) - wq) наблюдателя, которая удовлетворяет соотношению

sup a(ir", u(-)) s c'*'(Cf7T) + e. (13)

u<■)« П (OTT, V, и'*')

IOC.

Здесь ut(-)- (u(t)} _. u(x)a U¿e)(w(T)); и (-)- (ы(т)} _

reo ,t-i Tel , t

(ta 1,T-l); u(-) - ы (•).

Число с'*'(О,Т), определенное соотношением (9.2), будем называть оптимальным гарантированным значением результата процесса позиционного минимаксного управления-наблюдения для динамической системы (1) - (5).

Далее, пусть задан следующий функционал:

д : 2я -» [-«, +»>,

*

для (Zj 2r ) A (Z * и): +«■ > д(Z) t О; д(и) <•' -а .

Тогда на промежутке О,Т на основе функционала д введем функционал и : W(0) х P(0,T) х ñ(0,Т) —+ R1, значения которого для начальной позиции и(0) - wQ е И(0), управления наблюдателя и(•)« Р(0,Т) и сигнала uíO* Й(0,Т) определяются соотношением

■ц(**, и(-). «(•)) Ä ¿(Z<e>(a)*).

где Z<e>C«)^ - Z^'íüTT^; w*. u(-). "(■))* и, как и в формуле (10), есть информационное множество процесса управления-наблюдения в динамической системе (1) - (5), которое формируется с помощью (6)-(8). Всюду далее в этой главе будем предполагать также, что для фиксированных позиции и*« W(0) и управления и(-)« а Р(0,Т) функционал д полунепрерывен сверху по переменной ь>( •) на множестве П(0,Т, и*. и( • _)> в случае, если CJ(Ö,T, w*, u(-))e a corap(S (1,Т)) (в силу леммы 5.2 такие ситуации возможны).

ж.

Аналогично задаче 9.1 сформулируем для динамической системы (1) - (5) уже с функционалом д следующую нелинейную многошаговую задачу позиционного минимаксного управления с неполной информацией .

Задача 9.2. Даны начальная позиция w(0)- "Ó"'0, уо* Zo'e для процесса управления с неполной информацией в динамической

системе (1) - (5) и произвольное число с > О. Требуется найти e-оптимальную стратегию управления-наблюдения Ö^"'- Ö^"'(w(t))e <= Uj, w(t)-[t/ut(-),ut(-)} с W(t), te OTTO (w(O)-w') наблюдателя, которая удовлетворяет соотношению

sup ц(и*. 0¿"\ ы(О) s с'в,(С7Г) + с . (14)

u(-)É CJjiöTT, w*. 0¿e))

Здесь u (•)- {u(x)l _, u(x)s Ü'"(w(x) и u>t(-)- (u(x)l _

tío,t-l : re i,i

(te 1,T-1), а число c^e'(O.T) - оптимальное гарантированное значение результата решения для данной задачи, определяемое формулой

-(«)(0-Т) „ inf sup и i u(.))

Ue UT u(-)s П (OTT. и*. U) i io

Таким обркзом, решение общей задачи 9.2 даст нам возможность найти решение и Солее частной задачи 9.1.

Следующие два параграфа этой главы посвящены описанию предлагаемой конструкции решения задач 9.1, 9.2 и доказательству справедливости используемых и получаемых при этом утверждений.

В § 10 описывается предлагаемое решение задачи 9.2 позиционного минимаксного управления с неполной информацией.

Зафиксируем начальную позицию w*« (О, у , Z*)e W(0) процесса управления-наблюдения, описываемого дискретной динамической системой (1) - (5), промежуток времени 0,Т и число С > 0. Для нахождения с-оптимальной стратегии üs, разрешающей сформулированную задачу 9.2, ниже предлагается рекуррентная конструкция, сочетающая прямые и попятные процедуры, основу которой составляют решения вспомогательных программных задач типа задачи 6 . 1 . ...

Рассмотрим нулевой шаг (вырожденный, используется только прямая процедура) предлагаемой конструкции, который отвечает промежутку управления-наблюдения О,Т. В связи с этим определим функционал <5(0> на промежутке 0,Т для начальной позиции н*= { 0,

• " д О

у . Z }, управлений наблюдателя u(0« и(ГГТ) а Р(ОТТ) и сигналов <о(-)е 0(0,Т, w*, и( •)) соотношением

f!(0>(w*. u(-), «<•)) S ц(и*. u(-), u(->).

Пусть число '(О.Т) есть оптимальный результат решения задачи 6,1 - программного минкмансного управления с неполной инфо-

рмацией для системы (.1) - (5) на промежутке 0,Т с функционалом Д(0) - д и начальной позицией w* . Тогда для c'E-'(D,T) « ^с|в'(О,Т) + с определим следующее непустое множество Т-позиций:

F(0, w*, Т. С1С)(07П) - (w(T): и(Т)-(Т, u(0, u(-))e

s W(0, vi*, T, Ü(ÜTT)), ß'0)(V0, uCO, u(-)) s

3 c<C,(ÜTT)).

Рассмотрим т-шаг предлагаемой конструкции,- отвечающий промежутку времени 0,Т-т+1, где те 1,7, и представляющий собой процесс, сочетающий на каждом шаге прямы? и попятные процедуры. В результате этого для всех te "1,Т-1 строятся непустые множества F(0, и*, t, clcl(ÜTI))c V)(0, w*. t, P(Ö7E)) t—позиций w(t) - [ t,, u( •), <j( •)) , где числа c(E'(OTE) - с'" (U7E)+ es c(EI(ÜTT). При этом для всех te 3,Т-2 справедливы неравенства

c(C4Cí7I) * с,е,(0Т2) s с1С,ССГ71) а с(Е)(ÖTi+Т) =. с<с>(Ü7T),

Для любой позиции w(t) - {t, u(-), <o(-)le F(0, w* , t, с<С1(П7Т)) (te 0,T-1, w(0)-w*) формируется также непустое множество управлений U^(vi(t))C Р такое, что для любых реализаций управления

u(t)s U (w(t)) и сигнала u(t+l)e П(Ъ, t+l",w(t), u(t)) для (t+1)-с - ~ ~ . р ~ — .

позиции w(t+l)-(t+l, u( •), u(O), где u(-) « ц(-) □ u(t), <j( •) -

ám -

u( •) □ u(t+l), справедливо следующее включение

w(t+l)e FÍO, w*, t+1, c<c,(0,t+l)).

Тогда, проделав вса построения предлагаемой конструкции, для

любого числа с>0 формируется набор множеств FCO,и*,t,с'Е'(О,t)),

te П7Г=Г (FÍO.w'.O.c'11? (Ö7Ö))= í w* ). где cIC)(U7ö). - любое дей-о о

ствительное число такое, что с (0,0) л с<Е|(О,1)). Отметим, что в § 11 доказывается непустота-построенных множеств F(0, wQ, t, c<c,(0,t)) для всех t« О,Т-1 и произвольного оО. Далее,-для te.О,Т-1 вводятся множества

FCO, и*.• t/c(t'C/,T,(ö7I)) s FCO, и* t, c'c'(ÜTt)),

'о 'О

F(0, w*, О, c""(ö~T)) Ä F(0, w*. 0, c<c>(ÖT0)) Ä („• }, t-0 о о о

и определяется стратегия управления-наблюдения '(w(t)

< üt, te 0,T-l (w(0) - уг*- {0, yQ, Z*) « Й(0)) наблюдателя следующим образом:

для T»(t)e F(0, w*, t, c""c'T'(ü7I))c il(t) пусть

Ü¿"(*(t)) й Üc/TCv»(t)), (15)

для всех остальных vr(t)c W(t) положим

u£*'(w(t)) ^ Pt. (16)

Из приведенных построений предлагаемой конструкции выводится справедливость следующего утверждения.

Теорема 10.1. Для заданных промежутка времени 0,Т', начальной позиции дискретной динамической системы (1) - (5) и* - (0, у , Z*)e W(0) и числа с>0 допустимая стратегия управления-наблюдения U^*'« Uг наблюдателя, которая определяется соотношениями (15) - (16), есть е-оптимальная стратегия для задачи 9.2 позиционного минимаксного управления с неполной информацией в системе (1) - (5), т.е. и'в,-и'в)и удовлетворяет <14), а значение опти-

* ( I ___

мального гарантированного результата для этой задачи с(0,Т) « - cj*'(DTT).

В § 11 приводится доказательство теоремы 10.1 о решении задачи 9.2, сформулированной в предыдущем параграфе, и на основе решения задач типа задач 9.2, 5.1 и 6.1 предлагается общая схема решения задачи 9.1 в форме нелинейного позиционного минимаксного фильтра.

В § 12 анализируется пример многошагового минимаксного управления процессом наблюдения, который иллюстрирует предложенную конструкцию решения позиционной задачи 9 1.

• В четвертой главе (§ 13 - 17) рассматривается задача апостериорной обработки данных измерений в дискретной динамической системе, состоящей из двух управляемых объектов. Исследуемая система принадлежит классу систем, которые анализируются в главе I настоящей работы, и представляет собой следующее.

На заданном целочисленном промежутке бремени 0,Т^[0,1,•••,Т) (Т > О) рассмотрим многошаговую динамическую систему, которая складывается из двух управляемых объектов - объекта I (объекта, с которого ведется наблюдение) и объекта II (объекта, .за которым ведется наблюдение). Движение объекта I описывается секретным рекуррентным уравнением вида

y(t+l) - f(t, y(t),u(t))„ (17)

движение объекта II - дискретным рекуррентным уравнением

z(t+l) - A(t)z(t) f B(t)v(t). (lb)

Здесь te 0,T-1 ; ye Rr' и ze R*- фазовые векторы объектов I и II соответственно (r,se N); u(t)« Rp и v(t)e R4 - векторы управ-

лений объектами I и II соответственно, стесненные ограничениями

и(Ь) е Р е пр, с <2 с Я4 (р, qe Л); (19)

для каждого Ье О,Т-1 вектор-функция £: О,Т-1 х Нгх -> Нг

непрерывна по совокупности переменных (у, и); А(Ь) и В(Ь) - известные действительные матрицы размера .(эха) и (н х ц) соответственно; предполагается также, что для всех te О,Т любой допустимый с учетом (18), (19) вектор г(1;)б Я11 удовлетворяет заданному ограничению

й(Ъ)е г*с и"; ■ , (20)

множества Р , (3 и Ъ есть выпуклые, замкнутые и ограниченные многогранники (с конечным числом вершин) пространств И13, И4 и В° соответственно.

Опишем информационные возможности в процессе фильтрации (оценивания состояний объекта II при наблюдении за ним с объекта I) .

Предполагается, что в процессе фильтрации для любого 1,Т, целочисленного промежутка 073 С 0,Т к моменту измеряются (и не обязательно запоминаются): у(0) - у - начальное фазовое состояние объекта I ; и(-) - и(Ъ)) - реализация управле-

ния объектом I на промежутке 0,д; ы( • ) {о>(Ъ)} —г (и(1;)б йт ; шб II, тзз ) - реализация сигнала на промежутке 0,1), значения которого и(0 (ь>(0) - и> ~ фиксирован) для ^ Оформируются з соответствии с линейным по дискретным соотношением

о(Ъ) - С(у(Ь))г(Ь) + 0(<:)е(Ь),' (21)

где £(1;)б й1- ошибка измерения, удовлетворяющая ограничению

?и)е ^с И1 (1е Ю; (22)

для любого t6 0,'Г и вектора у(1;)« йг C(y(t)) и 0(О - действительные матрицы размера (тхв) и (шх!) соответственно, причем С(у(Ъ)) для всех у(1;)е Яг имеет ранг, равный числу ш - размерности вектора и(Ь); 3] - выпуклый, замкнутый и ограниченный многогранник (с конечным числом вершин) пространства И1. В процесс« фильтрации известен также выпуклый, замкнутый и ограниченный многогранник (с конечным числом вершин) 7(0) - £ 2 с И* возможных начальных состояний объекта II, который не противоречит начальному сигналу ио, и известны уравнения и ограничения (17) - (22).

Пусть на^промежутке 0 с Ц7Т реализовались управление • )■-

- {иСЪ)} —5— и сигнал ы( ■ ) (ы(Ъ)1 —г . Тогда цельГ про-и€0,и-1 , и

цесса апостериорной минимаксной фильтрации для системы (17) -(22) (на содержательном уровне) можно сформулировать следующим оОразом. По информации, имеющейся к моменту i5, требуется определить наименьшую гарантированную (в минимаксном смысле) оценку фазовых векторов z(iS) объекта II, совместимых с данной информацией .

При сделанных предположениях относительно элементов дискретной динамической системы (17) - (22) и в соответствии с результатами главы I данной работы формулируется задача 13.1 апостериорного минимаксного оценивания фазовых состояний наблюдаемого объекта в форме нелинейного фильтра, аналогичного описанному в главе I. Для ее решения на основе работ г~*•13-16 предлагается численный рекуррентный алгоритм, который исходную многошаговую задачу сводит к решению последовательности одношаговых оптимизационных задач линейного и выпуклого математического программирования. Дей-

г-

ствие этого алгоритма реализовано в виде комплекса стандартных программ для персонального компьютера IBM PC/AT на алгоритмическим языке Pascal (его описание представлено в Приложении) и проиллюстрировано на модельном примере. Отметим, что ограничениями на размерность рассматриваемой динамической системы и число ша-fob процесса оценивания для предлагаемого алгоритма являются только ограничения на ресурсы памяти и быстродействие компьютера. При этом результаты данной главы позволяют утверждать, что позиционное управление процессом минимаксного оценивания для исследуемой системы может быть реализовано с помощью конструкции, которая описана в главе III.

Данная глава состоит из двух частей. В первой части рассмат-

13 Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. М.: Мир, 1982.

14 Лотов A.B. Численный метод построения множеств достижимости для линейных управляемых систем с фазовыми ограничениями // Иурн. ъычисл. математики и мат. физики, 1975. Т..15, NI C. 67-79

15 Черникоа С,Н. Линейные неравенства. М.: Наука, 1968.

16 Черникова Н.В. Алгоритм для нахождения общей формулы неотрицательных решений системы линейных уравнений // Иурн. вычисл. математики и мат. физики. 1964. Т.4, N 4: С, 733-738.

риваются постановка задачи 13.1 апостериорного минимакс юго оценивания состояний для исследуемой динамической сист<мы (17) -(22) (§ 13), общая схема апостериорного минимаксного .щенивания (§14) и общая схема алгоритма решения поставленной задачи (§15) Во второй части описывается предлагаемый численный алгоритм моделирования решения задачи 13.1 апостериорного миниминимаксного оценивания (§ 16) и приводится модельный пример (§ 17), иллюстрирующий действие этого алгоритма.

В пятой главе (§ 18 - 20) на основе работ 2-4 и результатов глав I - III данной диссертации формулируются и рошаются задачи апостериорного минимаксного оценивания состояний системы, программного и позиционного минимаксного управления с неполной информацией для нелинейной дискретной динамической системы общего .вида. Исследуемая система представляет собой следующее.

Пусть на заданном целочисленном промежутке времени 0,Т = ^(0,1,2,. ., Т) (Т>0) рассматривается многошаговый управляемый объект, динамика которого описывается дискретным рекуррентным векторным уравнением вида

x(t+l) - f(t, x(t), u(t),v(t)), (23)

где te О,T-l; xe Rn - фазовый вектор объекта (ne N); u(t) - вектор управляющего воздействия (управления); v(t) - вектор априори неопределенной помехи (погрешности моделирования), стесненные заданными ограничениями

u.(t)e Р , v(t)e Qt , (24)

Pt6 comp(Rp), QjS comp(R4) (p,q e N);

вектор-функция f : O.T-l x Rnx Rpx R4-> R" для всех te O.T-l

непрерывна по совокупности переменных (х, u, v).

Опишем информационные условия, в которых рассматривается процесс оценивания (наблюдения).

Предполагается, что для любого момента времени тс 1,Т измеряются и запоминаются: х(0)-х - начальное фазовое состояние объекта; и(•)-(u(t)) — х - история реализации управления; s(■)=

~{s(t)(s(t)e Rm; me N; s(0) - sq - фиксирован) - история реализации сигнала, значения которого s(t) формируются в соответствии с нелинейным дискретным соотношением (уравнением измерений) вида

' h(t, x(t), C(t)), x(t)e Г, s(t) - • ' (25)

• s<n! x(t)i Г.

03

Здесь £(t) - ошибка измерения, удовлетворяющая заданному ограничению

C(t)€ Dt, De comp(R') (le H); (26)

вектор-функция h: 0, T x R" x R1-> R1" для всех te OTT непрерывна rio совокупности переменных (x, £); множество Ге comp(Rn) и ограничивает действие измерителя; символом stn,'= (+и,4чр, . . . ,+ю)е

m

eRm будем обозначать факт отсутствия сигнала в момент времени t, т.е. полагая s(t) = s^™' в случае, когда нарушается ограничение на действие измерителя, а именно при x(t)* Г.

В процессе оценивания известно также множество Х(0) = X (X е е corap(Rn)) .возможных начальных состояний объекта, которое не противоречит начальному сигналу sq, и известны уравнения и ограничения (23) - (26).

В § 18 формулируется и решается задача апостериорного минимаксного оценивания для нелинейной дискретной динамической системы с неполной информацией вида (23) - (26). Оценочный функционал определяется на информационных множествах системы, для построения которых предлагается процедура в форме реализации последовательности рекуррентных одношаговых операций, основывающихся на введенной И-сопряженной системе, которая является естестственным обобщением аналогичного понятия из главы I. Изучается структура основных элементов рассматриваемой задачи и приводятся соответствующие утверждения.

В § 19 рассматривается задача программного минимаксного управления с неполной информацией для дискретной динамической системы из § 18. Для ее решения предлагается общая схема, которая является аналогом схемы, описанной в главе II данной работы. Формулируются утверждения, которые обобщают результаты, полученные в главе III данной работы.

В § 20 формулируется и решается задача позиционного минимаксного управления с неполной информацией также для системы из §18. Для решения этой задачи предлагается рекуррентная конструкция, сочетающая прямые и попятные процедуры и идейно базирующаяся на результатах главы III. В отличие от конструкции, описанной в главе III, эта конструкция использует не только решения вспомо-

гательных задач программного минимаксного управления, но и технологию решения этих задач в соответствии с результатами §18,19. Формулируются утверждения, которые являются аналогам!' утверждений, приведенных в главе III, но уже для более широкого класса дискретных динамических систем.

В Приложении дается описание разработанного совместно с В.А.Тюлюкиным комплекса программных средств, моделирующих алгоритмы решения задач из главы IV, на языке программирования Pascal для персонального компьютера типа IBM PC/AT. Этот комплекс имеет модульную структуру, и для каждого модуля приведены описания входных и выходных параметров и ограничения на области их изменения. Приводятся также листинги программ.

ЗАКЛЮЧЕНИЕ

Таким образом, в диссертационной работе предложена формализация достаточно общих классов задач минимаксного управления и оценивания в нелинейных дискретных динамических системах с неполной информацией. Разработаны конструктивные методы построения информационных множеств для задач апостериорного минимаксного оценивания. Предложены методы решения задач программного минимаксного управления-наблюдения. Для решения задачи позиционного минимаксного управления по неполным данным предложена конструкция, позволяющая формировать е-оптимальную стратегию. Разработано программное обеспечение, предоставляющее возможность моделировать на персональном компьютере действие предложенного численного алгоритма решения задачи апостериорного минимаксного оценивания для конкретного класса дискретных динамических систем.

В рамках разработанных в диссертации методов получены следующие основные результаты.

1. Изучена многошаговая задача апостериорного минимаксного оценивания для нелинейной дискретной динамической системы с разделенными движениями в условиях неполной информации и ограничения на действие измерителя, формализация которой имеет вид апостериорного е-минимаксного фильтра. На основе введенного понятия И-сопряженной системы, которая представляет собой последовательность одношаговых "операций, использующих всю доступную для наблюдателе информацию, исследована структура основных эле£йнтов

данной задачи и предложены конструктивные методы построения информационного множества рассматриваемого процесса и на его базе - выходных параметров апостериорного с-минимаксного фильтра.

2. Исследована многошаговая задача программного минимаксного управления-наблюдения для нелинейной дискретной динамической системы с разделенными движениями и неполной информацией. Для ее решения разработана общая схема, основу которой составляет построение множества допустимых прграммных управлений наблюдателя, гарантирующих ему результат управления-наблюдения, не превышающий заданного значения критерия процесса.

3. В целях решения многошаговой задачи позиционного минимаксного управления в классе нелинейных дискретных динамических систем с разделенными движениями и неполной информацией предложена конструкция построения с-оптимальной стратегии, сочетающая прямые и попятные процедуры, основывающиеся на решениях вспомога-

г-

тельных программных задач минимаксного управления.

4. Для достаточно общего класса дискретных динамических сис-' тем Г"С неполной информацией предложен численный алгоритм моделирования решения задачи апостериорного минимаксного оценивания .и разработано (совместно с В.А.Тюлхжиным) программное обеспечение для персонального компьютера, реализующее его действие.

5. Предложены конструктивные методы решения задач апостериорного минимаксного оценивания, программного'и позиционного минимаксного управления по неполным данным для общего класса нелинейных дискретных динамических систем с неразделенными движениями .

ПУБЛИКАЦИИ ОСНОВНЫХ РЕЗУЛЬТАТОВ

1. Шориков А.Ф. Одна нелинейная задача наблюдения // Задачи управления с неполной информацией. Свердловск, 1976. С. 129-138

2. Шориков А.Ф. Об одной нелинейной задаче управления-наблюдения // Таз. докл. Всесоюз. конф. "Динамическое управление". Свердловск, 1979. С. 295-296.

3. Шориков А.Ф. Об одном классе нелинейных многошаговых задач управления-наблюдения. I // Изв. АН СССР. Техн. кибернетика. 1982. N 4. С. 19-25.

А. Шориков А.Ф. Об одном классе нелинейных многошаговых задач

управления-наблюдения. XI // Изв. АН СССР. Техн кибернетика. 1983. N 3. С. 11-16.

5. Шориков А.Ф. Нелинейная многошаговая задача управления-наблюдения при наличии фазового ограничения // Управление и оценивание в динамических системах. Свердловск, 1982. С. 113-126.

6. Шориков А.Ф. 00 одной нелинейной многошаговой задаче управления-наблюдения // Оценивание в условиях неопределенности. Свердловск, 1982. С. 106-124.

7. Шориков А.Ф. Об одной попятной процедуре решения минимаксной задачи управления с неполной информацией // 'Тез. докл. IV Всесоюз. конф. по оптимальному управлению в механических системах. М., 1982. С. 198-199.

8. Шориков А.Ф. Минимаксная оптимизация в нелинейной многошаговой системе с неполной информацией // Некоторые вопросы оптимизации разрывных функций. Свердловск, 1984. С. 109-132.

9. Шориков А.Ф. Минимаксный адаптивный алгоритм обработки радиотехнических сигналов в дискретных управляемых системах // Тез. докл. Всесоюз. семинара "Эволюционное моделирование и обработка данных радиофизического эксперимента".. М., 1984, С. 42-43.

10. Шориков А.Ф. Двухуровневое минимаксное управление в нелинейной многошаговой системе // Тез. докл. V Всесоюз. конф. по оптимальному управлению в механических системах. Казань, 1985, С. 62.

11. Батухтин В.Д., Шориков А.Ф. Минимаксное управление процессом идентификации в нелинейных многошаговых системах // Тез. докл. VI Всесоюз. съезда по теор. и прикл. механике. Ташкент, 1986. С. 83.

12. Шориков А.Ф. Минимаксный адаптивный алгоритм коррекции управления -процессом наблюдения в одной многошаговой системе // Методы негладкой оптимизации и задачи управления. Свердловск, 1986. С. 135-148.

13. Шориков А.Ф. Минимаксное позиционное управление процессом идентификации в нелинейных многошаговых системах // Автоматика и телемеханика. 1987. N 2. С.74-88.

14. Шориков А.Ф. Минимаксное программное управление процессом идентификации в нелинейных многошаговых системах(// Кибернетика. 1988. N 3. С. 71-74.

15. Шорикй'Ь А.Ф. Апостериорный минимаксный фильтр для не^иней-

ных многошаговых систем с запаздыванием // Негладкие задачи оптимизации и управление. Свердловск, 1988. С. 94-98.

16. иориков А.Ф. Адаптивный минимаксный фильтр для дискретных многойаговых систем с запаздыванием // Тез. докл. VI Всесоюз. конф. по оптимальному управлению в механических системах. Львов, 1988. С. 164.

17. Тюлюкин В.А., Шориков А.Ф. Об одном алгоритме построения области, достижимости линейной управляемой системы // Негладкие задачи оптимизации и управление. Свердловск, 1988. С. 55-61.

18. Тюлюкин В.А., Шориков А.Ф. Об одном алгоритме построения области достижимости линейной многошаговой системы // Тез. докл. III Урал, регион, конф. "Функционально-дифференциальные уравнения и их приложения". Пермь, 1988. С. 203.

19. Шориков А.Ф. Минимаксные фильтры для нелинейных дискретных систем // Кибернетика. 1990. N 4. С. 97-103.

20. Шориков А.Ф. Минимаксная идентификация для нелинейных многошаговых систем с неполной информацией // Задачи управления и некоторые вопросы негладкой оптимизации. Свердловск, 1990. С. 90-97.

21. Шориков А.Ф. Минимаксные фильтры для оценивания состояний нелинейных дискретных систем // Автоматика и телемеханика. 1991. N 4. С. 112-122.

22. Тюлюкин В.А., Шориков А.Ф. Алгоритм решения задачи терминального управления для линейной дискретной системы // Автоматика и телемеханика. 1993. N 4. С. 115-127.

23. Шориков А.Ф. Алгоритм решения задачи апостериорного минимаксного оценивания состояний многошаговых динамических систем// Тез. докл. III'Междунар. семинара "Негладкие и разрывные задачи управления, оптимизации и их приложения ". С.-Петербург, 1995. С 127-130.

24. Шориков А.Ф. Алгоритм решения задачи апостериорного минимаксного оценивания состояний дискретных динамических систем.

I // Автоматика и телемеханика. 1996. N 7. С. .130-143.

25. .Шориков А.Ф. Алгоритм решения задачи апостериорного.минимаксного оценивания состояний дискретных динамических систем.

II // Автоматика .и телемеханика. 1996. N 9. С. 139-150.

26. Шориков А.Ф. Апостериорный фильтр для минимаксного оценивания состояний , .управляемого объекта по измерениям пеленга и