автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Адаптивное робастное управление в l1 постановке

доктора физико-математических наук
Соколов, Виктор Федорович
город
Сыктывкар
год
1998
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Адаптивное робастное управление в l1 постановке»

Оглавление автор диссертации — доктора физико-математических наук Соколов, Виктор Федорович

Список иллюстраций

Введение

Робастное управление.

Адаптивное управление.

1 Робастиость систем со структурированной неопределенностью в 1\ постановке

1.1 Системы со структурированной неопределенностью

1.1.1 Основные обозначения и определения.

1.1.2 Системы со структурированной неопределенностью

1.2 Робастная устойчивость.

1.2.1 Скалярные параметрические возмущения.

1.2.2 Параметрические возмущения произвольной размерности

1.2.3 Нелинейные параметрические возмущения.

1.3 Равномерный показатель качества.

1.3.1 Достижение робастного качества.

1.3.2 Равномерный показатель качества

1.3.3 Необходимость рассмотрения асимптотического показателя качества.

1.4 Параметрические возмущения с конечной памятью.

1.4.1 Робастная устойчивость и асимптотический показатель качества: скалярный случай.

1.4.2 Робастная устойчивость: многомерный случай

1.4.3 Достижение робастного качества: многомерный случай

1.4.4 Асимптотические показатели качества в задаче регулирования: многомерный случай.

1.4.5 Неверифицируемость модели параметрических возмущений с конечной памятью.

1.5 Параметрические возмущения с ограниченной памятью

1.5.1 Определение возмущений с ограниченной памятью и верифицируемость

1.5.2 Робастная устойчивость. Эквивалентность для FIR-операторов.

1.5.3 Асимптотический показатель качества при фиксированной входной последовательности w.

1.5.4 Асимптотический показатель качества в классе аддитивных возмущений

1.6 Параметрические возмущение с затухающей памятью и с экспоненциально убывающими импульсными характеристиками

1.6.1 Определения классов и верифицируемость.

1.6.2 Оценка асимптотического показателя качества

1.7 Задача слежения.

1.7.1 Системы с возмущениями с конечной памятью

1.7.2 Системы с возмущениями из других классов

1.7.3 Асимптотический показатель качества в задаче слежения

Синтез ¡i субоптимальных робастных регуляторов для SISO объектов

2.1 Робастное качество SISO объекта управления со структурированной и неструктурированной неопределенностью

2.1.1 Описание SISO объекта со структурированной и неструктурированной неопределенностью.

2.1.2 Асимптотическое качество в задаче регулирования

2.1.3 Асимптотическое качество в задаче слежения

2.2 Задачи синтеза оптимальных регуляторов.

2.2.1 Задача синтеза 1\ оптимального регулятора.

2.2.2 Синтез 1\ субоптимального регулятора методом Q-масштабирования.

2.2.3 Задачи синтеза оптимальных робастных регуляторов

2.3 1\ субоптимальный робастный регулятор для SISO объекта со структурированной неопределенностью.

2.3.1 Переформулировка задачи и геометрическая интерпретация

2.3.2 Синтез 1\ субоптимального робастного регулятора

2.4 1\ субоптимальный робастный регулятор для SISO объекта с неструктурированной неопределенностью

2.4.1 Переформулировка задачи и геометрическая интерпретация

2.4.2 Обобщение метода метода Q - масштабирования

2.4.3 Синтез 1\ субоптимального робастного регулятора

3 Адаптивное робастное управление: оценивание и стабилизация

3.1 Постановка задач адаптивного управления

3.1.1 Задачи адаптивной стабилизации и синтеза неконсервативного адаптивного управления.

3.1.2 Априорная информация

3.2 Проблема оценивания.

3.2.1 Согласованность оценок с наблюдениями и априорной информацией.

3.2.2 Множество оценок, согласованных с наблюдениями и априорной информацией.

3.3 Синтез адаптивного управления переборными методами

3.3.1 Адаптивная стабилизация.

3.3.2 Синтез неконсервативного адаптивного управления

3.4 Адаптивная стабилизация посредством конечно-сходящихся алгоритмов оценивания градиентного типа.

3.4.1 Конечно-сходящийся алгоритм оценивания.

3.4.2 Теорема об адаптивной стабилизации.

3.4.3 Максимизация равномерной области робастной устойчивости

3.4.4 Адаптивная стабилизация в случае конечных наборов выпуклых априорных множеств и допустимых структур объекта.

3.4.5 Заключительные замечания к решению задачи адаптивной стабилизации

4 Адаптивное робастное управление на основе множественного оценивания

4.1 Робастный показатель качества как критерий идентификации

4.1.1 Идентификация и робастное управление.

4.1.2 Стандартные критерии идентификации для робастного управления.

4.1.3 Критерий идентификации в задаче синтеза неконсервативного адаптивного управления.

4.2 Синтез неконсервативного адаптивного управления

4.2.1 Синтез управления на основе дискретизации значений показателя качества.

4.2.2 Конечно-сходящийся алгоритм множественного оценивания

4.2.3 Синтез неконсервативного адаптивного управления на основе множественного оценивания.

4.3 Синтез неконсервативного адаптивного управления для объекта с неизвестной структурой и в задаче слежения

4.3.1 Управление объектом с неизвестной структурой

4.3.2 Задачи слежения

4.4 Адаптивное робастное управление на основе конусного алгоритма оценивания

4.4.1 Конусный алгоритм оценивания.

4.4.2 Минимизация нормы аддитивного возмущения

4.4.3 Минимизация эффекта возмущений.

4.5 Реализация и моделирование неконсервативного адаптивного управления.

4.5.1 Проблемы реализации и возможные аппроксимации неконсервативного адаптивного управления.

4.5.2 Субоптимальное адаптивное управление.

4.5.3 Выбор модели неопределенности

4.5.4 Примеры численного моделирования.

Введение 1998 год, диссертация по информатике, вычислительной технике и управлению, Соколов, Виктор Федорович

Основная задача настоящей работы заключается в построении и строгом математическом обосновании законов управления линейными дискретными стационарными объектами в условиях неопределенности. В качестве модели управляемого объекта используются линейные конечномерные разностные уравнения с постоянными коэффициентами и возмущениями. Неопределенность в описании объектов управления подразделяется на два различных типа. Первый тип принято характеризовать как параметрическую неопределенность, означающую, что коэффициенты уравнения объекта, нормы возмущений и, возможно, структурные параметры объекта предполагаются неизвестными. Задачи построения управления объектами с параметрической неопределенностью являются предметом теории адаптивного управления. Второй тип неопределенности заключается в наличии неизмеряемых и непредсказуемых возмущений как в самом объекте, так и в регуляторе. В данной работе рассматриваются детерминированные (нестохастические) возмущения, включающие внешние ограниченные аддитивные возмущения и возмущения, характеризующие неточность описания объектов конечномерными разностными уравнениями. Источниками возмущений последнего типа могут быть немоделируемая динамика объекта, малые колебания его параметров, нелинейности и другие источники. Для упрощения терминологии возмущения этого типа мы будем называть параметрическими, имея в виду, что никакой набор коэффициентов (параметров) разностного уравнения не обеспечивает правильного описания системы управления с точностью до внешнего аддитивного возмущения. Изучение систем управления в условиях параметрических возмущений является предметом теории робастного управления.

Основное и главное различие двух описанных выше типов неопре-ленности заключается в том, что неопределенность второго типа, описываемая параметрическими и аддитивными возмущениями, является неустранимой, в то время как неопределенность первого типа, названная выше параметрической неопределенностью, может и должна быть устранена в процессе управления. Следуя структуре настоящей работы, остановимся сначала на вопросах, относящихся к робастному управлению.

Робастное управление

Активное, можно сказать взрывное, развитие теории робастного управления началось в начале 80-х гг. после публикации серии работ [74, 73, 75, 113], посвященных устойчивости линейных стационарных систем в условиях структурированных линейных стационарных возмущений. В общих словах под робастностью системы по отношению к некоторому ее свойству, например, устойчивости, понимается способность системы сохранять это свойство при вариациях модели системы из определенного множества возможных вариаций. К понятию робастности можно отнести понятие грубости системы, введенное A.A. Андроновым [3]. Поскольку, начиная с указанных выше работ, робастность систем стала изучаться не столько в качественном, сколько в количественном аспекте, включая вопросы оценки качества возмущенных систем, в литературе на русском языке закрепился принятый в мировой литературе термин робастность [7, 11, 32].

За редкими исключениями (например, [14]), внимание российских исследователей было сосредоточено на системах с линейными стационарными возмущениями. В работах Ю.И. Неймарка, A.A. Первозванского, Б.Т. Поляка, Я.З. Цыпкина и других авторов были получены многочисленные результаты по робастной устойчивости различных систем в условиях возмущений ([27, 26, 35, 34, 65] и другие работы). Особое место в теории робастного управления заняла знаменитая теорема Харитонова, сводящая проблему изучения гурвицевости семейства полиномов, векторы коэффициентов которых принадлежат заданному параллелепипеду, к изучению устойчивости всего четырех (в случае полиномов с вещественными коэффициентами) специальных полиномов [51]. Теорема Харитонова инициировала в 80-е годы огромный поток работ, посвященных различным ее обобщениям. Количество соответствующих публикаций насчитывает, по всей видимости, не одну сотню работ. Следует заметить, что теорема Харитонова не находит применения в теории адаптивного управления, поскольку линейная стационарная неопределенность, с которой имеет дело теорема Харитонова, является параметрической неопределенностью, подлежащей устранению средствами адаптивного управления.

Теория робастного управления в 1\ постановке. Теория робастного управления в 1р постановке соответствует изучению систем как операторов, действующих из пространства n-мерных векторных последовательностей I™ в пространство т-мерных векторных последовательностей I™, где 1/р + 1/д = 1. В частности, в /1 теории робастного управления, являющейся предметом настоящей работы, входы и выходы систем рассматриваются как элементы пространств равномерно ограниченных векторных последовательностей Общей теоретической базой всех 1р теорий робастного управления служит теорема о малом коэффициенте усиления [144]. Согласно этой теореме, замкнутая система из двух устойчивых систем является устойчивой, если произведение коэффициентов усиления этих систем меньше единицы (определение коэффициента усиления приведено ниже). Первым результатом в 1\ теории робастного управления явилась работа [69], в которой было доказана неконсервативность условия робастной устойчивости, доставляемого теоремой о малом коэффициенте усиления, в классе неструктурированных линейных нестационарных параметрических возмущений с ограниченной нормой. Основы ¿1 теории робастного управления были разработаны в работах М. Хаммаша и Дж. Б. Пирсона [93, 92] в начале 90-х годов. Позднее были получены результаты по робастной устойчивости нестационарных номинальных систем и результаты по 1р робастной устойчивости систем при р < оо.

Приведем в сжатом виде два основных результата /¡-теории, дающих необходимые и достаточные условия робастной устойчивости и достижения робастного качества для класса структурированных возмущений. Пусть /^ обозначает нормированное пространство ограниченных вещественных векторных последовательностей {х(к)} размерности п с нормой ЦжЦоо := Бир^Бир; |жг-(&)|, где Х{(к) - г-я координата вектора х(к). Причинное отображение С : /^ н-► /™ называется /^-устойчивым, или, для краткости, устойчивым, если оо

G|| := ||е||,:=гар!!^<оо хфО ||^||оо

Величина ||С?|| называется коэффициентом усиления отбражения G. Рассмотрим систему, изображенную на рис. 0.0.1. Во избежание за

IV М

Рис. 0.0.1: Система с параметрическими возмущениями громождения обозначений будем считаь, что последовательности ги и у на рис.0.0.1 являются скалярными. Последовательность из обозначает и неизмеряемое внешнее ограниченное возмущение, а последовательность у - выход системы. Пусть векторные последовательности £ и 2; имеют размерность п. Оператор М : н-> на рис. 0.0.1 обозначает оператор системы, включающей объект управления и регулятор. Оператор М предполагается линейным стационарным причинным устойчивым оператором (все необходимые определения приведены в начале главы 1) и описывает номинальную систему. Оператор А : н-> является неизвестным и описывает неопределенность второго типа - параметрические возмущения в номинальной системе. В 1р теориях робастного управления оператор неопределенности считается неизвестным строго причинным оператором с коэффициентом усиления, не превосходящим 1: ||А|| < 1. Пусть Б обозначает множество операторов А с указанными свойствами. Для удобства изложения будем считать, что класс И включает только линейные нестационарные операторы. Заметим, что случай ненормированных параметрических возмущений сводится к случаю нормированных возмущений посредством соответствующего изменения оператора номинальной системы М. Таким образом, параметры номинальной системы в общем случае зависят от нормы параметрических возмущений. Уравнения системы на рис. 0.0.1 запишем в виде

0=(£й)(")-(0Л) где М: 1^0 |—> Для каждого фиксированного оператора А £ О в системе (0.1) определены отображения Хд и Х2>д, сопоставляющие входной последовательности и) выходные последовательности у и г, соответственно. Система (0.1) называется робастно устойчивой в классе неопределенностей X), если отображения Хд и Хгд устойчивы. Для ро-бастной устойчивости системы (0.1) необходима и достаточна устойчивость отображения (/ — А)-1 [93].

Терминологическое замечание. Поскольку робастная устойчивость системы означает /до-устойчивость отображений Хд и Х2;д, было бы естественным именовать соответствующую теорию робастного управления /оо-теорией. Использование термина ^-теория вместо ¿оо-теория вызвано необходимостью согласования терминологии с устоявшейся терминологией в теории 1\ оптимального управления, о которой будет сказано ниже. Ограничимся здесь коротким замечанием, что использование терминологии вызвано тем, что 1\ норма является индуцированной нормой линейных операторов из в

Достаточное условие робастной устойчивости системы (0.1) в классе I), вытекающее из теоремы о малом коэффициенте усиления, имеет вид

Р^||<1. (0.2)

Условие (0.2), как отмечалось выше, является одновременно и необходимым условием робастной устойчивости в классах линейных нестационарных, нелинейных стационарных и нелинейных нестационарных возмущений, если не наложено никаких других ограничений на класс Б

Рождение и развитие современных теорий робастного управления связано с сужением класса параметричеких возмущений И посредством рассмотрения операторов А блочно-диагональной структуры, получивших название структурированной неопределенности в описании системы. В случае структурированной неопределенности в системе (0.1) достаточное условие (0.2) становится консервативным. В отмеченных выше пионерских работах [74, 73, 75, 113] класс И содержал только линейные стационарные операторы, что является дополнительным источником консервативности достаточного условия робастной устойчивости

Пусть класс возмущений D{ri) обозначает подмножество класса -D, включающее только операторы А с диагональной структурой: А = diag{Ai,., Ап}. Введем необходимые для формулировки двух основных результатов обозначения.

Матрицу оператора Mz£ представим в виде где £ 1\ является импульсной характеристикой от j входа к г выходу, и действие (произведение) элемента матрицы на числовую последовательность определяется оператором свертки (конволюции). Первая теорема дает необходимые и достаточные условия робастной устойчивости системы (0.1).

Теорема 0.0.1 ([93, 92]) Следующие утверждения эквивалентны:

1. Система (0.1) робастно устойчива в классе 0{п).

2. р([Мге] 1) < 1, где [М\\ обозначает матрицу, составленную из I\ норм элементов матрицы М, и р(А) обозначает спектральный радиус квадратной матрицы А.

3. Система неравенств х < [М^х не имеет ненулевых решений х £ II™; удовлетворяющих условию х > 0; где неравенства понимаются покомпонентно.

67].

0.2).

Вторая теорема позволяет оценивать робастное качество системы (0.1). Будем говорить, что система (0.1) достигает робастного качества в классе 0(п), если она робастно устойчива в классе и

Тд|| < 1 для всех А £ £>(п).

Для формулировки основного результата о достижении системой ро-бастного качества рассмотрим систему на рис. 0.0.2, полученную введением в систему (0.1) дополнительной обратной связи ии = До?/, где До : ¿оо ^оо ~~ произвольный строго причинный оператор, удовлетворяющий условию || До|| < 1. Пусть 1)(п+ 1) обозначает класс всех структурированных параметрических возмущений, полученных добавлением к операторам Д £ 0{п) дополнительного блока До в левом верхнем углу. А

Рис. 0.0.2: Замкнутая система со структурированной неопределенностью

Теорема 0.0.2 ([93, 92]) Система (0.1) достигает робастного качества в классе D(n) если и только если система на рис. 0.0.2 робастно устойчива в классе D(n + 1).

Таким образом, достижение системой (0.1) робастного качества зависит от матрицы [М]i, составленной из 1\ норм импульсных характеристик оператора системы М (именно указанные 1\ нормы являются причиной именования рассматриваемой теории робастного управления как /i-теории). В работах [93, 92] доказано, что сформулированные теоремы сохраняют силу и для классов D произвольных (нелинейных) строго причинных и причинных операторов и приведены соответствующие теоремы для случая операторов Дг- произвольной размерности. Теорема 0.0.2 сводит задачу проверки достижения системой робастного качества к проверке алгебраических условий, доставляемых теоремой 0.0.1.

Рассмотрим показатель качества системы (0.1)

Joo(M) := sup ||ГД|| = sup sup IHloo, (0.3)

AeD{n) A<ED(n) |M|oo<l который будем называть равномерным робастным показателем качества системы. Показатель качества (0.3) соответствует наиболее неблагоприятной Iqo норме выхода системы в классе допустимых возмущений и относится к классу показателей, характеризуемых в мировой литературе термином worst-case performance. Заметим, что использованный в отношении показателя качества (0.3) термин 'равномерный' относится не к операции вычисления супремума по классу возмущений, а к характеристике 10о нормы выхода, задействованной в этом показателе качества. На основе двух приведенных выше теорем в работе [91] была получена формула для равномерного показателя качества J00 (М): оо(М) = \\Муи>\\ + [Му^(1 - [М^У^М^г.

Имеется ряд обстоятельств, затрудняющих непосредственное использование изложенных результатов в реальных системах управления. Полнота информации об операторе М номинальной системы управления зависит от решаемой практической задачи. Без риска ошибиться можно сказать, что в любой реальной системе управления оператор М никогда не известен абсолютно точно и зачастую необходимо предварительно построить модель номинальной системы или выбрать параметры модели из некоторого параметризованного класса моделей. Если выбор параметров модели осуществляется в процессе управления, возникает задача адаптивного управления. При построении адаптивного регулятора, вследствие неполноты информации об управляемом объекте, неизбежны неудачные управляющие воздействия на начальном отрезке времени, ухудшающие значение равномерного робастного показателя качества. Следует также заметить, что в процессе подстройки регулятора фактически изменяется и сама номинальная система, включающая используемый для управления регулятор. Таким образом, приведенные выше результаты необходимо применять к текущей модели номинальной системы. При этом начальные данные в текущей модели номинальной системы нельзя считаь нулевыми, в то время как теоремы 0.0.1 и 0.0.2 подразумевают нулевые начальные данные в номинальной системе. Для разрешения этой проблемы, ненулевые начальные условия в системе можно объяснить воздействием модифицированных на начальном отрезке времени возмущений, что приведет к ухудшению значения равномерного робастного показателя качества 0.3. Остается добавить, что оценка равномерного показателя качества в замкнутой адаптивной системе является чрезвычайно трудной математической задачей, представляющей практический интерес с точки зрения оценки переходных процессов.

Асимптотическое робастное качество. Из приведенных выше аргументов следует, что для оценки робастного качества систем управления больший интерес представляют показатели качества, не зависящие от поведения системы на начальном отрезке времени. В настоящей работе рассматривается асимптотический показатель качества, полученный заменой функционала ||г/||оо на функционал y\\ss= Hmsup \у(к)\. (0.4) к—>оо

Однако сама по себе замена в робастном показателе качества (0.3) равномерной нормы ||2/||ss на асимптотическую полунорму \\y\\ss не позволит устранить зависимость асимптотического показателя качества от поведения системы на начальном отрезке времени. Причиной этого является излишнее богатство класса параметрических возмущений D(n), элементы которого могут обладать сколь угодно долгим последействием (см. [90] и раздел 1.3 настоящей работы). Для исключения из рассмотрения таких операторов в работе [90] были рассмотрены классы Dp{n) возмущений с конечной памятью ж Dfd{p) возмущений с затухающей памятью. Оператор возмущений Д называется оператором с конечной (затухающей) памятью, если он переводит последовательности с конечным числом ненулевых элементов (сходящиеся к нулю последовательности) в такие же.

В работе [90] для случая фиксированного скалярного входного сигнала w в системе (0.1) получены необходимые и достаточные условия ро-бастной устойчивости и достижения робастного качества относительно асимптотического функционала ||y||ss, аналогичные сформулированным в теоремах 0.0.1 и 0.0.2. Отличие в формулировках заключается в замене матрицы [М] 1 матрицей \\Myww\\ss ЦМ^И! . ||M*J|i \

MZlWw\\ss HM^IIi . HM^j! \\MZnWw\\ss ЦМ^Цх . HM^JIi/ отличающейся от матрицы [M] i элементами первого столбца, соответствующего фиксированному входному сигналу w.

Задачи слежения и регулирования. Задачи управления с показателем качества вида (0.3) относятся к классу задач робастного регулирования. Введение дополнительного фиксированного входного сигнала в систему (0.1) позволяет рассматривать робастные обобщения задач слежения.

Для фиксированного сигнала в системе принято использовать специальное обозначение г, соответствующее английскому термину reference signal (задающий, или эталонный, сигнал). Системы, содержащие как ограниченное аддитивное возмущение w, так и фиксированный задающий сигнал г, рассматривались в работе [77] в равномерной (неасимптотической) постановке с классом возмущений D(n). В работе [77] для случая нулевого аддитивного возмущения был получено довольно т., = сложное достаточное условие достижения системой робастного качества относительно нормы выхода, менее консервативное, чем условие, непосредственно вытекающее из результатов работ [93, 92]. Для случая ненулевого аддитивного возмущения сформулировано простое и консервативное достаточное условие достижения робастного качества относительно ¿оо нормы выхода, непосредственно вытекающее из результатов работ [93, 92]. В силу описанных выше причин результаты работы [77] представляют ограниченный интерес для практических приложений и, во всяком случае, неприменимы для построения адаптивного управления.

В главе 1 настоящей работы робастная устойчивость и робастное качество систем управления в задачах регулирования и слежения изучается в асимптотической постановке для сигналов произвольной размерности [37, 38, 39, 118, 119, 121, 124].

Классы возмущений с ограниченной памятью и с экспоненциально затухающими импульсными характеристиками. Рассмотрение классов Dp и Dp в возмущений с конечной памятью и с затухающей памятью позволяет получить как исчерпывающие результаты по робастной устойчивости систем, так и явные формулы для асимптотического робастного показателя качества

J(M) := sup sup \\y\\ss = sup sup ||y||ss (0.5)

AeDF ||iü||oo<l A<eDfd |H|oo<1 в задачах регулирования и слежения (равенство показателей качества в классах Dp или Dpp> является доказанным утверждением). Однако использование этих результатов в практических задачах ставит проблему проверки гипотезы о типе возмущений в системе, т.е. проверки принадлежности возмущений в выбранной модели системы управления к классам Dp или Dpp>. Из определения этих классов следует, что данная проблема принципиально неразрешима в силу того простого обстоятельства, что данные измерений всегда являются конечными множествами, а определения указанных классов относятся к асимптотическому поведению входов и выходов операторов возмущений. Таким образом, для проверки принадлежности возмущений к классам Dp или Dpjj необходимо вводить дополнительные гипотезы (ограничения), приводящие к сужению классов допустимых возмущений. В настоящей работе в качестве таких сужений рассмотрены подкласс возмущений с ограниченной памятью Dß С Dp и подкласс возмущений с экспоненциально затухающими импульсными характеристиками Dxed С Dpp>. В скалярном случае, А : указанные подклассы можно описать следующим образом. Последовательности у и х удовлетворяют равенству у = Ах с некоторым оператором А Е 1) если и только если

V* Е N < \x\zl\oo := тах |ж(* - к)\ . (0.6)

В случае оператора А Е -0|-£)(1) неравенства (0.6) заменяются неравенствами

V* Е N |у(*)| < т(£)|, т(*) := Ат(£ - 1) + (1 - А)|ж(*- 1)| , т(0) := 0 .

0.7)

Таким образом, память возмущений из класса ограничена сверху числом /I > 0. Для возмущений из класса число Л Е [0,1) характеризует скорость убывания влияния предшествующих значений входа возмущения на его выход. Множитель 1 — Л введен для нормировки возмущений.

Поскольку классы возмущений и являются подклассами классов Др и соответственно, то необходимые и достаточные условия робастной устойчивости для последних становятся только достаточными условиями для первых двух классов. По той же причине формулы для асимптотических робастных показателей качества в классах Др и становятся верхними оценками робастных показателей качества в классах Ид и В разделе главы 1 настоящей работы, посвященном возмущениям с ограниченной памятью, показано, что консервативность указанных условий робастной устойчивости и верхних оценок показателей качества исчезает при неограниченом росте допустимой памяти возмущений, т.е. при ц, —■> со. Этот результат не имеет аналога для класса возмущений что следует из контрпримера, построенного А.Е. Барабановым и приведенного в разделе главы 1, посвященном этому классу возмущений. В главе 1 показано также, что для систем с конечными импульсными характеристиками условия робастной устойчивости и формулы для показателей качества в классах Ир и Бд эквивалентны при достаточно больших значениях /л.

Следует отметить, что возмущения, описываемые неравенствами типа (0.6) и (0.7), получили широкое распространение в теории адаптивного робастного управления. Однако условия устойчивости систем при подобных возмущениях, получаемые в работах по адаптивному робастному управлению с помощью аппарата функций Ляпунова, имеют скорее качественный, а не количественный характер, и степень их консервативности не обсуждается.

Робастные задачи синтеза оптимального управления. При постановке задач синтеза робастных регуляторов номинальная система рассматривается как система, включающая объект управления и регулятор, в результате чего оператор системы М зависит от оператора Р, описывающего управляемый объект, и оператора С, задающего регулятор:

М = М(Р, С).

Рассмотрим систему управления, изображенную на рис. 0.0.3. Для упрощения рисунка параметрическое возмущение отнесено к объекту Р, однако в общем случае может присутствовать и в регуляторе С.

Рис. 0.0.3: Замкнутая система управления с неопределенностью

Приведенные выше теоремы 0.0.1 и 0.0.2 мотивировали постановку в работах [67, 68, 89] задачи достижения робастного качества как задачи построения регулятора С, обеспечивающего достижение робастного качества в системе М(Р, С), т.е. задачи обеспечения неравенства ||Тд|| < 1 при всех А £ Х)(п). Напомним, что Тд обозначает отображение, сопоставляющее входу и] выход у. Сформулированная задача имеет достаточно общий вид, но не является оптимальной. Решение этой задачи в настоящее время не получено, однако ее формулировка послужила основанием для постановки в работах [92, 68, 89]) вспомогательной задачи минимизации спектрального радиуса: ы Р([М(Р,С)]0,

С—стао. где инфимум вычисляется на множестве регуляторов, обеспечивающих робастную устойчивость замкнутой системы. Такая формулировка оптимальной задачи порождена двумя обстоятельствами. Первое из них заключается в том, что условие достижения системой на рис. 0.0.3 робастного качества принимает вид р([М(Р, С)]х) < 1. Второе, и более важное, обстоятельство связано с возможностью применения к решению поставленной задачи результатов и методов теории 1\ оптимизации. Более подробное обсуждение проблемы приведено в главе 2. Ограничимся здесь замечанием, что в работе [92] была предложена итеративная процедура построения последовательности приближенных решений, сходящихся к локальному минимуму. В работе [88] задача минимизации спектрального радиуса решена в случае одного скалярного блока возмущений (п = 1).

Еще одна, более частная, формулировка оптимальной задачи синтеза робастного регулятора для скалярного объекта, порожденная условием робастной устойчивости, будет приведена ниже. Возвращаясь к исходной мотивации задач синтеза робастного управления как задач, связанных с поведением системы управления как отображения 'вход-выход', следует считать наиболее естественной постановкой оптимальной задачи следующую:

Задача синтеза 1\ оптимального робастного регулятора. Требуется построить регулятор С, доставляющий решение задачи

0.8) где J обозначает равномерный, (0.3), или асимптотический, (0.5), показатели качества.

Задача синтеза 1\ оптимального робастного регулятора является сложной задачей невыпуклого программирования и даже не формулировалась в литературе по робастному управлению в своем общем виде (0.8). В частном случае скалярного объекта со структурированными возмущениями в каналах выхода и управления формулировка этой задачи без ее решения приведена в работе [68]. Робастные показатели качества (0.3) и (0.5) для такого объекта управления, замкнутого линейным стационарным регулятором, принимают вид [37]

J(M(P,C)) = g^

1 — 6 у 11 Gyy 11 — <5M||GUi;|| где Gyv и Guv - передаточные операторы от суммарного возмущения v в объекте к выходу у и управлению м, соответственно, a Sw,6y,6u - нормы аддитивного возмущения и параметрических возмущений в каналах выхода и управления, соответственно. Заметим, что задача синтеза 1\ оптимального регулятора, более побдробное обсуждение которой приведено ниже, является частным случаем задачи синтеза 1\ оптимального робастного регулятора и заключается в минимизацию числителя в правой части формулы (0.9).

Необходимое и достаточное условие робастной устойчивости описанной системы в классах D{2), Dp(2) и Dpp>(2) эквивалентно условию положительности знаменателя в правой части формулы (0.9). В связи с этим условием в работе [66] была сформулирована и решена задача inf (¿JGyi + ¿и||<?и„||) >

С—стаб. названная в [66] задачей наибольшего запаса устойчивости (the largest stability margin). В терминах робастного показателя качества (0.9) эта inf J{M(P,C)), задача эквивалентна максимизации знаменателя в показателе качества (0.9).

Интересно заметить, что для описанной системы с независимыми параметрическими возмущениями в каналах выхода и управления р([м(р, сою = (бу + ад цсу| + ¿ус ыг;||, и задача минимизации спектрального радиуса отличается от всех других рассмотренных выше оптимальных задач. Следует отметить, что решение задачи минимизации спектрального радиуса зависит от нормы аддитивного возмущения что, по-видимому, следует рассматривать как недостаток самой постановки задачи.

В главе 2 настоящей работы дается решение задач синтеза 1\ субоптимальных робастных регуляторов для скалярного объекта при структурированном и неструктурированном параметрических возмущениях. Решение задачи использует дробно-линейную зависимость показателя качества 0.9 от норм передаточных операторов и основано на сведении исходных задач к семейству нестандартных задач /1 оптимизации, для решения которых используется предложенный в работах [88, 87] метод масштабирования решения задач /1 оптимизации. Достаточно наглядная геометрическая интерпретация всех обсуждавшихся выше оптимальных задач синтеза робастных регуляторов для случаев структурированных и неструктурированных параметрических возмущений приведена на рис. 2.3.7 и 2.4.9, соответственно.

Теория /1 оптимального управления. Если в системе на рис. 0.0.3 отсутствуют параметрические возмущения (А = 0), то задача синтеза 1\ оптимального робастного регулятора становится задачей синтеза 1\ оптимального регулятора, являющейся предметом современной теории 1\ оптимального управления. Первым результатом по синтезу /1 оптимального регулятора явилась статья Е.Д. Якубович [58], в которой решение задачи было получено для скалярного минимально-фазового объекта. Решение задачи для произвольных скалярных объектов было дано А.Е. Барабановым и О.Н.Граничиным в 1984 г. в работе [5]. Впоследствии А.Е. Барабановым и его учениками были получены решения различных общих задач /1 оптимизации, подробное изложение которых можно найти в моногорафии [4].

К сожалению, работа [5] долгое время оставалась незамеченной за рубежом. В связи с этим первая постановка задачи синтеза 1\ оптимального управления приписывается в зарубежной литературе по теории управления работе [137], а первое ее решение для скалярного объекта - работе [70], повторившей результат работы [5]. После публикации в 1987 г. широко известной премированной работы [71] началось бурное развитие теории /1 оптимизации, изложение результатов которой, полученных в зарубежной литературе, приведено в монографии [67]. Заметим, что подход, разрабатываемый А.Е. Барабановым и учениками, является более привлекательным с теоретической точки зрения и использует геометрические подходы и идеи динамического программирования, позволяющие решать более общие задачи 1\ оптимизации (например, для непрерывных объектов управления). Утвердившийся в зарубежной литературе подход к решению задач /1 оптимизации основан на сведении этих задачи к бесконечномерным задачам линейного программирования и построению приближенных решений исходной задачи. Достоинством этого подхода является удобство его вычислительной реализации с использованием хорошо разработанного стандартного программного обеспечения.

Минимаксные (игровые) задачи управления. Обсуждавшиеся выше задачи синтеза робастных и 1\ оптимального регуляторов относятся к минимаксным задачам управления. С точки зрения теории игр они являются игровыми задачами, в которых роль игрока, максимизирующего показатель качества, отведена возмущениям в системе управления, и задача другого игрока, конструктора системы управления, заключается в минимизации наихудшего значения показателя качества за счет выбора соответствующего управляющего воздействия. Задачи подобного типа известны также под именем задач управления с гарантированным результатом и хорошо изучены в случае управления на конечном временном промежутке с функционалами терминального или интегрального типа [18, 19, 21, 24, 54]. При решение этих задач широко применяются методы выпуклого анализа. Задачами оптимального минимаксного управления для неограниченного временного интервала являются задачи Н°° теории, имеющей дело с частотными показателями качества и составляющей одно из ведущих направлений современной теории управления (см. обзорную монографию [33] и обзор [6]). Для решения задач Н°° оптимизации разработаны богатые с математической точки зрения спектральные методы синтеза и методы пространства состояний, основанные на решении уравнений Лурье-Риккати.

Адаптивное управление

Теория адаптивного управления зародилась в середине 50-х годов как прикладное научное направление в связи с задачами упраления полетом и управления процессами с использованием первых появившихся образцов вычислительной техники. Уже на начальном этапе развития теории были сформулированы основные идея и подходы, разрабатывавшиеся в последующие десятилетия: адаптивное управление с эталонной моделью, самонастраивающиеся регуляторы, дуальное управление, использование нейронных сетей. К числу пионерских публикаций относятся работы [47, 64, 85]. Начальный этап развития адаптивного управления характеризовался непосредственной проверкой предлагаемых идей и подходов на моделях реальных систем [59]. Несмотря на успешное решение некоторых практических задач, в целом стало понятным, что для дальнейшего успешного применения предложенных методов необходимо более глубокое теоретическое понимание поведения, прежде всего устойчивости, адаптивных систем управления. Начиная с 60-х годов теория адаптивного управления относилась к числу наиболее активно развивавшихся направлений современной теории управления, и за прошедшие годы накопилась огромная литература, трудно поддающаяся обозрению. К числу известных монографий по адаптивному управлению, так или иначе повлиявших на содержание настоящей работы, относятся опубликованные в СССР книги [17, 31, 46, 48, 49, 50, 53].

Развитие теории адаптивного управления за рубежом происходило в основном независимо от результатов, публиковавшихся в СССР. Количество одних только монографий, посвященных адаптивному управлению и опубликованных за два последних десятилетия, насчитывает не один десяток наименований. К числу наиболее часто цитируемых относятся книги [60, 76, 80, 96, 106].

Стохастическое и детерминированное адаптивное управление. В течение достаточно долгого периода времени предметом теории адаптивного управления были системы без возмущений. Сказанное относится, в частности, к большинству публикаций по адаптивному управлению с эталонной моделью и самонастраивающимся регуляторам. Начиная с середины 70-х годов стали изучаться адаптивные системы управления при наличии стохастических возмущений. Адаптивное управление для АИМАХ процессов, возмущения в которых описывались аддитивными стационарными случайными процессами, строилось на основе алгоритмов оценивания типа стохастической аппроксимации или рекуррентного метода наименьших квадратов. При этом достигалась цель не только стабилизации замкнутой адаптивной системы, но и ее оптимальности для асимптотических функционалов квадратичного типа [20, 48, 80]. Оптимальность адаптивного управления достигалась благодаря сходимости оценок неизвестных параметров к их истинным значениям за счет возбуждающих свойств задающего сигнала или рандомизации управления. Было также установлено, что в некоторых задачах оптимальность замкнутой стохастической адаптивной системы может достигаться и без асимптотически точной идентификации неизвестных параметров благодаря сходимости оценок не к истинным значениям параметров, но к таким, которые порождают искомый оптимальный регулятор. Примерами таких задач являются задача регулирования минимально-фазовым объектом [63] и задачи адаптивного локально-оптимального управления [15, 16]. Впоследствии, за счет использования аппарата функций Ляпунова, удалось доказать и некоторые робаст-ные свойства стохастического адаптивного управления для минимально-фазовых объектов [110, 111] без обснования сходимости оценок. Обладая рядом несомненных достоинств, стохастическое адаптивное управление обладает существенным недостатком, заключающимся в необходимости априорной информации о стохастических свойствах возмущений. Такая информация зачастую бывает недоступной в практических задачах, а предложенные методы оценивания и управления не предусматривают процедур проверки соответствия принятой модели возмущений реальной ситуации.

Иная ситуация имеет место в детерминированных задачах адаптивного управления, в которых предположения о возмущениях в системе управления не апеллируют к их стохастическим свойствам, и природа возмущений считается нестохастической. Уже в детерминированных задачах адаптивного управления без возмущений стало признанным, что оценки неизвестных параметров могут не сходиться к их истинным зна-ченим или вовсе не иметь никаких предельных значений, причем последнее всегда имеет место в системах с возмущениями при использовании градиентных или МНК алгоритмов оценивания.

Адаптивное робастное управление. К началу 80-х в были получены разнооборазные результаты по устойчивости замкнутых адаптивных систем с линейными стационарными объектами без возмущений. Необходимость учета возмущений при разработке законов адаптивного управления стала весьма актуальной теоретической проблемой после построения нескольких примеров неустойчивости систем с известными адаптивными регуляторами при наличии внешних аддитивных возмущений или малых параметрических возмущений [76, 112]. Так, в книге [76] был построен пример объекта первого порядка с одним неизвестным параметром и стремящимся к нулю аддитивным возмущением, в котором оценки неизвестного параметра, получаемые в замкнутом контуре согласно методу наименьших квадратов (МНК), стремятся к бесконечности. 80-е гг. стали десятилетием активных исследований в области адаптивного робастного управления. Достаточно полное описание достигнутых к концу 80-х гг. результатов приведено в обзорах [83, 108]. Для обеспечения устойчивости замкнутых адаптивных систем были предложены различные модификации стандартных градиентных и МНК алгоритмов оценивания (<т и £ модификации, относительная зона нечувствительности, нормировка сигналов, проектирование оценок параметров и др.). Полученные результаты относились в основном к минимально-фазовым объектам, локальной устойчивости замкнутых адаптивных систем и выяснению механизмов возникновения неустойчивости. Результаты по глобальной устойчивости формулировались в основном на качественном уровне, означающем сохранение устойчивости замкнутых адаптивных систем при достаточно малых параметрических возмущениях. Доказательства устойчивости строились исходя из рассмотрения конкретных алгоритмов оценивания, с использованием разнообразных норм сигналов с экспоненциальным взвешиванием и описанием параметрических возмущений в виде линейных стационарных операторов. В 90-х гг. появились отдельные результаты по детерминированному адаптивному робастному управлению минимально-фазовыми объектами, в которых не только доказывалась устойчивость замкнутой адаптивной системы, но и давались грубые оценки асимптотических показателей качества [105, 110, 111, 130, 142, 143]. С конца 80-х гг. основное внимание специалистов по адаптивному управлению смещается в область адаптивного управления линейными нестационарными и нелинейными объектами.

Несмотря на разнообразие достигнутых результатов, теории робаст-ного управления, оценивания параметров и адаптивного управления до настоящего времени развиваются в значительной степени независимо. Их взаимовлияние осуществляется большей частью на уровне мотивировок рассматриваемых задач, без использования результатов теории ро-бастного управления и теории оценивания параметров в теории адаптивного управления. Проблемы установления более тесных взаимосвязей между указанными теориями находятся в центре внимания современной теории управления. Об этом свидетельствуют, в частности, специальные выпуски ведущих журналов по теории управления [125, 128], мнения известных специалистов, высказываемые в многочисленных публикациях и докладах на крупнейших научных конференциях.

Идентификационный подход к синтезу адаптивного управления . Двумя основными подходами к синтезу адаптивного управления динамическими объектами являются прямое и непрямое адаптивное управления. Для краткой характеристики этих подходов рассмотрим объект управления описываемый разностным уравнением a(q-1)y(t) = q-db(q-1)u(t) + v(t), (0.10) где у, u, v обозначают, соответственно, измеряемый выход объекта, управление и суммарное возмущение в объекте, а и b - полиномы от оператора сдвига назад (g-1?/(i) := y(t— 1)), deg а = n, deg Ь = m (deg - степень полинома), a(0) = 1. Обозначим через 9р вектор, составленный из коэффициентов полиномов а и Ь:

0р \= (аь ., an, 60,. •, Ът)т.

Вектор 9р предполагается неизвестным, но принадлежащим известному множеству 0р. Пусть задана некоторая цель управления и для каждого вектора 9р из некоторого известного множества Qp задан регулятор a{q-\6p)u(t) = (3(q-\ep)y(t) , ar(0) := 1, (0.11) обеспечивающий достижение заданной цели управления. Обозначим через с(вр) вектор, составленный из коэффициентов полиномов а и ¡3.

Прямое адаптивное адаптивное управление основано на оценивании в процессе управления неизвестного вектора коэффициентов регулятора с(вр), а непрямое адаптивное управление - на оценивании вектора коэффициентов объекта 9р. На начальном этапе развития теории адаптивного управления непрямое адаптивное управление рассматривалось как более перспективное и более соответствующее самой идее адаптации системы управления к условиям неопределенности. В настоящее время можно сказать, что возлагавшиеся на этот подход надежды оправдались в гораздо меньшей степени, чем ожидалось вначале. Основной сферой применения этого подхода является адаптивное управление с эталонной моделью, и существенным ограничением этого подхода является его применимость только к минимально-фазовым объектам управления (полином Ъ должен быть устойчивым) [28, 29].

В литературе на русском языке вместо термина непрямое адаптивное управление обычно используются термины управление с идентификатором [45] или синтез адаптивного управления на основе идентификационный подхода [49]. Адаптивное управление при этом подходе строится на основе принципа разделения задач управления и оценивания, известном как the certainty equivalence principle [115]. Согласно этому принципу, управление в момент времени t осуществляется регулятором a(q-\ep(t))u(t) = P(q~\0p(t)Mt), (0.12) полученным заменой в регуляторе (0.11) неизвестного вектора коэффициентов 9р его оценкой 0p(t). Таким образом, задача построения адаптивного управления сводится к построению последовательности оценок 9p(t), обеспечивающей достижение цели управления.

В отличие от прямого адаптивного управления, где подстройка неизвестного вектора коэффициентов с(9р) осуществляется из соображений минимизации непосредственно ошибки слежения, выбор оценки 9p{i) неизвестного вектора коэффициентов при использовании идентификационного подхода обычно преследует цель минимизации в том или ином смысле набора невязок в уравнении модели объекта: ф, ep(t)) := y{s) - 9p{t)^{s - 1) , 5 < t, i/j(t - 1) :=* (~y(t - 1),., -y(t - n),u(t -d),.,u(t- m))T .

Основанием дли минимизации невязок является равенство невязок возмущению, v(t,ep) = v(t), для истинного вектора коэффициентов 9р. Двумя наиболее распространенными типами алгоритмов оценивания неизвестного вектора вр являются градиентные алгоритмы, в которых корректировка вектора оценок 9p(t — 1) осуществляется вдоль вектора - 1) = -gradepv(t: вр): и разнообразные модификации метода наименьших квадратов (МНК), согласно которому оценка 9p(t) в момент времени t определяется формулой t

9p(t) := argmin ^^ z/(s, 9р)2 . s=О

Выше уже отмечалось, что в литературе по адаптивному управлению рассматривались разнообразные версии и модификации градиентных и МНК алгоритмов оценивания с целью достижения стабилизации адаптивных систем в условиях тех или иных возмущений. Не вдаваясь в подробности, выделим два важных обстоятельства:

1. термин идентификация в применении к детерминированным задачам адаптивного управления подразумевает не точное определение неизвестного вектора коэффициентов 9р, а только построение последовательности его оценок, позволяющей обеспечить достижение цели управления;

2. нормы возмущений в объекте управления не входят в набор оцениваемых параметров или предполагаются известными.

Метод рекуррентных целевых неравенств. Во второй половине 60-х В.А. Якубовичем был предложен метод рекуррентных целевых неравенств решения задач адаптивного управления [55, 56, 57]. Предложенный метод предназначался для решения задачи стабилизации линейного дискретного минимально-фазового объекта посредством прямого адаптивного управления. Отличительные черты метода сводятся к следующим.

1. Возмущение в объекте (0.10) предполагается аддитивным и ограниченным, вир|г;(*)| < (0.13) г с известной верхней оценкой 8Ю.

2. Цель управления переформулируется в виде формируемой в процессе управления последовательности неравенств относительно неизвестного вектора коэффициентов регулятора с(вр), и задача оценивания сводится к асимптотическому решению этой системы неравенств.

3. Для решения указанной системы неравенств используются алгоритмы оценивания градиентного типа, обеспечивающие приближенное асимптотическое решение неравенств за конечное время благодаря введению зоны нечувствительности. Алгоритмы оценивания с указанным свойством получили название конечно сходящихся.

В работе [25] метод рекуррентных целевых неравенств был применен для решения задачи адаптивной стабилизации на основе идентификационного подхода, при этом система неравенств относительно неизвестного вектора вр имела вид

Ш-о1ф{г-1)\<бт, (0.14)

Справедливость неравенств (0.14) очевидно следует из уравнения объекта (0.10) и предположения (0.13) об аддитивном возмущении V. Согласно методу рекуррентных целевых неравенств, желательно построить в процессе управления оценку вр Е Ор неизвестного вектора 9Р, удовлетворяющую системе неравенств (0.14) с вектором вр вместо вр при всех достаточно больших t. В случае построения такой оценки выход объекта (0.10) можно рассматривать как выход воображаемого объекта вида (0.10) с вектором коэффициентов вр, и использование регулятора (0.12), в котором вр(1;) = в обеспечит достижение цели управления в терминах воображаемого объекта. Технические сложности реализации описанного подхода связаны с тем, что невозможно построить предельную оценку вр, удовлетворяющую в точности неравенствам (0.14), и последние нуждаются в некотором ослаблении. Наиболее удобным для целей построения адаптивного управления оказалось предложенное В.И. Пономаренко ослабление, заключающееся в добавлении к правой части неравенств (0.14) слагаемого е\ф^ — 1) \ с достаточно малым фиксированным множителем е > 0.

Наиболее полное изложение метода рекуррентных целевых неравенств приведено в монографии [49]. В связи с тем, что метод базировался на предположении ограниченности возмущений с известной верхней границей, данная модель возмущений широко использовалась в работах по адаптиной стабилизации, публиковавшихся в СССР ([1, 2, 10, 30] и др.). В работе [12] метод был модифицирован для решения задачи адаптивной стабилизации минимально-фазового объекта при стохастических возмущениях с известной дисперсией и при ограниченных в среднеквадратичном возмущениях с известной верхней границей.

Идентификационный подход позволил решить задачу адаптивной стабилизации для неминимально-фазовых объектов при ограничительном предположении о выпуклости априорного множества коэффициентов Ор. Предположение выпуклости, общепринятое в работах по адаптивному управлению, порождено проблемой возможной неуправляемости объекта, соответствующего текущему вектору оценок 9p(t). Разрешение этой проблемы за счет предположения выпуклости множества Эр, не включающего векторов коэффициентов неуправляемых объектов, не очень практично, и проблема отказа от этого предположения в течение многих лет остается трудной нерешенной теоретической проблемой. Вариант ее решения в рамках метода рекуррентных целевых неравенств был предложен в работе [9] за счет использования стабилизирующего регулятора (0.11) специального вида с заметным ухудшением качества управления. Другой вариант решения, со специальной подстройкой текущих оценок, обсуждался в работе [97].

Выще уже отмечалось, что развитие теории адаптивного управления в СССР и за рубежом происходило в значительной степени независимо. В частности, алгоритмы оценивания, разработанные в рамках метода рекуррентных целевых неравенств, оставались вне внимания зарубежных исследователей. Лишь относительно недавно эти алгоритмы привлекли внимание специалистов по теории идентификации [61].

В главе 3 настоящей работы метод рекуррентных целевых неравенств применяется к решению задач адаптивной стабилизации в условиях аддитивных ограниченных и параметрических возмущений. Существенное отличие рассматриваемых в главе 3 алгоритмов оценивания состоит во включении норм всех возмущений в число оцениваемых параметров, при этом не вводятся дополнительные консервативные ограничения на нормы параметрических возмущений, кроме диктуемых условиями ро-бастной устойчивости, и верхняя граница нормы аддитивного возмущения не предполагается известной.

Гарантированное оценивание. До середины 80-х гг. основной моделью возмущений в теории идентификации и оценивания параметров служили аддитивные возмущения, описываемые случайными процессами различного типа. В начале 80-х гг. появились первые публикации, в которых возмущения моделировались в виде произвольных ограниченных последовательностей, с известной верхней границей. Следует заметить, что модель нестохастичеких возмущений, принимающих значения в известном ограниченном множестве, использовалась в задачах оценивания состояния уже в конце 60-х [114], а в работах А.Б. Кур-жанского 70-х гг. были решены многие задачи оптимального управления на ограниченном интервале времени для этой модели возмущений [24]. В дальнейшем раздел теории оценивания параметров в условиях ограниченных детерминированных аддитивных возмущений получил в литературе на русском языке наименование теории гарантированного оценивания [23], а в англоязычной литературе - несколько наименований: set membership approach, set estimation, worst-case estimation и др. [103]. Концепция гарантированного оценивания заключается в описании множества параметров, согласованных с выбранным параметрическим семейством моделей, верхней границей на ошибку модели и данными наблюдений (измерений). В случает объектов вида (0.10) и ограничения на возмущение (0.13), искомое множество для набора измерений Уо = Ы°)> ■ • •»У(*)}> «о-1 = М°)> 1)} принимает вид ад := П w ш - в№8 " < } (°-15) s<t и представляет собой выпуклое многогранное множество, образованное пересечением полос (0.14). Поскольку сложность описания множеств Qp(t) растет по мере получения новых данных, внимание специалистов по идентификации было сосредоточено исключительно на построении различных внешних и внутренних аппроксимаций множеств ©p(t) множествами более простой структуры: эллипсоидами или полиэдрами фиксированной сложности. Для характеристики большого потока публикаций, посвященных задачам оценивания параметров при предположении ограниченности возмущений, достаточно назвать специальные выпуски журналов [125, 127, 129], содержащие богатую библиографию по этим вопросам. Однако с точки зрения теории гарантированного оценивания все объекты с параметрами из множества @p(t) рассматриваются как равноправные, а сама задача идентификации считается исчерпывающе решенной при наличии полного описания множества Qp(t). Несмотря на стандартную мотивировку рассматриваемых задач оценивания исходными задачами управления, вопрос о выборе той или иной конкретной оценки, которой можно было бы воспользоваться в задаче управления, либо вообще не ставится, либо ограничивается замечанием о возможности использования в качестве искомой оценки чебышевского центра множества Оp(t) или другой оценки минимаксного типа. Однако до настоящего времени не получено никаких строгих результатов, касающихся применения результатов теории гарантированного оценивания к задачам управления на неограниченном интервале времени. Редкие публикации на эту тему сводятся к изложению тех или иных эвристических соображений [94, 133]. Не будет преувеличением сказать, что результаты многочисленных публикаций по теории гарантированного оценивания не нашли приложений в задачах адаптивного управления.

Идентификация и робастное управление. В связи с бурным развитием в 80-х гг. теории робастного управления встал вопрос о разработке адекватной ей теории идентификации и оценивания параметров, поскольку модель ограниченных возмущений не соответствовала описанию параметрических возмущений в теории робастного управления в операторной форме. В частности, выходы параметрических возмущений нельзя считать априори ограниченными в исходном пространстве сигналов. Полученные к середине 90-х гг. результаты по теории идентификации, ориентированной на задачи робастного управления, нашли отражение в специальных выпусках журналов [125, 128]. Оставляя в стороне задачи оценивания в частотной области, можно выделить два основных направления 'робастной' теории идентификации: задачи подтверждения модели (model validation) и теорию 1\ оценивания. Задачи подтверждения модели сводятся к вопросу проверки согласованности выбранной фиксированной модели системы с данными измерений и принятыми априорным предположениям о присутствующих в системе возмущениях [117, 109]. Следует отметить, что указанные задачи рассматриваются только при предположении об известных верхних границах норм всех учитываемых возмущений. Проблема выбора тестируемой модели остается вне рассмотрения в рамках этого направления теории идентификации.

Проблема построения модели является предметом теории 1\ оценивания. Примером задачи, рассматриваемой в рамках этой теории, является задача аппроксимации импульсной характеристики устойчивой линейной системы [82, 100]. В качестве меры близости системы и ее оценки используется 1\ норма, и критерий идентификации имеет вид наихудшего рассогласования системы и ее оценки в классе ограниченных аддитивных возмущений. Полученные в теории 1\ оценивания результаты относятся только к априори устойчивым системам и сводятся как правило не к вопросам непосредственного построения моделей, а к некоторым вопросам качественнонго характера. Несмотря на мотивацию этого направления теории оценивания задачами 1\ теории робастного управления, сама постановка рассматриваемых задач по существу не связана с 1\ теорией робастного управления, и в целом это направление 'робастной' теории идентификации развивается вне контекста задач робастного управления.

Несмотря на то, что проблемы построения теории идентификации, адекватной теории робастного управления, находятся с начала 90-х гг. в фокусе внимания современной теории управления, идентификация и робастное управление остаются в значительной степени независимыми областями исследований. Это дало основание авторам обзора [107] о современных методах оценивания, основанных на детерминированном (нестохастическом) описании возмущений, сделать вывод о том, что консервативность оценок верхних границ возмущений, чувствительность этих оценок к точности априорной информации и трудности с обеспечением соответствующей априорной информации являются следствиями самого детерминированного подхода. Одна из основных задач настоящей работы заключается в опровержении столь пессимистичного взгляда на возможности использования нестохастических моделей возмущений в задачах адаптивного робастного управления.

Постановки задач адаптивного управления. Первым необходимым требованием к качеству системы управления на бесконечном интервале времени является ее устойчивость, понимаемая как ограниченность всех сигналов в системе относительно некоторой фиксированной нормы. Задачу адаптивной стабилизации в самых общих словах можно охарактеризовать как задачу построения управления для неизвестного объекта из некоторого известного множества объектов, обеспечивающего устойчивость замкнутой системы управления в определенном классе допустимых возмущений. Если класс возмущений включает параметрические возмущения, то зачастую, чтобы подчеркнуть допустимость параметрических возмущений, говорят о задаче адаптивной робастной стабилизации. С математической точки зрения все полученные в теории адаптивного робастного управления результаты относятся к решению именно задачи адаптивной робастной стабилизации.

Предъявление к адаптивной системе любых дополнительных требований делает задачу синтеза адаптивного управления более трудной. Наиболее сильным, с математической точки зрения, дополнительным требованием является требование оптимальности системы, под которым обычно понимается минимизация заданного глобального показателя качества. Если в стохастической теории задача синтеза адаптивного управления изначально ставилась и решалась как задача оптимального управления, в детерминированных задачах адаптивного управления решение ограничивалось обычно обеспечением устойчивости замкнутой системы, а при обсуждении вопросов оптимальности последняя, как правило, относилась к тому или иному локальному показателю качества. Наиболее последовательно постановка детерминированной оптимальной задачи адаптивного управления проводилась в методе рекуррентных целевых неравенств [49]. Однако достигнутые в этом направлении результаты относятся только к минимально-фазовым объектам в условиях ограниченных аддитивных возмущений. Именно, если в объекте (0.10) возмущение v - произвольная последовательность, удовлетворяющая ограничению (0.13) с известной верхней границей <5^, то для любого числа р > 1 метод рекуррентных целевых неравенств позволяет построить адаптивное управление, гарантирующее ограниченность управления и неравенство

IMU < А •

Это неравенство обеспечивает субоптимальность адаптивного управления, поскольку число р может быть выбрано сколь угодно близким к 1, а значение р = 1 соответствует оптимальному управлению. Трудности обобщения этого результата на случай неминимально-фазовых объектов с помощью традиционных алгоритмов оценивания будут пояснены ниже при обсуждении выбора критерия идентификации в задаче синтеза неконсервативного адаптивного управления.

Наиболее продвинутые результаты в теории адаптивного робастного управления, относящиеся не только к задаче адаптивной робастной стабилизации, но и к оценке качества замкнутой адаптивной системы, были получены в работах [105, 110, 111, 143]. В указанных работах рассматривались задачи слежения для минимально-фазовых объектов, а полученные оценки показателей качества (как правило, относительно различных норм 'со взвешиванием' сигналов) при наличии параметрических возмущений являются достаточно грубыми. Другими словами, эти результаты также являются скорее качественными и означают допустимость малых параметрических возмущений в системе при использовании стандартных градиентных или МНК алгоритмов оценивания неизвестных параметров. Повторимся, что доказательство робастной устойчивости в задачах адаптивного робастного управления всегда проводится независимо от результатов 1р теорий робастного управления и опирается на аппарат функций Ляпунова.

В настоящей работе рассматривается задача синтеза неконсервативного адаптивного управления, постановку которой проиллюстрируем для случая структурированных параметрических возмущений в объекте (0.10). Пусть суммарное возмущение v имеет вид v(t) = wa(t) + wy(t) + wu(t), wa||oo < Sw, Wy = 8yAiy, wu = 6uA2u , (0.16) где wa - ограниченное аддитивное возмущение, a wy и wu - параметрические возмущения с конечной памятью, не превосходящей некоторого известного значения ¡i. Указанные параметрические возмущения имеют следующее эквивалентное описание

KMI < Ьуту{1), ™>y(t) '■= \yt-l\oo, K(i)| < 6umu(t), mu(t) := \u\~l\oo ■

0.17)

Нормы 8W:6y:iöu всех возмущений в объекте считаются неизвестными. Введем вектор номинальных параметров объекта управления (0.10) в := (0J, 6У, 6U, 6W)T GR"0, щ := п + т + 4 , полученный добавлением к вектору коэффициентов 9р норм всех возмущений. Предположим, что для каждого вектора в из некоторого известного множества Qpr С Rn<? задан регулятор a(q-\e)u(t) = ß(q~\ 9)y{t) , а(0) := 1 , (0.18) обеспечивающий желаемое качество управления объектом с известным вектором номинальных параметров:

IHU < АМ(в)) = ^"¡f"" . (0.19)

I — Oy\\Lryv\\ — öu||(jruv||

В (0.19) G yv и Guv обозначают зависящие от в передаточные функции от возмущения v к выходу у и управлению и в замкнутой системе (0.10), (0.18). Следует подчеркнуть, что в отличие от классической теории управления, где выбор того или иного регулятора полностью определяется вектором коэффициентов 0Р, выбор робастного регулятора в общем случае может осуществляться с учетом норм возмущений. Набор

Ipr '•— {-^3(2)5 öpr} 5 включающий класс допустимых параметрических возмущений Dg(2), структуру объекта а = (n,m,d) и априорное множество Орг допустимых значений в, будем называть априорной информацией об объекте.

Задача синтеза неконсервативного адаптивного управления заключается в построении ограниченного управления, обеспечивающего выполнение неравенства (0.19) для выхода у объекта (0.10) с неизвестным вектором номинальных параметров 9 £ Qpr.

Дадим несколько комментариев к постановке задачи неконсервативного адаптивного управления. Неробастный вариант этой задачи, т. е. построение неконсервативного адаптивного управления при наличии только ограниченного аддитивного возмущения, рассматривался в работах [44, 123], в которых решение задачи было получено с использованием техники множественного оценивания неизвестных праметров. Несмотря на это, до настоящего времени даже сама возможность постановки подобной задачи представляется многим специалистам по адаптивному управлению невозможной. Так, в работе [130] выражено мнение, что гарантии качества, имеющиеся для объекта с известными параметрами, недостижимы при адаптивном управлении. Основанием для такого убеждения является то обстоятельство, что множество согласованных с наблюдениями и априорной информацией оценок 0Р(£), определенное формулой (0.15), состоит в общем случае из множества элементов, рассматриваемых как равноправные с точки зрения идентификации. Поэтому, ввиду невозможности точной идентификации вектора вр, авторы указанной работы считают невозможным и построение неконсервативного адаптивного управления. Близкое мнение было выражено в недавней работе [132], в которой устанавлены нижние границы для асимптотического качества адаптивного управления при использовании определенного класса алгоритмов оценивания. Единственным способом улучшения качества адаптивного управления считается введение возбуждающего сигнала в систему управления с целью уменьшения размеров множества ©(/), что приводит к некоторому ухудшению качества по сравнению с качеством, достижимым для объекта с известными парамеме-трами (при этом важную роль играет отношение нормы возбуждающего сигнала к норме возмущения).

Сформулированная выше задача синтеза неконсервативного адаптивного управления усложнена не только наличием параметрических возмущений, но и тем, что нормы всех возмущений предполагаются неизвестными. Заметим, что нормы параметрических возмущений обязаны быть ограниченными в силу условия робастной устойчивости

11^11 + ^11^11 < 1- (0-20)

В реальных задачах управления всегда можно считать известной и некоторую грубую верхнюю оценку величины однако в настоящей работе специально рассматривается ситуация с неизвестной верхней границей аддитивного возмущения. Это сделано с целью демонстрации важности выбора критерия идентификации в зависимости от сформулированной цели управления. Поясним сказанное детальнее. Множество номинальных векторов 0, согласованных с наблюдениями у^и^1, в случае параметрических возмущений с ограниченной памятью задается системой линейных относительно в неравенств: вй = р| |а(д1)у(в) - < <5ут„(в) + Ьити(з) + <5№ . в<Л

Принципиальное отличие множеств ©(¿) от множеств гарантированных оценок связано именно с тем обстоятельством, что множества ©(/) не ограничены в направлениях компонент 6у,6и,8ю вектора в. Даже с учетом необходимости ограничить компоненты 8у и 6и условием робаст-ной устойчивости (0.20), множества ©(¿) остаются неограниченным в направлении компоненты 6Ш. Более того, при любой последовательности управлений на любом промежутке времени вектор в = (¿^Г, 6и)т с любым вектором 9С будет согласован с наблюдениями у^и1^1 при достаточно большом значении 8т. Другими словами, если верхняя граница аддитивного возмущения в объекте (0.10) неизвестна, то любое рассогласование в любой модели объекта можно объяснить воздействием достаточно большого аддитивного возмущения. Тем самым, для рассматриваемой задачи адаптивного управления становятся принципиально неприменимыми никакие соображения, связанные с расчетом на уточнение информации о неизвестном векторе коэффициентов 9р и составляющие идейную основу теории гарантированного оценивания.

Если в качестве регулятора (0.18) выбран 1\ оптимальный робастный регулятор, то задачу синтеза неконсервативного адаптивного управления можно назвать задачей синтеза адаптивного 1\ оптимального ро-бастного управления.

Задачи адаптивной стабилизации и синтеза неконсервативного адаптивного управления находятся на противоположных полюсах спектра возможных постановок задач адаптивного управления при заданном показателе качества. Задача адаптивной стабилизации предъявляет минимальное требование к замкнутой системе - ограниченность показателя качества. Задача синтеза неконсервативного адаптивного управления предъявляет максимальное требование - гарантированное значение показателя качества в замкнутой адаптивной системе должно быть не хуже качества, гарантированного для объекта с известным вектором номинальных параметров. Промежуточной между двумя названными задачами является задача синтеза адаптивного управления, гарантирующего заранее заданную верхнюю оценку показателя качества. В настоящей работе рассматриваются в основном первые две задачи. Исключение составляют замечание о задаче синтеза адаптивного управления с гарантированной оценкой показателя качества для объектов с неизвестной структурой и задачи синтеза адаптивного управления на основе конусного алгоритма оценивания.

Выбор критерия идентификации. Согласно общепринятому в теории непрямого адаптивного управления принципу разделения задачу синтеза регулятора для объекта с известными параметрами и задачу оценивания неизвестных параметров следует рассматривать независимо, и оптимальное решение каждой из указанных задач обеспечит наилучшее качество адаптивного управления [81]. В соответствии с этим принципом все стандартные алгоритмы оценивания неизвестных параметров в детерминированных задачах адаптивного управления основывались на минимизации в том или ином смысле невязок в модели управляемого объекта. При этом выбор алгоритма оценивания определялся предпочтениями автора, а те или иные модификации стандартных градиентных и МНК алгоритмов оценивания диктовались стремлением гарантировать глобальную устойчивость замкнутой адаптивной системы при тех или иных расматриваемых возмущениях.

В связи с развитием теории робастного управления, предметом рассмотрения которой стал учет параметрических возмущений в системах управления, актуализировался вопрос о выборе критерия идентификации. Причиной актуализации стало то обстоятельство, что при наличии в системе возмущений различной природы необходимо ответить на вопрос об относительном вкладе в суммарное возмущение каждого из учитываемых возмущений. К настоящему времени этот вопрос остается в целом неразработанным, и публикациях на эту тему он рассматривается вне контекста задачи управления. Типичным примером является одна из наиболее часто цитируемых статья [117], в которой рассматривались линейные стационарные возмущения, и основным сигнальным пространством являлось пространство ¿2- В терминах объекта (0.10) с возмущениями (0.16), (0.17) обсуждавшиеся в [117] задачи эквивалентны следующим :

1. для данного набора наблюдений у*0, и^1 требуется найти минимальное число 8тт такое, что существует вектор 9 = (9р,6у,6и,6хю)Т, согласованный с наблюдениями и с априорной информацией 1рг и такой, что тах{«5у,<М4<6тг>1.

2. Для данного набора наблюдений у^и^1 и для заданного фиксированного значения 6тах требуется найти минимальное вещественное число 6™гп такое, что существует вектор 9 = (9р, 6р, 8Ю)Т, согласованный с наблюдениями и с априорной информацией 1рг и такой, что тах^, А} < <Гаж , и

Достаточно очевидно, что решение первой задачи может оказаться формально непригодным для выбора соответствующей ее решению модели в качестве модели управляемого объекта, если для соответствующих этой модели параметров 6у и 6и нарушено условие робастной устойчивости, что заведомо произойдет при относительно большом аддитивном возмущении в объекте. Решение второй задачи может быть согласовано с условием робастиой устойчивости за счет выбора достаточно малого значения верхней границы 6тах с неизбежным огрублением условия ро-бастной устойчивости. Достаточно очевидно также, что ни одна из сформулированных задач не позволяет обеспечить решение задачи синтеза неконсервативного адаптивного управления.

Решение задачи синтеза неконсервативного адаптивного управления может быть обеспечено благодаря выбору робастного показателя качества J(M(6)) в качестве критерия идентификации, и основная идея решения указанной задачи сводится к выбору текущих оценок 9{t) неизвестного вектора номинальных параметров в согласно этому критерию:

0(t) G argmin J(M{t)) . (0.21) ге0(г)п0рг

В первом разделе главы 4 приведены соображения, поясняющие необходимость выбора показателя качества задачи управления в качестве критерия идентификации в задаче синтеза неконсервативного адаптивного управления. К сожалению, изложенные соображения не поддаются строгой математической формализации в связи с асимптотическим характером рассматриваемого показателя качества. Описанная ключевая идея была предложена в работах [44, 123], где она эксплуатировалась для синтеза неконсервативного адаптивного управления в случае ограниченных аддитивных возмущений. В работе [62] она использовалась для построения адаптивного 1\ оптимального управления в более широком классе ограниченных аддитивных возмущений, описываемых обновляющимися процессами [4]. Подобная (0.21) идея 'предпочтительной' идентификации (preferantial identification) была предложена в работе [95] для случая основного пространства сигналов L2,<r. Указанная работа ограничиваетсся по существу формулировкой ряда определениий и постановок задач оценивания.

Реализация формулы (0.21) требует решения двух сопутствующих проблем: оценки поведения замкнутой адаптивной системы и необходимости хранения неограниченно возрастающего объема информации для запоминания множеств O(i). Одним из простых путей решения первой проблемы является дискретизация значений робастного показателя качества и сохранение текущей оценки 9{t) неизменной до тех пор, пока соответствующий этой оценке регулятор обеспечивает достаточно близкое, в том же интервале дискретизации, значение показателя качества для какого-либо другого объекта, согласованного с наблюдениями и априорной информацией. В результате такой дискретизации предельная модель номинальной системы, асимптотически согласованная с наблюдениями и априорной информацией, становится линейной стационарной, что позволяет делать выводы о ее качестве. Однако этот путь не снимает проблемы неограниченности требуемой памяти. Для решения этой проблемы вместо множеств согласованных с наблюдениями оценок 0(£) в настоящей работе используются множественные оценки Е^), обновляемые только в том случае, когда текущая оценка в{{) не попадает в е-окрестность вновь поступающих ограничений с заранее выбранным параметром £ > 0. Описанный способ введения зоны нечувствительности позволяет гарантировать конечную сходимость алгоритма оценивания и сколь угодно точное приближенное решение задачи синтеза неконсервативного адаптивного управления. При этом платой за повышения точности решения выступает рост требуемой памяти и требуемой компьютерной мощности. Реализация описанного подхода описана в главе 4 настоящей работы.

Недостаток любого асимптотического показателя качества заключается в исключении из рассмотрения переходных процессов в системе управления. Следствием этого недостатка является то, что рассмотренные выше задачи адаптивного управления допускают решение посредством алгоритмов оценивания переборного типа, что проиллюстрировано в главе 3. Рассматриваемые в настоящей работе алгоритмы адаптивного управления, основанные на множественном оценивании неизвестных параметров, по существу ориентированы на достижение гарантированных оценок показателя качества за возможно короткое время. Будучи достаточно сложными в своих исходных формулировках, предложенные алгоритмы адаптивного управления допускают основанные на различных эвристических соображениях работоспособные аппроксимации разной степени сложности.

Примером такой, частично обоснованной, аппроксимации является адаптивное управление на основе конусного алгоритма оценивания, описанное в главе 4. Конусный алгоритм оценивания использует множественные оценки параметров в виде конусов, описываемых ровно столькими линейными неравенствами, каково число оцениваемых неизвестных параметров. Поскольку при использовании множественных оценок запоминается большая информация о поведении системы управления по сравнению со стандартными градиентными и МНК алгоритмами оценивания, эту информацией желательно распоряжаться в целях достижения более сильных целей управления, нежели простая стабилизация адаптивной систмы. В частности, конусный алгоритм оценивания позволяет гарантировать неравенство

0.22) где е - любое наперед выбранное положительное число, Gy и Gu ~ любые наперед выбранные верхние оценки норм передаточных операторов

Gy> sup \\Gyv(d)\\ и Gu> sup \\Guv{e)\\,

0(z@pr в&Орг и 6w,6y,6u - неидентифицируемые нормы возмущений в управляемом объекте. Неравенство (0.22) означает, что конусный алгоритм оценивания позволяет гарантировать оптимальную по нормам возмущений равномерную по вр G Bp оценку робастного показателя качества. Следует заметить, что оценка (0.22) намного сильнее других известных в литературе по адаптивному робастному управлению оценок качества выхода.

Благодарности. Настоящая работа базируется на двух основных источниках: концепции адаптивного управления, предложенной В.А. Якубовичем во второй половине 60-х, и концепции множественного оценивания, предложенной А.Б. Куржанским в 70-х. С подходом В.А. Якубовича автор имел возможность познакомиться, будучи студентом и аспирантом кафедры математической кибернетики в Ленинградском государственном университете, возглавляемой В.А. Якубовичем, и во время нескольких научных стажировок на этой же кафедре в последующие годы. С подходом А.Б. Куржанского автора познакомил его научный руководитель В.Н. Фомин, которому автор благодарен за многочисленные полезные уроки, внимание и поддержку. Значительное влияние на методы и результаты настоящей работы оказало научное общение автора с сотрудниками лаборатории теоретической кибернетики в С.-Петербургском государственном университете А.Е. Барабановым и C.B. Гусевым. На заключительном этапе работы неоценимую помощь автору оказали стипендия Шведского института и гостеприимство главы департамента автоматического управления Королевского технологического института в Стокгольме проф. Бо Валберга (В. Walberg), благодаря которым автор имел возможность ознакомиться со многими опубликованными за рубежом и необходимыми для настоящей работы материалами.

Заключение диссертация на тему "Адаптивное робастное управление в l1 постановке"

выход возмущение

Заключение

В заключение перечислим основные результаты настоящей диссертационной работы.

Глава 1 посвящена обобщениям известных результатов 1\ теории ро-бастного управления, ориентированным на решение глобальной задачи настоящей работы - построение моделей номинальных систем управления, адекватных этой теории. В разделах 1.1-1.3 приведены основные обозначения и определения, а также основные известные результаты 11 теории робастного управления. В разделе 1.3 получено также многомерное обобщение формулы для робастного показателя качества и важное следствие о наибольшем в классе возмущений значении нормы оператора Д(/ — М^Д)-1.

Раздел 1.4 посвящен классу параметрических возмущений с конечной памятью. В разделе 1.4.1 получена формула для робастного показателя качества в случае скалярных сигналов. В разделах 1.4.2 и 1.4.3 доказаны многомерные обобщения критерия робастной устойчивости и теоремы о достижении асимптотического робастного качества, получен-ныее в [90] для скалярного случая. На основании этих обобщений в разделе 1.4.4 получены формулы для асимптотических робастных показателей качества для систем с фиксированными входными сигналами и без таковых, т.е. формулы для показателей качества в задачах слежения и регулирования. В разделе 1.4.5 обсуждается неверифицируемость модели возмущений с конечной памятью на основании данных измерений и необходимость рассмотрения иной модели возмущений.

В разделе 1.5. рассматриваются параметрические возмущения с ограниченной памятью, составляющие подкласс класса возмущений с конечной памятью. В разделе 1.5.1 дано определение возмущений с ограниченной памятью и приведен критерий принадлежности оператора возмущений этому классу в терминах неравенств относительно входов и выходов оператора возмущений. Доказана справедливость этого критерия для линейных нестационарных и нелинейных операторов возмущений. В разделе 1.5.2 получен критерий робастной устойчивости для систем с конечными импульсными характеристиками (И11-системы). В разделах 1.5.3 и 1.5.4 доказаны важные для приложений теоремы о сходимости значений робастного показателя качества в классе возмущений с ограниченной памятью к значению робастного показателя качества в классе возмущений с конечной памятью при неограниченном росте памяти возмущений. В задаче слежения такая сходимость имеет место при некотором дополнительном требовании к задающему сигналу. Показано, что указанное требование выполняется, в частности, для периодического задающего сигнала.

В разделе 1.6 рассматриваются класс возмущений с затухающей памятью и его подкласс возмущений с экспоненциально затухающими импульсными характеристиками. В разделе 1.6.1 поясняется справедливость всех результатов для класса возмущений с конечной памятью в равной мере и для класса возмущений с затухающей памятью и обсуждается неверифицируемость модели возмущений с затухающей памятью. Здесь же приводится определение возмущений с экспоненциально затухающими импульсными характеристиками и доказывается критерий принадлежности оператора возмущений этому классу в терминах неравенств относительно входов и выходов оператора возмущений. Классы возмущений, близкие к классу возмущений с экспоненциально затухающими импульсными характеристиками наиболее широко используются в работах по адаптивному робастному управлению. В разделе 1.6.2 приведен построенный А.Е. Барабановым пример, демонстрирующий различие в робастных показателях качества в классах возмущений с затухающей памятью и с экспоненциально затухающими импульсными характеристиками. Здесь же рассмотрены некоторые специальные классы систем, в которых сохраняется равенство робастных показателей качества в указанных классах возмущений.

В разделе 1.7 полученные ранее результаты формулируются в наиболее общем виде для многомерных систем содержащих как фиксированные входные сигналы, так и аддитивные возмущения. Поясняется возможность рассмотрения задачи слежения как частного случая полученных ранее результатов.

В главе 2 рассматриваются конечномерные объекты управления со скалярным входом и скалярным выходом (SISO объекты). В разделе 2.1 результаты главы 1 применяются к SISO объекту управления с линейным стационарным регулятором в цепи обратной связи. Рассматриваются случаи независимых параметричеких возмущений в каналах выхода и управления (структурированная неопределенность) и смешанных параметрических возмущений (неструктурированная неопределенность). В разделе 2.1.2 получены явные формулы для асимптотичесих показателей качества в задаче регулирования для обоих типов неопределенностей. В разделе 2.1.3 получено обобщение этих формул на задачу слежения при дополнительном учете влияния аддитивной ограниченной помехи измерений выхода.

Раздел 2.2 является описательным и содержит краткое изложение необходимых впоследствии некоторых результатов теории 1\ оптимального управления. В разделе 2.2.1 приведена формулировка задачи синтеза 1\ оптимального регулятора. Раздел 2.2.2 содержит краткое описание предложенного в работах [87, 88] метода Q-масштабирования приближенного решения задач li оптимального управления. В разделе 2.2.3 приведены рассматривавшиеся в литературе по 1\ теории робастного управления постановки различных задач синтеза робастных регуляторов и обсуждается их различие. Отмечено, что наиболее естественная задача синтеза 1\ оптимального робастного регулятора, минимизирующего наихудшую в классе параметрических и аддитивных возмущений норму (или установившуюся норму) выхода системы, в литературе не рассматривалась.

В разделе 2.3 дано решение задачи синтеза 1\ субоптимального робастного регуляторов для класса структурированных возмущений. Решение основано на сведении исходной задачи к выбору наилучшего решения из однопараметрического семейства стандартных задач 1\ оптимизации. Построение необходимых верхних и нижних оценок показателей качества осуществляется методом Q-масштабирования, предложенным в [87, 88]. Приводены алгоритмы проверки робастной стабилизируемости объекта и синтеза субоптимального регулятора.

В разделе 2.4 аналогичные результаты получены для класса неструктурированных возмущений. В этом случае задача сводится к выбору наилучшего решения из семейства нестандартных задач 1\ оптимизации. Для получения верхних и нижних оценок оптимального значения этих нестандартных задач предложено обобщение метода Q -масштабирования. Предложенное обобщение позволяет решать задачи синтеза субоптимальных робастных регуляторов с показателями качества, включающими управление.

Глава 3 посвящена обсуждению проблем оценивания и решению задачи адаптивной стабилизации. В разделе 3.1.1 приведены формулировки задач адаптивной стабилизации и синтеза неконсервативного адаптивного управления. Вторая задача является гораздо более сложной и в литературе по адаптивному управлению не рассматривалась. Частным случаем этой задачи является задача синтеза адаптивного оптимального робастного управления. В разделе 3.1.2 определены 4 основных типа априорной информации, рассматривающиеся в настоящей работе и соответствующие классам структурированных или неструктурированных параметрических возмущений с ограниченной памятью или с экспоненциально затухающими импульсными характеристиками. Особо подчеркнуто, что понятие априорной информации эквивалентно набору базовых предположений, необходимых для формулировки строгих математических результатов и одной из основных задач настоящей работы является минимизация необходимой для построения адаптивного управления априорной информации. В этом же разделе детально поясняется отличие робастных регуляторов от классических в том отношении, что выбор того или иного робастного регулятора в задаче регулирования может зависеть не только от коэффициентов уравнения объекта, как в классическом случае, но ит от норм возмущений.

Раздел 3 посвящен проблеме оценивания неизвестных номинальных параметров. В разделе 3.2.1 введено понятие согласованных с наблюдениями и априорной информацией оценок и формализовано понятие неидентифицируемости вектора номинальных параметров управляемого объекта. Приведены критерии проверки согласованности оценок для четырех основных типов априорной информации. В разделе 3.2.2 введено понятие множества согласованных с наблюдениями и априорной информацией оценок и детально обсуждается различие этих множеств для различных типов априорной информации. Показано, что в случае структурированных параметрических возмущений указанные множества описываются системой линейных неравенств, а в случае неструктурированных возмущений такое описание может использоваться только для внешних аппроксимаций этих множеств.

В разделе 3.3 показан недостаток формальных постановок задач адаптивного управления с функционалами асимптотического типа без учета переходных процессов и требующейся компьютерной мощности. В разделе 3.3.1 приведено формальное решение задачи адаптивной стабилизации с помощью переборного алгоритма оценивания минимальной сложности, неприемлемое для приложений как ввиду гигантского времени, необходимого для завершения переходных процессов, так и с точки зрения качества переходных процессов. В разделе 3.3.2 приведено формальное решение задачи синтеза неконсервативного адаптивного управления с помощью специального алгоритма оценивания, осуществляющего перебор по сетке в порядке возрастания значений показателя качества. Это формальное решение гораздо более трудной задачи непригодно для приложений как с точки зрения переходных процессов, так и с точки зрения необходимого объема вычислений.

Раздел 3.4 посвящен решению задачи адаптивной стабилизации с помощью алгоритма оценивания градиентного типа с зоной нечувствительности. Решение задачи лежит в рамках метода рекуррентных целевых неравенств и является его обобщением на задачи робастного управления и на случай отсутствия априорной информации о верхней границе аддитивного возмущения. В разделе 3.4.1 приведен конечно-сходящийся алгоритм оценивания, применяемый в разделе 3.4.2 для решения задачи адаптивной стабилизации. В разделе 3.4.3 предложена модификация алгоритма, позволяющая гарантировать его работоспособность для максимальной равномерной по др Е ©р области робастной устойчивости. В разделе 3.4.3 дано обобщение предыдущих результатов раздела 3.4 на случай невыпуклых априорных множеств и объектов неизвестной структуры. Недостаток предложенного обобщения заключается в использовании перебора по конечному набору допустимых априорных выпуклых множеств или вариантов структуры объекта.

Глава 4 посвящена синтезу адаптивного робастного управления на основе множественного оценивания. Поскольку множественное оценивание связано с запоминанием большего объема информации о поведении системы по сравнению со стандартными градиентными и МНК алгоритмами, оно позволяет решать более сложные задачи синтеза адаптивного управления. В разделе 4.1.1 приведен краткий обзор существующих методов идентификации, связанных с задачами робастного управления, а в разделе 4.1.2 обсуждаются соответствующие критерии идентификации. Отмечено, что известные критерии и методы не имеют в настоящее время приложений собственно к задачам адаптивного робастного управления. В разделе 4.1.3 приведены аргументы о необходимости выбора показателя качества в задаче управления в качестве критерия идентификации при решении задачи синтеза неконсервативного адаптивного управления.

В разделе 4.2 дано решение задачи синтеза неконсервативного адаптивного управления. В разделе 4.2.1 изложено приближенное решение на основе дискретизации значений показателя качества. Непрактичность этого решения связана с возрастанием требуемой для его реализации памяти. В разделе 4.2.2 дано описание и доказана конечная сходимость алгоритма множественного оценивания с зоной нечувствительности, а в разделе 4.2.3 дано приближенное решение задачи синтеза неконсервативного адаптивного управления с использованием этого алгоритма. Приближенное, с любой степенью точности, решение задачи достигается за счет высокой сложности алсгоритма: необходимости большого объема вычислений и конечной, но большой памяти. При этом повышение точности решения приводит к росту необходимой памяти и вычислительных затрат.

В разделе 4.3 приводится обобщение результатов раздела 4.2 на объекты неизвестной структуры и на задачи слежения. В задаче управления объектом неизвестной структуры предполагается наличие относительно небольшого числа возможных вариантов структуры, и поиск подходящей оценки структуры осуществляется также на основе критерия идентификации равного показателю качества в задаче управления, что позволяет избежать недостаков, присущих переборным алгоритмам. В задаче адаптивного слежения рассмотрены два различающихся по достижимому результату случая полностью известного задающего сигнала и априори неизвестного ограниченного сигнала.

В разделе 4.4 рассмотрено адаптивное управление на основе конусного алгоритма, оценивания. В разделе 4.4.1 приведено описание и доказаны некоторые свойства алгоритма. Конусный алгоритм имеет минимальную сложность, допустимую при множественном оценивании неизвестных параметров, и имеет дело с множественными оценками, включающими ровно щ линейных неравенств, где щ - число оцениваемых параметров. В разделе 4.4.2 на основе конусного алгоритма оценивания решена задача адаптивного управления с минимизацией оценки нормы аддитивного возмущения. В разделе 4.4.3 конусный алгоритм использован для минимизации по нормам возмущений равномерной по 9р 6 вр оценки робастного показателя качества. Решения, изложенные в разделах 4.4.2 и 4.4.3 получены при дополнительном предположении о сходимости оценок, доставляемых конусным алгоритмом. Частичное обоснование допустимости такого предположения приведено в разделе 4.4.1.

В разделе 4.5 обсуждаются проблемы реализации и приводятся результаты моделирования неконсервативного адаптивного управления. В разделе 4.5.1 рассмотрены некоторые возможные упрощения алгоритмов неконсервативного адаптивного управления, связанные с вычислением множественных и векторных оценок неизвестных параметров и выбором начальных оценок и основанные на тех или иных эвристических соображениях. В разделе 4.5.2 осбсуждаются возможности реализации субоптимального и квазиоптимального робастного управления. Достоинства и недостатки моделей параметрических возмущений с ограниченной памятью и с экспоненциально убывающими импульсными характеристиками рассмотрены в разделе 4.5.3. В заключительном разделе 4.5.4 приведены результаты численного моделирования упрощенной версии неконсервативного адаптивного управления для объекта второго порядка, подтверждающие возможность численной реализации предложенных законов адаптивного робастного управления с использованием множественного оценивания.

Библиография Соколов, Виктор Федорович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Аксенов Г.С., Фомин В.Н. Метод функций Ляпунова в задаче синтеза адптивных регуляторов // Вопросы кибернетики. Адаптивные системы управления. 1979. М. Научный совет по кибернетике АН СССР. С. 69-93.

2. Александров А.Г. Частотное адаптивное управление I. II. // Автоматика и телемеханика. 1994. N. 12. С. 93-104, 1995. N. 1 С. 117-128.

3. Андронов A.A., Понтрягин JI.C. Грубые системы // ДАН СССР. 1937. Т. 14. N. 5. С. 247-250.

4. Барабанов А.Е. Синтез минимаксных регуляторов. С.-Петербург. Изд. С.-Петербургсоко университета, 1996.

5. Барабанов А.Е., Граничин О.Н. Оптимальный регулятор линейного объекта с ограниченной помехой// АиТ. 1984. N. 5. С. 39-46.

6. Барабанов А.Е., Первозванский A.A. Оптимизация по равномерно-частотным показателям (üi-теория) // Автоматика и телемеханика. 1992. N. 9. С. 3-32.

7. Бесекерский В.А., Небылов A.B. Робастные системы автоматического управления. 1983. М. Наука. 240с.

8. Бондарко В.А. Адаптивное субоптимальное управление решениями линейных разностных уравнений. Докл. АН СССР. 1983. т. 270. N. 2. С. 301-303.

9. Бондарко В.А. Адаптивная стабилизация неминимально-фазовых объектов с неизвестным запаздыванием // Известия АН. Техническая кибернентика. 1992. N. 6. С. 77-83.

10. Брусин В.А. Синтез беспоисковой самонастраивающейся системы методом теории абсолютной устойчивости // Автоматика и телемеханика. 1978. N. 7. С. 61-67.

11. Воронов A.A. Введение в динамику сложных управляемых систем. 1985. М. Наука. 352с.

12. Гусев C.B. Конечно-сходящийся алгоритм восстановления функции регрессии и его применение в задачах адаптивного управления. Автоматика и телемеханикаю 1989. N. 3. С. 79-85.

13. Гантмахер Ф.Р. Теория матриц. М. Наука, 1988.

14. Емельянов C.B., Живоглядов П.В., Коровин С.К., Никитин C.B. Асимптотика допустимых параметрических возмущений в задаче стабилизации неопределенной дискретной системы // Автоматика и телемеханика. 1991. N. 7. С. 41-52.

15. Коган М.М., Неймарк Ю.И. Функциональные возможности адаптивного локально-оптимального управления // Автоматика и телемеханика. 1994. N. 6. С. 94-105.

16. Коган М.М., Неймарк Ю.И. Адаптивное управление стохастическим объектом с неизмеряемым состоянием в условиях неидентифицируемости // Автоматика и телемеханика. 1992. N. 6. С. 114122.

17. Козлов Ю.М., Юсупов P.M. Беспоисковые самонастраивающиеся системы. 1969. М. Наука. 455 с.

18. Красовский H.H. Управление динамической системой. 1985. М. Наука. 518 с.

19. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. 1974. М. Наука. 446 с.

20. Кульчицкий О.Ю. Адаптивное управление линейными динамическими объектами с помощью модифицированного метода наименьших квадратов // Автоматика и телемеханика, 1987. N. 1. С. 89-105.

21. Кунцевич В.М., Лычак М.М. Синтез оптимальных и адаптивных систем управления. Игровой подход. Киев, 1985. 247 с.

22. Кунцевич В.М., Лычак М.М. Об оптимальном и адаптивном управлении динамическими объектами в условиях неопределенности. Автоматика и телемеханика. 1979. N. 1. С. 79-88.

23. Куржанский A.B. Задачи идентификации теория гарантированных оценок // АиТ. 1991. N. 2. С. 3-26.

24. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. 1977. М. Наука. 392 с.

25. Любачевский БД. Рекуррентный алгоритм адаптивного управления линейным дискретным динамическим объектом // Автоматика и телемеханика. 1974. N. 3. С. 83-94.

26. Неймарк Ю.И. Меры робастной устойчивости линейных систем // Автоматика и телемеханика. 1993. N. 1. С. 107-110.

27. Неймарк Ю.И. Робастная устойчивость линейных систем // Докл. АН СССР, 1991. Т. 319. N. 1. С. 578-580.

28. Никифоров В.О., Фрадков А.Л. Схемы адаптивного управления с расширенной ошибкой // Автоматика и телемеханика. 1994. N. 9. С. 3-22.

29. Павлов Б.В., Соловьев И.Г. Системы прямого адаптивного управления. 1989. М. Наука.

30. Пенев Г.Я., Якубович В.А. О некоторых задачах адаптивного управления // ДАН СССР. 1971. Т. 198. N. 4. С. 787-790.

31. Петров Б.Н., Рутковский В.Ю., Крутова И.Н., Земляков С.Д. Принципы построения и проектирования самонастраивающихся систем управления. 1972. М. Машиностроение. 260 с.

32. Первозванский A.A. Курс теории автоматического управления. 1985. М. Наука. 616 с.

33. Позняк A.C., Себряков Г.Г., Семенов A.B., Федосов Е.А. Н°°-теория управления: феномен, достижения, перспективы, открытые проблемы. 1990. М. Гос. НИИАС, ИПУ.

34. Поляк Б. Т., Цыпкин Я.З. Робастный критерий Найквиста // Автоматика и телемеханика. 1992. N. 7. С. 25-32.

35. Поляк Б. Т., Цыпкин Я.З. Робастная устойчивость линейных дискретных систем // Докл. АН СССР. 1990. Т. 316, N. 4. С. 842-846.

36. Пшеничный Б.Н. выпуклый анализ и экстремальные задачи. М.: Наука, 1980.

37. Соколов В.Ф. Адаптивное робастное управление дискретным скалярным объектом в Ii постановке // Автоматика и телемеханика. 1998. N. 3. С. 107-131.

38. Соколов В. Ф. Адаптивное управление линейным дискретным объектом в условиях аддитивных и параметрических возмущений //

39. Алгебра, дифф. уравнения и теория вероятностей", Труды Коми научного центра УрО РАН, 1997. No. 151. Сыктывкар. С. 85-111.

40. Соколов В. Ф. Робастное качество линейного регулятора для линейного дискретного объекта в 1\ постановке // Вестник Сыкт. ун-та. 1996. Сер. 1: математика, механика, информатика, Выпуск 2. С. 213-224.

41. Соколов В.Ф. Адаптивное робастное управление с гарантированным результатом в условиях ограниченных возмущений// АиТ. 1994. N. 2. С. 121-131.

42. Соколов В.Ф. Рекуррентное линейное программирование в задачах адаптивного минимаксного управления// Известия РАН. Техническая кибернетика. 1993. N.3. С. 103-109.

43. Соколов В.Ф. Адаптивное минимаксное управление на основе рекуррентного линейного программирования// Автоматика и телемеханика. 1993. N. 12. С. 127-139.

44. Соколов В.Ф. Адаптивное субоптимальное управление линейным объектом первого порядка с ограниченными помехами в объекте и измерениях // Автоматика и телемеханика. 1990. N. 12. С. 125-135.

45. Соколов В.Ф. Адаптивное субоптимальное управление в случае ограниченной помехи // Автоматика и телемеханика. 1985. N. 9. С. 78-86.

46. Справочник по теории автоматического управления. Под ред. А.А.Красовского. 1987. М. Наука. 711 с.

47. Срагович В.Г. Адаптивное управление. 1981. М. Наука. 382 с.

48. Фелъдбаум A.A. Теория дуального управления. I, II. // Автоматика и телемеханика. 1960.

49. Фомин В.Н. Методы управления линейными дискретными объектами. Л.: Изд-во. ЛГУ, 1985.

50. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981.

51. Фрадков А.Я. Адаптивное управление в сложных системах. 1990. М. Наука. 293 с.

52. Харитонов В. JI. Асимптотическая устойчивость семейства систем линейных дифференциальных уравнений // Дифференциальные уравнения. 1978. N. 11. С. 2086-2088.

53. Хачиян Л. Г. Сложность задач линейного программирования // Новое в жизни, науке, технике. Математика, кибернетика. Знание. 1987. N. 10.

54. Цыпкин Я.З. Адаптация и обучение в автоматических системах. 1968. М. Наука. 309 с.

55. Черноусъко Ф.Л., Меликян А. А. Игровые задачи управления и поиска. 1978. М. Наука. 278 с.

56. Якубович В.А. Конечно сходящиеся алгоритмы решения счетных систем неравенств и их применение в задачах построения адаптивных систем // ДАН СССР. 1969. Т. 189. N. 3. С. 495-498.

57. Якубович В.А. К теории адаптивных систем // ДАН СССР. 1968. Т. 183. N. 3. С. 518-521.

58. Якубович В.А. Рекуррентные конечно сходящиеся алгоритмы решения счетных систем неравенств // ДАН СССР. 1966. Т. 166. N. 6. С. 1308-1311.

59. Якубович Е.Д. Решение задачи оптимального управления линейным дискретным объектом // Автоматика и телемеханика. 1975. N. 9. С. 73-79.

60. Astrom K.J. Adaptive control around 1960 // Proceedings of the 34th Conference on Decision and Control. 1995. New Orleans. LA. December. P. 2784-2789.

61. Astrom K.J., Wittenmark В/ Adaptive control. 1989. Addison-Wesley. Reading. M.A.

62. Bai E.-W., Nagpal K.M., Tempo R. Bounded-error parameter estimation: noise models and recursive algorithms // Automatica. 1996. V. 32. N. 7. P. 985-999.

63. Barabanov A.E. Adaptive ^-optimal control for SISO plant // Proc. of the 34th Conference on Decision and Control. 1995. New Orleans, LA, December.

64. Becker A.H., Kumar P.R., Wei C.Z. Adaptive control with the stochastic approximation algorithm: geometry and convergence // IEEE Transactions on Automatic Control. 1985. V. 30. P. 330-338.

65. Bellman R. Adaptive Control Processes A Guided Tour. Princeton University Press. Prinstone. 1961.

66. Chechurin L.S., H. Choi, J.H. Kim, A. A. Pervozvanski Robust control in linear systems. St. Petersburg. St.Petrsburg State Technical University. 1998.

67. M.A.Dahleh "BIBO stability robustness in the presence of coprime factor perturbations", IEEE Trans. Automat. Control, 1992, vol. AC-37, pp. 352-355.

68. Dahleh M.A. and Diaz-Bobillo I.J. Control of uncertain systems: a linear programming approach. Englewood Cliffs. NJ:Prentice-Hall. 1995.

69. Dahleh M.A., Khammash M.H. Control design for plants with structured uncertainty// Automatica. 1993. V. 29. P.37-56.

70. Dahleh M.A., Ohta Y. A necessary and sufficient condition for robust BIBO stability // Systems and Control Letters. 1988. V. 11. P. 271-275.

71. Dahleh M.A., Pearson J.B. 11 optimal-feedback controllers for discrete-time systems// Proc. American Control Conference. 1986. Seattle, WA, June, P. 1964-1968.

72. Dahleh M.A., Pearson J.B. ^-optimal feedback controllers for MIMO discrete-time systems// IEEE Trans. Autom. Control. 1987. V. 32. P. 314-322.

73. J.S.McDonald and J.B.Pearson /i-optimal control of multivariable systems with output norm constraints, Automatica, vol. 27, pp. 317-329, 1991.

74. Doyle J.C. Analysis of feedback systems with structured uncertainty // IEE Proceedings. Pt.D. 1982. V. 129. N. 6. P. 242-250.

75. Doyle J.C., Stein G. Multivariable feedback design: Concepts for a classical/modern synthesis // IEEE Transactions on Automatic Control. 1981. V. 26. P. 4-16.

76. Doyle J.C., Wall J.E., Stein G. Performance and robustness analysis for structured uncertainties // Proceedings of the 20th Conference on Decision and Control. 1982. December.

77. Egardt B. Stability of adaptive controllers. 1979. Springer-Verlag. New York.

78. Elia N., P.M. Young, and M.A. Dahleh Robust preformance for both fixed and worst case inputs // Proc. of the 34rd Conference on Decision and Control. 1995. New Orleans, LA, December, P. 3170 3175.

79. Fogel E. and Huang Y.F. On the value of information in system identification bounded noise case. Automatica. 1982. V.18. P. 229-238.

80. Giri F., M. M'Saad, L. Dugard, and M. Dion Robust pole placement indirect adaptive control. 1988. International Journal of Adaptive Control and Signal Processing. V. 2. P. 33-47.

81. Goodwin G.C., Sin K.S. Adaptive Filtering, Prediction and Control. N.J.: Prentice-Hall, 1984.

82. Goodwin, G.C., B.Ninness, P.Cockerell, and M.Salgado Illustration of an integrated approach to adaptive control. 1990. Int. J. Adaptive Control and Signal Processing, 4, 149-162.

83. Jerby A. and E. W. Kamen Large robust adaptive control of discrete-time systems with arbitrary rate of variations. Journal of Mathematical Systems, Estimation, and Control. 1996. V. 6. N. 4. P. 465-468.

84. Kalman R.E. Design of self-optimizing control system // Transactions of the ASME. 1958. V. 80. P. 468-478.

85. Kosut R.L. Adaptive control via parameter set estimation // International Journal of Adaptive Control and Signal Processing. 1988. V. 2. P. 371-400.

86. Khammash M.H. The scaled-Q method for solving l\ optimization problems// Proc. of the American Control Conference. 1997. Albuquerque, New Mexico, June 4-6, 1997.

87. Khammash M.H. Solution of the l\ MIMO control problem without zero interpolation// Proc. of the 35rd Conference on Decision and Control. 1996. Kobe, Japan, December, P. 4040-4045.

88. M.H. Khammash Synthesis of globally optimal controllers for robust, performance to unstructured uncertainty// IEEE Trans. Automat. Control, AC-41, pp. 189-198, 1996.

89. Khammash M.H. Robust steady-state tracking// IEEE Trans. Autom. Control. 1995. V. 40. P. 1872-1880.

90. Khammash M.H. Robust performance bounds for systems with time-varying uncertainty // Proc. of the 33rd Conference on Decision and Control. 1994. Lake Buena Vista, FL, December, P. 28-33.

91. Khammash M., Pearson J.B. Analysis and design for robust performance with structured uncertainty// Systems and Control Letters. 1993. V. 20. P. 179-187.

92. Khammash M., Pearson J.B. Performance Robustness of Discrete-Time Systems with Structured Uncertainty // IEEE Trans. Autom. Control. 1991. V. 36. P. 398-412.

93. Kosut R.L., M.K.Lau, S.P.Boyd Set-Membership Identification of Systems with Parametric and Nonparametric Uncertainty // IEEE Transactions on Automatic Control. 1992. V. 37. P. 929-941.

94. Màkilà P., Partington J.R., Gustafsson T.K. Worst-case control-relevant identification. Automatica. 1995. V. 31. N. 12. P. 1799-1819.

95. Mârtensson B. The order of any stabilizing regulator is sufficient a priori information for adaptive stabilization. Systems and Control Letters. 1985. V. 6. no. 2. P. 87-91.

96. Middleton R.H., Goodwin G.S., Hill D.J., Mayne D.Q. Design issues in adaptive control. IEEE Trans. Autom. Control. 1988. V. AC-33, P. 50-58.

97. Milanese M., Belforte G. Estimations theory and uncertainty intervals evaluation in the presence of unknown but bounded errors: linear families of models and estimators // IEEE Transactions on Automatic Control. 1982. V. 27. P. 408-414.

98. Mo S., J.P. Norton Recursive parameter bounding algorithms which compute polytope bounds. // Proc. 12th IMACS World Congress. 1988. V. 2. P. 477-480.

99. Naik S.M., Kumar P.R. Robust indirect adaptive control of time-varying plants with unmodeled dynamics and disturbances// SI AM J. Control and Optimization. 1994. V. 32. P. 1696-1725.

100. Narendra K.S., Annaswamy A.M. Stable Adaptive Systems. 1989. Prentice-Hall. Englewood Cliffs. NJ.

101. Ninnes B., Goodwin G.C. Estimation of model quality. Automatica. 1995. V. 31. N. 12. P. 1771-1797.

102. Ortega R., Tang Y. Robustness of adaptive controllers a servey // Automatica. 1989. V. 25. N. 5. P. 651-677.

103. Poolla K., Khargonekhar P., Tikku A., Krause J., Nagpal K. A timedomain approach to model validation. IEEE Trans. Autom. Control. 1994. V. 39. N.5. P. 951-959.

104. Praly, L., Lin S.-F., Kumar P.R. A robust adaptive minimum variance controller// SIAM J. Control and Optimization. 1989. V. 27. P. 235266.

105. Radenkovic M.S., Michel A.N. Robust Adaptive Systems and Self Stabilization // IEEE Trans. Autom. Control. 1992. V. 37. P. 13551369.

106. Safonov M. Stability margins of diagonally perturbed multivariable feedback systems // IEE Proceedings. Pt.D. 1982. V. 129. N. 6. P. 242-250.

107. Schweppe F. Recursive state estimation unknown but bounded errors and system inputs // IEEE Trans. Autom. Control. 1968. V. 23. P. 2228.116 117118119120121122123124125126

108. Simon H.A. Dynamic programming under uncertainty with a qudratic criterion function // Econometrica. 1956. V. 24. P. 74-81.

109. Sun J., Ioannou P. Robust Adaptive LQ Control Schemes // IEEE Trans. Autom. Control. 1992. V. 37. P. 100-106.

110. Smith, R.S. and J.C. Doyle Model Validation: A Connection Between Robust Control and Identification. IEEE Trans. Aut. Contr., 1992. V. AC-37. P. 942-952.

111. Sokolov V.F. Robust performance bounds for scalar output of linear system with structured uncertaintiy // Proceedings European Cotrol Conference. 1997. Brussels. Belgium. July 1-4.

112. Sokolov V.F. Adaptive robust control for SISO plant in l\ setting // Proceedings European Cotrol Conference. 1997. Brussels. Belgium. July 1-4.

113. Sokolov V.F. Closed-loop Identification for the Best Asymptotic Performance of Adaptive Robust Control // Automatica. 1996. V. 32. P. 11631176.

114. Sokolov V.F. Robust performance bounds provided by linear controller for SISO plant with structured uncertainty // Proceedings of the 35th Conf. on Decision and Control. 1996. Kobe. Japan. December. P. 23362341.

115. Sokolov, V.F. Cone algorithm of identification for adaptive robust control// Prepr. 10th IFAC/IFORS Symp. on System Identification. 1994. Copenhagen. V. 2. P. 273-278.

116. Sokolov V.F. Adaptive suboptimal control of a linear system with bounded disturbances // Systems and Control Letters. 1985. V. 6. P. 93-98.

117. Sokolov V.F., Veres S.M. Adaptive robust steady-state tracking control // Proc. American Control Conference. Albuquerque. New mexico. June 4-6. 1997. p. 1198-1202.

118. Special issue on system identification. Automatica. 1995. V. 31. N. 12.

119. Special issue on bounded-error estimation (part II). International Journal of Adaptive Control and Signal Processing. 1995. V. 9. N. 1.

120. Special issue on bounded-error estimation. International Journal of Adaptive Control and Signal Processing. 1994. V. 8.

121. Special issue on system identification for robust control design. IEEE Transactions on Automatic Control. 1992. V. AC-37. N. 7.

122. Special issue on parameter estimation with bounded error. Mathematics and Computers in Simulations. 1990. V. 32.

123. Sun J. and P. Ioannou Robust adaptive LQ control schemes // IEEE Transactions on Automatic Control. 1992. V. 37. N. 1. P. 101-106.

124. Teo Y. T., T. T. Tay Design of a ^-optimal regulator: the limits of performance approach // IEEE Transactions on Automatic Control. 1995. V. 40. N. 12. P. 2114-2119.

125. Tsakalis K.S. Performance limitations of adaptive parameter estimation and system identification algorithms in the absence of excitation // Automatica. 1996. V. 32. N.4. P. 549-560.

126. Veres S.M., J.P. Norton Predictive self-tuning control by parameter bounding and worst-case design // Automatica. 1993. V. 29. P. 911-928.

127. Veres S.M., V.F. Sokolov Adaptive robust control under unknown plant orders // Automatica. 1998. V. 34. No. 6.

128. Veres S.M., D.S.Wall, S.Hermsmeyer, I.Valyi, A.Kuntsevich; S.Sheng Geometric Bounding Toolbox for MATLAB. Version 5.2. The MATLAB/SIMULINK Connection Catalogue. 1996. MathWorks Inc.

129. Vidyasagar M. Control Systems Synthesis: A Factorization Approach. MIT Press. 1985.

130. Vidyasagar M. Optimal rejection of persistent bounded disturbances // IEEE Transactions on Automatic Control. 1986. V. 31. P. 527-534.

131. Walter E., Piet-Lahanier H. Exact recursive polyhedral description of the feasible parameter set for bounded error// IEEE Trans. Aut. Control. 1989. V. 34. P. 911-915.

132. Wen C. and Y.C. Soh A unified approach for the analysis and design of robust adaptive control systems. Proc. of the 35th Conference on Decision and Control. Kobe. December 1996. P. 1922-1927.

133. Wen C. A robust adaptive controller with minimal modifications for discrete time-varying systems. IEEE Trans. Autom. Control. 1994. V. 39. N. 5. P. 987-991.290

134. Wen C. and D.J.Hill Robustness of adaptive control without dead-zones, data normalization or persistence of excitation. Automatica. 1989 V. 25. R 943-947.

135. Weyer E., Mareels I.M.Y., Polderman J.W. Limitations of robust adaptive pole placement control. IEEE Trans. Autom. Control. 1994. V. 39. R 1665-1671.

136. Ydstie B.E. Transient performance and robustness of direct adaptive control // IEEE Transactions on Automatic Control. 1992. V. 37. P. 1091-1105.

137. Zames G. On the input-output stability on nonlinear time-varying feedback systems. Part I: Conditions derived using concepts of loop gain, conicity and positivity// IEEE Trans. Autom. Control. 1966. V. 11. P. 228-238.