автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы решения задачи оптимальной стабилизации для стационарных гладкихконечномерных систем управления

кандидата технических наук
Кондратьев, Геннадий Вячеславович
город
Нижний Новгород
год
1998
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Методы решения задачи оптимальной стабилизации для стационарных гладкихконечномерных систем управления»

Автореферат диссертации по теме "Методы решения задачи оптимальной стабилизации для стационарных гладкихконечномерных систем управления"

НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ ^ £ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

с-с

» На правах рукописи

КОНДРАТЬЕВ ГЕННАДИЙ ВЯЧЕСЛАВОВИЧ

МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОЙ СТАБИЛИЗАЦИИ ДЛЯ СТАЦИОНАРНЫХ ГЛАДКИХ КОНЕЧНОМЕРНЫХ СИСТЕМ УПРАВЛЕНИЯ.

Специальность 05.13.01 - Управление в технических системах

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Н. Ногород - 1998

Работа выполнена на кафедре "Электроника н сети ЭВМ".

Научный руководитель: ■ кандидат технических наук,

профессор БАРАНОВ В.Г.

Официальные оппоненты: доктор физико-математических наук,

профессор ПАКШИН П.В., кандидат технических наук ЗУЛЬКОРНЕЕВ Ю.Ф.

Ведущая организация: ЗАО' "Научно-технический центр

ГОСИНКОР-НИЖНИЙ НОВГОРОД"

Защита диссертации состоится " ^ " ^998 г. в часов

на заседании диссертационного совета Д 063.85.02 при

Нижегородском государственном техническом университете, .603600, г. Н.Новгород, ГСП-41, ул. Минина, 24.

С диссертацией можно ознакомиться в библиотеке Нижегородского государственного .технического университета . „

■ Автореферат разослан 29 1998 г. .

Ученый секретарь "л

диссертационного совета .

кандидат технических наук А.П.ИВАНОВ

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

1. Актуальность темы.

Большинство задач управления технологическими процессами требуют решения задачи синтеза оптимальной обратной связи. В настоящее время для решения задач оптимального управления существует несколько общих и достаточно эффективных методов: принцип максимума Понтрягипа, метод динамического программирования Беллмапа и метод аналитическою конструирования регуляторов. Однако в нелинейном случае с помощью указанных методов невозможно получить аналитическое решение оптимизационной задачи в общей постановке, и кроме того, методы не удобны для программирования и применения в качестве стандартных процедур ЭВМ, что затрудняет решение задач производства и реализации оптимальных нелинейных регуляторов. Так, принцип максимума, в особенности для объектов выше второго порядка, за исключением частных задач, не удобен для алгоритмизации,так как предполагает численное интегрирование сложной нелинейной системы уравнений и построение семейства базовых траекторий в пространстве большой размерности. Чнслсппая форма метода динамического программнрова-нич для объектов выше третьего-четвертого порядка приводит к необходимости использования больших объемов памяти ЭВМ и к очень громоздким вычислениям. .Метод аналитического конструирования в основном опирается на классический метод решения вариационной задачи Эйлера или на метод динамического программирования, и в смысле алгоритмизации ему присуши недостатки выше указанных методов.

Оптимизация закона управления методом нелинейного программирования сводится к параметрической оптимизации оператора управления, имеющего заданную структуру. При этом целевая функция оказывается функцией onepai opa управления, дифференциальные уравнения системы входят в сос тав ограничений и решение проводится меюдом упорядоченного поиска оптимального сочетания параметров в облает параметров, заданной ограничениями. Дтя каждого сочетания варьируемых параметров необходимо численно шпегриромть дифферепци-

альные уравнения системы или решать многомерную систему алгебраических уравнений, которая получается в результате перехода от дифференциальных уравнений к уравнениям в конечных разностях. Такие трудоёмкие расчеты сдерживают широкое применение данного метода.

В связи с этим разработка эффективных алгоритмов и процедур для практического нахождения оптимальной обратной связи управления в настоящее время является актуальной задачей.

В данной рабюте для решения задачи оптимальной стабилизации гладких конечномерных систем используется аппарат га-мильтоновой механики и дцфференциально-алгебраической геометрии, позволяющий точно определить потенциальную функцию (функцию Беллмана-Ляпунова).

2. Цель работы.

— использование хорошо разработанного, ранее не применявшегося в данной области, аппарата гамильтоновой механики, дифференциально-алгебраической геометрии, групп Ли преобразований в теории оптимального управления, что позволяет по-новому и более глубоко подойти к решению известных проблем;

— разработка численно-аналитических методов синтеза оптимальной и субоптимальной обратной связи;

— создание вычислительного алгоритма, обеспечивающего расчет аналитической структуры оптимальных и субоптимальных регуляторов.

3. Методы исследования. Для решения задачи синтеза оптимальной обратной связи в работе использованы методы гамильтоновой механики, дифференциально-алгебраической геометрии, групп Ли преобразований.

4. Новые научные результаты.

Предложен ряд новых в данной области подходов к задаче синтеза оптимальной обратной связи, допускающих эффективную численно-аналитическую реализацию:

— метод характеристик для уравнения Гамильтопа-Якоби восстановления лагранжева многообразия с заданными начальными условиями;

А

— метод первых интегралов для описания сепаратрис гамильто-новой системы, описана алгебраическая структура первых интегралов гамильтоновой системы;

— метод разложения функции Беллмана-Ляпунова В ряд Тейлора в окрестности начала координат;

— метод деформации алгебраического решения в голономное уравнения Гамильтона-Якоби;

— решена задача стабилизации для класса систем с инвариантным слоением функции Беллмана-Ляпунова;

— предложен метод дифференцирования вдоль гамильтонова векторного поля, позволяющий эффективно синтезировать аналитическую форму оптимальной обратной связи для систем с квадратичным гамильтонианом; для линейно-квадратичных систем этот метод приводит к уменьшению числа алгебраических

2

неизвестных с п до п по сравнению с решением квадратичного матричного уравнения Риккати;

— предложен способ восстановления лагранжева многообразия вырожденной функции Беллмана-Ляпунова;

— предложен ряд приёмов аналитического интегрирования уравнения Гамнльтопа-Якобн.

5. Практическая ценность полученных результатов.

— предлагаются методы аналитического конструирования оптимальных и субоптимальных регуляторов для нелинейных конечномерных систем;

— процесс отыскания оптимального управления для систем высокого порядка вручную сталкивается с проблемой огромного количества вычислений, но с использованием систем компьютерной алгебры г-та проблема отпадает, а получаемые точные решения удивительным образом оправдывают ожидания;

— разработал алгоритм синтеза оптимальной обратной связи, обеспечивающий заранее заданную точность переходных процессов в замкнутой системе.

6. Апробация работы и публикации. .

По материалам диссертации были сделаны сообщения на V Всесоюзном Совещании по управлению .многосвязными системами (г.Тбилиси, 1984 г.); на V Всесоюзной конференции по

оптимальному управлению в механических системах (г.Казань, 1985 г.); на VII Всесоюзном Совещании-семинаре школы молодых ученых и специалистов по современным проблемам автоматического управления (г.Минск, 1987 г.); на X Всесоюзном Совещании-семинаре школы молодых ученых и специалистов по современным проблемам автоматического управления (г.Омск, 1989г.); на IX научной конференции молодых ученых и специалистов Волго-Вятского региона (г.Горький, 1989 г.); на IX Всесоюзном Совещании по проблемам управления (г.Ташкент, 1989 г.). Основное содержание диссертации опубликовано в 11 печатных работах.

7. Структура и объем диссетрации.

Основной текст диссертации состоит из введения, трех глав, заключения, списка литературы, содержащего 54 наименования, и занимает 75 машинописных страниц.

КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении показана актуальность работы, дана ее краткая характеристика, сформулирована цель и основные задачи исследования, представлены основные научпые результаты, приведено краткое содержание работы по главам.

В главе 1 дается обзор состояния проблемы оптимального управления конечномерными системами и ставится задача оптимальной стабилизации для стационарных гладких конечномерных систем. .

Постановка задачи оптимальной стабилизации: для гладкой конечномерной системы

¿ = /(г,и), 1бДп,и£Г, /(0,0) =0 (1)

и интегрального функционала

+оо

3 = у ш(х, и)Л, и(х, и) > 0, ы(0,0) = о (2)

о

требуется найти функцию uopt(x), обеспечивающую глобальную устойчивость в некоторой максимальной окрестности начала координат системы (1) и реализующую минимум функционала (2) вдоль каждой её траектории. Все функции предполагаются гладкими.

Согласно принципу Беллмапа, задача (1), (2) сводится к решению функционального уравнения

minu{f(х, u)Vi + и(х, и)} = 0 (3)

где (/'(г, и),fn(x,u))T = f(x,u) - правая часть уравнения (1), V(dx' = dV - дифференциал функции Беллмана-Ляпунова. Уравнение (3) эквивалентно системе

/'(х, и)Ц + и(х, и) = 0 • (4.а)

/¿,(х,«)У; + ыц,(х,и) = 0 1 (4.6)

В благоприятном случае путем, исключения переменных uJ, j = 1, m, система (1.4) сводится к уравнению Гамильтона-Якоби •

1$)= 0 ' (5)

Прп укапанном подходе задача синтеза оптимальной "обратной сплзп полностью сводится к нахождению функции- Беллмана-Ляпунова, удовлетворяющей уравнепию (5).

Задача (1),(2) и уравнения (3)-(5) изучались с разный точек зрения разными авторами. Нараду с теоретическим обоснованием самого метода, исследованием условий существования оптимального управления, определением адекватного пространства, в котором решение всегда существует, разрабатывались пути решения конкретных задач, возникающих в механике, биологии, промышленности и т.д., а также классов задач для систем определенного вида. Основными методами синтеза оптимальной обратной связи для нелинейных систем до сих пор остаются: метод замены исходной системы линейно-квадратичным приближением в окрестности особой точки, метод разбиения окрестности начала координат пространства состояний на достаточно малые блоки и попыткой склеить найденные на них, используя'

принцип оптимальности Беллмана, иорц,г € Т, в единую функцию и,^, метод синтеза оптимальной обратной связи заданной структуры и„р1(х,а),а— оптимизируемые параметры.

Удивительно, что теория оптимального управления, выросшая из аналитической механики, совсем не использует методов последаей и традиционно связанной с аналитической механикой диффе°ренциальной геометрии. Данная работа в какой-то мере восполняет этот пробел. Приведенные методы допускают дальнейшее развитие и могут стать основой для создания инвариантной теории гладких оптимальных систем управления.

В главе 2 рассматриваются свойства управляемости и устойчивости, рассматриваются классические методы гамильтоновой механики и возможность вычисления коэффициентов ряда Тейлора функции Беллмана-Ляпунова в окрестности особой точки, дается способ построения эволюционного уравнения, переводящего алгебраическое решение уравнения Гамильтона-Якоби в голономное.

Для системы (1), (2), допускающей в начале координат невырожденную линейно-квадратичную аппроксимацию (система дифференциальных уравнений - линейная, управляемая, подынтегральное выражение функционала - квадратичная положительно определенная форма), лаграпжево многообразие Ь представляет сепаратрису устойчивых точек гамильтоновой системы

( ¿ = ■

Система (б) имеет также сепаратрису 1Г неустойчивых точек, являющуюся лагранжевым многообразием сопутствующего решения (5) отрицательно определенной функции V.

Наиболее простыми необходимыми условиями управляемости нелинейных систем

х = /(х,и), х.е я", и.е в.т

являются следующие (эквивалентные) условия: -— отсутствие нетривиальных первых интегралов системы , — ранг алгебры Ли, порожденной множеством векторных полей

{Г(х,и)<& | и £ , не меньше п ,

— для однородной линейной по управлению системы х = выполняется теорема Рашевского-Чжоу: производная система модуля 1-форм, аннулирующих векторные поля т , тривиальна.

В качестве достаточного условия управляемости относительно начала координат можно привести следующее предложение: одновременную выполнимость критерия Калмана для линеаризованной системы и асимптотическую устойчивость начала координат для некоторого и(х) .

Не менее важным требованием, предъявляемым к оптимизируемой системе, является устойчивость положения равновесия. Критерием локальной асимптотической устойчивости является существование управления и(с) , для кшорого махри-ца линеаризованной в окрестности положения равновесия системы имеет собственные значения с отрицательной вещественной частью. Простым для проверки необходимым условием стнбилп'шруемостн является строгая отрицательное1, ь функции <Нь-(/'(х, и(х))~) в окрестности особой точки.

Предложен метод синтеза оптимальной обратной связи с помощью решения задачи Коши для гамильтоповой системы: известно, что объединение траекторий гамильтоповой системы (6), проходящих через (п-1)-мерное лагранжево многообразие С <£-1(0) > трансверсальное траекториям гамильтоповой системы, представляет п-мерное лагранжево много-, образие Ьп С К сожалению, напрямую воспользовать-

ся этим фактом для построения сепаратрисы устойчивых точек Ь+ не удается, так как по условию известна только одна точка (0,0) £ Ь+. Тем не менее можно воспользоваться следующей процедурой:

— вычислить (линейное) лагранжево многообразие

£.тян \ — , а,у € Л, линейного приближения в начале координат системы (6) (<*у является решением системы Риккати),

— просчитать эволюцию начального (п-1)-мерного лагранжева многообразия Ц~1 = {(х"', V)) € Т*ЛП | VI = ацх>, (х1 / + ... 4-

+(хл)2 ~ е, е > 0 — малое вещественное число} вдоль гамильто-нова векторного поля (С) в обратном направлении.

Рассмотрен метод первых интегралов гамильтоновой системы. В окрестности неособой точки векторное иоле (б) имеет (2п — 1) функционально независимых первых интегралов, коммутирующих относительно скобки Пуассона с гамильтонианом

= 0 (7.а)

то есть удовлетворяющих линейному однородному уравнению в частных производных первого порядка

¡ру^г' - = 0 (7.6)

В окрестности особой точки системы (6) существует не более п функционально независимых интегралов (хотя в дополнении Ь+ и функционально независимых интегралов может быть более п ). В любом случае, если {/а}, о € А, - некоторое множество интегралов системы (6), то при подходящем выборе констант с„, а € Л, функции (1„~са) принадлежат (приводимому) идеалу мпогообоазия 1Л\}Ь~. В действительности, для задания лагранжева многообразия достаточно иметь п функционально независимых попарно коммутирующих относительно скобки Пуассона интегралов.

Для линейного уравнения (6) естественно искать интегралы движения квадратичными. В этом случае задача сводится к системе линейных однородных алгебраических уравнений. Методы отыскания интегралов системы (6) представляют собой классическую задачу аналитической механики.

Также во второй главе рассматривается способ разложения потенциальной функции в ряд Тейлора в окрестности начала координат и приводится эволюционное уравнение, переводящее алгебраическое решение уравнения Гамильтона-Якоби в голо-номыое.

В главе 3 для решения задачи оптимальной стабилизации применяются средства дифференциально-алгебраической геометрии. Описывается класс систем с инвариантным слоением функции

Беллмана-Ляпунова, допускающий точное решение; вычисляются дифференциальные инварианты функции Ееллмана-Ляпунов;' линейно-квадратичной задачи; дается определение невырожденной потенциальной функции, как эквидистантной функции евклидова пространства; рассматривается способ получения дифференциальных инвариантов с помощью подходящего изоморфизма дифференциальных алгебр; анализируется алгебраическая структура первых интегралов п сепаратрис гамильтоновой системы, на основании чего формулируется способ вычисления лагранжева многообразия потенциальной функции; предлагается эвристический алгоритм синтеза субоптимального управления заданной структуры; рассматриваются симметрии в задаче оптимальной стабилизации и некоторые дополнительные факты (продолжение функции Беллмана-Ляпунова на пространство большей размерности, ранговые условия на лагранжепо многообразие, внешняя -дифференциальная система, связанная с задачей оптимальной стабилизации); приводится алгоритм синтеза оптимальной обратной связи системы (1), (2), применимый в режиме реального времени. Эффективность предложенных методов иллюстрируется расчетом систем 2 и 3 порядков.

Рассмотрен класс систем с инвариантным слоением функции Беллмама-Ляпунова. Система (1), (2) обладает инвариантным слоением функции Беллмана-Ляпунова, если оптимальный поток в пространстве состояний сохраняет поверхности уровня функции Беллмана-Ляпунова. Класс таких систем не пуст и имеет хорошее алгебраическое описание. Для систем этого класса имеет место ряд предложений, позволяющих отыскать точное решение задачи оптимальной стабилизации.

Существуют совместные дифференциальные инварианты гамильтониана 93 и функции У(®), являющейся решением уравнения (£> = 0. В работе представлено их вычисление методом Лаптева Г.Ф. и показано, что класс систем с инвариантным слоением фупкции Беллмана-Ляпунова содержится в классе систем с гамильтонианом, допускающим группу симметрий вдоль поверхности уровня решения уравнения Гамильтона-Якоби.

Также в этой главе вычисляются дифференциальные иниари-

анты квадратичной потенциальной функции относительно стандартного действия полной линейной группы.

В каноническом случае невырожденная потенциальная функция имеет-вид У(х) = (х1)2+...+(хп)2. Поэтому для стандартной евклидовой метрики р2 = где д^ = и соответству-

ющей (У{р*) = 0) связности V : Лс~(Я") -4- Лс»(д»)® Ас~(й») : (1х' Ь-> <1х> 0

где £>] = 0, Лс~(/г«) - модуль 1-форм на Д",

У(^) = 2 р2 (8)

Функция V, удовлетворяющая (8), называется эквидистантной.

Уравнение (8) носит инвариантный характер (функция V внутренним образом присоединена к риманову пространству с метрикой р2 ). В силу сказанного, невырожденная потенциальная функция У(х) однозначно определяется как эквидистантная функция некоторого плоского риманова пространства.

Далее в работе приводится способ получения дифференциальных инвариантов с помощью изоморфизма алгебр с подходящим отмеченным дифференцированием, рассматривается алгебраическая структура порвых интегралов гамильтоно-вой системы, связанной с задачей оптимальной стабилизации, и дается метод вычисления лаграпжева многообразия функции Беллмана-Ляпунова, приводящий в линейно-квадратичном случае к уменьшению числа алгебраических неизвестных с п2 (система Риккатти) до п. Также в этой главе рассматриваются: синтез субоптимального управления заданной структуры, основанный на минимизации некоторой функции; способ получения функции Беллмана-Ляпунова, продолженной на пространство большей размерности; ранговые условия на лаграпже-во многообразие; внешняя дифференциальная система, ассоциированная с задачей оптимальной стабилизации; общий способ построения симметрий в задаче оптимальной стабилизации. Приведены примеры аналитического конструирования оптимальных регуляторов для линейных и нелинейных систем второго и третьего порядков.

ЗАКЛЮЧЕНИЕ

В работе представлены новые методы численно-аналитического конструирования оптимальных регуляторов для нелинейных ста- • ционарных систем. Часть методов универсальна для гладких систем (решение задачи Коши для гамильтоповой системы, разложение потенциальной функции в ряд Тейлора в окрестности начала координат, решение эволюционного уравнения, метод отыскания симметрии в задаче оптимизации), другие применимы в особых частных случаях (с вырожденной функцией Беллмана-Ляпунова, линейно-квадратичных систем, систем с инвариантным слоением функции Беллмана-Ляпунова). Некоторые методы полезны для решения задачи синтеза, но требуют дополнительного исследования в процессе решения частной задачи (восстановление лагранжева многообразия потенциальной функции, выбор подходящей римановой метрики, выбор дифференцирования общего положения по отношению к функции Беллмана-Ляпунова, метод дифференциальных инвариантов для гладкой потенциальной функции общего вида).

Основные результаты, полученные в работе: — предложен аппарат гамильтоповой механики и дифференциально-алгебраической геометрии для задачи синтеза оптимальной обратной связи;

— предложен простой метод синтеза оптимальной обратной связи для класса систем. с квадратичным гамильтонианом (здесь же предложен альтернативный метод решения линейно-квадратичной задачи, отличающийся от известного уменьшением числа независимых переменных с п2 до п); 1

— исследован класс систем с инвариантным слоением функции Беллмана-Ляпунова, допускающий точное решение задачи синтеза; .

— показана возможность разложения аналитической потенциальной функции в ряд Тейлора в окрестности начала коо'рдипат;

— введено эволюционное уравнение, позволяющее при подходящих начальных условиях деформировать алгебраическое реше-

ние уравнения Гамилътона-Якоби в голономное на полубесконечном отрезке;

■— рассмотрен метод первых интегралов и эволюционных симметрии;

— предложен алгоритм синтеза оптимальной обратной связи, основанный на восстановлении лагранжева многообразия функции Беллмана-Ляпунова с помощью решения задачи Коши для гамильтоновой системы, ассоциированной с задачей оптималь-' ной стабилизации.

Представление различные подходы как индивидуально, так и в сочетании, позволяют эффективно решать задачу оптимальной стабилизации.

Многие из методов нетрадиционны в области теории оптимального управления и допускают дальнейшую, детализацию и уточнение.

Основное направление дальнейшего развития исследований . может быть связано с созданием инвариантной теории пары "гамильтониан - лагранжево многообразие" (9, Ь) и отдельно теории потенциальпой функции V на базе инвариантного дифференциального исчисления.

ПУБЛИКАЦИИ

1. Кондратьев Г.В. Достаточное условие управляемости нелинейных систем, межвузовский сборник "Системы управления, преобразования и отображения информации."- Рязань, 1984 г., 42-45 с.

2. Кондратьев Г.В. Управляемость нелинейных систем, в сб. "Управление многосвязцыми системами: Тезисы докладов V Всесоюзного совещания."- Тбилиси, 1984 г., 70-77 с.

3. Кондратьев Г.В., Беляев Е.И. Синтез нелинейных дискретных систем управления при неполном наблюдении вектора состояния, межвузовский сборник "Системы управления, преобразования и отображения информации."- Рязань, 1984 г., 42-45 с.

4. Кондратьев Г.В. Постороение областей достижимости конечномерных динамических систем, в сб. "Оптимальное управление в механических системах: Тезисы докладов V Всесоюзной

конференции."- Казань, 1985 г., 73 с.

5. Кондратьев Г.В. Аппарат внешних форм в исследовании не-, линейных систем, в сб. "Современные проблемы автоматического управления: Тезисы докладов VII Всесоюзного совещания-семинара школы молодых ученых и специалистов."- Минск, 1987 г., 19 с.

6. Копдратьев Г.В. Синтез оптимальной обратной связи в задаче АКОР, в сб. "Проблемы управления: Тезисы докладой IX Всесоюзного совещания."- Ташкент, 1989 г., 11 с.

7. Кондратьев F.B., Мисевич П.В. Построение информативной области для нелинейных систем при помощи уравнения Фокера-Планка-Колмогорова, в сб. "Тезисы докладов X Всесоюзного совещания-семинара школы молодых ученых и специалнстов."-Омск, 1989 г., 34 с.

8. Кондратьев Г.В., Жукова М.И. Синтез оптимальной обратной связи в реальном времени, в сб. "IX научная конференция молодых ученых и специалистов Волго-Вятского региона: Тезисы докладов."-Горький, 1989 г., 10 с.

9. Кондратьев Г.В. Теорема Рашевского-Чжоу как критерий слабой управляемости конечномерных систем, линейных по управлению, межвузовский -сборник "Математическое моделирование в задачах механики и управления."- Волгоград, 1990 г., 32-34 с.

10. Кондратьев Г.В., Жукова М.И. Один метод ситнеза оптимальной обратной связи для нелинейных систем, межвузовский сборник "Математическое .моделирование в задача« механики и управления."- Волгоград, 1990 г., 59-64 с.

11. Кондратьев Г.В. Класс систем с инвариантным слоением функции Беллмана-Ляпунова, межвузовский сб. НГТУ "Системы управления и обработки информации."- Н.Новгород, 1995 г., 59-64 с.

Подп. х печ. 28.С4.98Формат60x34 !/16. Бумага газетная. Печать офсетная. Уч.-издл. 1,0 , Тираж ICO экз. Заказ 223.

Типография НГТУ. 603600, Нижний Новгород, ул.Минина. 24.