автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Стабилизация линейных систем с запаздыванием по времени в координатах и управлении

кандидата физико-математических наук
Солодушкин, Святослав Игоревич
город
Екатеринбург
год
2009
специальность ВАК РФ
05.13.18
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Стабилизация линейных систем с запаздыванием по времени в координатах и управлении»

Автореферат диссертации по теме "Стабилизация линейных систем с запаздыванием по времени в координатах и управлении"

на правах рукописи

Солодушкин Святослав Игоревич

СТАБИЛИЗАЦИЯ ЛИНЕЙНЫХ СИСТЕМ С ЗАПАЗДЫВАНИЕМ ПО ВРЕМЕНИ В КООРДИНАТАХ И УПРАВЛЕНИИ

05.13.18 - математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

- 3 ДЕК 2009

Екатеринбург — 2009

003486561

Работа выполнена в Учреждении Российской академии наук Институте математики и механики УрО РАН в отделе дифференциаль-

ных уравнений

Научный руководитель: Официальные оппоненты:

Ведущая организация:

доктор физико-математических наук, A.B. Ким

доктор физико-математических наук, Н.Ю. Лукоянов

кандидат физико-математических наук, Ю.Н. Седов

ГОУ ВПО "Уральский государственный

технический университет - УПИ

им. первого Президента России Б.Н. Ельцина"

1L

/¿Г

Защита диссертации состоится У /декабря 2009 г. в часов на заседании диссертационного совета Д 212.286.10 при ГОУ ВПО "Уральский государственный университет им. A.M. Горького" по адресу: 620000. г. Екатеринбург, ул. Ленина, 51, комн. 248.

С диссертацией можно ознакомиться в научной библиотеке ГОУ ВПО "Уральский государственный университет им. A.M. Горького".

Автореферат разослан ^ ноября 2009 г.

Ученый секретарь диссертационного совета, доктор физико-математических наук, профессор

В.Г. Пименов

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Задачи стабилизации линейных дифференциальных систем с запаздыванием (иными словами последействием) в фазовых координатах и управлении возникают при моделировании многих технических, физических, биологических, экономических процессов. Присутствие запаздывания является неотъемлемым свойством многих систем, и попытки построить модель, в которой запаздыванием пренебрегают, зачастую приводят к неверным результатам; качественного соответствия модели и реального процесса можно добиться только учитывал запаздывание.

Основополагающими в теории аналитического конструирования регуляторов (АКОР) для систем с последействием являются работы H.H. Кра-совского [1-3], в которых показано, что оптимальное стабилизирующее управление является линейным непрерывным функционалом на функциональном (фазовом) пространстве системы с последействием, а также выведены соотношения, описывающие параметры оптимального управления и оптимального значения функционала качества.

Существенный вклад в развитие качественной теории функционально-дифференциальных уравнений и, в частности, линейно-квадратичной задачи управления внесли Н.В. Азбелев, Р. Габасов, A.M. Зверкин, Г.А. Каменский, Ф.М. Кириллова, В.Б. Колмановский, H.H. Красовский, A.B. Кряжимский, A.A. Мартынюк, Ю.А. Митрпполький, А.Д. Мыш-кис, С.Б. Норкин, В.Р. Носов, Ю.С. Осипов, Л.С. Понтрягин, B.C. Ра-зумихин, Ю.М. Репин, А.Л. Скубачевский, С.Н. Шиманов, Г.Л. Харати-швили, Э.Л. Эльсгольц. Н.Т. Banks, R. Bellman. Т.А. Burton, К. Cooke, С. Corduneanu, M. Delfour, R. Driver, A. Halanay, J. Hale, L. Hatvani, H. Kushner, V. Lakshmikantan, K. Ushida, V. Volterra и другие авторы.

К настоящему времени теоретические аспекты АКОР для систем с последействием разработаны с достаточной полнотой, однако, в силу бесконечномерной природы систем с последействием, практическое применение теории наталкивается на ряд принципиальных трудностей. Поэтому разработка конструктивных алгоритмов АКОР для систем с последействием постоянно находится в центре внимания математиков и инженеров.

Одной из основных трудностей, сдерживающих практическое использование АКОР в задачах синтеза управления для систем с последействием, является необходимость решения специальной системы обобщенных уравнений Риккати (ОУР), описывающей коэффициенты оптимального управления и представляющей собой систему алгебраических уравнений, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными. В связи с этим, уже в первых ра.-ботах, где были получены ОУР, проблема АКОР для систем с последействием была сформулирована в виде двух задач: 1) нахождение явных решений ОУР и 2) разработка методов исследования стабилизирующих

свойств управлений, соответствующих явным решениям ОУР.

Следует особо подчеркнуть, что решение первой из задач не является самоцелью, а позволяет построить синтез управления в явном виде. Также отметим, что для систем с последействием, в отличие от конечномерных систем, линейное управление с обратной связью, построенное на основе решения ОУР, не всегда является стабилизирующим. Поэтому выделение исследования устойчивости в отдельную представляется естественным. В настоящей работе исследуются и решаются обе этих задачи. В работе используется подход, развитый в [4-6].

Цель работы. Разработка конструктивных аналитических и численных методов синтеза стабилизирующих управлений для систем с последействием в координатах и управлении на. основе минимизации обобщенных квадратичных функционалов качества.

Методика исследования. Основные результаты базируются на функциональном подходе в качественной теории функционально-дифференциальных уравнений. Систематически применяются понятия и методы функционального анализа, теории устойчивости и управления, и численные методы.

Научная новизна. В работе получены следующие основные результаты.

1) Исследована задача, стабилизации тривиального решения линейной системы с запаздыванием в фазовых координатах и управлении. Исходная задача сведена к задаче оптимального управления на бесконечном промежутке, решение которой сводится к решению ОУР. Минимизируемый функционал имеет несколько свободных параметров, распоряжаясь которыми, можно, во-первых, упростить ОУР, а, во-вторых, сделать найденное управление стабилизирующим. Получен явный вид управления через решения ОУР.

2) Система ОУР явно сведена к решению одного алгебраического матричного уравнения. Показано, что, распоряжаясь свободными параметрами минимизируемого функционала, можно произвольную матрицу сделать решением данного уравнения. Выбирать это решение, а вместе с ним и свободные параметры, необходимо исходя из требований стабилизации. Как следствие, закрыт вопрос о способах решения получаемого алгебраического матричного уравнения.

3) На основе теоремы об асимптотической устойчивости ([1], стр. 172) получены достаточные условия на параметры, гарантирующие стабилизирующие свойства управления. На основе численного моделирования фундаментальной матрицы решений получен конструктивный критерий ста-билизируемости системы.

4) Создан пакет программ на МАТЬАВ для нахождения стабилизирующего управления.

Теоретическая и практическая значимость. Развитые вдиссер-

тации методы позволяют строить и анализировать синтез управления для систем с последействием. Разработанные методы и алгоритмы реализованы в пакете прикладных программ Time-delay System Stabilization в системе MATLAB.

Апробация работы. Результаты диссертации были представлены на Всероссийских конференциях «Теория управления и математическое моделирование» (Ижевск, 2006, 2008), Воронежской зимней математической школе С.Г. Крейна-2008 (Воронеж, 2008), 39-й и 40-й Всероссийских конференциях «Проблемы теоретической и прикладной математики» (Екатеринбург, 2008, 2009), а также на научных семинарах в Институте математики и механики УрО РАН и Уральском государственном университете им. A.M. Горького.

Публикации. Основные результаты диссертации изложены в 7 работах, список которых приведен в конце автореферата. Из них 3 опубликованы в ведущий рецензируемых научных журналах, определенных ВАК. Результаты работ получены диссертантом самостоятельно.

Структура и объем диссертации. Диссертация состоит из введения, 5 глав, приложения, где описан программный комплекс, и списка литературы. Главы разбиты на разделы. Объем диссертации составляет 74 страницы, включая библиографический список из 42 наименований.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

ВВЕДЕНИЕ содержит историю вопроса п краткий обзор работ. Во введении обосновывается актуальность, формулируется цель диссертационной работы и пути её достижения, отмечается новизна и практическое значение работы.

В ПЕРВОЙ ГЛАВЕ дается постановка задачи АКОР для систем с запаздыванием в фазовых координатах и управлении.

Основным объектом исследования является управляемая система с последействием

о

х(£) = Ах(Ь) + Агх{Ь - г) + J АфхЦ + ¿) <1з+

~т о (1)

+ Ви{г) + вАи(г - д) + J 5(Ои(< + с)^С, -д

где г и А — положительные константы, А, Ат — постоянные пхп матрицы, В, Бд — постоянные п х г матрицы, Л(-) — пхп матрица-функция с непрерывными на [—г; 0] элементами, В(-) —пх г матрица-функция с

непрерывными на [—Д;0] элементами, х 6 В." — фазовый вектор, и е йг — управление, формируемое по закону обратной связи.

Вводится обозначение {х,у(-), «;(•)} = {!(«); + 5), 5 € [-2т; 0); и(« + С), С € [-г - А; 0)}.

Управление для системы (1) ищется в классе линейных отображений

о о

иЦ,х,у{-),ю{-)] = Ех + Ету{-т) + У Ьт{з)у(з)с1з +^ ¿д^МСИС, (2)

-г -Д

где Е, Ет — постоянные гхп матрицы, £,-(•),Ьд(-) —гхп и гхг матрицы с непрерывными и кусочно-непрерывно дифференцируемыми на [-г; 0] и [—Д; 0] элементами соответственно (разрывы производной только первого рода, в точках разрыва непреывность срава, нет точек сгущения).

Вводится в рассмотрение замкнутая система в дифференциальной форме

о о

х= Ах + Ату{—т) + J А(з)у(з) йэ + Ви + Душ(-Д) + J В(СММ>

-г -Д

й = [ЯЛ + Ьт(0)]а: + [£МТ - Ьт{-т) + ЕтА]у(—т) + ЕтАту{-2т)+ о о

+ + у{з)(1з +1 ЕтА{з)у(-т + з)<1з+

+ [ЕВ + ¿д(0)]и + [ЕВа - £д(-Д)]ти(-Д) + ЕтВю{-т)+

+ ЕтВьт(-т - Д)+

о о

+1 \ев(0 + ^р у{СК + / етв(0у(-г + 0^.

-д -д

(3)

При соответствующих начальных условиях можно поставить задачу Коши для (1), (2) и для (3). Доказывается эквивалентность этих задач Коши.

Формализуется понятие управления, стабилизирующего систему (1). как управления, обеспечивающего х-асимптотическую устойчивость тривиального решения системы (3). Основную задачу, решаемую в диссертации, можно сформулировать следующим образом: найти управление (2), стабилизирующее систему (1). Известно, что из асимптотической устой-чиовости тривиального решения системы (3) следует г-асимптотическая устойчивость тривиального решения системы (3), поэтому достаточно найти такое управление, которое обеспечит асимптотическую устойчивость тривиального решения системы (3).

Для поиска одного из возможных стабилизирующих управлений, задаче стабилизации ставится в соответствие задача оптимального управления на бесконечном промежутке, состоящая в минимизации специального квадратичного функционала вдоль решений системы. Используется понятие обобщенной энергии, введенное A.A. Красовским. Поскольку задача состоит именно в стабилизации системы, то структуру и коэффициенты функционала следует выбирать так, чтобы упростить исходную задачу.

со

J = j[x(-),u(-)l = J \z + u'Mu dt, (4)

где

+ 2x'

+2x'

г = г{х(-),и(-)] = х'Ф0х+ 0 0 0 0

' I $1(5)2/(5) + J у'(з)Ф2{з)у(з)с1з + 11 у'(з)Ф3(з, и)у(у)<1зйи+

-т —т —т -т

О 0 0 0

' I Ф^гф)^ + J к/^Фг^Мз)^ + J J и/(5)Ф3(5,г/)Цгу)сЫИ-

-д -д -д-д

+ ш'(-Д)Ф4Ц-Д)+

о

+ 2у'(—т) у Т^гф^ + з/Ч-^Тги^-ДН

о о

+ 2 II у'{8)Г3(з,у)и:(1;)<1з<11У.

-г -Д

(5)

Здесь Фо и Ф4 — постоянные симметричные п х п матрицы; Ф-(я) — п X п матрица, с кусочно-непрерывными на [—г; 0] коэффициентами; Ф2М

— симметричная п х п матрица с кусочно-непрерывными на [—т;0] коэффициентами; Фз(^) — пх п матрица с кусочно-непрерывными на [—г;0] х [— т;0] коэффициентами; Ф^з) — п х г матрица с кусочно-непрерывными на [—Д; 0] коэффициентами; Фг(й) — симметричная г х г матрица с кусочно-непрерывными на [—Д;0] коэффициентами; Фз(з, и)

— г х г матрица с кусочно-непрерывными на [—Д; 0] х [—Д; 0] коэффициентами; Ф4 — постоянная симметричная г х г матрица; Т^я) — п х г матрица с кусочно-непрерывными на [-Д; 0] коэффициентами; Т2 — постоянная симметричная пхг матрица; Тз(5, и) — п х г матрица с кусочно-непрерывными на [—т;0] х [—Д;0] коэффициентами; М симметричная положительно определенная г х г матрица.

ВО ВТОРОЙ ГЛАВЕ дается вывод системы обобщенных уравнений Риккати (ОУР), к решению которой сводится нахождение коэффициентов стабилизирующего управления. Оптимальное значение (функционал Беллмана) для задачи (1), (2), (4) обозначается через Ш\х,у(-),и>(-)]. Функционал Ш ищется в виде

О 0 0 о

+ 2х'У 0(з)у{з)йв + I У у'(в)+ J у'(вЩ^у^) бЬ+

—т —г —т —т

0 0 0 0

j Л(а)ш(в) ¿я + J У «/(Й)©^, ¿в ¿1/+ У ги'(з)Е(з)ги(з)

-а -Д-Д -Д

0 0 о

2 У У у'{вЩ$, и)гю(и)йзС1и + 2у'(~т) Jy(з)и>(з)с1з.

+ 23;'

-г -Д

(6)

Теорема 1 Предположим, что

(1) существует решение задачи (1), (2), (4);

(2) Р — симметричная п х п матрица;

(3) элементы п х п матриц £>(•) и П(-) непрерывны, и кусочно-дифференцируемы на [—г, 0]/

(4) .элементы п х г матриц Л(-) и Б(-) непрерывны и кусочно-дифференцируемы на [-Д,0];

(5) элементы п х п матрицы •) и её производных —- и

os

dR(s,u) . п. ,

—-—- непрерывны всюду на [—г, 0j х [—г, 0J исключая, быть может, линию s = у;

ta\ csf \ л dQ(s,i/) dQ(s,u)

(о) элементы пхг матрицы ©(■, ■) и ее производных —--и —--

os os

непрерывны всюду на [—А, 0] х [—Д,0] исключая, быть может, линию s = v;

(7) для матрицы Й(-, ■) выполнено условие R(s,u) = R'(i/, s) на [-r,0] х [—т, 0];

(8) для матрицы ©(•,•) выполнено условие ®(s,v) = &(и, s) на [-Д, 0] х [—Д, 0];

т\ ы \ л d@(s>v) ") (91 элементы пхг матрицы р!-, •) и ее производных —--и —--

as os

непрерывны всюду на [—т,0] х [—Д,0];

(10) элементы пхг матрицы j(-) непрерывны и кусочно-дифференцируемы на [—Д, 0];

(11) матрица S(0) + M положительно определена.

Тогда матрицы F, £)(•), iî(-, •),!!(•),©(•,■), Е(-) являются решением

системы ОУР

Р'А + А'Р + £>(0) + £>'(0) + П(0) 4- Ф0 = (Р'В + Л(0)) к(в'Р + Л'(0)), ^^ = P'A(s) + A'D(s) + R( 0, s)-

-(Р'В + A(0))üf (ß'D(s) + ß'(s, 0)) + Ф1(а),

^ = P'B(s) + A'A(s) + ß{Q, s)- [p'B + Л(0))ЛГ (ß'A(s) + 0(0, s)) + ®i(e), dU(s)

ds d~(s)

= ВД,

- Фа(в),

ds

Wgrf + дЩ^ = D'(s)A(v) + A'(v)D(s)-äs , ov

(d'{s)B + ß(s, 0)}k(b'D{v) + ß'(v, 0)) + Ф3(в, v),

(A'{s)B + 9(5,0))K[B'A{v) + 0(0,i/)] + Ф3(а, и), ds , dv

0))k(B'A(v) + 9(0, v) ) + T3(s, i/),

d-r(s)

= A'TA(s) - 0{-t,s) + 7(0)# (ö'A(s) + 6(0, s)) + Ti(s)

ds

с граничными условиями

(7)

(8)

D{-t) = P'Ar + 7(0 )К(В'Р + A'(0)), Л(-Д) = Р'Вд, П(-Г) = Ф4 + 7(0)ВД), 2(-Д) = Ф4,

Д(-Т, s) = A'rD(s) + 7(0)Ä" (ß'D(s) +/3'(S,0)),

0(-Д,в) = 0'дЛ(з)|

ß'(s,-A) = B'aD(s),

7(-Д) = T2

xi условиями симметрии Р = Р', ñ(s, i/j = R'{v,s), 9(s,i/) =

©'(¡у, а). При этом управление с обратной связью

и*(х,у{-)М-)) =-К

(в'Р + А'{0))® + I (В'0(з) + Р'{8,0)}у{з)с1з+

—т

0

+ У(0)у(-т) + У (в'Л(а) ©СО, я))и|(я) <2в ,

(9)

где К = [Е(0) 4- М] является решением задачи (1), (2), (4).

Показано, что на основе подходящего выбора матриц Фо,...,Тз уравнения могут быть упрощены, и их решение явно сводится к решению алгебраического матричного уравнения. Рекомендовано выбирать матрицы Фо,-..,Тз следующим образом

Фо = Сфо,

Фх(я) = -Р,А(в) - Я(0, в) 4- [Р'В + Л(0)]Я"[В'£>(*) + р(а, 0)],

Фг(5) =

Фъ(з,и) = -1У(8)А{и) - А'да(в) + [0'(з)В + р(з,0)]К[В'0(и) + 0)], Ф4Х(Я) = -Р'В{з) - Щ0,з) + [Р'В + А{0)]К[В'А{з) + 6(0, в)],

= М*),

Ф3(в, и) = -Л'(«)ВД - В'{и)А(з) + [А'(з)В + в(я, 0))^[В'ЛН 4- 9(0,«/)], Ф4 = Сфл,

Тг(я) = -А'ТА(з) + р(-т, з) 4- 7(0)^[В'Л(а) + 0(0, а)] + «(а),

= - У г>(в) ¿а,

Т3(з, и) t -П'(з)В(и) - Л'(з)Л(5) + [Щ3)В + /?(в, ЩК[В'А{и) + 0(0, и)\

(10)

Здесь Сфа,СфьСфА,ф2(я),^2(^)1^(5) — произвольные матрицы соответствующих размерностей.

Теорема 2 Пусть в системе ОУР (7) матрицы Фо,...,Тз выбраны согласно (10), Сфо, СфА, Сф4 — симметричные матрицы; <¿>2(5) — симметричная матрица с кусочно-непрерывными на [—т;0] коэффициентами; ^2(5)1 — симметричные матрицы с кусочно-непрерывными на [-Д; 0] коэффициентами. Пусть Р является решением матричного

уравнения

и

РА + А'Р + еЛтРАт + А'тРеЛт + f ф2( Ç) dC, + СфА + Сф0 =

, (И") —Т

= (рв + ел'*РВА^к(в'Р + В'АРеАА},

а матрицы D(s), A(s), II(s), S(s), R(s,u), Q(s,v), ß(s,u), 7(s) заданы по формулам

s

D(s) = üt'MpAr, II(s) = IШ + Сф1,

—т

„и - I Ме^ъ

Л (s) = е^+д>Р'Вд, Н(5) - J Ш) d( + С* 4,

ОГч ,Л _ / ОМАН, МеПдъ

A'(S)Q'W. (s,f)eiîû2

s

ß(s, и) = D'(s - 1/ - Д)Вд, 7(s) = J v(Q dÇ,

где

iiTi = {(a, v) 6 [-т, 0] x [ т, 0] : s < i/},

= {M e [-T.0] x [—r, 0] : s > v},

ПД1 = {(s, G [-Д, 0] X [-Д, 0] : s < v},

Яд2 = {(«,«/) € [-Д,0] X [-Д.0] : s > v),

T(s) = 4e-A'(ä+r), Q(s) = В^Г^Ч

Тогда матрицы P, D{s),Tl(s),R(s, iy),A(s),E(s),Q{s,u),ß(s,v),'y(s) являются решением ОУР.

ТРЕТЬЯ ГЛАВА посвящена построению и анализу стабилизирующих свойств регулятора.

Согласно разработанному подходу для построения управления с обратной связью необходимо

1) вычислить матрицу Р, являющуюся решением матричного уравнения

(И),

И

2) вычислить матрицы D(s), Л (s), n(s), E(s), R(s, v), Q(s,v), P(s,u), 7 (s) подстановкой P в соответствующую формулу,

3) построить управление с обратной связью, подставив в формулу (9) соответствующие матрицы.

Следующей задачей, после нахождения явного вида регулятора, является задача исследования его стабилизирующих свойств.

Теорема 3 Пусть выполнены следующие условия:

(1) весовой функционал Z[x,y(-),w(-)] является положительно определенным на Н,

(2) матрицы P, D, R, П, Л, ©, Е, /?, 7 являются решением системы ОУР

(7),

(3) функционал Беллмапа W[x, у(-),ги(-)] является положительно определенным на Н,

тогда система (1) стабилизируема и управление с обратной связью (9) явмется решением задачи стабилизации (1), (2) в классе стабилизирующих управлений, а минимальное значение функционала качества J, соответствующее начальной позиции {£,y(,)i'l0(')}> имеет вид (6).

Замкнутую систему в дифференциальной форме (3), в которой управление формируется согласно (9), можно рассматривать по как систему с запаздыванием только в фазовых переменных относительно переменной z = (г; и).

z(t) = Âz(t) + ÂTz(t -т)+ B&z(t - Д)+ о о

+ J À(s)z(£ + s)ds+ J B(Ç)2(i + Ç)<*Ç.

(12)

где

А-( А В \ А -( Ат 0

Л~\ЕА + Ьт(0) ЕВ + Ьд(0) )'Лт~\ЕАт- Ьт{-т) 0

Ва = ( 0 ЕВа -Ьь(-А) ) ' = ( ЕА{8) + !$1 0 ) '

ЕВ(0 + ^1

Теорема 4 Система (12) асимптотически устойчива тогда и только тогда, когда существует число Т > 2т, т = тах{г; Д}, что

Os ос \

1 + г||Лг||+Д||Дд|| + J J \\ÁT{v)\\dvds + I J ||5д(д)|| d¡j,d( j <1

-T -T -Д — Д /

В ЧЕТВЕРТОЙ ГЛАВЕ описываются численные методы решения линейных систем с запаздыванием и численные методы поиска параметров стабилизирующего управления.

Вводится дискретная численная модель системы (12) Vk £ Rn, как приближение точного решения Хк = x{tk) в точке Отметим, что, если на дискретной предыстории Vk, к = 0,1,..., А'", определить оператор интерполирования [7], то на [О, Т] будет определена функция v(-).

Методом Тейлора, в котором удерживаются слагаемые до n-го порядка включительно, назовем пошаговую модель

^vf(tk+1-tkY

Vk+1 = ¿^ --> V(> = х0- (13)

¿=o г'

Невязкой (погрешностью аппроксимации) полученного таким образом метода Тейлора назовем функцию

хк+1 - Ez^fo+i ~*кУ/г\

№ =-^---.

4+1 - ч

Будем говорить, что невязка имеет порядок р, если существует такая константа С, что для всех к = 0,1 ,...,N — 1 имеет место неравенство

mtk)\\<c{tk+i-tk)p.

Будем говорить, что метод сходится, если max ílx/t — —>

l<k<N

0 при N —► оо, и имеет порядок сходимости р, если найдется постоянная С такая, что Цх^ — г^Ц < СЬР для всех к = 0,1,..., N.

Утверждение 1 Если в методе Tetuopo, (13) удерживаются слагаемые до р-го порядка включительно, то невязка имеет порядок р.

Для того чтобы определить функционал правой части на приближенном решении, необходима интерполяция.

Оператором интерполирования I дискретной предыстории модели назовем отображение, которое для всех к = 0,1,..., N устанавливает соответствие i: {ví}¡=0 —> и(-) € Q[0;í*].

Оператор интерполирования I имеет порядок р на точном решении, если существуют константы Ci, С\ такие, что Vi* G [0;Т] ||x(í*)— v(£*)|| < Ci max ^Xi-ViW+Cih?, где i - lk : 4+г, Uk < t* < í(fe+1, í¡t и íife+l — соседние узлы разбиения временной сетки на отрезки гладкости (р+ 1)-го по]>ядка.

С помощью многочленов Лагранжа и Эрмита строится оператор интерполирования I, значениями которого являются многочлены Lpk(-). Устанавливается порядок этого опе^тора.

Теорема 5 Пусть точное решение x(t) является р раз кусочно-непрерывно дифференцируемым, тогда оператор интерполирования I имеет р порядок погрешности интерполирования на, точном решении.

Теорема 6 Пусть 1) в методе Тейлора (13) удерживаются члены до р-го порядка включительно; 2) точки кратные запаздыванию т,2т, ..., (р+2)т, Д, 2Д, ..., (р+2)Д включены во временную сетку; 3) оператор интерполирования имеет порядок р на точном решении. Тогда метод (13) сходится, порядок сходимости равен р.

Нахождение коэффициентов метода Тейлора предполагает вычисление интегралов функции от предыстории. Эти интегралы приходится считать приближенно. Ниже приводится оценка для глобальной погрешности метода Тейлора с учетом приближенного вычисления коэффициентов.

Методом Тейлора, в котором удерживаются слагаемые до n-го порядка включительно с приближенным вычислением функционала vМ назовем дискретную модель вида

^ ,

v0=xQ, Vk+l =vk +k = 1,...,N,

где v^ — приближенное значение

Аппроксимация функционала х^ имеет порядок погрешности р на точном решении, если существует константа Сх¿, что для всех к = 0,1 ,...,N выполняется неравенство Цх^' — х^'Н < CxihP, где х^ — приближенное значение х®.

Невязкой с учетом приближенного вычисления функционалов х^ метода Тейлора, в котором удерживаются слагаемые до n-го порядка включительно, назовем функцню вида

хк+х -хк -Y.x^tiJH .In \ «=1

Будем говорить, что методом Тейлора имеет невязку порядка р с учетом приближенного вычисления функционалов-производных, если существует константа что для всех к = 0,1,N — 1 выполняется неравенство < Сфкр.

Утверждение 2 Пусть метод Тейлора имеет невязку порядка р, аппроксимация функционалов-производных имеет порядок р, тогда метод Тейлора имеет невязку с учетом приближенного вычисления функционалов-производных порядка р.

14

Теорема 7 Пусть метод Тейлора имеет невязку порядка р, аппроксимация функционалов-производных имеет порядок р, оператор интерполяции имеет порядок р, тогда метод Tetuiopa сходится и имеет порядок сходимости р.

В ПЯТОЙ ГЛАВЕ приводятся примеры синтеза стабилизирующего управления для 1-мерной и 2-мерной систем с последействием в управлении и координатах на основе разработанных алгоритмов. Приведен пример стабилизации 4-мерной системы (простейшей модели инфекционного заболевания [8]), что с точки зрения медицины интерпретируется как подавление инфекционного заболевания, которое в случае отсутствия лечения приводит к летальному исходу.

В ПРИЛОЖЕНИИ описаны программы на, языке JavaScript и MATLAB, которые позволяют находить коэффициенты метода Тейлора для ФДУ и находить параметры стабилизирующего управления для рассматриваемых систем.

Список литературы

[1] Красовский H.H. Некоторые задачи теории устойчивости движения. М.: Гоетехиздат. 1959. 211 с.

[2j Красовский H.H. Об аналитическом конструировании регулятора для систем с последействием. ПММ, 1962. Т. 26. Xs 1. стр. 39-51.

[3] Красовский H.H. Оптимальные процессы в системах с запаздыванием. Krasovskii N.N. Optimal Processes in Systems with Time Lag // Proc. 2nd IFAC Congress (Basel, 19G3). Butterwoths, London. 1964.

[4] Ким A.B. i-Гладкий анализ и функционально-дифференциальные уравнения. Екатеринбург: ИММ УрО РАН. 1996. 23G с.

[5] Ким A.B., Ложников A.B. Линейно-квадратичные задачи управления для систем с запаздыванием по состоянию. Точные решения уравнений Риккати. Автоматика и телемеханика. 2000. № 7. стр. 15-31.

[6] Ким A.B., Волканин Л.С. К синтезу управления для систем с последействием в управляющих параметрах. Известия Уральского государственного университета. 2003. №26 стр. 81-86.

[7] Ким A.B., Пименов В.Г. г-Гладкий анализ н численные методы решения функционально-дифференциальных уравнений. — М.-ИжевскгИНЦ "Регулярная и хаотическая динамика". 2004. 256 с.

[8] Марчук Г.И. Математические модели в иммуиологин. М.: Наука.

1980. 264 с.

ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ СТАТЬИ, ОПУБЛИКОВАННЫЕ В ВЕДУЩИХ РЕЦЕНЗИРУЕМЫХ НАУЧНЫХ ЖУРНАЛАХ, ОПРЕДЕЛЕННЫХ ВАК.

[9] Солодушкин С. И. Стабилизация линейных систем с запаздыванием по времени в координатах и управлении // Труды института математики и механики УрО РАН, 2008. Т. 14, № 4 с. 143-158.

[10] Солодушкин С.И. О стабилизации систем с последействием // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. Ижевск. 2008. с. 140-141.

[11] Солодушкнн С.И. Стабилизация систем с запаздыванием по времени в координатах и управлении // Системы управления и информационные технологии, 2009. 1.3(35) с. 404-406.

ДРУГИЕ ПУБЛИКАЦИИ

[12] Солодушкин С.И. Линейно-квадратичная задача стабилизации систем с запаздыванием по времени // Проблемы теоретической и прикладной математики. Екатеринбург, УрО РАН. 2008. с. 291-297.

[13] Солодушкин С.И. Линейно-квадратичная задача стабилизации систем с запаздыванием по времени Воронежская зимняя математическая школа С.Г. Крейна - 2008. Тезисы докладов. 2008. с. 131-133.

[14] Солодушкин С.И. Стабилизация систем с запаздыванием по времени в координатах и управлении // Информационные технологии моделирования и управления, 2009. 2(54) с. 226-230.

[15] Солодушкин С.И. Об одном конструктивном критерии проверки ста-билизируемости систем с запаздыванием по времени // Проблемы теоретической и прикладной математики. Екатеринбург, УрО РАН. 2009. с. 251-254.

Подписано в печать 5.11.2009 г. Формат 60x84/16 Бумага офсетная. Уч.-изд. л. 1,5 Усл. печ. л. 1,5 Тираж 100 экземпляров. Заказ № -/£'/. Отпечатано в ИПЦ "Издательство УрГУ". 620083, г. Екатеринбург, ул. Тургенева, 4

Оглавление автор диссертации — кандидата физико-математических наук Солодушкин, Святослав Игоревич

I ВВЕДЕНИЕ

II Постановка задачи

1 Линейная управляемая система

2 Замена задачи стабилизации на задачу управления

III Обобщенные уравнения Риккати

3 Вывод обобщенных уравнений Риккати

4 Явные решения обобщенных уравнений Риккати

IV Построение и анализ регулятора

5 Достаточные условия стабилизируемости

6 Проверка положительной определенности функционалов

7 Критерий стабилизируемости

V Численные методы поиска стабилизирующего управления

8 Численное интегрирование функционально-дифференциальных уравнений

8.1 Основные предположения и определения

8.2 Построение временной сетки.

8.3 Нахождение коэффициентов метода.

8.4 Интерполяция предыстории.

8.5 Построение фундаментальной матрицы решений.

9 Поиск параметров стабилизирующего управления

VI Примеры

10 Стабилизация двумерной системы

11 Стабилизация одномерной системы

12 Противомикробное лечение инфекционного заболевания (четырехмерная система)

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Солодушкин, Святослав Игоревич

Диссертация посвящена разработке конструктивных методов аналитического конструирования регуляторов (АКОР) для систем с последействием.

Для конечномерных систем линейно-квадратичная теория (получившая название аналитического конструирования регуляторов), разработанная A.M. Летовым и Р. Калманом в начале 60-х годов, благодаря ясной постановке и конструктивным результатам играет особую роль среди различных подходов к синтезу управлений. Вычисление коэффициентов матрицы усиления (стабилизирующего) управления на основе теории АКОР сводится к решению алгебраического уравнения Риккати (АУР), примем соответствующее управление, если оно существует, стабилизирует систему.

Исследование задач АКОР для систем с последействием инициировано статьей Н.Н. Красовского [18], в которой было показано, что оптимальное стабилизирующее управление является линейным непрерывным функционалом на функциональном (фазовом) пространстве системы с последействием, а также были выведены соотношения, описывающие параметры оптимального управления и оптимального значения функционала качества.

Основой построения общей теории АКОР для систем с последействием, также как и общей теории функционально-дифференциальных уравнений (ФДУ), является предложенная Н.Н. Красовским [16, 17] функциональная трактовка решений таких систем.

К настоящему времени теоретические аспекты АКОР для систем с последействием разработаны с достаточной полнотой, (см., например, [13,18,38, 41-43,49,52,53,55,58,60,62] и ссылки в них) однако, в силу бесконечномерной природы систем с последействием, практическое применение теории наталкивается на ряд принципиальных трудностей. Поэтому разработка конструктивных алгоритмов АКОР для систем с последействием постоянно находится в центре внимания математиков и инженеров.

Одной из основных трудностей, сдерживающих практическое использование АКОР в задачах синтеза управления для систем с последействием, является необходимость решения специальной системы обобщенных уравнений Риккати (ОУР), описывающей коэффициенты оптимального управления и представляющей собой систему алгебраических уравнений, обыкновенных дифференциальных уравнений и дифференциальных уравнений с частными производными. В связи с этим уже в первых работах, где были получены

ОУР [57,58], проблема АКОР для систем с последействием была сформулирована в виде двух задач: Задача А : нахождение явных решений ОУР;

Задача В : разработка методов исследования стабилизирующих свойств управлений, соответствующих явным решениям ОУР.

Следует особо подчеркнуть, что решение Задачи А не является самоцелью, а позволяет построить синтез управления в явном виде. Также отметим, что для систем с последействием, в отличие от конечномерных систем, линейное управление с обратной связью, построенное на основе решения ОУР, не всегда является стабилизирующим. Поэтому выделение исследования устойчивости в отдельную Задачу В представляется естественным. В настоящей работе исследуются и решаются Задача А и Задача В.

Явные решения ОУР (Задача А). Предложенные в [13,42,57-59] приближенные методы решения ОУР являются сложными для практической реализации, поэтому в настоящее время задача нахождения явных решений ОУР имеет принципиальный характер. Разработанный в данной диссертации подход к построению явных решений ОУР основывается на идее введения дополнительных (функциональных) слагаемых в квадратичный функционал качества. Модификация функционала качества в теории АКОР для конечномерных систем была предложена в работе А.А.Красовского [14]. Введение дополнительного квадратичного слагаемого в функционал качества позволило упростить матричные уравнения, описывающие коэффициенты оптимального стабилизирующего управления. В рамках такого подхода для ОДУ оптимальное стабилизирующее управление определяется матрицей усиления являющейся решением не АУР, а более простого уравнения Ляпунова. Соответствующая процедура называется аналитическим конструированием по критерию обобщенной работы, так как добавочное слагаемое в функционале качества может быть интерпретировано как "энергия"(обобщенная работа) оптимального управления. Обобщение данного подхода на системы с последействием было реализовано в работах [12,60] и других. Отметим работу [60], в которой разработан алгоритм построения точных решений ОУР на основе включения в квадратичный критерий качества дополнительных функциональных составляющих. Такое обобщение увеличивает число свободных параметров в системе и, при соответствующем их выборе, позволяет построить специальную процедуру нахождения явных решений ОУР. Трудности реализации данного метода связаны с необходимостью нахождения неустойчивых полюсов разомкнутой системы и построения специальной вспомогательной системы функций.

В работах [10,50] удалось преодолеть эти трудности за счет подходящего выбора коэффициентов обобщенного функционала качества и разработать подход, позволяющий найти явный вид решений ОУР. При этом, для нахождения решения полной системы ОУР достаточно решить либо классическое АУР, либо специальные экспоненциальные матричные уравнения. Соответствующие алгоритмы позволяют решить Задачу А нахождения явных решений ОУР. Отметим, что в рамках разрабатываемого подхода обобщенный квадратичный функционал качества не может быть произвольно заданным, а определяется в соответствии с некоторыми правилами и имеет специальную структуру. Однако наличие подобного рода ограничений на функционал качества можно считать естественным, так как в задачах стабилизации, как правило, критерий качества не связан с физической природой объекта управления, а его структура и параметры определяются исходя из инженерных требований (простоты вычислений, времени переходного процесса и т.д.). В нашем случае таким требованием является нахождение явных решений ОУР и построении синтеза управления в явной форме.

Проверка стабилизирующих свойств управлений (Задача В). Ввиду бесконечномерности фазового пространства линейных систем с последействием (что отражается, например, в счетном числе собственных чисел соответствующего квазиполинома), исследование стабилизирующих свойств синтеза управлений существенно сложнее, чем в случае конечномерных систем. Нахождение синтеза управления в явном виде (па основе решения Задачи А) позволяет свести исследование стабилизирующих свойств управления к анализу устойчивости замкнутой системы. В данной работе используется конструктивный критерий асимптотической устойчивости линейных систем с последействием, на основе анализа свойств фундаментальной матрицы системы. Учитывая, что фундаментальная матрица линейной системы с последействием может быть найдена на основе эффективных численных алгоритмов и соответствующего программного обеспечения, то соответствующий критерий позволяет реализовать конструктивные алгоритмы проверки устойчивости замкнутой системы. Еще один возможный подход к исследованию стабилизирующих свойств управлений основан на использовании функционалов Ляпунова-Красовского. Отметим, что в рамках теории АКОР для ОДУ основной метод проверки стабилизирующих свойств управлений состоит в применении метода функций Ляпунова модернизированного в соответствии с принципами динамического программирования. В рамках такого подхода, позволяющего в случае ОДУ получить конструктивные условия устойчивости, принципиальным является положительная определенность подынтегралыюго квадратичного функционала в критерии качества и положительная определенность оптимального значения (являющегося квадратичной формой) функционала качества. В теории АКОР для систем с последействием исследование стабилизирующих свойств синтеза управления может быть проведено на основе использования функционалов Ляпунова-Красовского. В настоящей работе па основе применения метода функционалов Ляпунова-Красовского, также получен ряд достаточных условий устойчивости в терминах коэффициентов системы и функционала качества. Однако, в общем случае, применение функционалов Ляпунова-Красовского наталкивается на трудности, связанные с требованием их положительной определенности, и полученные на этом пути достаточные условия устойчивости являются, как правило, достаточно сложно проверяемыми.

Еще одно замечание относительно соотношения между задачами стабилизации и оптимальной стабилизации состоит в следующем. Основной целью является разработка методов построения стабилизирующего но, вообще говоря, не обязательно оптимального управления; при этом, однако, используется методология АКОР, основанная на минимизации вспомогательного функционала качества. Рассмотрение такой оптимизационной задачи позволяет получить ряд математических соотношений (обобщенных уравнений Риккати), которым удовлетворяют (при некоторых предположениях) параметры определенного класса стабилизирующих управлений (если система может быть в принципе стабилизирована управлениями такой структуры). В рамках данной работы основная идея использования минимизируемого функционала состоит в обосновании использования ОУР при построении стабилизирующего управления. При этом, в конечном счете, задача минимизации является вспомогательной и свойство оптимальности управления не является принципиальным и, вообще говоря, специально не исследуется. При этом мы основываемся на том, что ( [22], с. 284): "Остается единственный путь: поиск форм функционалов и отвечающих им оптимальных регуляторов, при которых переходный процесс в замкнутой системе обладал бы наперед заданными свойствами. В этом случае роль оптимизирующего функционала будет заключаться, быть может, не столько в том, что он будет достигать минимума, сколько в возможности завершить синтез оптимального управления, обладающего заданными свойствами."

Цель диссертации состоит в разработке конструктивных аналитических и численных методов синтеза стабилизирующих управлений для систем с последействием в координатах и управлении па основе минимизации обобщенных квадратичных функционалов качества.

Методика исследования основана на функциональном подходе в качественной теории функционально-дифференциальных уравнений. Систематически применяются понятия и методы функционального анализа, теории устойчивости и управления, и численные методы.

Научная новизна. Разработаны новые конструктивные алгоритмы анализа и синтеза управлений для систем с последействием в управляющих параметрах на основе решения линейно-квадратичных задач управления.

Теоретическая и практическая ценность. Развитые в диссертации методы позволяют строить и анализировать синтез управления для систем с последействием. Разработанные методы и алгоритмы реализованы в пакете прикладных программ Time-delay System Stabilization в системе MATLAB. КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

ВВЕДЕНИЕ содержит историю вопроса и краткий обзор работ. Во введении обосновывается актуальность, формулируется цель диссертационной работы и пути сё достижения, отмечается новизна и практическое значение работы.

Библиография Солодушкин, Святослав Игоревич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Андреева Е.А., Колмановский В.Б., Шайхст J1.E. Управлегате системами с последействием. М.Ж Наука, 1992.

2. Бахвалов Н.С. Численные методы. М.: Наука. 1973. 632 с.

3. Долгий Ю.Ф., Ким А.В. К методу функционалов Ляпунова для систем с последействием // Дифференциальные уравнения. 1991. Т. 27. № 8. стр. 1313-1318.

4. Долгий Ю.Ф. К стабилизации линейных автономных систем дифференциальных систем с распределенным запаздыванием. Автоматика и телемеханика. 2007. № 10. стр. 92-105.

5. Ким А.В. Ко второму методу Ляпунова для систем с последействием // Дифференциальные уравнения. 1985. Т. 21. № 3. стр. 385-391.

6. Ким А.В. О методе функционалов Ляпунова для систем с последействием // Автоматртка и телемеханика. 1990. Т. 1. стр. 79-83.

7. Ким А.В. Об уравнении Беллмапа для систем с последействием // Изв. АН СССР: Техническая кибернетика. 1991. № 2. стр. 54-69.

8. Ким А.В. i-Гладкий анализ и функционально-дифференциальные уравнения. Екатеринбург: ИММ УрО РАН. 1996. 236 с.

9. Ким А.В., Волкашш Л.С. К синтезу управления для систем с последействием в управляющих параметрах. Известия Уральского государственного университета. 2003. №26 стр. 81-86.

10. Ким А.В., Ложников А.Б. Линейно-квадратичные задачи управления для систем с запаздыванием по состоянию. Точные решенртя уравнений Риккати. Автоматика и телемеханика. 2000. № 7. стр. 15-31.

11. Ким А.В., Пименов В.Г. г-Гладкий анализ и численные методы решения функционально-дифференциальных уравненрш. — М.-Ижевск:ИНЦ "Регулярная pi хаотргческая динамика 2004. 256 с.

12. Колмановский В.Б., Королева Н.И. Оптимальное управление некоторыми бршинейными системами с последействием. ПММ. 1989. Т. 53. стр. 238-243.

13. Колмановский В.Б., Майзенберг T.JI. Оптимальное управление стохастическими системами с последействием. АиТ. 1973. № 1. стр. 47-62.

14. Красовский А.А. Интегральные оценки моментов и синтез линейных систем. АиТ. 1967. № 10. стр. 53-71.

15. Красовский А.А. Системы автоматического управления полетом и их аналитическое конструирование. М.: Наука. 1973. 558 с.

16. Красовский Н.Н. О применении второго метода A.M. Ляпунова для уравнений с запаздываниями времени. ПММ, 1956. Т. 20. № 3. стр. 315-327.

17. Красовский Н.Н. Об асимптотической устойчивости систем с последействием. ПММ, 1956. Т. 20. № 4. стр. 513-518.

18. Красовский Н.Н. Об аналитическом конструировании регулятора для систем с последействием. ПММ, 1962. Т. 26. № 1. стр. 39-51.

19. Красовский Н.Н. Оптимальные процессы в системах с запаздыванием. Krasovskii N.N. Optimal Processes in Systems with Time Lag // Proc. 2nd IFAC Congress (Basel, 1963). Butterwoths, London. 1964.

20. Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Гостехиздат. 1959. 211 с.

21. Красовский Н.Н., Осипов Ю.С. О стабилизации движений управляемого объекта с запаздыванием в системе регулирования. Изв. АН СССР: Техн. Кибернетика. 1963. №6.

22. Летов A.M. Динамика полета и управление. М., 1969. 360 с.

23. Летов A.M. Аналитическое конструирование регуляторов. I-V Автоматика и телемеханика, 1960. Т. 21, № 4, стр. 436-441. 1962. Т. 23, № 11, стр. 1405-1413.

24. Маркушин Е.М., Шиманов С.Н. Приближиенное решение задачи аналитического конструирования для систем с запаздыванием // Автоматика и телемеханика. 1963. № 3.

25. Марчук Г.И. Математические модели в иммунологии. М.: Наука. 1980. 264 с.

26. Осипов Ю.С. Стабилизация систем с запаздыванием // Дифференциальные уравнения. 1965. Т. 1. № 5. стр. 463-473.

27. Репин Ю.М., Третьяков В.Е. Решение задачи об аналитическом конструировании регулятора на элктронных моделирующих установках // Автоматика и телемеханика. 1963.Т.24. № 6. стр. 738-743.

28. Солодушкин С.И. Стабилизация линейных систем с запаздыванием по времени в координатах и управлении // Труды института математики и механики УрО РАН, 2008. Т. 14, № 4 с. 143-158.

29. Солодушкин С.И. Линейно-квадратичная задача стабилизации систем с запаздыванием по времени // Проблемы теоретической и прикладной математики. Екатеринбург, УрО РАН.2008. с. 291-297.

30. Солодушкин С.И. О стабилизации систем с последействием // Вестник Удмуртского университета. Математика. Мехаиика. Компьютерные науки. Ижевск. 2008. с. 140-141.

31. Солодушкин С.И. Линейно-квадратичная задача стабилизации систем с запаздыванием по времени Воронежская зимняя математическая школа С.Г. Крейна 2008. Тезисы докладов. 2008. с. 131-133.

32. Солодушкин С.И. Стабилизация систем с запаздыванием по времени в координатах и управлении // Системы управления и информационные технологии, 2009. 1.3(35) с. 404-406.

33. Солодушкин С.И. Об одном конструктивном критерии проверки стабилизируемое™ систем с запаздыванием по времени // Проблемы теоретической и прикладной математики. Екатеринбург, УрО РАН. 2009. с. 251-254.

34. Солодушкин С.И. Стабилизация систем с запаздыванием по времени в координатах и управлении // Информационные технологии моделирования и управлеия, 2009. 2(54) с. 226-230.

35. Харатишвилли Г.Л. Оптимальные процессы с запаздыванием. Тбилиси: Мицниереба, 1966.

36. Vinter R.B., Kwong R.H. The Time Quadratic Control Problem for Linear Systems wiyh State and Control Delays: An Evolution Equation Approach // SIAM J. Control and Optimization. 1981. Vol. 19, № 1. pp. 139-153.

37. Wenzhang H. Generalization of Liapunov's Hteorem in a Linear Delay Sustems // J. Math. Anal. Appl. 1989. V. 142. № 1. pp. 83-94.

38. Yoshizawa T. Stability Theory by Liapunov's Second Method. Tocyo: Math.Soc. Japan. 1966.