автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы и алгоритмы оптимизации динамических систем, описываемых линейными уравнениями с управляемыми коэффициентами
Автореферат диссертации по теме "Методы и алгоритмы оптимизации динамических систем, описываемых линейными уравнениями с управляемыми коэффициентами"
На правах рукописи
Батурина Ольга Владимировна
МЕТОДЫ И АЛГОРИТМЫ ОПТИМИЗАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ, ОПИСЫВАЕМЫХ ЛИНЕЙНЫМИ УРАВНЕНИЯМИ С УПРАВЛЯЕМЫМИ КОЭФФИЦИЕНТАМИ
Специальность 05.13.01 — Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
IЯ НОЯ 2013
Москва - 2013
005540074
Работа выполнена в Федеральном государственном бюджетном учреждении науки Институт проблем управления им. В.А. Трапезникова Российской ака-
демии наук
Научный руководитель: доктор технических наук,
профессор Кротов Вадим Федорович
Научный консультант: кандидат физико-математических наук,
доцент Расина Ирина Викторовна
Официальные оппоненты: доктор физико-математических наук,
профессор Хрусталев Михаил Михайлович (Московский авиационный институт)
кандидат физико-математических наук Лемперт Анна Ананьевна (Институт динамики систем и теории управления СО РАН)
Ведущая организация: Нижегородский государственный университет
им. Н.И. Лобачевского
Защита состоится 19 декабря 2013 г. в 14.00 часов на заседании диссертационного совета Д 002.226.02 при Институте проблем управления им. В.А. Трапезникова РАН по адресу: 117997, г. Москва, ул. Профсоюзная, 65.
С диссертацией можно ознакомиться в библиотеке ИПУ им. В.А. Трапезникова РАН.
Автореферат разослан 19 ноября 2013 г. Ученый секретарь
диссертационного совета Д 002.226.02, канд. физ.-мат. наук
Общая характеристика работы
Актуальность темы и степень разработанности. Линейные системы с управляемыми коэффициентами широко распространены на практике. Особенно ярко это подтверждается активно ведущимися в настоящее время исследованиями квантовых систем и поисками для них решений задач оптимизации (Caneva Т. Optimal control at the quantum speed limit/ T. Caneva, M. Murphy, T. Calarco and others // Phys. Rev. Lett. 103. 240501. 2009. URL: http://arxiv.org/abs/0902.4193v2; Кротов В.Ф. Управление квантовыми системами и некоторые идеи теории оптимального управления // Автоматика и телемеханика. 2009. №3. С. 15-23; Гурман В.И. Магистральные решения в задачах оптимального управления кваптомеханическими системами // Автоматика и телемеханика. 2011. №6. С. 115-126). Успешное решение такого рода задач позволит сделать следующий шаг в проблеме создания квантовых компьютеров. При решении такого вида задач активно используется метод глобального улучшения управления Кротова. Очевидно, что развитие метода, его модификации позволят строить более эффективные итерационные процедуры. Анализ исследуемых задач показывает, что многие из них обладают свойством вырожденности: наличием в системе пассивных дифференциальных связей. Переход к производной задаче, предложенный в работах В.И. Гурмана, позволяет уменьшить размерность исследуемой задачи. В свою очередь решение производной задачи носит магистральный характер и, следовательно, обладает неоднородной структурой. Этот фактор позволяет представлять искомое решение в виде дискретно-непрерывного процесса и применять для пего модификации глобального метода с целью максимального учета специфики задачи и использования наиболее эффективных вариантов итерационных процедур. Актуальность выбранной темы подтверждает и тот факт, что указанные вопросы рассматривались на международной конференции по периодическим системам (5th IFAC International Workshop on Periodic Control Systems (PSYCO'2013), Кап, Франция, июнь 2013).
В работе систематически развивается метод глобального улучшения управления, рассматриваются его модификации, в том числе и для дискретно-непрерывных систем, а также практические приложения для задач оптимизации квантовых систем. Основой для этого служат достаточные условия оптимальности Кротова, принципы расширения и локализации, минимаксный принцип, глобальный метод улучшения управления, теория вырожденных задач оптимального управления Гурмана, математическая модель и достаточные условия оптимальности дискретно-непрерывных систем (ДНС).
Целью работы является исследование, развитие и применение в итерационных процедурах метода Кротова глобального улучшения управления
для линейных по состоянию систем.
Основные задачи исследования.
1. Экспериментальное исследование глобального метода применительно к га-мильтоновым системам, линейным по состоянию, разработка его модификаций и расширение областей применения.
2. Получение достаточных условий оптимальности и улучшения для линейных по состоянию ДНС и построение для них аналога метода глобального улучшения.
3. Модификация метода применительно к вырожденным задачам с неограниченным линейным управлением.
4. Разработка вычислительных процедур для решения модельных и прикладных задач.
Научная новизна. Новыми результатами являются достаточные условия оптимальности и улучшения для линейных по состоянию ДНС и метод глобального улучшения для этого же класса систем, схема исследования вырожденной задачи оптимального управления для билинейной системы и представление ее магистрального решения в форме ДНС. Полученные результаты расширяют область применения метода глобального улучшения управления.
Теоретическая ценность заключается в реализации поставленной цели — исследовании, развитии и применении в итерационных процедурах метода Кротова глобального улучшения управления для линейных по состоянию систем.
Практическая ценность состоит в расширении круга приложений метода глобального улучшения управления, что позволяет решать с его помощью задачи оптимального управления для линейных ДНС и вырожденных задач в билинейных системах.
Положения, выносимые на защиту.
1. Результаты исследования линейных систем с управляемыми коэффициентами и квадратичным критерием качества методом глобального улучшения управления, в том числе гамильтоновых систем, включая вопросы построения приближенно-оптимального синтеза управления.
2. Достаточные условия оптимальности и улучшения для линейных по состоянию ДНС. Построение метода глобального улучшения управления для линейных ДНС и его модификации для нелинейных ДНС. Теорема об улуч-шаемости начального приближения для линейных ДНС.
3. Результаты исследования билинейных систем на основе теории вырожденных задач. Представление магистральных решений билинейных систем в форме ДНС и модификация метода для этого случая.
4. Апробация предложенных схем и модификаций метода глобального улучшения управления на серии тестовых и содержательных примеров из кван-
товой механики.
Степень достоверности и апробация результатов. Достоверность полученных результатов подтверждена доказательствами соответствующих теорем и содержательной интерпретацией решений задач.
Результаты работы были представлены в докладах на следующих научных конференциях: "Методы оптимизации и их приложения". Северобай-кальск, 2008. III Всероссийская молодежная научная конференция по проблемам управления. Москва, 2008. 32-я конференция молодых ученых и специалистов ИППИ РАН "Информационные технологии и системы". Москва, 2009. Молодежный симпозиум с международным участием "Теория управления: новые методы и приложения". Переславль-Залесский, 2009. VI школа-семинар молодых ученых "Управление большими системами". Ижевск, 2009. XI Международная конференция "Устойчивость и колебания нелинейных систем управления "(конференция Пятницкого). Москва, 2010. VII Всероссийская школа-конференция молодых ученых "Управление большими системами". Пермь, 2010. Всероссийская конференция "Устойчивость и процессы управления". Санкт-Петербург, 2010. Воронежская весенняя математическая школа "Понтрягинские чтения - XXI" Современные методы теории краевых задач. Воронеж, 2010. III Международная конференция "Инфо-коммуниционные и вычислительные технологии и системы". Улан-Удэ, 2010. Modeling and Simulation on Systems. Улан-Батор, 2010. XV Байкальская Международная школа-семинар "Методы оптимизации и их приложения". Иркутск, 2011. Российско-монгольская конференция молодых ученых по математическому моделированию, вычислительно-информационным технологиям и управлению. Иркутск - Ханх, 2011. VIII Всероссийская школа-конференция молодых ученых "Управление большими системами". Магнитогорск, 2011. Школа-семинар "Модели, оптимизация и приложения импульсных и гибридных систем". Геленджик, 2011. VI Международный научный семинар GSSCP-2012 "Обобщенные постановки и решения задач управления". Геленджик, 2012. Всероссийская конференция "Управление в технических, эргатических, организационных и сетевых системах". Санкт-Петербург, 2012. Российско-китайский семинар "Теория оптимального управления и научные вычисления". Шанхай, 2012. X Всероссийская школа-конференция молодых ученых "Управление большими системами". Уфа, 2013. Numerical Computations: Theory and Algorithms. International Conference and Summer School. Фалерна, Италия, 2013. 5th IFAC International Workshop on Periodic Control Systems. Кан, Франция, 2013. Семинар Лаборатории 45 ИПУ им. В.А. Трапезникова РАН (рук. проф. В.Ф. Кротов). Семинар ИПС им. А.К. Айламазяна РАН "Модели и методы теории управления "(рук. проф. В.И. Гурман).
Основное содержание работы
Диссертация состоит из введения, заключения, 4 глав и списка литературы.
Во введении показана актуальность работы, определены цель и задачи, дан обзор литературы, отражающий состояние вопроса.
Глава 1. Основы теории
В данной главе излагается кратко основной математический аппарат, используемый далее в работе. За основу взяты следующие источники: Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973; Krotov V.F. Global methods in optimal control theory. N.Y. Marcel Dekker, 1996; Гурман В.И. Принцип расширения в задачах управления. М. Наука. Физ-матлит 1997; Расина И.В. Итерационные алгоритмы оптимизации дискретно-непрерывных процессов // Автоматика и телемеханика. 2012. №10. С. 3-17.
Разделы этой главы включают достаточные условия оптимальности и улучшения управления Кротова для непрерывных систем; общие принципы расширения и локализации Гурмана; основы теории вырожденных задач; модель дискретно-непрерывной системы (ДНС) и достаточные условия оптимальности и улучшения для этой модели.
Глава 2. Оптимизация систем, описываемых обыкновенными дифференциальными уравнениями
Данная глава посвящена разработке и экспериментальному исследованию глобального метода улучшения применительно к линейным по состоянию непрерывным системам с учетом особенностей, возникающих в частных случаях.
Рассматривается следующая задача:
где х{Ь) £ К" - напрерывная кусочно-дифференцируемая функция, «(¿) -скалярное кусочно-непрерывное управление, функции Л(£, и),Ь{Ь, и) — непрерывны по совокупности переменных, F(ж) — гладкая линейная или вогнутая функция. Рассматривается также регуляризованная задача для исключения возможных особых и скользящих режимов управления:
(1) х = А (t, u)x + b{t,u), te Т, Т = [ti, tF], х (</) = хI
(2)
I = F(x(tF)) -» inf,
<f
где параметр регуляризации /3 > 0 фиксирован. Для задачи (1),(2) получены достаточные условия оптимальности как частный случай достаточных условий оптимальности Кротова.
Глобальный метод улучшения Кротова для допустимого управления ua(t) сводится к следующим соотношениям и операциям:
(4) ф = —AT(t, и)ф, ф(1Е) = -Fx(x(tF)),
u(t,x) 6 Argmax H(t, x, i>(t), и), H = фт(t)(A(t,u) x + b(t,u)). ueV
1. "Слева направо" просчитывается исходная система (1) при и = us(t) и заданных начальных условиях. Получается соответствующая траектория xs(t).
2. "Справа налево" разрешается сопряженная система (4) при и = us(t) и x(lp) ~ хs(tp) и находится сопряженная траектория ips(l).
3. Просчитывается "слева направо" система (1) при и = й(t, х) и определяется новая траектория xs+i(t) и управление us+j = u(t,xs+i(t)).
Находится новое значение функционала Итерация заканчивается и начинается следующая итерация с шага 2.
Процесс итераций заканчивается, если |/i+j — Is \ «Ос заданной точностью. Данный метод сравнивается с известным градиентным методом в серии вычислительных экспериментов.
Как важный частный случай рассматривается билинейная гамильто-нова система:
(5) ± = {А + иВ)х, te[t[,tF), |u(i)| < и, x(tI)=xI,
(6) I = (x(tF), Nx(tF)) -> inf,
где N — симметричная матрица; А и В — п х n-матрицы; управление и одномерно; i> > 0, размерность фазового вектора четная (n = 2т), х = (х1, х2,..., хп)\ матрицы А и В имеют следующую блочную структуру:
m ЧЛо"). "-(Л?).
где матрицы Рд и Рв симметричны.
Эта система имеет динамический инвариант
п
(8) /(*) = ||х||2 = Y,(xk)2 = const.
к=1
Проведено экспериментальное исследование тестовой задачи рассматриваемого класса и задачи оптимального управления квантовой системой на модели Ландау-Зинера. Сравнивались глобальный метод, глобальный метод с регуляризацией и градиентный метод. Показана высокая эффективность глобального метода.
Глава 3. Оптимизация дискретно-непрерывных систем
Данная глава посвящена классу управляемых процессов, структура описания которых изменяется с течением времени, и для которых непосредственно не применимы классические результаты теории оптимального управления. Для таких процессов разработаны специальные математические модели и достаточные условия оптимальности (Расина И.В. Итерационные алгоритмы оптимизации дискретно-непрерывных процессов // Автоматика и телемеханика. 2012. №10. С. 3-17). В данной главе рассматривается линейная модель ДНС. За основу берется дискретная модель
(9) х(к + 1) = А(к,и)х(к) + Ь(к,и),
х <= и е и (к) С к е К = {кг, кг + 1,..., кР},
где к — номер шага (этапа), не обязательно физическое время, хаи — соответственно переменные состояния и управления. Все указанные объекты
— произвольной природы для различных к, и (к) — заданное при каждом к множество, к[,кр — начальный и конечный шаги соответственно. Пусть на некотором подмножестве К' С К, кр К', и = (иа, тс), и'1 — переменная управления, тпс = (хе(к,{),ис(к,{)) — некоторый непрерывный управляемый процесс с соответствующей дифференциальной системой
(10) хс = Ас (к, 2, ис) хс + Ьс (к, г, ис),
¡бТ(г),Т = ке К' С К, кР К',
Iе е мп(А:), ис е ис (к, ¿) с , и* е иа(к) с кг(<:), 2 = (х, ил).
Взаимодействие с каждой подсистемой нижнего уровня осуществляется через границу этой подсистемы и соответствующего непрерывного процесса 7е:
= {7С: 11 = т{к,г), = = \9(к,г), хсР е Ко-
оператор правой части (9) сводится к следующему: а(к, 2)7° + /3 (к, г), где а — матрица, /3 — вектор соответствующих размерностей. Здесь хс и и°
— состояние и управление непрерывного процесса, к — номер шага (этапа), и (к), и <1{к) — заданные множества, т(к,г), £(к.г), д(к,г) — заданные
функции, z = (х, ud) — совокупность переменных дискретной цепочки (верхнего уровня), играющая на нижнем уровне роль параметров. Все зависимости от г здесь и далее считаются линейными:
A(z,q) = Ло(<?) + Az{g)z,
где q — совокупность прочих аргументов.
Решением этой системы считается набор т = (х(к), и{к)) (называемый дискретно-непрерывным процессом), где прн k S К': и(к) = (ud(k), тпс(к)) , тс(к) 6 D°{k,z), тс(к) — непрерывный процесс (xc(k,t).uc(k,t)), t € Т(k,z), а Dc(k,z) — множество допустимых процессов тпс, удовлетворяющих указанной дифференциальной системе (10).
Обозначим через D множество элементов т, удовлетворяющих всем вышеперечисленным условиям.
Рассматривается задача оптимального управления о минимуме на D функционала I = cTx(kF), где с — n(kF)-вектор.
Предложенная модель удобна для представления неоднородных управляемых процессов и является двухуровневой иерархической системой. При этом нижний уровень представляет собой описания однородных процессов на отдельных этапах, а верхний уровень связывает эти описания в единый процесс и управляет функционированием всей системы в целом. В различных задачах управления, в частности в задачах оптимизации, оба уровня рассматриваются во взаимодействии. Взаимодействие с каждой подсистемой нижнего уровня осуществляется, как видно, через границу этой подсистемы и соответствующего непрерывного процесса 7е. Такое представление позволяет декомпозировать всю неоднородную систему на совокупность однородных для применения к ним готовых хорошо разработанных методов.
Для решения поставленной задачи выводятся достаточные условия оптимальности и улучшения управления, а на их основе и минимаксном принципе Кротова строится итерационная процедура.
Вводятся линейные по переменным состояния функции ip(k,x) = 1фТ(к)х и ipc(k,z,t,xc) = ^cT(k,z,t)хс, где ф(к) произвольна, а %j)c{k,z,t) — произвольная кусочно-гладкая по t. Строится лагранжиан
L = G{x{kF)) - Y1 R(k,x{k),u{k))-
keK\K'\kF j IF(k,z;t,xc(t),uc(t))dt),
fc6K' T(fc,2)
G(x) = cTx + i>T{kF)xF - i}>T(ki)xj, l = MG(x{kF)).
R(k,x, и) = Н(х,ф(к + 1),х,и) — фт(к)х,
где
Н(х, ф{к + 1), ж, и) = фт(к + 1) (А{к, и)х(к) + Ь{к, и)),ке К\К' Н(к, z, 7) = фт (к + 1) (а{к, z)jc + Р (к, z)), к е К'
Gc (к, z, 7е) = —Н(к, z, 7е) + фт(к)х + фсТ(к, z, tF)xcF -
tj = T(k,z), tF = 0(k,z)> xc(t!) = ^k,z), Rc (к, z, t, xc, uc) = Hc + фсТ(к, z, t)xc,
где
Hc(k, z, t, uc, xc) = фсТ(к, z, t) (Ac {к, z, t, uc) xc + bc (к, z, t, uc)). (j,°(k,z,t)= sup i?c(fc,z,i,:Ec,'uc), lc(k,z)= inf Gc{k,x(tF),jc),
(x',u") (x'f)
ц{к) = sup R(k, z,x,u), к <= K\K', ц{к) = - inf lc(k, z), к & К'.
(X,tt) (*>«'')
Теорема 3.2.2. Пусть имеется два процесса m1 € D, т.11 6 D и функции ф, фс такие, что L(mn) < L^m1) = /(m1). Тогда I(mn) < /(m1).
Теорема 3.2.3. Пусть имеется последовательность {ms} С D, и функции ф,фс такие, что:
1) fic(z,t) — кусочно-непрерывна;
2) H(k,xs(k),us{k)) - ipT(k)xs(k) ц{к), к 6 К;
3) / (Яс(£, zc, t, xcs(k, t), ucs{k, t)) - фсТхс(к, t))dt -» Atc(/r, г), A; € К' T(fc,z)
5) G(xs(tF)) -> f.
Тогда эта последовательность минимизирует функционал I на D. Аналог метода глобального улучшения управления приводит к задаче Коши для ДНС относительно ф(к) и фс(к, z, t) с начальными условиями на правом конце:
ф (kF) = -с, ф (к) = НХ, к € K\K'\kF, (11) ф{к) = Нх + {Нг-фс2{к,1Р)хсР + фс2{к,11)хс1)гх, ке К',
(12) ipQ = —Нхс, Ф1=-Нх.г, Фс{кМ = Н^, шм = H*pZ.
В целом получается следующая итерационная процедура.
1. "Слева направо" просчитывается ДНС (9), (10) при и = и8(к), и6, — ис = и заданных начальных условиях. Получаются соответствующие траектории х3(к), хса(к,
2. "Справа налево" разрешается ДНС относительно "ф, 1рс и фс,.
3. Просчитывается "слева направо" исходная ДНС (9), (10) при = &щтах(—-ф°(к + 1)и + / (IIе + г1>схс)М), й= argmax.fi, йс = argmax Нс
и начальном условии х(£/) = .т/. Находится 13+\. Итерация заканчивается и начинается следующая итерация с шага 1.
Процесс итераций заканчивается, если |/5+х — 1а\ ~ 0 с заданной точностью.
Теорема 3.2.4. Если элемент тп1 не оптимален, то он улучшаем предложенным алгоритмом: 1(т1) > 1(тп).
На наглядном примере показано, что этот алгоритм применим и к нелинейным ДНС по принципу локализации путем частичной линеаризации исходной ДНС по переменным состояния в окрестности траектории на каждой итерации и построению достаточно простого алгоритма улучшения на итерациях.
Рассмотрен также простой содержательный пример — оптимальный экономический рост с учетом инноваций как модификация известной од-нопродуктовой модели экономического роста (Гурман В.И., Трушкова Е.А. Практические методы оптимизации. - Переславль-Залесский: "Университет города Переславля". 2009. 160с.):
(13) К = г- 5К, П = р(1 - А)у(К)" - Вг, К > 0, 0 < а < 1,
где К — основной капитал, А, В — коэффициенты прямых и фондообразующих затрат, соответственно, 5 — коэффициент амортизации, i — инвестиции, р — индекс цен, П — накопленный доход при отсутствии инновационных затрат, 7 — коэффициент фондоотдачи.
Предполагается, что коэффициент прямых затрат А поэтапно уменьшается за счет активных инноваций (реконструкция, модернизация оборудования и т.п.):
А(к+ 1) - Л = (А(к) - А)(а- и), 0 < и < а - Ь; Ь < а, Л(0) = А0,
к — номер этапа, А — значение, соответствующее мировому уровню, и — управление инновациями, требующее пропорциональных затрат Би. Максимизируется накопленный доход за вычетом инновационных затрат, т.е. минимизируется функционал
кР-1
I = Юи(к) - П(Т), о
где Т — общий период (горизонт) планирования.
После перехода к эквивалентной производной системе на каждом этапе была построена соответствующая ДНС, применен описанный выше алгоритм и проведены конкретные расчеты для нескольких вариантов значений удельных инновационных затрат В (рис. 1, табл. 1). На рисунке график 1 соответствует Б = 15, график 2 - Б = 6 и график 3 - Б = 0.
Рис. 1.
Таблица 1.
О 0 6 15
1 -58,1959 -54,1595 -50,7383
Конечный результат для всех вариантов получается практически за одну итерацию (следствие упрощения при переходе к производной системе). На оптимальном режиме активные инновации производятся с максимальной интенсивностью на начальных этапах и не производятся на конечных этапах.
Построенный алгоритм последовательного улучшения высокоэффективен для линейных по состоянию ДНС, как и известные его аналоги для непрерывных и дискретных систем, поскольку допускает глобальную операцию минимизации лагранжиана по управлениям при наиболее простой, линейной, конструкции функции Кротова и не требует параметров настройки.
В случае дискретно-непрерывного представления приближенных магистральных решений, характерных для многих прикладных задач, дополнительный эффект получается за счет возможного изменения порядка системы на отдельных этапах — использования исходной системы на переходных
участках и производной системы меньшего порядка на магистральных участках.
Глава 4. Исследование метода глобального улучшения применительно к магистральным решениям билинейной задачи оптимального управления
Рассматривается система
ч
(14) х = АоЩх + 60(() + ^ (А^)х + Ь,(£))
1
¿6Т= [ЬI, ЬР], х е К", и 6 и С Е9.
Ставится задача о минимуме функционала I = 7?(х(<^)) = стх(1р) при заданном х(</) = Х[.
Поставленная задача оптимального управления относится к классу вырожденных с характерными для приложений магистральными решениями — точными или приближенными. Точные разрывные (в пространстве состояний) решения получаются при неограниченных ьР как регулярные решения производной задачи меньшего порядка, где переменными состояния служат интегралы предельной системы, в данном случае
Ит 4
Рассмотрим это более детально для случая одного линейного управления. Записывается производная система
У = {ш (еЛ'Мт)"1 + (У1(()т)-14>(о) У + Ш + (еА^т)-\(0+
°° ок
(15) + (Ах{1))-\1){е-л^ - Е)т, е<? = Е 1Г-
к=0
В результате исследования производной задачи получается окончательно магистральное решение, которое при неограниченном и1 следует рассматривать как точное обобщенное решение исходной. При ограниченном и1 это же решение используется для построения начального приближения в той же самой итерационной процедуре применительно к исходной задаче.
При практической реализации магистрального решения естественно его дискретно-непрерывное представление. Исходная система записывается в
новых переменных (у, г). Для этого достаточно дополнить (15) уравнением 7- = и. Разрывное решение для r(t) как программа управления в производной задаче аппроксимируется в окрестностях точек разрыва решением уравнения Т = и при и = Umax ИЛИ и = Umin.
Для последовательного улучшения этого приближенного магистрального решения строится ДНС.
Заданный отрезок разбивается на К = —1 этапов, соответствующих точкам разрыва. Этап к = О — выход из начальной точки на магистраль. Этап к = К — сход с магистрали в конечную точку. Остальные четные к — переходы между магистралями, а нечетные к — движения по магистралям.
Векторы состояния верхнего (дискретного) уровня обозначаются через (у0, у, г), а нижнего (непрерывного) уровня — через (ус, тс).
Изменение переменных описывается следующими уравнениями (по шагам):
у°(к + 1) = у°(к) + и1, у\к)<их<ч1,к = 0,1,..., К. Для четных к
(16) ус = fc(t, ус,тс), т° = ис, ге[у°(ад,
уЧ{к) = у{к), у (к + 1) = Ур(к), Tf(k) = т(к). Для нечетных к
(17) if = fc(t, ус, ис), ис = тс, t £ [у0(к), и1],
yci{k) = y(.k), у(к + 1) = Ур(к), т(к + 1) = и2.
Здесь управление и1 определяет моменты окончания этапов, а переменная у0 играет роль начальных моментов этапов. Дифференциальное уравнение
тс = ис, |«с| < а,
действует на переходных (четных) этапах, а на нечетных (магистральных) исключается.
В этой формализации рассматривается задача о минимуме соответствующего предельной системе функционала при заданных y{kj) = У и т(0) = tj. Для решения этой задачи может быть применен итерационный алгоритм глобального улучшения типа Кротова, описанный выше в главе 3.
Вся процедура исследования апробирована на двух задачах из области управления квантовыми системами. Первая — задача на модели Ландау-Зинера. Исходные уравнения:
(18) х1 = я4 + их3, х2 = х3 - их4, х3 = -х2 - их1, х4 = -х1 + их2.
í€[0,íf], z(0) = :ro, I = F{x{tF)) ->• min, F{x) = \\x - x\\2,
где x — желаемое конечное состояние. С учетом инварианта ||х|| = const функционал сводится к линейному F(x) = const + lTx. Уравнения и функционал производной системы:
у1 = у2 sin 2т + у4 cos 2т, у2 = —у1 sin 2т + у3 cos 2т,
у3 = у4 sin 2т — у2 cos 2т, у4 = —у3 sin 2т — у1 cos 2т,
F(x(y,T)) = const + mJycosT + mjy sin т.
Переменная т служит управлением, которое на итерациях получается из операций максимума Н и минимума F аналитически, что радикально сокращает объем вычислений.
Были проведены расчеты для нескольких начальных условий и начальных приближений, из которых выделено одно из наиболее представительных:
tF= 0,3; t(í) = const = тг/4; у0 = ((0,8)1/2, -(0,2)1'2, 0, 0),
х = (1/2, 1/2, 1/2, 1/2), I = —2х. После 3-й итерации функционал практически не менялся (табл. 2). Управле-
Таблица 2.
Номер итерации 0 1 2 3
Значение (/ — 2) 0,9779 -1,3331 -1,7659 -1,7688
ние t(î) получилось весьма характерным — кусочно-постоянным с разрывами в начальной и конечной точках. Соответствующее решение исходной задачи при неограниченном управлении получается двухимпульсным.
Для решения задачи с ограниченным управлением |и| < а разрывная функция t(î) аппроксимировалась в окрестностях точек разрыва кусочно-гладкой функцией и далее улучшалась как дискретно-нерерывная, как показано на рнс. 2 для а = 50 (1 - решение производной задачи, 2 - t(î) на нулевой итерации, 3 - t(î) на второй итерации).
Вторая задача, аналогичная первой, но более сложная — оптимизация процесса передачи возбуждения в спиновой цепочке — поставлена в работе M. Murphy, S. Montangero, V. Giovannetti, T. Calarco. Communication at the Quantum Speed Limit Along a Spin Chain. Phys. Rev. Lett., 2010.
Рис. 2.
1 — — 1 .....з$...........
//г
1 1 /
1 J............
1 . Л........../
| 7 л.../....
17
Таблица 3.
Производная система Аппроксимированная система
Номер шага 0 1 2 3
Значение (/ — 2) 0,9779 -1,7688 -1,5953 -1,6674
иШ_1:Шр://агх1у.о^/аЬз/1004.3445у1, на основе уравнения Шредингера, гамильтониан которого зависит от комбинации линейного и нелинейного управлений:
(19)
г = -гН{иъ и2)г, г € С", Я = Н0 + {щк^щ)},
#о =
/-11 О 1 -2 1 О 1 -2
О 0 \ О О О О
О 0 0 ... -2 1 \ 0 0 0 ... 1 -1 /
3 — номер спина в цепочке, — действительные непрерывные функции.
Требуется минимизировать функционал
/ = .Г (*(«,.)) = £ \\ztfr)-
где г* £ С" заданное состояние.
Переход к производной системе выполняется компактно непосредственно в комплексных переменных:
(20) гу = (а1а5{-геЛ>2)т}Я0Шаё{е-^Ыг}) V).
Здесь и> — вектор состояния, т(£) — новое управление (нелинейное, кусочно-непрывное), а управление «-¿(О принимается кусочно-постоянным, которое заменяет с любой точностью кусочно-непрывное при достаточно малых интервалах постоянства.
Система (20) рассматривается далее как обычная регулярная линейная система с управляемыми кэффициентами. После перехода к действительным переменным к ней может применяться метод глобального улучшения, как и в первой задаче.
Рис. 3.
Таблица 4.
Номер итерации 0 1' 1 2
Значение функционала 2,2023 1,1801 1,1601 1,1565
Проведены вычислительные эксперименты для спиновых цепочек из 2-х и 3-х спинов.
За начальное приближение было принято т(£) = 0. При этом система не зависит от «2- Улучшение остановилось после первой итерации, что говорит о высокой эффективности преобразования к производной системе. Результаты решения для трехспиновой цепочки представлены на рнс. 3-4(1-
о.4 0.2 о
-о.г -<н -о $ ■0.«
Таблица 5.
Производная система Аппроксимированная система
Номер шага 0 1 2 3
Функционал 2,2023 1,1565 1,1738 1,1609
решение производной системы, 2 - решение аппроксимированной системы) и в табл. 4-5 (где 1' - результат априорной минимизации по управлению).
В заключении сформулированы основные результаты, полученные в диссертации.
1. Предложены модификации метода глобального улучшения для линейных систем с управляемыми коэффициентами, в том числе гамильтоновых систем с квадратичным критерием качества. Для указанного класса задач сформулированы и доказаны достаточные условия оптимальности.
2. Сформулированы и доказаны теоремы о достаточных условиях оптимальности и улучшения управления для линейных по состоянию ДНС. Построен метод глобального улучшения управления для линейных ДНС и его модификации для нелинейных ДНС. Сформулирована и доказана теорема об улучшаемое™ начального приближения для линейных ДНС.
3. Предложено представление магистральных решений билинейных систем на основе теории вырожденных задач в форме ДНС, позволяющее применение разработанного метода глобального улучшения для ДНС.
4. Проведена апробация предложенных схем и модификаций метода глобального улучшения управления на серии тестовых и содержательных примеров из квантовой механики.
Итоги исследования, рекомендации и перспективы. В работе показана высокая эффективность глобального метода улучшения для линейных по состоянию систем. Предложен ряд модификаций метода для ДНС. Полученные результаты являются перспективными для решения задач квантовой механики, в том числе для решения задачи передачи возбуждения в спиновой цепочке.
Список публикаций по теме диссертации
Основные результаты диссертации отражены в 20 публикациях, в т.ч. в 5 статьях в рецензируемых журналах из списка рекомендованных ВАК.
Статьи в рецензируемых журналах из списка рекомендованных ВАК.
1. Батурина О.В. Билинейные динамические системы: исследование итеративных методов оптимизации // Проблемы управления. 2010. №5. С. 22-27.
2. Батурина О.В., Моржин О.В. Оптимальное управление системой спинов на основе метода глобального улучшения // Автоматика и телемеханика. 2011. №6. C.79-8G.
3. Кротов Б.Ф., Булатов A.B., Батурина О.В. К оптимизации линейных систем с управляемыми коэффициентами // Автоматика и телемеханика. 2011. №6. С. 64-78.
4. Расина И.В., Батурина О.В. Оптимизация линейных по состоянию дискретно-непрерывных систем // Автоматика и телемеханика. 2013. №4. С. 80-90.
5. Расина И.В., Батурина О.В. Оптимизация управления в билинейных системах // Автоматика и телемеханика. 2013. №5. С. 102-113.
Публикации в других изданиях:
6. Батурина О.В., Моржин О.В. Оптимизация управления квантовой системой на модели Ландау-Зинера // Программные системы: теория и приложения, 2011. 2:1. С. 51-61.
7. Батурина О.В., Булатов A.B., Моржин О.В. Алгоритмы нелокального улучшения управлений в классах нелинейных дифференциальных систем // Программные системы: теория и приложения. 2011. 2:5. С. 31-48.
8. Батурина О.В., Булатов A.B., Кротов В.Ф. Оптимизация линейных систем с управляемыми коэффициентами / Тезисы докладов 11-й Междунар. конф. "Устойчивость и колебания нелинейных систем управления". Москва, 2010. М.: ИПУ РАН, 2010. С. 22.
9. Кротов В.Ф., Булатов A.B., Батурина О.В. К оптимизации линейных систем с управляемыми коэффициентами. / V Междунар. симпозиум "Обобщенные постановки и решения задач управления". Монголия, г. Улан-Батор.
2010.
10. Батурина О.В. Глобальный метод улучшения для задачи оптимального управления с невогнутым квадратичным функционалом и гамильтоновой системой уравнений / Материалы VII Всерос. школы-конф. молодых ученых "Управление большими системами". Пермь. 2010. С. 11-15.
11. Батурина О.В. Сингулярный режим в задаче оптимизации линейных динамических систем с управляемыми коэффициентами / Тр. Всерос. конф. "Устойчивость и процессы управления". СПб: Изд-во С.-Петерб. ун-та, 2010. С.61-62.
12. Батурина О.В. Решение задачи улучшения управления для линейных систем с управляемыми коэффициентами / Материалы Воронежской весенней математической школы "Понтрягинские чтения - XXI" Современные методы теории краевых задач. Воронеж. 2010. С. 29.
13. Батурина О.В. Влияние регуляризующего слагаемого на решение задачи улучшения управления линейными динамическими системами с управляемыми коэффициентами / Материалы III Междунар. конф. "Инфо-коммуникационные и вычислительные технологии и системы". Улан-Удэ. 2010.
14. Батурина О.В. Глобальный метод улучшения для задачи управления системой спинов / Тр. XV Байкальской Междунар. школы-семинара "Методы оптимизации и их приложения". Иркутск, 2011 г., т.5: Прикладные задачи. 2011. С. 6-9.
15. Батурина О.В., Моржин О.В. Методы нелокального улучшения управления в дифференциальных системах / Тез. Российско-монгольской конф. молодых ученых по математическому моделированию, вычислительно-информационным технологиям и управлению. Иркутск - Ханх. 2011. С.11.
16. Батурина О.В. Глобальный метод улучшения управления квантомехани-ческой системой / Материалы VIII всерос. школы-конф. молодых ученых "Управление большими системами". Магнитогорск. 2011. С. 14-16.
17. Расина И.В., Батурина О.В. Дискретно-непрерывные линейные и билинейные системы / Материалы конференции "Управление в технических, эргатических, организационных и сетевых системах". 2012. С. 215-218.
18. Батурина О.В. Дискретно-непрерывные билинейные системы. / Управление большими системами: материалы X Всероссийской школы-конференции молодых ученых. Том 1. Уфимск. гос. авиац. тех. ун-т. - Уфа: УГАТУ, 2013. С. 23-25.
19. Baturina О., Gurman V., Hasina I. Discrete-Continuous Models and Optimization of Heterogeneous Systems. Proceedings of the International Conference "Numerical Computations: Theory and Algorithms". 2013. P. 46.
20. Baturina O., Gurman V., Rasina I. Optimization of Excitation Transfer in a Spin Chain. 5th IFAC International Workshop on Periodic Control Systems.
2013. Periodic Control Systems, V. 5, Part 1. P. 177-180.
В совместных публикациях автору принадлежат следующие результаты. В [2] проведена часть вычислительных экспериментов и получены соотношения метода для рассматриваемой задачи. В [3] выполнен сравнительный анализ глобального и градиентного методов для исследуемой задачи. В [4] построен и реализован метод глобального улучшения для линейных дискретно-непрерывных систем. В [5] реализован метод глобального улучшения для билинейных систем. В [6] и [7] получены достаточные условия оптимальности для исследуемой задачи. В [8] и [9] проведены вычислительные эксперименты с привлечением градиентного метода. В [15] для исследуемой задачи получены достаточные условия оптимальности, сформулирован и реализован алгоритм улучшения. В [17] получены достаточные условия оптимальности для дискретно-непрерывных билинейных систем. В [19] и [20] предложено представление магистрального решения в форме ДНС и реализован алгоритм улучшения для полученных линейных ДНС.
Подписано в печать: 15.11.13
Объем: 1,0 п.л. Тираж: 100 экз. Заказ № 143 Отпечатано в типографии «Реглет» г. Москва, Ленинский проспект, д. 2 (495) 978-66-63, www.reglet.ru
Текст работы Батурина, Ольга Владимировна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук
На правах рукописи
04201453733
Батурина Ольга Владимировна
МЕТОДЫ И АЛГОРИТМЫ ОПТИМИЗАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ, ОПИСЫВАЕМЫХ ЛИНЕЙНЫМИ УРАВНЕНИЯМИ С УПРАВЛЯЕМЫМИ КОЭФФИЦИЕНТАМИ
Специальность 05.13.01 - Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)
Диссертация на соискание ученой степени кандидата физико-математических наук
Научный руководитель: Кротов В.Ф.,
д-р тех. наук, профессор Научный консультант:
Расина И.В.,
канд. физ.-мат. наук, доцент
Москва - 2013
Оглавление
Введение 4
1. Основы теории 12
1.1. Достаточные условия оптимальности и улучшения управления В.Ф. Кротова для непрерывных систем..............12
1.2. Глобальный метод улучшения....................15
1.3. Вырожденные задачи.
Разрывные (импульсные) и магистральные решения.......16
1.4. Достаточные условия оптимальности и улучшения для дискретно-непрерывных систем...................18
2. Оптимизация систем, описываемых обыкновенными дифференциальными уравнениями 21
2.1. Постановка задачи..........................21
2.2. Билинейная система и гамильтонова система...........23
2.3. Необходимые условия оптимальности
(в форме принципа максимума Понтрягина) ...........25
2.4. Особенности реализации глобального метода
улучшения управления .......................28
2.5. Вычислительные эксперименты...................32
2.6. Квантовая система..........................39
2.7. Основные результаты главы.....................45
3. Оптимизация дискретно-непрерывных систем 46
3.1. Линейные по состоянию дискретно-непрерывные системы. Постановка задачи............................46
3.2. Достаточные условия оптимальности и улучшения........47
3.3. Итерационный алгоритм.......................49
3.4. Пример. Экономический рост с учетом инноваций.........50
3.5. Приложение к нелинейным системам ...............54
3.6. Пример ................................55
3.7. Основные результаты главы.....................58
4. Исследование глобального метода улучшения применительно к магистральным решениям билинейной задачи оптимального управления 59
4.1. Билинейная задача оптимального управления. Постановка задачи 59
4.2. Переход к производной задаче...................60
4.3. Итерационный алгоритм.......................61
4.4. Дискретно-непрерывное представление
магистрального решения ......................63
4.5. Пример ................................64
4.6. Оптимизация передачи возбуждения в спиновой цепочке с использованием магистральных решений ..............70
4.7. Основные результаты главы.....................77
Заключение 79
Список литературы 81
Введение
К настоящему времени теория оптимального управления, возникшая на рубеже 50-х, 60-х годов прошлого века, стала полноценной математической дисциплиной, а ее основные результаты - принцип максимума Понтрягина и метод динамического программирования Беллмана - классическими. Однако прямое использование указанного аппарата сопряжено со значительными трудностями, и построение аналитических решений задач оптимального управления возможно лишь в отдельных случаях. Поэтому важное значение имеют приближенные и численные методы итерационного типа для исследования и решения оптимизационных задач. Исторически в этой области определились и активно развиваются различные подходы и направления исследований в зависимости от их теоретических основ, каковыми являются общие методы вариационного исчисления и оптимального управления.
Еще в начале 1950-х гг. A.A. Фельдбаум сформулировал задачу оптимального управления динамической системой [194, 195]. Основополагающими результатами математической теории оптимального управления, как уже указывалось, являются принцип максимума Л.С. Понтрягина [162, 163], метод динамического программирования Р. Беллмана [31], а также достаточные условия оптимальности В.Ф. Кротова [121, 124].
Большой вклад в становление теории оптимального управления внесли A.A. Милютин [148, 149], A.A. Красовский [117], H.H. Красовский [119, 118], А.Б. Куржанский [134, 135]. Основы теории активных систем разработаны в работе [44].
Большую группу численных методов составляют методы градиентного типа [204, 205, 124, 193] и их разнообразные модификации [215, 224, 139, 71, 158, 47, 98, 192, 193, 4].
Другое направление, основанное на принципе расширения и достаточных условиях оптимальности, получило развитие в работах В.Ф. Кротова и В.И. Гурмана [124] и в серии работ их последователей. В них предложен
ряд новых нетрадиционных схем, которые используют линейное и линейно-квадратичное задание функции Кротова и соответственно делятся на методы первого и второго порядков [78, 84, 17, 18, 81, 188].
В работах [83, 12, 69] исследуются методы улучшения, основанные на локальной аппроксимации множества достижимости. Для систем с линейным неограниченным управлением существует преобразование исходной задачи к производной, первое упоминание о которой было в работе [72]. Алгоритмы улучшения для систем с неограниченным управлением приведены в работах [84, 101, 102]. Прямое использование достаточных условий оптимальности в форме Беллмана [124] невозможно из-за известного эффекта проклятия размерности. В работе [89] предлагается интересная схема частичного решения указанной проблемы путем задания функции Кротова в форме многомерных полиномов и глобальной аппроксимацией в заданной области соотношений типа Беллмана на некоторой сетке узлов.
Эпоха освоения космоса привела к необходимости расчета траекторий перелета с одной планеты Солнечной системы на другую и разработки алгоритмов передвижения шагающих аппаратов по поверхностям других планет. Особенность указанных задач состоит в том, что на заданном отрезке времени управляемый процесс разбивается на отдельные этапы, каждый из которых имеет свое описание в терминах дифференциальных (либо дискретных) уравнений. Все эти этапы связаны общим функционалом. Такие процессы получили название дискретно-непрерывных, в частном случае - многоэтапных. В настоящее время их часто называют гибридными.
В работе В.И. Гурмана [73] впервые была приведена математическая модель дискретно-непрерывного процесса и сформулированы достаточные условия оптимальности. Модель такого процесса содержит два уровня. Нижний уровень представляет собой непосредственное описание управляемого процесса. На этом уровне действует непрерывная модель. Верхний уровень в ряде случаев создается искусственно в виде дискретного процесса, связывающего моменты изменения описания исходной системы управления. На этой основе разработана серия приближенных численных методов, которыми возможно практическое исследование столь сложных процессов [67, 79, 81, 168].
Как уже отмечалось, многие реальные объекты управления, в том числе и непрерывные, по своей природе таковы, что в различных ситуациях проявляют различные свойства и плохо представимы или вообще не пред-
ставимы целиком в терминах классических дифференциальных систем. К ним относятся объекты, описываемые дифференциальными уравнениями с разрывными правыми частями, дифференциальными уравнениями различных порядков на различных временных отрезках, либо содержащие, кроме дифференциальных уравнений, объекты другой природы. Спектр подобных объектов достаточно широк: системы переменной структуры [107], дискретно-непрерывные системы [73], непрерывно-дискретные [55], многоэтапные процессы [67], логико-динамические системы [226, 54, 33, 34, 35], импульсные процессы [200, 103, 208, 146] и, наконец, возникший в последние годы термин "гетерогенные системы". В [45] рассматриваются непрерывно-дискретные системы как обобщающий (самый общий и самый сложный) класс сложных систем и называются такие системы агрегативными. Подобные объекты объединяются в настоящее время общим термином - гибридные системы. Как указывается в [220], этот термин возник в 1993 году. Сам термин "гибридные системы" не является устоявшимся, на это обращается внимание в [143], и разные исследователи вкладывают в него разный смысл. Так в [227] под терминами "импульсные и гибридные" понимаются разные динамические системы, а в [144] уточняется, какие именно гибридные системы рассматриваются. Хотя следует заметить, что авторами работы [211] была предпринята попытка классификации указанных систем.
Существуют также процессы подобного вида, описываемые дискретными уравнениями [168]. В этом случае модели верхнего и нижнего уровней дискретные.
В работе К.Н. Габелко [67] приведен первый алгоритм градиентного типа для решения многоэтапной задачи и решена задача космического перелета Земля-Марс. С помощью аналогичного метода также была решена задача оптимизации химического процесса [3]. Позднее в работах В.И. Гурмана и А.Г. Орлова [76, 79] были приведены более общая модель и достаточные условия оптимальности и решена задача управления шагающим аппаратом. Затем в работе [169] впервые построен для сложных процессов метод улучшения второго порядка.
В статье [170] приведены достаточные условия оптимальности как в форме Кротова, так и в форме Веллмана. Сочетание этих условий и специальное преобразование части приращения функционала позволило построить алгоритм второго порядка, содержащий меньшее число сопряженных переменных
на каждом этапе по сравнению с более ранними вариантами метода для частного случая дискретно-непрерывного процесса. В [170, 171] рассматривались достаточные условия оптимальности для сложных процессов с параметрами и процессов с запаздыванием по состоянию. Для последних получен алгоритм градиентного типа.
Другие подходы к оптимизации гибридных процессов, как процессов в логико-динамических системах, развиваются в [53] и в [35]. В статье [56] рассматриваются гибридные системы, описываемые нелинейными обыкновенными дифференциальными уравнениями с переключениями правых частей и скачками по состоянию.
В конце 1980-х, в 1990-ые годы и в первые годы 21-го века, с одной стороны, шла шлифовка разработанных методов, а с другой - продолжался процесс создания новых алгоритмов по ранее описанным направлениям. В монографии [51] наряду с методами решения экстремальных задач подробно освещаются итерационные процессы, основанные на принципе максимума. Большое внимание уделено градиентным методам и задаче с дополнительными функциональными ограничениями. Широкий спектр методов и их приложения для решения практических задач представлены в [17]. Там же, помимо изложения методов улучшения и исследования вопросов их настройки, рассматриваются вопросы сходимости.
Своеобразным итогом и обобщением многолетних исследований достаточных условий оптимальности и методов улучшения, построенных на базе достаточных условий оптимальности, служит монография В.Ф. Крото-ва [219]. В ней, в частности, описан общий метод глобального улучшения управления и его конкретная реализация с линейной разрешающей функцией, оказавшаяся особенно эффективной в приложении к управлению квантовыми системами [216].
В монографии В.А. Срочко [179] для классов линейных и квадратичных задач проводится их анализ на основе нелокальных представлений для приращения функционала. Строятся итерационные процедуры улучшения на основе этого анализа. Для повышения качества методов вводится итеративная регуляризация целевого функционала. Кроме того, рассматриваются методы линеаризации и аппроксимации для сведения задачи к рассматриваемым классам. Эти методы развиваются в работах A.C. Булдаева [41, 43, 42].
К нелокальным следует также отнести процедуры улучшения в вырож-
денных задачах оптимального управления, которые характеризуются наличием пассивных дифференциальных связей. Их исключение не меняет искомого решения задачи, но приводит к задаче меньшего порядка (производной задаче). При этом известные локальные улучшения в производной задаче автоматически ведут к нелокальным в исходной [75, 93].
Другие подходы к решению задач улучшения, использующие схемы динамического программирования, представлены в [151, 197, 152].
Развитие вычислительной техники, появление суперкомпьютеров создало предпосылки для активного использования в задачах улучшения и приближенно-оптимального синтеза схем многомерной аппроксимации уравнения Беллмана, непосредственное использование которого связано с катастрофическим ростом объемов вычислений и памяти с увеличением размерности решаемой задачи. В.Ф. Кротовым впервые предложена схема приближенного синтеза с оценкой на основе достаточных условий оптимальности [120]. Она может реализоваться с помощью различных аппроксимирующих конструкций.
Одна из них - композиция одномерных полиномов - предложенная и реализованная в свое время в [38, 39, 74], позволяет проводить интерполяцию на прямоугольной сетке. Другие варианты интерполяции функции Кротова--Беллмана рассмотрены в [84]. Наиболее широкие возможности для применения разнообразных конструкций предоставляет аппроксимация по методу наименьших квадратов. Сами аппроксимирующие конструкции при этом тоже могут улучшаться. Разные аспекты такого подхода рассматривались в [88, 191]. Последний вариант подобной схемы, как уже указывалось, дан в работе [89].
Теми же методами возможно приближенное аналитическое представление моделей объектов управления, необходимое для применения методов теории управления, как точных, так и приближенных, в то время как в реальности эти модели зачастую представлены сложными зависимостями, в том числе эмпирическими, табличными, и компьютерными программами. Наглядным примером может служить модель вертолета при оптимизации режимов нештатной посадки [32, 90].
Отметим, что в связи с этим повысился интерес к дискретизации непрерывных систем - переходу от непрерывной модели к дискретной на ранних стадиях исследования задачи, а не в конце, при численном интегрировании
конечных дифференциальных соотношений оптимального процесса. Такое преобразование модели управляемой системы позволяет обойти обременительные теоретико-функциональные требования в применяемых схемах аппроксимации и оценках приближенных решений. Кроме того, в терминах постановки дискретной задачи оптимального управления и соответствующих достаточных условий возможна интерпретация самых разнообразных задач. Эти вопросы затрагивались в работах [73, 82]. Дискретные модели естественно используются для применения развитых методов нелинейного программирования к решению задач оптимального управления [105, 66, 70].
Как известно, выбор начального приближения, достаточно близкого к оптимуму, играет важную роль при проведении расчетов любым итерационным методом. Общих методик и рекомендаций на этот счет не существует. Однако для вырожденных задач, широко распространенных на практике, предлагается в качестве начальных приближений находить магистральные решения таких задач специальными методами [86, 87].
Изложенное говорит о том, что развитие, использование, апробация и применение итерационных процедур для решения задач оптимального управления остаются по-прежнему актуальными.
Цель исследования. Данная работа посвящена развитию и применению в итерационных процедурах метода Кротова глобального улучшения управления для систем, линейных по состоянию.
Основные задачи исследования. 1. Экспериментальное исследование глобального метода применительно к гамильтоновым системам, линейным по состоянию, и выработка рекомендаций по его совершенствованию и расширению областей применения. 2. Распространение метода на дискретно-непрерывные задачи оптимального управления. 3. Модификация метода применительно к вырожденным задачам с неограниченным линейным управлением. 4. Разработка вычислительных процедур для решения модельных и прикладных задач.
Методы исследования. В работе используются достаточные условия оптимальности Кротова для непрерывных систем, модели и условия оптимальности дискретно-непрерывных систем, принципы расширения и локализации, теория вырожденных задач Гурмана.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения и списка литературы. Общее количество страниц
-100, рисунков - 26, таблиц - 16, наименований в списке литературы - 227.
В первой главе рассматривается общая постановка задачи оптимального управления, методы ее решения. Приводятся понятия вырожденной задачи и магистрального решения. Рассматривается дискретно-непрерывная система и достаточные условия оптимальности для нее.
Во второй главе исследуются характерные свойства линейных дифференциальных систем с управляемыми коэффициентами, их динамические инварианты и ограничения области достижимости, существенные для проблем управления, свойства понтрягинских экстремалей данного класса задач, численные методы оптимизации управления. Рассматривается применение метода Кротова для таких задач, решаются экспериментальные примеры.
В третьей главе предлагается итерационный метод �
-
Похожие работы
- Методы идентификации динамических характеристик систем с распределенными параметрами
- Моделирование стабилизирующих управлений для уравнений Хилла и Матье
- Математическое моделирование динамических систем с запаздыванием на основе интегрального квадратичного критерия
- Об исследовании некоторых задач моделирования и оптимизации с помощью позиционно-управляемых систем
- Синтез многопрограммных систем управления на основе метода позиционной оптимизации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность