автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Итерационные методы оптимизации управления на основе принципа расширения и достаточных условий оптимальности

доктора физико-математических наук
Трушкова, Екатерина Александровна
город
Москва
год
2013
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Итерационные методы оптимизации управления на основе принципа расширения и достаточных условий оптимальности»

Автореферат диссертации по теме "Итерационные методы оптимизации управления на основе принципа расширения и достаточных условий оптимальности"

На правах рукописи

ТРУШКОВА ЕКАТЕРИНА АЛЕКСАНДРОВНА

ИТЕРАЦИОННЫЕ МЕТОДЫ ОПТИМИЗАЦИИ

УПРАВЛЕНИЯ НА ОСНОВЕ ПРИНЦИПА РАСШИРЕНИЯ И ДОСТАТОЧНЫХ УСЛОВИЙ ОПТИМАЛЬНОСТИ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

2 / ФЬВ 2014

Москва, 2014

005545398

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институт проблем управления имени В.А. Трапезникова РАН, лаборатория № 45

Научный консультант: Гурман Владимир Иосифович

доктор технических наук, профессор Официальные оппоненты:

Хрусталев Михаил Михайлович доктор физико-математических наук, профессор, Московский авиационный институт, профессор кафедры «Математическая кибернетика»

Лотов Александр Владимирович

доктор физико-математических наук, профессор, ФГБУН Вычислительный центр им. A.A. Дородницына РАН, заведующий сектором «Математические методы оценки экономических решений»

Салмин Вадим Викторович

доктор технических наук, профессор, Самарский государственный аэрокосмический университет имени академика С.П. Королёва, заведующий кафедрой «Летательные аппараты» Ведущая организация: ФГБУН Институт системного анализа РАН, лаборатория «Информационные технологии оценки эффективности инвестиций» Защита состоится 17 апреля 2014 г. в 1400 часов на заседании Диссертационного Совета Д002.226.02 в ФГБУН «Институт проблем управления им. В.А. Трапезникова РАН» по адресу: 117997, Москва, ул. Профсоюзная, д. 65.

С диссертацией можно ознакомиться в библиотеке ИПУ РАН. Автореферат разослан _2014 г.

Ученый секретарь диссертацион- __

ного совета Д 002.226.02, канди- A.A. Галяев

дат физико-математических наук тж--

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Приближенные и вычислительные методы — обширная и ставшая самостоятельной область исследований и разработок в теории оптимального управления, нацеленных па эффективное решение практических задач. Основные исследования и разработки приближенных методов группируются главным, образом вокруг численной реализации известных теоретических результатов: принципа максимума Понтрягина, .метода динамического программирования Беллмана, принципа оптимальности Кро-това и общей теории экстремума Милютина-Дубовицкого. их обобщений и аналогов для различных постановок, учитывающих разнообразные практические ситуации. Основы этой теории широко освещены в литературе (Р. Беллман; А. М. Лотов; Л. С. Поитрягпп. В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко; В. Ф. Кротов: А. Я. Дубовицкий, А. А. Милютин; Н. Н. Красовекий, А. И. Субботин; А. Б. Куржанский; Р. Габасов, Ф. М. Кириллова и др.).

Несмотря на то, что теоретические результаты учитывали особенности современных задач управления, главным образом, наличие разнообразных ограничений в дополнение к основным дифференциальным - связям в вариационном исчислении, их прямое практическое использование оказалось весьма ограниченным сложностями реализации теоретических соотношений, описывающих искомое решение получаемых уравнений. Как правило, аналитическое решение можно было найти лишь в редких случаях, если не считать специально подобранных примеров. Это послужило причиной для разработки приближенных методов, позволяющих решать сложные практические задачи. За прошедший с момента их появления полувековой период было предложено множество разнообразных приближенных, численных методов, позволяющих искать оптимальное решение напрямую, минуя условия оптимальности, посредством операций улучшения управления, повторяемых в итерационной процедуре. При этом косвенно использовались как сами основополагающие результаты, так и принципы, лежащие в их основе.

Исторически развитие методов улучшения началось с методов первого порядка, известных как градиентные методы, одновременно с созданием современной теории оптимального управления. В числе основоположников отмстим Р. Куранта, JI. В. Канторовича, Д. Е. Охоцимского и Т. М. Энеева, Л. И. Шатровского, Дж. Кел-ли. Более сложные схемы требуются при наличии ограничений на переменные управления и состояния. Здесь можно отметить, например, работы Р. П. Федоренко и В. Г. Гюрджиева. Наряду с этим реализовались и другие методы, родственные градиентным, основанные на принципе максимума Понтрягина (И. А. Крылов, Ф. Л. Чсрпоусько; О. В. Васильев, А. И. Тятюшкин, А. В. Аргу-чшщов). Ряд интересных схем предложен H. Н. Моисеевым. Для поиска управления в форме синтеза весьма эффективным оказался метод моментов (H. Н. Красовский; Р. Габасов, Ф. М. Кириллова).

Методы первого порядка демонстрируют, как правило, высокую эффективность па первых итерациях и ее резкое снижение 1! окрес тности оптимума. Это заставило обратиться к более сложным схемам построения алгоритмов и разработке методов второго порядка (Д. X. Джекобсон; В. Ф. Кротов, И. Н. Фельдман; Р. Ан-риоп). Одно из направлений в этой области базируется на достаточных условиях оптимальности В. Ф. Кротова1,2 и его последователей: В. И. Гурмана3, M. М. Хрусталева, А. И. Москаленко. В работах А. И. Москаленко были предложены теоремы о совместной оп тимальности, которые имеют отношение, с одной стороны, к теории достаточных условий В. Ф. Кротова, а с другой — к методу вектор-функций Ляпунова, разрабатывашемуся В. М. Матросовым и его учениками (Л. Ю. Апапольский, С. Н. Васильев).

Ряд конкретных методов как для непрерывных, так и для дискретных систем приведен в работах В. И. Гурмана, В. А. Батурина,

'Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления. — М.: Наука, 1973.

-Krotov V. F. Global methods in optimal control theory. — N.Y.: Marcel Dekker, 1996.

'Гурман В. И. Принцип расширения п задачах управления. — М.: Физмат-лпт. 1985, 1997.

И. В. Расиной, Е. В. Данилиной, В. Ф. Кротова, И. Н. Фельдмана. Их спецификой является априорно приближенный подход, возможность оценивания получаемых приближенных решений и использование характерного свойства вырожденности прикладных задач и соответствующих специальных методов для поиска начальных приближений, что, как известно, является критическим моментом при использовании итерационных улучшающих алгоритмов. Родственные методы улучшения, называемые нелокальными, описаны в книге В. А. Срочко. Эти методы развиваются в работах А. С. Бул-даева.

Широкий спектр методов и их приложения для решении практических задач представлены в работах В. А. Батурина, В. И. Гурмана, В. В. Токарева, В. А. Дыхты, А. В. Лотова, В. В. Салмппа.

В настоящее время появляется все больше европейских работ, предлагающих применять теорию оптимального управления (а именно, метод глобального улучшения управления Кротова) к задачам управления различными квантовыми системами (S. Е. Sklarz, D. J. Tannor, С. P. Koch, J. P. Palao, R. Kosloff. I. I. Maximov, J. Salomon, G. Turinici, N. C. Nielsen. M. Murphy. S. Montangero, V. Giovanetti, T. Calarco). Было отмечено, что метод Кротова не испытывает особых трудностей на больших размерностях и позволяет решать задачи управления квантовыми системами с высокой точностью.

Современные сложные многомерные прикладные задачи (па-пример, задачи управления квантовыми системами, социо-эколого-экономических системами, и т. п.) диктуют основные требования к методам решения задач управления: упрощающие преобразования модели объекта, эффективные методы поиска приближенно-оптимальных управлений с учетом больших размерностей и распараллеливание вычислений.

В диссертационной работе разработаны новые итерационные методы оптимизации управления на основе достаточных условий оптимальности, ориентированные на параллельные вычисления. Для предварительного анализа и поиска эффективных начальных при-

ближепий исходной задачи рассматриваются различные расширяющие. аппроксимирующие и сужающие преобразования модели объекта, направленные на упрощение исходной задачи.

Как показывают вычислительные эксперименты, выполненные па суперкомпьютерах семейства «СКИФ», разработанные методы обладают высокой эффективностью и временной производительностью.

Цель и задачи исследования. Целью диссертационной работы является разработка эффективных методов поиска приближенных решений задач оптимального управления, ориентированных на параллельные вычисления, на основе известных ранее и новых преобразований модели объекта управления, достаточных условий оп тимальности и глобальных оценок.

Дня достижения указанной цели в работе поставлены и решены следующие задачи:

1. Разрабо тать теоретические основы и конструктивные методы упрощающих преобразований модели объекта, которые позволяют заменить исходную задачу семейством более простых задач (в смысле дальнейшего поиска приближенного решения) и тем самым составляют основу методики исследования.

2. Реализовать конструктивно минимаксный принцип Кротова улучшения управления как основу эффективных итерационных методов оптимизации управления.

3. Разработать на основе указанных подходов серию методов и алгоритмов приближенного поиска оптимального управления, ориентированных па параллельные вычисления с соответствующим программным обеспечением.

4. Применить разработанные методы для решения прикладных задач управления из различных областей, в том числе с применением суперЭВМ.

Методы исследования. Исследования, выполненные в работе. базируются на достаточных условиях оптимальности и глобальных оценках, принципах расширения и локализации. При алгоритмической и программной реализации использовались различные

численные методы аппроксимации функций многих переменных, решения дифференциальных уравнений, нелинейного программирования. При написании компьютерных программ использовался язык программирования С++, при написании параллельных версий программ использовалась Т-система с откры той архитек турой (ОрепТБ).

Научная новизна результатов. Все основные результаты диссертации являются новыми. Среди них ниболее важные:

- конструктивные методы упрощающих преобразований множества управлений динамической системы как модели объекта посредством расширения, аппроксимации и сужения;

- общая схема приближенного решения задач оптимального управления с использованием указанных и известных ранее преобразований в пространстве состояний, включающая глобальный поиск начального приближения, итерационные процедуры его улучшения и оценки;

-новые методы глобального улучшения управления в составе итерационных процедур на основе минимаксного принципа Кро-това, ориентированные на параллельные вычисления.

Теоретическая и практическая ценность результа тов, полученных в диссертации, заключается в разработке:

- методики приближенного решения задач управления па базе преобразований модели объекта, позволяющей создать гибкое математическое и программное обеспечение, легко адаптируемое к решению конкретных практических задач;

- итерационных процедур, использующих методы глобального улучшения управления, являющихся составной частью общей схемы поиска приближенного решения;

- алгоритмического и программного обеспечения для решения задач управления, позволяющего реализовать предлагаемый подход к поиску приближенных решений в среде параллельных вычислений и тем самым повысить его эффективность при решении различных прикладных задач.

Результаты диссертационной работы используются в Исслсдо-

na гол i,ском центре системного анализа Института программных систем имени А.К. Айламазяна РАН и в лаборатории математических методов исследования оптимальных управляемых систем Института проблем управления имени В,А. Трапезникова РАН, а также нашли применение при выполнении ряда крупных программ н проек тов РФФИ и-РГНФ.

Положения, выносимые на защиту:

1. Исследование и конструктивное представление класса преобразований динамической системы как модели объекта управления па основе расширения множества управлений. Общая схема приближенного исследования задач оптимального управления с использованием э того класса, известных преобразований в пространстве состояний, достаточных условий оптимальности Кротова и глобальных оценок.

2. Реализация минимаксного принципа глобального улучшения управления посредством задачи Коши для линейного уравнения в частных производных относительно разрешающей функции Кро-тоин п его дискретного аналога для построения эффективных итерационных процедур.

3. Серия новых методов и алгоритмов приближенного решения задач оп тимального управления, как для систем общего вида, так и для важных частных случаев на основе предложенных общих подходов с применением принципа локализации.

4. Решения разработанными методами ряда прикладных задач, демонстрирующие эффективность предложенного инструментария.

Связь исследований с научными программами. Исследования проводились в рамках:

- научных грантов № 06-01-00330-а (Реализация обобщенных решении задач управления), 08-01-00274-а (Приближенные методы оп тимизации управления на основе аппроксимаций модели объекта), 09-01-170-а (Вырожденные задачи оптимального управления). 11-01-90717-моб-ст (Научная работа Трушковой Е. А. из И ПС им. А.К. Айламазяна РАН в ИПУ им. В.А. Трапезникова

8

РАН. «Глобальные алгоритмы улучшения для динамических систем с управлением»), 12-01-00256-а (Исследования импульсных и гибридных управляемых систем на основе дискретно-непрерывных моделей) Российского фонда фундаментальных исследований;

- научно-технической программы Союзного государства «Развитие и внедрение в государствах-участниках Союзного государства наукоемких компьютерных технологий на базе мультипроцессорных вычислительных систем» (шифр «ТРИАДА») по проекту ПР6: «Исследование проблемы эффективной синхронизации параллельных процессов при имитационном дискретном моделировании больших технических и социально-экономических систем, разработка основ создания параллельных интеллектуальных имитационных комплексов для работы в составе ситуационных центров поддержки принятия решений» , подпроект: «Разработка программного комплекса улучшения и оптимизации законов управления для приложений в различных областях»;

- в научно-технической программе Союзного государства «Разработка и использование программно-аппаратных средств Грид-технологий перспективных высокопроизводительных (суперком-пыотерных) вычислительных систем семейства СКИФ» (шифр «СКИФ-ГРИД») по проекту «Многовариантные расчеты стратегии устойчивого развития Байкальского региона с применением ПК КССЖ на суперЭВМ СКИФ»;

- в научной программе № 14 ОЭММПУ РАН «Анализ и оптимизация функционирования систем многоуровневого, интеллектуального и сетевого управления в условиях неопределенности» по проекту 1.6: «Методы оптимизации управления динамическими системами, описываемыми линейными уравнениями с управляемыми коэффициентами. Синтез управления в нелинейных системах. Приложения к моделям оптимального управления квантовыми системами».

Степень достоверности и апробация работы. Достоверность полученных результатов подтверждена доказательствами соответствующих теорем и содержательными примерами вычисле-

iiiih для различных прикладных задач.

Результаты диссертации неоднократно докладывались и обсуждались па научных семинарах ИПС им. А.К. Айламазяна РАН и ИПУ РАН. па семинаре «Квантовые компьютеры и квантовые вычисления» Физико-технологического института РАН, а также на различных научных симпозиумах и конференциях: XV Международной конференции по механике и современным прикладным программным системам (ВМСППС'2007), 25-31 мая 2007 г., Алушта: IV Международном симпозиуме «Обобщенные решения в задачах управления» (GSCP-08), Бурятия, г. Улан-Удэ, 23-28 июня 2008 г.: Третьей всероссийской научно-практической конференции «Имитационное моделирование. Теория и практика», 17-19.10.2007, Санкт-Петербург; IV международной конференции «Параллельные вычисления и задачи управления» (РАСО-2008), Москва, октябрь 2008 г.: Международной конференции «Программные системы: теория и приложения». ИПС РАН, Переславль-Залесский, 2009: XVI Международной конференции по вычислительной механике и современным прикладным программным системам (ВМ-(41110- 2009), 25-31 мая 2009 г., Алушта: Первой традиционной всероссийской молодежной летней школе «Управление, информация н оптимизация», Персславль, 2009; Молодежном симпозиуме с международным участием: «Теория управления: новые методы и приложения». ИПС РАН, Переславль-Залесский, 22-26 сентябри 2009 г.: Международной научной конференции «Параллельные вычислительные технологии'2010», Уфа, 2010 г.; Третьей Международной научной конференции «Суперкомпыотерные системы и их применение» (SSA'2010), 25-27 мая 2010 года, Минск; Третьей международной конференции «Математическое моделирование социальной и экономической динамики» (MMSED-2010), 23-25 июня 2010 г.. Москва: III международной конференции «Инфокоммуни-кацпонные и вычислительные технологии» (ИКВТС-2010), Улан-Удэ. 2010: V International Symposium «Generalized statements and solutions of control problems - 2010», Ulaanbaatar, Mongolia, 2010; Школе-семинаре «Приближенные методы оптимального управле-

ния в параллельных вычислениях», Переславль-Залесский, декабрь 2010; 16-ой Саратовской зимней школе «Современные проблемы теории функций и их приложения», Саратов, 27 февраля - 3 января 2012; VI Международном научном семинаре "Обобщенные постановки и решения задач управления "(GSSCP-2012). Геленджик, сентябрь 2012; Sino-Rnssian International Workshop on Optimal Control and Computing, Shanghai, China, November. 2012.

Публикации. Результаты диссертационной работы отражены в 38 публикациях: 19 статей, в том числе 15 статей в изданиях из списка ВАК; 15 материалов международных и российских конференций; 1 свидетельство государственной регистрации программ для ЭВМ; 2 учебных пособия.

Структура и объем работы. Диссертационная работа состоит из введения, б глав основного материала, заключения, библиографического списка и содержит 229 страниц основного текс та, 46 рисунков, 12 таблиц. Библиографический список включает 143 наименования литературы.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении дан обзор результатов, относящихся к теме работы, обоснована актуальность темы исследований, сформулированы цели работы и решаемые в ней задачи, дана общая характеристика полученных результатов, определена их научная новизна.

В первой главе содержатся основные теоретические сведения, составляющие общую методическую базу исследований в диссертации.

Представлена математическая постановка задачи оптимального управления в общем виде для непрерывных систем

±(t) = f(t,x(t)Mt)), te[tr,tF], ()

x(t,I) = xI, u(t) е v{t,x(t)), i(t)ex(i), :r(if) e r, {)

где x(t) — непрерывные и кусочно-гладкие функции, a u(t) кусочно-непрерывны функции, и дискретных систем

x(t + l) = f(t,x(t),u(t)), te + l,...,iF}, ,

x{tI) = xu u(t) € и (t,x(t)), x(t) e x(t), x(tF) e r.

li

Ставится задача: на множестве О пар т. = (х(1),и(1.)), удовлетворяющих перечисленным условиям, найти минимизирующую последовательность для заданного функционала:

Краткое обозначение поставленной задачи — (D, I).

В общих терминах рассмотрены основные положения принципа расширения, который состоит в том, чтобы заменить исходную задачу оптимизации со сложными ограничениями (D,/), другой, более простои задачей (Е, L), где исключены те или иные связи, по такой ч тобы ее решение удовлетворяло отброшенным связям и совпадало с решением исходной задачи.

На основе принципа расширения для задач оптимального управления непрерывными системами вводится в рассмотрение функция ^(t.x) непрерывная при всех t. х и обладающая непрерывными частными производными сpt, (рх = (ipxi,..., ipxn)T при всех t, х, за исключением конечного числа множеств t = const пространства {1.x). Рассматриваются конструкции

/?(/. х, н) = ipj.f(t, х, и) + ipu fi(t) = sup R(t, x, и),

и £ V(t,x), х G X(t)

а множество Е получается непосредственно из множества О исключением дифференциальной связи х = /(¿, х, и). При этом Ь = I па множестве О.

В этих терминах формулируются достаточные условия оптимальности для рассматриваемой непрерывной задачи в виде следующей теоремы.

I = F{x(tF))-+ inf.

G(x) = F(x) + <p(tF,x)-ip(tI,x1)

I = inf G(x)

xemx(tF)

h

Теорема 1.1. (В. Ф. Кротов) Пусть имеются последовательность {xs,us} — {ills} С D и последовательность функций tpq(t,x), такие, что

1) Rg (t, xs (t) , ua (t)) - fiq (t) -> 0, при п.в. t e [t{, tF};

2) Gq {xs (tF)) - lq -> 0;

3) функции nq(t) кусочно-непрерывны, а числа lq конечны;

4) последовательность Rq (t,xs (t) , uA. (t)) ограничена.

Тогда последовательность {ms} — минимизирующая. При этом справедлива оценка

tp

1(тя) - U < Д7, = Lq(ms) -lq + J fiq(i)dt.

ti

Эта теорема сводит задачу оптимизации с дифференциальными связями к задаче без таких связей или, более детально, к задачам математического программирования (минимизации G (х) и максимизации R(t,x:u) при различных заданных значениях /).

Аналогичным образом для задач оптимального управления дискретными системами вводятся в рассмотрение следующие конструкции:

R(t, х, и) = cp(t + 1, f(t, х, u))—ip (t, x), ju(t) = sup R(t. x. u),

и 6 U(i, a;).

X e X(0

G(x) = F(x) + <p(tF,x) - <p(ti,x/), 1= inf G(x),

жег nx(tF)

tF-i

L = G(x(tF))-^2R(t,x(t),u(t)). ■ t=ti

При этом L = I на множестве D. В этих терминах формулируются достаточные условия оптимальности для рассматриваемой дискретной задачи в виде следующей теоремы.

Теорема 1.3. Пусть имеются последовательность {т.ч} € D и последовательность tpq, такие что

1) П„ (t. xs{t). //.,(/.)) - fiq(t) о, t e {i/, - - -, tF - 1};

2) С,(.тя(/у,))-/,->0.

Тогда, последовательность {ms} — минимизируют,ая. При :>том справедлива оценка.

tF-1

7(тя) - Л < Aag = L,(me) - lq + J] /^(i)-

t=tt

Далее соотношения 1), 2) этих теорем будут называться соотношениями достаточных условий оптимальности, а соответствующая функция ip(t.,x) —- разрешающей функцией.

В этой же главе дана конкретизация этих условий в форме соотношений динамического программирования Беллмана и основные сведения из теории вырожденных задач оптимального управления.

Э ти известные теоретические факты приведены в краткой обзорной форме, без доказательств, с указанием ссылок на первоисточники. и согласованы в обозначениях, что позволяет сохранить целостный характер изложения дальнейшего материала.

Вторая глава «Преобразования модели объекта» посвящена сис тематизации и исследованию различных преобразований модели объекта по принципу расширения или сужения области поиска решения, направленных на упрощение исходной задачи с точки зрения ее решения приближенными методами. Подобный подход расширяет возможности предварительного анализа задачи с применением эффективных специальных методов. Рассмотрены возможные конструктивные схемы реализации подобных преобразований.

Предложены преобразования типа аппроксимации правой части динамической системы в рабочей области выбранной аналитической конструкцией, что наиболее актуально в случае, когда исходная задача пе имеет полного или достаточно простого аналитического описания. Также представлены сужающие преобразования, ограничивающие поиск решений в классах кусочных управлений с параметрами, что позволяет свести исходную задачу к дискретно-

непрерывной задаче оптимального управления, которая в непрерывной части не содержит управляющих функций.

На основе представленных преобразований предложена методика приближенного решения задач управления на основе общей схемы. которая состоит из следующих основных этапов.

Этап 1. Упрощающие преобразования модели объекта па основе принципа расширения (введение новых множеств Е' э О, г — 1, га), или преобразования типа аппроксимации (введение новых множеств Ег, г — п = 1,1, таких, что свойства элементен множеств Е' и Б похожи), или сужающие преобразования (введение новых множеств Е® = из), (¡) С Б, г - п - I — ТГа), позво-

ляющие заменить исходную задачу (0,1) семейством задач (Е' ,/) для которых возможно эффективно проводить последующие этапы исследования;

Этап 2. Поиск решений тк> — (хк', и*') € Е1, г — 1, п +1 + н, кг -- 1,1г (точных или приближенных) семейства задач (Ег,/) и тем самым поиск оценки снизу функционала / в виде

ш£ /(га) > шах_1(тк')\

или оценки сверху функционала / в виде

ш£ /(га) < 1Ш11 1(тк');

Этап 3. Построение приближенных решений тк* = (хк', ик') € Б исходной задачи с использованием решений тк', полученных на предыдущем этане исследования, подсчет оценок приближенных решений Д(га^);

Этап 4. Выбор лучшего из полученных на предыдущем этапе исследования приближенных решений га = (х, и) е Б.

Результатом первого этапа предлагаемой схемы исследования является семейство задач (Е2,/), г — поиск решений которых гораздо проще поиска решения исходной задачи (О,/). Так, указанное семейство может содержать:

- линейные задачи оптимального управления с ограниченным управлением, линейно-квадратические задачи, решение которых, кик известно, не представляет особых трудностей и может быть получено в точном виде;

- задачи оп тимального управления, правая часть дифференциальных уравнений которых линейна по управлению, что часто позволяет найти качественное приближенное решение задачи после перехода к производной задаче на основе принципа расширения, т. е. повторяя этап 1;

- задачи оптимального управления, правая часть дифференциальных уравнений которых линейна по состоянию, для которых приближенное решение может быть найдено весьма эффективно с помощью методов глобального улучшения управления;

- дискретно-непрерывные задачи оптимального управления, которые не содержат управлений на непрерывном уровне;

--другие виды задач оптимального управления, для которых известны методы поиска точного или качественного приближенного решения.

Семейство задач (Е',7), г — 1,п. может быть получено с помощью расширений двух типов:

1) расширения с помощью замены правой части динамической системы при условии выполнения включения О С Ег;

2) расширения с помощью замены переменных у = г)(Ь,х) и перехода к производной системе (метод кратных максимумов).

Расширения второго типа хорошо известны4, поэтому в настоящей работе основное внимание уделено расширениям первого типа, рапсе не изучавшимся систематически. Конструктивно расширение первого типа можно выполнить в компактной области В изменения фазового и управляющего векторов, например, следующим образом. Задается аппроксимация ,и) в желаемом классе правых частей исходной системы: f(t,x,и). Для этого может быть использовано приближение функции по методу наименьших

'Гурман П. И. Принцип расширения в задачах управления. — М.: Физмат-.-ШТ. Н)8Г>. 1997.

квадратов в области В с помощью композиционных полиномов. Рассматривается система

х = Т(Ь,х,и) +0(«,ги,г), (3)

или дискретный вариант

хЦ + 1) = 7(1,,х(1),и(1))+в(^юа),г(1.)) , (4)

где в(1,ш,г) = /(¿, гу,г) — /(£, ги, г), го, г — новые управления, го е Х(2), Х(£) — сечение В, и.:г € и (£, -ш). Системы (3), (4) па-зоваются оценочными для соответствующих систем (1), (2). Справедлива следующая теорема.

Теорема 2.1. Множество скоростей .т) - / (/. х, .-/:)) + в (¿, Х(г'), Т_7(£, ж)) оценочной системы (3), (4) является расширением множества скоростей = / (£, ж, и(£, х1)) соответствующей исходной системы (1), (2), и, следовательно, О С Е), где. Е) — множество допустимых оценочной системы.

Если речь идет о задаче оптимального управления; го решение ее на любом расширении дает нижнюю границу минимизируемого функционала, а при специальном выборе расширяющего преобразования может дать нижнюю грань и соответственно точное1 решение исходной задачи.

Семейство задач (Е\ 1),г = п + 1, га, может быть получено, па-пример, с помощью аппроксимации правой части динамической системы в рабочей области выбранной аналитической конструкцией, что наиболее актуально в случае, когда исходная задача не имеет полного или достаточно простого аналитического описания.

Из различных типов упрощающих преобразований модели объекта, более простые, например линейные, могут быть использованы и для моделей, представленных полностью в аналитических терминах, с целью их упрощения и проведения эффективного качес твенного анализа.

Это же семейство включает задачи, полученные посредством применения расширений типа Кротова, т. е. таких, при которых дифференциальные связи полностью исключаются, а функционал

17

с помощью функции х) заменяется обобщенным лагранжианом. В этом случае можно проводить аппроксимацию исходной системы упрощенной моделью без априорного расширения (формально полагая ?/;, г) — 0) с целыо получения достаточно хорошей приближенной функции Кротова х), разрешающей упрощенную задачу. Такая функция, примененная к исходной системе, дает возможность генерировать приближенно оптимальное управление и(1, х) с оценкой, которая позволяет судить о качестве полученного управления и, как следствие, о качестве выбранной аппроксимации динамической системы.

С помощью сужающих преобразований, ограничивающих поиск решений в классах кусочных управлений исходная задача сводится к дискретно-непрерывной задаче оптимального управления, которая па непрерывном уровне не содержит управляющих функций. что позволяет применять к решению задачи известные методы для дискретных систем. Подобный подход позволяет существенно упростить и сократить время расчетов, что особенно актуально для систем большой размерности.

Второй этап исследования предполагает поиск точного решения семейства задач, полученных на этапе 1, если точное решение можно найти, и поиск приближенного решения в противном случае. Поиск приближенных решений на втором этапе исследования или их уточнение может быть проведено с помощью различных итерационных методов глобального или локального улучшения управления.

Полученные на первом этапе с помощью принципа расширения задачи (Е\ I). % — 1 ,п, обладают несомненным преимуществом перед задачами, полученными с помощью аппроксимации, т. к. позволяют дополнительно с помощью своих решений, найденных на втором этапе, найти нижнюю оценку функционала исходной задачи. Аналогичным образом, решения суженных задач позволяют найти верхнюю оценку функционала исходной задачи.

В силу того, что большинство полученных приближенных решений пе являются допустимыми решениями исходной задачи, ос-

новная цель третьего этапа исследования заключается в аппроксимации приближенных решений, полученных на втором этапе, допустимыми решениями исходной задачи и, при необходимости, в уточнении решений с помощью итерационных методов улучшения. Отметим, что одни и те же итерационные методы глобального или локального улучшения могут быть использованы и на в тором, и па третьем этапах исследования.

Четвертый этап исследования является весьма эвристическим и сильно зависит от практической реализуемости окончательного решения. Так, выбор решения т е D может осуществляться из условия т = arg _min_1(тк''). или условия

= 1 Л,

т = arg _min_A(mfci), или из особенностей рассматриваемой

г—

практической прикладной задачи. Предлагаемый подход обладает большим преимуществом, т. к. позволяет получать множество решений прикладной задачи, что позволяет в случае необходимости выбирать лучшее приемлемое решение с учетом возможных неучтенных в модели ограничений, неопределенностей в описании модели и критерия качества управления и т. п.

В целом предложенная схема является априорно приближенным подходом к исследованию задач управления, в отличие от численных методов реализации теоретических результатов. Она хорошо согласуется с естественными допущениями при постановке прикладных задач, их особенностями и зарекомендовавшими себя разнообразными методами и приемами их математического исследования, что существенно расширяет возможности приближенного исследования задач оптимизации управления, ориентирована па реализацию в среде параллельных вычислений и многометодные процедуры.

В третьей главе «Глобальное улучшение управления на основе минимаксного принципа» предлагаются конструктивные методы, реализующие общий подход к эффективному улучшению управления (получивший название минимаксного принципа), посредством линейного уравнения в частных производных для

случая непрерывных систем и соответствующих линейных рекуррентных соотношений для случая дискретных систем.

В общих терминах минимаксный принцип состоит в задании функционала L(z(i),ti(t)) так, чтобы он достигал максимума по x(t) па заданной допустимой паре га1 = (х1 (t), и1 (t)), тогда его минимизация по u(t) и наложение связи множества D, приведет к некоторой паре тпи такой, что 1(т11) < 1(т1).

Здесь предлагается искать разрешающую функцию ip(t, х) из условия, чтобы функционал L(x(t), ul(t)) не зависел от x(t) (это специальный случай максимума по х(t) ) Тогда соотношения метода запишутся в случае непрерывной системы как задача Коши для линейного уравнения в частных производных

= -(px(t.,x)Tf(t,xy(t)), t Е [t!,tF], <p(tF,x) = -F(x), (5)

а. для дискретных систем — в виде линейных рекуррентных соотношений

у('••'•) = <p(t+l,f(t,x,u\t))) , t € {i7,...,iF-l}, ip(tF,x) = -F(x). (6)

Одна итерация построенного метода глобального улучшения в случае дискретных систем состоит из следующих шагов:

0) Имеется начальный допустимый процесс (х1 (t.), и1 (t)).

1) Ищется ip(t,x) из соотношений (6).

2) Строится функция:

v{t, х) = arg max ф + 1, f(t, х, и)) - ip(t, х)). (7)

M€U(i.x'(i))

3) Решается система

x(t + 1 ) = f (t, x(t), V,(t, x(t))) , x(tj) = Xj,

и находится улучшенный допустимый процесс (.т11^), un(i)).

Метод глобального улучшения гарантирует при естественных предположениях улучшение управления по функционалу, т. е. выполнение неравенства I (xl(t),ul(t)) — I (zn(i), uu(t)) > 0 без настроечных параметров. Доказаны соответствующие теоремы как

20

для случая дискретных, так и для случая непрерывных систем, которые влекут следующее утверждение.

Утверждение 3.3.Если функционал I ограничен снизу на множестве D и операции метода глобального улучшения выполнимы на каждой итерации, то этот метод генерирует .монотонный итерационный процесс, сходящийся по функционалу I.

Рассмотрены частные случаи, когда указанные общие соотношения сводятся к обыкновенным дифференциальным уравнениям и их дискретным аналогам относительно коэффициентов разрешающей функции, заданной в форме степенных полипомов. Так для линейной относительно переменных состояния задачи, т. е. при

f(t, х, и) = A(t, и)х + B(t, и), F(x) - //1 .г.

получается ip(t,x) = v(t) + tf}T(t)x, где v{t), ф{1.) ...... решение задачи Коши для системы п + 1 обыкновенных дифференциальных уравнений

ф{1) = ~Al\t,ti\t))^{t), ф{гР) = -//, ù(t) = -BT{ty(t))№, v(tF) = o.

Для общих линейпо-квадратических относительно переменных состояния задач — дискретной

x(t + 1) = A(t, u)x(t) + B(t, -u),

tF-i

1 = Y, u)x{t) + r]Tx(tF) + xr(t,)p:r(tF).

i=t/

и непрерывной

x = A(t,u)x{t) + B(t,u),

t-F

I = J xT(t)a{t, u)x(t)dt + rjvx(tF) + xT{tF)px{tF). ti

указанным соотношениям удовлетворяют линейно квадратические р.

В общем случае возможно задание разрешающих функций в форме многомерных полиномов с глобальной аппроксимацией в заданной области соотношений на некоторой сетке узлов в окрестности текущего приближения. Размеры окрестности могут регулироваться по принципу локализации во взаимосвязи с порядком а! I проксимиругощих полиномов.

Это даст возможность строить разнообразные итерационные процедуры, различных порядков, в том числе — многометодные, с учетом специфики конкретных задач с ориентацией на парал-. тел ы 11)1(1 вычисления.

Для непрерывных систем непосредственный выигрыш от параллельной реализации получается при известном представлении решения задачи Коши (5) посредством уравнений характеристик, поскольку каждая характеристика может рассчитываться независимо.

Аналогичное представление возможно и для дискретного случая.

Предложена модификация метода глобального улучшения для систем с линейным неограниченным управлением. Она предусматривает преобразование исходной системы к производной, известное из теории вырожденных задач.

В этой же главе на основе соотношений метода глобального улучшения исследована задача приближенного синтеза управления. Нетрудно видеть, что равенства (5) метода глобального улучшения управления, являются аналогами соотношений Беллмана для поиска приближенного синтеза управления методом последовательных приближений5. Разница заключается лишь в том, что вместо начального управления в форме синтеза м1^, х) в соотношениях (5) используется начальное управление в виде функции времени программное управление '»'(/). Таким образом, соотношения Беллмана для определения следующего приближения к синтезу управления существенно упрощаются и позволяют на некоторых классах задач отойти от приближенного задания искомой разре-

"Зубов В. И. лекции по теории управления. — М.: Наука, 1975.

тающей функции ip(t.:.х) в виде интерполяционного полинома для функции нескольких переменных, как было независимо предложено в работах различных авторов. Однако найденное управление u(t, х) гарантирует улучшение начального программного управления лишь на одной итерации, т. к. выбор подходящего программного управления для следующей итерации оказывается в общем случае неочевидным.

Рассматривается случай непрерывной задачи .

x{t) = A(t,u{t))x(t?>, te[tj,t.F},

x(i7) = Xl, X er, и G и с Вр, (8)

F {x(t,F)) = riTx(tF) + xT(tF)px(tF) min,

где матрица р неположительно определена. Формулируется для нее теорема об улучшении начального программного управления на одной итерации с помощью построенного управления в форме синтеза из соотношений метода глобального улучшения.

Теорема 3.3. Пусть и1 (f.) — некоторое допустимое управление задачи (8), г — любое число из интервала [tr,tF), хТ — произвольный п-мерный вектор, Ф(/.) — фундаментальная .матрица, ранений системы х = A(t,ul(t))x такая, что Ф(т) есть единичная матрица, а Ф(t) — фундаментальная матрица региенмй системы, х = -Ат(* ,u}{t))x такая, что xl'(tr) есть единичная матрица. Справедливо неравенство

F {xn(tF)) < F {x\tF)) . где .тт(/.) — решение задачи Коши

х(t) = A (t, u\t)) x(t), t е [г, tF], х(т) = хт. xu(t) — решение задачи Когии

x(t.) = A (t, u(t, x(t))) x(t), t e [r, *,.], x{t) = xT.

u(t, x) = arg max (- (2хт (Ф^))7" <S>T(t.F)pT + r/T) v,).r) .

Вышеизложенная теорема позволяет организовать вычислительный процесс поиска приближенного синтеза управления в заданной области изменения начальных условий х1 £ Х1 С М". Предполагается, что поставленная задача поиска приближенного синтеза в заданной области решена, если известно приближенно оптимальное по функционалу управление в некоторой достаточно частой сетке узловых точек множества Хх. Очевидно, поставленная задача может быть решена, как задача улучшения для каждого узла заданной сетки, что потребовало бы вычислений разрешающей функции для каждого узла на каждой итерации. С помощью теоремы 4.4 эти вычисления можно существенно сократить.

Для этого задается начальное управление и1^), для которого проводится одна итерация алгоритма глобального улучшения с целыо получения управления в форме синтеза и(Ь, х). Пусть это управление обозначается через х). В силу теоремы 4.4, управление и1^.,х) улучшает начальное управление и1(Ь) для любого XI € Х1, и, следовательно, на первой итерации процесса нахождение разрешающей функции удалось провести одновременно для всех узловых точек. Далее, разбив сетку узловых точек на достаточно крупные подмножества, можно выбрать в каждом подмножестве начальную точку х, и построить для второй итерации программное управление ии(£), решая систему с начальным условием = Х[ замкнутую управлением у}(1, х). Теперь вторая итерация проводится отдельно в каждом подмножестве узловых точек для своего программного управления ип(£). Это позволяет на второй итерации метода найти разрешающую функцию одновременно для всех узловых точек текущего подмножества. Для следующей итерации каждое текущее подмножество опять разбивается на части, после чего шаги соответствующего алгоритма повторяются аналогичным образом. Отметим, что в каждом подмножестве текущая итерация проходит независимо и при программной реализации может проводиться параллельно, сокращая время вычислений.

В четвертой главе «Методы и алгоритмы приближенной

оптимизации управления» подробно описаны методы и соответствующие алгоритмы улучшения управления на основе аппроксимации соотношений метода глобального улучшения в окрестности траектории текущего приближения и принципа локализации.

В работе представлены два типа методов улучшения первого-второго порядка, получающихся при различных способах реализации приближенных соотношений общего метода глобального улучшения. В методах первого типа используется грубое приближение производных их разностными аналогами, в методах второго типа используется аппроксимация с помощью метода наименьших квадратов.

В диссертационной работе оба этих метода доведены до вычислительных схем, а также исследована возможность параллельной реализации соответствующих алгоритмов на суперЭВМ. Представленные методы обладают естественным параллелизмом.

Предложен новый метод улучшения траектории в окрестности текущего решения, основанный на линеаризации правой части динамической системы и сведении задачи к известной линейно квадратической. Рассматривается его приложение к коррекции простой аппроксимации скользящего режима как обобщенного решения задачи управления, а также к задаче аппроксимации приближенного решения решениями исходной задачи.

Предложена модификация методов локального улучшения па случай задач с фазовыми ограничениями с помощью метода штрафов и автоматической регулировкой параметров штрафных слагаемых на каждой итерации.

В пятой главе «Задачи оптимального управления в квантовых системах» рассматривается ряд задач управления квантовыми системами, к которым применяются различные варианты и модификации общего метода глобального улучшения. На основе краткого обзора прикладных исследований в области проблем передачи квантового состояния обосновывается актуальность соответствующего класса задач и важная роль задач оптимального управления.

Представлена модификация глобального .метода улучшения применительно к задаче оптимального управления для конечномерного уравнения Шрёдингера вида

z{t) = -IH{u(t))z{t), te[t!,tF],

z(ti) = 2/, z € С", u(-) € U(m,uiow,uup), ^

J(z, u) = F (z(tF)) - Ё H*f) - zj*f min,

j=i

где z(t) — комплекснозначная кусочно-дифференцируемая функция, I — комплексная единица, U{m,ulow,uup) — множество р-мерных функций, принимающих постоянное значение на полуинтервалах [ti + jh, h + (j + 1 )h), j = ü, m — 1, h = и подчиняющихся ограничениям щои, < u(t) < иир, Н(и) — действительная симметрическая функциональная матрица (гамильтониан) непрерывная но и, z* Е С" — заданная точка. Нетрудно видеть, что данная задача является задачей наилучшего попадания в заданную точку. п

Система имеет динамический инвариант S = X) I=

з=1

¿|zJ'(i)|2, следовательно, исходный квадратичный функцио-

пал качества перепишется в линейном виде F(z(tF)) =

jr\zi(tF) - z>*\2 = S + £М*(2 - 2n(z*,z(tF)), где функция

j=i J=1

fi,(z*,z) = Rez*TRez + Imz*TIrnz линейна по своим аргументам.

Функция fi(z*,z), по сути, является действительной частью ска/ * \ *Т —

лярного произведения соответствующих векторов (2 ,z) = z z.

п

Всюду в дальнейшем предполагается, что J2 \zj*\2 = поэтому

з=1

целевой функционал окончательно примет вид

F(z{tF)) = 2S-2n(z\z(tF)).

Задача (9) может быть эквивалентным образом выписана в терминах действительных переменных. Для этого достаточно выделить отдельно действи тельную и мнимую части рассматриваемых

26

величин. Соответствующая действительная постановка при этом будет иметь вид задачи управления гамильтоновой системой вида

( Rez{t) \ / О Я («(/.)) \ ( Rez(t) \ \Imz(t)J \~H(u(t)) 0 ){lmz(t)J-

Однако при рассмотрении в терминах комплексных переменных запись как самой задачи, так и дальнейших соотношений метода ее решения более компактна.

С помощью сужающего преобразования вводится в рассмотрение дискретная задача оптимального управления

y(t + Л) = / (t,-y(t), u(t)), t G {*/, tj + h,...,tF- h}, y(ti) = ye С", m(.) <s U(m, ulow, uup), (10)

F (y(tp)) min,

гДе f(t,y{t),u(t)) — решение задачи Коши

х{т) - -IH (u(t)) х(т), re[M + h], x(t) = y(i),

взятое в точке г = t + h.

Показано, что задачи улучшения управления для (9) и (10) эквивалентны. Для решения задачи улучшения управления используется метод глобального улучшения для линейной но состоянию динамической системы с линейным функционалом качества, описанный выше. При этом разрешающая функция ip(t.,y) ищется из соотношений

ф, у) = <p(t + h,f (/, У, u'(t))), t е {tj, U + h.....tF -/;.}, .,, ■

<p(tFly) = 2S-F(y). (J1)

При программной реализации поиска разрешающей функции па задачах большой размерности возникают трудности. Следующая теорема позволяет осуществить второй шаг более эффективно, т. к. сводит его к решению одной задачи Коши.

Теорема 5.1. Функция <p(t, у) = // (ф(Ь),у), где ib(t) — решение задачи Коши

m = —IH («'(*)) t € [tj, tF], iitF) = 2z*.

27

разрешает соотношения (11).

Далее с помощью разработанной модификации метода глобального улучшения решен ряд тестовых задач, и актуальная задача высокоточной передачи одиночного возбуждения вдоль открытой непочки с конечным числом спинов 1/2, регулируемой с помощью изменяющегося во времени внешнего магнитного поля. Следуя6, математическая постановка соответствующей задачи оптимального управления дается в предположении, что все параметры системы отмасштабированы и принимают безразмерные величины, причем постоянная Планка и величина спин-спинового взаимодействия равны единице. Гамильтониан Н(и) = Я0 + Н^и) является суммой трёхдиагональной постоянной матрицы

/ -1 1

Я0 =

\

1 О

О

о

о

-2 1 1 -2

О О

О О

О О

0

-2

1

О О О

\

-1 /

отвечающей за спин-спиновое взаимодействие, и диагональной матрицы

отвечающей за воздействие внешнего магнитного поля, где

Р(и(1)) = и1 (г) и - 1 - и2{1) - о, ы)2,3 =

В рассматриваемой системе присутствуют взаимодействия между ближайшими спинами в цепочке и взаимодействия каждого спина с внешним магнитным полем. На рис. 1 представлен процесс передачи возбуждения по спиновой цепочке при отсутствии воздействия внешнего магнитного поля (при и1 (г) = 0). При этом, хотя возбуждение и достигает последнего спина в цепочке, но минимальное значение целевого функционала на рассматриваемом про-

''Murphy M., Montangero S., Giovaimetti V., Calarco T. Communication at tlie quantum speed limit along a spin chain // Phys. Rev. Lett. 2010. URL:http: /arxiv.org abs/1004.3445vl.

межутке времени не меньше, чем F0 (z(t)) = 0,8706, т. е. точность передачи квантового состояния мала (па превышает 12,94%), что вызвано дисперсионным эффектом. Улучшить точность передачи можно с помощью внешнего поля: если спины находятся далеко от минимума поля, то оно доминирует над спин-спиновым взаимодействием, в противном случае доминирует связь ближайших соседних спшюв. Этот управляемый процесс, позволяет проводить высокоточную передачу возбуждения по спиновой цепочке.

Были проведены расчеты для случая спиновой цепочки, состоящей из п — 51 спина, при tF = 100, т = 10000, U/0„, = (—2, — 2)7, иир = (2,2)г. На рис. 2 представлен процесс передачи возбуждения по спиновой цепочке при управлении, найденном па 20-ой итерации алгоритма. При этом достигнуто значение функционала F0 (z(100)) = 0,0026 (точность передачи квантового состояния составила 99,7%).

Параллельная программная реализация алгоритма в рамках Т-системы с открытой архитектурой OpenTS позволила сократить время расчета одной итерации алгоритма с 1147 минут (19 часов 7 минут) на одном ядре до 76 минут («¿1 часа 16 минут) на 51 ядре суперкомпьютера «Blade», расположенном в Институте программных систем имени А.К. Айламазяна. РАН.

Была также решена задача вращения плоской молекулы7.

Разработанная модификации метода глобального улучшения управления позволяет проводить расчеты по улучшению управления для задач большой размерности, характерных для квантовых приложений. Проведенные тестовые вычислительные эксперименты для задачи управления передачей квантового состояния в спиновой цепочке, с помощью программной реализации разработанного метода, позволяют сделать вывод об эффективности метода для рассматриваемого класса задач управления квантовыми системами.

7Boussaid N.. Caponigro М., Chambrion Т. Periodic control laws for bilinear quantum system with discrete spectrum. 2011. URL: http://arXiv.org/pdf/1111.4550vl.

0.2 О 1(5 и. 12 — О 08 0.04

¡1» |2

(= 20

О ->т*

Т' ¡ТТлП ' I.' I' I

5 И 13 1? 1? 18 ?1 23 25 2» 31 33 35 37 39 41 43 45 47 49 = 1

а.:

и. 14 —| 0.12 0 08

О 04 —

о -4

|2](1)|2

I =г 40

I чччфп Тг\'ГГ111ТФтФТТФТТФг

1 3 5 ? 9 11 !3 15 17 19 21 23 25 27 25 31 33 35 ЗТ 35 41 45 45 47 48 51

О 10 —| ') 12 0 08 I.) 04 О

I = 60

> 5 7 е 11 13 15 17 1« 21 23 25 П 29 31 И 35 37 3 9 4 1 4 3 4 5 4 7 45 61

0.2. —1

0 16 — 0 12 — 1 = 80

0 08 — 0 04 — гГк[ гПп -ЛП^ТТтЖ

0.2 — и 16 О 12 — 0.08 — 0 04

(-100

1? 15 1? 19 21 23 25 27 П 31 33 И 37 Л9 41 43 48 47 49 51

' I 1 I П I П I П П I ! П I

& и

] - порядковый номер спина

Рис. 1: Передача возбуждения при отсутствии внешнего поля.

1 — 0.8 0.6 — 0 4

0.2 0 ■

( = 20

. ФТТФТП"11 Ч Ч Ч 1 111 Ч 11 11 11 Ф 11 !11 Ч Ч 11 1 г

13 5 Г 3 11 ¡3 15 17 № 21 23 25 27 29 31 35 35 5! 36 41 43- 45 47 49 51 ! = 40

1

0.8

0.6 0.4 0,2 0

1

08 ■ 0 6 -04 02

0 -

1 -

08 -Об -0.4 -0 2 -

О -

, , . ■ 111' 11111' I ч11' I ч 1111' г

'.9 21 23 25 27 29 31 33 35 17 X 41 43 45 47 49 51

I = 60

. ч ч 1 I 1 I 1 I ч ч ч ч 1 I 1 I Ч ч Ч Ч Ч 1 I Ч Ч Ч Ч 1! Ч Ч 1

1 3 8 ' 7 9 11 13 15 17 16 21 "а. 25 V 29 31 39 35 37 36 «1 -1? 45 47' 45 51

( = 80

ГТН Ч Ч ....... Ч Ч Ч Ч Ч Ч,|1('т?ТУ7?7ГтУТч ''ГГ-

13 5 7 8 11 13 15 17 19 21 23 25 27 29 31 33 35 37 -Эй ' 41 43 45 47 49 51

1 08 06 04

0.2

1 = 100

,11 1 I Ч 1 П ' I ч 1 I 1 11 11 П Т !1 I 1 I ' Г 11 I 11 1 I ' п 1

1 3 5 7 в 11 13 15 17 1В 21 25 25 27 29 31 33 35 37 Ж 41 43 45 47 49

] - порядковый номер спина

Рис. 2: Передача возбуждения при управляемом внешнем поле.

В шестой главе «Другие приложения» приведено решение прикладных задан управления различной природы, демонстрирующее эффективность разработанных методов улучшения управления и представленной методики приближенного исследования задач управления па основе преобразования модели объекта. Глава состоит из трех разделов.

В первом разделе проведено исследование маневров безопасной нештатной посадки вертолета с определением нижней границы опасной зоны. Расчеты проводились для модели динамики вертолета, которая используется в задачах оценки взлетно-посадочных характеристик. По заданным значениям горизонтальной, вертикальной скоростей и угловой скорости вращения несущего винта она позволяет найти максимально возможную высоту для начала маневра безопасной посадки и соответствующее управление этим маневром. Модель не имеет полного аналитического описания что затруднило качественный анализ и заставило с самого начала применять приближенные методы. Так, на первом этапе исследования построено семейство полиномиальных аппроксимаций правой части динамической системы, что соответствует моделям движения различной сложности, начиная с линейной. На втором этане с помощью метода кратных максимумов и оценок множеств достижимости был проведен качественный анализ, в результате которого сформировалось начальное приближение для дальнейшего итерационного улучшения на третьем этапе. Улучшение управления проводилось на суперкомпьютере семейства «СКИФ» с помощью компьютерной программы, реализующей в параллельном режиме метод локального улучшения управления. Это позволило провести серию расчетов и получить нижнюю границу опасной зоны в координатах высота - скорость для характерного сценария нештатной си туации. Эти результаты позволили сделать вывод о повышении границы опасной зоны на 15% по сравнению применявшимися на практике упрощенными расчетами при сохранении качественного характера динамики.

Во втором разделе рассматривается одна из последних версий

социо-эколого-экономической модели, разработанных в ходе многолетних исследований с середины 1970-х годов в Сибирском о тделении Академии наук в связи с решением проблемы сохранения природного комплекса озера Байкал и прилегающего региона.

Эта версия наиболее перспективна для различных приложений, но и наиболее сложна, по сравнению с предшествующими. Она не могла быть реализована в полном объеме на обычных компьютерах, даже самых современных. Для практических вычислений требовались различные упрощающие допущения и высокая степень агрегирования. Появление доступных суперкомпьютеров открывает здесь новые возможности.

Описан комплекс программ ОБЕЕтосЫ 1.0, реализующий на кластерном вычислительном устройстве параллельные методы сценарных расчетов, "оптимизации и улучшения приближенно-оптимального управления для модели с целью проведения многовариантных расчетов, связанных с разработкой стратегии устойчивого развития региона.

Для получения эффективного начального приближения принимаются идеализирующие допущения проводятся преобразования, известные из теории вырожденных задач, сводящие исходную задачу практически к серии конечномерных задач, приводящих к характерному магистральному решению. В целом это - новый подход к проблеме ситуационного управления регионом с использованием суперЭВМ.

В третьем разделе рассматривается задача автоматического управления аппаратными ресурсами, с учетом ценности выделенных компьютерному приложению ресурсов (например, количества виртуальных машин (ВМ), обеспечивающих работу приложения, оперативной памяти ВМ, доли физического процессора, предоставляемой ВМ, при текущей пользовательской нагрузке. Построена соответствующая математическая модель для системы, состоящей из п приложений, использующих один первичный ресурс и т различных категорий вторичных (зависимых от первичного) ресурсов. Задача состоит в поддержании значения уровня сервиса не

ниже некоторого целевого уровня в заданные моменты времени. Метод решения задачи рассмотрен на примере системы двух приложений: картографический сервис «МарБегуег» и вычислительный сервис «Х-Сот» Написана программа, моделирующая работу системы двух указанных приложений при задаваемой пользовательской нагрузке с применением описанного метода выбора ресурсов. При различных пользовательских нагрузках алгоритм дает устойчиво хорошее динамическое перераспределение ресурсов с учетом поддержания характеристик на целевом уровне.

В Приложении описываются особенности программной реализации алгоритмов для работы с задачами оптимального управления динамическими системами, в том числе — параллельной реализации алгоритмов разработанных в диссертации.

Все параллельные алгоритмы, представленные в диссертации. реализованы в рамках Т-системы с открытой архитектурой (ОрепТБ) на языке программирования Т++. Т-система - система параллельного программирования, реализующая концепцию автоматического динамического распараллеливания программ. Это -оригинальная российская разработка, выполненная под руководством С.М. Абрамова в Институте программных систем имени А. К. Айламазяна РАН.

В заключении сформулированы основные выводы и перечислены основные результаты диссертационной работы.

Исследован и представлен конструктивно класс преобразований динамической системы как модели объекта управления на основе расширения .множества управлений. Предложена общая схема приближенного исследования задач оптимального управления с использованием этого класса, известных преобразований в пространстве состояний, достаточных условий оптимальности Кротова и глобальных оценок. Она включает поиск глобальных приближенно-оптимальных решений и их последующее итерационное улучшение с оценками точности.

Для построения эффективных итерационных процедур предложена реализация минимаксного принципа глобального улучшения

управления применительно к системе общего вида посредством задачи Коши для линейного уравнения в частных производных относительно разрешающей функции Кротова и его дискретного аналога. Указаны возможности эффективного приближенного решения задачи Коши в общем случае посредством параллельных алгоритмов и важные частные случаи, когда она разрешается в терминах линейной или линейно-квадратической конструкции.

На основе предложенных общих подходов с применением принципа локализации разработана серия новых методов и алгоритмов приближенного решения задач оптимального управления, как для систем общего вида, так и для важных частных случаев. Среди них метод для задач с частично закрепленным правым концом, метод с автоматическим подбором штрафных параметров для задач с фазовыми ограйичениями, метод улучшения в случае импульсных управлений. Соответствующие алгоритмы доведены до вычислительных схем, и исследована возможность их параллельной реализации.

Разработанные методы и алгоритмы применены для решения ряда прикладных задач. С одной стороны, эти задачи имеют самостоятельное практическое значение, а с другой — представляют ценный экспериментальный материал, демонстрирующий эффективность всего предложенного инструментария.

Среди них важное место занимают актуальные задачи управления в квантовых системах. В частности, эффективность метода глобального улучшения с применением сужающего преобразования и сокращение времени расчетов при переходе к параллельной версии продемонстрированы на задаче передачи квантового состояния в длинных спиновых цепочках.

В задаче построения нижней границы опасной зоны при нештатной посадке вертолета нашли применение практически все основные элементы описанной общей схемы приближенного исследования: аналитическая аппроксимация многомерными полиномами, поиск глобального начального приближения на упрощенной модели с фазовыми ограничениями, его итерационное улучшение, оцеп-

ка множества достижимости.

Для работы с социо-эколого-экономической моделью региона разработан программно-алгоритмический комплекс В8ЕЕнкх1е1 1.0, реализующий на кластерной суперЭВМ многовариантные расчеты с приближенной оптимизацией многочисленных управляющих воздействий, где специальные преобразования модели при поиске начального приближения играют решающую роль, поскольку классические методы неприменимы из-за-вырожденности соответствующих задач.

В целом реализованные в работе принципы, методы и алгоритмы представляют собой априорно приближенный подход к исследованию задач управления, использующий достижения теории оптимального управления, отвечающий самой природе сложных прикладных задач и имеющий перспективы дальнейшего развития.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в периодических изданиях из списка ВАК:

1. Гурман В. И., Трушкова Е. А., Ухин М. Ю., Улучшение управления, реализующего скользящий режим // Автоматика и телемеханика. 2008. № 3. С. 161-171.

2. Квоков В. Н., Трушкова Е. А., Ухин М. Ю., Метод улучшения управления на имитационной модели объекта и его приложение к задаче оптимизации маневров нештатной посадки вертолета // Сборник научных трудов «Вестник Самарского государственного аэрокосмического университета имени академика С. П. Королева». 2009. Д* 1. С. 161-169.

3. Блинов А. О., Гурман В. И., Трушкова Е. А., Фраленко В. П., Программный комплекс оптимизации законов управления // Программные продукты и системы, 2009. № 2(86). С. 95-100.

1. Гурман В. П., Трушкова Е. А., Блинов А. О., Приближенная глобальная оптимизация управления па основе преобразова-

36

ний модели объекта // Автоматика и телемеханика. 2009. Л'2 5. С. 13-23.

5. Гурман В. И., Трушкова Е. А., Оценки множеств достижимости управляемых систем // Дифференциальные уравнения.

2009. Т. 45. № 11. С. 1601-1609.

6. Гурман В. И., Трушкова Е. А., Блинов А. О., Приближенная оптимизация управления в параллельных вычислениях // Вестник Бурятского государственного университета.

2010. Математика и информатика. Вып. 9. С. 18-28.

7. Трушкова Е. А., Синтез оптимальных траекторий, подчиненных граничным условиям, для линейных управляемых систем // Автоматйка и телемеханика. 2011. № 3. С. 3-14.

8. Гурман В. И., Матвеев Г. А., Трушкова Е. А. Социо-эколого-экономическая модель региона в параллельных вычислениях // Управление большими системами. Выпуск 32. М.: ИПУ РАН, 2011. С. 109-130.

9. Трушкова Е. А., Алгоритмы глобального поиска, оптимального управления // Автоматика и телемеханика. 2011. Л^ 6. С. 151-159.

10. Трушкова Е. А., Матвеев Г. А., Модель динамического распределения ресурсов // Вестник Бурятского государственного университета, 2011. Математика и информатика. Вып. 9. С. 274-279.

11- Трушкова Е. А. Оценка приближенно оптимальных решений на основе преобразований модели объекта // Вестник Бурятского государственного университета, 2011. Математика и информатика. Вып. 9. С. 47-51.

12. Гурман В. И., Трушкова Е. А., Расина И. В., Усенко О. В. Иерархическая модель неоднородной дискретной системы и

со приложения /7 Управление большими системами. Выпуск 41. М.: ИПУ РАН, 2013. С. 249-269.

13. Трушкова Е. А. Об одном классе задач оптимального управления для квантовых систем // Автоматика и телемеханика. 2013. № 1. С. 35-46.

14. Трушкова Е. А. Метод глобального улучшения для гамильто-повых систем с управляемыми коэффициентами // Изв. Са-рат. ун-та. Нов. сер. 2013. Т. 13. Сер. Математика. Механика. Информатика, вып. 1, ч. 2. С. 95-99.

15. Кротов В. Ф., Моржин О. В., Трушкова Е. А. Разрывные решения задач оптимального управления. Итерационный метод оптимизации // Автоматика и телемеханика. 2013. № 12. С. 31 55.

Свидетельство о госрегистрации программ:

16. Гурман В. И., Трушкова Е. А., Матвеев Г. А., Свидетельство о государственной регистрации программы для ЭВМ ВБЕЕшосЫ 1.0 № 20106160006, 14 сентября 2010 г.

Учебные пособия:

17. Трушкова Е. А., Численные методы анализа. — Переславль-Залесский: «Университет города Переславля», 2009.

18. Гурман В. И., Трушкова Е. А., Практические методы оптимизации. — Переславль-Залесский: «Университет города Переславля». 2009.

Другие публикации:

19. Гурман В. И., Трушкова Е. А. Метод улучшения управления для дискретных систем // Вестник Тамбовского Университета. Сер. Естественные и технические науки. Под редакцией В. М. Юрьева. Тамбов, 2007. - Т. 12. Выи. 4, С. 439-441.

20. Трушкова Е. А. Синтез оптимальных траекторий, подчиненных граничным условиям, в линейно-квадратической задаче // Вестник Бурятского государственного университета. Вып. 9. Математика и информатика. Улан-Удэ. Изд-во Бурятского госуниверситета. 2008. С. 60 -66.

21. Гурман В. И., Трушкова Е. А. Приближенные методы оптимизации управляемых процессов // Эл. науч. журнал Института программных систем имени А. К. Айламазяпа РАН «Программные системы: теория и приложения», 2010. Л"'! 4 (т. 1).

22. Трушкова Е. А., Улучшение управления в одном классе систем с линейным неограниченным управлением // Эл. науч. журнал Института программных систем имени А. К. Айла-мазяна РАН «Программные системы: теория и приложения». 2011. № 1 (т. 2). С. 39-50.

23. Трушкова Е. А., Синтез управления в окрестности приближенного решения задачи с частично закрепленным правым концом // Эл. науч. журнал Института программных систем имени А. К. Айламазяна РАН «Программные системы: теория и приложения», 2011. № 1 (т. 2). С. 31-35.

Личный вклад автора, в статьях с соавторами. Основные результаты диссертации, выносимые на защиту, получены лично соискателем. В совместных статьях соискателем получены следующие результаты соответственно:

[6], [1], [2], [3], [19] — Разработка методов локального улучшения управления, в том числе для задач с фазовыми ограничениями интервального типа; создание соответствующих вычислительных схем; реализация соответствующих рабочих программных модулей в среде параллельных вычислений; проведение вычислительных экспериментов;

[4], [5] — Разработка конструктивных методов преобразования правых частей задач оптимального управления с целью дальнейшего поиска их приближенных решений; применение указанных преобразований к поиску множеств достижимости и к задаче спуска космического челнока в атмосфере с минимальным теплоподво-дом; разработка метода и соответствующей вычислительной схемы улучшения управления в окрестности текущего приближения для задач с частично фиксированным правым концом: программная реализация соответствующего алгоритма и проведение вычислительных экспериментов для рассматриваемой прикладной задачи;

[8], [12] — Разработка вычислительных методов и соотеветству-ющая реализация в среде параллельных вычислений основных рабочих модулей программного комплекса «ВБЕЕтосЫ 1.0», предназначенного для проведения многовариантных расчетов с дискретной социо эколого-экономической моделью развития региона;

[10] — Разработка математической модели задачи о динамическом распределении компьютерных ресурсов для системы компьютерных приложений; разработка метода решения задачи и его программная реализация для системы двух компьютерных приложений;

115], [21] — Разработка методов глобального улучшения управления; создание соответствующих вычислительных схем; демонстрация эффективности разработанных методов на представленных тестовых примерах.

Научное издание

ТРУШКОВА Екатерина Александровна

Итерационные методы оптимизации управления на основе принципа расширения и достаточных условий оптимальности

Автореферат диссертации на соискание ученой степени доктора физико-математических наук

В печать от 20.01.2014 Формат 60x90/16. Уч.-изд. л. 2,4 Тираж 100. Заказ 3

117997, Москва, Профсоюзная, 65 Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А.Трапезникова Российской академии наук

Текст работы Трушкова, Екатерина Александровна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

Федеральное государственное бюджетное учреждение науки Институт проблем управления имени В.А. Трапезникова РОССИЙСКАЯ АКАДЕМИЯ НАУК

На правах рукописи

05201450764

ТРУШКОВА Екатерина Александровна

Итерационные методы оптимизации управления на основе принципа расширения и достаточных условий оптимальности

Диссертация на соискание ученой степени доктора физико-математических наук

по специальности 05.13.01 — Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)

Научный консультант

доктор технических наук, профессор

Гурман В.И.

Москва, 2013

ОГЛАВЛЕНИЕ

Введение 4

ГЛАВА 1. Основные сведения из теории достаточных условий

оптимальности 17

1.1 Общая задача оптимизации и улучшения. Принцип расширения. 17

1.2 Оптимальное управление непрерывными системами........19

1.3 Оптимальное управление дискретными системами.........26

ГЛАВА 2. Преобразования модели объекта 30

2.1 Расширяющие преобразования систем с управлением .......30

2.1.1 Некоторые конструктивные схемы ................33

2.1.2 Преобразование к линейной системе и приложение к оцениванию множеств достижимости...................37

2.1.3 Преобразование к системам с линейным управлением .....42

2.2 Использование достаточных условий оптимальности........43

2.3 Аппроксимация моделей с неполным аналитическим описанием . 49

2.4 Преобразования, приводящие к дискретно-непрерывным системам 52

2.5 Схема приближенного исследования задач управления.......57

2.6 Выводы к главе 2............................64

ГЛАВА 3. Оптимизация управления на основе минимаксного принципа 66

3.1 Дискретные системы..........................66

3.2 Непрерывные системы.........................72

3.3 Улучшение для систем с линейным неограниченным управлением 79

3.4 Приближенный синтез управления на основе метода улучшения . 82

3.5 Выводы к главе 3............................87

ГЛАВА 4. Методы и алгоритмы приближенной оптимизации управления 89

4.1 Улучшение с использованием принципа локализации........89

4.2 Методы улучшения...........................91

4.2.1 Методы первого типа........................91

4.2.2 Методы второго типа........................96

4.2.3 Метод улучшения простой аппроксимации скользящего режимаЮО

4.3 Итерационные методы в задачах с фазовыми ограничениями . . 105

4.4 Метод приближенно-оптимального синтеза управления в окрестности заданной траектории......................108

4.5 Выводы к главе 4............................112

ГЛАВА 5. Задачи оптимизации управления в квантовых системах 114

5.1 Улучшение управления в одном классе гамильтоновых систем . .115

5.1.1 Управление передачей возбуждения в спиновой цепочке . . . .119

5.1.2 Преобразование к производной системе..............126

5.2 Управление квантовой системой с дискретным спектром .....142

5.3 Выводы к главе 5............................144

ГЛАВА 6. Другие приложения 147

6.1 Оптимизация маневров нештатной посадки вертолета.......147

6.2 Исследование стратегий устойчивого развития на социо-эколого-экономической модели региона....................160

6.2.1 Программно-алгоритмический инструментарий.........164

6.2.2 Тестовые расчеты..........................171

6.3 Динамическое распределение ресурсов................181

6.4 Выводы к главе 6............................196

Заключение 201

Приложение 203 Список использованных источников....................216

Введение

Приближенные и вычислительные методы — обширная и ставшая самостоятельной область исследований и разработок в теории оптимального управления, нацеленных на эффективное решение практических задач. Основные исследования и разработки приближенных методов группируются главным образом вокруг численной реализации известных теоретических результатов: принципа максимума Понтрягина, метода динамического программирования Беллмана, принципа оптимальности Кротова и общей теории экстремума Милютина-Дубовицкого, их обобщений и аналогов для различных постановок, учитывающих разнообразные практические ситуации. Основы этой теории широко освещены в литературе (Р. Беллмап [8]; А. М. Летов [78]; Л. С. Поптрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф Мищенко [91]; В. Ф. Кротов [65]; А. Я. Дубовицкпй, А. А. Милютин [55]; Н. II. Красов-ский [62], [63]; В. Г. Болтянский [13], [14]; Н. Н. Красовский, А. И. Субботин [64]; А. Б. Куржанский [76]; Р. Габасов, Ф. М. Кириллова [24]; и др.).

Несмотря на то, что теоретические результаты учитывали особенности современных задач управления, главным образом, наличие разнообразных ограничений в дополнение к основным - дифференциальным - связям в вариационном исчислении, их прямое практическое использование оказалось весьма ограниченным сложностями реализации теоретических соотношений, описывающих искомое решение получаемых уравнений. Как правило, аналитическое решение можно было найти лишь в редких случаях, если не считать специально подобранных примеров. Это послужило причиной для разработки приближенных методов, позволяющих решать сложные практические задачи. За прошедший с момента их появления полувековой период было предложено множество разнообразных приближенных, численных методов, позволяющих искать оптимальное решение напрямую, минуя условия оптимальности, посредством операций улучшения управления, повторяемых

в итерационной процедуре. При этом косвенно использовались как сами основополагающие результаты, так и принципы, лежащие в их основе.

Исторически развитие методов улучшения началось с методов первого порядка, известных как градиентные методы, одновременно с созданием современной теории оптимального управления. В числе основоположников отметим Р. Куранта [128], Д. Е. Охоцимского и Т. М. Энеева [88), [89], JI. В. Канторовича [58], JT. И. Шатровского [116], Дж. Келли [60]. Более сложные схемы требуются при наличии ограничений на переменные управления и состояния. Здесь можно отметить, например, работы Р. П. Федоренко [П0|, [111] и В. Г. Гюрджиева [54]. Наряду с этим реализовались и другие методы, родственные градиентным, основанные на принципе максимума Понтрягина (И. А. Крылов, Ф. Л. Черноусько [74], [75[; О. В. Васильев, А. И. Тятюшкип [22]). Ряд интересных схем предложен в книге Н. Н. Моисеева [82]. Для поиска управления в форме синтеза весьма эффективным оказался метод моментов (Н. Н. Красовский [62], [63]; Р. Габасов, Ф. М. Кириллова |23]).

Методы первого порядка демонстрируют, как правило, высокую эффективность па первых итерациях и ее резкое снижение в окрестности оптимума. Это заставило обратиться к более сложным схемам построения алгоритмов и разработке методов второго порядка (Д. X. Джекобсон [131]; В. Ф. Кротов, И. Н. Фельдман [72]; Р. Анрнон [5]). Одно из направлений в этой области базируется на достаточных условиях оптимальности Кротова (В. Ф. Кротов, В. И. Гурман [70], В. Ф. Кротов f 133|) и принципе расширения Гурмана (В. И. Гурман [31]), отличающимися значительным многообразием подходов и результатов. Они связаны с тейлоровской аппроксимацией функции Белл-мана и условий Беллмана в окрестности текущего приближения с точностью до малых второго порядка, что приводит к дифференциальным уравнениям для первых и вторых производных функции Беллмана. Ряд таких методов как для непрерывных, так и для дискретных систем приведен в работах В. И. Гурмана, В. А. Батурина, И. В. Расиноп [35], В. И. Гурмана, И. В. Ра-

синоп, В. А. Батурина, Е. В. Данилиной [41], В. И. Гурмана, В. А. Батурина, Е. В. Данилиной и др. [36]. Иначе получаются методы сильного улучшения. Такого типа методы представлены в работах В. Ф. Кротова, 14. И. Фельдмана [72], В. И. Гурмана, И. В. Расиной [40], В. И. Гурмана [31]. В основном, это различные итерационные процедуры улучшения управления, как и в других школах. Спецификой является априорно приближенный подход, возможность оценивания получаемых приближенных решений и использование характерного свойства вырожденности прикладных задач и соответствующих специальных методов для поиска начальных приближений, что, как известно, является критическим моментом при использовании итерационных улучшающих алгоритмов.

Были также инициированы работы по исследованию сложных (гибридных) процессов. В работе А. Г. Орлова, И. В. Расиной [87] впервые построен для сложных процессов метод улучшения второго порядка, в статье И. В. Расиной [92] приведены достаточные условия оптимальности, как в форме Кротова, так и в форме Беллмана. Сочетание этих условий и специальное преобразование части приращения функционала позволило построить алгоритм второго порядка, содержащий меньшее число сопряженных переменных на каждом этапе по сравнению с более ранними вариантами метода. Также в работах И. В. Расиной [93], [94] рассматривались достаточные условия оптимальности для сложных процессов с параметрами и процессов с запаздыванием по состоянию. Для последних получен алгоритм градиентного типа. Иные подходы к оптимизации сложных процессов как процессов в логико-/динамических системах развиваются в работах С. Н. Васильева, А. К. Жер-лова, Е. А. Федосова, Б. Е. Федунова [20] и А. С. Бортаковского, А. В. Пантелеева [15]).

В конце 1980-х, в 1990-ые годы и в первые годы 21-го века, с одной стороны шла шлифовка разработанных методов, а с другой продолжался процесс создания новых алгоритмов по ранее рассмотренным направлениям. В

монографии О. В. Васильева, А. В. Аргучинцева [21] наряду с методами решения экстремальных задач подробно освещаются итерационные процессы, основанные на принципе максимума. Большое внимание уделено градиентным методам и задаче с дополнительными функциональными ограничениями. Широкий спектр методов и их приложения для решения практических задач представлены в работах В. А. Батурина, В. И. Гурмана, В. А. Дыхты [6], В. А. Батурина, Д. Е. Урбановича [7], А. В. Лотова, В. А. Бушенкова, Г. К .Каменева [135], А. В. Лотова, И. И. Поспеловой [79], В. В. Салмпна, С. А. Ишкова, О. Л. Стариновой [95], В. В. Токарева [98].

Своеобразным итогом и обобщением многолетних исследований достаточных условий оптимальности и методов улучшения, построенных на базе достаточных условий оптимальности, служит монография В. Ф. Кротова [133], где в частности описан общий метод глобального улучшения управления и его конкретная реализация с линейной разрешающей функцией, оказавшаяся особенно эффективной в приложении к управлению квантовыми системами. Родственные методы улучшения, называемые нелокальными, описаны в книге В. А. Срочко [96]. Эти методы развиваются в работах А. С. Булда-ева [17], [18]. В настоящее время появляется все больше европейских работ, предлагающих применять теорию оптимального управления (а именно, метод глобального улучшения управления Кротова) к задачам управления различными квантовыми системами (S. Е. Sklarz, D. J. Таппог [142]; С. P. Koch, J. P. Palao. R. KoslofT, F. Masnou-Seeuws [132]; J. P. Palao, R. Kosloff, C. P. Koch [139]; I. I. Maximov, J. Salomon, G. Turinici, N. C. Nielsen [137]; M. Murphy, S. Montangero, V. Giovanetti, T. Calarco [136]; S. G. Schirmer, P. Fouquieres [141]; D. M. Reich, M. Ndong, С P. Koch [140[ и др.). Было отмечено, что метод Кротова не испытывает особых трудностей на больших размерностях и позволяет решать задачи управления квантовыми системами с высокой точностью.

В тоже время повысился интерес к дискретизации непрерывных систем -

переходу от непрерывной модели к дискретной па ранних стадиях исследования задачи, а не в конце, при численном интегрировании конечных дифференциальных соотношении оптимального процесса. Такое преобразование модели управляемой системы позволяет обойти обременительные теоретико-функциональные требования в применяемых схемах аппроксимации и оценках приближенных решений. Кроме того, в терминах постановки дискретной задачи оптимального управления и соответствующих достаточных условий возможна интерпретация самых разнообразных задач. Эти вопросы затрагивались в работах В. И. Гурмана [30], [31], В. А. Батурина и Д. Е. Урба-иовича [7]. Дискретные модели естественно используются для применения развитых методов нелинейного программирования к решению ряда задач оптимального управления (10. Г. Евтушенко [56[; Р. Габасов, Ф. М. Кириллова, А. И. Тятюшкин [25]; А. Ю. Горнов [27]).

Как правило, исходная математическая модель, соответствующая изучаемой практической проблеме, оказывается сложной или даже нерегулярной с точки зрения общих методов решения, и даже с точки зрения приближенных методов. Так исходная математическая модель может содержать неучтенные и незаметные на первый взгляд резервы, позволяющие с помощью преобразования исходной модели объекта заменить ее приближенно или точно более простой с точки зрения поиска решения задачей. Подобный подход к решению сложных задач издавна неявно применялся в теории экстремальных задач, например, в виде известного метода множителей Лагранжа и его современных модификациях. В теории оптимального управления он получил новое развитие в работах по достаточным условиям оптимальности М. М. Хруста-лева [112], [113], В. Ф. Кротова и его последователей. Он оказался весьма эффективным для приложений, что было подтверждено рядом новых точных и приближенных методов, отмеченных выше, и значительным числом решений сложных прикладных задач из различных областей. В основе данного направления лежит принцип расширения, наиболее полно исследован-

ный и освещенный в работах В. И. Гурмана. В них активно развивались как идеи принципа расширения для абстрактной задачи об оптимуме, так и эффективные конкретные методы решения распространенных на практике так называемых «вырожденных задач» — задач, в которых отсутствует искомый оптимальный режим в классе сравниваемых, или присутствует множественность решений, отвечающих необходимым условиям оптимальности, или неприменимы известные достаточные условия оптимальности. При этом в конструктивном плане использовались как непосредственные аппроксимации решений уравнения Беллмана и его аналогов, так и эффективные косвенные методы, использующие активные преобразования модели объекта по принципу расширения, вырожденность и магистральную природу решений прикладных задач (В. И. Гурман, М. Ю. Ухии [51]; Пи Минь Кань, М. Ю. Ухин [86]). В работах А. И. Москаленко были предложены теоремы о совместной оптимальности, которые связаны, с одной стороны, с теорией достаточных условий оптимальности В. Ф. Кротова, а с другой — к методу вектор-функций Ляпунова (В. М. Матросов [80]; В. М. Матросов, Л. Ю. Апа-польский, С. П. Васильев [81]). Теоремы о совместной оптимальности позволяют сводить исходную задачу к более простой, которая именуется задачей сравнения. При этом инструментом преобразования является отображение, заданное парой функций, которые устанавливают соответствие между состоянием, управлением и функционалом исходной задачи и задачи сравнения, т. е. по исходной задаче определяют соответствующую задачу сравнения. Основной трудностью подобного подхода к решению прикладных задач является отсутствие достаточно общих конструктивных методов.

Современные сложные многомерные прикладные задачи (например, задачи управления квантовыми системами, задачи управления, связанные с моделями социо-эколого-экономических систем, и т. п.) диктуют основные требования к методам решения задач управления: упрощение модели объекта, эффективные методы поиска приближенно-оптимальных управлений с

учетом больших размерностей и параллельная программная реализация соответствующих алгоритмов.

Цель и задачи исследования. Целыо диссертационной работы является разработка эффективных методов поиска приближенных решений задач оптимального управления, ориентированных на параллельные вычисления, па основе известных ранее и новых преобразований модели объекта управления, достаточных условий оптимальности и глобальных оценок.

Для достижения указанной цели в работе поставлены и решены следующие задачи:

1. Разработать теоретические основы и конструктивные методы упрощающих преобразований модели объекта, которые позволяют заменить исходную задачу семейством более простых задач (в смысле дальнейшего поиска приближенного решения) и тем самым составляют основу методики исследования.

2. Реализовать конструктивно минимаксный принцип Кротова улучшения управления как основу эффективных итерационных методов оптимизации управления.

3. Разработать па основе указанных подходов серию методов и алгоритмов приближенного поиска оптимального управления, ориентированных на параллельные вычисления с соответствующим программным обеспечением.

4. Применить разработанные методы для решения прикладных задач управления из различных областей, в том числе с применением суперЭВМ.

Методы исследования. Исследования, выполненные в работе, базируются на достаточных условиях оптимальности и глобальных оценках, принципах расширения и локализации. При алгоритмической и программной реализации использовались различные численные методы аппроксимации функций многих переменных, решения дифференциальных уравнений, нелинейного программирования. При написании компьютерных программ использовался язык программирования С++, при написании параллельных версий

программ использовалась Т-система с открытой архи�