автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Качественные и численные методы решения задачи оптимального управления с фазовыми ограничениями на примере управления локомотивом

кандидата физико-математических наук
Данг Тхи Май
город
Москва
год
2012
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Качественные и численные методы решения задачи оптимального управления с фазовыми ограничениями на примере управления локомотивом»

Автореферат диссертации по теме "Качественные и численные методы решения задачи оптимального управления с фазовыми ограничениями на примере управления локомотивом"

На правах рукописи

005044592

Данг Тхи Май

КАЧЕСТВЕННЫЕ И ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ НА ПРИМЕРЕ УПРАВЛЕНИЯ ЛОКОМОТИВОМ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (промышленность)

АВТОРЕФЕРАТ

Диссертации на соискание ученой степени кандидата физико-математических наук

2 * МАЙ 2012

Москва-2012

005044592

Работа выполнена в ФГБУН Вычислительном центре им. А.А. Дородницына РАН в отделе прикладных проблем оптимизации

Научные руководители: доктор физико-математических наук

профессор Василий Васильевич Дикусар, доктор технических наук Нгуен Куанг Тхыонг

Официальные оппоненты: доктор физико-математических наук,

профессор Ольга Валентиновна Дружинина кандидат физико-математических наук, доцент кафедры высшей математики МФТИ Виктор Борисович Трушин

Ведущая организация: Федеральное Государственное Бюджетное Учреждение Науки ЦЭМИ РАН

Защита диссертации состоится «31» мая 2012г. в 16 часов на заседании диссертационного совета Д002.017.03 при ВЦ РАН по адресу: 119333, г. Москва, ул. Вавилова, д. 40 в конференц-зале.

С диссертацией можно ознакомиться в библиотеке Вычислительного центра им. A.A. Дородницына РАН

Автореферат разослан « 28 » апреля 2012 г.

Ученый секретарь совета по защите докторских и кандидатских диссертаций Д 002.017.03

кандидат физико-математических наук

Мухин A.B.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы диссертации

Задачи оптимального управления с фазовыми и смешанными ограничениями наиболее адекватно отражают свойства управляемого объекта. Большую роль при проектировании систем управления играют программные траектории. Из известных методов решения указанных задач являются: прямые методы, метод вариации фазовых переменных, метод штрафных функций, метод функций Лагранжа, принцип максимума. В вычислительном плане наиболее точные результаты получаются с использованием принципа максимума. Основы теории оптимального управления были заложены в работах JI.C. Понтрягина, H.H. Красовского, В.Г. Болтянского, A.A. Милютина, А .Я. Дубовицкого, Р.В. Гамкрелидзе, Р. Беллмана и других авторов.

Известно, что принцип максимума редуцирует исходную постановку задачи к краевой задаче для системы обыкновенных дифференциальных уравнений. Решение краевых задач связано с выбором начальных значений сопряженных переменных и опирается, в основном, на требования хорошей обусловленности матрицы Якоби [1].

Трудности исследования и численного решения таких задач связаны с алгебраическими ограничениями типа неравенства, а также со структурой сопряженной системы ОДУ. Для задач с фазовыми и нерегулярным! смешанными ограничениями правые части сопряженных ОДУ содержат обобщенные функции. Особую трудность при численной реализации представляют траектории, близкие к нерегулярным. В этом случае сопряженные уравнения могут содержать малый параметр при производной, который зависит от времени [2].

Кроме того, одной из основных задач, возникающих при обработке результатов экспериментов, является задача интерполяции и дифференцирования табличных данных. Из-за сложности математических моделей экспериментов процесс точного их восстановления более трудоемок по сравнению с построением модели, близкой по свойствам к модели эксперимента. Для более точного приближения построенной математической модели к эксперименту, помимо информации, полученной в результате эксперимента, используется априорная информация, которая задает дополнительные ограничения на поведение функции.

Известно, что наилучшее приближение для функций класса Ж22[а, б] (если / eW22[a,b] то / интегрируемых в квадрате и /' - абсолютно непрерывна) с

ь

точки зрения функционала энергии вида J(S"(*))2ebc дают кубические сплайны.

То есть, кубический сплайн обладает минимальной кривизной среди всех интерполяционных функционалов, построенных по заданным точкам. Наиболее

3

простым кубическим сплайном является интерполяционный кубический сплайн, методы вычисления которого являются базовыми для вычисления других видов сплайнов [3].

Однако область применения таких сплайнов ограничена таблицами, содержащими точные значения интерполируемой функции. То есть при использовании этого типа сплайнов мы должны быть уверены, что экспериментальные данные не содержат ошибок, которые могут быть внесены, например, регистрирующей аппаратурой. В случае наличия таких ошибок выполнение условий интерполяции приводит к искажению исходной функции, более того, при дифференцировании построенного сплайна его производная будет содержать высокочастотные «шумовые» осцилляции большой амплитуды, обусловленные некорректной операцией дифференцирования. Чтобы избежать такой ситуации используются сглаживающие кубические сплайны.

В связи с указанными обстоятельствами возникает, с одной стороны, необходимость создания новых математических моделей, описывающих динамические процессы, с другой стороны, необходимость разработки методов, позволяющих оптимизировать и оценивать эффективность функционирования динамических систем. Так, в связи с проектированием и внедрением скоростных и высокоскоростных составов актуальными задачами являются изучение качественного поведения и устойчивости математических динамических моделей с учетом различных типов возмущений.

Предмет исследования - разработка эффективных методов и алгоритмов решения задач оптимального управления и задач аппроксимации профиля поверхности по которой движется транспорт.

Цель и задачи исследования. Целью работы является разработка и исследование эффективных качественных и численных методов решения задач оптимального управления с фазовыми и смешанными ограничениями. Методы исследования настоящей работы опираются на схему Дубовицкого-Милютина; включая разработку и анализ алгоритмов а также программную реализацию предложенных алгоритмов, включая исследование и разработка методов и алгоритмов построения кубических сплайнов, а также Чебышевского сплайна.

Теоретическая и методологическая основа диссертации. Теоретическую и методологическую основу диссертации составляют труды российских и зарубежных специалистов по методам оптимального управления. Основным инструментом для решения поставленных задач является принцип максимума (схема Дубовицкого-Милютина) и методы исследования сплайн-функций.

Научная новизна результатов диссертационной работы состоит в исследовании методов решения задачи оптимального управления со смешанными ограничениями, сводящейся к последовательному решению

линейной задачи оптимального управления; проведении сравнительного анализа эффективности методов кубического и Чебышевского сплайнов. Во всех случаях проводились численные эксперименты по выяснению границ применимости предложенных методов.

Практическая ценность диссертации.

Разработанные методы, алгоритмы и программное обеспечение позволили решить три важные для практики задачи:

1. задача аппроксимации функции;

2. задача оптимального управления движением поезда с учетом рельефа местности;

3. задача наилучшего прогноза элементов матрицы Якоби а также задача корректного численного дифференцирования.

Качественное исследование и вычислительные эксперименты подтверждают эффективность предложенной методики при решении практических задач оптимального управления с фазовыми и смешанными ограничениями.

Апробация результатов исследования. Результаты диссертации докладывались и обсуждались в ВЦ РАН, ИСА РАН, ЦЭМИ РАН, ИЛУ РАН, МФТИ.

Достоверность результатов, полученных в диссертационной работе, подтверждается использованием математических моделей управления движением поезда, корректных алгоритмов аппроксимации и прогноза, методов статистической обработки информации и теории оптимального управления движением, а также проведенным математическим моделированием процессов оптимальной обработки результатов измерений.

Публикации. Основные результаты исследования по теме диссертации опубликованы 4-х работах общим объемом 2,2 п.л., в том числе 3 работы в журналах и изданиях из перечня, рекомендованного ВАК РФ, объемом 1,5 п.л.

Структура и объем работы.

Диссертация содержит 110 страницы текста с 25 графиками и состоит из введения, 3 глав, заключения по работе, приложения и списка литературы.

Краткое содержание диссертации

Во введении изложены обоснование предмета и цели исследования, основные результаты, выносимые на защиту, характеристика их научной новизны, практической значимости и апробации полученных результатов.

В первой главе « Задачи оптимального управления при наличии ограничений общего вида » излагается схема Дубовицкого-Милютина для задач с фазовыми и смешанными ограничениями [4, 5]. Приводятся постановки

задачи Понтрягина, а также задач Блисса-Больца (Лагранжа-Майера). Изложение ограничивается принципом максимума Л0 [6].

Далее рассматривается две задачи: каноническая задача Дубовицкого-Мшпотина с гладкой зависимостью правой части дифференциальных уравнений от времени; каноническая задача с непрерывной зависимостью от времени при фиксированном (,.

Рассмотрена задача оптимального управления с фазовыми ограничениями [12]:

г

Л'") = М (1.1)

о

х = Дху1,и) (1.2)

и^и п.в *е[0, Г] (1.3)

К (*(о)) = К (*(ТУ) = 0 (1.4)

*,(/,*(«))£ о, /6 [о, т\ ; = 1Д (1.5)

В этой задаче вьшолнены все стандартные предложения гладкости; функции : /хй" -> /?, г = 1, непрерывны по / и непрерывно дифференцируемы по х. Ограничения типа (1.5) называются фазовыми ограничениями. Ограничения типа (1.4) где функции к,: Я" -> Л5' дифференцируемы, называютя терминальными ограничениями.

Вводится функция Понтрягина задачи (1.1) - (1.2):

Щ1, х, и, р, />0) = (р, /(/, л:, «))- Ло/Д/, X, и)

и функция Гамильтона

А', х,р,Ла) = шах ли, х, и, р, Л0)

*еЬ'

зДесь и далее х = х(0, и = ¡¡(г) где / е [о, г]. Приводится теорема [12]

Пусть № = (*(■), й(-))- оптимальный управляемы процесс в задаче (1.1)- (1.5). Тогда существуют не равные одновременно числа Л0 > 0, векторы /0 е , /, с , вектор-функция /?(•): / е /Г и неотрицательные регулярные меры д., г = 1, £, сосредоточенные на множествах

Г, ={/<=/: & (/,*(/)) = <)}

такие, что

1) Вектор-функция р(.) является решением интегрального уравнения

р(0 = + |я (г, *(г), "(г). р(г), А0)</г -¿^„(г, х{т))<1цп г е [о, Т]

, .=1 ,

6

с условиями на левом конце

т=ь>лту„ ■

2) Почти при всех t е Т выполняется равенство

Щ, x(t), Й(<), р(о, А>) = Д'> *(')> р(0, Л,) •

Принцип максимума позволяет редуцировать исходную задачу к краевой задаче для системы обыкновенных дифференциальных уравнений. Для определения оптимального управления в каждой расчетной точке / необходимо решать задачу нелинейного (линейного) программирования.

Во второй главе « Кубические сплайны и Чебышевский сплайн. Основные методы и алгоритмы » вводятся основные понятия теории сплайнов, кубические сплайны и Чебышевский сплайн.

В § 2.1 излагаются основные теории сплайнов в гильбертовых пространствах [7].

В § 2.2 излагается метод построения интерполяционного сплайна. Исследован алгоритм на основе выражения сплайна через его производные.

Аппроксимационные свойства интерполяционного сплайна зависят от гладкости функции /(*) - чем выше гладкость интерполируемой функции, тем выше порядок аппроксимации и при измельчении сетки увеличивается скорость сходимости.

В § 2.3 рассматривается задача построения сглаживающих сплайнов. Излагаются существующие методы их построения.

Обратимся к задаче сглаживания кубическими сплайнами (СКС), используем функционал вида

где р, - весовые множители.

Привлекательная сторона такого подхода состоит в первую очередь в широких возможностях «управления» поведением сглаживающего сплайна. Действительно, полагая параметр сглаживания р, малым числом, добиваются того, что сплайн «проходит» в малой окрестности точки /,. Наоборот, при увеличении р, точка 7, перестает влиять на поведение сплайна.

Выбор величин р, часто связывают со стремлением иметь

(2.1)

í=l

\f, - f\ ~ei> гДе ei величины пофешностей задания /, = S(xt ). Предложенный в работе [3] алгоритм последовательного вычисления р,!4 по формулам

при /,(М) * J,, где к - номер итерации, направлен на то, чтобы получить |/, -/¡j < е,. Однако сходимость этого процесса к сплайну в выпуклом множестве была доказана в случае кубических сплайнов только когда все s,, кроме одного, равны нулю [8].

Для построения сглаживающего кубического сплайна (СКС) вариационным способом удобно представить функционал (2.1) в матричном виде. Приведем лемму, которая позволяет сделать это.

Лемма 2.1 [3]

Пусть заданы естественные краевые условия 5"(а) = 0; Sn(b)=0. Тогда

ь

функционал j(s"(x$dx можно представить в виде

){s"(x))1dx = sTQ.': (2.2)

а

где j' = (s (лД S (x2),...,S (xlV)Y - вектор, составленный из значений сплайна в узлах х„ матрица Q размером NxN положительно полуопределена и имеет два нулевых собственных значения и определяется соотношением Q = HTA'lH.

Тогда функционал (2.1) может быть представлен в виде

F(s) = sT{Q + P)s + sTPf + fTf (2.3)

В этом случае задача построения сглаживающего сплайна состоит из двух этапов:

1) Нахождение значений s, сглаживающего сплайна в узлах х, , на основе решения вариационной задачи

min F (s)

■ES» V

2) Построение интерполяционного сплайна по таблице {х,, s,}.

Далее рассмотрим задачу приближении функции непрерывной f{x)^c[a,b\ с использованием функций сплайнов с фиксированными узлами а - х0 < хх <... < xt < хы = b.

Исходными являются 0 + 1) функций которые строго

положительны на [о, б] и таковы, что ус, принадлежит классу непрерывных функций С" '\а,ь], образуем следующую систему функций:

«!,(*) = *„(*)}*.(£ (2.4)

К М = и>0 (х) [ w, Of,) )...[-' (£,

Тогда функции {г/, }"=0 называется обобщенной полной системой Чебышева или ЕСТ-системой [9].

Чебышевский сплайн с узлами представим в следующем виде:

S(x) - ¿АуИу(дг) + ¿^.(л;,*,) (2.5)

j=Q /= 1

где

?Sx'xj)=

X, X. X, (2°)

О х<х1 или х>Ь

Лемма 2.2 [9] Пусть {и,}"1=0 представляет собой ЕСТ- систему вида (2.4) на интервале [а,б], пусть функция /р„(х, е) определяется соотношением (2.6). Если

}*=1; {х, }*=1 таковы, что а < х, < х2 <... < хк < Ь; а < е, < <... < ¡к < Ъ, то

причем строго неравенство будет иметь место тогда и только тогда, когда

*(-„-!<'.• <*,•; ' = 1,2,-,к (2.7)

где случаю ¡<п+1 соответствует только правое неравенство. Для п — 0 допускается равенство в правой части (2.7). Пример!

Использован Чебышевский сплайн для построения аппроксимации

ФУНКЦИИ /(*) = ЯПА'.

Результат приведен на рис. 2.1( Матлаб).

Рис.2.1. Аппроксимация функции f(x) = sin(x) Чебышевским сплайном Построение кубического сплайна( Матлаб). Результат приведен на Рис 2.2

! 1.5 2 2.5 3 35 4 4.5 5 5.5

Рис.2.2. Аппроксимация функции ^х) = зш(х) кубическим сплайном Пример2

Использованы Чебышевский сплайн и кубический сплайн для построения аппроксимации функции /(*) = —у.

•0. -О •О

-о ■а -а. ■о. •0. ■о

Рис.2.3. Аппроксимация функции Г(х) = —г Чебышевским сплайном

X

Кубический сплайн

^^ •*'-* О эадзные точки I --«ппрою-фун 1

■0.3 ■ /] --'Ч»8) I

/У ,_,

Д /;' | Ошибка. - 0-6562 |

!

-0.6 - I /

•0.В ■ 11

/

-0.9 //

Рис.2.4. Аппроксимация функции В(х) = —- кубическим сплайном

X

Рис. 2.1 - рис. 2.4 показывают что, ошибка аппроксимации функции по методу сплайн-Чебышева меньше чем ошибка по методу кубического сплайна.

В третье главе «Оптимальное управление движением поездов» представлена постановка задачи оптимального управления движением скоростного поезда, проанализированы существующие методы ее решения и рассматривается возможность использования принципа максимума при оптимальном управлении движением скоростного поезда.

Расход электроэнергии определяется следующем интегралом:

/ /у

„»«-о-----

О зэданыЕ точки

...............аппрок-фун

----1/(х*)

ошибка = 0.2203

// // и

а

Ч

2.5 3 3.5

4.5 5 5.

Кубический сплайн

/7

О заданые точки | --аппрок-фун

— -"("*) I

и

1.5 2 2.5 3 3.5 4 4.5 5 5.

' "г Fv ,

А>=)—л СЗ-1)

о '/

где Т7 - сила тяги поезда; V - скорость поезда; у - к.п.д. тягового привода, - время хода по перегону.

Объект управления описывается системой го двух дифференциальных уравнений движения поезда. Решенные относительно производных пути э и скорости V, они имеют вид:

Г£ = у; (3.2)

Л

л

——--(V) - IV , (.V)--

р + д »V/ д\ , р + д

(3-3)

где Р - вес локомотива или вагона электропоезда; (¡> - вес состава или загрузки электропоезда; \у0(у) - удельное основное сопротивление движению поезда; - удельное дополнительное сопротивление движению от уклонов и кривых.

Величина = ——, где с коэффициент, учитывающий размерности переменных, 1 + у

заданных в единицах, не соответствующих СИ; у коэффициент инерции вращающихся масс. Определены граничные условия:

5(0) = г(0) = V,; ,5(Г„) =v(ГIJ = V,; (3.4)

ограничение на фазовые координаты:

0<у<у„(^); (3.5)

а также ограничения на силу тяги, ток двигателя и силу торможения -ограничения на управление:

0 ^/'-,„>); 0</</тю; 0 <Вт<ВТтах(г) (3.6)

Целью оптимизации является определение такого управления и ВТ(г) и соответствующей траектории движения поезда v(í) и ^(0, которые обеспечивают заданное время хода по перегону Тт с минимальным расходом

электроэнергии Аъ при выполнении граничных условий (3.4), ограничений на фазовые координаты (3.5) и ограничение управление (3.6).

Введем вспомогательные сопряженные функции ц/0, у/,, удовлетворяющие дифференциальным уравнениям:

= 0; = ~(3-7)

ей ах ¿л» от

12

Функция гамильтониан

. Щ> V, Uf, ub, s) = ц/афй +

(3.8)

где

Фо~ "//»+-, Ф, - -i-

v v

uf=F/FmJvy, ub=BT!BTmiM

/м=££п>). b (V)JBt-{v)-

jr,\ p+q > ttl\ j p+q . w(v) = £u'0 (v); g{s) = £и>г (s) . А - неопределенный множитель Лагранжа.

(3.9) (3.10)

Согласно принципу максимума, если управления u'f(s), ub(s) и соответствующая им траектория движения v*(s) оптимальны, то должны существовать такие сопряженные функции ц/а = const <0 и <//, (s), при которых

для любого функция Я переменных uf,ub достигает максимального

* *

значения в точке с координатами Uj-Up иь = иь; т.е.

Н(%,Щ,,v, и' ub,s) = maxff(%,,v, и,, ub,s)

Обозначим

Vav

Тогда гамильтониан (3.8) можно представить в виде

Я = -у о

А

"/Л (v)(p - 1) - "¡,6» (v)p - [w(v) + g(i)]p--

(3.11)

(3.12)

При фиксированных значениях р, V, я величина Н является функцией управляющих воздействий и},ик. Для функции р($) можно выделить пять диапазонов с различными оптимальными управляющими воздействиями, обеспечивающими максимума Я:

а—если р < 0,то и/ = 0,иь = 1; б-еслир = 0 тои/ = 0,иь е [ОД} в - если р е (о, 1), то иг = 0, иь = 0; г - если р = 1, то 6 [0,1], иь = 0; д—еслир >\,то и^ = 1 ,иь =0.

а- это режим торможения с максимальной интенсивностью (ТМ);

б - режим стабилизации торможением (СТ)

в- режим выбега (ВБ), т.е. движение поезда по инерции;

д- режим движения с максимальной силой тяги (ТГ).

г - режим движения с постоянной скоростью vc (С).

Структура оптимальной траектории

Ограничение на число переключений режимов следует из непрерывности функции p(s). Все переключения режимов ТГ, С, ВБ из одного в другой возможны только при р = 1, а режимов ВБ и ТМ - при р = 0. Переключения ТГ ++ТМ и С <-+ТМ невозможны, так как они должны сопровождаться скачками p(s).

Под структурой траектории понимается последовательность оптимальных режимов управления; она зависит от граничных условий (3.4), профиля пути и длины перегона. Например, режим тяги на интервале [a,b], находящемся внутри перегона, возможен лишь в случае, если на [a,b\ имеется крутой подъем, на котором скорость поезда уменьшается даже при максимальной силе тяги. Поэтому должно выполняться соотношение v(a) > v(b), что возможно только при наличии крутого подъема. Аналогично можно показать, что режим выбега внутри оптимальной траектории возможен либо перед торможением, либо если крутой спуск, на котором скорость поезда растет даже при выключенных тяговых двигателях.

На перегоне с легким профилем (без крутых подъемов и спусков) при vH < vc оптимальная траектория включает максимум четыре режима: ТГ -> С ВБ ->■ ТМ (рис. 3.1, а). На коротких перегонах режим С может отсутствовать (рис. 3.1, б). Если vK >0 (например, vK задано ограничением скорости при въезде на станцию), то может не быть режима ТМ (рис. 3.1, в). И, наконец, если vH > vc, оптимальная траектория (рис. 3.1, г) имеет в начале режим выбега.

Получены струтуры оптимальной траектории показываются на рис.3.1.

и

Рис.3.1. Оптимальные траектории Учет ограпичения скорости движения

Учет ограничений по условию (3.5) производится с помощью предложенной А. А. Малютиным и А. Я. Дубовицким формулировки принципа максимума, предназначенной для решения задач с фазовыми ограничениями [10]. Дифференциальное уравнение для принимает следующий вид:

(3-13)

as dv ov as

Функция /j(s) обладает следующими свойствами: во - первых, она изменяется только тогда, когда фазовая координата v достигает границы v„, ; во-вторых, y(s) - неубывающая функция.

Как и ранее, из оптимальности траектории следует, что гамильтониан достигает максимума по управляющим воздействиям. Поскольку запись его не изменилась то в зависимости от значения p(s) оптимальным является один из пяти рассмотренных выше режимов: ТМ, СТ, ВБ, С, ТГ. Пользуясь уравнениями (3.2), (3.3), (3.11) и (3.13), запишем

itJ-ZJLu (v)+PUbK, (v) + iV(v)-4~f{s) (3.14)

ds v v v v vy/0

Для режима СТ из этого уравнения получим ^ = -^--//(î)/(i//0v) . Если

as v

такой режим существует на некотором интервале, то внутри интервала dp/ds = 0, что возможно лишь, если ju'(s) > 0. В силу первого свойства ju(s) это достигается лишь на границе фазовой траектории, т. е. когда v = v„,. Таким образом, в режиме СТ с помощью торможения поддерживается максимальная допустимая скорость v„,, что возможно лишь на крутых спусках.

В режиме стабилизации в соответствии с выражением (3.14) из условия с1р/Л- = 0 следует, что v^w'^y)-X-v2ц'(s)lч/й = 0. Если V<V,,,, то = и

скорость поезда равна значению ус, определяемому уравнением у2м-''(у) = Я. Если у = у,„, то в силу второго свойства //(я) получим у2и/(у)<1, т. е. v<vc. Следовательно, в режиме стабилизации поддерживается минимальная из скоростей ус или у,„.

Если в точке переключения V < ; то р'(х)=0. Если же в точке переключения v = vnl, вследствие скачков /¿(я) возможны дополнительные переключения: ТМ -+ ТГ, ТМ -> С, СТ -» ТГ, СТ -»• С. Однако все переключения из режима ТМ, при скорости у = невозможны, так как в конце любого торможения V < V,,. Переключение СТ ТГ при у = также невозможно, так как режим СТ может существовать лишь на крутом спуске, а использование максимальной силы тяги даже конце вредного спуска приведет к превышению у„. Единственно допустимо переключение СГ->С в конце крутого спуска.

Исходя из ограничения по условию (3.5) легко также показать, что при у = переключение ВБ -> '1Т недопустимо, СТ->ВБ и ВБ С происходят в конце крутого спуска, а С -» 7Гв начале крутого подъема.

Таким образом, на перегоне с легким профилем оптимальная траектория, содержит четыре режима: ТГ(ВБ)->С->ВБ -+ТМ . Разница заключается только в том, что на режиме стабилизации скорость не обязательно равна \с, а может поддерживаться на уровне у„ если у„, < . При наличии крутого подъем или спуска, если < гт, скорость может достичь , как это показано на рис. 3.2а, б, в. Если же vc > у„,, то оптимальная траектория имеет вид, показанный на рис. 3.2г, д,е.

v

<0

Рлх V ' ; ~ '' *- ✓ ст

1 С _у 5

Рис.3.2. Оптимальные траектории с ограничением скорости движения

Таким образом, полученные условия оптимальности совместно с уравнениями движения и граничными условиями образуют полную систему соотношений, позволяющую рассчитать оптимальную траекторию при любом профиле пути на перегоне.

В заключении приведены основные результаты диссертации.

1. Проведён сравнительный анализ качества аппроксимации методом Чебышевского сплайна и кубического сплайна. По результатам экспериментов был сделан вывод о том что, ошибка аппроксимации функции по методу сплайн-Чебышева меньше.

2. Оптимальное управление скоростью поезда определялось с помощью принципа максимума. Рассмотрен вариант дискретного регулирования силы тяги на базе принципа максимума.

3. Предложенные алгоритмы реализованы программно в Матлабе 7.0 для решения задачи аппроксимации функций а также поставленных задач оптимального управления.

4. Для решения краевых задач использовался метод продолжения решений по параметру.

Литература к реферату:

[1]. Шалашилин В.И., Кузнецов Е.Б. Метод продолжения решения по параметру и наилучшая параметризация, М.: УРСС, 1999.

[2]. Дикусар В.В., Милютин A.A. Количественные и качественные методы в принципе максимума -— М.: Наука, 1989.

[3]. Завьялов Ю.С., Квасов Б.И., Мирошниченко B.JI. Методы сплайн-функций. М.:Наука, 1980.

[4]. А.П. Афанасьев, В.В. Дикусар, A.A. Милютин, С.А. Чуканов. Необходимое условие в принципе максимума. М.: Наука, 1990.

[5]. А.Я.Дубовицкий, A.A. Милютин. Необходимые условия слабого экстремума в общей задаче оптимального управления. М. : 1971.

[6]. А.П. Афанасьев, В.В. Дикусар, A.A. Милютин, С.А. Чуканов. Необходимое условие в оптимальном управлении. М.: Наука, 1990.

[7]. В.В. Вершинин, Ю. С. Завьялов, H.H. Павлов, Экстремальные свойства сплайнов и задача сглаживания, 1988.

[8]. Вершинин В. В. О сглаживающих сплайнах и их производных - Новосибирск, 1980 -20с.

[9]. С. Карлин, В. Стадден. Чебышевские системы и их применение в анализе и систатистике. М.: Наука, 1976.

[10]. Иоффе А. Д., Тихомиров В.М. Теория экстремальных задач. М.:Наука, 1974, 376с.

[11]. Мирошниченко B.JI. Достаточные условия монотонности и выпуклости для интерполяционных кубических сплайнов класса С //Приближение сплайнами.-Новосибирск. 1990. -Вып 137:Вычислительные системы, с.31-40.

[12]. Е.А. Андреева, В.М. Цирулева. Вариационное исчисление и методы оптимизации. Оренбург-Тверью ГОУ ОГУ Твер. Гос. Ун-т., 2004.

По теме диссертации опубликованы следующие работы.

1. Н.К Тхыонг, Д.Т.Май, О задаче оптимального управления движением скоростных поездов. Труды ИСА РАН Динамика неоднородных систем, Т.49(1),

2010, с 43-48.

2. Н.К. Тхыонг, Д.Т.Май, О применении принципа максимума в задаче управления движением поезда. Труды ИСА РАН Динамика неоднородных систем, Т.49(1), 2010, с 49-56.

3. Д. Т. Май. Применение сплайнов Чебышева в задаче аппроксимаций функций. Труды ИСА РАН Динамика неоднородных систем,Т.53(1), 2010, с.225-233.

4. Дикусар B.B, Н. КТхыонг, Д. Т. Май. О минимуме максимального суммарного нагреваспускаемого аппарата. «Оптимизация и приложение».2 -М.: ВЦ РАН,

2011, с.84-94.

Подписано в печать:

27.04.2012

Заказ № 7315 Тираж - 100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru

Текст работы Данг Тхи Май, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

61 12-1/806

Вычислительный Центр им. А.А. Дородницына Российской Академии Наук

КАЧЕСТВЕННЫЕ И ЧИСЛЕННЫЕ МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ НА ПРИМЕРЕ УПРАВЛЕНИЯ ЛОКОМОТИВОМ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (промышленность)

Диссертации на соискание ученой степени кандидата физико-математических наук

Научные руководители: доктор физико-математических наук

На правах рукописи

Данг Тхи Май

профессор В. В Дикусар

доктор технических наук

Нгуен Куанг Тхыонг

Москва-2012

Оглавление

Введение....................................................................................5

Глава 1.............................................................................................................11

ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ ОБЩЕГО ВИДА.........................................................11

1.1 Задача Понтрягина..............................................................................12

1.2 Задача Блисса - Больца (Майера)..........................................................13

1.3 Канонические задачи Дубоеицкого—Милютина.................................15

1.3.1 Каноническая задача оптимального управления с гладкой зависимостью от времени.............................................................................15

1.3.2 Локально-выпуклые функции конечномерного пространства г, у по у..................................................................................................................16

1.3.3 Предположения, при выполнении которых проводится вариационное исследование задачи А..................................................................................17

1.3.4 Структура смешанных ограничений.................................................18

1.3.5 Интегральный принцип максимума в регулярном случае 19 1.3. 7 Интегральный принцип максимума в нерегулярном случае

(принцип максимума П0)..........................................................................22

1.3.8 Каноническая задача с непрерывной зависимостью от времени при фиксированном ..............................................................27

1.4 Класс задач оптимального управления, сводящихся к каноническим Задачам А и В..............................................................28

1.5 Редукция задач оптимального управления к задаче отыскания

корней трансцендентных функций..........................................................30

Глава 2

КУБИЧЕСКИЕ СПЛАЙНЫ И ЧЕБЫШЕВСКИЙ СПЛАЙН. ОСНОВНЫЕ МЕТОДЫ И АЛГОРИТМЫ...............................................37

2.1 Сплайны в гильбертовых пространствах............................................37

2.1.1 Определение и общие сплайнов в гильбертовых пространствах.. 37

2.1.2 Полиномиальные сплайны...............................................................42

2.2 Интерполяционный кубический сплайн...............................................43

2.2.1 Определение интерполяционного кубического сплайна.................43

2.2.2 Метод построения интерполяционного сплайна...........................45

2.2.3 Свойства интерполяционного кубического сплайна......................47

2. 3 Сглаживающий кубический сплайн.....................................................49

2.3.1 Определение сглаживающего кубического сплайна.......................50

2.3.2 Методы вычисления сглаживающего кубического сплайна..........51

2.4 Чебышевский сплайн в задаче аппроксимации функций...................55

Глава 3

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДВИЖЕНИЕМ ПОЕЗДОВ.............60

3.1 Постановка задачи оптимального управления движением скоростного поезда........................................................................................60

3.1.1 Критерий оптимальности...............................................................60

3.1.2 Описание объекта управления.........................................................61

3.1.3 Формулировка задачи.......................................................................63

3.2 О применении принципа максимума в задаче управления движением поезда..............................................................................................................66

3.2.1 Преобразование уравнения движения.............................................67

3.2.2 Принцип максимума.........................................................................68

3.2.3 Оптимальные режимы управления.................................................69

3.2.4 Структура оптимальной траектории...........................................72

3.2.5 Расчет функции p(s)......................................................................73

3.2.6 Расчет оптимального управления поездом....................................75

3.2.7 Учет ограничения скорости движения..........................................76

3.2.8 Оптимальное управление электроподвижным составом с

рекуперативным торможением..............................................................81

3.3 Применение принципа максимума при дискретном регулировании силы тяги........................................................................................................84

3.3.1 Постановка задачи...........................................................................84

3.3.2 Описание скользящих режимов..................... ..................................85

3.3.3 Оптимальные управляющие воздействия.......................................87

ЗАКЛЮЧЕНИЕ......................................................................................................................................89

Приложения...................................................................................................90

Список литературы....................................................................................103

Введение

Актуальность темы диссертации.

Задачи оптимального управления с фазовыми и смешанными ограничениями наиболее адекватно отражают свойства управляемого объекта. Большую роль при проектировании систем управления играют программные траектории. Из известных методов решения указанных задач являются: прямые методы; метод вариации фазовых переменных; метод штрафных функций; метод функций Лагранжа, принцип максимума. В вычислительном плане наиболее точные результаты получаются с использованием принципа максимума. Основы теории оптимального управления были заложены в работах JI.C. Понтрягина, H.H. Красовского, В. Г. Болтянского, А. А. Милютина, А. Я. Дубовицкого, Р. В. Гамкрелидзе, Р. Беллмана и других авторов [1-9].

Известно, что принцип максимума редуцирует исходную постановку задачи к краевой задаче для системы обыкновенных дифференциальных уравнений. Решение краевых задач связано с выбором начальных значений сопряженных переменных и опирается, в основном, на требования хорошей обусловленности матрицы Якоби [32-39, 50, 57, 68, 69, 72].

Трудности исследования и численного решения таких задач связаны с алгебраическими ограничениями типа неравенства, а также со структурой сопряженной системы ОДУ. Для задач с фазовыми и нерегулярными смешанными ограничениями правые части сопряженных ОДУ содержат обобщенные функции. Особую трудность при численной реализации представляют траектории, близкие к нерегулярным. В этом случае сопряженные уравнения могут содержать малый параметр при производной, который зависит от времени [73-76].

Кроме того, одной из основных задач, возникающих при обработке результатов экспериментов, является задача интерполяции и

дифференцирования табличных данных. Из-за сложности математических моделей экспериментов процесс точного их восстановления более трудоемок по сравнению с построением модели, близкой по свойствам к модели эксперимента. Для более точного приближения построенной математической модели к эксперименту, помимо информации, полученной в результате эксперимента, используется априорная информация, которая задает дополнительные ограничения на поведение функции.

Известно, что наилучшее приближение для функций класса Ж22 [а, Ъ] (если / е Ж? [а, ъ\ то / интегрируемых в квадрате и /' абсолютно

ь

непрерывна ) с точки зрения функционала энергии вида дают

а

кубические сплайны [10, 18, 19]. То есть, кубический сплайн обладает минимальной кривизной среди всех интерполяционных функционалов, построенных по заданным точкам. Наиболее простым кубическим сплайном является интерполяционный кубический сплайн, методы вычисления которого являются базовыми для вычисления других видов сплайнов.

Однако область применения таких сплайнов ограничена таблицами, содержащими точные значения интерполируемой функции. То есть при использовании этого типа сплайнов мы должны быть уверены, что экспериментальные данные не содержат ошибок, которые могут быть внесены, например, регистрирующей аппаратурой. В случае наличия таких ошибок выполнение условий интерполяции приводит к искажению исходной функции, более того, при дифференцировании построенного сплайна его производная будет содержать высокочастотные «шумовые» осцилляции большой амплитуды, обусловленные некорректной операцией дифференцирования. Чтобы избежать такой ситуации используются сглаживающие кубические сплайны[22, 28].

В связи с указанными обстоятельствами возникает, с одной стороны, необходимость создания новых математических моделей, описывающих динамические процессы, с другой стороны, необходимость разработки методов, позволяющих оптимизировать и оценивать эффективность функционирования динамических систем. Так, в связи с проектированием и внедрением скоростных и высокоскоростных составов актуальными задачами являются изучение качественного поведения и устойчивости математических динамических моделей с учетом различных типов возмущений.

Предмет исследования - разработка эффективных методов и алгоритмов решения задач оптимального управления и задача аппроксимации профиля поверхности по которой движется транспорт.

Цель и задачи исследования. Целью работы является разработка и исследование эффективных качественных и численных методов решения задач оптимального управления с фазовыми и смешанными ограничениями. Методы исследования настоящей работы опираются на схему Дубовицкого-Милютина; включая разработку и анализ алгоритмов а также программную реализацию предложенных алгоритмов, включая исследование и разработка методов и алгоритмов построения кубических сплайнов а также Чебышевского сплайна.

Теоретическая и методологическая основа диссертации. Теоретическую и методологическую основу диссертации составляют труды российских и зарубежных специалистов по методам оптимального управления. Основным инструментом для решения поставленных задач является принцип максимума (схема Дубовицкого-Милютина) и методы исследования сплайн-функций.

Научная новизна результатов диссертационной работы состоит в

исследовании методов решения задач оптимального управления со смешанными ограничениями, сводящейся к последовательному решению линейных задач оптимального управления; проведении сравнительного анализа эффективности методов кубического и Чебышевского сплайнов. Во всех случаях проводились численные эксперименты по выяснению границ применимости предложенных методов.

Практическая ценность диссертации.

Разработанные методы, алгоритмы и программное обеспечение позволили решить три важные для практики задачи:

1. задачи аппроксимации функции;

2. задача оптимального управления движением поезда с учетом рельефа местности;

3. задача наилучшего прогноза элементов матрицы Якоби а также задача корректного численного дифференцирования.

Качественное исследование и вычислительные эксперименты подтверждают эффективность предложенной методики при решении практических задач оптимального управления с фазовыми и смешанными ограничениями.

Апробация результатов исследования. Результаты диссертации докладывались и обсуждались в ВЦ РАН, ИСА РАН, ЦЭМИ РАН, ИПУ РАН, МФТИ.

Достоверность результатов, полученных в диссертационной работе, подтверждается использованием математических моделей управления движением поезда, корректных алгоритмов аппроксимации и прогноза, методов статистической обработки информации и теории оптимального управления движением, а также проведенным математическим моделированием процессов оптимальной обработки результатов

измерений.

Публикации. Основные результаты исследования по теме диссертации опубликованы 4-х работах общим объемом 2,2 п.л., в том числе 3 работы в журналах и изданиях из перечня, рекомендованного ВАК РФ, объемом 1,5 п.л.

Структура и объем работы.

Диссертация содержит 110 страницы текста с 25 графиками и состоит из введения, 3 глав, заключения по работе, приложения и списка литературы.

В первой главе диссертационной работы излагается схема Дубовицкого-Милютина для задач с фазовыми и смешанными ограничениями. Приводятся постановки задачи Понтрягина, а также задач Блисса-Больца (Лагранжа-Майера). Изложение ограничивается принципом максимума П0.

Далее рассматриваются две задачи: каноническая задача

Дубовицкого-Милютина с гладкой зависимостью правой части

дифференциальных уравнений от времени; каноническая задача с

непрерывной зависимостью от времени при фиксированном .

Изложена редукция задач оптимального управления к задаче отыскания корней трансцендентных функций.

Во второй главе приводятся основные теории сплайнов в

гильбертовых пространствах и вводятся методы построения

интерполяционных, сглаживающих сплайнов и Чебышевского сплайна.

Излагаются существующие методы их построения. Решение конкретных

задач моделируется на компьютере.

В третье главе представлена постановка задачи оптимального управления движением скоростного поезда, проанализированы существующие методы ее решения и рассматривается возможность использования принципа максимума при оптимальном управлении движением скоростного поезда. Исследуем вариант дискретного регулировании силы тяги на базе принципа максимума.

Проведена структура оптимальной траектории движения скоростного поезда с учетом ограничений скорости движения. Проведен анализ оптимальных управляющих воздействий.

В заключении приведены основные результаты диссертации.

Автор выражает глубокую благодарность научным руководителям доктору физико-математических наук Дикусару Василию Васильевичу и доктору технических наук Нгуен Куанг Тхоынг за помощь в работе над диссертацией, статьями, решении организационных вопросов, и научный опыт, переданный в процессе совместной деятельности.

Глава1

ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ПРИ НАЛИЧИИ ОГРАНИЧЕНИЙ ОБЩЕГО ВИДА

Появление электронно-вычислительной техники привело к качественному скачку в развитии теории управления и позволило практически подойти к созданию эффективных алгоритмов управления, и в частности отысканию оптимальных управлений в детерминированных динамических задачах. Большую актуальность в связи с этим приобретает проблема построения и исследования новых алгоритмов оптимизации, ориентированных на решение задач управления с фазовыми и смешанными ограничениями. Однако если общая теория таких задач разработана достаточно хорошо, то конкретную практику анализа и получения численных решений, несмотря на значительные достижения в этой области, еще нельзя считать завершенной. На этом пути имеется целый ряд принципиальных затруднений, которые сдерживают внедрение общетеоретических методов в расчетную практику. Особый интерес представляет использование принципа максимума для решения, задач с ограничениями общего вида (фазовые и смешанные ограничения).

Смешанные ограничения характеризуются наличием совместной функциональной связи типа равенств и неравенств на фазовые и управляющие переменные. С формальной точки зрения фазовые ограничения являются частным случаем смешанных ограничений, когда у последних отсутствуют в явном виде управляющие функции.

Методика исследования задач оптимального управления общего вида состоит в применении принципа максимума Понтрягина и схемы Дубовицкого-Милютина. Область рассмотрения ограничивается принципом максимума минимального индекса. Кроме того, проводится

исследование аналитического эквивалента нерегулярной ситуации, предложенного А. Я. Дубовицким и А. А. Милютиным.

Задачи оптимального управления в зависимости от гладкости и структуры ограничений можно условно разделить на следующие классы.

1. Задача Понтрягина.

2. Задача Блисса—Больца (Майера, Лагранжа).

3. Каноническая задача Дубовицкого—Милютина.

1.1 Задача Понтрягина

Найти min J{p) при наличии следующих ограничений:

х = f(x,u,t),K(p) = 0, p = (x(t0),x(tl),t0,tl),ueU (1.1.1)

Здесь U - произвольное множество пространства щ х- фазовый вектор; и - вектор управления; J - функционал. Правая часть f(x,u, t) (1.1.1) непрерывно дифференцируема по переменным х, t и непрерывна по управлению; размерность f(x,u,t) равна п; хе Rn, и е Rr; К(р)~ гладкая функция от р; функционал J выпуклый ПО р .

Рассмотрение поставленной задачи в классе игольчатых вариаций приводит к известному принципу максимума Понтрягина. Вводится функция Понтрягина

П{х, и, y/x,y/t,t)= (ц/х, f{x,u,t))+if/t (1.1.2)

и краевая функция Лагранжа

1{р) = а^(р) + (с,К{р))- (1.1.3)

где запись < с, К(р) > означает скалярное произведение.

Пусть xQ(t), u0(t),t0, tx является экстремалью предложенной задачи (1.1.1) и u0(t) - ограниченная измеримая функция.

Принцип максимума

Существуют константы а0> 0, вектор-константа сеГ такие,

что

n(x0(t), u0{t),y/x,if/t,t)(=)maxn(x0{t), u(t),y/,t)= 0 (1-1.4)

ueU

где запись (=) означает "равно почти всюду";

-Iff, =n'l(xQ(t),uü{t),if/,t), J ^

V* (t0 ) = *'„ (Po)> Vx (t,) = 1'ъ (Po \а = хо (t0), b = x0 (/,), V, ('i) = (Po )> V, fr ) = {po)> Po = (*o Co)' Ci )> h, )•

Условие нетривиальности принципа максимума имеет вид

т

«о+||с||> 0, = (1.1.6)

/=1

Необходимо заметить, что в [11] приведена другая формулировка принципа максимума и, кроме того, задача (1.1.1) по постановке отличается от классической задачи Понтрягина. Однако легко видеть, что условие нетривиальности принципа максимума эквивалентно суще