автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка методики решения задач с фазовыми и смешанными ограничениями
Автореферат диссертации по теме "Разработка методики решения задач с фазовыми и смешанными ограничениями"
На правах рукописи
Мольдеров Олег Анатольевич
РАЗРАБОТКА МЕТОДИКИ РЕШЕНИЯ ЗАДАЧ С ФАЗОВЫМИ И СМЕШАННЫМИ ОГРАНИЧЕНИЯМИ
Специальность: 05.13.01. Системный анализ, управление и обработка информации
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва 2004
Работа выполнена на кафедре высшей математики Московского Физико-Технического института (государственного университета) и Вычислительном Центре РАН.
Научные руководители:
Ведущая организация:
Институт Системного Анализа РАН
Защита состоится Ю/ОИЛ2004г. в ч. на заседании диссертационного совета Д 002.017.03 при Вычислительном Центре имени А.А. Дородницина РАН по адресу: 119991. г. Москва, ул. Вавилова, д. 42 в конференц зале.
С диссертацией можно ознакомиться в библиотеке ВЦ РАН. Автореферат разослан "-^Т" 2004г.
доктор физ.-мат. наук, профессор доктор педагогических наук, доцент
Дикусар В. В. Шомполов И.Г.
Официальные оппоненты: доктор физ.-мат. наук, профессор кандидат физ.-мат. паук, м.н.с.
Гусятников П. Б. Ерешко А. Ф.
Ученый секретарь диссертационного совета кандидат физ.-мат. наук
Мухин А В.
Общая характеристика работы.
Актуальность темы. Задачи оптимального управления с фазовыми и смешанными ограничениями наиболее адекватно отражают свойства детерминируемого управляемого объекта. Большую роль при проектировании систем управления играют программные траектории. Наиболее известными методами решения подобных задач являются: прямые методы (спуск в пространстве управлении); метод вариации фазовых переменных, метод штрафных функций; принцип максимума. В вычислительном плане наиболее точные результаты получаются с использованием принципа максимума. Однако применение принципа максимума требует решения принципиальных проблем, которые могут быть успешно преодолены по мере накопления опыта решения конкретных задач оптимального управления. Указанное обстоятельство связано с одной стороны со сложной формулировкой принципа максимума для задач оптимального управления с фазовыми и смешанными ограничениями. Сложность математического аппарата не позволяет надеяться в ближайшее время на упрощение формулировки принципа максимума. С другой стороны известно, что принцип максимума редуцирует исходную постановку задач к краевой задаче для обыкновенных дифференциальных уравнений, причем в таких задачах существуют дополнительные алгебраические связи типа равенств и неравенств. В свою очередь краевая задача требует решение трех основных проблем: задача Коши для обыкновенных дифференциальных уравнений: решение в каждой расчетной точке ? задач нелинейного программирования; поиск нулей трансцендентных функций \6].
Задачи оптимального управления с фазовыми и смешанными ограничениями для систем описываемых стохастическими дифференциальными уравнениями являются некоторым обобщением своего детерминированного аналога. Необходимость моделирования с помощью стохастических дифференциальных уравнений связана со сложностью практических задач. Данный класс требует разработку существенно новых методик их решения.
РОС. НАЦИОНАЛЬНАЯ I БИБЛИОТЕКА I
ЭД1
1
Модель международной торговли с промышленным ростом, кроме того, что имеют большую практическую значимость, содержит два вышеприведенных класса задач. В детерминированном случае возникает необходимость исследования момента схода с ограничения типа неравенств, т.е. определение геометрии оптимальной траектории или другими словами множества активных индексов для ограничений типа неравенств. В стохастическом варианте возникает необходимость использования метода динамического программирования Беллмана или схемы Дубовицкого-Милютина. Отсюда следует актуальность рассмотрения задач с фазовыми и смешанными ограничениями в практическом и методическом аспектах.
Цель работы. Разработать методы качественного решения задач оптимального управления при наличии ограничений общего вида для систем с нелинейной структурой. Разработать методы численного решения задач оптимального управления при наличии ограничений общего вида для систем с линейной структурой. Провести анализ существующих методов решения линейных алгебраических уравнений в плохо обусловленном случае. Проанализировать методы продолжения решений по параметру для численного решения краевых задач. Разработать алгоритмы и процедуры для оценки геометрии оптимальной траектории. Построить динамическую модель двухсекторной экономики с экзогенным ростом, учитывающую накопление факторов производства. Построить динамическую модель международной торговли. Построить стохастическую модель спроса на импортные товары. Описать методы исследования задач оптимального управления описываемых стохастическими дифференциальными уравнениями на примере модели спроса на импортные товары.
Методы исследования. В части решения задачи двухсекторной экономики с экзогенным ростом используются методы решения линейных алгебраических систем, принцип максимума, методы продолжения
решений по параметру, метод Ньютона, программный комплекс "Баланс-Т (Умнов А.Е., Шомполов И.Г.). В части аналитического решения задачи оптимального управления стохастическими дифференциальными уравнениями метод динамического программирования Беллмана, схема Дубовицкого-Мялютина.
Научная новизна состоит в следующем:
1. Предложен численный алгоритм для решения задач оптимального управления при наличии ограничений общего вида для систем с линейной структурой.
2. Построена модель двухсекторной экономики с экзогенным ростом.
3. Построена динамическая модель международной торговли, которая допускает решения в виде сбалансированного роста.
4. Построена стохастическая модель спроса на импортные товары, цены на которые описываются стохастическими дифференциальными уравнениями.
5. Предложены методы для качественного анализа задач оптимального управления стохастическими дифференциальными уравнениями.
Практическая значимость работы. Получена оценка возможных решений в задаче международной торговли в зависимости от параметров. Предложенные численные алгоритмы и аналитические методы могут применяться при решении линейных задач и задач описываемых стохастическими дифференциальными уравнениями.
Апробация результатов работы. Основные результаты диссертационной работы докладывались и обсуждались на международной конференции в Брестском государственном университете имени А.С. Пушкина (03.06.2003-06.06.2003 г.), научной конференции Московского физико-технического института, на семинарах Института Системного Анализа РАН, ВЦ РАН, ЦЭМИ РАН, Института Проблем Управления РАН.
Публикации. По теме диссертации опубликовано три печатные работы.
Личный вклад. В совместной печатной работе [2] автору принадлежит не менее 70 процентов результатов, Дикусар В.В. внес большой вклад при построении модели международной торговли. В печатной работе [3], Дикусар В.В. оказал помощь относительно применения метода динамического программирования, постановка задачи и доказательство теоремы, принадлежит автору, проверку доказательства теоремы и критические замечания сделала Сарнецка В.
Структура и объем работы. Диссертация состоит из введения и четырех глав, изложенных на 126 страницах, содержит 3 таблицы, 12 рисунков, список литературы, приложения.
Краткий обзор работы.
В Главе I диссертации предлагаются методики на базе принципа максимума для анализа задач оптимального управления со смешанными и фазовыми ограничениями применительно к модели международной торговли.
Модель международной торговли строится на основе модели двухсек-торной экономики с экзогенным ростом. Данное исследование пренебрегает влиянием структуры торговли на темпы роста и сосредотачивается на том, как экономический рост и накопление факторов производства влияют на торговлю. Модель является одним из вариантов обобщения широко известной модели Хэкшера-Олина и предполагает, что могут быть неравновесные решения. Неравновесные решения в частности позволяют объяснить отклонения реальных наблюдений от свойств модели Хэкшера-Олина.
В современной экономической теории по динамике внешней торговли доминируют исследования, где экономический рост является эндогенной переменной [20]. Расчеты экономического роста для большего ряда стран обычно показывают, что вклад отношения капитала к труда составляет менее половины экономического роста за прошедшие пятьдесят лет. Хотя эконометрические попытки объяснить остаток для роста не увенчались успехов, здравый смысл все уже указывает на его основную причину -технологические усовершенствования. Экономисты склоняются к мнению Пола Ромера, полное понимание роста в долгосрочном периоде требует оценку экономических детерминант накопления знаний. Поэтому внимание было сосредоточено на введение эндогенного роста в модели международной торговли. Наибольших успехов в данной области добились американские экономисты Хэлпмэн и Гроссмэн (Helpman,Grossman) [15], [16]. Однако накопление факторов производства нашло отражение только в работе Бонда и Траска (Eric W.Bond, Kathleen Trask) [13]. Неопределенность спроса на экспортируемые товары в работах не рассматривалась. Одним из объяснений данного положения является сложность математического аппарата используемого для описания как стохастических, так и детерминированных динамических моделей. Кроме того, поскольку инициаторами моделей международной торговли являются экономисты, то они ограничиваются рассмотрением, как правило, только равновесных случаев.
В диссертации исследуются возможности повышения уровня адекватности моделей международной торговли, возникающей в связи с необходимостью объяснения новых экономических явлений. С другой стороны исследуется математическая сложность полученных моделей, методы аналитического и численного анализа.
В диссертации модель двухсекторной экономики описывается следующим образом. В каждой из отраслей известны стратегии других, т.е. при решении задачи оптимального управления для одной из отраслей фиксируются состояния других. Отрасли максимизируют текущую стоимость
будущих доходов :
ЛГРИ = ! (р,?, - Д^!,- - пК()е-т<И => шах (!)
динамика факторов производства и развитие технологии в 1 -м (1 = 1,2) секторе задаются уравнениями
На политику найма и на политику накопления капитала введены ограничения. В отрасли не может быть дополнительно занято и дополнительно сокращенно более определенного числа рабочих мест.
^ ('Цтт)Цпш]) £ [^|*тт)^шх] (3)
Предполагается, что поток потребления не может быть меньше некоторого минимального значения
с10<5>(1(4)
В системе есть естественное ограничение на трудовые ресурсы
^КЬг + ^КЬ1 (5)
В модели приведены следующие обозначения: р1 - стоимость продукции. д, = АЩк) - выпуск, Ди;,- - зарплата, гг - процентная ставка, Ц- -занятость, К - капитал, р - дисконт фактор, п,- темп роста занятости. ^ - темп технологического роста, у - темп сбережения, /¡(к )- неоклассическая производственная функция, к = Х/Л£1 - отношение капитала к эффективному труду, с - совокупное промышленное потребление, а,-коэффициент замещения продуктом X прочих продуктов. В задаче оптимального управления (1)-(5): п> s¡ - переменные управления, Ц, к1 -
6
фазовые переменные, (4) - смешанное ограничение, (5) - фазовое ограничение.
В приведенной постановке задача А2 является достаточно сложной' для анализа необходимых условий на базе схемы Дубовицкого-Милютина.
Модель международной торговли состоит в совместном решении систем (1)-(5) для двух различных стран, при условия заданной функции спроса на товары. Устанавливается, что система допускает решение в виде траектории экономического роста. В предположениях классической теоремы Хэкшера-Олина [14], при условии отсутствия безработицы и минимальном потоке потребления, справедлива следующая теорема. Теорема 1. Существуют траектории развития экономики при которых страна с более высокими темпами технологического роста хотя бы в одной из отраслей, обладает сравнительным преимуществом и поэтому будет экспортировать продукт, для производства которого необходим фактор, используемый интенсивно.
Для дальнейшего исследования задачи удобно переписать ее, записав динамику роста не для к, = К/А1Ь1 а для кА = К/А. Таким образом, получаем видоизмененную задачу А2*
г
ЯРЦ = I Ь{) - А^Ь - пА,к?)е-М<Н
шах
(1')
о
£¿(0) = Л(0) = л?,
(2') (3')
(4')
< ¿1 + ¿2 < Ь1
(5')
Далее предлагается следущая методика. В качестве первого приближения вместо задачи A2* рассмотрим следующую задачу Л1 в каноническом виде
(6)
(7)
при наличии ограничения (5) и
Линеаризация системы А позволяет провести качественное и количественное исследование задачи с использованием пакета "Баланс-2". В задаче Л сначала решается задача Понтрягина. Предпологается выполнение условий
v¡ е [г{т{„, Гйжи], Щ € [«{пищ «.тег] (10)
В этом случае легко определяется структура оптимального управления, что делает возможным найти оптимальную траекторию. Далее, после решения задачи Понтрягина начинаем учитывать фазовые и смешанные ограничения. Наличие фазовых ограничений типа неравенств (5) приводит к усложнению вычислительных процедур, связанных с решением сопряженной системы. Структура сопряженной системы определяется геометрией оптимальной траектории. Под геометрией понимается число выходов на фазовые ограничения и их характер (тип контакта). Требует обоснования момент схода с фазового ограничения. В другой формулировке задача определения геометрии оптимальной траектории сводится к
задаче определения множества активных индексов для ограничений типа неравенств.
В работе для предварительной оценки геометрии использовалась дискретная схема явного метода Эйлера для системы (7). Задача линейного программирования большой размерности решается с использованием пакета оптимизационных программ "Баланс-2"(Умнов А.Б., Шомполов И.Г.) [б].
Задача линейного программирования программирования может быть представлена в канонической форме.
тпах(с\хх + с2х2 +... + СпХ„), ац*1 + <»12*2 + ». +а1„хп = Ь1, + «22^2 + — + 02пХ„ = Ьг,
От 1*1 + От2Х2 + ... + <ХтцХп = 6т,
или в матричной записи тпах(С,Х),
1Ш = в,х > о,х еяп,ве 11т, а е 11тхп
В силу того, что ЭВМ оперирует лишь приближенными значениями параметров задачи, округляемыми в процессе счета, могут возникать проблемы связанные с устойчивостью задач линейного программирования. По сути дела происходит замена задачи
(12)
некоторой задачей
(13)
где относительно матрицы и векторов известно только то,
что они в определенной степени близки к истинным значениям соответственно матрицы А и векторов В, С. Одно из определений устойчивости
задачи линейного программирования имеет следующую формулировку [б].
Определение. Задачу (12) назовем устойчивой, если существует такое число ¿о > 0, что для всех 5, 0 < 6 < ¿о задача (13) имеет решение. Другими словами, задача устойчива, если она имеет решение, а также имеет решение любая задача, получающаяся из нее небольшими изменениями параметров.
В Главе II излагаются методы для регуляризации неустойчивых задач линейного программирования, оценки решения и вопросы создания алгоритмов для решения линейных систем достаточно общего вида.
Решение задачи А1 используется в свою очередь как первое приближение для задачи А*. В данном случае решение получалось методом продолжения решений по параметрам т^ 6 [0,1]:
¿,- = «<. А = д. Л,
¿г4=«,--(&
& = + (1 - щ)(РиЬ +
где
При наличии ограничения (5) и
ViSiminFi{kf, Ь{) + (1 - + Ти^) - «< < 0,
щ - «Ь^тоЦ) - (1 - + <0
- (1 - ч)(РкЬ + Твк?) + щ) < 0 (16)
Теорема 2. Продолжение решений по параметрам в задаче А2* существует и единственно и не зависит от выбора очередности продолжения по параметру.
(14)
В Главе II также излагается метод продолжения по параметру как для решения систем линейных уравнений, так и подход для продолжения в общем виде. Основой метода продолжения по параметру является теорема о неявной функции [8].
При Q 6 Я1, X £ Д", теорема о неявной функции определяет в некоторой окрестности В(х, qí) точки (х,,, qí) единственную кривую, которая имеет следующее параметрическое представление:
х = х(я),х{<ы)=ха (17)
Для получения решения x1 при q1 близкому к qo, необходимо продвинуться вдоль этой кривой, оставаясь внутри В(ход). Если условия теоремы о неявной функции выполнены в окрестности точки (х,д), то решение можно снова продолжить и так далее.
В Главе III описываются вычислительные методы продолжения решения по параметру, приводится описание методов решения и полученные результаты для задач A1 и А2*.
Численное наблюдение тех или иных свойств системы требует "правильный" выбор начальных значений и параметров. С этой целью использовались свойства аналитического решения задачи Л1.
Эффективность численных методов по отношению к параметрам системы (7) проверялась на задаче Понтрягина, поскольку она позволяет получить достаточно простое аналитическое решение. Аналитическое решение и решение полученное с помощью пакета "Баланс-2" оказались близкими, за исключением краевых эффектов. Дискретизация задачи проводилась методом Эйлера, задача рассматривалась на интервалах * € [0,100] и { € [0,200] с шагом дискретизации Д£ = 1. Далее проводились численные экспсремснты с учетом смешанных ограничений (8), (9) и фазового ограничения (5) с использованием пакета "Баланс-2". В одном из тестов в ограничении (9) параметры а, зависели от времени и экспоненциально затухали. Геометрия полученных решений согласуется с принципом максимума. Результаты расчетов и графики представлены в
Приложении.
В следующей главе диссертации изучается моделирование спроса в международной торговле с использованием стохастических дифференциальных уравнений. Ценовая неопределенность импортных товаров моделируется винеровским процессом. Приводится постановка задачи для неоклассической и линейной производственной функции с импортными товарами в качестве факторов производства [12]. Решение задачи с линейной производственной функцией при дополнительном предположении сводится к задаче выбора оптимального портфеля и потребления инвестором в непрерывном времени, доход которого формируется на основе доходов по акциям [19]. В общем случае, с неоклассической производственной функцией решение получить затруднительно, функция цены в уравнении Бел-лмана зависит от нескольких фазовых переменных и, следовательно, это уравнение в частных производных.
Рассматривается экономика, выпуск, которой задается агрегированной производственной функцией:
У = Дхт,хе,х{,хк) (18)
где У агрегированный совокупный выпуск, хт объем импортируемых неэнергетических продуктов, хе объем импортируемых энергетических продуктов (например, нефть), х1 трудовые ресурсы, хк капитал. Предполагается, что производственная функция /•) непрерывная, неубывающая, линейно-однородная, и квази-выпуклая.
Неопределенность в задаче может возникать из-за цен выпуска, цен на факторы производства и цен импортных товаров, используемых в производстве. Предположим, что цены энергетических и неэнергетогческих товаров, де и соответственно, не известны, когда делаются производственные решения. С другой стороны, цена выпуска р, затраты на единицу труда и капитала и технология, известны. Цены импорта описываются следующими стохастическими дифференциальными уравнениями.
dq.(t) «7.(0
= a,dt + dW-, i = m,e
(19)
Предположим, также, что все доходы от продажи произведенной продукции, за вычетом текущего потребления, снова вкладываются в производство. Тогда благосостояние производителя описывается следующим уравнением:
& = <*(р/(хт, хе, XI, хк) - дтхт - цехе - щц - ткхк)-сЛ= ^ у
= (-От9т2т - ОедеХе - с)Л - (ТтдтХт(Ш}п - О&ХеШ^ ' ' °
где c(t) - текущее потребление.
(20)
(21) (22)
Управление производством может быть найдено из решения задачи максимизации ожидаемой дисконтированной функции полезности:
(23)
при (20), (21), (22) и (24)
c(t) > s > 0 (24)
где U( •) строго возрастающая, строго выпуклая непрерывно дифференцируемая функция полезности на (s, со), продолжим данную функцию на [з,оо), полагая U(s) = liml/(c) и U'(s) = limí/'(c). Также предполагаем, что функция полезности сублинейна, т lim V(c) = 0 и \U[0) < Р < 1 lim U(c). Определим функцию цены:
P(Z, fe qe) = ^sup^ I{Z, qm, qe) (25)
Пусть {Wl,Ft,t > 0} винеровский процесс на вероятностном пространстве (П, F,P), где {Fi,í > 0} неубывающее, непрерывное справа
семейство а-алгебр. Будем считать, что винеровские процессы й7^ и И^ не коррелируют между собой, т.е. ¿^¿И^ДУ^) = 0. Процесс потребления называется допустимым, если он неотрицателен и прогрессивно измерим относительно потока <г-алгебр {^1}, и который удовлетворяет
следующему условию Для каждого прогрессивно изме-
римого относительно потока процесса момент остановки
определяется из условия:
Теорема 3. Пусть 1(И,дт,де) строго выпуклая по Д дважды непрерывно дифференцируемая функция на [0,оо), удовлетворяющая уравнению Беллмана
Чт
р1 = „ „ тах {(-атдтхт - аедехе - с)Гг + ОтЯтЕ
++^ел)^+шл*.++ит
(26)
Если уравнение (20) имеет сильное решение для хт = Ятт Яе),
хе = хе(г,де,дт), с = с(2,дт,де) на [0,То], где хт, хе, с - решение оптимизационной задачи в правой части (26), тогда 1(2,дт,де) = 1*(2,дт,де),
г>о.
При дополнительных предположениях задача становится аналогичной выбору инвестором оптимального портфеля и потребления с одной безрисковой и одной рисковой акцией. Она имеет решение, его можно найти, решая уравнение Беллмана [19]. Некоторые свойства решения удобно получить из необходимых условий оптимальности [2].
Последняя глава диссертации посвящена примеру использования необходимых условий оптимальности для исследования свойств решения задачи инвестирования, которая получается переформулировкой задачи спроса на импортные товары.
Инвестор может выбирать темп потребления с(t) и управление инвестициями ir{t), где ir(t) = idsE—Чс)хе обозначает часть капитала вложенного в рисковую ценную бумагу. Оставшаяся часть капитала, 7ro(t) = 1 — Tr(i) вкладывается в безрисковую ценную бумагу. Управление ж(t) не ограничено, что подразумевает неограниченную покупку и продажу; c(t) должна быть неотрицательна.
Для данных 7г(!) и c(t), капитал x(t) = Z(t) инвестора описывается стохастическим дифференциальным уравнением Ито
dx(t) = (a-r)*(t)x{t)dt+{rx{t)-c{t))dt+x(t)v{t)adlV(t),x(0) = х (27)
где г = а = a*, а = <7*, остальные обозначения из предыдущей задачи. По определению
Т0 = inf{t > 0 : x(t) = 0}. (28)
Инвестор стремится выбрать c(t) и ж(t) так, чтобы максимизировать цену
Г0
V = Ех( J e-"U(c{t))dt + Ре~рТ>)
(29)
Параметр р > 0 коэффициент дисконтирования.
Теорема 4. Предположим, что (х0(<),7г0(*),с°(£)) является экстремумом задачи (27)-(29), тогда существуют
(30)
с G L2(Q,F,P), 0 < А € П;Ф(и, 0 £ Lb[BF],tp{uj,t) G L^BF],
такие, что
((a - г)7г°(*)х°(0 + гx°(t) - c°(i))v(<) + (l/2)x°(i)7r°(i)<7A(w, *"(«), c°(i), t)-
4V(0 + Ae-"^(c°(t)) - £) = 0, P - пл., i 6 [0, T|
(31)
max{((a - r)jrx°(i) + rx°(t) - с)фЦ) + (l/2)x°(t)irah(u], тг, с, t)+ c>o.* (32)
+<p(t) + \e-e<(U(c) - £)} = 0, P - n.H., te[0,T]
15
(а - r)x°(t)i¡>{t) + ax°(t)h(t) = О, P - п.н., t £ [O, TJ (33)
m) = -(((« - r)At) + rMO + + h(t)dW(t),
ép{t) = Ape"^(t/(c°(t)) - f )dt+ r»(t)<ñV(í) 1 '
W = y(T) = 0 (35)
A +> O (36)
Заключение.
Разработаны методы приближенного и точного решений задач оптимального управления при наличии смешанных и фазовых ограничений для линейных структур на примере моделей международной торговли. Предложены методы решения задач оптимального управления описываемых стохастическими дифференциальными уравнениями на примере модели спроса на импортные товары. В процессе проведения теоретических и практических исследований получены следующие основные результаты.
1. Предложены различные методы параметризации детерминированных моделей с фазовыми и смешанными ограничениями с целью получения решения методом продолжения по параметру.
2. Предложен метод предварительной оценки геометрии оптимальной траектории с помощью системы "Баланс-2".
3. Предложена динамическая модель двухсекторной экономики.
4. Предложена динамическая модель международной торговли. Установлено свойство данной модели: существуют траектории развития экономики при которых страна с более высокими темпами технологического роста, хотя бы в одной из отраслей, обладает сравнительным преимуществом и поэтому будет экспортировать продукт, для производства которого необходим фактор, используемый интенсивно.
5. Предложена динамическая модель спроса на импортные товары в условиях ценовой неопределенности. При дополнительных предположениях задача эквивалентна задаче управления ценными бумагами (Мертон).
6. Разработан метод для качественного исследования задачи определения спроса на импортные товары на основе необходимых условий оптимальности. Метод допускает дальнейшее обобщение для более широкого класса задач.
Приведенные примеры расчета показали эффективность разработанной методики.
Список литературы.
1. Центральный Банк РФ. Платежный баланс РФ, 1994-2003.
2. Аркин В., Саксонов М. Необходимые УСЛОВИЯ оптимальности в задачах управления стохастическими дифференциальными уравнениями. Докл. АН СССР, 1979.ТОМ 244, номер 1, стр.11-15.
3. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.В. Необходимое условие в принципе максимума. М.: Наука, 1990.
4. Вержбицкий В.М. Численные методы. Линейная алгебра и нелинейные уравнения. М.: Высшая школа, 2000.
5. Вержбицкий В.М. Численные методы. Математический анализ и обыкновенные дифференциальные уравнения. М.: Высшая школа, 2001.
6. Дикусар В.В., Кошька М., Фигура А. Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями. МФТИ, 2001.
7. Иванилов Ю.П., Лотов А.В. Математические модели в экономике. М.: Наука, 1979.
8. Колмогоров А.Н., Фомин СВ. Элементы теории функций и функционального анализа. М.: Наука, 1976.
9. Моисеев Н.Н. Математические задачи системного анализа. М.: Наука, 1981.
10. Тихонов А.Н., Васильева А.Б., Свешников А Г. Дифференциальные уравнения. М.: Наука, 1985.
11. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.
12. Appelbaum E., Kohli U. Import Price Uncertainty and the Distribution of Income. The Review of Economics and Statistics, Volume 79, Issue 4 (Nov., 1997), 620-630.
13 Bond E.W., Trask K., Ping Wang. Factor Accumulation and Trade: dynamic comparative advantage with endogenous human capital. Working Paper No.00-W31R, Vanderbuilt University,(Dec.,2001).
14. Bowen H.P., Hollander A., Viaene J.-M.A.R.G. Applied International Trade Analysis. North America, Macmillan Press Ltd., 1998.
15. Grossman G.M., Helpman E. Product Development and International Trade, The Journal of Political Economy, Volume 97, Issue 6 (Dec-,
1989), 1261-1283.
16. Grossman G.M., Helpman E. Comparative Advantage and Long-Run Growth, The American Economic Review, Volume 80, Issue 4 (Sep.,
1990), 796-815.
17. Merton R. Lifetime Portfolio Selection- under Uncertainty: The Continuous-Time Case. The Review of Economics and Statistics, Volume 51, Issue 3 (Aug., 1969), 247-257.
18. Merton R. An Asymptotic Theory of Growth Under Uncertainty. The Review of Economic Studies, Volume 42, Issue 3 (Jul., 1975), 375-393.
19. Sethi S. Optimal Consumption and Investment with Bankruptcy. Kluwer Academic Publishers, 1997.
20: Young A. Learning by Doing and the Dynamic Effects of International Trade, The Quarterly Journal of Economics, Volume 106, Issue 2 (May,
1991), 369-405.
По теме диссертации опубликованы следующие работы:
1. Molderov O.A. A variation on stochastic maximum, principle for optimal control problems, Solving of Linear Systems in Proceedings of ISA Dynamics of Xon-Homogeneous Systems, Volume 6 (2002), 15-42.
2. Дикусар В.В., Мольдеров О.А. Изменение факторов производства в двухсекторной модели с экзогенным ростом и международная торговля. //Applications of the "Matliematica" system to social processes and mathematical physics. Proceedings of the international workshop. Brest. 3-6 June 2003. С 44-63.
3. Дикусар В.В., Мольдеров О.А., Сарнецка В. Модель спроса на импортные товары, используемые в производстве в условиях ценовой неопределенности. //Applications of the "Mathematica"system to social processes and mathematical physics. Proceedings of the international workshop. Brest, 3-6 June 2003. С 64-77.
Мальдеров Олег Анатольевич
РАЗРАБОТКА МЕТОДИКИ РЕШЕНИЯ ЗАДАЧ С ФАЗОВЫМИ И СМЕШАННЫМИ ОГРАНИЧЕНИЯМИ
Изо- лиц. №040060 от21.08.96. Подписано в печать Формат 60x90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 1,0 Тираж 60 экз. Заказ Л»
Московский физико-технический институт (государственный университет) Отдел автоматизированных издательских систем "ФИЗТЕХ-ПОЛИГРАФ" 141700, Московская обл., г. Долгопрудный, Институтский пер., 9
Р- 89 83
Оглавление автор диссертации — кандидата физико-математических наук Мольдеров, Олег Анатольевич
Введение
I. Модель двухсекторной экономики и международная торговля
1.1. Постановка задачи.•.
1.2. Исследование задачи Аг без учета ограничений (1.1.4), (1.1.5)
1.3. Отклонение от совершенной конкуренции
1.4. Активное смешанное ограничение.
1.5. Приближенное решенение задачи
1.6. Вырожденный случай принципа максимума или совершенная конкуренция в двухсекторной модели.
1.6.1. Цены на факторы производства и их использование
1.6.2. Цены на факторы производства и цены на товары . 33 1.6.3 Производственная функция Кобба-Дугласа.
1.6.4. Изменения предложения факторов производства и цен выпуска.
1.6.5. Определение спроса.
1.6.6. Определение автономной цены.
1.6.7. Автономность и равновесие на мировом рынке
1.6.8. Теорема изобилия производственных факторов
1.7. Теорема о влиянии экономического роста на торговлю . 42 Заключение.
II. Численные методы решения систем линейных уравнений, методы оценки решений в некорректных задачах линейного программирования и методы продолжения решений по параметру
2.1. Системы линейных уравнений. Прямые и итерационные методы решения.
2.2. Обусловленность линейных алгебраических систем.
2.3. Метод продолжения по параметру для решения систем линейных уравнений.
2.3.1. Метод продолжения для решения линейных систем
2.3.2. Расширения метода продолжения.
2.4. Методы оценки решений в некорректных задачах линейного программирования.
2.4.1. Регуляризация неустойчивых задач.
2.4.2. Обобщенная задача линейного программирования
2.5. Методы продолжения решений по параметру.
2.5.1. Теорема о неявной функции и продолжение решений по параметру.
2.5.2. Метод выбора наилучшего параметра продолжения решения.
2.5.3. Непрерывный аналог метода Ньютона.
III. Численные методы и расчеты
3.1. Численные расчеты для задачи Ai.
3.2. Численные методы для решения обыкновенных дифференциальных уравнений.
IV. Модель спроса на импортные товары, используемые в производстве в условиях ценовой неопределенности
4.1. Теоретическая постановка
4.2. Упрощение задачи (4.1.3.)-(4.1.7.) и задача оптимального управления портфелем ценных бумаг.
V. Необходимые условия оптимальности в задачах управле ния стохастическими дифференциальными уравнениями
5.1. Постановка задачи.
5.2. Необходимые условия оптимальности.
5.3. Присоединенные процессы.
5.4. Теорема об альтернативе.
5.5. Уравнение Эйлера и обратная замена переменных
5.6. Обратные стохастические дифференциальные уравнения
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Мольдеров, Олег Анатольевич
Задачи оптимального управления с фазовыми и смешанными ограничениями наиболее адекватно отражают свойства детерминируемого управляемого объекта. Большую роль при проектировании систем управления играют программные траектории. Наиболее известными методами решения подобных задач являются: прямые методы (спуск в пространстве управлений); метод вариации фазовых переменных; метод штрафных функций; принцип максимума. В вычислительном плане наиболее точные результаты получаются с использованием принципа максимума. Однако применение принципа максимума требует решения принципиальных проблем, которые могут быть успешно преодолены по мере накопления опыта решения конкретных задач оптимального управления. Указанное обстоятельство связано с одной стороны со сложной формулировкой принципа максимума для задач оптимального управления с фазовыми и смешанными ограничениями. Сложность математического аппарата не позволяет надеяться в ближайшее время на упрощение формулировки принципа максимума. С другой стороны известно, что принцип максимума редуцирует исходную постановку задач к краевой задаче для обыкновенных дифференциальных уравнений, причем в таких задачах существуют дополнительные алгебраические связи типа равенств и неравенств. В свою очередь краевая задача требует решение трех основных проблем: задача Коши для обыкновенных дифференциальных уравнений; решение в каждой расчетной точке t задач нелинейного программирования; поиск нулей трансцендентных функций [6].
Задачи оптимального управления с фазовыми и смешанными ограничениями для систем описываемых стохастическими дифференциальными уравнениями являются некоторым обобщением своего детерминированного аналога. Необходимость моделирования с помощью стохастических дифференциальных уравнений связана со сложностью практических задач. Данный класс требует разработку существенно новых методик их решения.
Модель международной торговли с промышленным ростом, кроме того, что имеют большую практическую значимость, содержит два вышеприведенных класса задач. В детерминированном случае возникает необходимость исследования момента схода с ограничения типа неравенств, т.е. определение геометрии оптимальной траектории или другими словами множества активных индексов для ограничений типа неравенств. В стохастическом варианте возникает необходимость использования метода динамического программирования Беллмана или схемы Дубовицкого-Милютина.
В Главе I диссертации предлагаются методики на базе принципа максимума для анализа задач оптимального управления со смешанными и фазовыми ограничениями применительно к модели международной торговли.
Модель международной торговли строится на основе модели двухсек-торной экономики с экзогенным ростом. Данное исследование пренебрегает влиянием структуры торговли на темпы роста и сосредотачивается на том, как экономический рост и накопление факторов производства влияют на торговлю. Модель является одним из вариантов обобщения широко известной модели Хэкшера-Олина и предполагает, что могут быть неравновесные решения. Неравновесные решения в частности позволяют объяснить отклонения реальных наблюдений от свойств модели Хэкшера-Олина.
В современной экономической теории по динамике внешней торговли доминируют исследования, где экономический рост является эндогенной переменной [20]. Расчеты экономического роста для большего ряда стран обычно показывают, что вклад отношения капитала к труда составляет менее половины экономического роста за прошедшие пятьдесят лет. Хотя эконометрические попытки объяснить остаток для роста не увенчались успехов, здравый смысл все уже указывает на его основную причину технологические усовершенствования. Экономисты склоняются к мнению Пола Ромера, полное понимание роста в долгосрочном периоде требует оценку экономических детерминант накопления знаний. Поэтому внимание было сосредоточено на введение эндогенного роста в модели международной торговли. Наибольших успехов в данной области добились американские экономисты Хэлпмэн и Гроссмэн (Helpman,Grossman) [15], [16]. Однако накопление факторов производства нашло отражение только в работе Бонда и Траска (Eric W.Bond, Kathleen Trask) [13]. Неопределенность спроса на экспортируемые товары в работах не рассматривалась. Одним из объяснений данного положения является сложность математического аппарата используемого для описания как стохастических, так и детерминированных динамических моделей. Кроме того, поскольку инициаторами моделей международной торговли являются экономисты, то они ограничиваются рассмотрением, как правило, только равновесных случаев.
В диссертации исследуются возможности повышения уровня адекватности моделей международной торговли, возникающей в связи с необходимостью объяснения новых экономических явлений. С другой стороны исследуется математическая сложность полученных моделей, методы аналитического и численного анализа.
В диссертации модель двухсекторной экономики описывается следующим образом. В каждой из отраслей известны стратегии других, т.е. при решении задачи оптимального управления для одной из отраслей фиксируются состояния других. Отрасли максимизируют текущую стоимость будущих доходов : о динамика факторов производства и развитие технологии в % -м (г = 1,2) секторе задаются уравнениями т
1)
Li = mLb Li(0) = Ll
Аг=дгА>, = (2) к = Sifi(ki) - (щ + 9i + щ)кг, ki(0) = fc?•
На политику найма и на политику накопления капитала введены ограничения. В отрасли не может быть дополнительно занято и дополнительно сокращенно более определенного числа рабочих мест.
Tli £ ['Т-гтшп) Tlimax\ j S{ G \Simini $гтах\ (3)
Предполагается, что поток потребления не может быть меньше некоторого минимального значения 2 cL° < Si)Li,Г{{к{) (4) i=l
В системе есть естественное ограничение на трудовые ресурсы
L0 < Lx + L2 < L1 (5)
В модели приведены следующие обозначения: р^ - стоимость продукции, qi = AiLifi(ki) - выпуск, AiWi - зарплата, г* - процентная ставка, Li -занятость, Ki - капитал, р - дисконт фактор, щ- темп роста занятости, gi- темп технологического роста, Sj - темп сбережения, fi(k{)- неоклассическая производственная функция, ki = Ki/AiLi - отношение капитала к эффективному труду, с - совокупное промышленное потребление, at-коэффициент замещения продуктом г прочих продуктов. В задаче оптимального управления (1)-(5): щ, Si - переменные управления, L,-, ki -фазовые переменные, (4) - смешанное ограничение, (5) - фазовое ограничение.
В приведенной постановке задача Аг является достаточно сложной для анализа необходимых условий на базе схемы Дубовицкого-Милютина.
Модель международной торговли состоит в совместном решении систем (1)-(5) для двух различных стран, при условия заданной функции спроса на товары. Устанавливается, что система допускает решение в виде траектории экономического роста. В предположениях классической теоремы Хэкшера-Олина [14], при условии отсутствия безработицы и минимальном потоке потребления, справедлива следующая теорема. Теорема 1. Существуют траектории развития экономики при которых страна с более высокими темпами технологического роста gi, хотя бы в одной из отраслей, обладает сравнительным преимуществом и поэтому будет экспортировать продукт, для производства которого необходим фактор, используемый интенсивно.
Для дальнейшего исследования задачи удобно переписать ее, записав динамику роста не для ki = Ki/AiLi, а для kf = К{/Л{. Таким образом, получаем видоизмененную задачу т
NPVi = У (;PiAiFi{kf, U) - AiWiU - riAikf)e-p{i)dt max (1') о
Li = mLi, Li{ 0) = L?,
Ai = giAi, = (2') kf = SiFi(kf, Li) - (9i + ^)kf, kf(0) = kf.
Tli £ \P'iTnini1rl'imax\i £ [Simim ^imax] (3 ) 2 cL° Si) Fi(kf, Li) (4') i=l
L° < Li + L2 < L1 (5')
Далее предлагается следущая методика. В качестве первого приближения вместо задачи А*2 рассмотрим следующую задачу Ai в каноническом виде
Ni(T) max (6)
Li = Vi, Li{0) = Ll
Ai=9iAu Ai(0) = Al kf = Щ- (9i + kf(0) = kf°, 1 ;
Ni = (PuLi + 7 ukf)e-M Ni{ 0) = 0. при наличии ограничения (5) и f^iminLi fj 5; О, V{ Tiimax^i — О
SiminfciU + Siminl2ikf ~ Щ < О, Щ - Simax(32iLi ~ Simaxl2i^t ^ 0 (8) 2
Y^ ctii-fciLi - 72ikf + щ) < 0 (9) t=l
Линеаризация системы позволяет провести качественное и количественное исследование задачи с использованием пакета "Баланс-2". В задаче Ai сначала решается задача Понтрягина. Предпологается выполнение условий
Vi £ [ftrain.) ^imax]> ^t € \uimin, Uimax\
В этом случае легко определяется структура оптимального управления, что делает возможным найти оптимальную траекторию. Далее, после решения задачи Понтрягина начинаем учитывать фазовые и смешанные ограничения. Наличие фазовых ограничений типа неравенств (5) приводит к усложнению вычислительных процедур, связанных с решением сопряженной системы. Структура сопряженной системы определяется геометрией оптимальной траектории. Под геометрией понимается число выходов на фазовые ограничения и их характер (тип контакта). Требует обоснования момент схода с фазового ограничения. В другой формулировке задача определения геометрии оптимальной траектории сводится к задаче определения множества активных индексов для ограничений типа неравенств.
В работе для предварительной оценки геометрии использовалась дискретная схема явного метода Эйлера для системы (7). Задача линейного программирования большой размерности решается с использованием пакета оптимизационных программ "Баланс-2"(Умнов А.Е., Шомполов И.Г.) [6].
Задача линейного программирования программирования может быть представлена в канонической форме. тах{с\х\ 4- С2Х2 + . + CnXn),
ЙЦХ1 + а\2Х2 + . + Gln^n = 61, а 21X1 + 022^2 + ••• + = &2> . amixi + ат2х2 + . + атпхп = Ьт, Х\ >0,Х2> 0,., хп > О. или в матричной записи тах(С,Х), ,
АХ = В,Х >0,Х £ Rn, В G Rm, A G Rmxn К }
В силу того, что ЭВМ оперирует лишь приближенными значениями параметров задачи, округляемыми в процессе счета, могут возникать проблемы связанные с устойчивостью задач линейного программирования. По сути дела происходит замена задачи тах(С,Х)1АХ > В, (12) некоторой задачей тах{С(5),Х), А{5)Х > В(8), (13) где относительно матрицы А(5) и векторов В(5), С(6) известно только то, что они в определенной степени близки к истинным значениям соответственно матрицы А и векторов В, С. Одно из определений устойчивости задачи линейного программирования имеет следующую формулировку [6].
Определение. Задачу (12) назовем устойчивой, если существует такое число <!>о > 0, что для всех <5, 0 < 5 < 5о задача (13) имеет решение. Другими словами, задача устойчива, если она имеет решение, а также имеет решение любая задача, получающаяся из нее небольшими изменениями параметров.
В Главе II излагаются методы для регуляризации неустойчивых задач линейного программирования, оценки решения и вопросы создания алгоритмов для решения линейных систем достаточно общего вида.
Решение задачи Ai используется в свою очередь как первое приближение для задачи Aj. В данном случае решение получалось методом продолжения решений по параметрам rji 6 [0,1]:
14)
15)
Li = vit Li{ 0) = Z°,
А = gtAi, A-{0) = Al kf = щ- (9i + kf{0) = kf,
Nt = Vi?i + (1 - mWuLi + 7likf)e~M iVj(O) = 0. рде Т{ = {PiAiFi(kf, Ь{) - AiWiLi - пА{к?)е~М. При наличии ограничения (5) и
HiminLi Vi ^ 0, Vi TlimaxLi ^ 0 rjiSiminF^kf, Li) + (1 - r}i)Simin(p2iLi + 72ikf) - щ < 0, Щ - riiSimaxFi(kf, Li) - (1 - r)i)Simax{02iLi + 72ikf) < 0 2 aii-riiFiikf, Li) - (1 - г?+ 72ikf) + щ) < 0 (16) i
Теорема 2. Продолжение решений по параметрам в задаче существует и единственно и не зависит от выбора очередности продолжения по параметру.
В Главе II также излагается метод продолжения по параметру как для решения систем линейных уравнений, так и подход для продолжения в общем виде. Основой метода продолжения по параметру является теорема о неявной функции [8].
При Q е Rl, X Е FC1, теорема о неявной функции определяет в некоторой окрестности B(xQ,qo) точки (хо,до) единственную кривую, которая имеет следующее параметрическое представление: х = x(q),x(q0) = х0 (17)
Для получения решения xi при qi близкому к <?о> необходимо продвинуться вдоль этой кривой, оставаясь внутри B(xo,qo). Если условия теоремы о неявной функции выполнены в окрестности точки (ari,gi), то решение можно снова продолжить и так далее.
В Главе III описываются вычислительные методы продолжения решения по параметру, приводится описание методов решения и полученные результаты для задач Ai и А*2.
Численное наблюдение тех или иных свойств системы требует "правильный" выбор начальных значений и параметров. С этой целью использовались свойства аналитического решения задачи Ai.
Эффективность численных методов по отношению к параметрам системы (7) проверялась на задаче Понтрягина, поскольку она позволяет получить достаточно простое аналитическое решение. Аналитическое решение и решение полученное с помощью пакета "Баланс-2" оказались близкими, за исключением краевых эффектов. Дискретизация задачи проводилась методом Эйлера, задача рассматривалась на интервалах t е [0,100] и t € [0,200] с шагом дискретизации At = 1. Далее проводились численные эксперементы с учетом смешанных ограничений (8), (9) и фазового ограничения (5) с использованием пакета "Баланс-2". В одном из тестов в ограничении (9) параметры а* зависели от времени и экспоненциально затухали. Геометрия полученных решений согласуется с принципом максимума. Результаты расчетов и графики представлены в Приложении.
В следующей главе диссертации изучается моделирование спроса в международной торговле с использованием стохастических дифференциальных уравнений. Ценовая неопределенность импортных товаров моделируется винеровским процессом. Приводится постановка задачи для неоклассической и линейной производственной функции с импортными товарами в качестве факторов производства [12]. Решение задачи с линейной производственной функцией при дополнительном предположении сводится к задаче выбора оптимального портфеля и потребления инвестором в непрерывном времени, доход которого формируется на основе доходов по акциям [19]. В общем случае, с неоклассической производственной функцией решение получить затруднительно, функция цены в уравнении Бел-лмана зависит от нескольких фазовых переменных и, следовательно, это уравнение в частных производных.
Рассматривается экономика, выпуск, которой задается агрегированной производственной функцией: где y агрегированный совокупный выпуск, хт объем импортируемых неэнергетических продуктов, хе объем импортируемых энергетических продуктов (например, нефть), х\ трудовые ресурсы, Хк капитал. Предполагается, что производственная функция /(•) непрерывная, неубывающая, линейно-однородная, и квази-выпуклая.
Неопределенность в задаче может возникать из-за цен выпуска, цен на факторы производства и цен импортных товаров, используемых в производстве. Предположим, что цены энергетических и неэнергетических товаров, qe и qm, соответственно, не известны, когда делаются производственные решения. С другой стороны, цена выпуска р, затраты на единицу труда и капитала Wk и wi, и технология, известны. Цены импорта описываются следующими стохастическими дифференциальными уравнениями.
Предположим, также, что все доходы от продажи произведенной продукции, за вычетом текущего потребления, снова вкладываются в производство. Тогда благосостояние производителя описывается следующим уравнением: y — /(з?гп)
18)
Щ = aidt + aidWt, i m, e
19) где c(t) - текущее потребление.
Z = pf(xm, хе, xi, xit) — qmxm — qexe — wixi — WkXk (21)
T0 = inf{t > 0 : Z{t) = 0} (22)
Управление производством может быть найдено из решения задачи максимизации ожидаемой дисконтированной функции полезности:
То
4т(.),хе( ),с( ) = J U(c)e~ptdt + Ре~рт°) (23) о при (20), (21), (22) и (24) c(t) > s > 0 (24) где [/(•) строго возрастающая, строго выпуклая непрерывно дифференцируемая функция полезности на (s,oo), продолжим данную функцию на [5,00), полагая U(s) = limf/(c) и U'(s) = limU'(c). Также предс—>s c—ts полагаем, что функция полезности сублинейна, т.е. lim U'(c) = 0 и с->оо pU(0) < Р < j lim U(с). Определим функцию цены:
I*{Ztqmtqe)= sup I(Z,qm,qe) (25)
Пусть {Wt,Ft,t > 0} винеровский процесс на вероятностном пространстве (Q,F,P), где {Ft,t > 0} неубывающее, непрерывное справа семейство сг-алгебр. Будем считать, что винеровские процессы W^ и W\ не коррелируют между собой, т.е. E(dW^ndW^) = 0. Процесс потребления (Ct, t > 0) называется допустимым, если он неотрицателен и прогрессивно измерим относительно потока сг-алгебр {Ft}, и который удовлетворяет t следующему условию f csds < 00, t > 0. Для каждого прогрессивно измео римого относительно потока {FJ процесса {xj, t > 0}, момент остановки определяется из условия: t
Т(х) = sup{£ >0: ^2 ahix2ids < q i=m,e 16
Теорема 3. Пусть I(Z, qm, qe) строго выпуклая по Z, дважды непрерывно дифференцируемая функция на [0, со), удовлетворяющая уравнению Беллмана pi = max {(—<ymqmxm — aeqexe - c)I'z + amqml'qm c>s,Z=pf(xm,xe)—qmxTn—qexe aeqeI'qe + \Ш1х1 + alqlxl)V'z + R^™ + Hq2J'U + U(c)}
26)
Если уравнение (20) имеет сильное решение для хт = xm(Zyqm,qe), хе = xe{Z,qe,qm), с = c(Z,qm,qe) на [0,То], где хт, хе, с - решение опти
Ч ( мизационной задачи в правой части (26), тогда I(Z, qm, qe) = I*(Z, gm, qe), Z>0.
При дополнительных предположениях задача становится аналогичной выбору инвестором оптимального портфеля и потребления с одной безрисковой и одной рисковой акцией. Она имеет решение, его можно найти, решая уравнение Беллмана [19]. Некоторые свойства решения удобно получить из необходимых условий оптимальности [2].
Последняя глава диссертации посвящена примеру использования необходимых условий оптимальности для исследования свойств решения задачи инвестирования, которая получается переформулировкой задачи спроса на импортные товары.
Инвестор может выбирать темп потребления с(£) и управление инвестициями 7г(t), где 7г(г) = i^fE.—Qe)Xe обозначает часть капитала влоZ женного в рисковую ценную бумагу. Оставшаяся часть капитала, 7Го(£) = 1 — ir(t) вкладывается в безрисковую ценную бумагу. Управление 7г(£) не ограничено, что подразумевает неограниченную покупку и продажу; c(t) должна быть неотрицательна.
Для данных 7r(t) и c(t), капитал x(t) = Z(t) инвестора описывается стохастическим дифференциальным уравнением Ито dx{t) = (a-r)n{t)x{t)dt+(rx{t)-c(t))dt+x(t)7r{t)adW(t),x{0) = х (27) где г = а^, ос = а*, а = а*, остальные обозначения из предыдущей задачи. По определению
Г0 = inf{f > 0 : x{t) = 0}. (28)
Инвестор стремится выбрать c(t) и 7r(t) так, чтобы максимизировать цену
То
У = Ех( J e~ptU (c(t))dt + Ре~рт°) (29) о
Параметр р > 0 коэффициент дисконтирования.
Теорема 4. Предположим, что (xc(t),7r°(t),c°(t)) является экстремумом задачи (27)-(29), тогда существуют е G ь2(П, Р, Р), о < Л € Я; ^(w,«) € L2c[BF], <р(и, t) G L2c[BF], г) е l22[bf], n(cj, t) g " 1 ; такие, что а - r)<n-0{t)x°(t)+rx°(t) - c°(t))iP(t) + (l/2)x0(<)7r0(0^(a;,7r0(t),c0(t),t) + +¥>(*) + Xe~pi(U(c°(t)) - f) = 0, P - п.н., t G [0, T]
31) max{((a - г)ттх°(*) + rx°(i) - c)ip{t) + (l/2)x°(t)irah(u, тг, с, t)+
32)
V(t) + \e-#{U(c) - £)} = 0, P - п.н., t e [0, T] a - r)x0(t)i/>(t) + ax°(t)h{t) = 0, P - п.н., £ G [0, T] (33) cty(i) = -(((* - »V(*) + r)ip(t) + a7r°(t)/»(t))df + h{t)dW{t), d<p(t) = Xpe~pt(U{c°(t)) - fjdt + n(t)dW(t) [ } ф(т) = V(T) = 0 (35)
Л + | > 0 (36)
Список литературы. 1. Центральный Банк РФ. Платежный баланс РФ, 1994-2003.
2. Аркин В., Саксонов М. Необходимые условия оптимальности в задачах управления стохастическими дифференциальными уравнениями. Докл. АН СССР, 1979.том 244, номер 1, стр.11-15.
3. Афанасьев А.П., Дикусар В.В., Милютин АА., Чуканов С.В. Необходимое условие в принципе максимума. М.: Наука, 1990.
4. Вержбицкий В.М. Численные методы. Линейная алгебра и нелинейные уравнения. М.: Высшая школа, 2000.
5. Вержбицкий В.М. Численные методы. Математический анализ и обыкновенные дифференциальные уравнения. М.: Высшая школа, 2001.
6. Дикусар В.В., Кошька М., Фигура А. Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями. МФТИ, 2001.
7. Иванилов Ю.П., Лотов А.В. Математические модели в экономике. М.: Наука, 1979.
8. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1976.
9. Моисеев Н.Н. Математические задачи системного анализа. М.: Наука, 1981.
10. Тихонов А.Н., Васильева А.Б., Свешников А.Г. Дифференциальные уравнения. М.: Наука, 1985.
11. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.
12. Appelbaum Е., Kohli U. Import Price Uncertainty and the Distribution of Income. The Review of Economics and Statistics, Volume 79, Issue 4 (Nov., 1997), 620-630.
13. Bond E.W., Trask K., Ping Wang. Factor Accumulation and Trade: dynamic comparative advantage with endogenous human capital. Working Paper No.00-W31R, Vanderbuilt University,(Dec.,2001).
14. Bowen H.P., Hollander A., Viaene J.-M.A.R.G. Applied International Trade Analysis. North America, Macmillan Press Ltd., 1998.
15. Grossman G.M., Helpman E. Product Development and International Trade, The Journal of Political Economy, Volume 97, Issue 6 (Dec.,
1989), 1261-1283.
• 16. Grossman G.M., Helpman E. Comparative Advantage and Long-Run Growth, The American Economic Review, Volume 80, Issue 4 (Sep.,
1990), 796-815.
17. Merton R. Lifetime Portfolio Selection under Uncertainty: The Continuous-Time Case. The Review of Economics and Statistics, Volume 51, Issue 3 (Aug., 1969), 247-257.
18. Merton R. An Asymptotic Theory of Growth Under Uncertainty. The Review of Economic Studies, Volume 42, Issue 3 (Jul., 1975), 375-393.
19. Sethi S. Optimal Consumption and Investment with Bankruptcy. Kluwer Academic Publishers, 1997.
20. Young A. Learning by Doing and the Dynamic Effects of International Trade, The Quarterly Journal of Economics, Volume 106, Issue 2 (May, 1991), 369-405.
I. Модель двухсекторной экономики и международная торговля
1.1. Постановка задачи.
Рассматриваются два основных фактора производства, труд и капитал. Количество занятых в производстве определяется политикой найма трудовых ресурсов. Капитал образуется в результате производства и его накопление определяется политикой в отрасли. Как на политику найма, так и на политику накопления капитала введены ограничения. В отрасли не может быть дополнительно занято и дополнительно сокращенно более определенного числа рабочих мест.
Отрасли максимизируют текущую стоимость будущих доходов : г
NPVi = J (piQi ~ AmLi - nKi)e-p{t)dt => max (1.1.1) о динамика факторов производства и развитие технологии в i -м (г = 1,2) секторе задаются уравнениями
U = riiLi, Li{ 0) = Ll
Ai = giAi, Ai{0) = Al (1.1.2) к = Sifi(ki) - (щ + gi + fj,i)ki, Ач(0) = tf.
На политику найма и на политику накопления капитала введены ограничения. В отрасли не может быть дополнительно занято и дополнительно сокращенно более определенного числа рабочих мест. n>i 6 [^zmm > ^гтох] » ^г ^ [Simini ^гтах] (1.1.3)
Предполагается, что поток потребления не может быть меньше некоторого минимального значения 2 cL° < - 8i)Lifi{ki) (1.1.4) i=i
В системе есть естественное ограничение на трудовые ресурсы
L° < L1 + L2 < L1 (1.1.5)
В модели приведены следующие обозначения: pi - стоимость продукции, qi = AiLifi(ki) - выпуск, A\Wi - зарплата, Г{ - процентная ставка, L{ -занятость, Ki - капитал, р - дисконт фактор, щ- темп роста занятости, gi- темп технологического роста, Sj - темп сбережения, fi(ki)- неоклассическая производственная функция, ki = Ki/AiLi - отношение капитала к эффективному труду, с - совокупное промышленное потребление, а;-коэффициент замещения продуктом i прочих продуктов. В задаче оптимального управления (1.1.1)-(1.1.5): щ, S{ - переменные управления, Lt-, ki - фазовые переменные, (1.1.4) - смешанное ограничение, (1.1.5) - фазовое ограничение.
Стоит отметить взаимосвязь между функцией производства Fj(Kj, AjLj) и производственной функцией fi(ki). Предполагается, что функции производства в отраслях удовлетворяют следующим свойствам:
1) Для производства необходим каждый из факторов: Fj( 0, AjLj) = Fj{Kj, 0) = 0, j = 1,2
2) Линейная однородность: для 7 > 0,
FjfrKj, 7 AjLj) = 7 Fj(Kj, AjLj) = <yqj, j = 1,2
3) Функции предельного продукта относительно факторов производства положительны, но убывающие: dFj(Kj,AjLj) dFj(Kj, AjLj) dKj d(AjLj)
92Fj(Kj, AjLj) d2Fj(Kj,AjLj) dKj д {AjLj)2
Учитывая свойства функции производства, искомая связь имеет следующий вид:
Fj(Kj,AjLj) = AjLjfj(kj), где fj(kj) - производственная функция отношения капитала к эффективному труду.
Задача А2 является достаточно сложной для анализа необходимых условий на базе схемы Дубовицкого-Милютина. Перепишем задачу А2 в виде удобном ддя ее исследования с использованием приближенных методов.
Запишем динамику роста не для к{ = Ki/AiLi, а для kf = Ki/Ai. Таким образом, получаем видоизмененную задачу эквивалентную А 2 т
NPVi = j СPiAiFi{kf, Li) - AiWiLi - nAikf)e-p{t)dt =» max (1.1.1') о
Li = niLh Li{ 0) = Ll
Ai = 9iAi, M 0) = Al (1.1.2') kf = SiFi(kf, Li) - (9i + fn)kf, kf(0) = kf.
Tli £ \p>imin»Щтпах] > £ t^immi ^imax] (1.1.3) 2
CL° < J] - bi) (1.1.4') i=l
L° <Li + L2< Ll (1.1.5')
Заключение диссертация на тему "Разработка методики решения задач с фазовыми и смешанными ограничениями"
Заключение.
Предложенная модель двухсекторной экономики дает описание большего числа возможных случаев, от перехода к совершенной конкуренции до неравновесной динамики. Это позволяет изучать зависимость между изменением факторов производства и торговлей. Включение в модель минимального уровня потребления, ограничений на изменение занятости и сбережений, изменение технологий показывает, как направление экспорта-импорта может меняться с течением времени. На примере случая совершенной конкуренции показано, как из двухсекторной модели можно получить свойства международной торговли. Такого рода анализ, в частности, применим для случая отклонения от равновесия в двухотра-слевой модели.
В общем случае возникает необходимость в использовании численных методов. Предварительный анализ с помощью принципа максимума может оказать существенную помощь в выборе того или иного численного алгоритма.
Библиография Мольдеров, Олег Анатольевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.В. Необходимое условие в принципе максимума. М.: Наука, 1990.
2. Иванилов Ю.П., Лотов А.В. Математические модели в экономике. М.: Наука, 1979.
3. Моисеев Н.Н. Математические задачи системного анализа. М.: Наука, 1981.
4. Тихонов А.Н., Васильева А.Б., Свешников А.Г. Дифференциальные уравнения. М.: Наука, 1985.
5. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.
6. Bowen Н.Р., Hollander A., Viaene J.-M.A.R.G. Applied International Trade Analysis. North America, Macmillan Press Ltd., 1998.
7. Grossman G.M., Helpman E. Product Development and International Trade, The Journal of Political Economy, Volume 97, Issue 6 (Dec., 1989), 1261-1283.
8. Системы линейных уравнений. Прямые и итерационные методы решения.
9. Изучается вопрос о численном решении систем вида ацХ1 + а 12X2 + . + ainxn = 61,
10. Обусловленность линейных алгебраическихсистем .
11. Рассматривается линейная алгебраическая система с квадратной невырожденной матрицей А1. Ах = 6, 2.2.1
12. Метод продолжения по параметру для решения систем линейных уравнений .
13. Принцип продолжения состоит в нахождении решения уравненияф(х)=ф{х), хеЕ, (2.3.1)определенного в банаховом пространстве Е, путем погружения его в семейство уравнений, зависящих от параметра а:х,а) = ф{х), (2.3.2)а(Е0,1., /(х,1 ) = ф{х).
14. Далее строится задача Коши dx= F{a), ае0,1., х(0) = х0,где х(а) решение уравнения (2.3.2). Интегрирование полученного дифференциального уравнения дает искомое решение ж(1) уравнения (2.3.1)21.23.1. Метод продолжения для решения линейных систем.
15. Ниже описывается способ решения линейных систем вида1. Ах = Ь, (2.3.3)основанный на методе продолжения. Здесь А квадратная п х п невырожденная матрица.
16. Областью возможного применения метода являются задачи, в которых необходимо быстро получить грубую оценку решения. Если задача оказывается вырожденной, то метод продолжения дает грубую оценку псевдорешения.
17. В уравнении (2.3.2) зависимость х от а является нелинейной, и это сильно затрудняет оценку вычислительной погрешности. В связи с этим не была сформулированна соответствующая теорема о сходимости и о погрешности метода.
18. В качестве нормы будем использовать далее норму Чебышева:пх|| = max | ^ |, || А|| = max .Г | ai5 |.~ j=l
19. А + Л)х = b + ах, 6 > 0, 0 < а < 5. (2.3.4)
20. Пусть До; малая вариация параметра, а Дх - соответствующая ей вариация решения уравнения (2.3.4). Тогда имеем:
21. А + Л)(х + Дх) = b + (а + Да) (х + Дх), (А + Л) (х + Дх) = b + (а + Аа)х + (а + Да)Дх.
22. Выбрав подходящую последовательность {ог^^}д.0, получаем таким образом следующую вычислительную схему:х(°) = (А + Л)"1Ь;xW^A + tt^Ob + aWx^);
23. X(*+D = (А + Л)-1(Ъ + + a^jggfxW х^"1))),1 < к < К, <*(*> < а<к+1\ а<°) = 0, а<*> =523.7)
24. Можно рассматривать различные модификации метода в зависимости от выбора последовательности К примеру можно выбрать равномерную последовательность.
25. С целью уменьшения погрешности вычислений выдвигается гипотеза о том, что дополнительные вычисления, производимые на каждом шаге метода продолжения, могут улучшить точность полученного решения.
26. В качестве нулевого приближения у(°) мы берем из выражения23.7). На каждом шаге спуска вычисляется градиент1. Dy-b1. VF(y) = D:пу) '
27. Далее, мы делаем попытку продвижения в направлении (— v F) с целью уменьшения значения F(у):
28. Начальное значение параметра /? мы ищем из уравнения
29. F(y(/)) + (v^(y(0),y(i+1)-y(/)) = o, которое после подстановки принимает следующиц вид:
30. В части применения метода продолжения по параметру, можно привести следующее заключение:
31. Областью применимости метода являются задачи большой размерности, в которых допустима невысокая точность результатов.
32. Метод может быть полезен в решении плохо обусловленных систем, особенно если вероятность, что система вырождена.
33. При решении хорошо обусловленных задач небольшой размерности целесообразно использование метода Гаусса.
34. Методы оценки решений в некорректных задачах линейного программирования.
35. АХ = В,Х >0,Х Q R",В € Rm, A G Rmx
36. Если фиксированы матрица А и векторы В, С, то для любого <5 > О символ А(<5) будет означать, что А(6) некоторая матрица, принадлежащая 5-окрестности матрицы А, т.е.1. А(5)-А\\<8 (2.4.4)
37. Аналогично В(6), С(5) некоторые векторы, для которых выполнены соотношения1. В(*)-Я||<*, (2.4.5)1. С(5)-С\\<6. (2.4.6)
38. Задачу вида (2.4.3) будем называть возмущенной задачей, принадлежащей ^-окрестности задачи (2.4.2), если выполнены условия (2.4.4)-(2.4.6).
39. Пусть задача (2.4.2) устойчива и S > 0 таково, что возмущенная задача имеет решение Х*(5) € Х°(5).
40. Определение 2.4.2. Задача (2.4.2) называется устойчивой по функционалу, еслиа) она устойчива;б) для любого е > 0 существует такое 8 > 0, что как только выполнены условия (2.4.4)-(2.4.6), то | D(8) -D | < е.
41. Иначе можно сказать, что значение задачи (2.4.2) как функция D(A, В, С) ее параметров в этом случае непрерывно.
42. Рассмотрим стандартную задачу линейного программированиятах(С,Х), АХ<В, X > 0. (2.4.7)
43. Предположим, что данная задача неустойчива. Как следует из результатов работ 7., [12], это может происходить по двум причинам:1. не существует положительного вектора > 0, для которого < В\2. не существует положительного вектора Р° > 0, для которого АТро
44. С. В любом из этих случаев решение задачи (2.4.7) на ЭВМ может привести к результатам, сильно отличающимся от истиннных. Даже в тех случаях, когда задача (2.4.7) устойчива, этот факт часто нельзя установить по ее внешнему виду.
45. В рамках общей методологии регуляризации некорректных задач, принадлежащей А.Н. Тихонову, построены методы, позволяющие решать произвольную задачу линейного программирования с любой степенью точности безотносительно к тому, устойчива она или нет.
46. Кроме того, имеют место теоремы Теорема 2.4.1.(1, стр.285. Игщ-^о D{5) = D, где D значение задачи (2.4.2), D{5) - значение задачи (2.4.3).
47. В работе 9. предложен приближенный метод решения некорректных задач линейного программирования. Рассматривается задачатах{С, X),X G Rn, С > 0, С 6 Rn, АхХ = Ви (24Q) X >0,Ai> 0,Bi> 0, А\ G Rmxn, В\ G Rm ' ' }
48. Здесь В\ и С положительные вектора, А\ - положительная матрица (положительны ее компоненты).
49. Задача (2.4.9) записывается в форме, зависящей от скалярного параметра tmaxt, Л2Х = B2, (С, X) = t,
50. Задача (2.4.9), вообще говоря, может не иметь решения. В этом случае рассматривается обобщенная задача линейного программированияmaxt, А2У = А%В2, У > 0. (2.4.11)
51. Система (2.4.11) всегда совместна. Вместо задачи (2.4.11) можно рассматривать следующую задачуmaxt, ASZS = В, Z5> 0,
52. А5 = А + 6Е,А%А2 = А,В = А%В2. )
53. Известно, что lims-^oZs = Zq £ Y, где У множество решений задачи (2.4.11). Решение линейной системы (2.4.12) является линейной функцией параметра t
54. Z5 = Ci+ tC2, Си С2 6 Rn. (2.4.13)
55. Условие Z$ > 0 выделяет неравенство t\ < t < t2. Если решение не ограничено сверху, то t2 = оо.
56. Резюмируя, оценка решений сводится к решению некорректной линейной системы. Оценка решения (2.4.13) близка к точному решению, когда число свободных параметров задачи (2.4.12)невелико.
57. Методы продолжения решений по параметру.25.1. Теорема о неявной функции и продолжение решений попараметру.
58. Теорема о неявной функции 11. служит основой метода продолжения по параметру.
59. Теорема 2.5.1. Пусть Q, X, Z банаховы пространства, U - окрестность точки (go,xq) £ QxX и F - отображение U в Z, обладающее следующими свойствами:
60. F непрерывно в точке (<?о,£о)2. F{q0,x0) = O.
61. Частная производная Fx(q,x) существует в U и непрерывна в точке (<Zo,zo). а. оператор Fx(qQ,xo) имеет ограниченный обратный.
62. При Q е Rl, X е Яп, теорема о неявной функции определяет в некоторой окрестности B(xo,qo) точки (яо,до) единственную кривую, которая имеет следующее параметрическое представление:х = x(q),x(q0) = Xq (2.5.1.)
63. Для получения решения х\ при q\ близкому к до, необходимо продвинуться вдоль этой кривой, оставаясь внутри B(xo,qo). Если условия теоремы (2.5.1.) выполнены в окрестности точки (xi,<?i), то решение можно снова продолжить и так далее.
64. Приведем еще одну формулировку теоремы о неявной функции, которая наиболее часто используется в литературе по численным методам и которая является частным случаем теоремы (2.5.1.).
65. Рассматривается система из п нелинейных алгебраических или трансцендентных уравнений относительно п неизвестных х\,., хп и параметра q
66. F(x,q) =0, х е Rn, q€ R\ F <Е Rn. (2.5.2)
67. Пусть известно решение хо.до системы (2.5.2), то есть1. F{x0, q0) = О
68. Тогда в некоторой окрестности точки (хо, до) система уравнений (2.5.2) определяет х\,., х„ как однозначные функции q:х{ = Xj(g), i = 1,n; функции (2.5.4) удовлетворяют условиям25.4)хг0, * = l,n;
69. Указанные функции непрерывны и имеют непрерывные первые производные.
70. Точки, в которых detJ ф 0 (2.5.3) называются регулярными, а точки, в которых detJ = 0 особыми.
71. В особых точках продолжение решения может оказаться неоднозначным, то есть появляется ветвление кривой множества решений системы (3.1.2), если сохраняется возможность продолжения решений.
72. В дальнейшем предполагается, что решение (2.5.2) существует и единственно. При этом не исключается случай плохой обусловленности матрицы Якоби (2.5.3).
73. Вопросы применения численных алгоритмов в методах продолжения по параметру для решения нелинейных алгебраических или трансцендентных уравнений достаточно подробно исследованы в работе 32.
74. Xi(m) = Xi(m 1) - J~1(xi(m - 1), qi)f{xi(k - 1), д{), (2.5.5) m = 1,2,.,где J~1(xi(m— 1), qi) обратная матрица Якоби (2.5.3) при х = х»(т— 1), q = qux е Rn.
75. Итерационный процесс (2.5.5) проводится до выполнения условия ||xj(m) — Xi(m — 1)|| < £, где е > 0 заданная точность вычислений.
76. F(x) = 0, хе Rn+\ F : Rn+l Rn. (2.5.6)
77. В общем случае считается, что неизвестные в (2.5.6) зависят от некоторого параметра цх — x(/i). (2.5.7)
78. Продифференцировав (2.5.6) по ц, получим уравнение продолженияо, J = ^ J G Rn*n+1 (2.5.8)dfi ox
79. В окрестности точки х на кривой множества решений вводится параметр fi так, чтобы он отсчитывался вдоль оси, определенной единичным вектором a Е Rn+l, ||а|| = 1. Тогда в этой точкеdfi=(a,dx). (2.5.9)
80. С учетом (2.5.8), (2.5.9) уравнения продолжения запишем в форме1. Tdx л ( dx\
81. В этом случае параметр продолжения выбирается из условий наилучшей обусловленности системы (2.5.10).
82. Так как при q — qo известно решение х = хо, то это позволяет сформулировать задачу Коши для системы (2.5.12) при начальном условиих(?о) = ^о- (2.5.13)
83. Указанный подход позволяет использовать для построения решения х = x(q) задачи Коши (2.5.12), (2.5.13) различные численные методы интегрирования обыкновенных дифференциальных уравнений.1. Список литературы.
84. Ашманов С.А. Линейное программирование, М.: Наука, 1981.
85. Васильев Ф.П., Иваницкий А.Ю. Линейное программирование, М.: Факториал, 1998.
86. Вержбицкий В.М. Численные методы. Линейная алгебра и нелинейные уравнения. М.: Высшая школа, 2000.
87. Вержбицкий В.М. Численные методы. Математический анализ и обыкновенные дифференциальные уравнения. М.: Высшая школа, 2001.
88. Воеводин В.В. Матрицы и вычисления. М.: Наука, 1984.
89. Волков Е.А. Численные методы. М.: Наука, 1987.
90. Голиков А.И., Евтушенко Ю.Г. Отыскание нормальных решений в задачах линейного программирования, ЖВМ и МФ, 2000, т.40, № 12, с.1766-1786.
91. Дикусар В.В., Кошька М., Фигура А. Качественные и количественные методы в задачах оптимального управления с фазовыми и смешанными ограничениями. МФТИ, 2001.
92. Дикусар В.В. Обобщенная задача линейного программирования. Доклады РАН, том 348, № б, 1996, с. 1-3.
93. Калиткин Н.Н. Численные методы. М.: Наука, 1978.
94. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1976.
95. Сухарев А.Г., Тимохов А.В., Фёдоров В.В. Курс методов оптимизации. М.: Наука, 1986.
96. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир, 1989.
97. Шикин Е.В. Линейные пространства и отображения. М.: МГУ, 1987.
98. Bjorck A. Generalized and Sparse Least Squares Problems. In Algorithms for Continuous Optimization, pp. 37-80. E. Spedicato (ed.) Kluwer Academic Publishers, 1984.
99. Тихонов A.H., Леонов А.С., Ягола А.Г. Нелинейные некорректные задачи. М.: Наука, 1995.
100. Морозов В.А. Регулярные методы решения некорректно поставленных задач. М.: Наука, 1987.
101. Икрамов Х.Д. Численные методы для симметричных линейных систем. М.: Наука, 1988.
102. Charles Van Loan. A Survey of Matrix Computations Theory Center Technical Report 90-026. Cornell Theory Center. October, 1990.
103. Ильин В.П., Кузнецов Ю.И. Трехдиагональные матрицы и их приложения. М., Наука, 1985.
104. На Ц. Вычислительные методы решения прикладных граничных задач. М.: Мир, 1982.
105. Годунов С.К. Решение систем линейных уравнений. Новосибирск, Наука, 1980.
106. Райе Дж. Матричные вычисления и математическое обеспечение. М.: Мир, 1984.
107. Ficken F. The Continuation Method for Nonlinear Functional Equations //Comm. Pure Appl. Math., 1951, V. 4, №. P. 435-456.
108. Ehrmann H. On Implicit Finction Theorems and the Existence of Solutions of Nonlinear Equations //Enseignement Math. V. 9. P. 129-176.
109. Давиденко Д.Ф. О приложении метода вариации параметра к теории нелинейных функциональных уравнений. //Укр. мат. журн. 1955, Т.7. т. С. 18-28.
110. Гавурин М.К. Нелинейные функциональные уравнения и непрерывные аналоги итеративных методов //Изв. вузов. Математика. 1958. №5. С. 18-31.
111. Яковлев М.Н. К решению систем нелинейных уравнений методом дифференцирования по параметру. //ЖВМ и МФ. 1964. Т. 4. №11. С. 146-149.
112. Яковлев М.Н. О некоторых методах решения нелинейных уравнений //Тр. мат. ин-та им. Стеклова. 1965. №84. С. 8-40.
113. Треногин В.А. Функциональный анализ. М.: Наука, 1993.
114. Гапоненко Ю.Л. Метод продолжения по параметру для уравнения второго рода с липшиц-непрерывным и монотонным оператором. //ЖВМ и МФ. 1989. Т. 26. №8. С. 1123-1131.
115. Шалашилин В.И., Кузнецов Е.Б. Метод продолжения решения по параметру и наилучшая параметризация. М.:Эдиториал УРСС. 1999.
116. Ортега Д., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. М.: Мир. 1975.
117. Давиденко Д.Ф. Об одном новом методе численного решения систем нелинейных уравнений //ДАН СССР. 1953. Т. 88. №4. С. 601-602.
118. Давиденко Д.Ф. О приближенном решении систем нелинейных уравнений //Укр. мат. журн. 1953, T.5. №2. С. 196-206.
119. I. Численные методы и расчеты
120. Численные расчеты для задачи Ai.
121. Д' = 9iAi, A'(0) = > /о -ikf = (9i + »i)kf, kf{0) = kfQ, K ' ■ ) Ni = (PuLi + 7i ikf)e-»W що) = 0.1. < Li + L2 < L1 (3.1.3)1. Himinlji Vi 0, fj — 0
122. SiminfaiLi + Siminj2ikf ~ Щ < 0, Щ — Simax(32iLi — sirnax^2ikt < 0- (3.1.4)2
123. J2 cxii-faiLi 72ikf + щ)< 0 (3.1.5)iвместо ограничений (3.1.3)-(3.1.5) рассмотрим ограничения
124. Vi £ \Vimini Vimax\i E ^imiru ^imax\ (3.1.6)1. Положим
125. Lj(0) = 1, А\л(0) = 2, Д(0) = 1, p{t) = 0.02 * t1Л = 0, gi= 0.05, Pu = -0.001, 7H = 0.01, T = 100 (3.1.7) Vimin = -0.05, Vimax = 0.02, Uimin = 0.001, Щтпах = 6.03
126. При аналитическом решении задачи Понтрягина (3.1.1), (3.1.2), (3.1.6), (3.1.7) оптимальное управление имеет вид
127. Vi{t) = Vimin = -0.05, Ui(t) = Uijnax = 6.03, t G 0, 100.
128. Пакет "Баланс-2" дает решение несколько отличающееся от аналитического
129. Vi{t) = Vimin = -0.05, t G 0,100., Ui(t) = uirnax = 6.03, t G [0,98], Ui{t) = Uimin = 0.001, t G [99,100]
130. Для решения задачи будем использовать метод продолжения по параметру, вводя параметр щ G 0,1. следующим образом:1. = t/i, U( 0) = Ll М = 9iA, 0) = Alkf = tii (gi + kf(0) = ^^
131. Arf = TjiTi + (1 m) (PiiLi + 71 ikt)e-M Ni{0) = 0.где Ti = (piAiFiikf,^) AiWiU - пА{к^)е~^\1. < Lx + L2 < L1
132. HiminLi ft ^ 0, Vi n>ima.xLi — 0 ViSiminFi(kf, Li) + (1 rjdSiminifoiLi + 72г^) ~ Щ < 0,
133. Щ riiSimaxFi(kf, Li) - (1 - r}i)Simax(p2iU + l2ikf) <0 2ceii-rjiFiikf, Li) (1 - rjiKPvLi + l2ik?) + щ) < 0 (3.1.11)i=l
134. При r.i = 0 имеем задачу Ai, при rji = 1 задачу A2. Решение при гц = 1 получается методом продолжения по параметру. Продолжение решений по параметрам в задаче А2 существует и единственно и не зависит от выбора очередности продолжения по параметру.
135. Численные методы для решения обыкновенных дифференциальных уравнений.
136. X(t) = (Xl (£),. .,Xn(t))T.
137. Определение 3.2.1. Система (3.2.1) с постоянной п х п-матрицей А называется жесткой, если собственные числа A* (к = 1 ,п) матрицы А удовлетворяют следующим условиям:1. Re\k < О Ук ehnо\ тт тах\ Re At
138. Число жесткости д =- п ч велико.min\ ReAfc I
139. Нестрогость, заключенная в последнем слове данного определения, аналогична той, которая присутствует при введении понятия "плохая обусловленность матрицы"; избавиться от нее можно, лишь рассматривая конкретную задачу.
140. Существующие пакеты программ для численного решения жестких систем наиболее подробно представлены в 6. В некоторых случаях можно улучшить структуру жесткой системы за счет нормировки и замены переменных.1. Список литературы.
141. Давиденко Д.Ф. О приложении метода вариации параметра к теории нелинейных функциональных уравнений. //Укр. мат. журн. 1955, Т.7. №1. С. 18-28.
142. Гавурин М.К. Нелинейные функциональные уравнения и непрерывные аналоги итеративных методов //Изв. вузов. Математика. 1958. т. с. 18-31.
143. Яковлев М.Н. К решению систем нелинейных уравнений методом дифференцирования по параметру. //ЖВМ и МФ. 1964. Т. 4. №11. С. 146-149.
144. Яковлев М.Н. О некоторых методах решения нелинейных уравнений //Тр. мат. ин-та им. Стеклова. 1965. №84. С. 8-40.
145. Гапоненко Ю.Л. Метод продолжения по параметру для уравнения второго рода с липшиц-непрерывным и монотонным оператором. //ЖВМ и МФ. 1989. Т. 26. №8. С. 1123-1131.
146. Шалашилин В.И., Кузнецов Е.Б. Метод продолжения решения по параметру и наилучшая параметризация. М.:Эдиториал УРСС. 1999.
147. Давиденко Д.Ф. Об одном новом методе численного решения систем нелинейных уравнений //ДАН СССР. 1953. Т. 88. №4. С. 601-602.
148. Давиденко Д.Ф. О приближенном решении систем нелинейных уравнений //Укр. мат. журн. 1953, Т.5. №2. С. 196-206.
149. Вержбицкий В.М. Численные методы. Линейная алгебра и нелинейные уравнения. М.: Высшая школа, 2000.
150. Вержбицкий В.М. Численные методы. Математический анализ и обыкновенные дифференциальные уравнения. М.: Высшая школа, 2001.
151. И. Самарский А.А., Гулин А.В. Численные методы. М.: Наука, 1989.
152. Lambert J.D. Computational Methods in Ordinary Differential Equations. N.Y.: Wilay, 1973.
153. Ракитский Ю.В., Устинов C.M., Черноруцкий И.Г. Численные методы решения жестких систем. М.: Наука, 1979.
154. Byrne G.D., Hindmarsh А.С. Stiff ODE solvers: A review of Current and Coming Attraction //J. of Computational Physics, 1987. Vol. 70. №1. P. 1-62.
155. Shampine A.H., Gear C.W. A User's View of Solving Stiff Ordinary Differential Equations //SIAM Review. 1979. V.21. №. P. 1-17.
156. Дулан Э., Миллер Дж., Шилдерс У. Равномерные численные методы решения задач с пограничным слоем. М.: Мир, 1983.
157. Дикусар В.В. Методы теории управления при численном интегрировании ОДУ. Журн. Дифференциальные уравнения. Том 30. №12, 1994. Минск. С. 2116-2121.
158. Hairer Е., Wanner G. Solving Ordinary Differential Equations. 2. Stiff and Differential-algebraic Problems. Berlin, e.a.: Springer-Verlag, 1991.
159. Лебедев В.И. Как решать явными методами жесткие системы ОДУ. //Вычислительные процессы и системы. 1991. Вып. 8. С. 237-291.
160. Федоренко Р.П. Жесткие системы ОДУ и их численное интегрирование //Вычислительные процессы и системы. 1991. Вып. 8. С. 328-380.
161. Тихонов А.Н., Арсении В.Я. Методы решения некорректных задач. М.: Наука, 1979.
162. Морозов В.А. Регулярные методы решения некорректно поставленных задач. М.: Наука, 1987.
163. Васильева А.Б., Бутузов В.Ф. Асимптотические разложения решений сингулярно возмущенных уравнений. М.: Наука, 1973.
164. Афанасьев А.П., Дикусар В.В., Милютин А.А., Чуканов С.В. Необходимое условие в оптимальном управлении. М.: Наука, 1990.1.. Модель спроса на импортные товары, используемые в производстве в условиях ценовой неопределенности
165. Рассматривается экономика, выпуск, которой задается агрегированной производственной функцией:
166. Z = pf(xm, xe, xi, хк) qmXm ~ qexe ~ ЩХ1 - wkx* (4-1-4)
167. T0 = inf{* > 0 : Z(t) = 0} (4.1.5)
168. Управление производством может быть найдено из решения задачи максимизации ожидаемой дисконтированной функции полезности:1. То
169. Т(х) = sup{t > 0 : J ahix2ids <1. О i=m,e
170. Если уравнение (4.1.3) имеет сильное решение для хт = xm(Z,qm,qe), хе = xe(Z, qe, gm), с = c(Z, gm, qe) на 0, To., где xm, xe, с решение оптимизационной задачи в правой части (4.1.9), тогда I(Z, qm, qe) = gm, qe), Z > 0.
171. Доказательство. Зафиксируем Z > 0 и выберем допустимыеc(Z,gm,ge), xm(Z,gm,ge), xe(Z,qm,qe). Выберем 0 < Z° < Z < Z1, g^ <tqm<qm,q0e<Qe< ч\ и определим Sn = inf{£ > 0 : I Y1 °i<lixlds = n}>0 i=m,e
172. T = TZ0 A TZ1 ASnA Tqom A T^ A Tqо A T9i. Из (4.1.9) и используя формулу Ито, получаем:1. Ez,qm,qe f U(c)e~pidt < ог р/ + (amgmxm + Оде^е + с)/^ amqmrqm - aeqeIq
173. Ez,qm,qe} 1. 2 2 „2 . 2„22\ jU ^ J1 J1 pi ^ JJr// l „-pt0 ^ тЯт тп + е' ZZ ~ 2атЯт1ЧтЧт ~ 2аеЯе wM dt
174. Zz,qm,qJ-d(e-o'I) = -Ez>qm>qee-pTI(Z(T),qm(T),qe(T)) + I 0
175. Поскольку значение U(0) ограничено, предыдущее неравенство можно переписать следующим образом:г
176. Ic/(0) > J U(c) U(0).e-ptdt+о9ee^r/(Z(T),gm(T),ge(T)) if/(0).г
177. Пусть Zo 4 0, Zi оо , ——оо, д^ —> оо, д® ——оо, q\ -> оо и п —оо, тогда Т t То п.н.
178. По лемме Фату и из неравенства
179. Z(T),qrn(T),qe(T)) -U(0) > Р - -U(0) >0:1. Р Р
180. Й? Ez>qm,qee-»TI(Z(nqrn(nqe(T)) Ь(0). >1 T-to р1. Ez,qm,qee~pT°P l-U{0).г1. От .а,0hnM -U( 0)1. Jo1. if/(0) > £;Z)9m)<7e f U(c)e~ptdt + Pe~pT°} itf (0) = P J P
181. Максимизации по xm, xey с дает необходимый результат. ■
182. Упрощение задачи (4.1.3.)-(4.1.7.) и задача оптимального управления портфелем ценных бумаг.
183. В этом случае задача принимает вид:dZ = d(pf(xm, хе) — qmxm — qexe) — cdt = = (a*m(Amp qm)xm + a*e{Aep - qe)xe - c)dt 4- a*e(Aepc(t) текущее потребление.
184. Z = (Amp qm)xm + (Aep - qe)xe (4.2.4)
185. T0 = inf{t > 0 : Z{t) = 0} (4.2.5)
186. Управление производством находится из решения задачи максимизации ожидаемой дисконтированной функции полезности:1. Тохт(.),хе( ),с( ) = EZ{ J U(c)e~ptdt + Ре~рТ°),опри (4.2.3), (4.2.4), (4.2.5) и (4.2.7)c(t) > s > 0 (4.2.7)
187. Т0 = inf{t > 0 : x(t) = 0}. (4.2.9)
188. Инвестор стремится выбрать c(t) и 7г(£) так, чтобы максимизировать цену1. То
189. V — Ех( J e~ptU(c(t))dt + Ре~рТ°) (4.2.10)о
190. Параметр р > 0 коэффициент дисконтирования.
191. Запишем принцип максимума (Глава 5). Предположим, что (x°(t)} 7г°(£), c°(t)) является экстремумом задачи, тогда существуют
192. Ф(0 = (a г)тг(*) + г.Ф(*)Л + air(t)<b(t)dW(t), Ф(£) = 1 (4.2.20)
193. Ф(Т) = ехр( J (а г)тг(<) + г - ^a\2(t).dt + J an(t)dW(t)) (4.2.21) о о
194. Предположим, что А ф 0, тогда c(t) может быть определено из условияc(t) = argmaх{-ф)ф(Ь)+ ^e-^C/(c(f))},ie0,T.
195. Когда ограничение c(t) > 0 отсутствует, оптимальное с(£) должно удовлетворять-0(£) + e~ptU'(c) = 0,te О,Т. (4.2.23)
196. Поскольку U строго выпуклая, U' имеет обратную функцию I. Следовательно, возможное потребление имеет вид:с(0 = I(U'{c0) ехр—(г р + - (4.2.24)z a cr
197. В общем случае, возможное потребление имеет вид:1. Список литературы.
198. Аркин, В.; Саксонов, М. "Необходимые условия оптимальности в задачах управления стохастическими дифференциальными уравнениями", Докл. АН СССР, 1979.том 244, номер 1, стр.11-15.
199. Appelbaum, Е.; Kohli, U. "Import Price Uncertainty and the Distribution of Income", The Review of Economics and Statistics, Volume 79, Issue 4 (Nov., 1997), 620-630.
200. Bismut, J., Journal of Math. Anal. Appl., V. 44, 384, 1973
201. Chang, F. "The Inverse Optimal Problem: A Dynamic Programming Approach", Econometrica, Volume 56, Issue 1 (Jan., 1988), 147-172.
202. Cox, J.; Ingersoll, J.; Ross, S. "An Intertemporal General Equilibrium Model of Asset Prices", Econometrica, Volume 53, Issue 2, (Mar., 1985), 363-384.
203. Fleming, W.; Rishel, R. "Deterministic and Stochastic Optimal Control", Springer-Verlag, 1975
204. Pardoux, E. "Backward Stochastic Differential Equations and Viscosity Solutions of Systems of Semilinear Parabolic and Elliptic PDS of second Order", Analyse, Topologie, Probabilites, 1996.
205. Pindyck, R. "Uncertainty and Exhaustible Resource Markets", Journal of Political Economy (Dec., 1980).
206. Pindyck, R. "Uncertainty in the Theory of Renewable Resource Markets", The Review of Economic Studies, Volume 51, Issue 2 (Apr., 1984), 289303.
207. Merton, R. "Lifetime Portfolio Selection under Uncertainty: The Continuous-Time Case", The Review of Economics and Statistics, Volume 51, Issue 3 (Aug., 1969), 247-257.
208. Merton, R. "An Asymptotic Theory of Growth Under Uncertainty", The Review of Economic Studies, Volume 42, Issue 3 (Jul., 1975), 375-393.
209. Molderov, O. "A variation on stochastic maximum principle for optimal control problems", Solving of Linear Systems in Proceedings of ISA "Dynamics of Non-Homogeneous Systems", Volume 6 (2002), 15-42.
210. Sethi, S. Optimal Consumption and Investment with Bankruptcy, Kluwer Academic Publishers, 1997.
211. V. Необходимые условия оптимальности в задачах управления стохастическими дифференциальными уравнениями51. Постановка задачи.
212. BF измеримых и таких, что E{f \<p(t,u)\2 dt) < оо, векторнаяонорма в Э?п.
213. J = Ef f0{x(t),u{t),t)dt, (5.1.2.) опри условии выполнения следующих ограничений:
214. G (х (и, t), и (oj, t)) < 0 P-a.s., (5.1.3.) G : LI x -> L\\.u = (u1,u2) в L^xY, (5.1.4.)где компактное множество Y G
215. Считаем функцию u(u>,t) управлением, если справедливо: u(u,t) G L^\+n2BF. : U2 G Y. Пара (x (u,t) ,u (oj, t)) допустимая пара для задачи (5.1.1.)—(5.1.4.), когда x(u!,t) G L^dBF], u(t) управление и выполняются (5.1.1.),(5.1.3.).
216. Назовем пару (ж0 (u,t) ,и° (u,t)) решением задачи (5.1.1.)-(5.1.4.), если она дает минимум «7 на множестве всех допустимых пар. Далее полагаем
217. Где К, N—некоторые константы.5. rank (G'x и (х,и)) = dim(ui), когда допустимые (x,u) удовлетворяют G(x, и) = О
218. Сформулируем также задачу, которая является модификацией задачи (5.1.1.).1. Задача 5.1.2.dx{t) = f (x(t),u(t),t)dt + a(x(t),u(t),t)dwt, х(0) = х0, (5.1.1.*)целью является нахождение и минимизирующее интегральный функционалг
219. J = Е J f0{x{t),u{t),t)dt, (5.1.2.*) огде Т определяется
220. T = inf{t > 0 : x{u)%t) = 0}, (5.1.3.*)и = (щ,и2) е Щ х У, (5.1.4.*)где компактное множество У G Ь2\.
221. Теперь можно сформулировать необходимые условия оптимальности.
222. Необходимые условия оптимальности.
223. А&Д*) KMm - <(*)ВД - gUl(t)a(u,t) =0,P-a.s.,t G 0,1.d)+ (*Ж«) - A/^(*)) dt~- gx(t)a(w,t)dt + h(t)dWt, (5.2.7) <M«) = " (Л'(*Ж*) + °'t(*)Ht) А&(*)) dt + n(t)dWte)tf(l) = 0>V>(l) = -a (5.2.8)01. A + |a|>0 (5.2.9)
224. Стоит отметить, что в условии (5.2.5) функция /г рассматривается как функция трех переменных x°(t),u1t, но функция ф(Ь) зависит от x°(t),u°(t),t. И в уравнениях (5.2.7) ф(t) и h(t) рассматриваются, как функции от x°(t),u,t и x°(t),u°(t),t.
225. Теорема 5.2.2. Пусть процесс (ж°(£),и°(£),£; 0,Т.) является решением задачи (5.1.1.*) — (5.1.4.*), тогда существуют
226. A/U*) ~ f'Ul{*)№ *'Ul(*)h(t) = 0, P - a.s.,t e 0,T. (5-2.4.*)d^t) = -(f'x(*mt) + *'x(*)h(t) Afbx(*))dt + h{t)dWu
227. Mt) = + 0{(*)b(t) + n(t)dWt • • ;ф(Т) = -£,<р(Т) = 0 (5.2.6.*)1. A + |C|>0 (5.2.7.*)
228. Теорема 5.2.2., приводится без доказательства, доказательство аналогично доказательству теоремы 5.2.1., частичное доказательство которой приводится в последующих разделах. Полное доказательство можно найти в 16.53. Присоединенные процессы.
229. Для доказательства, будем использовать так называемые присоединенные процессы 2J. Пусть допустимый процесс (x°(t), и0(t),t; [0,1.) является решением задачи (5.1.1.)—(5.1.4.).
230. Обозначим через 7г конечный набор точек 0,1. Таким образом,тг = (ti,.,tjt) ,ti < t2 < £jt, , .1. G 0,l.,Vi= 1 j
231. Через U (U) ,i = 1 обозначим конечный набор точек
232. Uiif . . . , WiSj}) j — 1, • • • , Sj
233. На интервале (0, Tieft (Ai)) функция v°{r) постоянная и ее значение определяется из условият/е/4(Д i)
234. J v°dr = t\— tieft (О» 1.) • (5.3.3.)0
235. Аналогично на (Tright (Afc), l),v°(r) константа и ее значение удовлетворяет1
236. J v°dT = tright(Q,l.)-tk. (5.3.4.)1. Tright (Д)1. Положимг
237. V) = tuft (До) + I v°(r)dr. (5.3.5.)о
238. На интервале между Д,- и Д,-+1 , ^(т) константа из1.v^dtr = Wti+l -Weifi = l.fc-1. (5.3.6.)1. Trihti&i)
239. Ha (0,riejt (Д1)) функция ^(т) константа и ее значение определяется ruft{ Ai)1.^(r)^r = ^tl-m(0,l.). (5.3.7.)0
240. Наконец, на (rrj3/tt (A^), 1), vj(r) константа, которая удовлетворяетlj v\{r)diT = Wtri3htib0) Wti. (5.3.8.)1. Tright(&)1. Нетрудно заметить ^(т) =
241. Теперь построим присоединенный процесс v°(т), х°(т), и°(т), t°(r), т € 0,1.1. Полагаемх°(т) = х° (t°(r)) . (5.3.9.)
242. Функция и°(т) определяется следующим образом. Разобьем Д* на непересекающиеся отрезки Дл,., Дг-а<.
243. На каждом отрезке Дгу функция u°(r) является константой и определяется уравнениеми°(т)|г6д4, = «У53.10.)
244. Вне отрезков = 1,., к, и°(т) определяется равенством1. М = (£°(г)) .53.11.)
245. Присоединенный процесс полностью определен.54. Теорема об альтернативе.
246. Приведем теорему по-видимому доказанную Левитиным 3.-[5], которая является основой для доказательства теоремы об альтернативе.
247. Теорема 5.4.1. Пусть Р : X —» У строго дифференцируем в хо, Р(х) G Q, где Q выпуклое замкнутое множество принадлежащее У, Р (хо) = Уо G Q и Р' (хо) X — (Q — уо) содержит окрестность нуля.
248. Тогда в окрестности хо с некоторой константой L, справедлива следующая оценка расстояния для множества N = P~1(Q)\
249. Так как наше доказательство аналогично детерминированному случаю 2., будем использовать те же обозначения. Обозначим К(х(0), £(0), i(l)) = (х(0) — x,t(0),£(l) — 1),Ро = (х(0),t(0),t(l)),d(0 размерность вектора
250. Г = {f = К' (р°) р\р= (5(0), t(0), t(l)),dx = К(г) Гх(х°(т)У(т)Лт))х(т) + 4(*)Й!(г) + Л(*)*(т). + +v(r)f(*)}dT+ W(r) [^(x0(r),U°(r),£°(r))x(r) + </и1(*)й1(г)+d(x,N) < Ld(P(x),Q). ■1. Положим
251. Функции v, х, и\, t будем называть вариациями присоединенной траектории. Также v, х, щ, t считаются удовлетворяющими уравнению для Г. Ясно, что d (Г) < d{K).
252. Теорема 5.4.2(об альтернативе) Верна следующая альтернатива: а) с£(Г) < d(K) или Ь) не существует вариации присоединенной траектории, такой, что
253. E{yraimmv{r)} > 0. (5.4.2.)15Г j Е J(v°(r) + ег;(г))/о(х0(т) + ex(r), u5(r)+-Ц-01.о0/\ Лей1(т), и02{т)} t°{r) + et(T))dT- (5.4.3.)-Е J^0(r)/o(x0(r),W0(r),^(r))dr| /е < 0,1. К'(р°)р = 0. (5.4.4.)
254. Доказательство. Предположим, что а) неверно, т.е. d(Г) = d(K). И докажем, что Ь) справедливо.
255. Предположим обратное. Пусть v, х, щ, t удовлетворяют (5.4.2.)-(5.4.4.).
256. Считаем ро = (х(0), t(0), t(l)) и рассмотрим операторы:
257. Е J v(£,r)/o(x(e,r),ui(e,r),U2(r),f(e:,r)dr1 (5-4.7.)-е j i;°(t)/o(x°(t), и°(т), £°(т))с?т < -сое, со > 0. о1. К(р(е))\=о(е), (5.4.8.)
258. G(x(e,r),ui(e,r)f«§(r)) G(x0(t),u°(t)) = о(е). (5.4.9.)где со константа и (х(е,r),t(£,r)) = А1 (v(£,T)1ui(£,r)yu2(r),po(£)).
259. В соответствии с оценкой расстояния, существуют v(e, г), й\(£, т),ро(е) такие, что
260. K(p0{e)) = 0,G(x{e,T)1ul{e,T),u2{e,T)) < 0, (5.4.10.)t>(e,r) -у(е,т)\\ + |Ms,r) tii(e,r)|| + ||д,(е) — Ро(е)|| <
261. L d\K(p(s))tQl) + d2(G(x(e,T)M^r))1Q2).l/2 = о(е),54.11.)x(£,T),i(£,T)) = Л1(г), tii, и2(£, т),ро)> (5.4.12.)здесь через d(•) обозначили функцию расстояния. Отсюда и (5.4.7.) следует1
262. Е J v(£,r)fo (x(£,r),ui(£,T),u2(£,r),i(£,r)) dr0-E J f0(r)/o(x0(r), w°(r), t0(r))dT < -c'0£, c'o > 0.
263. Сделаем замену, t = t(e,r). Получим семейство траекторий, сходящихся к траектории х°(£), u°(t), t : x(e,t) = x(е,т(£)), ui(e,£) = «i(e,r(0), u2(e,0 = u2{£fr{t)), t G *(e,0),f(e, 1).
264. Так как на траектории х(е,т),., значения J, К те же, что и на х(е,£),., 0,1., то из (5.4.13.)) следует, (х°(£), u°(t), t; [0,1]) ) не является решением задачи.
265. Мы пришли к противоречию с нашим предположением. Таким образом справедливость Ь) доказана. ■55. "Уравнение Эйлера и обратная заменапеременных.
266. E J Ga(uj, r)v°(r)dT 4- f (v(r)) —-AE Jv°{f0x{*)x + /0и{*)щ + fot{*)t} + M*)v.dr = 0,55.5.)
267. Для любых (V,X,Ui,t) G l2oo X l^ X T/21^ X L21. Где,r ,vf = f {АттАт)>Ат)Ат)Ш+ 04№(т) + Л'МЧг). + v(r)/(*)}dr+r/ K(r)K(x0(r),n0(r),t0(r))x(r)+ 0<№(r) + o{(*)t(r). + vi(T)a(*)Kr,
268. Доказательство. Прежде всего рассмотрим случай d(T) < d(K). Положим
269. P:L2oox L^ x x L2i -> x l5x) x L21 x L!d(G) y21линейный оператор определенной формулой
270. P(v,x,u1,i) = ^K'ip^x-VfJ- j v(p)dp.
271. V(v,x,ulti) в L2oo x L%x) x Lx L2l.
272. Положим L = L^ x L2\ x L^^. Покажем, что, если rankG'Itti = dim(ui), тогдаprojectionLP (l2oo x L&x) x ^ x L21) = x L21 x Z,gG). (5.5.7.) Справедлив более сильный результат.projectionLP (l2oo x x ^ x Ь) = L^ x L2l x (5.5.8.)1. Al'lx Ali„. \41'
273. Действительно, рассмотрим матрицу:1.n1. G\.1. G'ulx ^lUj \ G'd(G)x /ее строки линейно независимы.} Откуда а ф 0.
274. Таким образом, когда d(T) < d(K), теорема справедлива. Рассмотрим другой случай , d(T) = d(K).
275. Мы имеем следующую систему непустых открытых выпуклых конусов и подпространств в L2oo х L^ х L^ х Ь2\.1. Конусы:
276. Е f v°{fox(*)x + /0щ(*)й1 + fot(*)t} + vf0(*). dr < О E{vraiminv} > 0,55.9.)1. Подпространства:1. К'(р°)Р = 0,dx = K(r) f'x (х\т)УШ\т)) х{т) + 4(*)ih(T) + /t'(*)f(r). + +v(T)f(*)}dr + К(т) К(Ат)У(т)ЛтМт)+*'щ(*)щ(т) + + ог{(*)£(г)]+г;1(т)а(*Жт,
277. Поскольку все подпространства находятся в одном положении, опорный функционал к их пересечению равен сумме опорных функционалов к каждому подпространству в отдельности.
278. Е J Vx{T){x-vf) + ВД I i J v(p)dpdr+
279. E J Ga{u,T)v0{T)dT + v{v(r)) = 055.15.)
280. Но когда v = О, все элементы из L = L^ x £21 x Lпредставимы через ^x — vf,t — /v(p)dp, gJ в соответствии с (5.5.8.).
281. Откуда, Ф(т) = 0, ц = 0 и поэтому и = 0.
282. Мы показали, что из (5.5.3.) следует (5.5.12.). Таким образом, в случае d(T) = d(K) теорема справедлива . ■.
283. Определим сопряженное стохастическое дифференциальное уравне55.17.)ние.
284. Е и*Жг) - <(*)Л(т) - С'щ(*)а(и,т))щу°(т)ат+
285. Е J(Л/о(*) Д*Жг) - (l/2)a(*)h(*) - <р(т))у(т)<1т - и(у{т)) = О55.19.)
286. Если v(r) = 0, получим Vtti(r),еI (А ЛиД^-^Д^М-^д^ад-с^д^.г^й^^г^о55.20.)
287. Если щ(т) = 0, получим \/г;(т),
288. Е J (XfoM ~ Д*Жт) (1/2) О- (*) Л(») - <р(т)) C(r)dr - I/ (е(т)) = 055.21.)
289. Так как и >0 и v (г;0) = 0, то
290. А/о(*) 1{*Жт) - (1/2) <т(*)Л(#) - (р{т) > О, Р - a.s., г G 0,1. (5.5.22.)v°(r) (Л/о(*) /(*Мт) - (1/2) er(*)h(*) - <р(т)) = 0 ,Р- a.s., г е 0,1.55.23.)
291. Анализ присоединенной траектории закончен. Сформулируем результат в виде теоремы.
292. Теорема 5.5.2 Пусть траектория (x°(i), u°(t),t\ 0,1.) является решением задачи.
293. A/o(*) /(*)$(r) - (1/2)а(*)Л(*) - 0(т) > 0, P - a.s., r G 0,1. (5.5.26.)
294. Для завершения доказательства необходимо произвести обратную замену переменных или иначе говоря произвести расшифровку. В работе 16. приводится оставшаяся часть доказательства.
295. Обратные стохастические дифференциальныеуравнения.
296. J (pTdWT + ЕФ\£ + E J Ф*tatdt = Eо 01. J Ф*tatdt + Ф^ j /Ft1. Доказательство.d(№*t) =(Фг(А&)* (A^t + B*tht - a№ + ht^t)*)dt+(M? + 1>t{B&ty)dWu10356.2.)56.3.)56.4.)56.5.)56.6.)- = J OrVrdT + I{НТФ*Т + BWr&T)dWT, (5.6.7.) t t
297. J ipTdWT + ЕФ\£ + Е J Ф*TaTdr =о о56.11.)непосредственной подстановкой полученных решений в уравнение для убеждаемся в справедливости предложения. ■
298. Вернемся к доказательству принципа максимума, рассмотрим (5.5.16.):dx = {t;°(r)/i(x0(r),U°(r),£0(r))x(r) -f/i^^n^r) + fl(*)t(r).+^(T)/(*)}dr+K(r)a;(x^r),U°(r),t0(r))x(r)+<(*)n1(r)+ + a,t(*)t(r). + v1{T)a(*)}d^ dt = v{r)dr.56.12.)
299. Выпишем сопряженное уравнение для (5.6.12.):
300. Щт) = (.Гх(*Шт)у°(т) + a'x(*)h(r)(vQ(r))^ - XfU*)Ar))dr~) -G'x(*)a(aj,T)v°(T)dT + h(T)dZT}
301. Mr) = ии*Жт)Ат) + °'Л*)Чт)(Ат))1/2- \foT(*)v0(r))dT + п{т)<%т56.13.)
302. Откуда, в других обозначениях, (5.5.21.) можно записать в виде
303. Е J (ХМ*) ~ /(*Жт) (1/2) {v°)~1/2a(*)h(*) - V(r)) v(r)dr-u (v(r)) = 0,56.14.)где h(*) определяется из предложения 5.6.2.
304. Л(#) = -а'х{*) (у°(т))1/2ф(т) Ф*-1 (ь°(т))1/2ф(*). (5.6.15.)
305. Аркин, В.; Саксонов, М. "Необходимые условия оптимальности в задачах управления стохастическими дифференциальными уравнениями", Докл. АН СССР, 1979-том 244, номер 1, стр.11-15.
306. Афанасьев А., Дикусар В., Милютин А., Чуканов С. "Необходимое условие в принципе максимума", М.: Наука, 1990.
307. А.В. Дмитрук, А.А. Милютин, Н.П. Осмоловский. "Теорема Люстер-ника и теория экстремума", Успехи Мат.Наук,т.35, вып. 6(216).
308. Левитин Е. "Об условиях локального минимума в экстремальных задачах с ограничениями", -ДАН, 1975, 221:5, стр.1031-1034.
309. Левитин Е. "К теории возмущений негладких экстремальных задач с ограничениями",-ДАН,1975,224:6,стр.1260-1263.
310. Bismut, J., Journal of Math. Anal. Appl., V. 44, 384, 1973
311. Chang, F. "The Inverse Optimal Problem: A Dynamic Programming Approach", Econometrica, Volume 56, Issue 1 (Jan., 1988), 147-172.
312. Fleming, W.; Rishel, R. "Deterministic and Stochastic Optimal Control", Springer-Verlag, 1975
313. Pardoux, E. "Backward Stochastic Differential Equations and Viscosity Solutions of Systems of Semilinear Parabolic and Elliptic PDS of second Order", Analyse, Topologie, Probabilites, 1996.
314. Липцер P., Ширяев А. Статистика случайных процессов, Москва, Наука,1974,стр.91-218.
315. В.И. Аркин, М.Т. Саксонов. К теории стохастического принципа максимума в задачах с непрерывным временем. М.: ЦЭМИ АН СССР, 1983.
316. Merton, R. "Lifetime Portfolio Selection under Uncertainty: The Continuous-Time Case", The Review of Economics and Statistics, Volume 51, Issue 3 (Aug., 1969), 247-257.
317. Molderov, O. "A variation on stochastic maximum principle for optimal control problems", Solving of Linear Systems in Proceedings of ISA "Dynamics of Non-Homogeneous Systems", Volume 6 (2002), 15-42.
318. Sethi, S. Optimal Consumption and Investment with Bankruptcy, Kluwer Academic Publishers, 1997.1. Заключение
319. Предложены различные методы параметризации детерминированных моделей с фазовыми и смешанными ограничениями с целью получения решения методом продолжения по параметру.
320. Предложен метод предварительной оценки геометрии оптимальной траектории с помощью системы "Баланс-2".
321. Предложена динамическая модель двухсекторной экономики.
322. Предложена динамическая модель спроса на импортные товары в условиях ценовой неопределенности. При дополнительных предположениях задача эквивалентна задаче управления ценными бумагами (Мертон).
323. Разработан метод для качественного исследования задачи определения спроса на импортные товары на основе необходимых условий оптимальности. Метод допускает дальнейшее обобщение для более широкого класса задач.
324. Приведенные примеры расчета показали эффективность разработанной методики.
-
Похожие работы
- Качественные и численные методы решения задачи оптимального управления с фазовыми ограничениями на примере управления локомотивом
- Анализ эффективности метода параметрической линеаризации для решения задач оптимального управления со смешанными ограничениями
- Оптимальное управление внешним и внутренним долгом промышленного холдинга
- Оптимальное управление линейными системами с нерегулярными смешанными ограничениями и определение геометрии оптимальной траектории
- Динамическая оптимизация процессов природопользования
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность