автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Принцип позиционной динамической устойчивости и его применение в системах со многими управлениями

кандидата физико-математических наук
Смолин, Евгений Александрович
город
Кемерово
год
2007
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Принцип позиционной динамической устойчивости и его применение в системах со многими управлениями»

Автореферат диссертации по теме "Принцип позиционной динамической устойчивости и его применение в системах со многими управлениями"

На правах рукописи "illf

Смолин Евгений Александрович

принцип позиционной динамической устойчивости и его применение в системах

— Leo многими управлениями

05.13.01 - Системный анализ, управление и обработка информации

автореферат

диссертации на соискание ученой степени кандидата физико-математических наук

Красноярск - 2007

Работа выполнена в Кемеровском государственном университете

Научный руководитель доктор физико-математических наук, профессор

Данилов Николай Николаевич

Официальные оппоненты доктор технических наук, профессор

Охорзин Владимир Афанасьевич

доктор физико-математических наук, доцент Змеев Олег Алексеевич

Ведущая организация Якутский государственный университет

им М К Аммосова

Защита состоится 20 апреля 2007 г в 13 часов на заседании диссертационного совета Д 212 249 02 при Сибирском государственном аэрокосмическом университете по адресу 660014, г Красноярск, пр им газ Красноярский рабочий, 31.

С диссертацией можно ознакомиться в библиотеке Сибирского государственного аэрокосмического университета

Автореферат разослан «14» марта 2007 г

Ученый секретарь диссертационного совета

И В Ковалев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. В диссертационной работе изучаются вопросы состоятельности во времени и пространстве принципов оптимального поведения в динамических системах со многими управляющими параметрами и критериями (функционалами) качества К таким объектам относятся широкие классы конфликтно-управляемых систем, динамические задачи векторной оптимизации и разного рода неклассические социально-экономические задачи принятия решения Во всех таких задачах вопросы, связанные с принципами оптимального поведения, являются одними из центральных Широта применения на практике и научная значимость делают их исследование актуальными Большое разнообразие принципов оптимальности разработано и изучается в теории игр (принцип минимакса, равновесие по Нэшу, С-ядро, вектор Шепли и т д), в теории многокритериальной оптимизации (принципы Парето, Слейтера, Джоффриона и т д), в математической экономике (равновесия по Вальрасу, Куну, Штакельбергу и их модификации)

Каждый принцип оптимальности имеет определенные границы приложимости, в пределах которых он может считаться адекватным описанием содержательного оптимального поведения Поэтому при обобщении результатов статической теории принятия решения на динамические системы, что продиктовано естественным ходом развития теории, возникает вопрос о применимости того или иного принципа оптимальности в новом более широком классе задач На этом пути, как отмечал Н Н Воробьев, можно ожидать нахождения обоснованных критериев выбора принципов оптимальности применительно к разнообразным классам задач, а также формальное конструирование новых принципов, которые могут оказаться весьма плодотворными Данная диссертационная работа относится к этому кругу актуальных проблем

Диссертационное исследование проводилось в рамках гранта Президента Российской федерации для поддержки ведущих научных школ Российской федерации «Математический анализ конфликтно-управляемых систем» - НШ-2174 2003 1 (выполняемого на кафедре математической кибернетики математического факультета Кемеровского государственного университета совместно с факультетом ПМ-ПУ Санкт-Петербургского государственного университета, научный руководитель профессор Л А Петросян)

Цель диссертационной работы: разработка принципа позиционной динамической устойчивости, как механизма реализуемости оптимальных и равновесных траекторий в динамических системах со многими управлениями и критериями качества

Поставленная цель достигается путем решения следующих задач - разработка концепции позиционной динамической устойчивости, как обобщения принципа оптимальности Р. Беллмана на общие динамические управляемые системы,

- исследование вопросов существования позиционно динамически устойчивых решений и их необходимых и достаточных признаков в моделях конфликтно-управляемых систем,

- применение концепции позиционной динамической устойчивости, как единого подхода к изучению моделей социально-экономических систем,

- разработка алгоритмов вычисления устойчивых во времени и в пространстве решений для исследуемых систем

Методика исследования. При выполнении работы использовались понятия и методы теории игр, теории оптимального управления, теории общих динамических систем, математической экономики, динамического программирования, функционального анализа и дифференциальных уравнений

Научная новизна. В классических задачах оптимального управления условие реализуемости оптимальной траектории обеспечивается принципом оптимальности Р. Беллмана, на основе которого был разработан метод динамического программирования В более общих (неклассических) задачах управления этот принцип не применим В работах Л А Петросяна и Н Н Данилова был разработан принцип динамической устойчивости в качестве аналога упомянутого принципа для кооперативных дифференциальных игр, который может рассматриваться как механизм реализуемости (состоятельности во времени) решения системы вдоль оптимальной траектории В отличие от принципа оптимальности Р Беллмана, определяемого на всем пространстве состояний, динамическая устойчивость определялась вдоль фиксированной (оптимальной) траектории Поэтому она может рассматриваться как "программный" принцип поведения

В диссертационной работе принцип динамической устойчивости обобщен на все фазовое пространство, т е. в виде принципа позиционной динамической устойчивости, что позволяет использовать его в качестве механизма реализуемости оптимальных траекторий во времени для широкого класса динамических управляемых систем

Поэтому разработанная в диссертации концепция устойчивости для общих динамических систем со многими управлениями, ее конкретизация для моделей конфликтно-управляемых систем и ряда социально-экономических моделей, а также полученные в работе условия существования и признаков позиционной динамической устойчивости траекторий в перечисленных классах задач являются новыми

Значение для теории. Предложенная в диссертационной работе концепция позиционной динамической устойчивости может быть полезна для дальнейшего развития теории динамических управляемых систем со многими управлениями и критериями качества Она может быть обобщена и применена для исследования динамических задач векторной оптимизации, стохастических систем и т д Основные результаты работы будут использованы при чтении специальных курсов, а также при выполнении курсовых и дипломных проектов на кафедре математической кибернетики Кемеровского государственного университета

Практическая значимость. Разработанный в диссертации единый подход, найденные условия существования и общая схема вычисления позиционно динамически устойчивых равновесных траекторий могут быть использованы при исследовании вопросов стабильного функционирования конкретных экономических и социальных систем

Основные положения, выносимые на защиту

1 Разработанный в диссертации принцип позиционной динамической устойчивости, являющийся обобщением известного принципа оптимальности Р Беллмана из теории оптимального управления, служит механизмом реализуемости принципов оптимального поведения в динамических системах со многими управлениями Он позволяет на основе единого подхода исследовать условия стабильного во времени и пространстве развития широких классов управляемых процессов

2 Найденные в работе условия существования, необходимые и достаточные признаки позиционной динамической устойчивости траекторий в дифференциальных и многошаговых кооперативных играх с побочными и без побочных платежей позволяют оценить реальные возможности объединения усилий участников конфликтно-управляемых систем для достижения поставленных целей

3 Алгоритм, разработанный для кооперативных многошаговых игр без побочных платежей, позволяет вычислить позиционно динамически устойчивые траектории, вдоль которых игроки получают справедливые (в смысле кооперативных принципов оптимальности) и стабильные выигрыши

4 Применение концепции позиционной динамической устойчивости для выявления стабильных и сбалансированных сценариев развития рынка товаров потребления, рынка ценных бумаг, рынка труда и процессов структурного изменения социальной системы, показывает ее возможности как единого подхода для изучения вопросов оптимального поведения в широкой области неклассических задач принятия решений

Публикаиии. По теме диссертации опубликовано 11 печатных работ, список которых приведен в конце автореферата

Апробация работы. Основные положения диссертации и отдельные ее результаты докладывались и обсуждались на Всероссийской научно-практической конференции «Информационные технологии и математическое моделирование» (г Анжеро-Судженск, 2002 г ), Конференции молодых ученых Кемеровского государственного университета, посвященной 60-летию Кемеровской области (г Кемерово, 2003 г), III Всероссийской научно-практической конференции «Информационные технологии и математическое моделирование» (г Анжеро-Судженск, 2004 г), XXXI апрельской конференции студентов и молодых ученых Кемеровского государственного университета, посвященной 50-летию Кемеровского государственного университета (г Кемерово, 2004 г), IV Всероссийской научно-практической конференции «Информационные технологии и математическое моделирование» (г Анжеро-Судженск, 2005 г ), VI Международной научной конференции «Наука и образование» (г Белово,

2006 г), V Всероссийской научно-практической конференции «Информационные технологии и математическое моделирование» (г Анжеро-Судженск, 2006 г ), а также на научных семинарах кафедры математической кибернетики математического факультета Кемеровского государственного университета, кафедры теории вероятности и математической статистики Томского государственного университета

Структура работы. Диссертация состоит из введения, трех глав, заключения и списка литературы

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи исследования, рассмотрены вопросы новизны, научной и практической ценности полученных результатов, изложены основные положения, выносимые на защиту

В первой главе приведены описание общей динамической системы с многими управлениями, конкретные динамические модели социально-экономических задач принятия решения, формулировка и обсуждение принципа позиционной динамической устойчивости для таких моделей, основные определения, построения, обоснование предлагаемой концепции и примеры

В § 1 с целью определения принципа позиционной динамической устойчивости в общем случае введено следующее понятие динамической системы

Общей динамической системой с п управлениями называется совокупность

К'о^оНМ.Х.Л,. А.к). (D

где [tQ,T\ - временной отрезок функционирования системы, X - множество состояний системы, Ul, ,Un - множества значений и входных воздействий, Ах, ,Ап - множества допустимых управлений, состоящие из отображений полуинтервала в U\ ,U" соответственно, к [г0,7"]х[?0,Г]х X х х Л,, , Ап —> X - функция состояния, удовлетворяющая следующим условиям

1) если ф,',ф,2 е А, и t0<t] <t2<t3<T ,то найдется такое ф;1 е Л,, что

ф?(0 Mo,

[Фf(t\ f2sf<i3

(условие сочленения допустимых управлений), 0 = 1, ,п),

2) k(/,i,*,<pt, ,(рп) = х для всех t0<t<T, дгеХ, ф,еА|, ,ф„еЛ„ (свойство согласованности),

3) если t0<tl<t2<t^<T и хе X, ф^Л,, , ф„е А0, то k(/3,/2,k(f2,fi,*,9i, ,Ф„).Ф1, .фп) = к(г3,г1,х,ф|, ,ф„) (полугрупповое свойство),

4) если 1 = 1, ,п, ф,'(г) = Ф,2(0. при /0 <г( <г<г2 <Т, то для

любого хе X к(г2,¡1,х,ф', ,ф'д) = к(г2,1,,х,ф2, ,фI) (свойство причинности) Элемент (?,х) множества [г0,7 ] х X называется позицией системы Е, элемент ,фя) множества X называется состоянием системы X в момент времени г, а соответствующее отображение х( ) = [и,Т] —> X называется траекторией системы порожденной набором управлений (ф,, ,фл) из начального состояния х{и) — х«

Через Ф(£,?.,л:.) обозначено множество всех траекторий системы исходящих из начальной позиции (и,х») Пусть в каждой позиции [!а,Т]хХ заданы функционалы К'и (ф,, ,ф„), 1 = 1, ,п, определенные на множестве <4, X х Ап, называемые функционалами качества В работе эти функции считаются аддитивными по позиции

Общей динамической задачей принятия решения со многими функционалами качества называется совокупность

Г(/0,хЬ) = (2,Д,^>л.,,6^)1 (2)

где N = {1, ,п] - множество лиц принимающих решение Процесс (2) начинается в исходной позиции (¡0,х0) и имеет продолжительность Т — г(1 Обозначим

через К00,л:0) = Хо (ф) |фе Л х х Лп ]с Я" множество всех векторов выигрыша в задаче (2)

В случае если задача (2) представлена в виде дифференциальной игры, то критерии качества рассмотрены в виде

г

/г;о1Хо(х0,ф„ ,Ф„)= ]^(г,х(0)А + ^(х(Г)), leN,

причем дополнительно рассматривается два случая игры с интегральными выигрышами (= 0, (6 N), в них игроки получают свои выигрыши непрерывно во времени вдоль реализуемой в игре траектории, и игры с терминальными выигрышами (И, = 0, 1б1У),в которых ифоки получают свои выигрыши :(Т)), 1е N конце реализуемой траектории

В дискретном случае, то есть когда задача (2) является многошаговой игрой, рассмотрены критерии качества вида

<='о

где к\, < е N, - есть выигрыши игроков, получаемые в момент времени I, вдоль реализуемой в игре траектории

Пусть IV - отображение, ставящее в соответствие каждой задаче Г(;,,х.) подмножество IV (Г*, х.) множества К(г,,х,), называемое оптимальным Отображение V/ называется принципом оптимальности (по), а множество

И7 (г»,*») - решением задачи Г(Г»,х»), порожденным этим п о В качестве п о в разных классах игр могут выступать такие понятия, как равновесие по Нэшу, Парето-оптимальность, С-ядро, НМ-решение, вектор Шепли, и др

Пусть в задаче (2) выбран по # и Любой набор допусти-

мых управлений ф = (ф,, ,<рп), такой, что К(<р)е И'(Г0,л:0), называется оптимальным (в смысле по \У) управлением, а любая траектория х()е Ф(!п, хп, 7р) -оптимальной (в том же смысле) траекторией

Приведены частные случаи общей динамической задачи принятия решения (2), такие как, классическая задача оптимального управления, задача многокритериальной оптимизации, антагонистическая дифференциальная игра и бескоалиционная дифференциальная игра многих лиц

В §2 приводятся математические модели тех социально-экономических задач, на которых в дальнейшем апробируются полученные в диссертации результаты модель экономической динамики, динамическая модель рынка труда, динамическая модель рынка ценных бумаг и модель изменения социальной структуры населения Для этих моделей введены понятия равновесных траекторий, как принципа оптимального сценария развития рассматриваемых процессов

Третий параграф посвящен анализу проблемы реализуемости п о в динамических задачах со многими управлениями Показано, что принцип Р Белл-мана не применим в моделях конфликтно-управляемых систем и в общей динамической задаче принятия решения Приведены примеры нереализуемости п о в дифференциальных играх, а также нереализуемости равновесных траекторий в моделях экономической динамики

Тем самым обоснована необходимость в построении механизма реализуемости по в динамических системах со многими управлениями, как аналога принципа Р Беллмана из теории оптимального управления

В §4 введено понятие позиционной динамической устойчивости, как обобщение для динамических задач вида (2) принципа оптимальности Р Беллмана Рассмотрено семейство текущих задач в пространстве всех позиций Г={(г,;с)|?е [Г0,Г],л:е X} вида {Г(г,;с) ((,4еГ), где текущая задача Г(г,*) отличается от исходной задачи Г(?0, х0) начальным положением х и продолжительностью Т - Г

Определение 1 Пусть в задаче Г(Г(|,х0) выбран по IV и \У(1о,ха)Ф0 Управление ф() такое, что К (ф( ))е Щг0,.дг0), называется позиционно динамически устойчивым, если выполняются следующие условия

1) все текущие задачи Г(/,х) имеют решения, те 1У(/,х)Ф0, {I,х)е Г,

2) ПК^сфои^*))

(г Х)6Г

Принцип позиционной динамической устойчивости означает, что в какой бы позиции (/д)еГ не оказалась система в процессе своего движения, даль-

нейшее ее развитие будет проходить оптимальным (в первоначальном смысле) образом вплоть до окончания всего динамического процесса

Показано, что в задаче оптимального управления (с одним критерием качества) принцип оптимальности Р Беллмана является следствием принципа позиционной динамической устойчивости В качестве его обоснования приведен пример отсутствия позиционной динамической устойчивости в одной математической модели изменения социальной структуры населения

В §5 установлены факты позиционной динамической устойчивости теоретико-игровых п о в бескоалиционных динамических играх и многокритериальных задачах Доказано, что если в динамической задаче многокритериальной оптимизации существует оптимальное по Парето решение, то оно позиционно динамически устойчиво, а также, что ситуация £-равновесия по Нэшу в бескоалиционных играх всегда позиционно динамически устойчива в классе кусочно-программных стратегий

Предлагаемый принцип позиционной динамической устойчивости обладает тем важным свойством, что в каждой позиции (t,x) он позволяет ориентироваться на один и тот же п о и, следовательно, исключает основания для отказа от ранее принятого правила оптимального поведения Он является, с одной стороны, обобщением известного из теории оптимального управления принципа Р Беллмана на сложные динамические системы управления со многими функционалами качества и на динамические задачи принятия решения, в которых в качестве п о применяются разные понятия равновесия С другой стороны, этот принцип является обобщением на все фазовое пространство принципа динамической устойчивости по JIА Петросяну, определяемого вдоль фиксированной траектории Поэтому принцип позиционной динамической устойчивости, представляющий собой механизм реализуемости оптимальных (в том или ином смысле) траекторий, может быть положен в основу единого подхода к исследованию разных классов моделей динамического управления

Вторая глава посвящена применению концепции позиционной динамической устойчивости в моделях конфликтно-управляемых систем, определенных в форме кооперативных дифференциальных и многошаговых игр с различными видами платежей

В первых двух параграфах исследуется позиционная динамическая устойчивость оптимальных (в смысле различных теоретико-игровых принципов) траекторий в кооперативных дифференциальных играх с побочными и без побочных платежей

На основе дифференциальной игры п лиц в нормальной форме x(r) = /(r,40,<Pi(0, ,Ф„(0), x{t)eXczRm, x(ta) = x0,

ф,(t)е i/, с CompRm', t0<t<T, (3)

т

JU «)) = \h< {x(t»dt + H> WO) -> min, г = 1, , и

Определяется два класса кооперативных игр в зависимости от трансферабель-ности и нетрансферабельности выигрышей игроков Это соответственно игра с побочными платежами в форме характеристической функции V 2" х[/0,Г]хХ -» /?', как совокупность

ГДг0,лг0) = (£,^у), (4)

где £ - динамическая система (1). N - множество игроков, и игра без побочных платежей в форме характеристического множества V 2^х[г0,Г]хХ ->2Л , как совокупность

= (5)

Любая траектория системы (1), такая, что

J,Na,XaШ = V(N^t0>X0)>

называется оптимальной траекторией в игре (4)

Стратегией распределения называется функция /? [г(|,т]х Я" —> где Ъ-гиперплоскость +2п=\

Пусть в игре (4) выбран по и дележ е\¥„(10,х0) Обозна-

чим /¡д, = /?, + + /г„ и положим

I

со(/,р)= |р(т,х(т))/7л,(т)л

Определение 2 Делёж Е,11 е \Уу(/0,д:0) называется пошционно динамически устойчивым в игре Г,,(г0,х0), если выполнены следующие условия

1) в любой позиции (гд)е в текущей игре Г„(г,х) существует решение *0,

2) е П Мг,р)+и;М]

Для любой позиции (Г,д:)е[?0,т]хХ

и произвольного п о \Уу в игре (4)

рассмотрим отображение

г->нГ(г)=и;М0) (6)

Отображение (6) имеет невозрастающий селектор г—если г0 < г < Т, причем > при г0 < г, < /2 < Т

Теорема 1. Пусть - непрерывная на [/0,т], не принимающая на этом отрезке нулевого значения, функция Для того чтобы решение И^,(/0,дг0) игры (4) было позиционно динамически устойчиво, достаточно, чтобы по 1С удовлетворял следующим условиям

1) г0 :£г<7\ X ,

2) в любой текущей игре Г„(г,дт) вдоль оптимальной в этой игре траектории для любого дележа Wv(/,x) существует дифференцируемый на [г,Т]

селектор т -> ¡;т отображения (б), такой, что q' = £,°[t]

Показано применение этой теоремы для кооперативных игр с терминальными выигрышами, а также для конкретных п о, таких как С-ядро и вектор Шепли Рассмотрен модельный пример

Пусть в игре rv (f0, х{)) в форме характеристического множества V выбран некоторый по W Пусть Wv(t,,x,)* 0 Любая траектория х() 6 O(E,í0,jc0), такая, что

т

J,0 ,о (х()) = (¡h(t,x{t))dt + Я(х(Г))) б Wv (í0,дг0),

называется оптимальной (в смысле по Wv) траекторией в игре (5)

Определение 3 Дележ J = J,a ч (I( ))е VV^ (f0,x0) называется позиционно динамически устойчивым в игре Гу(г0,дг0), если выполнены следующие условия

1) в любой позиции (t,x)e [fo.Tjx X в текущей игре Гу(Г,х) существует решение Wv (f, х) * 0,

i

\h(x,x(x)dx + Wv(t,x)

L'o

В качестве кооперативной игры без побочных платежей рассмотрена следующая дифференциальная игра на перетягивание Гп(г0,дг0) Пусть в Rm заданы п целевых точек М,, ,МЯ Выигрыши игроков задаются следующим образом И, =0, Я,(лг(7')) = -с1(х(т), А/,), le N, где d - евклидово расстояние

Обозначим через ^М - ортогональную проекцию выпуклой обо-

лочки точек M¡, ieN, на множество достижимости С(Е,г0,х0) в игре Гп(г0,:с0), а через /?Дл:(0) = /?[А/,,г,(Зс(0)] - замкнутый шар с центром в точ-кеЛ/, и радиусом rt(x(t)) = max _d(x,M,), ie N (t0<t<T) Для каждой

•«'cfflKDlM

коалиции S cN (S Ф N) построим множество

Л*(*(')) = (t0<t<T)

is s

Введем множества Y(S,r„,x,) = (;ye C(£,í„,x.)| val T](í.,x,) = o}, где Г/(г,,х.) антагонистическая игра между коалициями S и N/S

Теорема 2. Для того чтобы в игре Г" (t(t,x0) существовало позиционно динамически устойчивое С-ядро, необходимо и достаточно, чтобы в любой пози-

2) •/,„.,„(*( ))е П

(/ т)е[г0 Г)*Х

ции (г,л:)е [г(),7"]хЛ" в текущей игре Г"(г,л) вдоль каждой ее оптимальной траектории х() е К (г, .г) и для всех 5 с: N (5 выполнялось условие

нп (х(г)) П X, *(т)) = 0, г < т < Т, где К (г, х) = {.?() е Х(2],г,л:)| х(Г)е 7СС(Х>, х)м} В этом случае позиционно динамически устойчивое С-ядро имеет вид

Су(10,х0) = {Р(х)\хепса^Хо)М } и каждая траектория из множества К(Гп,л(|) = {х( )е Х(Е,Г0,х0)| | х(Т)е является оптимальной

Теорема 3. Для того чтобы в игре Г" (/0, х0) существовало позиционно динамически устойчивое НМ-решение, необходимо и достаточно, чтобы в любой позиции (г,х)е [г0,7"]хX в текущей игре Г"(г,х) вдоль каждой ее оптимальной траектории х()е К(г,х) и для всех ге N выполнялось условие К(ЛГ\{1},т,*(т))ПяС(2гх)Л? = 0, 1<Т<Г

В этом случае позиционно динамически устойчивое множество имеет вид

и каждая траектория из множества К(/0,х0) = {х()е |

| х(Т)е яс(£ , Ло)М} является оптимальной

Условия приведенных теорем применены на модельном примере, в котором найдены позиционно динамически устойчивые множество Парето, С-ядро и НМ-решение

В двух последних параграфах второй главы исследована игра многих лиц, динамика которой описывается разностными уравнениями (система X2) ^')=/'(*<'-1),и|<0, 1 = 1.,Т,

и^еи;, 1 = 1, ,«,? = 1, ,Т, (7)

/'еГ

Целью игрока ; (г = 1, ,п) является возможная максимизация выигрыша

Г=1

В случае трансферабельных выигрышей в игре в нормальной форме (7) определяется кооперативная многошаговая игра с побочными платежами в форме характеристической функции, в которой получены аналогичные приведенным выше условия относительно позиционной динамической устойчивости ее решений

Если в игре (7) выигрыши игроков нетрансферабельные, то с помощью характеристического множества V 2" х[/0,7']хЛ'" -±2Я можно определить кооперативную многошаговую игру

Су(0,х(0)) = {£2(0,Х(0)),ЛГ,У) (8)

без побочных платежей

Для получения условий позиционной динамической устойчивости решений в игре (5) использована схема аналогичная динамическому программированию

Для любой траектории х() и множественнозначного отображения х(" —> В(хи>) с /?" определено множество

ЩВ(х(,))] = Я(х(,)) П Щ (х(,))

В частности,

Пусть со0(х), ,шг(х) - и-мерные вектор-функции, определенные на Я"' и удовлетворяющие рекуррентным соотношениям

мДх)еЩш,+1(/'+Чх,и)) + /г'+|(х,и)|иеУ'+1], / = 0,1, ,Г-1, (%(/) = 0леГ, где и = (И„ ,и„), и,+1 = и[+х х хи'п+]

Теорема 4. Пусть \Уу (г,дг(,>) ^0, (Г,х(;>)е [0,Т]хЯ"' Тогда для того чтобы решение И'уСО.х"4) игры (0,х<(1)) было позиционно динамически устойчиво, необходимо и достаточно, чтобы вдоль каждой оптимальной в текущей игре Су(г,хс,)), (Г,х('))б[0,7]х/гт, траектории х|„ Т] () = {х('),х<'+1), ,х(п} (х(,] = х"') были выполнены рекуррентные соотношения

Фу(х,х№)е \VtHV(/т+1 (х<т),н)) + /1х+1 (х{%),и)\ие {/"'], т = г, ,7"-1, И^(7\х(г,)=0„

Эти соотношения являются аналогом уравнения Беллмана из теории оптимального управления Они позволяют последовательно вычислить множества У/уЦ^^), 1 = Т, ,1,0, начиная с МуСГ,х(п) = 0„ и до искомого решения (0, х'0))

Процедура вычисления множества И^СО.х'0') с помощью этих соотношений напоминает схему динамического программирования и использует рекур-рентно построенные множества £20={х<0)), С2,={хе/г"'| |х = /,(хи'1\и1'\ ,«'0),х<'~|)е а,_,,г/,'е ¿/,',/е N}, I = 1, ,Т во всех точках которых вычисляются множества И^, (Ах'"), ¿=7", ,1,0

В случае, когда множества £/' значений управляющих параметров в игре (8) являются конечными для всех 1 = 1, , и и ! = 0, ,Т, построен алгоритм нахождения позиционно динамически устойчивых траекторий в этой игре Работа алгоритма показана на числовом примере, когда в качестве п о \¥ применяется С-ядро

В третьей главе рассмотрено применение принципа позиционной динамической устойчивости в динамических моделях конкретных социально-экономических задач

Для этих моделей принцип позиционной динамической устойчивости означает, что в какой бы точке фазового пространства не оказалась рассматриваемая система в процессе своего движения в дальнейшем из этого состояния имеется возможность равновесного (в том или ином смысле) развитие динамического процесса

Во всех этих задачах были построены семейства текущих моделей, с помощью которых введены определения позиционной динамической устойчивости, аналогично общей динамической задаче принятия решения со многими функционалами качества

В § 1 рассмотрена классическая макроэкономическая система с п видами товаров (продуктов), состоящая из совокупного потребителя и производственного сектора и функционирующая на конечном интервале [О,Г], разбитом дискретными точками 0,1, ,Т

На интервале [0,Т] совокупный потребитель решает следующую задачу т

U(c) = jV(c')->max, (р',с')<Р', г = 0, ,7\

1=0

где с' е R" - набор товаров потребления, определенный в момент времени t, с = {с°, . ,ст}е R"lT+]) - траектория потребления на отрезке [0,Г], и' е R" —>R -

функция полезности, определенная в момент времени I, Р' - бюджет потребительского сектора в момент времени t

Последовательность векторов с={с0,. ,ст] называется оптимальным решением задачи совокупного потребителя, или спросом совокупного потребителя на интервале [0,7"], если существует такая последовательность векторов цен

г

р=.{р\ ,рт}, для которой U(c)= шах U(c), где В(р,Р) = Пя'(/>'.Р'), а

сеЩр р) Ц

Я V.P') = { с' е I (р',с'} < Р'} - бюджетное множество в момент времени t Множество всех оптимальных решений задачи совокупного потребителя для последовательности р обозначено FloT](p)

с

Производственный сектор в каждый момент t характеризуется технологическим множеством Z'czR*", каждый элемент (x',y'+I) которого интерпретируется как технологический процесс, осуществляющий выпуск вектора У+| е R" продуктов при материальных затратах, описываемых вектором х' е R:

На интервале [0,Г] производственный сектор решает следующую задачу максимизации прибыли

*(р,х,у) = Т£((р'+\у'+]}-(р',х'})-> шах ,

,=0 ' (х ,У )

(*'».у'+1)е 2', г = 0,1, ,Т-1, у° = у0 Здесь х' е , У+| е , у0 - начальный вектор ресурсов Оптимальное решение задачи максимизации прибыли представляется последовательностью (х,у) = {(х°,>'0),(3с1,)'1),. ,(хт,ут)), а множество всех таких решений для заданной последовательности цен р обозначено О,00'т[(р)

X у

На отрезке [0,Т] опредена экономика как совокупность

£ „ (Р,Т) = ( Я+"(Г+1\ ^(р), Щ Ц, (9)

где г° = (с°,х°,у°)<= /?+" - вектор состояния экономики в момент г = 0

Тройка (с, д:, у) еназывается допустимой траекторией экономики £„(/7,7") при ценах ре Л+"<7Ч1\ если се £10ол(/>)> О, у) е (р). Множество всех допустимых траекторией экономики Е^0(р,Т) обозначается К^„(р,Т)

Траектория (с,х, у)е называется равновесной в экономике

£ „ (р,Г), если существует такой вектор ре Л"(Г+1), что

1=0 1=0 1=0 1=0 Для рынка (9) найдены достаточные условия существования позиционной динамической устойчивости равновесных траекторий, которые кроме традиционных условий для существования равновесных траекторий содержат новые, характеризуемые как условия стабильности экономики

В §2 рассмотрена модель рынка ценных бумаг с к рисковыми активами и п инвесторами функционирующая на конечном интервале [0,Г], разбитом дискретными точками 0,1, ,Т Для инвесторов поставлена задача сформировать портфель ценных бумаг с определенным уровнем доходности и минимальным уровнем риска за интервал управления [0,Г]

Оптимизационная задача < -го инвестора имеет вид

х°=Ьу>0,у=1, Г = 1, ,7\ 7 = 1,. ,*.

к к

¿4=1, 1 = 1, ,Т, ¿тХ^/п/, г = 1, ,7\ 1'1х',1<а'цР)аг 1 = 1, ,Т,} = 1, X 0 < 0Су < 1, 4>0, 1 = 1, ,Т,у=1,. ,к,

Т к к

/=) }=\ ы 1

раметров в момент !, ац - параметр, обозначающий возможность перехода объектов из класса Л, в класс равен 0, если такая возможность есть, или 1, в

противном случае, (я,0, ,хЦ) - известное состояние системы в момент г, с^, р\ - фиксированные числа, выражающие ограничения на численность класса /?,, сц > О - затраты на переход одного объекта из класса Л, в класс RJ, С\ - затраты в момент времени г для класса /?,, у'( ) - заданная функция, характеризующая качество г-го шага социального процесса Предполагается, что в начальный момент Г = О каждый объект системы относится к какому-либо классу, т е

т 1=1

Любая последовательность Ф() = { Ф(1), ,ф(7')}, удовлетворяющая ограничениям задачи (11), называется допустимым управлением социальной системы Допустимое управление ф*() = {ф*(1), ,<р*(Т)}, доставляющее максимальное значение критерию J(x0,^p), называется оптимальным управлением Оптимальная траектория д:*(), вдоль которой выполняется условие

Т т Т т

Е £ = £ И аЛ< ((). ' = 1. .т,

(=1 ;=1 Г=1 )=\

называется равновесной траекторией социальной системы

С учетом уравнения состояния это условие перепишется в виде т т

2>*(0 = 5Х('-1)> 1 = 1.,т

1=1 г=1

В результате исследования вопроса существования позиционной динамической устойчивости равновесных траекторий в социальной системе (11), для непрерывного критерия качества по всем аргументам и выполнения ряда условий технического характера, было получено необходимое и достаточное условие позиционной динамической устойчивости ситуации равновесия

В §4 рассмотрен рынок труда, представленный т фирмами, п индивидами, / видами труда и г типами товаров потребления Задачи участников рынка формализованы в виде моделей оптимального управления на дискретном конечном временном интервале [0,Т]

Модель оптимального управления к -ой фирмы имеет вид

= .х°иф^ <4(4 -)-4;1, У = 1, ,1,1 = 1 ,т.

Ь Ф* ()) = Е л (4)) - (и'', х') - Л' шах,

г=0

где х° - начальное состояние ¿-ой фирмы, х^ - ресурсы А:-ой фирмы по у-му виду труда в момент времени I, <$>'к] - управление в момент времени (, если Ф^ > 0 (ф^ < 0) - фирма принимает (увольняет) работников у-го вида труда в количестве |ф^|, к[ - капитал (основные фонды) к-ой фирмы в момент времени I, у' - цена капитала (арендная плата за капитал) в момент времени ?, ¿к -фонд затрат на факторы производства к -ой фирмы в момент времени -почасовая ставка заработной платы по у -му виду труда в момент времени /, и'' = (и.'[, ,и','), /у7 - производственная функция к-ой фирмы для <?-ой продукции, /к = (/*, ,/к), р', - цена с/-ой продукции в момент времени г, р' =(р''1, ,р',г), 3£ - функция прибыли к -ой фирмы

Модель оптимального управления г -го индивида имеет вид

УМзЯ. ^.-уГ^Ч^^-уГ1, 7 = 1, ,/, Г = 1. ,7-,

г/+1 =(1 + 5')((м/,у1') + ^+(у;,7'>-(р',с1'», г = 1, ,Г-1, = ^ ,Т,у'ц>0, ; = ,1,1 = 1, ,7,

У-1

Я, (у,0,у,()) = 1;я;(у;)-^тах,

1=0

где у,0 - начальное состояние (-го индивида, у,^ - количество времени, которое I -й индивид затрачивает на работу вида у в момент времени г, \\)'и - управление выбираемое в момент времени г, если >0 (\]/у <0)- индивид увеличивает (сокращает) время работы по у -му виду труда на величину |, ^ - суммарный ресурс времени / -го индивида в момент времени г, У1к - доля прибыли к-ой фирмы, которую получает 1-й индивид в момент времени Г, У, = (У,1< '/!»,)• Ь, = (/;,,, ,Ь,Г) - вектор начальных запасов /-го индивида, с' =(с'п, ,с'г) - вектор, оценивающий приемлемый для 1-го индивида уровень благосостояния, где с' - минимальное допустимое количество товара <7-го ви-

да, необходимое i-му индивиду, S' - ставка банковского процента в момент времени t

Совокупность

M^^iQr'^t.H^ky,0)};,), (12)

где Q[tor'(;r°) - символическое обозначение модели к -ой фирмы, 4,l[0,ri(i|°) -

символическое обозначение модели i -го индивида, называется динамической моделью рынка труда

В модели (12) для фирм и индивидов введены определения допустимых управлений и оптимальных траекторий

Через х'кС) = max|o, х'к] - х'к]}, х'кП] = тах{(), х'к] - х'к]}, где х'к] - компонента

вектора х'к , являющегося сечением оптимальной траектории х*к() в момент времени t, обозначены соответственно спрос и предложение к -ой фирмы на рынке труда в текущем состоянии х[ Аналогично обозначены через УкС] = max{°. y'kj - y'kX У'кП] = тах{°' y'kj - у'к]\> где у\* ' компонента вектора у'*, являющегося сечением оптимальной траектории у*() в момент времени t, соответственно предложение труда ¿-го индивида и дополнительный спрос на труд, инициируемым i-м индивидом в текущем состоянии у\ Векторы

>'//7 =(vI/7i> >у'ии)> y',c-{y'kci> >У'ка) называются соответственно предложением труда i -го индивида и дополнительным спросом на труд, инициируемым / -м индивидом в текущем состоянии у\ Векторы

C'(x',y',W) = x'c(x',wt) + y'c(y',w'), n'(x',v',w') = xrn(x',wr) + y,n(y',w') называются соответственно рыночным спросом и рыночным предложением на рынке труда А/|0Г| в текущем состоянии (х',у')

На рынке М1<) ' '(х0, у") существует £-равновесная траектория, если найдется такая последовательность jvv £ , что для соответствующих ей оптимальных траекторий х*() и у*() задач фирм и индивидов и любого £>0 выполнено неравенство

£ С' (У\ у'*, и-'*) - £ П' (х'*,у'\ и-") < Е

Г=| /=1

В этом случае пара (х*( ),>'*()) называется е-равновесной траекторией рынка Мт\х{\уп)

Для динамической модели рынка труда (12) получено следующее условие существования позиционно динамически устойчивых равновесных траекторий Если, во-первых, фонд затрат на факторы производства не меньше, чем затраты

на капитал, для каждой фирмы в любой момент времени, во-вторых, у любого индивида имеется достаточно денежных средств для удовлетворения потребностей в товарах, в-третьих, производственные функции, функции полезности и траектории участников рынка непрерывны по своим аргументам, то принцип е-равновесности траекторий на рынке Л/'071 позиционно динамически устойчив

В завершение третьей главы обсуждена общая вычислительная схема для позиционно динамически устойчивых равновесных траекторий в рассмотренных моделях и приведен пример

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1 Предложена новая концепция позиционной динамической устойчивости, как обобщение принципа оптимальности Р Беллмана из теории оптимального управления, для динамических управляемых систем со многими управлениями и критериями качества Она также обобщает понятие принципа динамической устойчивости, введенного Л А Петросяном для дифференциальных игр вдоль их оптимальных траекторий, путем распространения последнего на все фазовое пространство

2 Как показывают приведенные в диссертационной работе исследования, принцип позиционной динамической устойчивости играет роль механизма реализуемости принципов оптимального поведения в широких классах динамических управляемых систем

3 Доказаны теоремы о позиционной динамической устойчивости принципов оптимального поведения как общего (для любых принципов оптимальности), так и частного (для таких принципов, как равновесие по Нэшу, С-ядро, НМ-решение, вектор Шепли) в конфликтно-управляемых системах Построен алгоритм вычисления позиционно динамически устойчивых оптимальных траекторий для многошаговых кооперативных игр без побочных платежей, аналогичный схеме динамического программирования из теории оптимального управления

4 С помощью единого подхода, основанного на концепции позиционной динамической устойчивости, исследованы вопросы стабильного и сбалансированного развития ряда социально-экономических систем

Выбор равновесных позиционно динамически устойчивых траекторий для реализации социально-экономических процессов может быть обоснован двумя причинами Во-первых, поскольку во всех рассмотренных моделях равновесие определяется на основе оптимальных (в смысле максимизации целевых функций) траекторий, то вдоль равновесной траектории достигаются наилучшие результаты для участников социально-экономических процессов, а также удовлетворены совокупные спросы и реализованы совокупные предложения Во-вторых, выполнение условий позиционной динамической устойчивости делает состоятельным во времени и пространстве принципы равновесия, когда у

участников процесса нет оснований для отказа от первоначально принятого принципа поведения до конца процесса

Следует заметить, что установление и построение позиционно динамически устойчивых равновесных траекторий в рассмотренных моделях, в общем случае, осложнены проблемами, присущими принципу оптимальности Р Белл-мана, и связанными с наличием большой размерности Тем не менее, как и в методе динамического программирования, для отдельных моделей социально-экономических систем предложенная схема вполне применима, о чем свидетельствуют рассмотренные в диссертации модельные примеры

Публикации по теме диссертации:

1 Смолин, Е А Исследование структуры Парето-оптимапьных инвестиций для предприятия / Е А Смолин // Сборник трудов студентов и молодых ученых КемГУ, посвященный 60-летию Кемеровской области / Кемеровский университет - Кемерово Полиграф, 2002 -В2т,Т2, с 104-106

2 Смолин, Е А Об одном подходе к оценке инвестиционных программ для предприятия / Е А Смолин // Материалы Всероссийской научно-практической конференции «Информационные технологии и математическое моделирование» - Томск Изд-во «Твердыня», 2002, с 301-302

3 Смолин, Е А Необходимое условие позиционной динамической устойчивости оптимальных решений в задачах конфликтного управления / Н.Н Данилов, Е А Смолин, НМ Яковлева//Вестник КемГУ Математика, №1(18), 2004, с 15-20

4 Смолин, Е А О необходимом и достаточном условии позиционной динамической устойчивости в сложных системах со многими управлениями / Е А Смолин // Информационные технологии и математическое моделирование Материалы III Всероссийской научно-практической конференции (11-12 декабря 2004 г) 4 1 -Томск Изд-во Том ун-та, 2004, с 165-167

5 Смолин, Е А Существование позиционно динамически устойчивых решений в некоторых задачах неклассической оптимизации / Е А Смолин // Обработка данных и управление в сложных системах Сборник статей / Под ред АФ Терпугова - Томск Изд-во Том ун-та, 2005 -Вып7, с 186-202

6 Смолин, Е А Достаточное условие позиционной динамической устойчивости в кооперативной дифференциальной игре с побочными платежами / Е А Смолин // Сборник трудов студентов и молодых ученых КемГУ, посвященный 60-летию Победы в Великой Отечественной войне / Кемеровский университет -Кемерово Полиграф, 2005 -Выпб, Т 3, с 144-146

7 Смолин, Е А Позиционная динамическая устойчивость в кооперативной игре без побочных платежей / Е А Смолин // Информационные технологии и математическое моделирование Материалы IV Всероссийской научно-практической конференции (18-19 ноября 2005 г) Ч 2 - Томск- Изд-во Том унта, 2005, с 112-114

8 Смолин, Е А Существование позиционно динамически устойчивых решений в одной кооперативной дифференциальной игре без побочных платежей /ЕА Смолин//ВестникКемГУ Математика, №4(24), 2005, с 61-69

9 Смолин, Е А Позиционная динамическая устойчивость равновесной траектории экономического развития / Е А Смолин // Наука и образование Материалы VI Международной научной конференции (2-3 марта 2006 г) В 4 Ч /Кемеровский Государственный Университет Беловский институт (филиал) -Белово Беловский полиграфист, 2006 -4 1, с 555-558.

10 Смолин, Е А Позиционная динамическая устойчивость оптимальных управлений финансовыми потоками предприятия / Е А Смолин // Информационные технологии и математическое моделирование Материалы V Международной научно-практической конференции (10-11 ноября 2006 г) -Томск Изд-воТом ун-та, 2006 4 2 с 135-138

11. Смолин, Е А Позиционно динамически устойчивое равновесие в многошаговой модели рынка ценных бумаг / Е А Смолин // Вестник Сибирского государственного аэрокосмического университета имени академика М Ф Ре-шетнева - Приложение к выпуску 3(10) - Красноярск СибГАУ, 2006, с 103112

Подписано к печати 13 03 2007 Формат 60х84'/|б Бумага офсетная X» 1. Печать офсетная Уел печ л 1,4 Тираж 100 экз Заказ №170

Издательство «Кузбассвузиздат» 650043, г Кемерово, ул Ермака, 7 Тел 58-34-48

Оглавление автор диссертации — кандидата физико-математических наук Смолин, Евгений Александрович

ВВЕДЕНИЕ.

ГЛАВА I. ПРИНЦИПЫ ОПТИМАЛЬНОГО ПОВЕДЕНИЯ В ДИНАМИЧЕСКИХ СИСТЕМАХ СО МНОГИМИ УПРАВЛЕНИЯМИ.

§ 1. Динамическая система со многими управлениями.

§2. Динамические модели социально-экономических задач принятия решения.

§3, Реализуемость принципов оптимальности в динамических управляемых системах.

§4. Позиционная динамическая устойчивость принципов оптимальности.

§5. Примеры позиционно динамически устойчивыхпринципов оптимальности.

ГЛАВА II. ПОЗИЦИОННАЯ ДИНАМИЧЕСКАЯ УСТОЙЧИВОСТЬ В МАТЕМАТИЧЕСКИХ МОДЕЛЯХ КООПЕРАТИВНОГО ПОВЕДЕНИЯ

§1. Кооперативные дифференциальные игры с побочными платежами.

§2. Кооперативные дифференциальные игры без побочных платежей.

§3. Позиционная динамическая устойчивость в многошаговых кооперативных играх.

§4. Вычисление позиционно динамически устойчивых решений с применением схемы динамического программирования.

ГЛАВА III. ПРИМЕНЕНИЕ ПРИНЦИПА ПОЗИЦИОННОЙ ДИНАМИЧЕСКОЙ УСТОЙЧИВОСТИ В МАТЕМАТИЧЕСКИХ МОДЕЛЯХ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМ

§1. Пространственно-временная состоятельность равновесных траекторий в одной модели экономической динамики.

§2. Позиционная динамическая устойчивость равновесных траекторий в многошаговой модели рынка ценных бумаг.

§3. Позиционная динамическая устойчивость в модели изменения социальной структуры населения.

§4. Пространственно-временная состоятельность равновесной траектории в модели рынка труда.

§5. Обсуждение вычислительного аспекта позиционно динамически устойчивых равновесных траекторий в социально-экономических моделях

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Смолин, Евгений Александрович

В диссертационной работе изучаются вопросы состоятельности во времени и пространстве принципов оптимального поведения в динамических системах со многими управляющими параметрами и критериями качества. К таким объектам относятся широкие классы конфликтно-управляемых систем, динамические задачи векторной оптимизации и так называемые неклассические социально-экономические задачи принятия решения. Во всех таких задачах проблемы, связанные с принципами оптимального поведения, являются одними из центральных. Широта применения и значимость делают их исследование актуальными. Большое разнообразие принципов оптимальности разработано и изучается в теории игр (принцип минимакса, равновесие по Нэшу, С-ядро, вектор Шепли и т.д. [8,18, 34,39,40,44,49, 62, 64,67]), в теории многокритериальной оптимизации (принципы Парето, Слейтера, Джоф-фриона и т.д. [42, 51]) и в математической экономике (различные концепции равновесия [2,13,26,29,41,54,60]).

Каждый принцип оптимальности имеет определенные границы приложимости, в пределах которых он может считаться адекватным описанием содержательного оптимального поведения. Поэтому при обобщении результатов статической теории принятия решения на динамические системы, что продиктовано естественным ходом развития теории, возникает вопрос о применимости того или иного принципа оптимальности в новом более широком классе задач. На этом пути, как отмечал Н.Н. Воробьев [8], можно ожидать нахождения обоснованных критериев выбора принципов оптимальности применительно к разнообразным классам задач, а также формальное конструирование новых принципов, которые могут оказаться весьма плодотворными. Данная диссертационная работа по своему содержанию относится к этому кругу актуальных проблем.

Наиболее естественным подходом к изучению принципов оптимального поведения в динамических системах является применение (обобщение) методологии и результатов, полученных в статической теории оптимизации и принятия решения. Однако попытка переноса «статических» принципов оптимальности на динамические задачи сталкивается с проблемами, связанными с особенностями динамических процессов.

Как известно, применение конкретного принципа оптимальности в статических задачах обосновывается его содержательностью, то есть соответствием фактическому пониманию оптимальности и реализуемостью этого принципа для широких классов задач. В динамических задачах принятия решения к этим двум требованиям естественным образом добавляется еще одно: содержательность и реализуемость принципа оптимальности должны сохраняться на протяжении всего динамического процесса. Это свойство и лежит в основе понятия динамической устойчивости принципов оптимальности, играющего роль механизма их реализуемости вдоль траектории динамической системы.

Прежде чем перейти к изложению цели и основных результатов работы вкратце осветим историю вопроса.

В середине пятидесятых годов двадцатого столетия академиком JI.C. Понтрягиным и группой его сотрудников были заложены основы математической теории оптимальных процессов [52], как науки занимающейся математическими моделями управляемых объектов и систем с целью выработки оптимальных способов управления ими. Изначальные результаты были получены для систем, описываемых дифференциальными уравнениями. Позже эта теория получила широкое распространение для различных классов задач оптимального управления [5-7, 32,33,43,53].

Одним из стержневых результатов теории оптимального управления является метод динамического программирования [4], развитой американским математиком Р. Беллманом на основе введенного им принципа оптамальности. Согласно этому принципу, оптимальное управление должно обладать свойством: независимо от того, каким образом система оказалась в данном состоянии в данный момент, ее дальнейшее развитие должно протекать оптимальным образом. Принципу оптимальности Р.Беллмана удовлетворяют позиционные управления, так как программные управления зависят только от параметра времени. Принцип Р. Беллмана применим только для задач оптимального управления с одним функционалом качества и не применим для более сложных динамических систем со многими управлениями и многими функционалами качества, а также для тех неклассических задач управления, в которых оптимальное поведение определяется иначе, чем максимизация одного функционала качества.

К такого рода задачам, прежде всего, относятся динамические игры (конфликтные задачи управления) [1, 3, 9, 12, 17, 31, 35, 45,48, 50, 59, 66, 68 и др.], возникшие на стыке теории оптимального управления и теории игр.

При изучении динамических процессов управления со многими участниками нельзя не учитывать возможность кооперации между участниками. В классической теории игр модели, учитывающие возможность кооперации, занимают ведущее положение [8,40].

Наиболее естественным подходом к изучению кооперативных динамических игр, как игр дележей, является применение методологии кооперативной теории Неймана-Моргенштерна [40]. Однако использование результатов классической теории невозможно без разрешения проблем, связанных с особенностями динамических процессов. В первую очередь - это перенос на динамические системы кооперативных принципов оптимальности. Разрешение этой проблемы стало возможным в середине 70-х годов, когда JI.A. Петрося-ном была высказана идея о необходимости учета устойчивости во времени (динамической устойчивости) теоретико-игровых принципов оптимальности.

Впервые понятие динамической устойчивости было сформулировано и обосновано JI.A. Петросяном в работе [46]. Для более общих классов кооперативных дифференциальных игр оно было сформулирована в работах [47, 48].

Динамическую устойчивость в общем виде можно сформулировать следующим образом: решение динамической игры, построенное в начальный момент игры (в начальном состоянии) согласно тому или иному принципу оптимальности, должно удовлетворять тому же принципу оптимальности в каждый момент времени (в текущем состоянии) при движении по оптимальной траектории вплоть до момента окончания игры. Динамическая устойчивость представляет собой то важное свойство принципов оптимальности, согласно которому игроки в каждый момент времени ориентируются на один и тот же принцип оптимальности и не имеют основания для отклонения от первоначально принятого поведения до конца игры. В первый же момент нарушения динамической устойчивости, выбранный в начале способ поведения перестает быть оптимальным и потому нереализуемым.

Принцип динамической устойчивости остается содержательным для широкого класса многокритериальных задач теории оптимального управления и неклассических задач оптимизации [15, 16, 50 и др.]. В этой связи укажем на работы зарубежных авторов [63, 65], в которых сформулировано свойство «состоятельности во времени» (time consistence) принципов оптимальности в задачах векторной оптимизации.

В отличие от принципа оптимальности Р. Беллмана, определяемого на всем пространстве состояний, динамическая устойчивость (по Петросяну) определена вдоль фиксированной (оптимальной) траектории и может рассматриваться как "программный" принцип поведения. Отсюда возникает задача обобщения принципа динамической устойчивости на все фазовое пространство изучаемой системы.

Основной целью диссертационной работы является разработка и применение нового принципа, называемого принципом позиционной динамической устойчивости, который может быть положен в основу единого подхода к изучению сложных динамических задач управления.

Таким образом, научная новизна диссертационной работы заключается в разработке новой концепции оптимальности в динамических управляемых системах и вытекающей отсюда новизне полученных результатов.

В диссертационной работе принцип динамической устойчивости (по Петросяну) обобщен на все фазовое пространство в виде принципа позиционной динамической устойчивости.

Суть принципа позиционной динамической устойчивости заключается в том, что в каком бы фазовом состоянии не оказалась динамическая система в некоторый момент времени, дальнейшее ее развитие из текущего состояния должно протекать оптимальным и устойчивым образом.

Можно сказать, что принцип позиционной динамической устойчивости отличается от динамической устойчивости по Петросяну (от программной динамической устойчивости) так же, как позиционное управление отличается от программного управления в теории оптимальных процессов.

Основные положения диссертации, выносимые на защиту, формулируются следующим образом:

1. Введено понятие позиционной динамической устойчивости для многокритериальных динамических систем со многими управлениями, являющееся обобщением принципа Р. Беллмана из теории оптимального управления; в качестве обоснования его состоятельности приведены примеры как по-зиционно динамически устойчивых, так и позиционно динамически неустойчивых принципов оптимальности из разных задач неклассической оптимизации.

2. В различных моделях конфликтно-управляемых систем, представляемых в виде дифференциальных и многошаговых игр, доказаны теоремы об условиях существования и о необходимых и достаточных признаках позиционной динамической устойчивости их решений в смысле различных принципов оптимальности (с-ядро, НМ-решение, вектор Шепли, множество Па-рето).

3. С применением единого подхода, основанного на концепции позиционной динамической устойчивости, как механизма реализуемости оптимальных траекторий, исследованы динамические модели ряда социально-экономических систем: экономической динамики, рынка труда, рынка ценных бумаг, изменения социальной структуры населения; в каждой из моделей для применяемых в них различных принципов равновесности (аналогов и модификаций равновесия по Вальрасу) найдены условия их позиционной динамической устойчивости.

4. Построены метод и соответствующий алгоритм вычисления позиционно динамически устойчивых решений в кооперативных многошаговых играх без побочных платежей как обобщение метода динамического программирования из теории оптимальных процессов.

Перейдем к краткому изложению основных результатов работы.

Диссертация состоит из введения, трех глав и списка литературы. Общий объем работы составляет 167 страниц машинописного текста.

Заключение диссертация на тему "Принцип позиционной динамической устойчивости и его применение в системах со многими управлениями"

ЗАКЛЮЧЕНИЕ

1. Предложена новая концепция позиционной динамической устойчивости, как обобщение принципа оптимальности Р. Беллмана из теории оптимального управления, для динамических управляемых систем со многими управлениями и критериями качества. Она также обобщает принятие принципа динамической устойчивости, введенного Л.А. Петросяном для дифференциальных игр вдоль их оптимальных траекторий, путем распространения последнего на все фазовое пространство.

2. Как показывают приведенные в диссертационной работе исследования, принцип позиционной динамической устойчивости играет роль механизма реализуемости принципов оптимального поведения в широких классах динамических управляемых систем.

3. Доказаны теоремы о позиционной динамической устойчивости принципов оптимального поведения как общего (для любых принципов оптимальности), так и частного (для таких принципов, как равновесие по Нэшу, С-ядро, НМ-решение, вектор Шепли) в конфликтно-управляемых системах. Построен алгоритм вычисления позиционно динамически устойчивых оптимальных траекторий для многошаговых кооперативных игр без побочных платежей, аналогичный схеме динамического программирования из теории оптимального управления.

4. С помощью единого подхода, основанного на концепции позиционной динамической устойчивости, исследованы вопросы стабильного и сбалансированного развития ряда социально-экономических систем. Выбор равновесных позиционно динамически устойчивых траекторий для реализации социально-экономических процессов может быть обоснован двумя причинами. Во-первых, поскольку во всех рассмотренных моделях равновесие определяется на основе оптимальных (в смысле максимизации целевых функций) траекторий, то вдоль равновесной траектории достигаются наилучшие результаты для участников социально-экономических процессов, а также удовлетворены совокупные спросы и реализованы совокупные предложения. Во-вторых, выполнение условий позиционной динамической устойчивости делает состоятельным во времени и пространстве принципы равновесия, когда у участников процесса нет оснований для отказа от первоначально принятого принципа поведения до конца процесса.

Следует заметить, что установление и построение позиционной динамической устойчивости равновесных траекторий в рассмотренных моделях в общем случае осложнены проблемами, присущими принципу оптимальности Р. Беллмана, и связанными с наличием большой размерности. Тем не менее, как и в методе динамического программирования, для отдельных моделей социально-экономических систем предложенная схема вполне применима, о чем свидетельствуют рассмотренные в диссертации модельные примеры.

Библиография Смолин, Евгений Александрович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Айзеке, Р. Дифференциальные игры / Р. Айзеке. -М.: Мир, 1967.

2. Ашманов, С.А. Введение в математическую экономику / С.А. Ашманов. -М.: Наука, 1984.

3. Байдосов, В.А. О подходе к определению динамических игр на языке обобщенных динамических систем / В.А. Байдосов // Оптимальное управление системами с неопределенной информацией. Свердловск: УНЦ АН СССР, 1980, с. 3-11.

4. Беллман, Р. Динамическое программирование / Р. Беллман. М.: ИЛ, 1960.

5. Болтянский, В.Г. Оптимальное управление дискретными системами / В.Г. Болтянский. -М.: Наука, 1973.

6. Брайсон, А. Прикладная теория оптимального управления /А. Брайсон, Хо Ю-ши. М.: Мир, 1972.

7. Варга, Дж. Оптимальное управление дифференциальными и функциональными уравнениями / Дж. Варга. М.: Наука, 1977.

8. Воробьев, Н.Н. Теория игр для экономистов кибернетиков / Н.Н. Воробьев. -М.: Наука, 1985.

9. Грауэр, Л.В. Многошаговые игры / Л.В. Грауэр, Л.А. Петросян Л.А. // Прикл. мат. и мех. (Москва). 2004.68, №4, с. 667-677.

10. Данилов, Н.Н. Динамическая оптимизация портфеля инвестиций / Н.Н. Данилов // II Международная конференция по матем. моделированию. Якутск, 1997.

11. Данилов, Н.Н. Динамическая устойчивость экономического равновесия / Н.Н. Данилов // II Сибирский конгресс по индустриальной математике. Тезисы докладов. Новосибирск, 1996.

12. Данилов, Н.Н. Кооперативные многошаговые игры без побочных платежей / Н.Н. Данилов // Кибернетика, 1990, №5, с. 72-78.

13. Данилов, Н.Н. Курс математической экономики: Учеб. пособие / Н.Н. Данилов. М.: Высш. шк., 2006.

14. Данилов, Н.Н. Методологические аспекты теоретиково-игрового моделирования рынка труда на уровне региона / Н.Н. Данилов // Сб. «Природные и интеллектуальные ресурсы Сибири», Томск, 2004.

15. Данилов, Н.Н. Модель экономического равновесия в динамике / Н.Н. Данилов // Вестник КемГУ. Математика №3 (7), 2001.

16. Данилов, Н.Н. Принцип динамической устойчивости в сложных системах управления / Н.Н. Данилов // Доклады СО АН ВШ, «2 (6), 2002.

17. Данилов, Н.Н. Решение задачи динамической устойчивости в кооперативной дифференциальной игре с побочными платежами / Н.Н. Данилов // Прикладная математика и механика. 1989. Т. 53. - Вып. 1. - С. 45-59.

18. Данилов, Н.Н. Теоретико-игровое моделирование конфликтных ситуаций / Н.Н. Данилов. Томск: Изд-во Том. ун-та, 2005.

19. Данилов, Н.Н. Принцип динамической устойчивости в математических моделях экономики / Н.Н. Данилов, Т.В. Голоколосова, В.В. Мешечкин // Матем. заметки ЯГУ. 1996. - т. 3, №2. С. 22-37.

20. Данилов, Н.Н. Динамически устойчивое равновесие в математической модели социальной системы / Н.Н. Данилов, C.JI. Злобина // IX Международная научно-практическая конференция «СИБРЕСУРС 9 - 2003», Доклады, Томск, САН ВШ, 2003.

21. Данилов, Н.Н. Содержательность во времени равновесных траекторий на рынке ценных бумаг / Н.Н. Данилов, Е.А. Николаева // «СИБРЕСУРС 8 - 2002»: Тез. докл. науч. конф. - Кемерово, 2002. - С. 120-122.

22. Данилов, Н.Н. Математическая модель равновесия на рынке труда / Н.Н. Данилов, Н.В. Осокина // Вестник КемГУ. Математика. 2000. - Вып.4. - С.44-54.

23. Егорова, А.А. Равновесие в многошаговой неантагонистической игре двух лиц / А.А. Егорова // Мат. заметки ЯГУ. 2003.10 №2, с. 43-51.

24. Интрилигатор, М. Математические методы оптимизации и экономическая теория / М. Интрилигатор. М: Прогресс, 1975.

25. Калихман, И.Л. Динамическое программирование в примерах и задачах / И.Л. Калихман, М.А.Войтенко. М.: Высшая школа, 1979.

26. Канторович, Л.В. Функциональный анализ / Л.В. Канторович, Г.П. Аки-лов. М: Наука, 1977.

27. Карлин, С. Математические методы в теории игр, программировании и экономике / С. Карлин. М.: Мир, 1964.

28. Корниенко, Н.А. Решения кооперативных динамических игр. Автореферат диссертации на соискание ученой степени кандидата физ.-мат. наук /' Н.А. Корниенко. С.-Петербург. Гос. Ун-т, Санкт-Петербург, 2003.

29. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красов-ский, А.И. Субботин. -М.: Наука, 1974.

30. Кротов, В.Ф. Методы и задачи оптимального управления / В.Ф. Кротов, В .И. Гурман. М.: Наука, 1973.

31. Ли, Э.Б. Основы теории оптимального управления / Э.Б. Ли, Л. Маркус. -М.: Наука, 1972.

32. Льюис, Р. Игры и решения. Введение и критический обзор / Р. Льюис, X. Райфа.-М.:ИЛ, 1961.

33. Малафеев, О.А. О существовании ситуации равновесия в дифференциальных бескоалиционных играх двух лиц с независимыми движениями / О.А. Малафеев // Вестник ЛГУ, 1980. №7. - С. 12-16.

34. Мамкина, С.И. Многошаговые игры с полной информацией и переменным коалиционным разбиением. Автореферат диссертации на соискание ученой степени кандидата физ.-мат. наук. С.-Петербург / С.И. Мамкина. Гос. Ун-т, Санкт-Петербург, 2005.

35. Моришима, М. Равновесие, устойчивость, рост / М. Моришима. М.: Наука, 1972.

36. Мулен, Э. Теория игр. С примерами в математической экономике / Э. Мулен. М.: Мир, 1983.

37. Нейман, Дж. фон. Теория игр и экономической поведение / Дж. фон Нейман, О. Моргенштерн. М.: Наука, 1970.

38. Никайдо, X. Выпуклые структуры и математическая экономика / X. Ни-кайдо. М.: Мир, 1972.

39. Ногин, В.Д. Основы теории оптимизации / В.Д. Ногин, И.О. Протодьяконов, И.И. Евлампиев. М.: ВШ, 1986.

40. Основы теории оптимального управления / В.Ф. Кротов, Б.А. Лагоша, С.М. Лобанов и др. М.: ВШ, 1990.

41. Оуэн, Г. Теория игр / Г. Оуэн. М.: Мир, 1971.

42. Петросян, Л.А. Дифференциальные игры преследования / Л.А. Петросян. Л.: Изд-во ЛГУ, 1977.

43. Петросян, JI.A. Устойчивость решений в дифференциальных играх со многими участниками / JI.A. Петросян // Вестник ЛГУ, 1977. №19. - С. 46-52.

44. Петросян, Л.А. Классификация динамически устойчивых решений в кооперативных дифференциальных играх / Л.А. Петросян, Н.Н. Данилов. -Известия ВУЗ. Математика. 1986, №7. С. 24-35.

45. Петросян, Л.А. Кооперативные дифференциальные игры и их приложения / Л.А. Петросян, Н.Н. Данилов. Томск: Изд-во ТГУ, 1985.

46. Петросян, Л.А. Теория игр / Л.А. Петросян, Н.А. Зенкевич, Е.А. Семина. -М.:ВШ, 1998.

47. Петросян, Л.А. Динамические игры и их приложения / Л.А. Петросян, Г.В. Томский. Л.: Изд-во ЛГУ, 1982.

48. Подиновский, В.В. Парето-оптимальные решения многокритериальных задач / В.В. Подиновский, В. Д. Ногин. М.: Наука, 1982.

49. Понтрягин, Л.С. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко. М.: Наука, 1976.

50. Пропой, А.И. Элементы теории оптимальных дискретных процессов / А.И. Пропой. -М.: Наука, 1978.

51. Розенмюллер, Н. Кооперативные игры и рынки / Н. Розенмюллер. М.: Мир, 1974.

52. Рокафеллер, Р. Выпуклый анализ / Р. Рокафеллер. М.: Мир, 1973.

53. Сансоне, Дж. Обыкновенные дифференциальные уравнения / Дж. Сан-соне.-М.: ИЛ, 1954, т. 2.

54. Скорняков, Л.А. Системы линейных уравнений / Л.А. Скорняков. М.: Наука, 1986.

55. Эльсгольц, Л.Э. Дифференциальные уравнения и вариационное исчисление / Л.Э. Эльсгольц. М.: Наука, 1965.

56. Basar, Т. Dynamic noncooperative game theory / T. Basar, I. Oldster. N. Y., Ac. Press, 1982.

57. Bierman, H.S. Game theory in economic applications / H.S. Bierman, l. Fernandez. Addison Wesley Publishing Company, INC, USA, 1993.

58. Blaquiere, A. Geometry of Pareto Equlibria in N-person Differential games / A. Blaquiere, L. Juricek, K.E. Wiese. Topics in Differential Games. Amsterdam-London, 1973.

59. Game theory and Applications. Vol. 10 / Petrosjan L.A., Mazalov V.V. Haup-pauge (N.Y.): Nova Sci. Publ. 2005.

60. Hillier, B. Dinamic inconsistency, rational expectations and optimal gover-ment policy / B. Hillier, M. James. Econometrica, 1984, v.52, p. 1437-1451.

61. Hinojosa, M.A. Core, least core and nucleolus for multiple scenario cooperative games / M.A. Hinojosa, A.M. Marmol, L.C. Thomas. Eur. J. Oper. Res. 2005.164, №1, p. 225-238.

62. Holly, S. On optimality and time consistency when expectations are rational / S. Holly, M.B. Zarrop. European economic review, 1983, v. 20, p. 23-40.

63. Leitman, G. Cooperative and Non-cooperative Many Player Differential Games / G. Leitman. Vienna, Springer Verlag, 1974.

64. Myerson, A B. Game theory. Analysis of conflict / A B. Myerson. Harvard University Press. Cambridge, Massachusetts, London, England, 1991.

65. Starr, A.W. Nonzero-sum Differential Games / A.W. Starr, Y.C. Ho. J. Optimiz. Theory and Appl., 1969,3, №3.

66. D.W.K.,Yeung Dynamically Stable Corporate Joint Ventures / Yeung D.W.K., Petrosyan L.A. -Automatica, v. 42,2006, p. 365-370.1. Труды автора

67. Смолин, E.A. Необходимое условие позиционной динамической устойчивости оптимальных решений в задачах конфликтного управления

68. Н.Н. Данилов, Е.А. Смолин, Н.М. Яковлева // Вестник КемГУ. Математика, №1(17), 2004. с. 15-20.

69. Смолин, Е.А. Существование позиционно динамически устойчивых решений в одной кооперативной дифференциальной игре без побочных платежей / Е.А. Смолин // Вестник КемГУ. Математика, №4(24), 2005. с. 61-69.