автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Равновесие по Нэшу при определенности
Автореферат диссертации по теме "Равновесие по Нэшу при определенности"
На правах рукописи
Махаркила Татьяна Владимировна
РАВНОВЕСИЕ ПО КЭШУ ПРИ НЕОПРЕДЕЛЕННОСТИ
05.13.16 - применение вычислительной техники, математического моделирования и математических методов в научных исследопаннх (по физико-математическим наукам)
Автореферат диссертации на. соискание ученой степени кандидата физико-математических наук
Москва -
1997
Работа выполнена на кафедре математики физико-математического факультета Орехово-Зуевского педагогического института
Научный руководитель -кандидат физико-математических наук, доцент Г.И. Житомирский
Официальные оппоненты:
доктор физико-математических наук, профессор В.И. Благодатских кандидат технических наук, доцент В.А. Серов
Ведущая организация:
Московский Государственный Технический Университет им. Н.Э. Баумана
Зашита состоится " и_ 1987 г. в 15 час. 00 мин.
на заседании диссертационного совета К 053.22.28 в Российском университете дружбы народов.
Адрес: 117923, Москва, ул. Орджоникидзе, 3.
г
С диссертацией можно ознакомится в Научной библиотско Российского университета дружбы народов по адресу: 117198, ул. Миклухо-Маклая, д.6.
Автореферат разослан " "_ 1997 г.
Ученый секретарь
диссертационного совета
кандидат физико-математических наук,
Доцент С.С. Спесивов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Многие технические, экономические и социальные проблемы, возникающие и процессе деятельности человеческого общества, требуют построения математических моде ей, в которых учитываются, по крайней мере, пять факторов. Во-первых, наличие нескольких взаимосвязанных управляемых систем, интересы которых не совпадают. Во-вторых, наличие возмущений, помех, ошибок измерений н другого вида неопределенностей, о которых известны лишь границы изменении, а какие-либо вероятностные характеристики отсутствуют. В-третьих, сами системы меняются с течением временя. В-четвертых, управление системами осуществляется по принципу обратной связи. В-нятых, необходимость учета запаздывания при передаче информации.
Одновременный учит всех указанных факторов является, несомненно, актуальным к может быть осущсстчлсн в рамках дифференцнально-разпосгных игр нескольких лиц при неопределенности.
Цель работы состоит в исследовании некоторых вопросов теории бескоалиционных игр при исоирсделешюсти таких, как формализация ре-шеннй на основе концепции равновесия но Пэшу, их классификация, исследование существования и построение решением, в том числе для позиционных линейно-квадратичных дифференциально-разностных игр при неопределенности.
Методика исследования. В доказательствах используются общие понятия и факты из теории игр, теории многокритериальных задач, выпуклого анализа, теории дифференциальных уравнений с залаэдывани- ■ см времени, оптимального управления.
Научная иопизна. Для бескоалиционных игр при неопределенности на осноае концепции равновесия по Нэш1' формализованы новые понятия решений, исследованы их свойства. Доказано существование таких решений п классе смешанных стратегий. В качестве примера рассмотрена одна из задач охраны окружающей среды от загрязнения.
Для дифференциально-разностных позиционных линейно-квадратичных игр при неопределенности формализованы новые решения, проведена их классификация. На основе динамического программирования получены достаточные условия существования, найден яциый вид решений и предложен способ построения выигрышей игроков по известный ситуации и неопределенности.
Основные результаты являются новыми.
Практическая н теоретическая ценность. Полученные и диссертации подходы можно использовать для общего исследопаиня дифференциаль-по-р злостных игр при неопределенности. Прелагаемые сг..>собы построения нопых равновесий дают возможность решать некоторые конкретные задачи экономики, экологии (н качестие примера в диссертации ирннедено решение задачи охраны окружающей среды от загрязнения).
Апробация работы. Результаты, состаиляющие содержанке работы, обсуждались ла региональных, всероссийских: и международных конференциях, школах, сешшарах. Они докладыналнсь на III Международной научной конференции "Многокритериальные задачи при пеонреде-лешюстц" (Орехово-Зуегю, 390-1), IV школе "Математические лробле-ш( зколоти" (Чата, 199-1), Ш Международной конференции xcuuniit-ыатематнкоь (г.Воронеж, 1995), Международном научном конгрессе студентов, &спирантоп и молодых ученых "Молодежь и наука - третье тысячелетие" (Москиа, 190G), Международной конференции "Математики, компьютер, образонаине" (Дубна, 1S9GJ, IV Международной конференции жешдин-математикои "Математика. Моделирование. Экология." (Волгоград, 19%), IV Международной научной конференции "Многокритериальные и игровые задачи при неопределенности" (г.Орехово-Зуено, 19(JG), а также на научных семинарах Института Кибернетики Академии Паук Украины, Российского унннсрситста дружбы народен к Орехоюо-Зуеиского педагогического института.
Публикации. Основные результаты изложены к статьях [2, 3, Б, 6j и тезисах (1, А, 7, 8], некоторые из них и.-полнены л соапторстве. Утверждения; пошедшие и диссертацию, получены, аптором самостоятельно.
Структура и объем работы. Диссертации состоит из введения к дкух г л an, разбитых на 10 параграфов. Объем работы 104 страницы машинописного текста. Библиография содержит 57 паимспопннин.
СОДЕРЖАНИЕ ГАВОТЫ
Do В1>иценни обосионыиается выбор темы диссертации н кратко изложены основные результаты работы.
В первой главе рассматривается бескоалиционная игра п лиц при неопределенности '
r=<N,{{A'i},eH.y},(/i(i.y)),£N>> (О
где N = {1,2,...,п} - множество номеров'игрокои; п игре (1) каждый i-UH игрок выбирает и использует свою стратегию х, 6 А'; С It"' (i 6
6 М), п результате складывается ситуация х = (zi,...,хп) Е X С R" (п = £ "Ol предполагаем, что А"; - компактное подмножество в Rni; ¡eN
А' = П А';; неопредело.лости у £ Y € comp It"1; скалярная функция .eN
пынгрыша fi[x,y) для i-го (г Г; Г!) игрока непрерывна на X х У; п-мернын тектор /(sc,v) = (Ji,У>, /п.(ас,У» = {№ ,У))-еП-
При принятии решений и игре (1) игроками учитываются два обстоя тел ьстп а:
- бескоалиционны)! "характер" игры,
- наличие: нпзмущеннй, помех н других неопределенностей.
U днох-рташш предлагаются два подхода к формализации решения игры (1). Нсриы» m них представляет собой аналог ссдлооой точки ап-тагоинсгнчсской игры с напорной функцией выигрыша, второй - модн-фипирует попятно оскториог.о макешшна, предложенного В.К. Жуковским для многокритериальных динамических задач при неопределенности1,
Оирсдслсшш 1. Ситуацию х* ~ (х|,..., х/п) £ X назовем рао-нооссис.я Нэ\иа-Слсйтсра игры (1), если существует неопределенность ys G У такая, что
1°. fi{x'И®.-, ys) < Vs), € Xi, i E N; 2°. система неравенств
Ш\у)<!i(*',Vs)» »ем,
несовместна при нссх у С V.
Здесь и далее используется обозначение
(хс||а:{) = (х|,..., ,xhx';+i,...,»;) = (х,-,
Утверждеиис 1. Если z' - равновесие Пэша-Слей repa нгрЬ' (1), jfs - соответствующая неопределенность, то
h{x\ys) > шах min тт/,(г;,гг№;,у), i GM, »er *
где xpivi = (гi,..., a;,_i, zl+l, xn) G Хщ = П Xy
je N\i
Пусть ял - множество всех пар (хе, ys), удовлетворяющих определению 1.
'Zbukovekiy V.l. end Saiukv&dze М.Е. The Vector-Valued Maxlrain. Doeton, Mew York, London: Academic Pre«, Inc., 1994. 404 p.
Утверждение 2. Множество Ш1 = {(ж'.Уз)} является компактным подмножеством (быть может, пустым) в X х У.
Д лее предлагаются два способа сведения бес эалицнониой игры при неопределенности (1) к известным в общей теории игр задачам. Первый сводит нахождение равновесия Нзша-Слейтера к построению седловон точки следующей антагонистической игры со скалярной функцией выигрыша
<Л'хУДхУ,ф,Ми)>. (2)
где Ф(х,у,2,гг) = £ - /¿(ж,«)], вектора е а у,
¿еМ
V 6 У, тогда б х€ X, г = (гь>. .,гя)е X.
В игре (2) первый (минимизирующий) игрок выбором своей стратегии (ж,з/) € X х У стремится достичь нозыожио меньших значений Ф(ж,у, г, у), второй (максимизирующий Ф(ж, у, г, у)) распоряжается вы. бором € X < У.
Теорема 1. Если (ж^уя.г0,«0) - седловая точка игры (2), т.е.
при любых х,г € X, у,ь € У, то хс есть равновесие Нэша-Олейтера игры (1).
Другой способ отыскания равновесия Изша-Слейтера сводится к построению ситуации равновесия по Нэшу специальной бескоалиционной игры, эффективно конструируемой по исходной (1). Для этого бескоалиционной игре при неопределенности (1) поставим в соответствие вспомогательную бескоалиционную игру (без неопределенностей)
<ки{п + 1},{{л;}{е№У},(Л(г,г/))...»л^.^.л+^х.у)) >. (з)
В отличие от игры (1), здесь добавлен <"це один игрок (п + 1-ый), ко-• торый выбором своей стратегии у 6 У стремится достичь возможно большего значения своей функции выигрыша
У) =-£//(*,!>)• ¿еМ
Теорема 2. Если пара (я'.уу) является ситуацией равновесия по Чэшу бескоалиционной игры (3), то х' есть равновесия Изша-Слейтера игры (1). . '
На основании этих двух подходов установлено существование решения Нэша-Слентерав смешанных стратегиях и выделены частные виды игры (1), в которых данное решение достигается в чистых стратегиях.
Наконец, рассматривается следующая задача экологии - задача охраны окружающей среды от загрязнения.
Каждое из трех промышленных предприятий (игроки 1-3), пользующихся для технических целен водой из некоторого природного водоема, располагает Двумя чистыми стратегиями: использование очистных сооружений для отработанной поды (стратегия 0) илч сбрасывание ее в водоем без очистки (стратегия 1). При этом первые два ire знают стратегии третьего и его стратегии являются нсолределенньш фактором (неопределенностью) для иершлх двух. Предполагается, что особенности водоема и технических процессов на первых д»ух предприятиях та-■ ковы, что если неочищенную воду сбрасывает только одно предприятие, вода и водоеме остается пригодной для использования, и предприятия убытка не несут. Если же неочищенную под у сбрасывают не менее двух предприятий, то каждый пользователь несет убытки в размере трех (денежных) единиц. Стоимость использования очистных сооружений ' обходится каждому предприятию в одну (денежную) единицу.
Тогда математическую модель взаимодействия предприятий можно представить в виде следующей бескоалиционной игры двух лиц при неопределенности
где 1 и 2 - номера игроков; множество А",- стратегий х; для г-го игрока есть Л'; = {0,1}; множество У неопределенностей у будет У"= {0,1}, Наконец, функция выигрыша г-го игрока
О, если (Xi = 1) А (|Л'| < 1), -1, если fo = 0) Л < 1), -3, если (аг{ = 1) Л (|ЙГ| > 2), —4, если (ж; = 0) Л (jft'j > 2).
Здесь К - множество номеров предприятий, сбрасывающих неочищенную воду; [К\ - их число.
На основании теоремы 2 бескоалиционной игре двух лиц при неопределенности (4) поставим в соответствие бескоалиционную игру трех лиц (без неопределенности) в смешанных стратегиях
r=<{l,2,a>f{{^>Wla,W>,(/<(vi,^,ii))i-iljiJ>, (5)
где добавлен третий игрок с функцией выигрыша
j
М"и Ъ, /0 = - J2 fi(vu^t /*)•
J*l
fi{x 1,^3,у):
В игре (5) каждая смешанная стратегия игрока полностью опи-сыпается вероятностью выбора им своей пторон чистой стратегии
Таким образом, множество всех смешанных стратегий этого игрока можно представить как сегмент [0,1], а множество всех ситуаций в смешанных стратегиям - как единичный 3-мерный куб. Следовательно, ь игре (5) множества сметанных стратегий игроком имеют вид
М = Шй 6 [0,1]} (г = 1,2), {/;} = {616 6 [0,1]}.
В диссертации найдено равновесие Нэша-Слентсра игры (5), исследованы его свойстиа, онисыпается все множестио таких решений, обсуждаются их позитивные и негативные стороны.
Формализацию решения игры (1) (на основе аналога векторного ыак-симина) проведем в три этапа.
I этан. Каждой ситуации х € X поставим в соответствие множество Уь-(ж) минимальных по Слейтеру решений многокритериальной задачи
(то есть система неравенств Я",у) <
несовместна для любых € и у € У).
II этап. Для каждого измеримого Селектора ух(-) 6 Уз(') построим бескоалиционную игру
Гв =< >.
где д?(х) ~ А(х,уа[х)),Ух £ X.
Рассмотрим, смешанное расширение Г„ игры Га,т.е. бескоалиционную игру
• Гв «< N. {д'.-Ь-еК.Ср?С*')).-еМ >.
где множество N определено выше, {у} - множество смешанных ситуаций К") — ... "»(•)> смешанная стратегия ¡л для ¿-го (г 6 М) игрока отождествляется с вероятностной мерой на множестве X,- функция выигрыша ¿/¡'(¡у) для 1-ю игрока имеет вид « »
Ж") = / #(*№(*) = / <М«|)-/ д?(*№л(хп).
X XI X.
III птатт. Пусть {i'e} - множество ситуаций равновесия по Нэшу во всех играх Г„. Тогда для каждой фиксированной ситуации и' 6 {и'} множество /1„. индексов а, для которых v'- является равновесием по Нэгау, не пусто. Введем обозначение G(vc) — (J ga(i>*)y где ga(v) =
~ (")>••• >5п(и)) 11 рассмотрим многокритериальную задачу
Г< =<{*/},£(/>')>
с многозначным векторным критерием (■?(•) : v' —► G(ve).
Опридслеши: 2. SENS-рсшснием (Slater-Equilibrinm-Nash-Slater) в смешанных стратегиях бескоалиционной игры при неопределенности (1) будем называть максимальное по Слсйтеру решение и' многокритериальной задачи Г'.
Теорема 3. Если Л'; и Y есть компакты и /¡(ж,у) непрерывны (i Е € 14), то в игре (1) существует SENS-решенне в смешанных стратегиях.
Вторая глава посвящена бескоалиционной лннейио-квадратичной дифференциально-разностной позиционной игре двух лиц при неопределенности.
Рассматривается следующая дифференциально-разностная игра двух лиц при неопределенности
<{lt2},S,{WbW,,Ä}I(Ji(Cr,^<.li,(tf)))i-lia>. (6)
В такой игре изменение управляемой системы £ описывается векторным линейным дифференциальным уравнением с постоянным запаздыванием времени г > О
М = Л(<)*((] + D{i)x[t - т] +щ+щ+ г, (7)
а функция выигрыша г-то игрока определена квадратичным функционалом
т
Ji{U,Z,t.,x.{4)) = ic'iTjC.xlT] + I +ti;[i] Di lUl[i]+
t.
+u,i\t)DiM\t\+z,[t\Liz\t\}dt, («=1,2). (8)
Вектора x € Itn, u; 6 R", г 6 Rn, «,• - управляющее воздействие i-го игрока (t = 1,2); z - неопределенный фактор; элементы матриц A(t), B{t) непрерывны на [—т,Т], а постоянные n х n-матрицы С;, Du,
Li {i = 1,2) симметричны; фиксированы моменты начала í, > 0 и окончания Т > t, игры; заданы начальные условия:
xjí, + tf) = a:,(i?), -т < ■ú < 0, (9)
где г,(г)) G С„[—т,0]. (Здесь и далее Сп[—т,0¡ есть множество непрерывных на [—г,0] »-вектор-функций r(i?), а для матрицы D > 0(< 0)
• означает, что квадратичная форма u'Du определенно положительна (отрицательна)); величина запаздывания г—const> 0.
Множество стратегий t-ro игрока
о
UU =» {üi -5-tíí(<.,)) = '(г[%)х{0) + I
-T
ti Xn—матрицы Q-1,(í)»í3.-S)(í.i:') непрерывны при t e [0,T],1? 6 [—r,0]},
(i = 1,2),
множество ситуаций U = (í/b í/2) — x U-¿.
Множество неопределенностей (помех, возмущений, ошибок измерений'« т.п.) вподнтся аналогичным образом:
о
-т
п х п-'матрицы непрерывны при i 6 (О,Т],0 6 (—т, 0}>
Здесь и далее обозначается г($).6 (7,4 -7,0] - отрезок траектории системы Е "длины'заназдываиия", через xt(i?) — x[t + < i < Т, —т < < 0 < 0, тогда xjí] = х\1 4- 0) = х((0), a;[í - т] = ®((-т). Кроме то-
• го, в (S) функции И,[i] = Vi(t,?i(0)) = u¿(t,rlí'+ 1?]), z[t\ =¡= z(í,st((l?)) « r=í(í,í jí+i>J), rnext(0) = x\t+#},t e ji„T], 1? G |-r,0j - решение (7), (9) при выбранных игроками стратегиях Ut — 2(1?)) и реализовавшейся независимо от них неопределенности Z -г z(t,x(t?)).
Определение 3. Ситуацию lfe 6 U назовем равновесием Нэша-Слсйтера игры (6), если существует неопределенность Zs Z такая, что при любом выборе начальной позиции (i.,*.($)) 6 [0,7') х (7„[-т,0] Io. ситуация Ue — € U. является равновесной по Нэшу в
дифференциально-разностной игре
< {1,2}ДО = Zs),m¡^ÁMU,Zs,L,x.(mi^ >,
которую получаем из (G), фиксируя ситуацию U = U'; 2°. неопределенность Zs минимальна по Слейтеру в двухкритериальной задаче
< ци = >,
которую получаем из (0), фиксируя ситуацию U = U'. Аналогично формализуются еще три решения игры (G) (равновесие Иэша-Парето, Нэша-Борвенна, Нэта-Джоффриона) и установлена связь между ними. Все четыре введенных решения игры (6) являются гарантирующими (в "векторном смысле").
Утперждеиие 3. Если в игре (6) существуют
•/?(<.,= шах min Ji(£/b^3,Z,t.,x.(i?)) = = min
= max min J2{UuUi,Z>UM$)) =
Vi (U1,/)
= min MUuUi,Z,t.,xt(4)), ("ii-O
to
> //(<♦, (*' = i,2;/г = S,P,B,G).
Утиерждепие 4. Каждое из решений (Ue, Z¡¡) {К — S¡P,B,G) игры (ß) динамически устойчиво.
D диссертации выделен класс дифференциально-разностных игр вида (ß), для которого установлены "коэффициентные условия" существования равновесий Нэша-Дхоффрноиа п найден их явный вид. Утверждение 5. Пусть " ,
' Io. Du <0,D«'<0; 2°. существует постоянная а £ (0,1) такая, что
l(a) = rt£i + (1 — a)Li > Ö;
3°. матрицы er(f), Л?М), Hí(í,i5,p), £ 6 [0,Г|, iJ,p G [—r,0j (» = = 1,2,3) есть решение специальной "гибридной" системы дифференциальных уравнений, содержащей матричные системы обыкновенных уравнений и уравнений с частными производными.
Тогда равновесие Иэща-Джоффриона {U¡,U¡) дифференциально -разностной игры (б) существует и имеет вид
Щ -ru;<l,*M) = -D:> (e:(t)x(0) + -jA^l^x^d?! (i = 1,2), а соответствующая неопределенность Za есть
. Zcf^^^r' (a) ¡Ql(t)x(0) + ~fA'(t,<l)x(<))d^ .
Затем рассматривается следующая бескоалиционная линейно-квадратичная дифференциально-разностная позиционная игра двух лиц при неопределенности
< > • (ю)
Здесь управляемая система дописывается векторным линейным дифференциальным уравнением с постоянным запаздыванием
= Л(1)хЩ + В{1)х[1-7)+щ+и3, ' (11)
x[t. + i?]=.a\(tf), -г < t7 < 0,
где фазовый вектор х £ R", управляющее воздействие i-ro игрока и,- 6 € R" (» = 1,2); элементы ихп-матр.чц /1(0> #(0 непрерывны на [—т,Г), фиксированы моменты начала I. > 0, окончания игры Т > t. и начальная позиция (t,,x,(U)) £ [0,Г) х С„[-т,0]. Множество ¿У; стратегий »-игрока (i = 1,2) то же, что и в игре (6).
Множество неопределенностей
-i-г(/, ),«)!«(<,Х^иД«,®^)),«^,!^)))»:
= Р^(1)х(0) + } pW(t,J)x(tf)di),
— Г
для любых u(i,a;(t>)) = (uj(i,»2Cfгде U{ + «;.(*,*(«?)),^ G € ¿Л (» = 1,2), матрицы Р^НО.^Н'.^) непрерывны при i 6 [0,Т], 0 е l-r.Ol).
Можно предложить следующую "игровую" интерпретацию используемого здесь класса неопределенностей (контрстратсгий - в терминологии теории дифференциальных игр). Пусть выбор неопределенностей есть результат действий фиктивного игрока, который, не имея "своей"
функции выигрыша, стремится "максимально навредить" первому и второму. Не зная его возможностей, естественно этого дополнительно' го игрока наделить более широкими информационными возможностями, по сравнению с первым и вторым. Именно, можно считать, что кроме реализующейся позиции, он может мгновенно узнавать или угадывать реализующиеся управления первого и второго. Тогда его способ управления учитывает как складывающуюся позицию игры, так и стратегии "действующих" игроков. Данный подход можно обосновать и тем, что, не зная о действиях дополнительного игрока, игроки 1 н 2 принимают свои решения, считал, что их противник имеет "наибольший простор действии", который только возможен и рамках используемого класса неопределенностей.
Функция iii.iHrpi.una г-го игрока в игре (10) задана квадратичным функционалом
ТГ 2 '
ми, 2, и, х.(0)) = в'[Г]С{г[Г1 4- / {£«;.[*] М+
Г.
+г'[1]ГлгЩ ^2г'[1\М{щ\1})(11 (г = 1,2), (12)
здесь «¿[г] = х^д)) = и,((,ж[Х + 1?]), гЩ = =
= г(г,х\1 + ■!?],и(«,ж[< + 1?1), где г,0?) = + I € [К,Т],-0 € [-г,0] - решение системы (11) при выбранных игроками стратегиях и~и^1,х{0))\ п х п-матрицы С{, (г,у — 1,2) постоянны и симметричны, Л/; -
постоянны (г = 1,2).
Отличие игры (10) от (б): здесь неопределенности (помехи, возмущения) "не действуют" непосредственно па управляемую систему Е-г(11), а оказывают влияние лишь на выигрыши игроков.
Формализацию решения игры (10) (аналог векторного максимина) проведем в три этапа.
I этап. Каждой ситуации II = {11\, И?) 6 и поставим в соответствие множество минимальных по Слентсру неопределенностей -г г5(г, 2(1У),и) е 2и) двухкритериальнон задачи
< (9),2и,(Л(У,^,г.,г-.(19)))1=1,2 > . (13)
II этап, Для каждого '¿^ £ построим бескоалиционную дифференциально-разностную игру
< {1,2},Е-г(9),{^};=115,(Л(^,^,«.)г-.(1?)));=1,3 >, . (И)
И
которую получаем из (10), фиксируя неопределенность = Zf.
Пусть U' = (и;,и;) ч- = ем- одна
из ситуаций равновесия по Иэшу игры (14).
Обозначим через {{U',Z%.)} множество всех пар, удовлетворяющих требованиям второго этапа.
III этан. Рассмотрим двулкритериальную задачу
<X+W,{(U',ZS.)},(Ji(U<,ZZ.,l„x.(m^>- (15)
Определение 4. Ситуацию О' назовем SENS-рсшспием игры (10), если существует неопределенность такая, что пара (Üe,Zf,) есть максимальное по Слейтеру решение двухкритсриальпой задачи (15), т.е. для любых [U',Zt) 6 {{U\Z*.)}, 6 |0,Г) х Ста[-г,0]
несовместна система неравенств
Ji(U\ZS,t.,z,{t))>Ji(Ü'tZl.,t.tx.(0)) (¿ = 1,2).
Утверждение 0. Если ¿; > 0 (i = 1,2), то при любых U е U и (t,,x.(i>)) Е [0,Т) х Сп(—т,0] множество Z'f минимальных но Слейтеру неопределенностей Zf(a) двухкритсриальпой задачи (13) имеет вид
2?= U {2uS(«)}, (Ю).
где
ZS(a)-TZS(t,x{H),uua) ~-Ь-1{а)М(а)щ. \
матрицы L(a) = аLt + (1 — a)L3, М(а) = аМл + (1 — а)М3.
Утверждение 0 приводит к следующей процедуре построения всего множества минимальных по Слейтеру неопределенностей задачи (13) при условии Li > 0 (* = 1,2).
Пусть в игре (13) фиксирована некоторая ситуация U — -7-(ut(ttz(tf)),v3(:,x(tf))), U 6 Ü. Для этой ситуации множество минимальных по Слейтору неопределенностей Я® состоит нз неопределенностей вида
U
<г{!>(0*(о) + JQVMxWW
причем каждому числу о € [0,1] отвечает "своя" неопределенность Zf(ot), авсе множество Z* получаем, когда а "пробегает" все значения от 0 до 1,
IIa этапе II построения SENS-решеиия найдем явный вид игры (14). С этой целью в функциях выигрыша (12) заменим z на zs из (16). В такой преобразованной игре новые функции выигрыша примут вид
г
MU, ¿.«.(О)) - ®'{Т]С,г(7'] + J{ь\ЩОй{а)щ[(\+
Wa[i]Dis«2li]}di (» = 1,2), (17)
где
At(o) = D{i -f M'(a)L-\a)LiL-l{a)M(a) - М'(а)^(а)М{-
-MlL~l(a)M(a) (¿ = 1,2).
Далее рассматриваем бескоалиционную дифференциально-разностную игру двух лиц (14) (без неопределенности), где система К, множества стратегий игроков W; (i — 1,2) те же, что и и игре (10), а функции выигрыша игроков J;(i/, ,i.,a\(t?))(t = 1,2) имеют вид (17). Утверждение 7. Пусть 1°. Da<01ö„(o)<0,Voe(0,ll;
2°. матрицы 0,4*,«), Л;М>а), SJ(/,t7,p,a)t t € [0,Г], е [-r,0] (t = 1,2) есть решение специальной "гибридной" системы дифференциальных уравнений. .
Тогда при любом выборе начальной позиции (i,,ac,(i?)) 6 [0,Т)х хСп[—т,.0], равновесная по Нашу ситуаЬия игры (14) имеет вид U' ¿= =» (I/f,irs«), гда .
Ui~u\{ttx(0\a) = -ВД«) ^0,«)х(О) + \ f AlM,aM*)iwj , U;+bi(t,z(*),<*)= -Я» ^(<,а)*(0) + , (18)
(при любых а G (о, 1J).
, Перейдем к этапу III построения SENS-рёшення. Для этого найдем выигрыши Обоих игроков з игре (14) в ситуации Ue = (U',.Uj) из (18). Именно, имеет место
Утверждение 8. Вели выполнены условия 1° н 2° утверждения О, то выигрыши игроков в игре (14) п ситуации Uc из (18) будут
и и
= {¿Я I х'.(1?)Ё^1,^>Р,а)х.{р)<1р+
—т —■т
О —т
где н х п-матрицы Е;(1,1?,/>,а), Л;(1,1?а), <Э;(*,а); I е [О,Т1], -д,р € 6 [—т, 0] (» = 1,2) есть решение специальной "гибридной" системы дифференциальных уравнении.
Теорема 4. Пусть для дкффереициалыю-разностнон игры (10)
1°. матрицы Л; > 0, (:' = 1,2), П23 < 0,
2°. при всех а С [0,1] матрица /)ц(а) < 0,
3°. о' максимальна но Слейтеру в дпуххрнтериалыюй задаче
0 о
< [0,1], М¡(¡.,0,ла)г.(/>)^+
-Ы'.(О)£ + х',{0)в<{1.,а)х.(0)).п11
> .
Тогда при любых начальных позициях (t,,x,(0)) € [0,Т) х Cft[—т,0] a) SENS U' = (U'nU;) игры (10) ниеет вид
1 °
G;(<,q-)x(O) + - J л\(1,о,а*)х(#)М
. «
©•s(i,Q'M0)+ - J K\(t,-d,a-)x(i))dx>
b) векторная гарагтия при этом будет
- у и
*((/*, Z?.,i„ *.(*)) = fdi>f x:(m{l.,*,p,a')x.{p)dp+
-Г —Г
о
+х'.(0) J \i{t.t*,cr)x.(i)M + x,.{0)Qi(U,a')x.(Q) (i = 1,2).
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
В диссертационной работе получены следующие основные результаты:
1) введены новые понятия гарантированных решений для бескоалиционной игры я лиц при неопределенности;
2) установлены свойства гарантирующих решений бескоалиционной игры при неопределенности;
3) доказано существование введенных решений в классе смешанных стратегий;
4) данные решения построены для одной модели охраны окружающей среды от загрязнения;
5) установлены удобные для приложений коэффициентные критерии существования гарантирующих равновесий лннейно-квадратичной дифференциально-разностной позиционной игры при неопределенности, найден явный вид таких решений.'
Основные результаты диссертации отражены в следующих опубликованных работах:
1. Житомирский Г.И., Макаркина Т.О. Охрана от загрязнения окружающей среды// Математические проблемы экологии: Тез. докл. ~ Чита, 1994. - С.42-43.
2. Макаркина Т.В. К модели охраны окружающей среды// Сложные динамические системы: Сб.науч.тр. - Исков: Псковский пед. пп-т. -1991. - С.163-108. • .
3. Макаркина Т.В. "Статические" игры при неопределенности// «¡3.4. из'кн. Жуковского В.И. и Чнкрия А.А. "Линейно-квадратичные дифференциальные игры". - Киев: Иаукоаа думка, 1994. - С. 232-281.
4. Makarkina T.V. About one solution for differential-difference game under uncertainty//'The IV-th Inter. Workshop "Multiple criteria arid game problem* under iincertainty": Abstracts, - Orekliovo-Zuevo. Russia. 1990. - P.G5.
5. Житомирский Г.И., Макаркина Т.В. СНП-решение одной бескоалиционной игры при неоиределсшюсти // Сложные управляемые системы: Сб. науч. тр. - М.: РосЗПТЛП, 1996. - С.17-20,
6. Макаркина Т.В. Решение Нзша-Джоффриона в одной дифференциально- разностной игре nprt неопредсленности//Слояшые управляемые системы: Сб.науч.тр. - М.: РосЗИТЛП, 199G. - С. 30-33.
7. Макаркина Т.В., Роялиста И.Н. Об одг.он задаче экологии // Международная конференция "Математика, компьютер, образование": 'Гез. докл. - Дубна, 199G. - С. 87.
8. Макаркииа Т.В. Рапнопесие Нэша-Джоффриона в одной дифференциально-разностной игре //IV Международная конференция женщин-математиков "Математика. Моделирование. Экология": Тез. докл. - Волгоград, 1996. - С.88.
Makarkiua Tatjana Vladiinirovna (Russia) Nnsli nquilibriuiii under uncertainty
Л new solutions for non-cooparetive games under uncertainty was introduced on the basis of the conscption of Nash equilibrium. Two approaches arc using under formalization оГ solutions: the first is the analogue of the saddle point in antagonistic gam'e with the vector function of payofT; the sccond is the,principle of guarantee result. The first chapter is devote the "slatic"version of problem, the second chapter is devote a linear-qudratic differcntial-cliflcrcnce games. Л researches arc on Scam of the theory of nnilticriteria problems, the theory of non-cooperative games, the theory of dilicrcntial positional games and the theory of acceptance solutions under uncertainty. Suggested v/ayes of construction a new equilibriums gave a possibility solve specific problems of economics, ecology and mechanics of controllable systems.
Макаркииа Татьян« Владимировна (Россия) РаЬмовсснс по Нэшу при неопределенности
Для бескоалиционных игр при неопределенности на основе концепции равновесия по Нашу введены иопые решения. При фомализации решений используются два подхода: первый представляет собой аналог седловой точки антагонистической игры с векторной функцией выигрыша, второй'- принцип гарантиропанного результата. Первая глава посвящена "статическому" варианту задачи, вторая - позиционным линейно-квадратичным дифференциально-разностным играм. Исследования лежат на стыке теории многокритериальных задач, теории бескоалиционных игр, теории дифференциальных позиционных игр н теории принятия решений при неопределенности. Предлагаемые способы построения новых равновесий дают возможность решать конкретные задачи экономики, экологии и механики управляемых систем.
-
Похожие работы
- Разработка математических моделей поддержки принятия решений при информационных ограничениях
- Модифицированное равновесие как инструмент анализа лабораторных рынков
- Декомпозиционные алгоритмы построения равновесных решений в динамических играх
- Равновесие по Нэшу при неопределенности
- Теоретико-игровые методы анализа случайных множеств событий
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность