автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности
Автореферат диссертации по теме "Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности"
На правах рукописи
СЕРГЕЕВА Мария Юрьевна
ГАРАНТИРУЮЩИЕ РАВНОВЕСИЯ В БЕСКОАЛИЦИОННОМ ВАРИАНТЕ ДВУХУРОВНЕВОЙ ИЕРАРХИЧЕСКОЙ ДЕЦЕНТРАЛИЗОВАННОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЫ ТРЕХ ЛИЦ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
Специальность 05.13.17 - теоретические основы информатики
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Москва-2005
Работа выполнена на кафедре прикладной математики и информатики физико-математического факультета Борисоглебского государственного педагогического университета
Научный руководитель:
доктор физико-математических наук, профессор Тараканов Андрей Федорович
Официальные оппоненты:
доктор физико-математических наук, профессор Горелик Виктор Александрович
доктор технических наук, профессор Шарипов Борис Усманович
Ведущая организация:
Воронежский государственный университет
заседании диссертационного совета К 212.154.11 при Московском педагогическом государственном университете по адресу: 107140, Москва, Краснопрудная, 14, математический факультет МПГУ, ауд.301.
С диссертацией можно ознакомиться в библиотеке Московского педагогического государственного университета по адресу: 119992, Москва, ул. Малая Пипоговская. 1.
Защита диссертации состоится
2006 г. в !."... часов на
Учёный секретарь Диссертационного совета ЧИКАНЦЕВА Н.И.
аоое А
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность. Многообразные проблемы, возникающие в процессе деятельности человека, требуют их исследования с применением математических методов. И при этом уже на этапе содержательной постановки научной проблемы, связанной с указанными выше сферами деятельности человека, зачастую становится ясно, что в основе этой проблемы лежит некоторое противоречие, конфликт. Например, большинство проблем в социальной и политической жизни возникают из-за конфликтов между начальником и подчинённым, между социальными группами, объединениями, партиями и т.п.
При более глубоком анализе поставленной научной проблемы, как правило, выясняется, что отношения между «учасгаиками» противоречия или конфликта могут быть с той или иной степенью достоверности описаны с использованием средств теории исследования операций. При этом в зависимости о г характера исследуемой проблемы может быть привлечён математический аппарат теории оптимального управления, теории игр, теории вероятностей и статистики. Конечным результатом исследования являются рекомендации для принятия решения ответственным лицом.
В последние годы оформилось общее название научного направления, в рамках которого ведутся исследования по управлению сложными системами -теоретические основы информатики. Такое название обусловлено тем, что одной из ключевых проблем в процессе исследований является проблема информационной неопределённости и её учета.
В указанном только что научном направлении к настоящему времени уже сложилось чёткое понимание общего объект исследования. Таким объектом является сложная система управления. В такой системе, как правило, фигурируют несколько активных сторон (активность понимается как наличие реакции на внешнее воздействие), что приводит к конфликтному характеру процесса принятия решения. Кроме того, процесс принягия решения может происходить в условиях неопределённости (неточное знание возможностей сложной системы, нечёткая постановка целей, неточности в передаче информации и т.п.).
Значительное число сложных систем управления характеризуется иерархической структурой. Исследование таких систем начиналось на основе одного из направлений в исследовании операций, связанного с изучением минимаксных задач, которыми занимались В.Г. Болтянский, Т.К. Виноградова, Г.В. Гай-шун, Л.Г. Турин, В.А. Горелик, В.Ф. Демьянов, Б.Ш. Мордухович, Е.М. Перво-званский, И.С. Столярова, В.В.Федоров, A.A. Чеботару и другие.
Важным классом минимаксных задач являются задачи управления со связанными переменными, когда управление одной из систем представляет собой многозначную реакцию на управляющее воздействие другой системы. В этом случае минимакс дает гарантированную оценку за весь период функционирования систем. Эти задачи возникают, в частности, при изучении иерархических
систем и рассмотрены В.А Гореликом, М.А. Гореловым, А.Ф. Кононенко, Н С. Новиковой, А.Ф. Таракановым, В.В. Федоровым.
При изучении иерархических систем применялся и игровой подход. Систематическая разработка вопросов теории иерархических игр начата Ю.Б. Гер-мейером и H.H. Моисеевым, которые определили решение иерархической игры, близкое по сути к решению по Штакельбергу. Была установлена структура решений, связанная с так называемыми стратегиями наказания. В дифференциальных играх данный подход активно использовался И А. Вателем, P.A. Ведерниковым, В.А. Гореликом, Т.Н. Данильченко, Ф.И. Ерешко, А.Ф. Кононенко, Н.С. Кукушкиным, И.С. Меньшиковым, К.К. Мосевичем, Е.З. Мохонько, Н.С. Новиковой, П.В. Фоменко, А.Д. Халезовым, В.В. Чумаковым и другими. Принцип Штакельберга стал основой исследования иерархических систем зарубежными учеными.
Особенностью многих исследований иерархических дифференциальных игр является применение к их решению теорем типа принципа максимума JI.C Понтрягина. Вследствие "»того управления игроков ограничиваются в основном только функциями времени.
Дальнейшее исследование иерархических игр связано с рассмотрением на нижнем уровне иерархии не менее двух игроков, что порождает проблемы выбора игроками правил рационального поведения. Эти правила были перенесены из классической теории игр с ненулевой суммой и породили бескоалиционный, коалиционный и кооперативный варианты иерархической игры. В этом направлении следует отметить исследования В.И. Жуковского и Э.М. Вайсборда, которые достаточно полно изучили различные варианты иерархической игры трёх лиц (без неопределённости) с правом первого хода у игрока верхнего уровня. Существенным обстоятельством является зависимость стратегий игроков не только от времени, но и от реализовавшихся значений фазовых координат. Это стало возможным благодаря подходу, основанному на предложенном академиком H.H. Красовским объединении динамического программирования с методом функций Ляпунова и позволяющему в ряде случаев указать коэффициентные критерии существования решения и построить их явный вид.
Характерной чертой многих игровых задач является наличие таких параметров управляемой системы, выбором которых игроки распоряжаться не могут. Появление таких задач связано с тем, что сложные системы, как правило, взаимосвязаны с внешним миром, что обязывает учишвать не только механизмы функционирования самих систем, но и их взаимодействие с помехами, возмущениями и другими неопределённостями. Изучением таких систем занимается новое направление теории дифференциальных игр - теория дифференциальных игр в условиях неопределённости
При этом выделилось два подхода к изучению игр в условиях неопределённости, формализованных в виде антагонистической игры с векторной функцией выигрыша. Первый основан на обобщении понятий минимаксной и мак-
симинной стратегий и активно разрабатывается в России В.И. Жуковским и ею учениками А.Е. Бардиным, Г.И. Житомирским, ВА. Матвеевым, В.В. Мухиным, И.В. Чернявским и другими. Независимо от них аналогичные исследования ведутся в Италии и Японии. Второй подход основан на обобщении понятия векторной седловой точки.
Проявление фактора неопределенности в реальных иерархических системах весьма многообразно - неопределённость, связанная с процедурой принятия решения, различная информированность подсистем о внешних параметрах, о параметрах системы и др. Многообразие возникающих здесь ситуаций определяется порядком ходов участников игры, их информированностью друг о друге, характером внешних параметров (неопределённые, случайные) и т.п. Во многих исследованиях по иерархическим играм неопределённость имеет, как правило, локальный характер, что позволяет отдельным игрокам использовать информацию о возможных её реализациях. Практически это сводится к следующим моментам: информированный о неопределённости игрок сворачивает свою функцию выигрыша, ориентируясь на наихудшую для себя реализацию неопределённости (то есть минимизирует выигрыш по неопределённому параметру), либо ориентируясь на математическое ожидание неопределённости При передаче информации другому игроку производятся те же свертки.
Однако в случае наличия нескольких критериев (выигрышей) более целесообразным представляется использование векторных гарантий (от неопределённости), то есть аналогов векторного максимина или векторной седловой точки. В рамках же исследования векторных гарантий в дифференциальных играх при неопределённости иерархические игры пока не рассматривались.
Целью работы является построение матемахического аппарата для исследования бескоалиционного варианта иерархической дифференциальной игры в условиях неопределённости с правом первого хода у игроков нижнего уровня. При формализации векторных гарантий дифференциальной игры в условиях неопределённости используется аналог векторной седловой точки, объединенный с концепцией равновесного решения иерархической игры. Указанная концепция основана на принципе Штакельберга.
Достижению поставленной цели способствует решение следующих задач: •построение принципа равновесного гарантированного результата - гарантирующих равновесий;
•изучение свойств гарантирующих равновесий;
•построение достаточных условий существования гарантирующих равновесий в случае однозначной и неоднозначной реакции лидера, нахождение коэффициентных критериев для линейно-квадратичного случая;
•численное исследование гарантирующих равновесий по коэффициентным критериям.
Таким образом, объект настоящего исследования - бескоалиционный вариант иерархической дифференциальной игры трёх лиц в условиях неопреде-
лённости с правом первого хода у игроков нижнего уровня.
Предметом исследования является принцип равновесного гарантированного результата в этих играх.
Методологическую основу настоящего исследования составляют выпуклый анализ, теория матриц и систем дифференциальных уравнений, методы и подходы теории дифференциальных игр и многокритериальных задач, методы и принципы теории оптимизации и оптимального управления, подход к построению достаточных условий, основанный на объединении метода функций Ляпунова с динамическим программированием.
Научную новизну работы составляют результаты исследования класса дифференциальных игр трёх лиц, где имеет место внешний неконтролируемый неопределённый фактор. Игра является децентрализованной, так как правом первого хода обладают игроки нижнего уровня, действующие каждый в своих интересах. Такая постановка задачи соответствует бескоалиционному варианту игры. Существенным моментом является нетривиальное! ь рассматриваемой игры, то есть учитывается многозначность в контрстратегиях лидера и непредсказуемость его действий для игроков нижнего уровня. Поэтому важной особенностью настоящего исследования является учёт реализации любой контрстратегии лидера из целого множества, что ставит игроков нижнего уровня перед проблемой учета дополнительного неопределённого для них параметра. Именно в отношении такого вида неопределённости следует рассматривать понятие "гарантирующий" в определениях исследуемых равновесий.
Основные результаты диссертации, выносимые на защиту, состоят в следующем:
1) сформулированы принципы гарантированного результата бескоалиционного варианта иерархической дифференциальной игры трёх лиц в условиях неопределённости - определения гарантирующих равновесий:
• обобщённое определение гарантирующих равновесий,
• определение равновесий Штакельберга-Слейтера, Штакельберга-Парето и Штакельберга-Джоффриона для частного случая исследуемой игры при однозначной реакции лидера,
• определение гарантирующего равновесия при неоднозначной реакции лидера;
2) сформулированы и доказаны свойства гарантирующих равновесий;
3) выведены достаточные условия существования гарантирующих равновесий и коэффициентные критерии в линейно-квадратичном случае.
Практическая ценность исследования заключается в прикладной актуальности рассмотренного класса игр. Такими играми моделируегся множество реальных ситуаций: управление многоуровневым производством в меняющихся экономических условиях с предоставлением экономической свободы в принятии решений по схеме "снизу-вверх"; осуществление командования военными действиями при неизвестных действиях противника; поддержание экологического баланса в природе при неопределённых природных факторах (напри-
мер, районная администрация следит за эффективным поведением вредного производства и оказывает поддержку сельскому хозяйству, при этом неопределённые природные факторы могут усилить вредное воздействие производства, что повредит всем элементам системы) и др. Настоящее исследование позволяет предложить эффективное решение указанных проблем, а в случае получения соответствующих количественных характеристик в ряде случаев возможно найти и численное решение.
Апробация работы. Результаты докладывались на научно-практических конференциях молодых ученых Балашовского филиала Саратовского государственного университета им. Н.Г.Чернышевского (Балашов, апрель 1999-2001, 2004, 2005 гг.), научно-методических семинарах кафедры информатики, на аспирантском объединении Балашовского филиала филиала Саратовского государственного университета им. Н.Г.Чернышевского (Балашов, 1999-2001, 2004, 2005 гг.), на международной конференции «Компьютерное моделирование 2003» в Санкт-Петербургском государственном политехническом университете (Санкт-Петербург, 2003 г.), научно-практических конференциях Балашовского филиала Саратовского государственного социально-экономического университета (Балашов, 2003-2005 гг.), научно-методических семинарах кафедры прикладной математики и информатики Борисоглебского государственного педагогического института (Борисоглебск, 2005г.). Кроме того, результаты исследования апробированы с помощью численного эксперимента, описанного в диссертации.
Основные результаты диссертации опубликованы в 6 печатных работах. Структура работы. Работа состоит из введения, трех глав, заключения и списка использованной литературы.
СОДЕРЖАНИЕ РАБОТЫ
В первой главе (§§ 1-4) формулируется и исследуется децентрализованная иерархическая дифференциальная игра трёх лиц в условиях неопределённости. В §1 дается описание игры и описываются ее правила. Игра формализуется в виде упорядоченного набора
(N, I, {Щкц, Z, {Дии U2U t/22, ^ t.a.)}„N >, (1)
где N = {1, 21, 22} - множество всех номеров игроков рассматриваемой игры, Т, - динамическая управляемая система, на которую воздействуют игроки и неопределенность, и формализуемая в виде дифференциального уравнения х=f(t,x, щ,и2], «22, ¿). Для системы £ определены начальная позиция (i.,x,)e[0,5)x/?", где х, =х(<,), а также фиксированный момент окончания игры ä Игроки принимают решения, используя стратегии U, (i^N) из допустимых множеств вида:
% ={ и{~ щ(t, х)= U,(t, X, «21, «22) I щ (t, х)=
=бо (о х+е,, w м2, (/, х)+ е,2 (о и22 (t, х)},
Щ ={Uy+ щ(t, X) | Uy (I, x)=Qy(t)х} (/=1,2), где их« матрицы Q0 (f), Q:J (t)eCnxn[0,&\ (i, j=1,2), то есть непрерывны на [0,&\. Здесь и далее запись U\+ui(t, х) означает, что стратегии U\ соответствует функция управления u\(t, х). Таким образом, выбор стратегии каждым игроком фактически сводится к выбору конкретных непрерывных на [О, Щ матриц. Неопределенность рассматривается как некоторый объективный внешний возмущающий фактор, воздействия которого можно описать с помощью множества
2 = {Z-н z(t, х) | z(f, xyP(t) х). Неопределенность реализуется с помощью матрицы P(t), которая предполагается также непрерывной на отрезке [0,5].
Выигрыши игроков описываются с помощью функций: ./,(£/,, U2ь U?7, Z, t„x,), ieN.
Игра протекает следующим образом:
1) игроки обладают достоверной информацией о множествах стратегий друг друга и о множестве неопределенностей;
2) всем игрокам известны функции выигрыша друг друга;
3) право первого хода принадлежит игрокам нижнею уровня, они независимо друг от друга выбирают стратегии f/2; (/=1,2) и сообщают достоверную информацию о своем выборе лидеру;
4) в ответ на выбор игроков нижнего уровня лидер использует контрстратегию U\ из множества Иь
5) независимо от выбора игроками своих стратегий реализуется конкретная неопределенность;
6) на содержательном уровне цель каждого игрока - увеличение своего выигрыша, дополнительно лидер стремится и к увеличению выигрыша системы в целом (благожелателен к игрокам нижнего уровня).
Для рассматриваемого класса игр описываются особенности и формулируются следующие основные этапы в построении решений:
1) определение принципа отношений между игроками нижнего уровня;
2) определение принципа оптимальности для лидера;
3) определение принципа гарантированного результата для игроков при реализации любой неопределенности.
В §2 производится поиск аналога решения по Штакельбергу применительно к бескоалиционному варианту рассматриваемой игры. При этом выкладки опираются на определение решения по Штакельбергу вспомогательной дифференциальной игры двух лиц без неопределенности. Это решение обобщается на случай исследуемой игры трёх лиц.
Согласно правилам игры (1), игрок верхнего уровня обладает достоверной информацией о выборе стратегий игроков нижнего уровня UjuUn- На этом основании можно утверждать, что для выбора контрстратегии на пару стратегий
игроков нижнего уровня ({/2], ^22) 6 И2\У.(И22, лидеру выгодно использовать элементы подмножества контрстратегий
Щи2],и2?)еЦ\
В общем случае это множество не обязано состоять из одного элемента.
С учетом этого и на основании исследования вспомогательной игры обобщенное определение гарантирующего равновесия бескоалиционного варианта децентрализованной игры (1) формулируется в следующем виде:
Определение 1. Четверку {и^{и2ии2г\и2^и22,2^) назовем КЬ-гарантирующтш равновесием игры (1), если для любой начальной позиции (/,, х,) е [0,1?) х Я" выполняются следующие условия:
1° существует такая неопределенность что для каждой бескоалиционной дифференциальной игры двух лиц
<{1,2}, I, {Щ)1,Л.Ъ {Нит,,игг\ иг„ и2Ъгь к,х.)}г1а), которую получаем из (1), фиксируя неопределенность 2 и контрстратегию Центра Щ^ь^и). существует своя ситуация (, 11'1г), равновесная по Нэшу, то есть
^ти1„и12),и;ьи'22>гь 1„х,) > ми^ип )Мг1,и;2 л,
при любых 1/21 е%1, и21еМгг.
обозначим через {(Щи'Л, и"п). 1/21, и22)} множество всех ситуаций, удовлетворяющих требованиям этого этапа, стратегии , и*22 назовем гарантирующими;
2° ситуация (и^ (и21,и22),и21,1/22) максимальна по К в двухкритериальной задаче
ълти'2]лггг\и;ии'п)}, щвд,,^), и-2], и;г,2ьг.,х.)}ги), (з>
3° неопределенность Z¿ минимальна по Ь в трехкритериальной задаче
<1, г, {ди^и^и^и^, г, 1„х.)}МЖ12). (4)
В этом определении: максимальность ситуации ([/* {и2и1122),и2] ,и22) по К в задаче (3) означает:
а) при - максимальность по Слейтеру,
б) при К=Р - максимальность по Парето,
с) при -максимальность по Джоффриону; минимальность по Ь неопределенности Z¿ в задаче (4) означает: а) при Ь=Б - минимальность по Слейтеру,
б) при Ь-Р - минимальность по Парето, с) при 1=6 - минимальность по Джоффриону.
Рассматривая взаимосвязь введенных равновесий, следует отметить, что-•достаточные условия существования ОО-гарантирующего равновесия обеспечивают существование остальных равновесий;
• необходимые условия существования ЯЯ-гаран гируюшего равновесия остаются необходимыми для остальных равновесий.
В §3 устанавливаются свойства введённых равновесий. Это традиционные для равновесий свойства: индивидуальная рациональность, векторная гарантия при реализации любой неопределённости, устойчивость к отклонению от равновесия отдельного игрока, динамическая устойчивость и полнота.
К традиционным свойствам добавляется также свойство влияния одного игрока нижнего уровня, выбравшего стратегию из равновесия, на выбор второго игрока нижнего уровня. Производится также сравнение исследуемого равновесия с популярным равновесием Нэша-Слейтера для той же игры, из чего следует, что гарантирующие равновесия являются более качественными.
Глава II посвящена исследованию вопросов существования исследуемых равновесий В §§5,6 изучено существование равновесий на случай однозначной реакции лидера в ответ на стратегии игроков нижнего уровня (тривиальная игра). При этом с учетом однозначности реакции лидера соответствующим образом изменилось (упростилось) и определение гарантирующих равновесий. Т.о сформулировано определение равновесия Штакельберга-Джоффриона.
Определение 2. Четверку (£/,( и21, и"22 )• 1 > 'Л*? > назовем равновесием Штакельберга-Джоффриона игры (1), если для любой начальной позиции (7., х.) е [0, х Е" выполняются следующие условия:
1° стратегия {//(^ЛГЛ?*) является единственной стратегией, удовлетворяющей неравенству:
ми,(и;ии;2),и'2ии'22^а, 1„х,)>чи,,и1ии;2^ V и^и,-
2° существует такая неопределенность '¿с е 2, что
1.,х.)>Ыи1{и1ии2г),игии\1,1а> 1„х.\
V иг1еи22-,
3° неопределенность 2а минимальна по Джоффриону в трехкритериаль-нойзадаче <1,2, {^¡{Щ^и'^и^^, г„х,)) МД1,22>-
Подобным образом вводятся понятия равновесия Штакельберга-Парето и Штаксльберга-Слейтера Достаточные условия строятся для равновесия Штакельберга-Джоффриона.
Для формулировки и доказательства достаточных условий шра конкрети-
зуется. Система £ описывается дифференциальным уравнением
X - А (/) Х+ Щ + «21 + «22+ а функции выигрьппа игроков определены функционалами: Мииигиил2,1„х,)=х'{9) С, х(Я)>
3
+ |[х' (/) С,х(0+ «,'!>п «1+ «¡О, «21+ «{А М22+У /.,г] с//;
и
= X' С2 |[х' (/) О2х(0+ «21^22 "21+ «22-°23 «22+ 2' ¿2
и
Ыи^гиЦцЯ, К,х.)=
в
= х' (5)С3 х(,9)+ |[х' (О х(/)+ м^,£)з2"21+ «22Аз «22+ / 13 г] Л;
где матрицы С„ (г„ Ь, (г~1, 2, 3). А, А, Оц. А,,, Аз, Аг, Аз - размерности иуи, симметричны и постоянны.
Неопределенное гь рассматривается как четвертый добавленный игрок, для которого вводится функция выигрыша
./з( А, Аь АгДг,, х,,р) - р\ Миъи2ииг22, Ах.) +Д> А(А, Аь АгД /,,х.) I
+р3Ыиьи2иип,г, 1„х.), где Р = (РиР2> р}), р,+р2+р,= 1, р, >0,1= 1,2,3.
Достаточные условия построены для равновесия Штакельберга-Джоффриона с помощью динамического программирования, объединенного с методом функций Ляпунова. Для этого введены функции:
дГ (дУV
Щ, «21, "22, г, +1 "^ 1 0*(0* + «1+ "21+ "22+ 2) +
+ х'С] х+ «¡А1«)+ и,'Л] «2! • «¡А "22+г'¿1 г;
с^ (8УЛ
X, Д(«2|, «22>, «21, «22, 2, + Г"^Г I (Л (0х + Л(«21, «22)+«21+ «22+ г)+
+ х'й2 х+ «2(2-^22 «21+ «22^23 «22+г'г;
х, Л(«21, «22), «21, «22, 2, = + <Ж0* +^(«21, И22)+«21+«22+ 2)+ + Х'С3Х+ И2]А2И21+ «22АЗ"??+2'1З2;
X, «ь «21, «22, 2, +1 ■— I (Л(/)Х + «,+ «2,4 «22+ *)+ х' СЦР) Х+
«;а1«1+ Р\ «;А«21+ А м;О2«22+«^ А(Д)М21+ и'г2о2(Р)и22+ ¿ир)^
где Giß) = tß,G,, L(ß) = tß,Lt,L>,D2{ß)= ß2D2,+
ы M
V, Vj 0=1,2) - функции Ляпунова-Беллмана.
Далее используется обозначение U'= ffff/j, ,t/*2), в функции W\ для построения U* используется функция Ляпунова-Беллмана V, а для построения отображения R(U2],Uv) - функция V.
Лемма 1. Пусть существует неопределенность 7.GeZ, ZG ±zG (t, x}=PG(t) x, функция R(t, x, u2\(t, x), u?i(t, x)) и для каждой ситуации iU2hU22)s Unx%2 своя непрерывно дифференцируемая функция V (t, х) такие, что
1°) при любых xeR" и (U2l,U22)e U2ixU22 V\&, х(3)) х' (&) С, х(&); 2°) при всех /е[0;5], xeR", (и2ХЦ, x), u21(t, x))eR2", V eR]
Wx(t, x, R(t, x, u2i(t, x), un(t, *)), u2i(t, x), u22(t, x), zrft, x), V) =
=max Wi(t, x, щ, u2l(t, x), u22(t, x), zG(t, x), V),
3°) для каждого u2j(t, x)=Qy(t) x (/=1,2), /е[0;5], xeR"
W,(t, x, R(t, x, u2l(t, x), u22(t, x)), и„(/, x), u22(t, x), zc(t, x), V \t, x)) = 0, 4°) отображение R(U2\,U22) + R(t, x, u2i(t, x), u22(t, x)) для пары (lh\,Uv)e таково, что R(U2),U22)e%. Тогда отображение R(U2[,U22) -ï- Я(/, x, x), u22(t, x)) задает контрстратегию лидера в ответ на пару (U2],U22)e U2\AA22.
Существенным является то, что неопределенность в этой лемме используется не любая, а фиксированная - Z<j(t, х)е Z. Это можно объяснить как объективно, так и субъективно (с позиции участника игры). Объективное объяснение основано на том, что рассматриваемое равновесие Штакельберга-Джоффриона является аналогом векторной седловой точки (игроки против неопределенности), а субъективное - на том, что динамика поведения неопределенности лидеру неизвестна, поэтому он не может строить отображение Rit, x, u2\it, x), u22it, x), zit, х)), которое получается при нефиксированной неопределенности.
Существование равновесия Штакельберга-Джоффриона определяется с помощью достаточных условий.
Теорема 1. Пусть существуют и-вектор-функции и\(t, x)-R{t, x, u*2l(t. x), u"n(t, x)), u'2[(t, x), u22it, x), zdt, x) и непрерывно дифференцируемые функции fit, x), Vf it, x), V2 (r, x), Vi (r, x) такие, что
1°) существует набор положительных чисел
ß= ißu ßi, ßi), ßi+ßx+ßb-1, ß,> о ii = 1,2,3) такой, что (и* (r, x)=Rit, x, u"t(t, x), u22it, x)), и*,(/, х), и22(/, x), zG(t, x)) для всех te[0;&\, xeR", V, VteR[, ¿=1,2,3, является решением системы
W,(t, X, u'(t, x), «21 x), u22{t, x), Zeit, x), V) -=
= max Wt(t, x, uh u'2](t, x), u22(t, x), zG(t, x), V),
u\
Wn{t, x, R(t, x, и7л (t, x), u22 (t, x)), u'2l(t, x), u22 (J, x), za(t, x), F,) =
= max W2\(t, x, R(t, x, u2U u22{t, x)), u2i, u'22(t, x), zdt, x), Vt),
«л
W22(t, x, R(t, x, uu{t, x), u22{t, x)), un(t, x), u22{t, x), zc(t, x), V2) =
= max W22(t, x, R(t, x, uv \t, x), u22), u2i \t, x), u22, zG(t, x), V2),
•a
X, u,'(t, x), u',(t, x), u22(t, x), zdt, x), V3, ßy
= min W3(t, x, rn \t, x), u2) (t, x), u22{t, x), z, V3, ß),
2°) набор (Vit, x), v;U, x), V*(t, x), V3"(t, x)) является решением системы из четырех уравнений с частными производными
Ш X, Щ (t, х), «*, (t, х), «22 (t, x), zG(t, x), V) = 0;
w2\(t, x, R{t, x, u2](t, x), «22(i, *)), «*,(', je), u'72(i, x), zG(t, x), V,) = 0;
W21(t, x, R(t, x, u'2](t, x), u'21{t, x)), u'2l(t, x), u22{t, x), zG{t, x), V2) = 0;
W3(t, x, u,'(l, x), u*v(t, x), u*22(t, x), zG(t, x), V3, ß) - 0; и граничными условиями V(3, х(,9))= x' (9) С,x(£f), V,(9, x($))= x' (&) C,., x(,9), 1,2, V3 {9, x(8))= x' (S) C(ß)x{3) для любых ie[0;,9j, xeR"\
3°) стратегии U'2] w*,(r, x); U'a -r u'22(t, x)\ U' i u*(t. x)= R{t, x, u'2i(t, x), u22(t, x)) и неопределенность ZG н- zG(t, x) таковы, что f/'sif,, U2ie1i2h U27 eîi-n, ZC^Z.
Тогда четверка (U',U'2i, U22, ZG) будет равновесием Штакельберга-Джоф-фриона иерархической дифференциальной игры при неопределенности (1), и соответствующие выигрыши игроков будут:
mu;,u'21,u;2,zg, t.,x.) = v\t.,x.), J2j(U;,U'2],U;2,Zg, î.,X.) = r;(f.,x.)(/=i,2) j3(u;,u*2Uu'22,zc, u,x„ß)= v'(t.,x.).
На основании этой теоремы построены коэффициентные критерии для линейно-квадратичной игры.
В §7-8 исследуется случай неоднозначной реакции лидера (нетривиальная игра). В ответ на каждую пару стратегий игроков нижнего уровня у него должен появиться выбор контрстратегии из целого множес1ва контрстратегий. Одна из возможностей формирования такого множества - использовать векторную функцию выигрыша для игрока верхнею уровня, то есть J\ = (Уц, Jn)< где
JuiUuU^U^Z, t„x,y-x'(3) Си X{3)+ s
+ j[x' (t) G,,x(i)+ u[Di M|+ u\Bu «21+ m|B,2 «22+ z'/.,,zl dt,
U
Jn(UhU21,U22,Z, t„x,)= x'(,9) С,2 x(19)+ s
+ |[x' (0 G,2*(0+ «i Aï «1+ «21+ «¡S22 M22+ z'Inz] <Л,
матрицы Си, Ci2, С7ц, Gn, ¿11, ¿12, £>1, £>2, Bu, Bl2, B2i, B22 - размерности nxn, симметричны и постоянны.
При такой постановке задачи контрстратегиями можно считать все U\e.tiu которые доставляют максимум по Слейгеру, Парето или Джоффриопу векторному функционалу J\ = (7ц, /и). Для построения контрстратегий формируется функционал
UUhU2l,U22,ZG, t,,х, )=а/,,(UUU2UU22,ZG,t.,xt) + (\-d)Jn(Uu U2],U». Zç,f,,x,), строго вогнутый по U\ при Zc.eZ и любых ае(0, 1), (t,,x,)e[0,ff)xR" и U2jеЫу (j-1,2), что достигается при условии D/<0 (/=1,2).
Следующая теорема является необходимым и достаточным условием существования контрстратегии лидера на пару (i/21, U22)
Теорема 2. Пусть Д<0 (г-1,2). Если существует число ае(0, 1), при котором имеет место равенство
JJ.Ui(U2hU22, a),U2!,U22,ZG, t„x*)= max MUhU2hU2bZc, t„x,\
то этого необходимо и достаточно, чтобы контрстратегия Центра U\(U2I.U72, а) была максимальной по Джоффриону в задаче
<£, «ь {MUuU2uU22,Zg, U2jeU2j (/=1,2)
Таким образом, в ответ на каждую пару стратегий игроков нижнего уровня (Un, и-п)^.1Л2\уМгг лидер формируег контрстратегию Ui(U2UU22, а), 1де ае(0,1). Очевидно, что выбор параметра а влияет на выигрыши игроков нижнего уровня. Поэтому а также естественно считать стратегией (имеющейся в распоряжении лидера). На основании этого можно ввести определение GG-гарантирующего равновесия при неоднозначной реакции лидера.
Определение 3. Четверку (U\(U2X(aF),U22{cf),cF), 1ЫсР)ЛЫа°), ZG) назовем GG-гарантирующим равновесием игры (1), если для любой начальной позиции (t,, х, ) е [0,5) х R " выполняются следующие условия
1° существует такое Zc е Z, что для любого ае( 0, 1) выполняется J2i(Ui(U2\(e),U22(a\oc),U2i(cî),U22(oc),Zc, t,,x,)>
ZJ2xmU2bU22(a),u),U2hU22(a),ZCn t„x.), V U2lcîd2U МЩи21(а),и22(а),а),и2^а),и22(а),га,^,х.)>
>J22{U,(U2{(a),Ulba),U2l(a\U22,Zc„ t„x,), V U22^4n-2° стратегия управления центра cF максимальна no Джоффриону в Овух-критериальной задаче
<1, (0,1), {Jv(U,(U2](a),U22(a),ä),U2i(ä),U22(a),ZG, l„x.)}rt& 3° неопределенность ZG минимальна по Джоффриону в четырехкритери-альной задаче
(1,2, {J{UiU2](cF),U21{cFlcF),U2,{aa\U22(cf\Z, t„x.)}M 1,12Д1,22>-Подобная схема построения многозначного отображения и равновесия может стать основой для обобщения на равновесие в иерархической игре т+п лиц (от наверху, п внизу). Но здесь для получения многозначности уже не будет необходимости вводить векторные функции выигрыша для игроков верхггего уровня иерархии.
Достаточные условия существования GG-гарантируюшего равновесия в нетривиальной игре строятся в несколько этапов с помощью динамического программирования, объединенного с методом функций Ляпунова. На первом этагге - для отображения, на втором - для гарантирующих стратегий игроков нижнего уровня, на третьем - для стратегии влияния и на четвертом для неопределенности
I ЭТАП. Введем функцию:
DV (dV)
Wt(t, X, «,, «21, «22, Z, V, a)=— +1 ■— I (A(fyx + u,+ u2,+ u22+ z)+
+ x"Gi(a)x+ulD(a) иi+ u[B](a) «2i+ u\B2(a)ui2+ z'Li(a)z; где V- функция Ляпунова-Беллмана,
G|(a)=aGu+(l-ö:)Gi2, D{a)=aDi+{\-a)D2> Si(«)=aB, A(l-a)ß2i, B2{a)=aBv+(\-a)B2bLx{a)-aLu+(l-a)La afc(0, 1) На основании теоремы 2 вводится утверждение.
Утверждение 1. Пусть существуют неопределенность Z(jeZw
а) «-вектор-функция «,(/, х, и2\, и2ъ У, ос),
б) для каждой ситуации (U2ь U22) + (u2l(tr х), u22(t, х)) = (Q2\(t)x, Q22(t)x) своя непрерывно дифференцируемая функция V (/, х) такие, что:
1° при любых xeR", ае(0,1) и (U2h U22) eH2ixM22 выполняется V{&, x)=x'(ff)Q(a)x(8), где Cl(a)=aCn + (1- a)C,2; 2° при всех te\0, Щ, xeR", ae(0,1), u2jeR" (/=1,2), VeR1 имеет место
шах W\(t, x, щ, «2i, «22, x), V, a) = щ
= fV,(t, X, U\{t, X, «21, «22, a), «21, «22, ZG(t, x), V, d)\
3° для каждой ситуации (U2h Uzi) + (u2i(t, x), u22(t, x)) = (Q2i(/)x, Qii(f)x) W]{t, x, U\(t, X, «21(/, x), u22(t, x), a), «?I{t, x), u22{t, x), zG(t, x), V(t, x), a) =0 при всех 0,3), xeR", ae(0, 1);
4® стратегия U\{U2h Un, а) + щ(1, x, u2\(t, x), u21{t, x), V(t, x), а) такова, что ГУ I (772b Un, a)e % при любых ae( 0,1), u2j{t, x)= Q2]{t)x (/'=1,2).
Тогда стратегия U\(JJ2\, U22j а) является контрстратегией лидера для любой начальной позиции (/., х,) е [0, .9) х R".
II ЭТАП. Для построения гарантирующих стратегий игроков нижнего уровня U2\(a), U22(a) используется следующий вид их функций выигрыша:
s
J2l{UuU2hU22,Z,h,x.)=x\S)Cix(S)+ \[x'{t)Gix(t) bu'2,Dnu2i + u'21Dnu22+ z'L,z] dt,
(,
&
J22(UbU2uU2bZ,t„x,)=x'(S)C2x(fy+ ¡[x'(t)G2x(t)+u'2lD2iu2\+u'22D?2u72+z'L2 z] dt,
и
где матрицы G, C2, Gu G2, Lh L2, Дь D]2, D2h Dj2 - размерности пуп, симметричны и постоянны.
Следуя принципу динамического программирования, в достаточных условиях используются функции Wa(t, х, u\(u2\, и22, а), и2\, u22, z, V,, a), W22(t, х, ui(ibi, щ2, а), и2], щг, z, V2, а), где V, - фикции Ляпунова-Беллмана,/=1,2.
Лемма 2. Пусть существуют неопределенность ZGeZ, п-вектор-функции u2](t, х, V], а) (j~ 1,2) и непрерывно дифференцируемые функции Vft, х, а) (/=1,2) такие, что:
Г при всех ае(0,1) ихеЯ" выполняется Vj{9, х, a)=x'{8)CjX{ff) (/=1,2), 2° для любых ie[0, Щ, xeR", ае(ОД), VjgR1 (/=1,2) имеют место max W2i(t, х, «,(/, х, u2l, u22(t, x, a), a), u2l, u22(t, x, a), za(t, x), Vu a)=
= W2\(t, x, ui(t, x, u2X{t, x, a), unit, x, a), a), u2\(t, x, a), unit, x, a), zc(/, x),Fi,a),
max W-niU x, uxit, x, u2l(t, x, a), un, «), u2l(t, x, a), u22, zd}, x), V2, a)=
«22
-W22.it, X, U\(t, X, u2iit, x, a), Unit, x, a), a), u2](l, x, a), u22it, x, a), zGit, x),V2,a), 3° napa (V\it, x, a), V2it, x, а)) является решением системы из двух уравнений с частными производными
W^it, х, х, и2]Ц, х, a), u22it, х, а), а), щ,(/, х, a), unit, х, a), z^t, х), Vx, а) = 0, W22it, х, ufa х, u2,it, х, a), u22it, х, а), a),u2lit, х, a), unit, х, a), zG(t, х), V2, а) = 0, при всех <е[0, xeR", ае(0,1);
4° ситуация (U2\(a), Unia)) -^iu2\(t, х, a), u22it, х, а)) такова, что при любых ае(ОД) стратегия (J2j{a)e 1A2j ij=\,2).
Тогда ситуация (Ui\{a), U22(a)) удовлетворяет пункту 1° определения 3 для любой начальной позиции (t,,x,) е [0,.9)х R", а соответствующие выигрыши игроков составят
MU^ia), U27{a),a\ Uv(a), и12(а),га ».,*.) = V/^x„a) (/=1,2). П1 Этап Для поиска стратегии управления оР, удовлетворяющей пункту 2° определения 3, используется уже известно значение выигрыша Vj{t„x,,a)
(/=1>2), are (0,1). Таким образом, стратегия управления oF является максимальной по Джоффриону в задаче ((0,1), { Vj (t.,x.,ä)}^.^2). Используя достаточное условие собственно эффективных решений, сР находится из равенства таX О'Г.а,*., a)+(i-r)V2(t„x„ ä)) = rVt(t.,x,.cF)+a-?) v2it.,x.J'),
где Это задача на нахождение максимального значения функции одно-
го аргумента на заданном интервале, не представляющая значительных трудностей.
IV ЭТАП. Достаточные условия для неопределенности Zc<r Z строятся, рассматривая неопределенность как четвертого добавленного игрока. Введем для него функцию выигрыша
J3{UhU2],U2bZ,tm,x,)=ßi MUMbU^Z, t„x,)+ ß2Ju(UuUluU12,Z, t„xt)+
+fhJ2i(UuU2uU22,Z, t„x,)+faJ22(UuU2hU22,Z, t„x,) Здесь ß\+ßi+ßi +ßi = 1. Для этой функции выигрыша вводится W/t, х, щ, и>\, "22, г, К3), где V3 - функция Ляпунова-Бсллмана. Лемма 3. Пусть существуют:
а) U7Jcf)el{2j , U2j{cF)+ u2j(J, х, cF) (/-1,2),
б) Щи21(аР),и22(сР),с?)= UfeUu 1/,с+ щ(1, х, u2l(t,x, cF), u22(t,x, cF), cF\
в) набор чисел ß=iß\, ßh ß, А).
г) п- вектор-функция z(t, х, V3)
д) непрерывно дифференцируемая функция V3(t, х) такие, что:
Г при всеххеВ" выполняется V3(S, x)=x'(3)C(ß)x(ß),
где C(ß)-ß\C\\ ^ßCn+ßCx+ßAC2; 2° для любых te[0,3\, xeR", F3eR' имеет место min Ш М|(/, х, u2\(t, х, cF), unit, х, of'), oF), u2\{t, x, of'), u22(t, x, cF), z, V3) =
z
W3(t, x, ui(t, x, u2](t, x, oF), u22(t, x, oF), cF), u2{{t, x, oF), u22(t, x, oF\ Zait, x), V3);
3° при всех ie[0,3), x&R" W3(t, x, M](i, x, uu{t, x, cF), u12(t, x, cF), cF), u2](t, x, cF), u22(t, x, cF),
zdt, x), V3(t, x)) = 0; 4° неопределенность Zc н- zc(t, x) такова, что Z0e Z.
Тогда неопределенность ZgE Z0 удовлетворяет пункту 3° определения 3, а соответствующий выигрыш неопределенности будет
МЩи^оР), U22(CF), cF), U2i(cF), U22(CF),Zg, /.,*.)-F3( /., x,). Объединение рассмотренных этапов и образует достаточные условия существования GG-гарантирующего равновесия, на основании которых построены коэффициентные критерии для линейно-квадратичной игры.
Глава III посвящена численной реализации гарантирующих равновесий. В §10 описывается линейно-квадратичная дифференциальная иерархическая игра
трёх лиц в условиях неопределённости и находится равновесие этой игры. Поиск решения осуществляется по сформулированным в §6 коэффициентным критериям существования равновесия и реализован в среде MathCAD 2000 Pro. В §11 описывается численный эксперимент по тестированию найденного в §10 равновесия. Результаты эксперимента подтвердили работоспособность достаточных условий существования исследованных равновесий.
В заключении перечисляются основные результаты работы, а также обсуждаются возможные области их применения.
Основное содержание диссертации отражено в работах: 1. Сергеева, М.Ю. Гарантированные равновесия в двухуровневой иерархической дифференциальной игре трех лиц в условиях неопределенности// Материалы ежегодной научно-практической конференции молодых ученых (1320 апреля 2000г.)/ Под общ. ред. А.В Шатиловой,- Балашов: Изд-во БГПИ, 2000г.-С. 100-102. (0,19 п.л.)
2 Сергеева, М.Ю. G-G-гарантированное равновесие в двухуровневой иерархической дифференциальной игре трех лиц в условиях неопределенности// Материалы ежегодной научно-практической конференции молодых ученых (1621 апреля 2001г.)/ Под общ. ред. A.B. Шатиловой. - Балашов: Изд-во БГПИ, 2001г. -С. 98-101. (0,19п.л.)
3 Сергеева, М.Ю Равновесие Штакельберга-Джоффриона двухуровневой иерархической дифференциальной линейно-квадратичной игры трех лиц в условиях неопределенности// Компьютерное моделирование 2003- Труды Международной научно-технической конференции (24-28 июня 2003 г.).- СПб: Нестор, 2003г. - С.210-219. (0,63 п.л.)
4. Сергеева, М Ю. Гарантированные равновесия двухуровневой нетривиальной иерархической дифференциальной игры трех лиц в условиях неопределенности// Компьютерное моделирование 2003: Труды Международной научно-технической конференции (24-28 июня 2003 г.).- СПб: Нестор, 2003г -С.220-229. (0,63 п.л.)
5. Сергеева, М.Ю Поиск решений в двухуровневых системах средствами среды MathCAD// Социально-экономический потенциал российского общества: факторы, проблемы, гипотезы: Материалы I региональной научно-практической конференции БФ СГСЭУ (22-24 апреля 2003 г.).- Балашов: Издат. центр БФ СГСЭУ, 2003г.-С.40-42. (0,19 п.л.)
6. Сергеева, М.Ю. Иерархические игры многих лиц в условиях неопределенности// Перспективы экономического роста и качество жизни россиян: Материалы III региональной научно-практической конференции БФ СГСЭУ (2829 апреля 2005 г.).- Балашов: Издат. центр БФ СГСЭУ, 2005г.- С.78-81 (0,31 п.л.)
Подл, к печ. 05.12.2005 Объем 1 п.л. Заказ №. 457 Тир 100 экз.
Типография МПГУ
ZOQÇ&
P- 1754
с
Оглавление автор диссертации — кандидата физико-математических наук Сергеева, Мария Юрьевна
Ф ВВЕДЕНИЕ.,.
ГЛАВА I. ОПРЕДЕЛЕНИЕ И СВОЙСТВА ГАРАНТИРУЮЩИХ
РАВНОВЕСИЙ.
§ 1. Постановка задачи.
§2. Определение равновесия.
§3. Свойства равновесия.
3.1. Максиминные стратегии и гарантии.
3.2. Устойчивость.
3.3. Полнота.
• §4. Сравнение с равновесием Нэша-Слейтера.
ГЛАВА И. ДОСТАТОЧНЫЕ УСЛОВИЯ СУЩЕСТВОВАНИЯ
РАВНОВЕСИЙ.
§5. Существование равновесий с однозначной реакцией игрока верхнего уровня.
§6. Достаточные условия существования в случае однозначного отображения.
6.1. Основная теорема.
6.2. Коэффициентные критерии для линейно-квадратичной игры.
§7. Построение структуры множества контрстратегий для неоднозначной реакции Центра.
§8. Достаточные условия существования неоднозначной реакции Центра и GG-гарантирующего равновесия.
§9. Коэффициентные критерии для нетривиальной линейноквадратичной игры.
ГЛАВА III. ЧИСЛЕННАЯ РЕАЛИЗАЦИЯ ГАРАНТИРУЮЩИХ
РАВНОВЕСИЙ.
§10. Вычисление гарантирующих равновесий для линейно-квадратичной игры.
§11. Тестирование численного решения.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Сергеева, Мария Юрьевна
Научно-технический прогресс оказывает, с одной стороны, безусловное позитивное влияние на все сферы общественной жизни - социальную и политическую, экономические отношения. С другой стороны, постоянно растущие материальные потребности, расширение и углубление взаимоотношений людей между собой и с окружающей природой приводят к необходимости построения общественных и экономических отношений, ведения хозяйства и сохранения среды обитания человека на научных принципах.
Многообразные проблемы, возникающие в процессе деятельности человека, требуют их исследования с применением математических методов. При этом уже на этапе содержательной постановки научной проблемы, связанной с указанными выше сферами деятельности человека, зачастую становится ясно, что в основе этой проблемы лежит некоторое противоречие, конфликт. Например, проблема добычи животных, птиц, рыб связана с противоречием между удовлетворением растущих потребностей в питании людей и сохранением популяций от уничтожения. Проблема роста благосостояния субъектов экономических отношений связана с конфликтом между продавцом и покупателем благ. Большинство проблем в социальной и политической жизни возникают из-за конфликтов между начальником и подчинённым, между социальными группами, объединениями, партиями и т.п.
При более глубоком анализе поставленной научной проблемы, как правило, выясняется, что отношения между «участниками» противоречия или конфликта могут быть с той или иной степенью достоверности описаны с использованием средств теории исследования операций. При этом в зависимости от характера исследуемой проблемы может быть привлечён математический аппарат теории оптимального управления, теории игр, теории вероятностей и статистики. А поставленные цели обусловливают статический или динамический вариант исследований. Конечным результатом исследования научной проблемы (которое проводит исследователь операции) являются рекомендации для принятия решения ответственным лицом (лицом, прини-Ф мающим решение - ЛПР).
В последние годы оформилось общее название научного направления, в рамках которого ведутся исследования по управлению сложными системами - теоретические основы информатики. Такое название обусловлено тем, что одной из ключевых проблем в процессе исследований является проблема информационной неопределённости и её учета.
В указанном только что научном направлении к настоящему времени уже сложилось чёткое понимание общего объекта исследования. Таким объектом является сложная система управления. В такой системе, как правило, ® фигурируют несколько активных сторон (активность понимается как наличие реакции на внешнее воздействие), что приводит к конфликтному характеру процесса принятия решения. Кроме того, процесс принятия решения может происходить в условиях неопределённости (неточное знание возможностей сложной системы, нечёткая постановка целей, неточности в передаче информации и т.п.).
Значительное число сложных систем управления характеризуется иерархической структурой. Исследование таких систем начиналось на основе одного из направлений в исследовании операций, связанного с изучением • минимаксных, или максиминных, задач. Изучением минимаксных задач управления занимались В.Г. Болтянский и И.С. Чеботару [8], Т.К. Виноградова и В.Ф. Демьянов [16], Г.В. Гайшун и Б.Ш.Мордухович [17], В.А.Горелик и В.В.Федоров [24, 26, 75], Л.Г. Гурин и Е.М. Столярова [30], А.А. Первозванский [57] и другие.
Важным классом минимаксных задач являются задачи управления со связанными переменными, когда управление одной из систем представляет собой многозначную реакцию на управляющее воздействие другой системы. £ В этом случае минимакс дает гарантированную оценку за весь период функционирования систем. Эти задачи возникают, в частности, при изучении иерархических систем и рассмотрены В.А. Гореликом, М.А. Гореловым, А.Ф. Ф Кононенко, Н.С. Новиковой, А.Ф. Таракановым, В.В. Федоровым в [24-29,
54, 75]. Игровой подход к иерархическим системам применялся в [14, 26, 28, 29, 36, 41, 48, 54, 70, 76, 77, 81]. На данный момент теория игр и, в частности, дифференциальных игр, является активно развивающейся областью современной математической теории управления.
Первые работы по дифференциальным играм с ненулевой суммой появились в конце 60-х-начале 70-х годов [1, 20, 47, 76, 92, 88, 89], и в их основе лежат фундаментальные исследования антагонистических дифференциальных игр и теории оптимального управления. На сегодняшний момент закон-Ш чился, в основном, период накопления практических задач и разрозненных теоретических фактов, и наблюдается тенденция к их систематизации, к построению стройной математической теории дифференциальных игр с ненулевой суммой как самостоятельного раздела общей математической теории оптимальных процессов, имеющего свой круг понятий и различные направления исследования.
Характерной чертой многих игровых задач является наличие таких параметров управляемой системы, выбором которых игроки распоряжаться не могут. Появление таких задач связано с тем, что сложные системы, как пра-• вило, взаимосвязаны с внешним миром, что обязывает учитывать не только механизмы функционирования самих систем, но и их взаимодействие с помехами, возмущениями и другими неопределённостями. Изучением таких систем занимается новое направление теории дифференциальных игр - теория дифференциальных игр в условиях неопределённости.
В многокритериальных задачах при неопределённости лицо, принимающее решение, при выборе своего решения должно учитывать, во-первых, наличие нескольких критериев, зависящих как от решений, так и от неопре-а делённостей, во-вторых, возможность реализации любой неопределённости из заданных границ её изменений и вызванную этим многозначность критериев. ф Данная задача привлекла к себе внимание ещё с 60-х годов. Одними из первых на необходимость учёта такой многозначности (в игровых задачах) обратили внимание Р. Ауманн и Б. Пелег [82]. Естественно дальнейшее развитие этого направления на игровые задачи при неопределённости. При этом выделилось два подхода к изучению игр в условиях неопределённости, формализованных в виде антагонистической игры с векторной функцией выигрыша. Первый основан на обобщении понятий минимаксной и максиминной стратегий и активно разрабатывается в России В.И. Жуковским [10, 36, 37, 39] и его учениками А.Е. Бардиным [5], Г.И. Житомирским [35], В.А. Мат® веевым [51], В.В. Мухиным [53], И.В. Чернявским [79] и другими. Независимо от них аналогичные исследования ведутся в Италии [85] и Японии [93]. Динамический вариант этой задачи впервые рассмотрен в книге [96] и получил свое дальнейшее развитие в [36]. Второй подход основан на обобщении понятия векторной седловой точки и рассмотрен в [36, 37, 41] и др.
В последние двадцать лет сформировалось направление в теории игр, оказавшееся весьма плодотворным при анализе иерархических организационных систем. Это направление исследует специальный класс игр, характеризующихся неравноправным положением участников (игроков) и получив® ших поэтому название иерархических игр. К указанным организационным системам можно отнести все модели, базирующиеся на отношениях "начальник-подчиненный". Это большая часть эколого-экономических систем, характеризующихся наличием подуровней.
Особенностью многих исследований иерархических дифференциальных игр является применение к их решению теорем типа принципа максимума JI.C. Понтрягина. Вследствие этого управления игроков ограничиваются в основном только функциями времени [84, 91]. В [83] на простейшем примере ф управляемой системы первого порядка рассмотрен вопрос об организационной структуре, подобная задача для более сложных систем изучена в [56, 71, 72]. Достаточные условия существования стратегий, зависящих только от времени, в линейно-квадратичной дифференциальной игре двух лиц приведены в [4, 91].
Систематическая разработка вопросов теории иерархических игр начата Ю.Б. Гермейером и Н.Н. Моисеевым [19, 23], которые определили решение иерархической игры, близкое по сути к решению по Штакельбергу [94]. В [41] даётся определение решения по Штакельбергу иерархической дифференциальной игры двух лиц. В [22] установлена структура решений, связанная с так называемыми стратегиями наказания. В дифференциальных играх данный подход активно использовался И.А. Вателем, Р.А. Ведерниковым, В.А. Гореликом, Т.Н. Данильченко, Ф.И. Ерешко, А.Ф. Кононенко, Н.С. Кукушкиным, И.С. Меньшиковым, К.К. Мосевичем, Е.З. Мохонько, Н.С. Новиковой, П.В. Фоменко, А.Д. Халезовым, В.В. Чумаковым и другими [12, 13-15, 25, 27-29, 31-34, 42-45, 48, 49, 52, 54, 78, 81]. Принцип Штакельберга стал основой исследования иерархических систем зарубежными учеными [83, 84, 87, 88, 90-92, 95].
Дальнейшее исследование иерархических игр связано с рассмотрением на нижнем уровне иерархии не менее двух игроков, что порождает проблемы выбора игроками правил рационального поведения. Эти правила были перенесены из классической теории игр с ненулевой суммой и породили бескоалиционный, коалиционный и кооперативный варианты иерархической игры. В этом направлении следует отметить исследование В.И. Жуковского и Э.М. Вайсборда [9], в котором использованы стратегии Штакельберга. Здесь достаточно полно изучены различные варианты иерархической игры трёх лиц (без неопределённости) с правом первого хода у игрока верхнего уровня. Однако все выкладки касаются так называемых "однозначных игр", где отсутствует многозначность в контрстратегиях, и действия игроков нижнего уровня предсказуемы. Существенным обстоятельством является зависимость стратегий игроков не только от времени, но и от реализовавшихся значений фазовых координат. Это стало возможным благодаря подходу, основанному на предложенном академиком Н.Н. Красовским объединении динамического программирования с методом функций Ляпунова и позволяющему в ряде случаев указать коэффициентные критерии существования решения и построить их явный вид.
Большое количество работ, посвященных принятию решений в условиях неопределённости, связано с многообразием проявления фактора неопределённости в реальных иерархических системах (неопределённость, связанная с процедурой принятия решения, различная информированность подсистем о внешних параметрах, о параметрах системы и др.).
Игры трёх и более лиц в условиях неопределённости исследовались, например, в [21, 48, 52, 54]. Многообразие возникающих здесь ситуаций определяется порядком ходов участников игры, их информированностью друг о друге, характером внешних параметров (неопределённые, случайные) и т.п. В этих работах, в частности, рассматривались задачи принятия решений в условиях неопределённости в случае, когда Центр информирован хуже подсистем. Это относится к тем неопределённым параметрам, которые являются локальными, то есть описывают сферу действия отдельных подсистем.
Случай, когда Центр информирован лучше подсистемы, рассмотрен в [28]. Это относится к глобальным неопределённым параметрам, описывающим внешнюю среду. В этом случае у Центра появляются дополнительные возможности воздействия на подсистемы, связанные с прогнозированием значений неопределённых факторов.
В [45, 81] изучается класс задач принятия решений в двухуровневой иерархической управляемой системе в условиях неопределённости, обусловленной внешними по отношению к системе факторами (неконтролируемыми воздействиями, параметрами). Специфика рассматриваемого класса задач заключается в следующем. Предполагается, что конкретизация значений неконтролируемых параметров происходит после реализации управлений, выбранных подсистемами, и до реализации конкретных значений управлений Центра. На этапе выбора управлений конкретные значения внешних воздействий не известны ни верхнему, ни нижнему уровням. Априорная информированность элементов системы о неконтролируемых факторах является самостоятельной и может различаться.
В перечисленных выше работах по иерархическим играм, неопределённость имеет, как правило, локальный характер, что позволяет отдельным игрокам использовать информацию о возможных её реализациях. Практически это сводится к следующим моментам: информированный о неопределённости игрок сворачивает свою функцию выигрыша, ориентируясь на наихудшую для себя реализацию неопределённости (то есть минимизирует выигрыш по неопределённому параметру), либо ориентируясь на математическое ожидание неопределённости. При передаче информации другому игроку производятся те же свертки.
Однако в случае наличия нескольких критериев (выигрышей) более целесообразным представляется использование векторных гарантий (от неопределённости), то есть аналогов векторного максимина или векторной седло-вой точки. В рамках же исследования векторных гарантий в дифференциальных играх при неопределённости иерархические игры пока не рассматривались.
Цель настоящей работы - построение математического аппарата для исследования бескоалиционного варианта иерархической дифференциальной игры в условиях неопределённости с правом первого хода у игроков нижнего уровня. При формализации векторных гарантий дифференциальной игры в условиях неопределённости используется аналог векторной седловой точки, объединенный с концепцией равновесного решения иерархической игры. Указанная концепция основана на принципе Штакельберга [94].
Таким образом, объект настоящего исследования — бескоалиционный вариант иерархической дифференциальной игры трёх лиц в условиях неопределённости с правом первого хода у игроков нижнего уровня.
Предметом исследования является принцип равновесного гарантированного результата в этих играх.
Научную новизну работы составляют результаты исследования класса дифференциальных игр трёх лиц, где имеет место внешний неконтролируемый неопределённый фактор. Игра является децентрализованной, так как правом первого хода обладают игроки нижнего уровня, действующие каждый в своих интересах. Такая постановка задачи соответствует бескоалиционному варианту игры. Существенным моментом является нетривиальность рассматриваемой игры, то есть учитывается многозначность в контрстратегиях лидера и непредсказуемость его действий для игроков нижнего уровня. Важной особенностью настоящего исследования является учёт реализации любой контрстратегии Центра из целого множества, а это ставит игроков нижнего уровня перед проблемой учета дополнительного неопределённого для них параметра. Именно в отношении такого вида неопределённости следует рассматривать понятие "гарантирующий" в определениях исследуемых равновесий.
Достижению поставленной цели способствует решение следующих задач:
• построение принципа равновесного гарантированного результата бескоалиционного варианта иерархической дифференциальной игры трёх лиц в условиях неопределённости - гарантирующих равновесий;
• изучение свойств гарантирующих равновесий;
• построение достаточных условий существования гарантирующих равновесий для тривиальной игры, нахождение коэффициентных критериев для линейно-квадратичного случая;
• построение достаточных условий существования гарантирующих равновесий для нетривиальной игры, нахождение коэффициентных критериев для линейно-квадратичного случая;
• численное исследование гарантирующих равновесий по коэффициентным критериям.
Методологическую основу настоящего исследования составляют:
• выпуклый анализ [61, 62];
• теория матриц и систем дифференциальных уравнений [6, 18, 60];
• методы и подходы теории дифференциальных игр и многокритериальных задач [1,9, 38, 39, 40, 58];
• методы и принципы теории оптимизации и оптимального управления [2, 3, 7, 11, 46, 50, 55, 59, 63, 73, 74, 80];
• подход к построению достаточных условий, основанный на объединении метода функций Ляпунова с динамическим программированием [47].
Практическая значимость исследования заключается в прикладной актуальности рассмотренного класса игр. Такими играми моделируется множество реальных ситуаций: управление многоуровневым производством в меняющихся экономических условиях с предоставлением экономической свободы в принятии решений по схеме "снизу-вверх"; осуществление командования военными действиями при неизвестных действиях противника; поддержание экологического баланса в природе при неопределённых природных факторах (распространенная схема: районная администрация следит за эффективным поведением вредного производства и оказывает поддержку сельскому хозяйству, при этом интересы производства и фермера различны, а неопределённые природные факторы могут усилить вредное воздействие производства, что повредит всем элементам системы) и др. Настоящее исследование позволяет предложить эффективное решение указанных проблем, а в случае получения соответствующих количественных характеристик в ряде случаев возможно найти и численное решение.
На защиту выносятся:
1) определения гарантирующих равновесий: а) обобщённое определение гарантирующих равновесий; б) определение равновесий Штакельберга-Слейтера, Штакельберга-Парето и Штакельберга-Джоффриона для частного случая исследуемой игры при однозначной реакции Центра; в) определение гарантирующего равновесия, конкретизированное для нетривиальной игры;
2) свойства гарантирующих равновесий;
3) достаточные условия существования гарантирующих равновесий для тривиальной игры и коэффициентные критерии в линейно-квадратичном случае;
4) достаточные условия существования гарантирующих равновесий для нетривиальной игры и коэффициентные критерии в линейно-квадратичном случае.
Апробация. Результаты докладывались на научно-практических конференциях молодых ученых Балашовского филиала Саратовского государственного университета (СГУ) им. Н.Г.Чернышевского (Балашов, 1999, 2000, 2001, 2005 гг.), научно-методических семинарах кафедры информатики, на аспирантском объединении Балашовского филиала СГУ им. Н.Г.Чернышевского (Балашов, 1999, 2000, 2001, 2005 гг.), на IV Международной научно-технической конференции «Компьютерное моделирование 2003» в Санкт-Петербургском государственном политехническом университете (Санкт-Петербург, 2003 г.), региональных научно-практических конференциях Балашовского филиала Саратовского государственного социально-экономического университета (Балашов, 2003, 2005 гг.), научно-методических семинарах кафедры прикладной математики и информатики Борисоглебского государственного педагогического института (2005г.). Кро
Кроме того, результаты исследования апробированы с помощью численного эксперимента, описанного в диссертации.
Структура работы. Работа состоит из трех глав. В первой главе (§§ 1-4) формулируется и исследуется децентрализованная иерархическая дифференциальная игра трёх лиц в условиях неопределённости. В § 1 дается описание игры и описываются ее правила. Рассматриваются особенности рассматриваемого класса игр и формулируются основные этапы в построении решений. В §2 производится поиск аналога решения по Штакельбергу применительно к бескоалиционному варианту рассматриваемой игры. При этом выкладки опираются на определение решения по Штакельбергу вспомогательной двухуровневой дифференциальной игры не трёх, а двух лиц. На основе анализа этого решения устанавливается практический способ нахождения решения по Штакельбергу игры двух лиц, который позволяет обобщить это решение на случай исследуемой игры трёх лиц.
В этом же параграфе даются обобщенные определения гарантирующих равновесий в игре трёх лиц в условиях неопределённости и устанавливается их взаимосвязь.
В §3 устанавливаются свойства введённых равновесий. Это традиционные для равновесий свойства: индивидуальная рациональность, векторная гарантия при реализации любой неопределённости, устойчивость к отклонению от равновесия отдельного игрока, динамическая устойчивость и полнота.
К традиционным свойствам добавляется также свойство влияния одного игрока нижнего уровня, выбравшего стратегию из равновесия, на выбор второго игрока нижнего уровня. Производится также сравнение исследуемого равновесия с популярным равновесием Нэша-Слейтера для той же игры.
Заключение диссертация на тему "Гарантирующие равновесия в бескоалиционном варианте двухуровневой иерархической децентрализованной дифференциальной игры трех лиц в условиях неопределенности"
Основные результаты диссертации.
1) Построено решение игры - KL-гарантирующее равновесие, которое является аналогом векторной седловой точки во взаимоотношениях «игроки-неопределенность», а также позволяет игрокам нижнего уровня использовать такие стратегии, которые гарантируют им наибольшие выигрыши при любом поведении Центра.
2) Для введенного равновесия изучено свойство индивидуальной рациональности, векторная гарантия в отношении неопределенности, устойчивость к отклонению отдельного игрока, динамическая устойчивость, полнота, диктатура условий, сравнение с равновесием Нэша-Слейтера.
3) Выделен и изучен частный случай рассматриваемой игры - тривиальный вариант, который образуется в случае однозначной реакции Центра и позволяет говорить о предсказуемости действий Центра для игроков нижнего уровня. Для данной разновидности рассматриваемой игры построены равновесия Штакельберга-Слейтера, Штакельбурга-Парето и Штакельберга-Джоффриона как частные случаи KL-гарантирующего равновесия.
4) Сформулированы и доказаны достаточные условия существования равновесия Штакельберга-Джоффриона, а также построены коэффициентные критерии для линейно-квадратичной игры.
5) В среде MathCAD реализована схема нахождения численного значения равновесия Штакельберга-Джоффриона. По этой схеме произведено тестирование равновесия на оптимальность, что показало практическую пригодность линейно-квадратичных критериев для решения рассматриваемого класса игр.
6) Выделен нетривиальный вариант игры, который реализуется в случае неоднозначной реакции Центра. В этом случае действия Центра непредсказуемы для игроков нижнего уровня, что говорит о наличии в игре не только заявленной объективной неопределенности, но и определенности субъективной. Эту дополнительную неопределенность приходится учитывать игрокам нижнего уровня. KL-гарантирующее равновесие в полной мере соответствует данной постановке задачи. Однако для удобства восприятия и дальнейших исследований введено корректирующее определение - GG-гарантирующее равновесие. В нем явным образом указана стратегия управления Центра а, которая входит в состав контрстратегии и реализует указанную неоднозначность реакции.
7) Для нетривиальной игры сформулированы и доказаны достаточные условия существования GG-гарантирующего равновесия (и, следовательно, KL-гарантирующих равновесий) и построены коэффициентные критерии для линейно-квадратичной игры. Важным моментом процесса построения коэффициентных критериев в данном случае является последовательное решение двух систем дифференциальных уравнений (ранее исследованные игры не использовали такой подход). Недостатком предложенной схемы является затруднительность ее численной реализации из-за большого числа коэффициентов и аргументов искомых функций.
II. Область применения полученных результатов. Множество реальных систем, функционирующих в обществе, имеют иерархическую структуру. Большая их часть может быть описана с помощью рассмотренной в диссертации игры.
Рассмотрим следующий пример. Телевизионный канал транслирует в эфире музыку и новости. За каждое направление деятельности отвечает самостоятельный отдел. Задача каждого отдела — создание интересных программ, которые будут транслироваться в эфире. Администрация канала обеспечивает качественную трансляцию эфира, производит отбор предоставленных к эфиру материалов, их анонсирование и рекламную политику. При этом деятельность канала осуществляется в условиях жесткой конкуренции с другими каналами. Такую систему можно описать с помощью иерархической децентрализованной игры в условиях неопределенности. Игроками нижнего уровня являются отдел новостей и музыкальный отдел, Центр — администрация канала. Конкурирующие каналы можно рассматривать как внешнюю неопределенность, которая своими действиями может повредить системе: перекупить частоты вещания, опередить в освещении событий и прочее.
Естественно, что в описываемой системе администрация канала благосклонна к каждому из отделов и способствует эффективной работе каждого из них. Распространенным явлением в деятельности телеканалов является регламентирование эфирного времени для каждой программы, поэтому администрация своими действиями не станет ущемлять один отдел и продвигать другой. При этом стратегические цели администрации понятны каждому из отделов. В этом случае действия администрации не являются непредска-л зуемыми для отделов. В качестве нахождения оптимального функционирования описанной системы можно предложить равновесие Штакельберга-Джоффриона.
Ф Согласно определению равновесия, система ориентируется на сильнейшее противодействие конкурентов, поэтому прилагает максимум усилий к качеству эфира. Отделы канала действуют самостоятельно, однако учитывают информацию о политике канала (контрстратегиях), то есть используют в своих решениях ответные решения администрации. При этом выбирают свои решения, ориентируясь на лучший результат.
Предложенные коэффициентные критерии существования равновесия Штакельберга-Джоффриона для линейно-квадратичной формализации данной задачи позволяют предложить отделам и администрации канала опти
• мальный вариант поведения. Числовые расчеты в среде MathCAD по приведенной в диссертации схеме дают возможность получить явный числовой вид функций поведения (стратегий), а также рассчитать прибыль или рейтинг каждого из отделов и канала в целом (выигрыши).
Другая задача. В некотором районе функционирует производство в лице завода, а также сельское хозяйство в лице фермерского хозяйства. Управляющим органом района является районная администрация, которой подчиняются и руководство завода и управляющий фермерским хозяйством. При этом интересы и завода, и фермерского хозяйства различны. Заводу необходимо получать прибыль, выпуская больше продукции, однако отходы производства могут загрязнять окружающую среду. Фермер заинтересован в выращивании качественной, экологически чистой сельскохозяйственной продукции, а этому могут помешать действия завода. Районная администрация заинтересована в процветании района, поэтому способствует развитию как сельского хозяйства, так и промышленности. Однако перед ней стоит важная задача поддержания экологического баланса и контролирования действий завода и фермерского хозяйства. Неопределенным фактором можно считать природные условия, которые могут усилить вредное воздействие промышленного завода и нарушить экологическое равновесие.
В такой задаче формально описана иерархия, функционирующая в условиях неопределенности. Но действия районной администрации в полной мере не предсказуемы для завода и фермерского хозяйства, поэтому образуют дополнительную субъективную неопределенность. Предложить варианты поведения в этом случае позволяет GG-гарантирующее равновесие. Интересной особенностью этого равновесия является то, что для принятия решения на его основе можно использовать следующую последовательность действий:
1) руководство завода и управляющий фермерским хозяйством предоставляют районной администрации проекты своей деятельности (множества стратегий);
2) администрация района в ответ на эти проекты формирует свою политику в отношении предоставленных проектов и сообщает ее руководству завода и управляющему фермерским хозяйством (создает множества контрстратегий);
3) и завод, и фермерское хозяйство принимают окончательные решения, которые содержат параметры, корректируемые районной администрацией (стратегии управления Центра);
4) районная администрация вносит коррективы и указывает конкретные объемы производства, ориентируясь на конъюнктуру рынка, загрязненность среды и прочее (выбирает конкретное решение из своей политики).
При этом каждый элемент описанной иерархии должен учитывать наличие неконтролируемых природных факторов.
Очевидно, что описанная последовательность действий является рациональной. В такой системе невозможно обойтись без обмена информацией между верхним уровнем и нижним.
Коэффициентные критерии существования GG-гарантирующего равновесия в случае линейно-квадратичной формализации функционирования этой системы позволяют предложить конкретный вид принимаемых решений (стратегий).
Рассмотренные примеры в достаточной степени отражают области возможного использования результатов настоящего исследования.
ЗАКЛЮЧЕНИЕ
Библиография Сергеева, Мария Юрьевна, диссертация по теме Теоретические основы информатики
1. Айзеке, Р. Дифференциальные игры Текст./ Р.Айзеке.- М.: Мир,1967.-479с.
2. Атанс, М. Оптимальное управление Текст./ М.Атанс, П.Фалб — М.: Машиностроение, 1968-764с.
3. Афанасьев, В.Н. Математическая теория конструирования систем управления Текст./ В.Н. Афанасьев, В.Б. Колмановский, В.Р. Носов- М.: Высш. шк., 1989-447с.
4. Баратова, Е.Д. Метод штрафов и необходимые условия оптимальности в дифференциальной иерархической игре при неопределенности Текст./
5. Е.Д.Баратова, А.Ф. Тараканов // Известия АН. Теория и системы управления.- 2003.- №4.- С.342-348.
6. Бардин, А.Е. Векторный риск Текст.: автореф. дис. . канд. физ.-мат. наук: Санкт-Петербургский гос. ун-т/ Бардин Александр Евгеньевич.- СПб, 1993.- 14с.
7. Беллман, Р. Введение в теорию матриц Текст./ Р.Беллман- М.: Наука, 1969.-367с.
8. Беллман, Р. Динамическое программирование Текст./ Р.Беллман.— М.: ИЛ, I960.-400с.
9. Болтянский, В.Г. Минимаксные задачи оптимального управления Текст./ В.Г.Болтянский, И.С. Чеботару // Дифференц. уравнения 1974-Т. 10.-№7.-С. 1213-1224.
10. Вайсборд, Э.М. Введение в дифференциальные игры нескольких лиц и их приложения Текст./ Э.М. Вайсборд, В.И. Жуковский. М.: Советское радио, 1980-304с.
11. Ватель, И.А. Оптимальное поведение игрока, обладающего правом первого хода при неточном знании интересов партнера Текст./ И.А.Ватель, Н.С.Кукушкин// Ж. вычисл. матем. и матем. физ 1973.-Т.13,№2.-С.303-310.
12. Ведерников, Р.А. О принятии решений в двухуровневой иерархической системе управления при неполной информации о нижнем уровне Текст./ Р.А.Ведерников, А.Ф. Кононенко// Изв. АН СССР. Техн. кибернети-ка.-1976.-№2.-С. 13-22.
13. Ф 14. Ведерников, Р.А. О рациональных процедурах обмена информациейпри планировании в условиях неопределенности Текст./ Р.А.Ведерников, А.Ф. Кононенко// Модели и методы анализа экономических целенаправленных систем-Новосибирск: Наука, 1977.-С.98-112.
14. Ведерников, Р.А. Об эффективных процедурах обмена информацией при управлении в условиях неопределенности Текст./ Р.А.Ведерников, А.Ф. Кононенко, П.В.Фоменко//Автоматика и телемеханика.-1983.-№1.-С.118-124.
15. Виноградова, Т.К. К необходимым условиям в минимаксных задачах управления Текст./ Т.К.Виноградова, В.Ф. Демьянов// Журн. вычисл. мате• матики и мат. физики 1974-Т. 14, № 1.-С. 233-236.
16. Гайшун, П.В. Минимаксная задача оптимального управления для одного класса негладких систем с терминальными ограничениями Текст./ П.В. Гайшун, Б.Ш. Мордухович (Препринт/ Ин-т математики АН БССР-№13(170)).-Минск, 1983.-30с.
17. Гантмахер, Ф.Р. Теория матриц Текст./ Ф.Р. Гантмахер- М.: Государственное издательство технико-теоретической литературы, 1953.- 492с.к
18. Гермейер, Ю.Б. Введение в теорию исследования операций Текст./ а Ю.Б. Гермейер.-М.:Наука, 1971.-383с.
19. Гермейер, Ю.Б. Игры с непротивоположными интересами Текст./ Ю.Б. Гермейер-М.:Наука, 1976-328с. Ф 21. Гермейер, Ю.Б. К теории игр трех лиц [Текст]/ Ю.Б. Гермейер//
20. Журн. вычисл. математики и мат. физики 1973-Т. 13.-№6.-С. 1459-1468.
21. Гермейер, Ю.Б. Об играх двух лиц с фиксированной последовательностью ходов Текст./ Ю.Б. Гермейер// Докл. АН СССР.- 1971.-195, №5-С.1001-1004.
22. Гермейер, Ю.Б. О некоторых задачах теории иерархических систем Текст./ Ю.Б.Гермейер, Н.Н.Моисеев// Проблемы прикладной матем. и механики.- М.: Наука, 1971.- С. 30-43.
23. Горелик, В.А. Максиминные задачи на связанных множествах в • банаховых пространствах Текст./ В.А. Горелик// Кибернетика 1983.- №1 .1. С.64-67.
24. Горелик, В.А. Принцип гарантированного результата в неантагонистических играх двух лиц с обменом информацией Текст./ В.А. Горелик //Исследование операций.-М.: ВЦ АН СССР.- 1971.-Вып.2.-С.102-108.
25. Горелик, В.А. Об одном подходе к решению минимаксных задач оптимального управления Текст./ В.А. Горелик, В.В. Федоров// Изв. АН СССР. Техн. кибернетика 1976-№1-С. 45-54.
26. Горелик, В.А. Анализ конфликтных ситуаций в системах управле-Ф ния Текст./ В.А. Горелик, М.А. Горелов, А.Ф. Кононенко.- М.: Радио исвязь, 1991.-288с.
27. Горелик, В.А. Теоретико-игровые модели принятия решений в эко-лого-экономических системах Текст./ В.А. Горелик, А.Ф. Кононенко М.: Радио и связь, 1982. - 144с.
28. Горелик, В.А. Метод решения минимаксных задач управления
29. Текст./ В.А.Горелик, А.Ф. Тараканов // Проблемы теоретической кибернетикки: Тез. докл. VIII Всесоюз. конф. в 2-х частях, Горький, июль 1988г.- Горь-т кий, 1988.- Ч. 1.-С.95-96.
30. Гурин, Jl.Г. Принцип максимума в одной минимаксной задаче Текст./ Л.Г. Гурин, Е.М. Столярова // Журн. вычисл. математики и мат. физики.-1973 .-Т. 13, №5-С. 1175-1185.
31. Данильченко, Т.Н. Многошаговая игра двух лиц при осторожном втором игроке и последовательной передаче информации Текст./ Т.Н.Данильченко, К.К. Мосевич//Журн. вычисл. математики и мат. физики-1974.-Т. 14, №5.-С. 1323-1327.
32. Данильченко, Т.Н. Многошаговая игра двух лиц с фиксированной последовательностью ходов Текст./ Т.Н.Данильченко, К.К. Мосевич// Журн. вычисл. математики и мат. физики.- 1974- Т. 14, № 4 — С. 1047-1052.
33. Данильченко, Т.Н. Многошаговые игры двух лиц с непротивоположными интересами и передачей информации Текст./ Т.Н.Данильченко, К.К. Мосевич // Труды 18-й науч. конф. Моск. физ.-техн. ин-та. Серия "Аэромеханика, процессы управления", 1973- С. 222-230.
34. Ерешко, Ф.И. Решение игры с правом первого хода при неточной информации о цели партнера Текст./ Ф.И. Ерешко, А.Ф. Кононенко// Ж. вычисл. матем. и матем. физ 1973.-Т. 13, №1-С.217-221.
35. Житомирский, Г.И. Конфликтные динамические системы Текст.: автореф. дис. . канд. физ.-мат. наук: 01.01.09 Ленинград, гос. ун-т/ Житомирский Гарри Иосифович-Л.:, 1988 16с.
36. Жуковский, В.И. Введение в дифференциальные игры при неопределенности Текст./В.И. Жуковский-М.: МНИИПУ,1997.-461с.
37. Жуковский, В.И. Многокритериальное принятие решений в условиях неопределенности Текст./ В.И. Жуковский, B.C. Молоствов М.: МНИИ-ПУ, 1988.- 132с.
38. Жуковский, В.И. Игровые линейно-квадратичные задачи Текст./ В.И. Жуковский, М.Е. Салуквадзе.- (Препринт).- Тбилиси: Ин-т Систем Управления АН Грузии, 1992 64с.
39. Жуковский, В.И. Многокритериальные задачи в условиях неопределенности Текст./ В.И. Жуковский, М.Е. Салуквадзе.- Тбилиси: МЕЦНИЕ-РЕБА, 1991.- 128с.
40. Жуковский, В.И. Оптимизация гарантий в многокритериальных задачах управления Текст./ В.И. Жуковский, М.Е. Салуквадзе- Тбилиси: МЕЦНИЕРЕБА, 1996.-480с.
41. Жуковский, В.И. Линейно-квадратичные дифференциальные игры Текст./ В.И. Жуковский, А.А. Чикрий- Киев: Наукова думка, 1994.- 320с.
42. Кононенко, А.Ф. Роль информации о функции цели противника в играх двух лиц с фиксированной последовательностью ходов Текст./ А.Ф. Кононенко// Ж. вычисл. матем. и матем. физ 1973.-Т.13, №2.-С.311-317.
43. Кононенко, А.Ф. О процессе получения информации в неантагонистических дифференциальных играх Текст./ А.Ф. Кононенко, Е.З. Мохонь-ко.-М.: ВЦ АН СССР, 1982.-20 с.
44. Кононенко, А.Ф. Принятие решений в условиях неопределенности Текст./ А.Ф. Кононенко, А.Д. Халезов, В.В. Чумаков.-М.: ВЦ АН СССР, 1991.- 198с.
45. Кононенко, А.Ф. О принятии решений в двухуровневой иерархической системе управления при наличии внешних неконтролируемых факторов Текст./ А.Ф. Кононеко, В.В. Чумаков// Автоматика и телемеханика 198811.-С. 92-101.
46. Красовский, Н.Н. Теория управления движением Текст./ Н.Н. Кра-совский.-М.: Наука, 1968.-475с.
47. Красовский, Н.Н. Позиционные дифференциальные игры Текст./ Н.Н. Красовкий, А.И. Субботин М.: Наука, 1974- 455с.
48. Кукушкин, Н.С. Бескоалиционные игры трех лиц с фиксированной иерархической структурой Текст./ Н.С. Кукушкин// Журн. вычисл. математики и матем. физики 1979.- Т. 19, №4 - С. 896-911.
49. Кукушкин, Н.С. Об одной игре с неполной информацией Текст./ Н.С. Кукушкин// Ж. вычисл. матем. и матем. физ.-1973.-Т.13,№1.-С.210-216.
50. Ф 50. Ли, Э.Б. Основы теории оптимального управления Текст./ Э.Б. Ли,
51. Л. Макус.-М.: Наука, 1972 — 574с.
52. Матвеев, В.А. Многокритериальная позиционная задача для параболической системы Текст.: автореф. дис. . канд. физ.-мат. наук: 01.01.02 Уральский гос. ун-т / Матвеев Владимир Александрович — Екатеринбург, 1992.-13с.
53. Новикова, Н.С. Игры двух и трех лиц со связанными ограничениями при фиксированном порядке ходов Текст./ Н.С. Новикова // Журн. вычисл. математики и мат. физики 1976 - Т. 16, №2.- С. 326-329.
54. Ногин, В.Д. Основы теории оптимизации Текст.: учеб. пособие для студентов ВТУЗов/ В.Д. Ногин, И.О. Протодьяконов, И.И. Евлампиев; под общ. ред. И.О.Протодьяконова.-М.: Высш. шк., 1986-384с.
55. Павловский, Ю.Н. Агрегирование сложных моделей и построение иерархических систем управления Текст./ Ю.Н. Павловский // Исследование операций.- Вып. 4.- М.: ВЦ АН СССР, 1974.- С.3-38.
56. Первозванский, А.А. О минимуме максимального уклонения управляемой линейной системы Текст./ А.А. Первозванский// Изв. АН СССР. Сер. Механика.- 1965.-№2.-С. 51-57.
57. Подиновский, В.В. Парето-оптимальные решения многокритериальных задач Текст./ В.В. Подиновский, В.Д. Ногин.-М.: Наука, 1972 254с.
58. Понтрягин, JT.C. Математическая теория оптимальных процессов Текст./ Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко
59. М.: Наука. Главная редакция физико-математической литературы, 1969384с.
60. Понтрягин, Л.С. Обыкновенные дифференциальные уравнения Текст./ Л.С. Понтрягн М.: Наука, 1961.- 311с.
61. Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи Текст./ Б.Н. Пшеничный— М.: Наука. Главная редакция физико-математической литературы, 1980 —320с.
62. Пшеничный, Б.Н. Численные методы в экстремальных задачах Текст./ Б.Н. Пшеничный, Ю.М. Данилин М.: Мир, 1982 - 276с.
63. Сеа, Ж. Оптимизиция: теория и алгоритмы Текст./ Ж. Сеа- М.: Мир, 1973 .-244с.
64. Сергеева, М.Ю. Гарантированные равновесия в двухуровневой иерархической дифференциальной игре трех лиц в условиях неопределенности
65. Текст./ М.Ю. Сергеева// Материалы ежегодной научно-практической конференции молодых ученых (13-20 апреля 2000г.)/ Под общ. ред. А.В. Шатиловой.- Балашов: Изд-во БГПИ, 2000г. С. 100-102.
66. Сергеева М.Ю. Иерархические игры многих лиц в условиях неопределенности/ М.Ю. Сергеева// Перспективы экономического роста и качество
67. Ф жизни россиян: Материалы III региональной научно-практической конференции БФ СГСЭУ (28-29 апреля 2005г.).- Балашов: Издат. центр БФ СГСЭУ, 2005г.-С.78-81.
68. Сергеева, М.Ю. Поиск решений в двухуровневых системах средствами среды MathCAD Текст./ М.Ю. Сергеева// Материалы I научно-практической конференции БФ СГСЭУ (22-24 апреля 2003 г.).- Балашов: БФ СГСЭУ, 2003г.- С.40-42.
69. Тараканов, А.Ф. Решение Нэша-Слейтера иерархической игры в условиях неопределенности Текст./ А.Ф. Тараканов// Известия АН. Теория и системы управления 2000 - №4 - С.553-560.
70. Фаткин, Ю.М. Оптимальное управление в иерархических системах, описываемых дифференциальными уравнениями иерархической структуры Текст./ Ю.М. Фаткин// Автоматика и телемеханика.-1973.-№10 С.169-178.
71. Фаткин, Ю.М. Оптимальное управление в иерархических структурах Текст./ Ю.М.Фаткин// ДАН СССР, 1972.- Т. 202, №1С.59-61.
72. Фаткин, Ю.М.Оптимальное управление в иерархической структуре, элементы которой заданы на различных временных интервалах Текст./ Ю.М.Фаткин, Г.М. Зуев// Автоматика ителемеханика-1974. № З.-С. 95-101.
73. Фаткин, Ю.М., Чарный В.И. Определение оптимального управления в системах дифференциальных уравнений с иерархической структурой с помощью итеративного процесса Текст./ Ю.М.Фаткин, В.И. Чарный// Автомал тика и телемеханика 1973-№11- С. 102-112.
74. Федоров, В.В. Численные методы максимина Текст./ В.В.Федоров-М.: Наука, 1979.-279с. р 76. Флеров, Ю.А. Многоуровневые динамические игры и централизованное управление Текст./ Ю.А.Флеров// Децентрализованное методы управления М.: Наука, 1972 - С. 64-71.
75. Флеров, Ю.А. Многоуровневые иерархические игры Текст./ Ю.А. Флеров// ДАН СССР.- 1969.- Т. 187, № 5.- С. 1002-1004.
76. Халезов, А.Д. Об одном классе многошаговых конфликтов в условиях риска Текст./ А.Д. Халезов// Журн. вычисл. математики и мат. физики,- 1982.- Т. 22, № 1.- С. 42-48.
77. Чернявский, И.В. Гарантии в многокритериальных задачах Текст.: # автореф. дис. . канд. физ.-мат. наук: 01.02.01. МГУ им. М.В. Ломоносова /
78. Чернявский Игорь Владимирович.-М., 1988.—13с.
79. Чикрий, А.А. Конфликтно управляемые процессы Текст./ А.А.Чикрий Киев: Наукова думка, 1992 - 384с.
80. Чумаков, В.В. Об одной иерархической игре в условиях неопределенности Текст./ В.В. Чумаков// Математические методы управления и обработки информации-М.: МФТИ, 1986-С. 120-125.
81. Aumann, R.J. Von Neumann-Morgenstern Solution for Cooperative Games without Side Payments Текст./ R.J. Aumann, B. Peleg// Bulletin of theф American Mathematical Society.- 1990.- V. 66, №3.- P. 173-179.
82. Basar, T. On the relative leadership property of Stackelberg strategies Текст./ Т. Basar// J. Optimiz. Theory Appl- V. 11, № 6 P. 655-661.
83. Chen, C.J. Stackelberg solution for two-person games with biased information patterns Текст./ C.J. Chen, J.B. Crus// IEEE Trans. Automat. Contr-1972, V. 17, № 6.- P. 791 -798.
84. Ferro, F.A. Minimax Theorem for Vector-Valued Function Текст./ F.A. Ferro// J. Optimiz. Theory and Appl.- 1989.- V. 60.- P. 19-31.
85. Jumarie, G. Coordination des systemes hierarchique a deux niveau pur coorgination des hamiltoniens de niveau inferrieur Текст./ G. Jumarie// C. r.
86. Ф Acad. Sci., ser. В.- 1974, № 1 l.-P. 451-454.
87. Kenko, U. Optimal control for a linear continues system under a hierarchical information structure Текст./ U.Kenko, M.Kinji, S.Etsu jiro// Кейсо-ку дзидо сейгё раккай рамбунсю (Trans. Soc. Instrum. and Control Eng.).-1974.-V. 10, № l.-P. 71-77.
88. Leitmann, G. Cooperative and Noncooperative Many Players Differential Games Текст./ G. Leitmann Wien: Springer, 1974- 77 p.
89. Pau, L.F. Coordinational par les contraintes dans in jeu twolevel hierarchise Текст./ L.F. Pau// C. r. Acad. Sci. Ser. A.- 1974.- V. 279, № 5.- P.• 177-180.
90. Simaan, M. Additional aspects of the Stackelberg's strategy in nonzero-sum games Текст./ M. Simaan, J.B. Crus// J. Optimiz. Theory Appl- 1973.-V.ll,№6.-P. 613-636.
91. Simaan, M. A Stackelberg's solution for games with many players Текст./ M. Simaan, J.B. Crus// IEEE Trans. Automat. Contr 1973- V.18, № 3.-P. 322-324.
92. Simaan, M. On the Stackelberg's strategy in nonzero-sum games Текст./ M. Simaan, J.B. Crus//J. Optimiz. Theory. Appl.- 19973.-V.11.№ 5.-P. 533-555.
93. Tanaca, T. Two Types of Minimax Theorems for Vector-Valued Functions Текст./ Т. Tanaca// Ibid 1991.- V. 68, № 2.- P. 321-334.
94. Von Stackelberg, H. The Theory of the Market Economy Текст./ H. Von Stackelberg- New York: Oxford University Press., 1952 328c.
95. Waltz, F.M. An enginiering approah: hierarchical optimization criteria Текст./ F.M. Waltz// IEEE Trans. Automatic. Control 1967.- AC-12, № 2.- P. 179-180.
96. Zhukovskii, V.I. The Vector-Valued Maximin Текст./ V.I. Zhukovskii, , M.E. Salukvadze- New York ets: Academic Press, 1994 404 p.
-
Похожие работы
- Информационные модели двухуровневых иерархических систем, функционирующих в условиях неопределённости
- Равновесие по Нэшу при определенности
- Равновесие по Нэшу при неопределенности
- Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников
- Гибридные равновесия в играх при неопределенности
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность