автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Стохастические модели проведения переговоров с несколькими участниками
Автореферат диссертации по теме "Стохастические модели проведения переговоров с несколькими участниками"
На правах рукописи
Носальская Татьяна Эдуардовна
Стохастические модели проведения переговоров с несколькими участниками
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ
АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук
005558612
Петрозаводск — 2014
005558612
Работа выполнена в ФГБОУ ВПО «Забайкальский государственный университет»
Научный руководитель: доктор физико-математических наук, профессор
Мазалов Владимир Викторович
Официальные оппоненты: доктор физико-математических наук, профессор
Луденко Михаил Михайлович, профессор кафедры «Математика и моделирование» ФГБОУ ВПО «Петербургский государственный университет путей сообщения Императора Александра I»
кандидат физико-математических наук Парилина Елена Михайловна,
доцент кафедры математической теории игр и статистических решений ФГБОУ ВПО «Санкт-Петербургский государственный университет»
Ведущая организация: ФБГОУ ВПО «Новгородский государственный
университет имени Ярослава Мудрого»
Защита состоится «26» декабря 2014 г. в 10:00 на заседании диссертационного совета Д 212.190.03 на базе ФГБОУ ВПО «Петрозаводский государственный университет» по адресу: 185910, г. Петрозаводск, пр. Ленина, 33.
С диссертацией можно ознакомиться в научной библиотеке Петрозаводского государственного университета и на сайте http://www.petrsu.ru.
Автореферат разослан ноября 2014 г.
Ученый секретарь /
диссертационного совета /Воронов Роман Владимирович
Общая характеристика работы
Актуальность темы. Модели переговоров занимают одно из центральных мест в теории игр. Известны различные схемы переговоров: арбитражные процедуры, задачи распределения ресурсов, последовательные процедуры, переговоры со случайными предложениями, процедуры проведения конкурсов и другие. Существует множество способов организации переговоров, все они должны отвечать ряду требований: должны быть определены все участники переговоров, в переговорах могут принимать участие два и более лиц, должна быть определена очередность предложений игроков, должны быть определены выигрыши игроков, переговоры должны заканчиваться, переговоры должны приводить к определённому результату, выигрыши равных игроков должны быть равны.
Особенно актуальным теоретико-игровое моделирование переговоров является в политике, экономике, медицине, а также сфере информационных технологий для решения различного рода прикладных задач. Примерами могут служить международные соглашения, голосование в парламенте, распределение оборонных ресурсов, политика сдерживания, определение географии импорта и экспорта товаров, ценовая политика, укрупнение бизнеса в условиях конкуренции, тендеры и т.д.
Степень разработанности темы исследования. Задача переговоров впервые возникла более 130 лет назад как экономическая проблема, описанная Эджвортом. Важную роль в теории переговоров играет задача о распределении ресурсов, которую также называют задачей дележа пирога. Существуют различные процедуры дележа. Условно все существующие модели могут быть разбиты на две группы. В первой группе сами участники предлагают варианты распределения. Такая постановка рассматривалась в работах Брамса, Килгора, Мазалова, Сакагучи, Забелина, Рубинштейна и других. Во второй группе для решения задачи приглашается третья независимая сторона - арбитр, который и формирует предложения участникам. Такие модели анализируются в работах Мазалова, Токаревой, Брамса, Килгора, Банина, Гар-наева, Сакагучи, Кроуфорда, Чаттерджи и других. Данное диссертационное исследование продолжает серию теоретико-игровых моделей, как предпола-
гающих участие арбитра либо арбитражного комитета, так и включающих в себя договорённости между участниками переговоров.
Цель диссертационной работы заключается в построении стохастических теоретико-игровых моделей проведения переговоров о распределении ресурса для двух и более лиц, исследовании свойств решений и оптимальных выигрышей, а также в нахождении оптимального поведения всех участников переговоров.
В работе рассматриваются следующие задачи:
1. Задача переговоров п лиц со случайными предложениями и голосованием;
2. Задача переговоров п лиц, связанная с проведением конкурса;
3. Задача переговоров о распределении ресурсов с возможностью установления приоритета.
Методы исследования основываются на теоретико-игровом анализе бескоалиционных игр. Предложенные рекуррентные схемы, с помощью которых осуществляется поиск равновесий по Нэшу в представленных задачах, опираются на методы динамического программирования.
Научная новизна работы заключается в применении теоретико-игровых методов к различным стохастическим моделям проведения переговоров.
В задаче о распределении ресурса предложена многошаговая модель со случайными предложениями арбитра. Определён вид оптимальных стратегий и найдены выигрыши для случаев, когда решение о дележе принимается по правилу большинства и по правилу полного консенсуса. Используются как симметричные, так и несимметричные параметры распределения мнения арбитра. Рассмотрен случай добавления игрока с правом вето. Получено обобщение модели, где для принятия окончательного решения о дележе требуется согласие р игроков из п.
Рассмотрена задача, связанная с проведением конкурса, в которой мнение арбитра распределено по нормальному закону. Для игроков, каждый из
которых заинтересован максимизировать величину, зависящую от параметров проекта, найдены оптимальные значения этих параметров.
Предложена модель распределения ресурса между двумя игроками и исследована устойчивость предварительного договора о дележе. Доказано, что для игры между агрессорами и толерантными игроками существуют строго доминирующие стратегии. Рассмотрены случаи игры без приоритета и с приоритетом одного из игроков.
Теоретическую и практическую ценность настоящего исследования представляют стохастические теоретико-игровые модели проведения переговоров, как предполагающие участие арбитра, так и использующие соглашения между игроками. Предложенные схемы могут иметь приложения в различных сферах деятельности, где требуется распределение ограниченных ресурсов, выявление наиболее предпочтительного проекта или заключение соглашений.
На защиту выносятся следующие положения:.
1. Найдены равновесия в классе пороговых стратегий в теоретико-игровой задаче о разделе ресурса для п лиц с арбитром, представленным многомерным распределением.
2. Найдено равновесие в задаче о проведении конкурса для п > 3 лиц с использованием арбитражной процедуры, основанной на многомерном распределении, и для п > 2 лиц с линейными функциями полезности при участии арбитражного комитета.
3. Предложена и исследована теоретико-игровая модель распределения ресурса для двух лиц с приоритетом одного из игроков и с равноправными игроками.
Степень достоверности и апробация работы. Достоверность полученных в ходе диссертационного исследования результатов подтверждается строгим обоснованием теоретических выводов с использованием теоретико-игровых методов, применением современного программного обеспечения для моделирования предложенных переговорных схем, а также глубокой проработкой исследуемой проблемы с изучением работ ведущих российских и за-
5
рубежных учёных в данной области. Результаты диссертационного исследования докладывались, широко обсуждались и получили одобрение специалистов на следующих конференциях:
1. VIII Международная конференция «Вероятностные методы в дискретной математике» и летняя сессия XIII Всероссийского симпозиума по прикладной и промышленной математике, 2-9 июня 2012, Петрозаводск.
2. Шестая Международная конференция «Game Theory and Management», 27 - 29 июня 2012, Санкт-Петербург.
3. Международный семинар «Networking Games and Management», 30 июня - 2 июля 2012, Петрозаводск.
4. Восьмая Международная конференция «Game Theory and Management», 25 - 27 июня 2014, Санкт-Петербург,
а также на семинарах кафедры фундаментальной и прикладной математики, теории и методики обучения математике факультета естественных наук, математики и технологий Забайкальского государственного университета, г. Чита, и семинарах лаборатории математической кибернетики Института прикладных математических исследований Карельского Научного Центра РАН, г. Петрозаводск.
По материалам диссертации опубликовано 11 работ, из них 7 статей [1-7], среди которых две в изданиях, рекомендованных ВАК [1,2|, и одна в журнале, включённом в базу данных Scopus [3], а также тезисы 4 докладов [8-11]. Диссертация поддержана грантами РФФИ (проект 12-01-90702-моб_ст) и Минобрнауки РФ в рамках Государственного задания вузу № 8.3641.2011.
Структура и объем диссертации. Диссертационная работа состоит из введения, трёх глав, заключения, списка литературы и двух приложений. Общий объем диссертации составляет 119 страниц. В работе присутствует 5 рисунков, 3 листинга программ и 9 таблиц. Список литературы включает 50 наименований.
Содержание работы
Во введении отражена актуальность работы, приведен краткий обзор литературы по теме диссертации, поставлена цель исследования, обоснована новизна работы, сформулированы положения, выносимые на защиту, показана практическая ценность полученных результатов.
В первой главе предложена стохастическая процедура распределения ресурса, представленная как проблема справедливого раздела пирога для п лиц. Рассмотрена многошаговая модель дележа, характеризующаяся конечным числом этапов переговоров, бескоалиционным поведением игроков и арбитражной процедурой, использующей случайный механизм с многомерным распределением Дирихле. Исследовано оптиматьное поведение игроков, найдено равновесие по Нэшу в классе пороговых стратегий и получены соответствующие аналитические выражения для выигрышей.
Представлена модель распределения ресурса единичного размера между п игроками при помощи многошаговой процедуры с участием арбитра. Для проведения переговоров предоставляется временной интервал К. На каждом шаге арбитр генерирует случайные предложения. Если число участников, согласных с предложением арбитра, больше или равно чем некоторое заданное число р, то делёж принимается. В противном случае игра переходит на следующий шаг с дисконтированием ресурса на величину 6, где 6 < 1. Если решение не принято за отведённое время, то каждый игрок получает
долю размера Ь, где Ь « —.
тг
Предполагается, что мнение арбитра распределено с плотностью
1 "
Л1'.....1») = щП1('"1'
где Xi>Q,^2xi = l\lki>\. Константа В(к) в этом распределении ¿=1
В(к) = В(к\,..., кп) =
П Г(Ь)
Г(/с! + --- + кп)
зависит от набора параметров (к\,..., кп), которыми можно регулировать веса участников.
В разделе 1.1 рассматривается теоретике- игровая задача распределения ресурса для трёх лиц. Используется обратный отсчёт по времени. Значение данной игры в состоянии, когда до конца переговоров остается к шагов из К, обозначается Нк- Игроки I, II и III на этом этапе получают предложения, соответственно, (х^х^х^), причём Х\ + Х2 + хз = 1.
Вначале исследуется случай, когда решение о реализации дележа принимается при полном согласии игроков, то есть р = 3. Функция совместной плотности распределения Дирихле с параметрами к\ = к? = кз = 2 есть
Лх1,хг) = 120^1 х2(1 — XI — х2), хг+х2<1, х1,хг>0.
Вводятся стратегии ^(хг) (112(22), Рз(хз))~~ вероятность того, что игрок I (II, III) примет текущее предложение х\ (х2, хз). Справедлива теорема Теорема 1.1 Оптимальные стратегии игроков на к-м шаге имеют вид
щ(х{) = 1{х,>тк-1}, » = 1> 2,3,
где 1а ~ индикатор события А.
Значение игры удовлетворяет рекуррентным соотношениям
Нк = |(1 - + 65Нк-1 - 352Я|_! - 12<53Я2_!) + Я0 = Ь.
Для случая, когда решение о деяеже принимается по правилу большинства и р = 2, получен следующий результат
Теорема 1.2 Оптимальные стратегии игроков на к-м шаге имеют вид Ш(х{) = -^г, >№_,}, г = 1,2,3. Значение игры удовлетворяет рекуррентным соотношениям Нк = 1~ 1(М4Я*-1(1 - 35Я*-1)(3 - 4бНы), Но = ъ.
Далее исследована задача, в которой параметры распределения Дирихле несимметричны, а именно к\ = 1, Лг = ^з = 2. Оптимальное решение в условиях полного консенсуса сформулировано следующим образом: Теорема 1.3 Оптимальные стратегии игроков на к-м шаге имеют вид
т(х1) = = 1{Х>>6Н?\} » = 2,3.
8
Значение игры удовлетворяет рекуррентным соотношениям
(1 - бн^У + в (х - ш<!>) 5н<^ + 4б2 (н^У] + 5Н<£\
^ = ¡(1-^-2 бН^у.
2 (1 - 6Н^У + 7 (1 - 5Н™) - 2б2 (Н^У
+ 6Н
В условиях правила большинства для распределения Дирихле с несимметричными параметрами доказана теорема
Теорема 1.4 Оптимальные стратегии игроков на к-м шаге имеют вид
Мхг) = *{11>гя«}> = 7{г,>ая'2Л} { = 2-3' Значение игры удовлетворяет рекуррентным соотношениям
Н11) = ^
■ (шЯ^ - МЯ» - ШЯ<^Я<2Л + 1252 КЛ)2)] +
Я[2) = 1 [2 - 2<5з (Я^)3 (ю + - 19<52 (//&)') -
-¿Я<2_> (5 4- 40<52 (Я<2_\)2 - 7053 (я® )' + 23^ (я^) --5
(Н^У (4 - 6Н™ + 2(Я<2Л)2) -
-25
(Я^)2(8-7^2Л)]]
В разделе 1.2 рассмотрена задача о разделе пирога для четырёх лиц. Функция совместной плотности распределения с параметрами к\ = к2 = к$ = кц = 1 имеет вид
/(х\,Х2, Хз) = 6, 21 +Х2 + ХЗ < 1, Х1,Х2,Х3>0. 9
Если р = 3, а значит для одобрения пакета предложений требуется согласие не менее трёх игроков из четырёх, то справедливо следующее утверждение
Теорема 1.5 Оптимальные стратегии игроков на к-м шаге имеют вид Рг(х() = /{х,>гяк_,}, г = 1,4. Значение игры удовлетворяет рекуррентным соотношениям Нк = 6Нк^ + 1 (1 - 4¿Ян) (1 - 12<52#!_! (3 - 7ЛЯ*_,)), Я0 = 6.
Предложена вариация модели для четырёх лиц с участием игрока, обладающего правом вето. Сформулирована и доказана теорема Теорема 1.6 Оптимальные стратегии игроков на к-м шаге имеют вид
^(Хг) = г = М-
Значение игры удовлетворяет рекуррентным соотношениям Нк = 5Нк-(1 - 5Нк_Л (4 + 30<ОДь_, - 18852Я|_1 + 2695^/^,)), Я0 = Ъ.
Раздел 1.3 посвящен обобщению полученных результатов для п игроков. Принятие окончательного решения о дележе предполагает по меньшей мере р > 1 голосов. Пусть = 1, i = 1,... ,п. Тогда функция совместной плотности распределения Дирихле имеет вид
/(хъ...,хп) = (л - 1)!,
п
где X; > 0, г = 1,..., п и ж; = 1. Щ - значение игры на этапе к. 1=1
Основной результат для общего случая доказан в следующей форме Теорема 1.7 В игре п лиц де.аежа пирога оптимальные стратегии игроков на к-м шаге имеют вид
Мх) = 1{х>5Нк.,}, 1 = 1,...,п.
Значение игры удовлетворяет рекуррентным соотношениями
"к- - о?! I сг(х1)лс1+
"■«г*-, 10
dx i ^ J ... J F-2,kdx2. ■ ■ dxn-i >.
0 S„.,(a,.,) >
Здесь
Fi.k =
il, если — P i=2 n
5Щ-1, если J2ai <P-
G2(*1) = C£i (ZI•
1-х, n
- / ... / /j > a} Q {x^ < a} >dx2...dxn_b
о о l ¿=2 ¿=ÎH-I J
Si( 1) = {xj : Xi > a} П [0,1 - Xi-----Xj_i],
S,(0) = {xj : Xj < a} П [0,1 - xi-----Xj_i].
Доказана теорема для игры, в которой принятие пакета предложений арбитра предполагает согласие всех игроков, то есть р — п. Теорема 1.8 В игре п лиц дележа пирога, в которой для окончательного решения требуется согласие всех игроков, оптимальные стратегии игроков на k-м шаге илгеют вид
1ц[х) = /{^Ян},« = 1,..., п, где значение игры Н£ удовлетворяет рекуррентным соотношениям
Во второй главе рассмотрена теоретико-игровая задача, связанная с проведением конкурса. Исследована модель бескоалиционной игры с ненулевой суммой для п + 1 лиц. Арбитр представлен нормальным распределением в п + 1-мерном пространстве. Найден вид и оптимальные параметры конкурсных проектов игроков, определены равновесные выигрыши игроков и
вычислены вероятности нахождения мнения арбитра в соответствующих областях. Рассмотрен случай, когда отдельные параметры всех представленных конкурсных проектов оцениваются отдельными экспертами, составляющими арбитражный комитет. Найдено равновесие в такой игре в предположении, что полезности игроков представляют собой произвольные линейные функции.
В разделе 2.1 представлена модель стохастической игры четырёх лиц. Игроки представляют на конкурс проекты, характеризующиеся набором из трёх параметров (щ, 112,113). Игрок I заинтересован максимизировать сумму U1 + U2 + из, а игроки II, III и IV - минимизировать параметр щ, и2 или г/3, соответственно.
После этого арбитр или арбитражный комитет рассматривает поступившие конкурсные предложения и выбирает один проект при помощи стохастической процедуры с распределением вероятностей вида
1
f(ui,u2,u3) = д(щ) -g(u2) ■ g(u3), где д(щ) = -= -е г =1,2,3.
у ¿ж
Это распределение известно всем участникам. Победителем становится тот игрок, проект которого оказывается ближе к мнению арбитра в евклидовой метрике. Выигрыш победителя конкурса зависит от параметров его проекта.
Оптимальные стратегии игроков находятся в виде для игрока I: (с, с, с), для игрока II: (—а, 0,0), для игрока III: (0, — о,0), для игрока IV: (0,0,—а).
Методами численного моделирования приближённо находятся оптимальные значения параметров а и с
а ~ 1.583, с «1.321.
В равновесии игроки получают выигрыши
tfi « 0.995, Я2 = Я3 = Я4 ~ 0.395
с вероятностями, соответственно
MVJ) « 0.251 ß(V2) = fi(V3) = ß(V4) » 0.249.
12
Далее получено обобщение этой задачи для игры нескольких лиц. Теперь п+ 1 игрок представляет на конкурс проекты, которые характеризуются набором из п параметров (щ,и2, ...,и„). Игрок I заинтересован максимизировать сумму Ы1+«2+---+мп, а остальные игроки, начиная со второго, стремятся минимизировать параметр г1;_ь где г = 1,тг 4-1 - номер игрока.
Стохастическая процедура с распределением вероятностей для арбитра представлена следующим образом
п 1 _
/(щ,и2,...,ип) = Цд(иг), где д(щ) = • е"^", г = 1 ,п.
Оптимальные стратегии игроков находятся в виде п-мерного вектора (щ,и2, ■■■,ип). Для игрока I компоненты этого вектора одинаковы щ = и2 = ... = ип = с, а для всех остальных игроков вектор имеет только одну ненуле-
вую компоненту = -а, где г = 1, п + 1 - номер игрока.
Оптимальные значения параметров а и с можно приближённо оценить следующим образом
тг+1 _ п + 1
а «--Ь е, где е > 0, см-.
п п
В равновесии игроки получают выигрыши
Нг «1, Н2 = Я3 = Щ и где £ > О
п
с вероятностями, соответственно
//(V,) « ц(У2) = (1(У3) = д « КУг) >
Раздел 2.2 посвящён задаче, связанной с проведением конкурса, в которой арбитражный комитет осуществляет экспертную оценку отдельных параметров проектов. Игрок г предлагает конкурсный проект, представляющий собой вектор вида х' = (х\, который включает в себя тп различных
параметров. Победителя определяет арбитражный комитет, состоящий из тп членов. Арбитр j является экспертом в оценке только одного параметра х^ каждого из п проектов, то есть он рассматривает набор {х],...,х"}. Мнение арбитра представляет собой случайную величину с некоторым распределением вероятностей которое известно всем участникам конкурса.
13
Каждому j - му параметру проекта в ставится в соответствие величина <7?, которая интерпретируется как голос арбитра
¡1. если = тт 1а;*- — а,| О, иначе.
Проект я, набравший не менее р голосов
т 7=1
побеждает. Тогда представивший его игрок получает выигрыш ка(хв). В зависимости от порога р возможно различное количество победителей. Если ни один проект не набрал порогового количества голосов, игра переходит на следующий шаг либо заканчивается. Переход на следующий этап предполагает дисконтирование с множителем 0 < 5 < 1.
Ожидаемый выигрыш игрока в на шаге к есть (в = 1,2, ...,п; к = 1,2,...). Для в-го игрока с функцией выигрыша
Щ(х\ = Н,{х'). Р > р| + 5Уи -{|>| > р^
величина является значением игры.
Далее рассматривается одношаговая игра с линейными полезностями игроков вида
т 3=1
Исследуется случай с участием двух лиц. Проект каждого игрока есть вектор г = 1,2. Игрок I стремится максимизировать величину
(с\Х1 — С2У1), а игрок II - величину (-¿1X2 + й2уг)- Эти функции называются полезностями соответствующих игроков. Арбитражный комитет состоит из двух экспертов: первый рассматривает параметры Xi, а второй - параметры У и гДе г = 1,2. Арбитры представлены распределениями вероятностей и соответственно. Эксперт отдаёт свой голос тому проекту, соответствующий параметр которого оказывается ближе к его собственному мнению. Побеждает игрок, получивший два голоса, то есть имеет место полный консенсус
14
и р = 2. Если ни один проект не набрал двух голосов, игра заканчивается, и оба игрока не получают ничего. Предполагается, что
Х\ > х2, у\ < у2. Ожидаемые выигрыши описываются формулами Н^х^уг, 12,г/г) = {с\хх - с2у\) ■ -Я ^ 2 ' р2 1 2 У2) '
Я2(хь№,х2,у2) = (-¿!Х2 + Й2У2) • Рг • - ^ •
Имеют место следующие соотношения для оптимальных параметров проектов
ж + х2 = 2 Г"1 (_С1 (¿1Х2 - Л2уг)_\
+ = 2 {_¿2 {с\х\ ~ с2ух)_\
2/1 2 2 \С1(12Х1 - С2й\Х2 + С2Й2«/2 - С2<%1)/ '
Затем рассматривается игра с тремя участниками, полезности которых имеют вид (с1Хх — с2у\), (-<¿1X2 + ¿22/2) и (61X3 + 622/з) Для игроков I, II и III, соответственно. Каждый из них представляет на конкурс проект, характеризующийся двумя параметрами (х,-,у,), где г = 1,2,3. Приглашены два арбитра, каждый из которых оценивает один параметр проекта. Побеждает игрок, набравший оба голоса.
Предполагается, что имеют место следующие неравенства
хг < хз < хг, г/1 < г/з < г/2,
и ожидаемые выигрыши имеют вид Я1
Я2
- с«.-«)--(1-1 Н^ЬН®).
п, «,*, + (,»)■ (г, (а±а) _я
Ч^НВ®))-
15
Получены уравнения для оптимальных параметров проектов
x1+x3 = 2-F~1 (_cidiiaxi -С2У1)_\
1 \C2bl(CidiXi - C\d-[X2 - c2diyi + Cid2y2)) '
x2 + x3 = 2 • F"1 f_C1d1(-d1x2 + d2y2)_А
1 \d2bi(cidixi - c\d\x2 - c2diyi + с^ут)) '
У1 + Уз = 2 ■ F2-
! I C2d2(-ClX\ + С2У1)
^cib2(c2dix2 - c\d2x\ - C2d2y2 + с2<%1),
2/2 + 2/3 = 2- F-1 (_c2d2(dix2 ~ d2y2)_\
2 \dib2{-cid2xi + c2d\x2 + c2d2yi - c2d2y2)) '
Приведён пример численного нахождения решения, если полезности игроков имеют следующий вид: (2а;! — yi) для игрока I, (—х2 + 2у2) для игрока II и (хз + Уз) для игрока III. Предполагается выполнение неравенств
x2<x3<xi, у\<уз<у2-
В случае нормального распределения мнения арбитра, игроки I, II и III должны представить на конкурс проекты с параметрами (1.86,0.14), (0.14,1.86) и (1.00,1.00), соответственно. При этом они получают следующие выигрыши
Hi = Н2 « 0.39, Н3 « 0.22.
При экспоненциальном распределении мнения арбитра проекты игроков I, II и III будут иметь вид (1.45,0.06), (0.06,1.45) и (0.75,0.75), соответственно, а выигрыши будут следующими
#i = #2 « 0.31, Нз « 0.17.
Получено обобщение в этой задаче для п игроков и т параметров проектов. Игрок г максимизирует величину CjXj. При этом для каждого j
j=i
хотя бы один коэффициент cj отрицателен. В оценке параметров участвуют т арбитров, или экспертов, ровно по одному на каждый параметр проекта. Их распределения обозначим Fj, где j = 1 ,..,т. Победитель определяется при соблюдении полного консенсуса, а именно р — т. Ожидаемый выигрыш г-го игрока (г = 1, п) равен
где х\ = max х\ и = min x\.
3 Щ<хУ 3 3 1:з*>Х) 3
Соотношения для оптимальных параметров следующие х) + х? = 2-Ff1
В третьей главе предложена многошаговая модель распределения ресурса для двух лиц, в которой игроки заключают первоначальное соглашение о дележе, после чего имеют возможность попытки захвата ресурса противника. Рассмотрены случаи, когда один из игроков имеет приоритет и когда оба игрока равноправны. Исследована устойчивость первоначального соглашения, определены доминирующие стратегии игроков и получены соотношения для оптимальных выигрышей.
Два игрока заключают первоначальное соглашение о распределении единичного ресурса: игрок I получает долю а, игрок II - долю (1 — а), где О < а < 1. После этого каждый из них имеет возможность попытаться захватить ресурс противника. Игрок I осуществляет захват ресурса игрока II с вероятностью р, где 0 < р < 1, а игрок II осуществляет захват ресурса игрока I с вероятностью д, где 0 < <7 < 1. На каждом этапе игры участники должны решить, предпринимать ли попытку захватить ресурс противника (С) или нет (ТУ), то есть в дискретные периоды времени - I, 2, 3,... - каждый игрок делает ход: либо предпринимает попытку захвата, либо решает следовать договору. При переходе на следующий шаг игры ресурс дисконтируется в <5 раз, где 0 < 5 < 1.
В разделе 3.1 рассмотрена многошаговая игра с приоритетом. Игрок I делает ход первым, а игрок II — вторым. При этом, если осуществлена успешная попытка игрока I захватить ресурс соперника, то игрок II теряет возможность сделать ход. Используются следующие стратегии:
17
i=i
■I -п
77!—1
■ ( П <*+ [х)+ - *}-) + £ (-1)' П с?^
1 ;=1 1=1
771-1
П <Г-£срс{-
i=i i=i __
771 — 1
/=i
г=1
Стратегия «толерантность» N —> N, С —>• N. Стратегия «агрессия» N —» С, С —> С.
Неустойчивость первоначального соглашения показана в следующей теореме: Теорема 3.1 Стратегия «агрессия» строго доминирует стратегию «толерантность» в игре с приоритетом игрока I. Оптимальный выигрыш игрока Iравен
р + (1-р)(1-д)(1-5)-а
Также отражён результат для случая, когда игроки могут воспользоваться одной из следующих стратегий: N N, С С либо N С,С —ь N.
В разделе 3.2 рассмотрена задача с равноправными игроками. На каждом шаге игры участники делают ход одновременно, используя стратегию «толерантность» либо «агрессия». Игрок I на первом шаге игры делает попытку захвата ресурса соперника с вероятностью а, 0 < а < 1, а игрок II -с вероятностью /3, 0 < /3 < 1. Справедлива теорема
Теорема 3.2 Стратегия «агрессия» строго доминирует стратегию «толерантность» в игре без приоритета. Оптимальный выигрыш игрока I равен
„ (1-9)(р+(1-р)(1-Д)-а)
В разделе 3.3 исследуется модель с приоритетом игрока I. Оба участника используют стратегию вида NN —> N, N0 -> N, CN СС —> С. Если выполняется неравенство
ад
Р> 1-(1-9)-а'
то игрок I предпринимает попытки захвата и на первом, и на втором шагах игры, получая выигрыш
„ р+(1-р)(1-д>)(1-Л)-а (1 _ 5)(1 _ (1 -р)(1 -д) - 5)' иначе игрок I делает попытку захвата на первом шаге игры и следует договору на втором шаге игры, получая выигрыш
р+(1-р)(1-9)-а
Я =-—5-•
18
Заключение
В настоящем диссертационном исследовании представлены стохастические теоретико-игровые модели переговоров о распределении» ограниченных ресурсов.
Рассмотрена стохастическая процедура распределения ресурса со случайными предложениями арбитра и голосованием. Найдено равновесие при различных параметрах распределения арбитра, квотах для принятия решения о дележе и правах участников переговоров. Эта модель может быть адаптирована к различным реальным ситуациям. Если участники переговоров имеют равные веса, то параметры распределения Дирихле следует выбрать равными. Тогда процедура дележа гарантирует равные возможности для всех участников. Если какой-либо из участников имеет больший вес, нужно увеличить его параметр в распределении Дирихле. Также решение будет зависеть от интервала времени, отведенного для переговоров.
Представлена модель в рамках задачи о проведении конкурса с участием арбитра либо арбитражного комитета. Исследованы две схемы, в зависимости от того, оценивает арбитр представленный проект каждого участника целиком или только один отдельный параметр проекта. В последнем случае приглашается арбитражный комитет в количестве, соответствующем количеству оцениваемых параметров конкурсных проектов. Найдены равновесия и оптимальные стратегии игроков. Предложенная процедура может быть использована при проведении разного рода тендеров, конкурсов, олимпиад.
Предложена многошаговая процедура распределения ресурса для двух лиц, предполагающая заключение первоначального соглашения о распределении и возможность несоблюдения договорных обязательств впоследствии. Исследовано влияние приоритета на поведение и выигрыши игроков. Показано, что соглашение о дележе в условиях рассмотренной модели не является устойчивым вследствие существования строго доминирующих стратегий. Возможна адаптация полученной схемы к реальным экономическим ситуациям для оценки рисков укрупнения бизнеса в условиях конкуренции.
Список публикаций по теме диссертации
1. Носальская Т. Э. Правило большинства в задаче наилучшего выбора для трёх лиц // Учёные записки Забайкальского государственного гуманитарно-педагогического университета им. Н.Г. Чернышевского. Чита: ЗабГГПУ, 2012. Т 3. N 44. С. 93-97.
2. Мазалов В. В. , Носальская Т. Э. Стохастический дизайн в задаче о дележе пирога // Математическая теория игр и её приложения. Петрозаводск, 2012. Т 4. Вып. 3. — С. 33-50.
3. Mazalov V. V. , Nosalskaya T. Е. , Tokareva J. S. Stochastic Cake Division Protocol // International Game Theory Review, 2014. Vol. 16, N 2. - P. 1440009.
4. Менчер A. Э. , Носальская T. Э. Об одной задаче распределения активов /,/ Учёные записки Забайкальского государственного гуманитарно-педагогического университета им. Н.Г. Чернышевского. Чита: ЗабГГПУ, 2009. Т2, вып.25. — С. 84-91.
5. Носальская Т. Э. Последовательная модель без приоритета в задаче распределения ресурсов // Математический анализ и его приложения. Чита: ЗабГГПУ, 2010. Вып. 9. - С. 36-42.
6. Носальская Т. Э. Марковские стратегии с памятью 1 в игре с приоритетом // Промышленная и экологическая безопасность на транспорте: Межвузовский сборник научных трудов. Чита: ЗабИЖТ, 2010. Т2. N 25. - С. 160-166.
7. Nosalskaya T. Е. Compétition Form of Bargaining // Contributions to Game Theory and Management, 2014. V. VII. — Pp. 254-261.
8. Носальская T. Э. Модель последовательных переговоров с голосованием в задаче о разделе единичного ресурса // VIII Международная конференция «Вероятностные методы в дискретной математике» и летняя сессия XIII Всероссийского симпозиума по прикладной и промышленной
математике, 2-9 нюня 2012, Петрозаводск. — с. 731.
20
9. Nosalskaya T. E. Sequential Bargaining Scheme in the Assets Sharing Problem H Game Theory and Management VI. June 27 - 29, 2012. St. Petersburg — Pp. 203-204.
10. Nosalskaya T. E. On a Discrete Model of the Cake Division Problem // International Workshop: Networking Games and Management. June 30 -July 2, 2012. Petrozavodsk — Pp. 45-46.
11. Nosalskaya T. E. Game-Theoretic Model of Negotiations with Incomplete Information // Game Theory and Management VIII. June 25 - 27, 2014. St. Petersburg — P. 41.
Научное издание
Носальская Татьяна Эдуардовна
АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук
Стохастические модели проведения переговоров с несколькими участниками
Подписано в печать 21.10.2014. Печать офсетная. Бумага тип. № 2. Формат 60x84/16. Печ. л. 1,0. Тираж 110 экз.
Забайкальский институт железнодорожного транспорта 672040, г. Чита, ул. Магистральная, 11 Редакционно-издательский отдел
-
Похожие работы
- Математическое моделирование процессов, характеризующихся диффузионными связями и случайными воздействиями в виде белого и цветного шумов
- Оценивание длительности мертвого времени и параметров асинхронного дважды стохастического потока событий методом моментов
- Математическое моделирование колебательных процессов под воздействием пространственно-временного шума
- Математическое моделирование и анализ аттракторов и бифуркаций нелинейных стохастических систем
- Устройство защиты радиотелефонных переговоров
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность