автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Разработка математических моделей поддержки принятия решений при информационных ограничениях
Автореферат диссертации по теме "Разработка математических моделей поддержки принятия решений при информационных ограничениях"
На правах рукописи
'' -.......■
ООЬиио»'«-
Жариков Александр Владимирович
РАЗРАБОТКА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ИНФОРМАЦИОННЫХ ОГРАНИЧЕНИЯХ
05.13.18 - Математическое моделирование, численные методы и комплексы программ
Автореферат диссертации на соискание ученой степени кандидата физико-математических наук
-.8 ДЕК 2011
Барнаул - 2011
005005387
Работа выполнена на кафедре теоретической кибернетики и прикладной математики ФГБОУ ВПО «Алтайский государственный университет»
Научный руководитель: кандидат физико-математических наук,
доцент
Максимов Александр Васильевич
Официальные оппоненты: доктор физико-математических наук,
профессор
Поляков Виктор Владимирович
кандидат физико-математических наук, доцент
Семенов Сергей Петрович
Ведущая организация: ФГБОУ ВПО «Новосибирский национальный
, - исследовательский государственный университет»
Защита диссертации состоится «23» декабря 2011 г. в 16-00 часов на заседании диссертационного совета Д 212.005.04 в ФГБОУ ВПО «Алтайский государственный университет» по адресу: 656049, г. Барнаул, пр. Ленина, 61.
С диссертационной работой можно ознакомиться в библиотеке Алтайского государственного университета по адресу: 656049, г. Барнаул, пр. Ленина, 61.
Автореферат разослан 22 ноября 2011 г.
Ученый секретарь диссертационного совета
д. ф.-м. н., профессор
С.А. Безносюк
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. В последние годы усиливается интерес к математическому моделированию процессов принятия решений в сложных социальных и экономических системах, в том числе в системах со многими центрами принятия решений (системы с п ЛПР).
Одним из значимых аспектов сложных систем при обосновании оптимальных решений выступают информационные ограничения, т.е. уровень информированности ЛПР о целях, условиях, предпочтениях, множествах допустимых решений всех действующих участников рассматриваемой системы, включая случай несовпадения (асимметрии) указанной информированности.
Исторически задачи обоснования решений с учетом различных информационных гипотез рассматривались в рамках теории игр (В.Н. Бурков, Ю.Б. Гермейер, В.А. Горелик, М.А. Горелов, А.Ф. Кононенко, H.H. Моисеев и др.), двухэтапного и многоэтапного стохастического программирования (IO.H. Ермольев, В.В. Колбин, Д.Б. Юдин и др.), декомпозиционных методов оптимизации сложных систем управления (Ю.Г Евтушенко, Н.М. Оскорбин, B.C. Танаев, В.И. Цурков и др.), методов системной оптимизации (B.JI. Волкович, В.М. Глушков, B.C. Михалевич и др.), системного компромисса (Г.И. Алгазин), теории принятия решений при нечеткой информации (JI. А. Заде, С. А. Орловский).
При анализе информационных ограничений в задачах поддержки принятия решений (ЗПР) часто используются две из известных в литературе базовые модели значений неконтролируемых параметров. В первой модели неконтролируемые параметры ЗПР можно рассматривать как случайные, т.е. значения всех параметров реально являются случайными и ЛПР известны их распределения вероятностей. Во второй модели для значений неконтролируемых параметров в рамках заданных множеств неизвестны их вероятностные характеристики и/или они не могут изучаться вероятностно-статистическими методами. Случай асимметрии информированности ЛПР и соответствующие математические модели обоснования оптимальных решений рассматривались только в простых частных случаях в общем же случае, недостаточно полно исследованы в литературе.
Перспективным для исследования является общий подход к проблеме поддержки принятия решений в условиях информационных ограничений, суть которого состоит в том, что все ЛПР выбирают оптимальные решающие функции, определенные на множествах известных параметров в соответствии с заданной структурой их информированности, включая и асимметрию информированности. При этом ЗПР записываются как задачи вариационного исчисления. Практическая применимость такого подхода состоит в том, что при некоторых простых информационных структурах, поиск оптимальных решений сводится к конечномерным задачам оптимизации, которые решаются известными методами математического программирования. В общем случае для задач поддержки принятия решений с информационными ограничениями необходимо применять методы вариационного исчисления. Учитывая вышесказанное, можно заключить, что тема диссертации является актуальной.
Цель диссертационной работы состоит в разработке математических моделей поддержки принятия решений при информационных ограничениях:
теоретическое исследование; разработка и обоснование численных методов; программная реализация.
Для достижения цели в диссертации были поставлены и решены следующие задачи:
1) анализ существующих подходов к формализации задач принятия решений с учетом информационных ограничений;
2) вариационное расширение задач принятия решений с учетом информационных ограничений и исследование частных случаев, в том числе игры двух лиц с квадратичными функционалами выигрышей;
3) формулировка и доказательство существования равновесия по Нэшу в игре п лиц при разной информированности игроков;
4) обоснование необходимых условий существования решения в задаче стимулирования второго рода при разной информированности активных элементов;
5) разработка алгоритма для модельного примера задачи стимулирования второго рода при общей и несовпадающей информированности игроков;
6) исследование информационных процессов в системах поддержки принятия корпоративных решений и качественный анализ схем информационного межуровневого взаимодействия на примере численных методов блочного программирования.
Объект исследования - процедуры принятия решений в условиях неопределенности и при асимметрии информированности ЛПР.
Предмет диссертационного исследования - математические модели процессов принятия решений в условиях информационных ограничений.
Методы исследования. При выполнении диссертационной работы использовались математические методы теории принятия решений (теория игр, теория активных систем), методы блочного программирования, вариационного исчисления, теории вероятностей и математической статистики, теории интегральных уравнений.
Научная новизна. Предложены модели, методы и алгоритмы для задач принятия решений при информационных ограничениях путем их сведения к задачам вариационного исчисления. Сформулированы необходимые и достаточные условия существования равновесия по Нэшу в условиях несовпадающей информированности игроков. Разработан алгоритм численного решения класса игр двух лиц с квадратичными интегральными функционалами выигрышей в концепции ситуации равновесия по Нэшу. Исследованы теоретические и прикладные модели поддержки принятия корпоративных решений и вычислительные алгоритмы ЗПР с учетом ограничений обмена информации.
Теоретическая и практическая ценность. Теоретическая ценность работы заключается в том, что предложен способ формализации проблемы принятия решений в условиях информационных ограничений и общий метод их исследования путем сведения к задачам вариационного исчисления, который позволяет обосновать оптимальность искомых решающих функций.
Практическая значимость результатов диссертационной работы состоит в расширении возможности применения математических методов для задач поддержки принятия решений в условиях неопределенности и при асимметрии ин-
формированное™ ЛПР. Исследование информационных ограничений в корпоративных системах управления может способствовать разработке эффективных численных методов и алгоритмов межуровневого взаимодействия при проектировании внутрифирменных информационных систем.
Разработанный в среде Matlab программный инструментарий поиска ситуации равновесия по Нэшу в квадратичном случае с асимметрией информированности может быть применен при решении задач вариационного исчисления, модификации алгоритмов блочного программирования и решения систем интегральных уравнений.
Основные положения, выносимые на защит}':
1. Результаты системного анализа проблем принятия решений в условиях информационных ограничений, классификации ЗПР и общий метод их исследования путем сведения к задачам вариационного исчисления.
2. Формализация игры п лиц с асимметрией информированности и математические результаты ее исследования, включая существование ситуации равновесия по Нэшу, необходимые условия существования ситуации равновесия по Нэшу для игры двух лиц с квадратичными функционалами выигрышей.
3. Результаты исследования математических моделей обоснования решений при информационных ограничениях, путем имитационного и компьютерного моделирования.
Апробация результатов исследования. Основные теоретические и практические результаты работы представлены автором на следующих научных конференциях, семинарах и научных школах:
Международные: VII международная научно-практическая конференция «Динамика современной науки» (Республика Болгария, г. София, 2011г.).
Всероссийские: IV Всероссийская научно-практическая конференция-выставка «Единая образовательная информационная среда: проблемы и пути развития» (Томск, 2005), IX Всероссийский симпозиум по прикладной и промышленной математике (весенняя сессия, Кисловодск, 2008).
Межрегиональные и региональные: ежегодная студенческая конференция, проводимая в рамках дней молодежной науки в Алтайском государственном университете (Барнаул, 2005, 2006); региональная конференция по математике МАК (Барнаул, 2006-2011); Сибирский научно-практический семинар «Информационные технологии регионального и муниципального управления» (Барнаул, 2009).
Публикации. По теме диссертационной работы автором опубликовано 14 работ, в том числе 3 статьи в ведущих реферируемых научных журналах, рекомендованных ВАК для публикации результатов диссертационных работ.
Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, 2 приложений и списка используемых источников и литературы (95 наименований). Основной материал изложен на 110 страницах, включая 2 таблицы, 20 рисунков. /
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность работы, сформулированы цели и задачи, объект и предмет исследования; научная новизна, теоретическая и
практическая значимость, положения, выносимые на защиту, апробация результатов исследования, отражен личный вклад автора.
В первой главе приведен обзор, анализ и классификация задач принятия решений с учетом информационных ограничений. Результаты классификации представлены таблицей, в которой отражена степень изученности в современной литературе.
Схема обоснования математических моделей с подобными ограничениями состоит в последовательном усложнении информационной структуры системы принятия решений. Для и ЛПР рассматриваются детерминированные системы принятия решений и системы принятия решений в условиях неполной информированности с рассмотрением асимметрии информированности. При анализе информационных ограничений в задачах принятия решений (ЗПР) используются две наиболее известные в литературе базовые модели значений неконтролируемых параметров. В первой модели неконтролируемые параметры ЗПР можно рассматривать как случайные, т.е. значения всех параметров реально являются случайными, и ЛПР известны их распределения вероятностей. Во второй модели для значений неконтролируемых параметров в рамках заданных множеств неизвестны их вероятностные характеристики и/или они не могут изучаться вероятностно-статистическими методами.
Как показывает анализ современной литературы, классы ЗПР при асимметрии информированности в литературе изучены не достаточно полно, а для некоторых типов задач с несовпадающей информированностью ЛПР не получены строгие математические постановки задач поиска оптимальных решений.
Предполагается, что объективное описание игровой обстановки задается в следующем виде:
/„={1,...,«}, (1)
^ед,
где ^(^„х,,...,*„) - стратегии игроков (.х е Л' = X, хХ2х...хХ„у,ме IV - вектор параметров целевых функций игроков (\уя), 1Уа,1Г).
Оптимальные стратегии игроков следует находить с учетом информационных ограничений, которые записываются путем задания вектора параметров с/,, известных игроку г е 1п. Пусть, например, - случайный век-
тор с функцией распределения Ф = Ф(м'), с /„ - совокупность индексов, определяющих информационную структуру для /'-го игрока (/„, ={1,...,«}). Тогда стратегией игрока является решающая функция х1 =х1(с!1), С11 е5",) со значениями на множестве Х,,/е/„. Пусть X, - множество таких функций. Обозначим как А/Д-] - знак операции математического ожидания выражения в квадратных скобках по вектору и>еИ/. Вариационным расширением (ВР) игры (1) назовем следующую игру:
= ;е/„. (2)
Таким образом, в диссертации предлагается общий подход к исследованию ЗПР с информационными ограничениями, суть которого состоит в том, что ЛПР выбирают оптимальные решающие функции, определенные на множествах известных параметров в соответствии с заданной структурой их информи-
рованности. Практическая применимость такого подхода состоит в том, что при некоторых простых информационных структурах, поиск оптимальных решений сводится к задачам математического программирования. В общем случае, игра (2) решается с использованием методов вариационного исчисления.
В качестве примеров ЗПР при асимметрии информированности ЛПР приводится игра двух лиц с непротивоположными интересами, которая в литературе известна как игра «Государство-Предприниматели» и задача поэтапной оптимизации управления методом динамического программирования.
Объективное описание игровой обстановки в игре «Государство-Предприниматели» представлено на рисунке 1. Здесь совокупные предприниматели (ЛПР 2) модельной страны выбирают уровень активности х - предпринимательская прибыль (0<д:<д:тах), где хтх соответствует предпринимательскому потенциалу страны. Государство (центр, ЛПР 1) выбирает к (0<к< 1) -долю прибыли, отчисляемой в качестве налогов. Задача центра заключается в выборе решения к*, при котором налоговые отчисления являются максимальными. Интересы предпринимателей состоят в максимизации разности чистой прибыли и предпринимательских рисков, описываемых функцией <р(х,5).
Центр Предприниматели
Целевые функции игроков
х-к
Цели отроков
Максимизировать целевую функцию пу- Максимизировать целевую функцию пу-
тем изменения ставки налога тем изменения совокупной активности
Информационные гипотезы
1. Центр знает вероятностное распределение параметра <5, а предприниматели его
точное значение.
2. Компромисс центра и предпринимателей достигается в ситуациях равновесия
по Штакельбергу.
Решение при 6В < х^
к' = X
Рис. 1. Схема принятия решения в игре «Государство - Предприниматели»
Асимметрия информированности центра и предпринимателей касается знания значений параметра 8, согласно информационной гипотезе, приведенной на рисунке 1. Решение рассмотренной игры получено в предположении, что асимметрично контролируемый параметр <5 имеет равномерное распределение с известными границами [8Н, Зя], а функция предпринимательских рисков и барьеров является логарифмической. В данном случае вариационные задачи поиска решений сведены к двум простым взаимосвязанным задачам оптимизации.
В диссертации рассмотрена задача динамического программирования, которая при асимметрии информированности ЛПР записывается так:
шах
Х,ЬГ„/Е/,
где ЛПР / знает д:(.1 и часть параметров вектора и'', индексы которых заданы множеством ^ с{/,...,л},\//е/„.
При решении задачи (3) в условиях полной информированности ЛПР рекуррентное соотношение динамического программирования записывается в следующем виде:
Чн (*,-. >'"')={*,. ) + / (Х,-1'х,' Ч)] >'6 К.
где и/Ци^и^,,...,^) - совокупный вектор параметров, существенных для вычисления функции Беллмана Ч',., на /-ом подпроцессе, причем и>' = IV,
При информационных ограничениях решающая функция ЛПР / записывается так:
(4)
В диссертации впервые была доказана оптимальность решения задачи (3), если на прямом ходе решающую функцию (4) находить из условия
Л е ^ ) = [Ч'< (*<'п'')+ А (5>
где Ji = {/',/ +1 ,...,и} \JÍ - индексы параметров, по которым проводится осреднение целевой функции в задаче (5).
Доказательство получено исследованием вариационного расширения задачи (3) с учетом заданной информационной структуры решающих функций в предположении, что параметры разных подпроцессов - независимые случайные величины.
Для информационных ограничений на тип обменной информации между ЛПР (центр и агенты), рассмотрено моделирование информационных процессов поиска оптимального плана корпорации на примере решения задач блочного линейного программирования методами Данцига - Вульфа, Корнай - Липтака и методом отсечений. Поставлена задача исследования вычислительных алгоритмов этих методов с учетом ограничений межуровневого обмена информации.
Во второй главе рассматриваются методы решения игры (2) с использованием вариационного исчисления. Исследование проводится для чартных случаев этой задачи.
Отсутствие в выражении *,(</,) переменной \ур } <£ означает равенство
нулю первой частной производной по данной переменной. Тогда условие разной информированности игроков можно учесть введением дополнительного ограничения для каждого игрока в следующем виде:
(6)
Множество допустимых стратегий обозначим так:Х = ]~|^, х, еХг
¡е!„
Предполагается, что ХсС^ПД"'], »ейсЯ". Соответственно, функция полезности ;-го игрока запишется в виде усредненного значения
уД*(0)=[/•(*,ад)],/е/„.
Следовательно, игровая постановка задачи управления при несовпадающей информированности в рассматриваемом случае примет вид:
■А (*(')) = р^ад)Ф(иОс/^тм,/е/„, (7)
а игра в нормальной форме запишется так: Г = ^ ,[•/,(.*(•))} /
Тогда Лагранжианы задач (7):
Ы М
сЬ\>;
уравнения Эйлера для функционалов (7):
дР.(ху,х(иО) . . х~,дЛ,, 'V ' V »ф(и,)=2-л.,1е/я, (8)
ОХ, ^ онг
а условия трансверсальности для свободных границ имеют вид:
АН|й=0, (9)
где дО - граница области £2, А - матрица множителей Лагранжа такая, что
л~(К)„„> К = I з'^'■ а ПРИ подстановке (9) в (8) получаем
[Л * о, у г ,
необходимые условия экстремума (в играх с совпадающими интересами):
0Ф(,)ф,=О, р, -(н^еЯ,), /б/„. (Ю)
П
Одна из распространённых концепций решения некооперативных игр, является поиск ситуаций равновесия по Нэшу. Рассмотрим задачу (7) при п = т = 2.
¿/[^(и^ДОу),*,^))] шах
, (И)
Л/1^0с1,>с2,51(|»'),^2(м'))]->тах при условиях асимметрии информированности Э^/сНу, = 0, дх2/дм2 =0. Исследуется случай квадратичных функционалов ^ =
={в{х1,хг^^1),(х],х2,^2)), где ^ = Лг = (а^)4х4, Я = = т.е.
- квадратичные формы с переменными х{,х2, и'ь Информационный вектор ш распределён на квадрате П = [а,6]х[а,£>] с плотностью Ф(н>).
Задача (11) при условиях асимметрии информированности имеет вид: J^ = |(апх,2 + 2апх]х2 + 2апх^ +...+ )ф(«0<Л? -> шах,
П (12) 32- К^,,*,2 + 2й12х]х2 + 2Ьпххм\ + ...+^4»'2)ф(1к')с/№->тах. а
Задача (12) является игрой двух лиц, где ^(х1,х2)^2(х1,х2) - функции выигрыша, а хх,х2 - стратегии игроков. Предположим, что множество допустимых стратегий Х1г Х2 - пространство С'(О). Для случая, когда IV] и н'2 явля-
ются независимыми случайными величинами, оптимальные решающие функции игроков х* (и'2), £(>с,) находятся аналитически.
Утверждение 1. Пусть компоненты вектора м> есть независимые случайные величины, тогда равновесие по Нэшу задачи (12) при условиях йс,/¿ле, = О, дх2/¿7№, = 0, и ап,Ь22 <0 достигается на линейных по своим переменным функциях и .¿'(ч»,), где яц и Ь2г элементы матриц А и В соответственно.
В диссертации рассмотрен общий случай вероятностного распределения и и>2- Необходимые условия существования решений при этом не изменятся. Тогда нахождение х'Д-* будет зависеть от разрешимости системы интегральных уравнений
»6 4 ь
¿¡¡,;с;(и;)|ф(м')£Лц +о;2|'х,(и>)Ф(н')й'ц; +Д[4и>2|ф(м')йЦ =0,
; ; \ / оз)
а а ал
Определяется тип данной системы. Путем несложных преобразований и изменения обозначений (13) сводится к виду
ь
х(5)-А[Г(М)5( 0Ж=/(*) (14)
К.П.х\ О
где А'(м)=
О K2(s,t))
¿,,|ф(Г,5)Л an¡ <t>(t,s)ds
D D
ffrW + <v) Ф(/, j)df -\{b¿ + ¿>„s)Q>(/, s)ds
г —i-> .
WV auj<t>(t,s)clt b22¡$>(t,s)c¡s
x(s) =
x. (s) ) a b
, Д = — • —. Уравнение (14) является уравнением Фредгольма вто-
<\i bv.
poro рода, записанное в векторной форме. Вопрос разрешимости исследовался с использованием метода сжатых отображений. Показано, что (14) однозначно разрешимо для всех А, достаточно малых по абсолютной величине. Вводится оператор )\х, определённый в С ([ a, ¿>], R2)
Jbc~l\K(t,s)x{t)dt + f(s). (15)
а
Доказывается следующая теорема.
Теорема 1. Пусть в пространстве Е = C([a,6],R:) определен оператор (15), такой что C([a,6],R2)—<¿-»C(M],R2). Пусть, кроме того, для всех q\,<p2eE
РСЩ, Я<Р2) £ Щм (b - a)P(<Pt, ,М = ||А'|| и |л|Л/ф -а) < 1. Тогда существует единственная неподвижная точка <р0.
|А|М (6 - а) < 1 О (Ь - а) шах
\
а) шах ' (<•') \ Ьп Ф(/,,)
ъ а ь Я /
<1. (16)
Последовательные приближения х0 (з),^ (з),...,ху (5),- к этому решению определяются из соотношений хЛ!(.?) = А|&'(г,.9)хЛ,(/)<Л + /(-у), Л'= 0,1,..., где в
а
качестве х0 [.$) можно взять любую непрерывную вектор-функцию на [а,Ь]. Данный итерационный процесс является сходящимся к некоторой функции в силу приведенного неравенства. Также можно найти решение, используя резольвенту ядра. Если Я||/?|| < 1, то уравнение (14) имеет единственное решение, которое определяется равенством
х~(1 -Л Я)'1 / = / + ЛЯ/ + Л2Я2/ + ... + Л "Я"/ + - (ряд Неймана). Степени оператора Я имеют вид
/Ш
т.
= = ]K(s,t)f(r)clr^ ds = J|jA'MA'(.S,r>&
b
Обозначим jK(t,s)K(s,z)hds = K1(t,T)h, где вектор h является пробной
а
вектор-функцией из Тогда, для произвольной степени оператора
ь Ь
имеем я"/ = )f(t)dt, где KXt,s)h = ¡K(t,T)K^(T,s)hdT.
с <х
Таким образом, решение уравнения (14) запишется в виде: x(r) = f{t) + x\R(t,sJ.)f(s)ds,
а *
В диссертации показано, что данный ряд сходится равномерно при выполнении условия (16) и доказано утверждение 2.
Утверждение 2. Решение задачи (11) в ситуациях равновесия Нэша при ограничениях axja\v\ = 0, dx2/ow2 = 0 существует и единственно, если выполняются условия:
ап.Ьц^О, (Ь-а)тах
ап Ф(м)
вц/ФМЛ
bnO(t,s)
¿>и]ф(м)<й
<1-
Рассмотрим задачу (6), (7) для случая квадратичной структуры функционалов Г,(х, 1е), г€/„. Пусть уу)}, /е/„, где
^ =(°ь)(„+ )(+„>• Приведенная задача может быть сведена к системе уравнений Фредгольма 2-го рода, когда п =2 и структура информационного вектора задается множествами ^и^,,...,!^,...,^}, ¿2 = {\\,\,...,м>к,™гм,...,ыт}, к е {1,2,...,от / 2}. Соответствующие уравнения Эйлера запишутся в виде
/ 2 2+» ^
1 Е^д^н2X^.3* ФИФ.=°./б/2. (17)
где р, = , = • Решение (17) можно разбить на два подслучая.
1. Пусть функция распределения входного вектора и1 имеет вид
.....
тогда, аналогично утверждению 1, оптимальные решающие функции отыскиваются
а1 а2
в классе линейных функций х'(с!1)= + г =1,2, при условии
М ЯЦ а22
=(^')Г = (°*Д2+} (2 (,' = 1»2|. Коэффициенты ^ находятся из (17).
2. Компоненты случайного вектора м имеют функцию распределения Ф(я'„...,и'и). Уравнения Эйлера (17) примут вид
» ь 2+»
№*»('»>» » (} «ь—'-чч-,
а а а а
Систему (18) можно свести к системе, аналогичной системе (14)
ь
5(5,/)- X \к{г,$,1)х{г,()<Ь- = /(«,/),
а
A-fk.fi гЛ-.Л-Г ° гЛ..Л-
' Ьл
а:2(г,5,г)=-
¿> 4 '
а а
Ь Ь1+т
-¡■■•¡Т^л^М^1)^
лМ= ° "П ^-•
а222 |...|ф(г,
а а
Аналогично случаю для двух переменных, решение системы (19) пред-ставимо в виде
при условии (А - а)к шах
Д,'2ф(г,5,<)
а,1, |.../ф(г, *,/)<£•
4 [:{ф(г,*,/)Ж
<1,
где = К, + ЛК2 (г, 5,*) + ...+ Я" X +...- резольвента.
Система (17) может быть сведена к системе интегральных уравнений Фред-гольма 2-го рода при информационной структуре игроков следующего вида:
¿г к е{1,2,...,т/2}.
Для общего вида подынтегрального функционала в диссертации сформулирована и доказана теорема существования ситуации равновесия по Нэшу.
Теорема 2. Пусть игра (7) задается совокупностью
Г = ^/„, {х,} < , | ./,(.*(■))} 1 Пусть для любого ; е /„ множество стратегий X,
есть выпуклый компакт топологического векторного пространства. Положим, что для всех ; е 1Я У, - непрерывный функционал на X=Y\^l и ^(■*(')) вогнут по
х1 (•) е X,. Тогда множество ситуаций равновесия по Нэшу ифы (7) не пусто и компактно.
Доказательство проводится на основе леммы Кнастера-Куратовского-Мазуркевича.
Данный результат можно усилить для игры (7), используя результаты теории нелинейных интегральных уравнений и классический результат Тихонова - Шаудера о неподвижной точке.
Теорема 3. Пусть игра задается совокупностью выражений Г = |/„, ^ . {./,(*(■))} : где функционалы выигрышей игроков имеют вид
(.*(■)) = |/г(1»')х(м'))ф(и')</»>,/£/„. Пусть для любого /е /„ множество стра-
О
тегий Х1 есть шар радиуса а, в С'[п], т.е. X, = {*,(/): 5, (<) е С^П],!*^«,}. Положим, что для всех /е/„ функции ^(гр, у)^еО,< а,) и Ф(те) непрерывны по всем переменным в совокупности, а /г (>е,3с(те)) вогнута по х, (•) е Х1.
Тогда множество ситуаций равновесия по Нэшу данной игры не пусто и компактно.
Таким образом, сформулированы необходимые условия существования ситуации равновесия по Нэшу. Приведенные теоремы не являются конструктивными и на практике приходится решать сложные нелинейные системы интегральных уравнений. Полученные результаты для квадратичной структуры функционалов выигрышей игроков можно использовать для нахождения ситуаций равновесия по Нэшу в играх с функционалами близкими к квадратичным.
Исследование некоторых моделей ЗПР при асимметрии информированности проведено в главе 2 с использованием компьютерного моделирования в среде МаНаЬ.
В третьей главе приведено численное исследование моделей ЗПР в условиях информационных ограничений на примере задачи индивидуального стимулирования при асимметрии информированности и задач принятии и реализации решений в производственных системах.
Рассмотрим многоэлементную детерминированную двухуровневую активную систему, состоящую из центра и п активных элементов (АЭ). Решающие функции каждого АЭ определены собственной информационной структу-
п
рой 5, с!т. Пусть х = (н'))е Л' = , и еГ2с/Г - вектор страте-
1-1
гий АЭ, где 4 £С'[П] - множество стратегий АЭ. Индивидуальные за-
траты /-го АЭ при стратегии х,(н') зависят от стратегий всех активных элементов, т. е. с, (.*(■)) = с, (дг(м')), где - функция затрат АЭ в точке и\ Предполагается неубывание по х(()с) и неотрицательность функции затрат, а для оценки затрат используется усредненное значение - с, = М [с 1 Стимулирование а, (•*(•)) вводится как усредненное значение от (х(-)). Целевой функционал /-го АЭ имеет вид
& (*Н) - с,(х(н'))Р(и>)с/н' шах.
п
Условие асимметрии информированности запишется так:
= (20) Задача стимулирования второго рода для центра есть разность:
а\ '»1
где а = (сг, ,а2 ,...,<т„) е Л/, М - множество допустимых систем стимулирования, а Н(х) — результат деятельности системы. Задача центра заключается в выборе функции стимулирования, доставляющей максимум функционала (21). Показано, что система стимулирования
= + (22) [О, х, * х,
является оптимальной для задачи (19)—(21), и реализует на нижнем уровне равновесие по Нэшу для АЭ.
Рассмотрим детерминированную задачу стимулирования второго рода с двумя АЭ, имеющими функции затрат:
, ^_(х, + агх,)2 , ч _ (х, + ах, )2 С1\Х1>Х2)- >С2\Х1'Х2)~ ГЗ >
2г, 2г2
(23)
где а - параметр характеризующий степень взаимодействия АЭ (0<аг<1), гпг2 - оценка квалификации АЭ. Функция дохода центра Н(х[,х2) = х1 +хг, а фонд заработной платы ограничен величиной А При использовании центром системы стимулирования
<г,{х,х) = \ , (24)
задача центра сводится к поиску оптимальных реализуемых стратегий: ("ф (л, , .х2) = Я (дг,,*2)- с, (,х„ х2) - с2 (х2) -> тах, ^ (25)
Задача (25) решалась с помощью метода множителей Лагранжа. Получено следующее решение внутри области
г.-ап
х, =
и на границе области
л, =
(1+«)2(1-
Т2-агх
(1 + «)2(1- ■а)'
/п+ъ »)" осп,
V 2Л 1- а1 '
-аг\
(26)
2Я I — ос
2 '
Найдены значения функции Ф (х) в точках (26), (27):
Ф, =0, Ф, = 3—^—-Л.
12 а +1
В зависимости от соотношения между величинами Н,7,,г2,а центр может выбирать одно из двух решений. Если Ф,>0, то выполняется неравенство + следовательно, центр выбирает решение (27) в силу положительности функции дохода. Для случая, когда Ф, <0, центру выгоднее принять решение (26), при этом его суммарный доход будет равен нулю.
Далее рассматривается задача стимулирования второго рода с двумя АЭ при асимметрии информированности. Пусть информационный вектор ад распределён на множестве (Г = IV, х 1Г2 с плотностью Р(м). Считаем, что Р(н') обладает свойствами плотности распределения:
/>(«-)> 0 и =
Яг
Пусть функции затрат АЭ имеют вид:
с; (х„х2) = ¡с, (х.^/'О,)^ = Г , , Г " (Г 1г Щу1)
¡г ш "г ( "7
где а - некоторый параметр, ф') = Л ■ = -
функции квалификации АЭ, - оценка квалификации АЭ
/¡(и') = |/;(у1')/5(и>)(:Лг, ¥г(н-) = |г2 («■)/> (и-) ¿Лг.
1Г 1Г
Функция дохода центра определяется аналогично функции затрат АЭ как Я(х,,х2) = ^(и^ + х^')?^)^, а фонд заработной платы ограничен вели-
Я'
чиной Л. При использовании центром системы стимулирования (22) задача центра сводится к поиску оптимальных реализуемых действий:
(Ф ( х,, х,) = Н (х,, х,) - с, (х,, х,) - сг (х,, х,) -» шах,
(28)
с^.х^ + сДдц.л^йД, при разной ннформировапности АЭ:
СНГ,
Аналогично рассуждениям, приведенным во второй главе, задачу (28) можно свести к интегральному уравнению (14):
<А(мч) 1-Я
«Ю
ХЦ)-8 (29)
1-Я
где ХЦ) =
( 0 Кг{и)
<Рг(')
О
, / =
1
1-Я 1
1-я;
/• \ а а
а2 1
1/.М ^М.
Приближенное решение системы (29) находится в среде Мае1аЬ с помощью метода моментов, адаптированного для систем интегральных уравнений. Решение задачи (28) находится в виде
Х(,) =
м
7=1
/(<)+Ы(<)
а система линейно независимых функций
й(0 =
йЧо!
, С082я/, 51П2Я7
1, /2
Для А = 2, В = 1, т = п = а = 0.5, = [-0.5,0.5]х[-0.5,0.5] иД»)=1 найдены коэффициенты ог#, Д,, ^:
аг,, = 1,25,о-|2 = 0, аи = 0,083,^, = 0, <яг22 = 0.58, ап = 0,я-3, =0.083, агг =0 ,а3} =0.51, Д, =1.08, Д2 = -0.0045, Д3 =0.115, Д2| = -0.01,Д22 = -0.002, Д23 = 0.003, Д31 =0.146,
Д32 =0.009, Д33 =0.014,г, =9~т
1-Я
1-Я
1-Я
Условие ортогональности невязки ХсДо^ = (г—1,2,3) для не
У-1
собственного значения 8 -1 примет вид:
0.167с, + 0.0045с2 - 0.032с3 = -1Л
0.01с, + 0.58с2 -0.003с3 =■
-0.063с,-0.009с, + 0.498с
1-Я' 0.01 1-Я' 0.174 1-Я"
Решение данной системы:
_ 2.06 -0.94Я _ 0.015Я-0.033 _ 0.33-0.177Я 1-я ,С2" 1-я ,Сэ" 1-Я '
Подставляя значения коэффициентов ci (г-1,2,3), приближенное решение системы интегральных уравнений (29) запишется в виде
(2.03 - 0.24Я+(0.01Я -0.03)со5(2;ги'2)+(0.3-0.17Я)зш(2^))4 _
(3.06 -0.49Я+(0.0и-0.03)ус1+(0.3-0.17Я)у112)
Ф2})
1-фо.
1-Я
(30)
Исследована зависимость найденного решения и целевой функции от А, при этом рассматривались следующие случаи. Случай 1 (Я=0):
"2.03-0.03соз(2я-и'2)+0.38т(2^»'2)>
'¿■„("•Г /
\
3.06-0.03И', +0.3му
Определим численное значение целевой функции Ф (.*,,*,):
1г
Случай 2:Л*=1 и В результате численного решения системы (29)
были получены эмпирические зависимости Ф(Я) и Ф(}.). Согласно полученным эмпирические зависимостям проведен анализ эффективности учета информационных ограничений, на основании которого можно сделать следующие выводы:
- центру не выгодно увеличивать фонд заработной платы /?;
- максимум функции дохода центра Ф = 0.5 реализуется при Я = 0.55;
- если ограничение фоцда заработной платы не учитывается (л = 0), то доход центра составит Ф = -6.9;
- информационные ограничения оказывают существенное влияние на эффективность системы в целом.
Исследование стратегий стимулирования агентов показывает, что центру выгодно использовать весь фонд заработной платы.
В последнем разделе третьей главы проводится исследование эффективности схемы согласования решений и влияние информационных ограничений по типу обменной информации между центром и агентом. Теоретические алгоритмы исследовались в рамках блочного линейного программирования. Построены и реализованы вычислительные схемы на основе методов Данцига -Вульфа, Корнай - Липтака и метода отсечений.
Для сравнения эффективности исследованных алгоритмов были случайным образом сгенерированы задачи блочного программирования и проведено сравнение сходимости алгоритмов согласования решений. Полученные результаты могут быть использованы для разработки алгоритмов поддержки принятия решений в корпоративных информационных системах.
В заключении приводятся основные научные результаты, полученные в диссертационной работе, которые состоят в следующем:
1.Проведен системный анализ проблем принятия решений в условиях информационных ограничений и предложен общий метод их исследования путем сведения к задачам вариационного исчисления.
2.Впервые формализована игра п лиц с асимметрией информированности и сформулированы необходимые и достаточные условия существования равновесия по Нэшу, при несовпадающей информированности игроков.
3.Разработан алгоритм численного решения игр двух лиц с квадратичными интегральными функционалами выигрышей для поиска ситуаций равновесия по Нэшу.
4. Сформулированы и обоснованы необходимые условия существования решения в задаче стимулирования второго рода при разной информированности активных элементов.
5.Исследованы информационные процессы систем поддержки принятия корпоративных решений и проведен качественный анализ схем информационного межуровневого взаимодействия на примере численных методов блочного программирования.
6.В среде Matlab реализован программный инструментарий поиска ситуации равновесия по Нэшу в квадратичном случае с асимметрией информированности, который может быть применен при решении задач вариационного исчисления, модификации алгоритмов блочного программирования и решения системы интегральных уравнений.
РАБОТЫ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
Работы, опубликованные автором в ведущих рецензируемых научных журналах, рекомендованных ВАК Министерства образования и науки Российской Федерации
1. Жариков A.B. Нахождение равновесия Нэша в игре двух лиц для вариантов информационной структуры игроков /A.B. Жариков // Обозрение прикладной и промышленной математики. - М., 2008. - Т. 15, вып. 3. - С. 470. 0,06 п.л.
2. Оскорбин Н.М. Информационные процессы координации корпоративных решений и их компьютерное моделирование / Н. М. Оскорбин, А. В. Бого-виз, А. В. Жариков // Вестник Новосибирского государственного университета. Серия: Информационные технологии. - Новосибирск, 2010. - Т. 8, вып. 1. -С. 54-59. 0,38 п.л. (лично автора - 0,13 пл.)
3. Жариков A.B. Модели стимулирования агентов промышленной корпорации в условиях асимметрии информированности / A.B. Жариков // Известия Алтайского государственного университета. Серия: Управление, вычислительная техника и информатика. - Барнаул, 2010. - №1. - С. 110-113.0,5 пл.
Другие публикации:
4. Жариков A.B. Необходимые условия оптимальности в задачах управления при разной информированности / A.B. Жариков // Единая образовательная информационная среда: проблемы и пути развития : материалы IV Всероссийской научно-практической конференции-выставке. - Томск : Изд-во TI1V, 2005. - С. 136. 0,06 пл.
5. Жариков A.B. О решении задачи управления в концепции теории игр при разной информированности игроков / A.B. Жариков II МАК-2006 : мате-
риалы девятой региональной конференции по математике. - Барнаул : Изд-во Алт. ун-та, 2006. - С. 77-78.0,13 п.л.
6. Максимов A.B. О решении частной задачи управления в случае разной информированности субъектов / A.B. Максимов, A.B. Жариков // Известия Алтайского государственного университета. Серия: Управление, вычислительная техника и информатика. - Барнаул, 2006. - №1. - С. 55-58.0,5 пл. (лично автора - 0,25 п.л.)
7. Жариков A.B. Применение принципа сжатых отображений в задаче управления игры двух лиц при разной информированности игроков / A.B. Жариков // Известия Алтайского государственного университета. Серия: Управление, вычислительная техника и информатика. - Барнаул, 2007. - №1. -С. 55-59.0,63 п.л.
8. Жариков A.B. О существовании равновесия по Нэшу в игровой постановке задачи управления при разной информированности субъектов / A.B. Жариков // МАК-2007 : материалы десятой региональной конференции по математике. - Барнаул : Изд-во Алт. ун-та, 2007. - С. 76-77.0,13 п.л.
9. Жариков A.B. Равновесия по Нэшу в игре двух лиц с квадратичной структурой выигрыша для разных случаев информированности игроков / A.B. Жариков // Управление корпорацией : сб. научных статей / под ред. Н.М. Ос-корбина, В.К. Толстова. - Барнаул : Изд-во Алт. ун-та, 2007. - С. 74-79.0,38 пл.
Ю.Жариков A.B. Равновесие Нэша в игре двух лиц для вариантов информированности игроков / A.B. Жариков // Известия Алтайского государственного университета. Серия: Управление, вычислительная техника и информатика. - Барнаул, 2008. - №1. - С. 69-70.0,13 п.л.
П.Жариков A.B. Исследование механизмов стимулирования в системах с горизонтальными связями / A.B. Жариков // Информационные технологии регионального и муниципального управления : материалы Сибирского научно-практического семинара / под ред. A.A. Цхая. - Барнаул: Изд-во ААЭП, 2009. -С. 30-31. 0,13 пл.
12.0скорбин Н.М. Проблема согласования решений в иерархических системах / Н.М. Оскорбин, И.Н. Дубина, A.B. Жариков // Препринт 8/09. - Барнаул : Изд-во Алт. ун-та, 2009. - 30 с. 1,9 п.л. (лично автора -0,63 п.л.)
13.Жариков A.B. О равновесии по Нэшу в игре при разной информированности / A.B. Жариков // МАК-2011 : материалы четырнадцатой региональной конференции по математике (24-26 июня 2011г., Барнаул). - Барнаул : Изд-во Алт. ун-та, 2011. - С. 88-90. 0,13 п.л.
14.Оскорбин Н.М. Информационный аспект принятия решений в системе ЛПР / Н.М. Оскорбин, A.B. Боговиз, A.B. Жариков // Динамика современной науки - 2011. Т. 2. Экономика : материалы УП международной научно-практической конференции. Республика Болгария, г. София, 17-25 июля 2011 г. -София: «Бял ГРАД-БГ» ООД, 2011. - С. 53-55.0,19 пл. (лично автора-0,06 пл.)
Подписано к печати 18.11.2011 г. Формат бумаги 60x84/16. Объем 1 печ.л. _Заказ № уу.'Тираж 100 экз._
656049, г. Барнаул, ул. Димитрова, 66. Типография Алтайского государственного университета
Текст работы Жариков, Александр Владимирович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
61 12-1/600
л
МИНИСТЕРСТВ О ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
ФГБОУ ВПО «АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
На правах рукописи
ЖАРИКОВ АЛЕКСАНДР ВЛАДИМИРОВИЧ
РАЗРАБОТКА МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ИНФОРМАЦИОННЫХ ОГРАНИЧЕНИЯХ
05.13.18 - Математическое моделирование, численные методы и комплексы программ
Диссертация на соискание учёной степени кандидата физико-математических наук
Научный руководитель: кандидат физико-математических наук, доцент А. В. Максимов
Барнаул - 2011
СОДЕРЖАНИЕ
ВВЕДЕНИЕ..............................................................................................................3
ГЛАВА 1. ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ В КОРПОРАТИВНЫХ СИСТЕМАХ ПРИНЯТИЯ РЕШЕНИИ И МЕТОДЫ ИХ МАТЕМАТИЧЕСКОГО МОДЕЛИРОВАНИЯ....................................................9
1.1. Проблема принятия корпоративных решений в условиях информационных ограничений..................................................................................9
1.2. Вариационное расширение задачи принятия решений при информационных ограничениях.............................................................................23
1.3. Исследование информационных ограничений в задачах принятия решений и управления..............................................................................................30
1.4. Исследование информационных процессов при принятии и реализации решений в производственных системах................................................................41
ГЛАВА 2. ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ПРИНЯТИЯ РЕШЕНИЙ С ИНФОРМАЦИОННЫМИ ОГРАНИЧЕНИЯМИ..........................51
2.1. Необходимые условия оптимальности задачи с информационными ограничениями...........................................................................................................51
2.2. Игровая постановка задачи управления при несовпадающей информированности..................................................................................................53
2.3. Задача стимулирования при несовпадающей информированности игроков................................................................................................................71
ГЛАВА 3. ИССЛЕДОВАНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ В КОРПОРАТИВНЫХ СИСТЕМАХ ПРИНЯТИЯ РЕШЕНИЯ ПРИ ИНФОРМАЦИОННЫХ ОГРАНИЧЕНИЯХ......................................................78
3.1. Пример детерминированной задачи стимулирования второго рода.........78
3.2. Пример задачи стимулирования второго рода при разной информированности активных элементов............................................................80
3.3. Влияние информационных ограничений по типу обменной информации на примере задач блочного линейного программирования...............................86
3.3.1. Генерация задач блочного линейного программирования...............90
3.3.2. Метод Данцига-Вульфа.............................................................................91
3.3.3. Метод Корнай-Липтака.............................................................................. 97
3.3.4. Метод отсечений.......................................................................................101
3.4. Анализ эффективности методов блочного линейного программирования...........................................................................................105
ЗАКЛЮЧЕНИЕ...................................................................................................110
СПИСОК ЛИТЕРАТУРЫ...................................................................................111
ПРИЛОЖЕНИЕ 1................................................................................................118
ПРИЛОЖЕНИЕ 2................................................................................................120
2
Введение
Актуальность исследования. В последние годы усиливается интерес к математическому моделированию процессов принятия решений в сложных социально социальных и экономических системах, в том числе в системах со многими центрами принятия решений (системы с п ЛПР).
Одним из значимых аспектов сложных систем при обосновании оптимальных решений выступают информационные ограничения, т.е. уровень информированности ЛПР о целях, условиях, предпочтениях, множествах допустимых решений всех действующих участников рассматриваемой системы, включая случай асимметрии указанной информированности.
Исторически задачи обоснования решений как одного ЛПР, так и п ЛПР с учетом различных информационных гипотез рассматривались в рамках теории игр (В.Н. Бурков [14, 16], Ю.Б.Гермейер [23], В.А.Горелик, М.А.Горелов, А.Ф.Кононенко [27, 28], Н.Н.Моиссев [62, 81] и другие), двух-этапного и многоэтапного стохастического программирования (Ю.Н. Ермольев [34], В.В. Колбин [37], А.С. Немировский [66], Е.А. Нурминский [71], Д.Б. Юдин [88, 89]), декомпозиционных процедур при оптимизации систем управления (Ю. Г Евтушенко [33], Н.М.Оскорбин [49, 57], B.C. Танаев [47],
B.И. Цурков [1, 85]), системного компромисса (Г.И. Алгазин [6, 5]), теории принятия решений при нечеткой информации (Л. Заде [95], А. Кофман [42],
C.А. Орловский [72]).
При анализе информационных ограничений в задачах поддержки принятия решений (ЗПР) часто используются две из известных в литературе базовые модели значений неконтролируемых параметров. В первой модели неконтролируемые параметры ЗПР можно рассматривать как случайные, т.е. значения всех параметров реально являются случайными и ЛПР известны их распределения вероятностей. Во второй модели для значений неконтролируемых параметров в рамках заданных множеств неизвестны их вероятностные характеристики и/или они не могут изучаться вероятностно-статистическими методами. Случай асимметрии информированности ЛПР и
соответствующие математические модели обоснования оптимальных решений рассматривались только в простых частных случаях в общем же случае, недостаточно полно исследованы в литературе.
Перспективным для исследования является общий подход к проблеме поддержки принятия решений в условиях информационных ограничений, суть которого состоит в том, что все ЛПР выбирают оптимальные решающие функции, определенные на множествах известных параметров в соответствии с заданной структурой их информированности, включая и асимметрию информированности. При этом ЗПР записываются как задачи вариационного исчисления. Практическая применимость такого подхода состоит в том, что при некоторых простых информационных структурах, поиск оптимальных решений сводится к конечномерным задачам оптимизации, которые решаются известными методами математического программирования. В общем случае для задач поддержки принятия решений с информационными ограничениями необходимо применять методы вариационного исчисления. Учитывая вышесказанное, можно заключить, что тема диссертации является актуальной.
Цель диссертационной работы состоит в разработке математических моделей поддержки принятия решений при информационных ограничениях: теоретическое исследование; разработка и обоснование численных методов; программная реализация.
Для достижения цели в диссертации были поставлены и решены следующие задачи:
1) анализ существующих подходов к формализации задач принятия решений с учетом информационных ограничений;
2) вариационное расширение задач принятия решений с учетом информационных ограничений и исследование частных случаев, в том числе игры двух лиц с квадратичными функционалами выигрышей;
3) формулировка и доказательство существования равновесия по Нэшу в игре п лиц при разной информированности ироков;
4) обоснование необходимых условий существования решения в задаче стимулирования второго рода при разной информированности активных элементов;
5) разработка алгоритма для модельного примера задачи стимулирования второго рода при общей и несовпадающей информированности игроков;
6) исследование информационных процессов в системах поддержки принятия корпоративных решений и качественный анализ схем информационного межуровневого взаимодействия на примере численных методов блочного программирования.
Объект исследования - процедуры принятия решений в условиях неопределенности и при асимметрии информированности ЛПР.
Предмет диссертационного исследования - математические модели процессов принятия решений в условиях информационных ограничений.
Методы исследования. При выполнении диссертационной работы использовались математические методы теории принятия решений (теория игр, теория активных систем), методы блочного программирования, вариационного исчисления, теории вероятностей и математической статистики, теории интегральных уравнений.
Научная новизна. Предложены модели, методы и алгоритмы для задач принятия решений при информационных ограничениях путем их сведения к задачам вариационного исчисления. Сформулированы необходимые и достаточные условия существования равновесия по Нэшу в условиях несовпадающей информированности игроков. Разработан алгоритм численного решения класса игр двух лиц с квадратичными интегральными функционалами выигрышей в концепции ситуаций равновесия по Нэшу. Исследованы теоретические и прикладные модели поддержки принятия корпоративных решений и вычислительные алгоритмы ЗПР с учетом ограничений обмена информации.
Теоретическая и практическая ценность. Теоретическая ценность работы заключается в том, что предложен способ формализации проблемы
принятия решений в условиях информационных ограничений и общий метод их исследования путем сведения к задачам вариационного исчисления, который позволяет обосновать оптимальность искомых решающих функций.
Практическая значимость результатов диссертационной работы состоит в расширении возможности применения математических методов для задач поддержки принятия решений в условиях неопределенности и при асимметрии информированности ЛИР. Исследование информационных ограничений в корпоративных системах управления может способствовать разработке эффективных численных методов и алгоритмов межуровневого взаимодействия при проектировании внутрифирменных информационных систем.
Разработанный в среде МАТЬАВ программный инструментарий поиска ситуации равновесия по Нэшу в квадратичном случае с асимметрией информированности может быть применен при решении задач вариационного исчисления, модификации алгоритмов блочного программирования и решения систем интегральных уравнений.
Основные положения, выносимые на защиту:
1. Результаты системного анализа проблем принятия решений в условиях информационных ограничений, классификации ЗПР и общий метод их исследования путем сведения к задачам вариационного исчисления.
2. Формализация игры п лиц с асимметрией информированности и математические результаты ее исследования, включая существование ситуации равновесия по Нэшу, необходимые условия существования ситуации равновесия по Нэшу для игры двух лиц с квадратичными функционалами выигрышей.
3. Результаты исследования математических моделей обоснования решений при информационных ограничениях, путем имитационного и компьютерного моделирования.
Апробация результатов исследования. Основные теоретические и практические результаты работы представлены автором на следующих научных конференциях, семинарах и научных школах:
Международные: VII международная научно-практическая конферен-
ция «Динамика современной науки» (Республика Болгария, г. София, 2011г.).
Всероссийские: IV Всероссийская научно-практическая конференция-выставка «Единая образовательная информационная среда: проблемы и пути развития» (Томск, 2005), IX Всероссийский симпозиум по прикладной и промышленной математике (весенняя сессия, Кисловодск, 2008).
Межрегиональные и региональные: ежегодная студенческая конференция, проводимая в рамках дней молодежной науки в Алтайском государственном университете (Барнаул, 2005, 2006); региональная конференция по математике МАК (Барнаул, 2006-2011); Сибирский научно-практический семинар «Информационные технологии регионального и муниципального управления» (Барнаул, 2009).
Публикации. По теме диссертационной работы автором опубликовано 14 работ, в том числе 3 статьи в ведущих реферируемых научных журналах, рекомендованных ВАК для публикации результатов диссертационных работ.
Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, 2 приложений и списка используемых источников и литературы (95 наименований). Основной материал изложен на 110 страницах, включая 2 таблицы, 20 рисунков.
В главе 1 приведен анализ информационных структур принятия решений при информационных ограничениях, обоснована классификация этих задач и отражена степень изученности в современной литературе.
В качестве основой модели рассматривается задача поддержки принятия решений с п ЛПР, когда ЛПР выбирают оптимальные решающие функции, определенные на множествах известных параметров в соответствии с заданной структурой их информированности.
Для иллюстрации данного подхода, приводятся примеры с простыми информационными структурами, а поиск оптимальных решений сводится к задачам математического программирования.
Рассмотрена игра двух лиц с непротивоположными интересами («Государство-Предприниматели») и задача поэтапной оптимизации управления методом динамического программирования.
В разделе 1.4. «Исследование информационных процессов при принятии и реализации решений в производственных системах» рассмотрено моделирование информационных процессов поиска оптимального плана корпорации на примере решения задач блочного линейного программирования методами Данцига-Вульфа, Корнай-Липтака и методом отсечений
В главе 2 рассматриваются методы решения игры при асимметрии информированности с использованием вариационного исчисления в концепции равновесия по Нэшу. Проводится исследование частных случаев этой задачи на примере игры двух лиц.
Для общего случая игры сформулированы условия существования ситуаций равновесия по Нэшу.
В разделе 2.3 «Задача стимулирования при несовпадающей информированности активных элементов» приводится постановка задачи стимулирования в условиях асимметрии информированности активных элементов, и рассматриваются некоторые свойства указанных задач.
В главе 3 приведено численное исследование моделей ЗПР в условиях информационных ограничений на примере задачи индивидуального стимулирования при асимметрии информированности и задач принятии и реализации решений в производственных системах.
Глава 1. Информационные процессы в корпоративных системах принятия решении и методы их математического моделирования
1.1. Проблема принятия корпоративных решений в условиях информационных ограничений
В данном разделе проводится классификация задач обоснования оптимальных решений с учетом информационных ограничений.
Схема обоснования математических моделей с подобными ограничениями, состоит в последовательном усложнении информационной структуры системы принятия решений. Для я-ЛПР рассматриваются детерминированные системы принятия решений и системы принятия решений, в условиях неполной информированности, с рассмотрением асимметрии информированности.
Анализ отмеченной выше литературы, позволяет предложить классификацию задач принятия решений с учетом фактора информированности, представленную на рисунке 1.1, где НПС, НПН - обозначения моделей неконтролируемых параметров соответственно теоретико-вероятностных и моделей с неопределенными факторами.
Поясним рассмотренную схему классификации ЗПР, а также приведем данные об изученности в литературе в виде следующей таблицы.
Таблица 1.1.
Описание и классификация задач принятия решений для п ЛПР
Код ЗПР Описание Литература
1. ЗПР при определенности или детерминированные ЗПР (теория математического программирования, теория игр, теория оптимального управления, исследование операций и др.) [14, 15, 16, 22, 23, 27, 28, 30, 46, 62, 64, 65, 67, 68, 70, 76, 79, 87 и др.]
2. ЗПР при неконтролируемых параметрах [6, 22,25, 37,49, 53, 54, 89]
2.1. ЗПР с совпадающей информированностью ЛПР о неконтролируемых параметрах [6, 22, 25, 37, 89]
2.1.1. ЗПР с совпадающей информированностью ЛПР о неконтролируемых параметрах, параметры имеют стохастический характер (НПС) [22, 25, 37, 89]
2.1.2. ЗПР с совпадающей информированностью ЛПР о значениях неконтролируемых параметров, не случайность (неопределенность) неконтролируемых параметров (НПН) [6, 22, 23, 49, 53, 54]
2.1.3. ЗПР с совпадающей информированностью ЛПР о неконтролируемых параметрах, включая НПС и НПН [22, 23]
2.2. ЗПР с асимметрией информированности ЛПР о неконтролируемых параметрах [6, 22, 23,49,51,52, 53,54]
2.2.1. ЗПР с асимметрией информированности ЛПР о неконтролируемых параметрах, включая НПС Отдельные постановки ЗПР этих классов с использованием приема вариационного расширения рассматривались в работах [51] и [52]
2.2.2. ЗПР с асимметрией информированности ЛПР о неконтролируемых параметрах, включая НПН
2.2.3. ЗПР с асимметрией информированности ЛПР о неконтролируемых параметрах, включая НПС и НПН
В соответствии с приведенными кодами ЗПР, рассмотрим основные подходы и способы их математической формализации.
Конечным результатом любой ЗПР становится решение - конструктивное предписание к действию. Классические модели принятия решений, как правило, являются оптимизационными, ставящими цель максимизировать выгоду ЛПР и на основе этих моделей получить, дополнительную прибыль.
В последние г�
-
Похожие работы
- Поддержка принятия решений при управлении в сложных системах на основе антикризисного подхода и интеграции интеллектуальных технологий
- Синтез информационных технологий обработки когнитивной информации в системах поддержки принятия решений
- Совершенствование процедур поддержки принятия решений в логистических системах на основе геоинформационных технологий
- Повышение оперативности принятия решений в многоуровневой системе управления на основе синтеза информационных ресурсов
- Система поддержки принятия решений по многокритериальной оценке и выбору проектов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность