автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Согласованные решения в мультиагентной информационной системе
Автореферат диссертации по теме "Согласованные решения в мультиагентной информационной системе"
На правах рукописи
КУДРЯВЦЕВ Константин Николаевич
СОГЛАСОВАННЫЕ РЕШЕНИЯ В МУЛЬТИАГЕНТНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЕ
05.13.17 — теоретические основы информатики
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
4848763
2 ИЮН 2011
Москва - 2011
4848763
Работа выполнена на кафедре математического анализа механико-математического факультета Южно-Уральского государственного университета.
Научный руководитель - заслуженный деятель науки РФ,
доктор физико-математических наук, профессор ЖУКОВСКИЙ Владислав Иосифович.
Официальные оппоненты: доктор физико-математических наук,
профессор ГОРЕЛИК Виктор Александрович;
Ведущая организация - Московский государственный университет им. М.В. Ломоносова.
Защита диссертации состоится «20» июня 2011 г. в 17 часов на заседании диссертационного совета Д 212.154.32 при Московском педагогическом государственном университете по адресу: 107040, г. Москва, ул. Краснопрудная, д. 14., математический факультет МПГУ, ауд. 301.
С диссертацией можно ознакомиться в научной библиотеке Московского педагогического государственного университета по адресу: 119992, г. Москва, ул. Малая Пироговская, д. 1.
кандидат физико-математических наук, доцент БАРДИН Александр Евгеньевич.
Автореферат разослан
Л м
2011 г.
Ученый секретарь диссертационного совета
МУРАВЬЕВА О.В.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Одной из важнейших задач теоретических основ информатики является разработка и анализ моделей информационных процессов, в частности, в мультиагентных информационно-управляющих системах (МИУС). В диссертации для МИУС учитываются, во-первых, взаимодействие интеллектуальных агентов, выражающееся в выработке совместных действий, во-вторых, наличие двухуровневой иерархии в передаче информации.
Разработка технологии и исследование взаимодействий интеллектуальных агентов, а также создание мультиагентных систем представляет собой одну из наиболее важных областей развития новых информационных технологий. У специалистов по информационным технологиям сформировалось и вошло в широкий научный обиход представление об интеллектуальных агентах как автономных, активных, а главное мотивированных объектах "живущих" и "действующих" в сложных виртуальных средах, в частности, в информационных системах. Уже сегодня агентный подход находит широкое применение в таких областях как распределенное решение сложных задач, построение виртуальных предприятий, имитационное моделирование интегрированных производственных систем. В ближайшем будущем он несомненно займет центральное место при развитии средств управления информацией и знаниями.
В теории мультиагентных систем (MAC) обычно предполагается, что отдельный агент может иметь лишь частичное представление об общей задаче и способен решить только некоторую ее подзадачу. Поэтому для решения сколько-нибудь сложной проблемы, как правило, требуется взаимодействие агентов. Этот социальный аспект решения задач - одна из фундаментальных характеристик новизны как передовых компьютерных технологий, так и искусственных (виртуальных) организаций, строящихся как MAC.
Основой для развития теории MAC послужили работы У.Питтса и У.МакКаллока по формальным нейронам, Дж.фон Неймана по самовос-призводящимся автоматам, А.Н.Колмогорова по теории сложности, У. фон Форстера по терпи самоорганизации, У.Эшби по гомеостазису, Г.Уолтера по реактивным робатам, Дж.Холланда по генетическим алгоритмам. Первые результаты в исследовании коллективного поведения агентов связаны с именами М.Л.Цетлина, В.А.Лефевра, Д.А.Поспелова, М.Минского, в области открытых систем и теории акторов К.Хьюитта. Первые практические разработки по MAC относятся к 70-м годам и связаны с именами
B.JIeccepa, Д. Лената, У.Корнфелда.
Значительный вклад в развитие теории MAC внесли также Варшавский В.А., Городецкий В.И., Стефанюк В.Л., Тарасов В.В., Теряев Е.Д., Филимонов A.B., Швецов А.Н., Яковлев А.Н., И.Шоэм, Р.Брукс, Ж.Фербе, Дж.Мейер, С.Уилсон и др.
В настоящее время одним из основных направлений в разработке MAC являются распределенный искусственный интеллект, ядро которого составляют исследования взаимодействия и кооперации небольшого числа интеллектуальных агентов. При этом, коллективное поведение образуется на основе индивидуальных интеллектуальных поведений. Здесь предполагается согласование целей, интересов и действий различных агентов, разрешение конфликтов путем переговоров. Вопросам коммуникации и кооперации агентов посвящены исследования Бондаревой О.Н., Васина A.A., Воробьева H.H., Морозова В.В., Гермейера Ю.Б., Горелика В.А., Жуковского В.И., Петросяна Л.А., Соболева А.И., Huhns M.N и Stephns L.M., Durfee E.H., Silaghi G.S., Rosenshein J., Zlotkin G., R.Smit и др.
В диссертации обсуждается принятие решений в мультиагентных системах, где интеллектуальные агенты, на основе имеющейся у них информации, взаимодействуют и совместно принимают решение, априорно имея возможность часть достигнутого ими предварительного исхода передать партнерам. Используются подходы теории кооперативных игр с побочными платежами для анализа задачи перераспределения добытых агентами исходов. При этом предполагается двухуровневая информационная структура. Нижний уровень - уровень более простых, реактивных агентов, например тех, которые служат для непосредственного автоматического управления объектами автоматизации. Верхний уровень составляют интеллектуальные агенты. Процесс передачи информации происходит следующим образом: агенты нижнего уровня сообщают интеллектуальным агентам свои действия, на их основе агенты верхнего уровня формируют действия, направленные на достижения своих целей. При этом предполагается, что интеллектуальные агенты могут перераспределять между собой достигнутые исходы.
В диссертации применяется подход оптимального сочетания исходов и рисков к информационным процессам возникающим в МИУС при взаимодействии двух интеллектуальных агентов и конечного числа реактивных. В первой главе рассматривается "статический" случай задачи. Предполагается, что в рассматриваемых МИУС интеллектуальные агенты действуют совместно и согласованно, причем стремятся не только увеличить свой общий исход (сумму исходов, которую впоследствии по заранее оговорен-
ным правилам могут перераспределить между собой), но и гарантировать себе по возможности меньшие риски. Возникновение МИУС данного вида связано с тем, что в настоящее время в большинстве экономических задач требует учитывать не только исходы интеллектуальных агентов, но и риски по этим исходам. Во второй главе диссертации исследуется динамический случай рассматриваемой задачи.
Целью работы является формализация и исследование гарантированных по исходам и рискам решений для информационных процессов в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных. При этом предполагается, что о действиях реактивных агентов известна лишь область значений, а какие-либо вероятностные характеристики отсутствуют (по тем или иным причинам).
Объектом исследования являются вопросы теории МИУС, касающиеся принятия гарантированных решений.
Предмет исследования — информационные процессы, возникающие в МИУС при взаимодействии двух интеллектуальных агентов и конечного числа реактивных.
Проблема заключается в формализации понятий гарантированных по исходам и рискам решений таких задач при учете действий реактивных агентов, исследование свойств решений и способов построения.
В основу исследования положена следующая гипотеза: на основе модификации принципа гарантированного результата, понятий векторных оп-тимумов, гарантированного дележа из теории кооперативных игр можно определить возможные решения для информационных процессов в МИУС с интеллектуальными и реактивными агентами, получить условия существования и предложить способ их построения.
Для реализации поставленной цели и проверки сформулированной гипотезы потребовалось решить следующие задачи:
- формализовать понятие гарантированного по неходам и рискам решения, исследовать свойства такого решения и условия существования;
- для динамического линейно-квадратичного случая модели информационных процессов в МИУС с интеллектуальными и реактивными агентами ввести понятие гарантированного решения, выявить "коэффициентные" условия его существования, алгоритм построения и найти явный вид;
- рассмотреть возможные приложение к конкретным экономическим задачам и линейно-квадратичному случаю.
Методологическую основу работы составляют методы и подходы теории мультиагентных систем, теории многокритериальных задач при неопределенности, теории игр, выпуклого анализа, теории матриц и квад-
ратичных форм, дифференциальных уравнений, теории динамического программирования.
Научная новизна. Отличие данной работы состоит в том, что в ней предложен новый подход к информационным процессам в МИУС с интеллектуальными и реактивными агентами, а именно: предлагается понятие гарантированного по исходам и рискам решения, позволяющее интеллектуальным агентам обеспечить некоторые "пороговые" исходы, и одновременно с этим некоторые "пороговые" риски. Одновременно исследован случай, когда действия интеллектуальных агентов формируются на основе "знания" о реализовавшихся действиях реактивных агентов. В обоих случаях установлены условия существования, а также предложен способ распределения между интеллектуальными агентами достигнутых ими исходов.
Для динамической линейно-квадратичной математической модели МИУС вводится понятие гарантированного по исходам и рискам решения. Установлены "коэффициентные" условия существования и, при выполнении этих условий, найден явный вид.
Практическая значимость работы. Результаты диссертации могут быть применены к решению сложных задач, построению виртуальных предприятий, имитационному моделированию интегрированных производственных систем, к построению средств управления информацией и знаниями, к различным прикладным задачам прогнозирования и планирования в экономике, экологии, механике управляемых систем. В качестве приложения исследована математическая модель рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта. Отметим также, что разработка (на основе предложенного подхода) экономико-математических моделей позволит, во-первых, дать более адекватное реальности описание процессов принятия решений, во-вторых, получить эффективные решения в сфере планирования и управления.
Основные положения, выносимые на защиту:
- формализовано понятие гарантированного по исходам и рискам решения для информационных процессов в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных, выявлены свойства и условия существования;
- построено гарантированное по исходам и рискам решение для модели рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта;
- на основе метода динамического программирования, объединенного с методом функций Ляпунова, найден явный вид гарантированного по исходам и рискам решения в динамическом линейно-квадратичном случае
задачи.
Апробация. Результаты диссертации докладывались на пятнадцатой Крымской осенней математической школе-симпозиуме "Spectral and Evolutionary Problems" (Simferopol, 2005), на XIV международной конференции "Математика. Экономика. Образование" (Ростов-на-Дону, 2006), на шестнадцатой Крымской осенней математической школе-симпозиуме "Spectral and Evolutionary Problems" (Simferopol, 2006), на международной школе-симпозиуме "Анализ, моделирование, управление, развитие экономических систем АМУР-2007" (Sevastopol, 2007), на XV международной конференции "Математика. Экономика. Образование" (Ростов-на-Дону, 2008), на 61-й научной конференции "Наука ЮУрГУ" (Челябинск, 2009), дважды на семинаре факультета ВМнК МГУ "Риски в сложных системах управления" (Москва, 2008, 2010).
Публикации. Основные результаты по теме диссертации опубликованы в 11 работах, в том числе публикации [1-3] - в изданиях, включенных в перечень ВАК. В работах [4,5] В.И. Жуковскому принадлежит постановка задач и общее руководство, К.Н. Кудрявцеву принадлежат все полученные результаты.
Структура и объем работы.Диссертационная работа состоит из введения, двух глав, разбитых на 10 параграфов, заключения и списка литературы. Материал изложен на 148 страницах машинописного текста, включая 20 рисунков. Библиография содержит 116 наименований.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность выбранной темы диссертации, дан краткий обзор литературы на основе работ отечественных и зарубежных авторов, определены цель, задачи и методы исследования, а также приведено краткое содержание по главам и основные результаты.
Первая глава ("Гарантированные исходы и риски") состоит из семи параграфов и посвящена исследованию "статического" случая модели информационных процессов в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных.
В первом параграфе рассматривается указанная модель, которую образует кортеж
Г=({1,2}1{Х1}1-=,,2,У,{Л(®.»)}<-1.2>- (1)
Здесь 1,2 - порядковые номера интеллектуальных агентов (ИА), действия i-го И А Х{ € X,- С R"f (R"' - «¡-мерное евклидово пространство). В результате совместного и согласованного выбора ИА своих действий
Xi € Xj (г = 1,2) в модели (1) складывается соглашение х = (rrj, Х2) € X = = Xi х Х2 С R" (п = щ + Пг). Независимо от действий И А реализуется некоторое действие реактивных агентов (РА) у ё Y С Rm. На образовавшихся в результате парах (х, у) G X х Y определена скалярная оценочная функция1 г-го ИА /¿(х, у) : Хх Y —> К (г = 1,2). Значение оценочной функции }i{x,y) на реализовавшемся (в результате действий И А) соглашении х и появившемся независимо действии РА у есть предварительный исход i-го ИА. На втором этапе взаимодействия полученные предварительные исходы И А перераспределяют между собой.
На "содержательном уровне" цель г-го И А состоит в согласованном выборе такого своего действия и такого перераспределения исходов, чтобы полученный в результате его перераспределенный исход стал возможно большим, а риск (определенный ниже) возможно меньшим.
"Кооперативный" характер модели допускает возможность И А договариваться между собой о наиболее благоприятных для них совместных выборах своих действий с целью достичь по возможности большего "суммарного исхода" и одновременно меньшего "суммарного риска", которые им впоследствии предстоит перераспределить между собой. При этом будем считать, что исходы суммируются только с исходами, а риски — с рисками. Кроме того, при выборе своих действий ИА дополнительно должны учитывать возможность реализации любого заранее непредсказуемого действия РА у из множества Y.
Функция риска г-го ИА Фi(x,y) определяется, следуя идее принципа минимаксного сожаления Сэвиджа 2:
Ф«(я,у) = fi{xP{y),y) - fi{x,y) (г = 1,2),
где соглашение хр(у), у s Y является максимальной по IJapemi? альтернативой в двухкритериальной задаче (для каждого действия РА у Е Y)
г(у)НХ, {/«(*, i/)b-i.a>-
Функция Фi(x,y) численно оценивает риск (сожаление) г-го ИА о том, что при действии РА у € Y он (согласованно с партнером) выбрал свое действие из соглашения х, а не из хр(у), хотя последнее и доставляет векторный максимум в задаче Г(г/). Особенность данной работе в том, что ИА считают исходы и риски (по этим исходам) одинаково важными. Исходя из этого,модели (1) ставим в соответствие вспомогательную модель
1 БутГги'Нко Д.Ю., Соловьев И.П. Абстрактная архитектура интеллектуального агента и методы ее реализации // Системное программиривание. 2005. №1. С. 36-67.
2Savage L.Y. The theory of statistical decusion // J. American Statistic Association, 1951. №46, P55-67.
3Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982. 254 с.
{{1,2}, {Xj}i=li2) Y, {ffa у), -Ф4(х, j/)}1=1,2). (2)
В модели (2) множества Xj, Y и функции /¡(х, у) те же, что и в (1). Отличие лишь в том, что оценочная функция г-го ИА в модели (2) становится векторной (&{х,у),—Ф{(х,у)), причем вторая компонента специально взята со знаком "минус". Поэтому, если в (2) ИА i стремится к возможно большим значениям одновременно обеих компонент своей оценочной функции, то тем самым он ставит цель увеличить исход /¡(х, у) и одновременно уменьшить риск Фi(x,y).
Для оценочной функции fi(x,y) (г = 1,2) ниже используются макснмины fi[y], а для функций риска Ф{(х,у) (г = 1,2) применяются минимаксы Ф°[г/]- В (3) и далее Idem[x —► х*] означает скобку [...] в (3) и далее, где х заменено на х*.
Определение 1. Гарантированным по исходам и рискам решением (ГИРР) математической модели взаимодействия двух интеллектуальных агентов при неизвестных действиях реактивных агентов (1) называется тройка (х*. /*, Ф*), для которой существует действие реактивных агентов ур £ Y такое, что выполняются следующие три условия:
1°. условие коллективной рациональности 2
in ах у fj(x,yp) — Idem[x —» х*], (3)
г=1 2
min ^ Ф,(г, ур) = Idemlx —> (4)
хеХ ' »= 1
2°. условие "неухудшаемосгпи" суммарного исхода и риска 2
min V [fi{x*, у) - Ф;(х*, у)] = Idem\y -* уР}; (5)
У6Y ' t=l
Зи. условие индивидуальной рациональности-. имеет место система из четырех неравенств
Ф?<Ф?ы (¿=1,2), (6)
где ifi(x*,yp) = 'tf* И ¿Ф ¡(х*,Ур) = £ф1
1=1 ¿=1 ¿=1 1=1 При этом пару /* = (/i,/2*) назовем гарантированным векторным исходом, пару Ф* = (Ф{, Ф2) - гарантированным векторным риском модели (1), а х* - соглашением, гарантирующим эти исходы и риски.
Следующее утверждение устанавливает принципиальную возможность распределения между ИА суммарного исхода f* + /2* и суммарного риска Ф* + <1>2 таким образом, чтобы выполнялось условие индивидуальной рациональности (6).
Лемма 1. Для суммарного исхода /,* + /2* и суммарного риска Ф^ + Ф2 справедливы следующие неравенства
/Г + П > /,°Ы + /2°Ы. Ф1 + < Ф?Ы + Ф°Ы-
Лемма 2. Имеет место импликация:
[(5)] => [несовместна система из четырех неравенств
МХ',У) < f-, Фг(х% у) > Ф* Vy € Y (» = 1,2), из которых хотя бы одно строгое].
Из леммы 3 следует, что действие РА ур € Y, найденное из (5), является минимальным по Парего в четырехкритериалыюй задаче
(Y, Шх*,у),-Фг(х*,у)}^У Отсюда получаем, что при использовании И А соглашения х* и реализации любого действия РА у £ Y исходы ИА fi{x*,y) (г = 1,2) не могут стать одновременно меньше соответствующих компонент f* вектора /* = (/i, /2). а риски Ф;(ж*,т/) (г = 1,2) одновременно больше Ф* - компонент гарантированного векторного риска Ф* = (Ф^Фг). В этом как раз и состоит "гарантирующий смысл" условия (5).
В §1 также рассматривается случай "информационной дискриминации" действий РА. Здесь ИА, принимая решение о выборе своих действий ориентируются не на возможность появления любого действия РА из множества Y, а на конкретную его реализацию у. То есть в качестве действий они выбирают не элемент х; £ X; С К"', а "действие" — функцию хг{у) : Y —> X, (г = 1,2) (по определению академика H.H. Красовского 4 — контрстратегию).
Математической моделью кооперативного взаимодействия двух ИА с возможностью перераспределения исходов и "дискриминацией" РА будем называть кортеж
({1,2},{ХП*=1,2^Л/Л*,2/)}<=1,2), (7)
где 1 и 2 - порядковые номера ИА, множества X; (г = 1,2) и Y те же, что и в модели (1), Xj - множество всех непрерывных функций Х{(у) (г = 1,2) заданных на множестве действий PA Y со значениями в X,-, а для оценочных функций
4Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 455 с.
fi{x,y) = ft(x(y),y) Vye Y (¿=1,2).
Определение 2. Гарантированным по исходам и рискам решением (ГИРР) математической модели кооперативного взаимодействия двух ИА с возможностью перераспределения исходов и "дискриминацией" РА называется тройка {х*(у), /*, Ф*) € XY х К4 такая, что существует действие РА у* € Y, при котором выполнены следующие три условия: 1°. условие коллективной рациональности: 2 2
Лу) = 5ZЯх*(у)>У) УУ е Y;
2°. условие "неухудшаемости" суммарного исхода и риска: 2
min Т [fi(x*(y),y) - Ф¡(х*(у), г/)] = /demfe - у*]; (8)
3°. условие индивидуальной рациональности: имеет место система из четырех неравенств
где ЕМ®т1/*) = ЕЛ* " ¿Ф.-№).1/') = ЕФ?;
¿=1 i=i ¿=1 i=i при этом пару f* = (/^/г) назовем гарантированным векторным исходом, пару Ф* = (Ф^, Ф£) - гарантированным векторным риском модели (7), а х*(у) - соглашением, гарантирующим (обеспечивающим) эти исходы и риски.
Во втором параграфе приводятся понятия векторных оптимумов по Слейтеру, Парето, Борвейну, Джофриону и соответствующих им векторных гарантий (из теории многокритериальных задач при неопределенности). Выявлена связь гарантированных исходов и рисков с векторной гарантией.
Свойство 1. Действие РА у* 6 Y из (8) является минимальным по Джоффриону в задаче
Свойство 2. Соглашение х*(у) е XY, удовлетворяющая требованию (1°) определения 2, максимально по Джоффриону в четырехкритериальной задаче
(Ху,{Мх(у),у),-ФМу),У)}ш,2)
при всех у е Y.
Установлено, что множества гарантированных исходов и гарантированных рисков являются внутренне Р - устойчивыми (устойчивыми по Паре-то) и 5 - устойчивыми (устойчивыми по Слейтеру).
В §3 приводятся понятия смешанного соглашения и смешаннго действия РА, определяются понятия ГИРР в смешанном и квазисмешанном (по действиям РА) расширениях модели (1). Условия существования ГИРР устанавливают следующие теоремы: Теорема 1. Предположим, что в модели (1)
1°) множества Хг- (г = 1,2) и У — непустые выпуклые компакты, 2°) оценочные функции /¿(я, у) (г = 1,2) непрерывны на X х У и строго
вогнуты по х 6 X при каждом фиксированном у £ У, 2
3°) функция [/¡(ж> У) — ФД1! У)} вогнута по х £ X при каждом у € У
«=1
и выпукла по у € У при каждом х € X.
Тогда для модели (1) существует ГИРР (х*, /*, Ф*). Теорема 2. Предположим, что в модели (1)
1°) множества X,- (г = 1,2) и У — непустые компакты, 2°) оценочные функции /; (х, у) и функции риска Ф<(х, у) (г = 1,2) непрерывны на X х У.
Тогда в (1) существует ГИРР (¡>(-),/,Ф) в смешанных соглашениях и действиях РА.
Теорема 3. Предположим, что в модели (1)
1°) множества X* (г =1,2) — выпуклые непустые компакты, У — непустой компакт,
2°) оценочные функции ¡¡{х, у) (г = 1,2) непрерывны на X х У и строго
вогнуты по £ б X при каждом фиксированном у 6 У, 2
3°) функция ^ [/¿(я* у) — у)] вогнута по х € X при каждом фик-¡=1
сированном у £ У.
Тогда в модели (1) существует гарантированное по исходам и рискам квазирешение (х,/, Ф). Теорема 4. Если
1) множество X - выпуклый компакт, У - компакт,
2) функции /¡(х, у) (г = 1,2) непрерывны на X X У и строго вогнуты по х при каждом фиксированном у е У,
то для игры (7) существует ГИРР.
В четвертом параграфе предлагается один из возможных способов распределения предварительных исходов как для модели (1), так и для ее смешанного и квазисмешанного расширений, а также для модели (7) с
"информационной дискриминацией" действия РА. Приводится алгоритм построения ГИРР.
Далее, в качестве приложения, в §5 рассматривается линейно - квадратичный случай модели МИУС (1), а именно
({1,2} , {X, = 1Г }i=1>2, Y = Rm, Ш*, y)}i=1,2) - (9)
Здесь множеством действий х,- (г = 1,2) у г-ro ИА является все евклидово пространство !" размерности п; соглашения х = (^ь Х2) € М2"; множество действий РА у совпадает с Ег"; оценочная функция г-го ИА линейно-квадратична и имеет вид:
fi{x,y)r=x'iAiiXi + 2x[By + y'Ciy + 2a'üxl + 2a'i2x2 (¿ = 1,2). (10)
В (10) матрицы соответствующих размерностей Ац, В и С; постоянны, причем Ац и С, симметричны, n-вектора а^ (i,j = 1,2) также постоянны; штрих сверху означает операцию транспонирования. Далее используем следующие обозначения:
С = Ci+ С2, Са = аСх + (1 - а)С2,
л; = du + a,2i (г = 1,2), aai = аац + (1 - а)а2; (г = 1,2),
h = В'А1{ аз, - а„] , к2 = -В'AT? [аи + ^а21] , (1
k = ki+ к2, 7i = ¿ra^-A^Vi - aai - ^а[2А2^аа2,
Т2 = (ГГ^а'с,2А22а<*2 - аа1 ~ ГГ^а^Ии аа2. 7 = 7l + 72,
М = С - l-4"afa2B'A^B, q^k + AB'A^au l = 2BM~1q + ai,
число а Е (0; 1).
Ниже А < 0 (>, >, <) означает, что квадратичная форма z'Az определенно отрицательна (определенно положительна, неотрицательна, неположительна).
Утверждение 1. Если Ац < 0 (г = 1,2), то для модели (9) функции риска имеют вид
у) = ^у'В'А^Ву + 2{к\ - х\В\у + Ъ- x\Auxi - 2а!пхх - 2а'12х2, Ых, у) = -ly'B'A^By + 2[к'2 - х\В]у + 72 - х'2А22Х2 - 2o'21xi - 2а'22х2,
где постоянная а € (0,1), а вектора и числа 7; (г = 1,2) определены в (11).
Утверждение 2. Если Ац < О, С; > 0 (г = 1,2) и а е (0,1/4), то для модели (9) существует ГИРР. При этом гарантированный векторный исход и гарантированный векторный риск определяются следующим образом:
Г = {(/Г, Я) I Я + П = q'M-}CMq - l'A^l - а'2А£а2},
ф* = {(ф;, ф*) | ф» + Ф* = д'[М-1 + М~1СМ\ч+
+2а\А^ах + а'2А^а2 - + 7},
гарантирующее эти исходы и риски соглашение х* — —А^а-^), а
соответствующе действие РА будет ур = М_1д.
Аналогичные результаты получены в §5 и для случая "информационной дискриминации" действий РА.
В шестом параграфе рассматривается модель МИУС, в которой оценочные функции "разделены" по соглашениям ИА и действиям РА
({1,2}, {Х*Ь=1>2, У, Мх) + ШЬ-и) ■ (!2)
выявлена структура ГИРР, именно, установлены утверждения: Утверждение 3. Пара (х*, ур) тогда и только тогда удовлетворяет требованиям (1°) и (2°) определения ГИРР для модели (12), когда выполнены следующие два условия:
2
1°) тах£ ^¡(х) = Ыет[х -+ х*],
хех
2
2°) шт ]П Му) = 1Лстп\у уР].
У|=1
Утверждение 4. Вектор /* = (/Г, /2) 6 К2 является гарантированным векторным исходом модели (13) тогда и только тогда, когда К^'Рг + 'Фг (* = 1,2),
где
<£> = (уь^), 1р = {1рит), ч> е п*, ^еФ •
Здесь Г2* — множество дележей "классической" кооперативной игры с побочными платежами без неопределенности
а.Фр = (ф — (1/>1,ф2) I {ФиФъ) = {■ф\{ур),'ф2{ур)), т= Х>.(ур)1 ■ I. ¿=1 i=l )
При этом показано, что при построении ГИРР можно гарантировать
нулевой векторный риск Ф* = (0,0).
Предлагается алгоритм построения ГИРР в моделях вида (12). Приведен также пример построения ГИРР конкретной модели с "разделенными" оценочными функциями.
В параграфе 7 найден явный вид ГИРР в одной модели рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта.
Вторая глава, названная "Динамическая линейно-квадратичная МИУС", посвящена построению ГИРР в динамической линейно-квадратичной модели МИУС, которую образует кортеж
({1,2}, g, mi=1,2, 2, mu, Z, t0, z0)}i=i,2>. (13)
В (13), как и ранее, 1 и 2 - порядковые номера ИА. Динамика управляемой системы ^ описывается линейным дифференциальным уравнением
х = A(t)x + «1 + и2 + A\{t)z + a(t), x(t0) = x0,
характеризующим изменение фазового вектора х Ç. К" с течением времени t 6 постоянные â > t0 ^ 0; (t,x) - позиция, (to,xo) - начальная
позиция; действие РА г G R'"; матрицы соответствующих размерностей Л(£), A\{t) и n-вектор a(t) непрерывны на [0, г?]; и, € К" - управляющее воздействие г-ro ИА (г — 1,2). Множество действий]! г-ro И А имеет вид И,- = {Ut -h Ui(t, х, z) = Pi{t)x + Qi{t)z + ®(t) |
VFiO) e CnxnMLQjO) e c,ixm[0,0], e c„M]}.
Действие РА Z отождествляется с m-вектор - функцией z[-\ = = {2[i],t € [t0,tf]}, являющейся решением
z = B(t)z + b(t), 2[«ol = 2o,
где m x m-матрица B(-) € Cmxm[0, д\ и m-вектор b(-) S Cm[0, •&] с начальным условием z[to] = zo € Rm. Множество Z действий РА Z получаем, когда t0 "пробегает" все значения из промежутка [0, г)), a zq - все точки из
Rm.
"Партия" в динамическом случае модели МИУС разворачивается следующим образом. ИА, действуя сообща (обмениваясь информацией) согласованно договариваются о выборе своих действий U? £ 21; (г = 1,2). В результате образуется соглашение U* = (£/*, Щ) G 21 = 21i х Я2. Независимо от этого выбора реализуется конкретное действие РА Z* € 2. При заданных соглашении и действии РА находится решение x*(t) уравнения из (13). Затем строятся реализации выбранных ИА действий и\[t] -f и*(t, x*(t), z*{t}) (i = 1,2). На четверках непрерывных вектор-функций
(i*(0. «¡н. «M. **[■]) = {z*(t),uîM,«;[i],*4f]|t e mi>
определены оценочные функции ИА, заданные квадратичными функционалами
Ji{U,Z,to,xo) = ¿{û)CiX(0) + /Щс11]гЩ+
й 2
+ ¡{Êv'MDHui M + + x'{t)Gix{t)}dt (i = 1,2),
к J=1
где использованы априори заданные постоянные симметричные п х п матрицы С,-, D,j, Gi и mxm матрицы Li, С1/''; штрих сверху означает операцию транспонирования.
В параграфе 8, аналогично подходу главы 1, определяется векторная функция риска Ф(£/, Z, t0,xo) = Z, to,x0)). С помо-
щью предложенного академиком H.H. Красовским объединения метода динамического программирования Беллмана с методом функций Ляпунова выявляются достаточные условия существования функции риска и строится ее явный вид.
Затем для модели МИУС (13) определяется понятие ГИРР.
В параграфе 9 установлены условия, при которых существует ГИРР и, при ряде предположений, найден их явный вид. Предложен алгоритм построения ГИРР для модели МИУС (13).
Наконец, в десятом параграфе для конкретного модельного примера с помощью системы Maple5 строится гарантированное по исходам и рискам решение.
В заключении сформулированы основные результаты диссертации.
1) Определено понятие гарантированного по исходам и рискам решения для информационного процесса в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных в двух случаях:
— для модели в "чистых" действиях интеллектуальных агентов;
— для модели с "информационной дискриминацией" действий РА. Выявлены свойства ГИРР, в частности, установлено их существование при обычных (в математическом программировании) ограничениях.
2) Исследованы ГИРР для линейно - квадратичного случая МИУС, для случая МИУС с "разделенными" (по соглашениям И А и действиям РА) оценочными функциями ИА. Построено ГИРР для одной модели рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта.
3) Введено понятие ГИРР в динамической линейно-квадратичной модели МИУС. Установлены "коэффициентные" условия его существования и, при выполнении таких условий, найден явный вид. Для конкретного модельного примера, с помощью системы Maple, построено ГИРР.
Публикации по теме диссертации
1. Кудрявцев К.Н. Об одной модели рынка и ее гарантированном по выигрышам и рискам решении // Вестник Южно-
5Waterloo Maple, Maple 8.0
Уральского государственного университета. Серия Математика, физика, химия. - 2006. - Выпуск 7. - №7(62). - С. 46-52.
- 0,8 п.л»
2. Кудрявцев К.Н. О существовании гарантированных по выигрышам и рискам решений в кооперативных играх при неопределенности // Системы управления и информационные технологии. - 2010. - № 1.1(39). - С. 148-152.- 0,54 п.л.
3. Кудрявцев К.Н. Об отсутствии максиминных стратегий в одной дифференциальной игре / / Вестник Южно-Уральского государственного университета. Серия Математика. Механика. Физика. - 2010. - Выпуск 3. - №30(206). - С. 13-20. - 0,9 п.л.
4. Жуковский В.И., Кудрявцев К.Н. Одна кооперативная игра с побочными платежами и учетом рисков // Spectral and evolution problems: Proceedings of the Sixteenth Crimean Autumn Mathematical School-Symposium, Vol.16. - Simferopol. 2006. - P. 142-148. - 0,4 п.л. (авторский вклад 50%).
5. Жуковский В.И., Кудрявцев К.Н. Существование гарантированного дележа в контрстратегиях // Spectral and evolution problems: Proceedings of the Seventeenth Crimean Autumn Mathematical School-Symposium, Vol.17. - Simferopol. 2007. - P. 28-31. - 0,26 п.л. (авторский вклад 50%).
6. Кудрявцев К.Н. Функции риска в одной кооперативной дифференциальной игре // Информационные технологии моделирования и управления. - 2008. - №.6 (49). - С. 665-674. - 0,6 п.л.
7. Кудрявцев К.Н. О гарантированном по выигрышам и рискам решении одной кооперативной игры // Современные информационные технологии. Сборник научных трудов. Выпуск 2. - М.: РосЗИТЛП, 2006. -С. 68-76. - 0,5 п.л.
8. Кудрявцев К.Н. О гарантированных по выигрышам и рискам решениях в некоторых кооперативных играх // Наука ЮУрГУ: материалы 61-й научной конференции. Секция естественно-научных и гуманитарных наук. Т.2. - Челябинск: Издательский центр ЮУрГУ, 2009.
- С. 149-153. - 0,24 п.л.
9. Кудрявцев К.Н. Модель рынка с учетом импорта // XIV международная конференция Математика. Экономика. Образование. Тезисы докладов. - Ростов-на-Дону. 2006. - С. 145. - 0,06 п.л.
10. Кудрявцев К.Н. О гарантированном по выигрышам и рискам решении для одной модели рынка // Международная школа-симпозиум "Анализ, моделирование, управление, развитие экономических систем АМУР-2007". - Севастополь: ТНУ, 2007. - с. 117-118. - 0,06 п.л.
11. Кудрявцев К.Н. О гарантированном по выигрышам и рискам решении одной дифференциальной игры // XVI международная конференция Математика. Экономика. Образование. Тезисы докладов. - Ростов-на-Дону: Изд-во "ЦВРР", 2008. - С. 185-186. - 0,06 п.л.
Подп. к печ. 10.05.2011 Объем 1 п.л. Зак. № 65 Тир. 100 экз.
Типография МПГУ
Оглавление автор диссертации — кандидата физико-математических наук Кудрявцев, Константин Николаевич
Введение.
Глава 1. Гарантированные исходы и риски
§1. Формализация гарантированного по исходам и рискам решения для интеллектуальных агентов
§2. Свойства
§3. Существование
§4. Распределение предварительных исходов между интеллектуальными агентами.
§5. Линейно-квадратичный случай модели (1.1)
§6. Модель с сепарабельными оценочными функциями
§7. Модель рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта
Глава 2. Динамическая линейно-квадратичная МИУС
§8. Формализация гарантированного по исходам и рискам решения
§9. Построение гарантированного по исходам и рискам решения
§10. Модельный пример
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Кудрявцев, Константин Николаевич
Одной из важнейших задач теоретических основ информатики является разработка и анализ моделей информационных процессов, в частности, в мультиагентных информационно-управляющих системах (МИУС). В диссертации для МИУС учитываются, во-первых, взаимодействие интеллектуальных агентов, выражающееся в выработке совместных действий, во-вторых, наличие двухуровневой иерархии в передаче информации.
Разработка технологии и исследование взаимодействий интеллектуальных агентов, а также создание мультиагентных систем представляет собой одну из наиболее важных областей развития новых информационных технологий. У специалистов по информационным технологиям сформировалось и вошло в широкий научный обиход представление об интеллектуальных агентах как автономных, активных, а главное мотивированных объектах "живущих" и "действующих" в сложных виртуальных средах, в частности, в информационных системах [1,4,16-19,42,100,101]. Уже сегодня агентный подход находит широкое применение в таких областях как распределенное решение сложных задач, построение виртуальных предприятий, имитационное моделирование интегрированных производственных систем. В ближайшем будущем он несомненно займет центральное место при развитии средств управления информацией и знаниями.
В теории мультиагентных систем (MAC) обычно предполагается, что отдельный агент может иметь лишь частичное представление об общей задаче и способен решить только некоторую ее подзадачу. Поэтому для решения сколько-нибудь сложной проблемы, как правило, требуется взаимодействие агентов. Этот социальный аспект решения задач - одна из фундаментальных характеристик новизны как передовых компьютерных технологий, так и искусственных (виртуальных) организаций, строящихся как MAC [5,18,67,72,74,80,82,86,93,95,99]. эН
Предыстория теории агентов связана в первую очередь с описанием" реактивных агентов в контексте проблематики искусственной жизни, которая восходит к работам У.Питтса и У.МакКаллока по формальным нейронам, Дж.фон Неймана по самовоспроизводящимся автоматам, А.Н.Колмогорова по теории сложности, У. фон Форстера по теории самоорганизации, У.Эшби по гомеостазису, Г.Уолтера по реактивным роботам, Дж.Холланда по генетическим алгоритмам. Особое место в этом ряду занимает школа коллективного поведения автоматов М.Л.Цетлина [55,56]. В работах этой школы [28,47,56] ниже кардинально использован исторический обзор из [50] впервые в мире был поставлен вопрос о возможности моделирования целесообразного поведения в стационарной среде при рассмотрении коллектива реактивных агентов минимальной сложности. Как показал М.Л.Цетлин, если среда является стационарной и вероятностной (реакции среды на действия агента выдаются с неизменным для каждого действия распределением), то для организации целесообразного взаимодействия со средой достаточно иметь в качестве агента конечный автомат определенной структуры. Расширение адаптивности агентов достигалось за счет перехода к автоматам переменной структуры. Это решение обеспечивало лишь некоторый, весьма невысокий уровень целесообразности, величина которого зависела от свойств среды.
Дальнейшее развитие этого направления связано с разработкой элементов теории локально организованных систем [48]. Подробнее о работах школы коллективного поведения в книгах [5,6]; сопоставление тенденций развития этого направления с некоторыми результатами теории MAC проведено В.Л.Стефанюком в работе [49].
В 60-е - 70-е годы сформировались еще две школы моделирования интеллектуальных агентов и их свойств - школа рефлексивного поведения В.А.Лефевра [29] и школа нормативного социального поведения Д.А.Поспелова [43,44]. В частности, было предложено описание действий (поведенческих актов) агентов фреймами поступков, представляющих собой пары взвешенных графов специального вида ("замысел - реализация"). В этой модели уже принимаются во внимание такие социальные факторы как намерения, ожидаемые оценки, нормы.
В США одним из первых ученых, предложившим распространить ментальные свойства на искусственные объекты, рассматриваемые в искуственном интеллекте (ИИ), и трактовать ментальную сферу как следствие взаимодействия между активными объектами стал М.Минский [87]. Им описан ряд механизмов возникновения интеллектуального поведения в результате конфликтов и сотрудничества между простейшими вычислительными единицами, которые он называет агентами. Каждый из этих агентов "отвечает" за то или иное ментальное свойство, причем их взаимодействие происходит спонтанно, без участия какого-либо управляющего агента.
Пожалуй, наибольшую роль в становлении распределенного искуственно-го интеллекта (РИИ) сыграли работы К.Хьюитта в области открытых систем и теории акторов [78,79]. Так в начале 70-х годов, разработав систему PLANNER, предназначенную для доказательства теорем, К.Хьюитт раскрыл важнейшую роль процессов коммуникации и управления в организации и понимании рассуждений. При этом процесс решения задачи группой экспертов был им рассмотрен как столкновение различных точек зрения.
Затем новаторские идеи К.Хьюитта получили свое развитие главным образом в области совмещенного программирования (concurrent programming) [58,84,104].
Первые практические разработки по MAC, посвященные в основном проблематике РИИ и интеллектуальных агентов, относятся к 70-м годам и связаны с именами B.Jleccepa [68,83], К.Хьюитта [79] и Д. Лената [82]. Работы В.Лессера, Ф.Хэйес-Рота, Л.Эрмана и др. с системой HEARSAY II привели к созданию архитектуры "доски объявлений" и легли в основу многих дальнейших разработок по организации коммуникации между агентами. Исследуя проблематику автоматического понимания речи, эти авторы воспользовались метафорой "доски объявлений", основываясь на простой идее, что решение любой проблемы требует заранее не запланированных обращений к специалистам (источникам знаний), когда структура управления процессом коммуникации предварительно не определена. При этом деятельность источников знаний связана с доставкой, модификацией и извлечением объектов с доски объявлений, т.е. из зоны совместной работы в базе данных, где модель предметной области структурирована как пространство гипотез и решений. Специальное управляющее устройство разрешает конфликты доступа к доске объявлений, возникающие между агентами и неявно организует их совместную работу.
Одной из важнейших работ начала 90-х годов стала статья И.Шоэма "Агентно-ориентированное программирование" [95]. В ней был описан социальный взгляд на организацию вычислений, связанный с взаимодействием агентов в процессе вычислений. При этом агент рассматривается как "прозрачный ящик" и моделируются такие его "внутренние переменные" как мотивы, убеждения, обязательства, способности к выработке и принятию решений. Мотивы агента лежат в основе его решений, а убеждения определяют логические ограничения на них.
Наконец, оригинальные методы описания реактивных агентов предложены в работах Р.Брукса [62,63] и Ж.Фербе [69,70]. Так метод „экорезолюции", предложенный Ж.Фербе, основан на решении задачи множеством агентов, которые общаются путем обмена сообщениями. Здесь решение задачи понимается как эволюция динамической системы вплоть до достижения ею устойчивых стационарных состояний. Этим стационарным состояниям отвечает удовлетворение целей различных агентов.
В настоящее время основными направлениями в разработке MAC являются РР1И и искусственная жизнь (в узком смысле этого термина) [51,69,77].
Ядро РИИ [41,45,61,65,73,80,91] составляют исследования взаимодействия и кооперации небольшого числа интеллектуальных агентов, например, классических интеллектуальных систем, включающих базы знаний и решатели. При этом, коллективное поведение образуется на основе индивидуальных интеллектуальных поведений. Здесь предполагается согласование целей, интересов и действий различных агентов, разрешение конфликтов путем переговоров. Вопросам коммуникации и кооперации агентов посвящены исследования Huhns M.N и Stephns L.M. [81], Durfee E.H. [66], Silaghi G.S. [97], Rosenshein J., Zlotkin G.[93], Smith R. [98]. Вопросам взаимодействия посвящены также работы [2,8-15,33-37,39,46,53,57,59,60,64,71,76,85-92] и др.
Под агентом понимается любая сущность, которая может воспринимать среду обитания (внешний мир) и воздействовать на нее [52]. Данное понятие объединяет как натуральных (люди, животные, коллективы людей, группы организмов), так и искусственных (сложные программы, роботы, коллективы автоматов) агентов. Естественно возникает вопрос о взаимоотношениях агентов, об их соглашениях, включающих в частности передачу друг другу части достигнутых ими исходов, наличие двухуровневой иерархии.
Предполагается, что интеллектуальным агентам известно множество действий каждого из них, а также их оценочные функции. О реактивных агентах агентам верхнего уровня известны лишь область действий последних (оценочные функции реактивных агентов им неизвестны).
В диссертации обсуждается принятие решений в мультиагентных системах, где интеллектуальные агенты, на основе имеющейся у них информации, взаимодействуют и совместно принимают решение, априорно имея возможность часть достигнутого ими предварительного исхода передать партнерам.
Используются подходы теории кооперативных игр с побочными платежами для анализа задачи перераспределения добытых агентами исходов. При этом, подчеркнем еще раз, учитывается двухуровневая информационная структура. Нижний уровень - уровень более простых, реактивных агентов, например тех, которые служат для непосредственного автоматического управления объектами автоматизации. Верхний уровень составляют интеллектуальные агенты. Процесс передачи информации происходит следующим образом: агенты нижнего уровня сообщают интеллектуальным агентам свои действия, на их основе агенты верхнего уровня формируют действия, направленные на достижения своих целей. При этом предполагается, что интеллектуальные агенты могут перераспределять между собой достигнутые исходы.
В диссертации применяется подход оптимального сочетания исходов и рисков к информационным процессам возникающим в МИУС при взаимодействии двух интеллектуальных агентов и конечного числа реактивных. В первой главе рассматривается "статический" случай задачи. Предполагается, что в рассматриваемых МИУС интеллектуальные агенты действуют совместно и согласованно, причем стремятся не только увеличить свой общий исход (сумму исходов, которую впоследствии по заранее оговоренным правилам могут перераспределить между собой),но и гарантировать себе по возможности меньшие риски. Возникновение МИУС данного вида связано с тем, что в настоящее время в большинстве экономических задач требует учитывать не только исходы интеллектуальных агентов, но и риски по этим исходам. Во второй главе диссертации исследуется динамический случай рассматриваемой задачи.
Целью работы является формализация и исследование гарантированных по исходам и рискам решений для информационных процессов в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных. При этом предполагается, что о действиях реактивных агентов известна лишь область значений, а какие-либо вероятностные характеристики отсутствуют (по тем или иным причинам).
Объектом исследования являются вопросы теории МИУС, касающиеся принятия гарантированных решений.
Предмет исследования — информационные процессы возникающие в МИУС при взаимодействии двух интеллектуальных агентов и конечного числа реактивных.
Проблема заключается в формализации понятий гарантированных по исходам и рискам решений таких задач при учете действий реактивных агентов, исследование свойств решений и способов построения.
В основу исследования положена следующая гипотеза: на основе модификации принципа гарантированного результата, понятий векторных оптиму-мов, гарантированного дележа из теории кооперативных игр можно определить возможные решения для информационных процессов в МИУС с интеллектуальными и реактивными агентами, получить условия существования и предложить способ их построения. •
Для реализации поставленной цели и проверки сформулированной гипотезы потребовалось решить следующие задачи:
- формализовать понятие гарантированного по исходам и рискам решения, исследовать свойства такого решения и условия существования;
- для динамического линейно-квадратичного случая модели информационных процессов в МИУС с интеллектуальными и реактивными агентами ввести понятие гарантированного решения, выявить "коэффициентные" условия его существования, алгоритм построения и найти явный вид;
- рассмотреть возможные приложение к конкретным экономическим задачам и линейно-квадратичному случаю.
Методологическую основу работы составляют методы и подходы теории мультиагентных систем, теории многокритериальных задач при неопределенности, теории игр, выпуклого анализа, теории матриц и квадратичных форм, дифференциальных уравнений, теории динамического- программирования.
Научная новизна. Отличие данной работы состоит в том, что в ней предложен новый подход к информационным процессам в МИУС с интеллектуальными и реактивными агентами, а именно: предлагается понятие гарантированного по исходам и рискам решения, позволяющее интеллектуальным агентам обеспечить некоторые "пороговые" исходы, и одновременно с этим некоторые "пороговые" риски. Одновременно исследован случай, когда действия интеллектуальных агентов формируются на основе "знания" о реализовавшихся действиях реактивных агентов. В обоих случаях установлены условия существования, а также предложен способ распределения между интеллектуальными агентами достигнутых ими исходов.
Для динамической линейно-квадратичной математической модели МИУС вводится понятие гарантированного по исходам и рискам решения. Установлены "коэффициентные" условия существования и, при выполнении этих условий, найден явный вид.
Практическая значимость работы. Результаты диссертации могут быть применены к решению сложных задач, построению виртуальных предприятий, имитационному моделированию интегрированных производственных систем, к построению средств управления информацией и знаниями, к различным прикладным задачам прогнозирования и планирования в экономике, экологии, механике управляемых систем. В качестве приложения исследована математическая модель рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта. Отметим также, что разработка (на основе предложенного подхода) экономико-математических моделей позволит, во-первых, дать более адекватное реальности описание процессов принятия решений, во-вторых, получить эффективные решения в сфере планирования и управления.
Основные положения, выносимые на защиту:
- формализовано понятие гарантированного по исходам и рискам решения для информационных процессов в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных, выявлены свойства и условия существования;
- построено гарантированное по исходам и рискам решение для модели рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта;
- на основе метода динамического программирования, объединенного с методом функций Ляпунова, найден явный вид гарантированного по исходам и рискам решения в динамическом линейно-квадратичном случае задачи.
Апробация. Результаты диссертации докладывались на пятнадцатой Крымской осенней математической школе-симпозиуме "Spectral and Evolutionary Problems" (Simferopol, 2005), на XIV международной конференции "Математика. Экономика. Образование" (Ростов-на-Дону, 2006), на шестнадцатой Крымской осенней математической школе-симпозиуме "Spectral and Evolutionary Problems" (Simferopol, 2006), на международной школе-симпозиуме "Анализ, моделирование, управление, развитие экономических систем АМУР-2007" (Sevastopol, 2007), на XV международной конференции "Математика. Экономика. Образование" (Ростов-на-Дону, 2008), на 61-й наг учной конференции "Наука ЮУрГУ" (Челябинск, 2009),дважды на семинаре факультета ВМиК МГУ "Риски в сложных системах управления" (Москва, 2008, 2010).
Перейдем к краткому изложению содержания диссертации. Диссертация состоит из двух глав, разбитых на десять параграфов.
В первой главе (§§1-7) вводятся гарантированные по исходам и рискам решения (ГИРР) для информационных процессов в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных.
Именно в §1 формализуется понятие ГИРР для "чистых" действий интеллектуальных агентов и для задачи с "информационной дискриминацией" реактивных агентов.
Последующий §2 посвящен исследованию свойств ГИРР.
В §3 на основе фактов из теории антагонистических игр, касающихся существования седловых точек, установлены условия существования ГИРР.
В §4 предложен возможный способ распределения достигнутых исходов интеллектуальных агентов.
Далее, в §5 для линейно - квадратичного случал задачи найдены "коэффициентные" условия существования и построено ГИРР в "чистых" действиях и при "информационной дискриминации" реактивных агентов.
В §6 рассматриваются МИУС, в которых оценочные функции интеллектуальных агентов "разделены" по соглашениям и действиям реактивных агентов.
Наконец, в §7 рассмотрена модель рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта. Для данной модели построено гарантированное по исходам и рискам решение.
Содержание второй главы (§§8-10) составляет исследование ГИРР в динамическом линейно-квадратичном случае МИУС с двумя интеллектуальными агентами и конечным числом реактивных.
В §8 строятся функции риска и формализуется понятие ГИРР для динамического случая МИУС.
Далее в §9 на основе метода динамического программирования, объединенного с методом функций Ляпунова, установлены достаточные "коэффициентные" условия существования ГИРР.
Затем в §10 с помощью системы Maple строится ГИРР для конкретного модельного примера.
Основные результаты опубликованы в работах [106 - 116].
Заключение диссертация на тему "Согласованные решения в мультиагентной информационной системе"
Заключение
В диссертации получены следующие основные результаты: 1) Определено понятие гарантированного по исходам и рискам решения для информационного процесса в МИУС со взаимодействием двух интеллектуальных агентов и конечного числа реактивных в двух случаях: для модели в "чистых" действиях интеллектуальных агентов; для модели с "информационной дискриминацией" действий РА.
Выявлены свойства ГИРР, в частности, установлено их существование при обычных (в математическом программировании) ограничениях.
2) Исследованы ГИРР для линейно - квадратичного случая МИУС, для случая МИУС с "разделенными" (по соглашениям ИА и действиям РА) оценочными функциями ИА. Построено ГИРР для одной модели рынка бесконечно делимого товара с двумя товаропроизводителями и учетом импорта.
3) Введено понятие ГИРР в динамической линейно-квадратичной модели МИУС. Установлены "коэффициентные" условия его существования и, при выполнении таких условий, найден явный вид. Для конкретного модельного примера, с помощью системы Maple, построено ГИРР.
Библиография Кудрявцев, Константин Николаевич, диссертация по теме Теоретические основы информатики
1. Адамацкий А.И., Холланд О. Роящийся интеллект: представления и алгоритмы// Информационные технологии и вычислительные системы. -1998. - №1. - С.45-53.
2. Бондарева О.Н., Вилков В.Б., Кулаковская Т.Е., Наумова Н.М., Соколина H.A. Обзор советских, работ по теории кооперативных игр // Исследование операций и статистическое моделирование. Сб. науч. тр. Ленинград: ЛГУ, 1977. Вып. 4. С. 81-126.
3. Бугайченко Д.Ю. Соловьев И.П. Абстрактная архитектура интеллектуального агента и методы ее реализации // системное программирование. 2005. №1. С. 36-67
4. Варшавский В.А., Поспелов Д.А. Оркестр играет без дирижера. Размышления об эволюции некоторых технических систем и управлении ими. М.: Наука, 1984.
5. Варшавский В.И. Коллективное поведение автоматов. М.: Наука, 1973.
6. Васин A.A., Морозов В.В. Теория игр и модели математической экономики. М.: МАКС Пресс, 2005. 271 с.
7. Венцель Е.С. Исследование операций. М.:3нание, 1976. 64 с.
8. Воробьев H.H. Основы теории игр. Бескоалиционные игры. М.: Наука,1984. 495 с.
9. Воробьев H.H. Современное состояние теории игр // Успехи матем. наук. 1970. №25, вып.2. С.81-140.
10. Воробьев H.H. Теория игр для экономистов-кибернетиков. М.: Наука,1985. 271 с.
11. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976. 354 с.
12. Гермейер Ю.Б. Введение в теорию исследования операций. М.: Наука, 1971. 383 с.
13. Горелик В.А., Горелов М.А., Кононенко А.Ф. Анализ конфликтных ситуаций в системах управления. М.: Радио и связь, 1991. 228 с.
14. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. М.: Радио и связь, 1982. 145 с.
15. Городецкий В.И. Многоагентные системы: основные свойства и модели координации поведения// Информационные технологии и вычислительные системы. 1998. - №1. - С.22-34.
16. Городецкий В.И5. Многоагентные системы: современное состояние исследований и перспективы применения// Новости искусственного интеллекта. 1996. - т. - С.44-59.
17. Городецкий В.И., Грушинский М.С., Хабалов A.B. Многоагентные системы (обзор)// Новости искусственного интеллекта. —1998. №2. —
18. Емельянов В.В. Многоагентная модель децентрализованного управления производственными системами // Информационные технологии и вычислительные системы. 1998. - №1. - С.69-77.
19. Жуковский В.И. Введение в дифференциальные игры при неопределенности. М.: Международный НИИ проблем управления, 1997. 461 с.
20. Жуковский В.И. Конфликты и риски. М.: РосЗИТЛП, 2007. 456 с.
21. Жуковский В.И. Кооперативные игры при неопределенности и их приложения. М.: Эдиториал УРСС, 1999. 340 с.
22. Жуковский В.И., Жуковская JI.B. Риск в многокритериальных и конфликтных системах при неопределенности. М.: Едиториал УРСС, 2004. 272с.
23. Жуковский В.И., Салуквадзе М.Е. Риски и исходы в многокритериальных задачах управления. Москва-Тбилисси: Интелекти, 2004. 358с.
24. Жуковский В.И., Чикрий A.A. Линейно—квадратичные дифференциальные игры. Киев: Наукова Думка, 1994. 320 с.
25. Красовский H.H. Управление динамической системой. М.: Наука, 1985. 520 с.
26. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 455 с.
27. Крылов В.Ю., Цетлин M.JI. Об играх автоматов// Автоматика и телемеханика-1963 Т.24, №7. - С.975
28. Лефевр В.А. Конфликтующие структуры. М.: Сов.Радио, 1973.
29. Люстерник Л.А., Соболев В.И. Элементы функционального анализа. М.: Наука, 1969. 312с.
30. Макаров В.А., Рубинов A.M. Математическая теория экономической динамики. М.: Наука, 1973. 212 с.
31. Макконнелл K.P., Брю С.Л. Экономикс. Принципы, проблемы и политика. М.: ИНФРА-М, 2003. 983 с.
32. Морозов В.В., Сухарев А.Г., Федоров В.В. Исследование операций в задачах и упражнениях. М.: Высш. шк., 1986. 287 с.
33. Мулен Э. Кооперативное принятие решений: Аксиомы и модели. М.: Мир, 1991. 464 с.
34. Нейман Дж., Моргенштерн ©¿. Теория игр и экономическое поведение. М.: Наука, 1970. 708 с.
35. Петросяхг Л.А., Данилов Н1Н. Кооперативные дифференциальные игры и их приложения. Томск: Томский ун-тет, 1985. 362 с.
36. Петросян Л. А., Захаров-В.В. Математические модели в экологии. Санкт-Петербург: СПбГУ, 1997. 254 с.
37. Подиновский В.В., Ногин В .Д. Парето-оптимальныс решения многокритериальных задач. М.: Наука, 1982. 254 с.
38. Полторович В.М. Кризис экономической теории: Труды семинара "неизвестная экономика". Отделение экономики РАН. М.: ЦЭМИ РАН, 1997.
39. Понтрягин JI.C. Обыкновенные дифференциальные уравнения. М.: Наука, 1961. 212 с.
40. Поспелов Г.С. Искуственный интеллект основа новой информационной технологии.- М.: Наука, 1988.
41. Поспелов Д.А. От коллектива автоматов к мультиагентным системам // Труды Международного семинара «Распределенный искусственный интеллект и многоагентные системы» (DAIMAS'97, Санкт-Петербург, Россия, 15-18 июня 1997). С:319-325.
42. Поспелов Д.А., Пушкин В.Н. Мышление и автоматы. М.: Сов. Радио, 1972.
43. Поспелов Д.А., Шустер В.А. Нормативное поведение в мире людей и машин.-Кишинев: Штиинца, 1990.
44. Пэранек Г.В. Распределенный искусственный интеллект// Искусственный интеллект: применение в интегрированных производственных системах/ Под. ред. Э.Кьюсиака. М.: Машиностроение, 1991.-С.238-267.
45. Соболев А.И. Кооперативные игры // Проблемы кибернетики, 1982. Вып. 39. С. 201-222.
46. Стефанюк B.J1. Пример коллективного поведения двух автоматов// Автоматика и телемеханика.- 1963. Т.24, №6. - С.781-784.
47. Стефанюк B.JI. Анализ целесообразности локально организованных систем методом потоков вероятностей// Модели систем обработки данных. -М.: Наука, 1989. С.33-45.
48. Стефанюк В.Л. От миогоагентных систем к коллективному поведению// Труды Международного семинара «Распределенный искусственныйинтеллект и многоагентные системы» (DAIMAS'97, Санкт-Петербург, Россия, 15-18 июня 1997). С.327-338.
49. Тарасов В.Б. Агенты, многоагентные системы, виртуальные сообщества: стратегическое направление в информатике и искусственном интеллекте //Новости искусственного интеллекта. 1998.№2. С. 5-64.
50. Тарасов В.Б. Эволюционная семиотика и нечеткие многоагентные системы основные теоретические подходы к построению интеллектуальных организаций// Информационные технологии и вычислительные системы. -1998. - Ш. - С.54-68.
51. Теряев Е.Д., Петрин К.В., Филимонов А.Б., Филимонов Н.Б. Агентные технологии в автоматизированных информационно-управляющих системах. // Мехатроника, автоматизация, управление. 2010. №7. С. 11-21.
52. Ухоботов В.И. Непрерывная игра в пространстве с неполной линейной структурой // Теория и системы управления. 1997. № 2. С. 107 — 109.
53. Цветкова Е.В., Арлюкова И.О. Риски в экономической деятельности. Санкт-Петербург: СПбИВЭСЭП, 2002. 64 с.
54. Цетлин M.JI. Р1сследования по теории автоматов и моделированию биологических систем.— М.: Наука, 1969.
55. Цетлин М. JI. О поведении конечных автоматов в случайных средах// Автоматика и телемеханика. 1961. - Т.22, №10. - С. 1345-1354.
56. Ширяев В.И. Математика финансов. Опционы и риски, вероятности, гарантии и хаос. М.: Книжный дом "Либроком". 2009. 200 с.
57. Agha G. Actors: a Model of Concurrent Computation for Distributed Systems. Cambridge MA: MIT Press, 1986.
58. Basar T. On the uniqueness of the Nash solution in linear-quadratic differential games // Int. J. Game Theory. 1976. Vol 5, N 2-3. P. 996-999.
59. Basar Т., Olsder G.J. Dynamic Noncooperative Game Theory. London: Academic Press, 1982.
60. Bond A., Gasser L. Readings in Distributed Artificial Intelligence. New York: Morgan Kaufman, 1988.
61. Brooks R. Intelligence Without Representation // Artificial Intelligence. 1991. - Vol.47. - P.139-159.
62. Brooks R. Robust Layered Control System for a Mobile Robot// IEEE Journal of Robotics and Automation. 1986. - Vol.2, Ш. - P.14-23.
63. Dadan N., Volij O. Bilateral Comparisons and Consistent fair Division Rules in the Context of Bankruptcy Problems. Hebrew University of Jerusalem, mimeo, February, 1994.
64. Durfee E.H. Coordination in Distributed Problem Solvers. Boston MA: Kluver Academic Publishers, 1988.
65. Durfee E.H. Distributed Problem Solving and Planning // Mutiagent Systems. -2001. P. 121-165.
66. Epstein J., Axtell R. Growing Artificial Societies: Social Science from the Bottom Up. Cambridge MA: MIT Press, 1996.
67. Erman L., Hayes-Roth F., Lesser V., Reddy D. The HEARSAY-II Speech Understanding System: Integrating Knowledge to Resolve Uncertainty// ACM Computers Surveys, vol.12, 1980.
68. Ferber J. Les systemes multi-agents. Vers une intelligence collective. -Paris: InterEditions, 1995.
69. Ferber J., Jacopin E. The Framework of Eco-Problem Solving// Decentralized Artificial Intelligence II / Ed. by Y.Demazeau, J.-P.Muller. -Amsterdam: Elsevier North-Holland, 1991.
70. Ferro F. Minimax theorem for vector—valued functions//J. Optimiz. Theory and Appl. 1989. 60. P. 19-31.
71. Fisher K., Muller J.-P., Heimig I., Scheer A.-W. Intelligent Agents in Virtual Enterprises// Proc. of the First International Conference on the Practical Applications of Intelligent Agents and Multi-Agent Technology (London, UK). -P.205-224.
72. Gasser L. An overview of DAI// Distributed Artificial Intelligence: Theory and Praxis/ Ed. by L.Gasser and N.M.Avouris. Amsterdam: Kluwer Academic Publishers, 1992.
73. Gasser L. Social Conceptions of Knowledge and Action: DAI Foundations and Open Systems Semantics // Artificial Intelligence. -1991. -Vol.47, №1-3. -P. 107-138.
74. Geoffrion A.M. Proper efficiency and the theory of vector maximization // J. Math. Anal, and Appl. 1968. V. 22, N 3. P. 618-630.
75. Herrero C., Maschler M., Villar A. Personal Rights and Collective Ownership: the Rights-Egalitarian Solusion. University of Alicante, mimeo. 1995.
76. Heudin J.-C. La vie artificielle. Paris: Hermes, 1994.
77. Hewitt C. Open Information Systems Semantics for Distributed Artificial Intelligence// Artificial Intelligence. 1991. - Vol.47, №1-3. - P.79-106.
78. Hewitt C. Viewing Control Structures as Patterns of Message Passing // Artificial Intelligence-1977.- Vol.8, №3. P.323-364.
79. Huhns M.N. Distributed Artificial Intelligence. London: Pitman, 1987.
80. Huhns M.N., Stephens L.M. Multiagent Systems and Societies of Agents // Mutiagent Systems. -2001. P. 79-121.
81. Lenat D. BEINGS: Knowledge as Interacting Experts// Proc. of the 1975 IJCAI Conference, 1975. P.126-133.
82. Lesser V., Corkill D. The Distributed Vehicle Monitoring Testbed: a Tool for Investigating Distributed Problem Solving Networks// AI Magazine.1983. Vol.4, №3. - P.15-33.
83. Maruichi,T., Ichikawa M., Tokoro M. Modeling Autonomous Agents and Their Groups// Decentralized AI/ Ed. by Y.Demazeau and J.-P.Muller. -Amsterdam: Elsevier North-Holland, 1990.
84. Mas-Colell A., Whinston^ M., Green G. Microeconomie Theory. Oxford: University Press. 1995.
85. Meyer J.A., Wilson S. Simulation of Adaptive Behavior: from Animals to Animats. Cambridge MA: MIT Press, 1991.
86. Minsky M. The Society of Mind. NewYork: Simon and Shuster, 1986.
87. Moulin H. Cooperative Microeconomics: a Game Theoretic Introduction. Princeton University Press and Prentice-Hall. 1995.
88. Neumann J. Zur Theorie der Gesellshaftsspiele // Math. Ann. 1928. Bd. 100. S. 295-320.
89. Ordeshook P. Game Theory and Political Theory: An Introduction. Cambridge University Press. 1986.
90. Rasmussen J., Brehmer В., Leplat J. Distributed Decision-Making. Cognitive Models-for Cooperative Work. New York: J.Wiley and Sons, 1991.
91. Rawis J. Theory of Justice. Harvard University Press, 1971. (Русский перевод: Дж. Ролз. Теория справедливости. Новосибирск: Изд-во НГУ, 1995.)
92. Rosenshein J., Zlotkin G. Rules of Encounter: Designing Conventions for Automated Négociation Among Computers. Cambridge MA: MIT Press, 1994.
93. Savage L. Y. The theory of statistical decusion //J. American Statistic Association, 1951. №46, P55-67.
94. Shoham Y. Agent Oriented Programming// Artificial Intelligence. 1993. -Vol.60, №1.-P.51-92.
95. Shubik M. Game Theory in the Social Scinces. Princeton University Press,1984.
96. Silaghi G.S. Coalition Formation Tools for Achieving Collaboration inside Agent Societis // Economy Informatics Journal vol VI. №1 -2006. P. 25-38
97. Smith R.G. The Contract Net Protocol: High Level Communication and Control in a Distrubuted Problem Solver // IEEE Transactions on Computers. -1980. Vol.29, №12. - P.1104-1113.
98. Tarassov V.B. Artificial Meta-Intelligence: a Key to Enterprise
99. Reengineering// Proc. of the Second Joint Conference on Knowledge-Based Software Engineering (JCKBSE'96) (Sozopol, Bulgaria, September 21-22, 1996). Sofia: BAIA, 1996. - P. 15-24.
100. Winograd Т., Flores F. Understanding Computers and Cognition: a New Foundation for Design. Norwood: Ablex, 1986.
101. Wooldridge M., Jennings N. Intelligent Agents: Theory and Practice// The Knowledge Engineering Review. 1995: - Vol.10, №2. - P.115-152.
102. Wooldridge M:, Jennings- N. Towards a Theory of Cooperative Problem Solving// (MAAMAW'94, Odense, Danemark)/ Ed. by Y.Demazeau, J.-P.Muller and J.Perram, 1994.
103. Yonezawa A ABCL: an Object-Oriented Concurrent System. -Cambridge MA: MIT Press, 1990.
104. Zhukovskiy V.I., Salukvadze M.E. The vector—valued maximin. New York etc.: Academic Press, 1994. 404 p.
105. Жуковский В.И., Кудрявцев К.Н. Одна кооперативная игра с побочными платежами и учетом рисков // Spectral and evolution problems: Proceedings of the Sixteenth Crimean Autumn Mathematical School-Symposium, Vol.16, Simferopol. 2006. P. 142 148.
106. Жуковский В.И., Кудрявцев К.Н. Существование гарантированного дележа в контрстратегиях // Spectral and evolution problems: Proceedings of the Seventeenth Crimean Autumn Mathematical School-Symposium, Vol.17, Simferopol. 2007. P. 28 31.
107. Кудрявцев К.Н. Модель рынка с учетом импорта // XIV международная конференция Математика. Экономика. Образование. Тезисы докладов. Ростов-на-Дону. 2006. С. 145.
108. Кудрявцев К.Н. Об одной модели рынка и ее гарантированном по выигрышам и рискам решении // Вестник ЮУрГУ. Серия: Математика, Физика, Химия. Выпуск 7. №7(62). 2006. С. 46-52.
109. Кудрявцев К.Н. О гарантированном по выигрышам и рискам решении одной кооперативной игры // Современные информационные технологии. Сборник научных трудов. Выпуск 2. М:. РосЗИТЛП. 2006г. С. 68-76.
110. Кудрявцев К.Н. О гарантированном по выигрышам и рискам решении для одной модели рынка // Международная школа-симпозиум "Анализ, моделирование, управление, развитие экономических систем АМУР-2007",
111. Украина, Севастополь: ТНУ, 2007. с. 117-118.
112. Кудрявцев К.Н. О гарантированном по выигрышам и рискам решении одной дифференциальной игры // XVI международная конференция Математика. Экономика. Образование. Тезисы докладов. Ростов-на-Дону: Изд-во "ЦВРР". 2008. С. 185-186.
113. Кудрявцев К.Н. Функции риска в одной кооперативной дифференциальной игре // Информационные технологии моделирования и управления. №.6 (49). 2008. С. 665 674.
114. Кудрявцев К.Н. О существовании гарантированных по выигрышам и рискам решений в кооперативных играх: при неопределенности // Системы управления и информационные технологии. 2010. 1.1(39). С. 148-152.
115. Кудрявцев К.Н. Об отсутствии макиминных стратегий в одной дифференциальной игре // Вестник ЮурГУ. Серия: Математика. Механика. Физика. Выпуск 3. №30(206). 2010. С. 13-20.Р
-
Похожие работы
- Методы и программные средства анализа мультиагентных систем на основе нечетких когнитивных и игровых моделей
- Разработка методов и алгоритмов мультиагентного поиска релевантной информации в информационных средах гипертекстовой организации
- Система управления коллективом мобильных роботов
- Математическое и программное обеспечение управления процессом согласования интересов исполнителей работ по проекту в области информационных технологий
- Система оперативного распределения ресурсов при управлении проектами создания и эксплуатации образцов новой техники и ее применение на предприятии аэрокосмической отрасли
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность