автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Теоретико-игровые модели информационного управления в активных системах
Автореферат диссертации по теме "Теоретико-игровые модели информационного управления в активных системах"
РОССИЙСКАЯ АКАДЕМИЯ НАУК Институт проблем управления им. В.А. Трапезникова
519.6
На правах рукописи
ЧХАРТИШВИЛИ АЛЕКСАНДР ГЕДЕВАНОВИЧ
ТЕОРЕТИКО-ИГРОВЫЕ МОДЕЛИ ИНФОРМАЦИОННОГО УПРАВЛЕНИЯ В АКТИВНЫХ СИСТЕМАХ
Специальность: 05.13.01 - «Системный анализ, управление и обработка информации (в отраслях информатики, вычислительной техники и автоматизации)»
АВТОРЕФЕРАТ диссертации на соискание ученой степени доктора физико-математических наук
Москва - 2005
Работа выполнена в Институте проблем управления им. В.А Трапезникова РАН
Научный консультант - доктор технических наук,
профессор Д. А. Новиков
Официальные оппоненты - доктор физико-математических наук,
профессор А.В. Назин
Ведущая организация - Институт системного анализа РАН
Защита состоится 23 июня 2005 г. в 14 час. на заседании Диссертационного Совета Д 002.226.02 Института проблем управления им. В.А. Трапезникова РАН: 117997, Москва, ул. Профсоюзная, 65.
С диссертацией можно ознакомиться в библиотеке Института проблем управления им. В.А. Трапезникова РАН.
- доктор физико-математических наук, профессор А.Ф. Кононенко
- доктор физико-математических наук, профессор Л.Н. Столяров
Автореферат разослан
2005 г.
Ученый секретарь Диссер------------- п----
кандидат технических нау
В.Н. Лебедев
IV о в
Общая характеристика работы
Актуальность темы. Задача управления активной системой (элементы которой способны к целенаправленному поведению) с теоретико-игровой точки зрения состоит в том, чтобы создать для управляемых субъектов (агентов) игру с такими правилами, чтобы ее исход был как можно более благоприятным для управляющего органа (центра). Поэтому необходимыми этапами решения задачи управления являются теоретико-игровой анализ, позволяющий центру спрогнозировать реакцию управляемой системы на те или иные управляющие воздействия, и синтез оптимального управления.
Теоретико-игровые модели управления активными системами исследовались в работах многих отечественных и зарубежных авторов, среди которых: В.Н. Бурков, A.A. Васин, Ю.Б. Гермейер, В.А. Горелик, Ф.И. Ерешко, В.А. Ириков, В.В. Кондратьев, А.Ф. Кононенко, Н.С. Кукушкин, В.В. Кульба, В.А. Лефевр, H.H. Моисеев, Д.А. Новиков, Т.А. Таран, R. Aumann, J. Geanakoplos, J. Harsanyi, N. Howard, E. Maskin, H. Moulin, R. Myerson, J. Sakovics и другие.
Предметом настоящей работы является информационное управление, т.е. воздействие на информированность агентов, осуществляемое центром с целью побуждения их к совершению требуемых для него действий.
Традиционно, начиная с Дж. фон Неймана и Дж. Нэша, в теории игр предполагалось, что все существенные параметры являются общим знанием среди игроков (т.е. известны всем игрокам, всем игрокам известно, что всем это известно и т.д. до бесконечности). В 1968 г. Дж. Харшаньи (J. Harsanyi) ввел в рассмотрение байесовы игры, в которых информированность агентов не является общим знанием. В байесовых играх вся частная (т.е. не являющаяся общим знанием) информация, имеющаяся у агента на момент выбора им своего действия, называется типом агента. При этом каждый агент, зная свой тип, имеет и предположения о типах остальных агентов в виде вероятностного распределения. Это вероятностное распределение, в свою очередь, само является общим знанием.
В конце 1960-х - начале 1970-х гг. в работах В.Н. Буркова, А.Ф. Кононенко, Р. Майерсона, Э. Маскина и других авторов исследовались игры с сообщением информации. Более информированный игрок передает сообщение менее информированному, и последний на основании этого сообщения выбирает свое действие. Здесь важную
роль играет выявление условий, при которых сообщение является правдивым (так называемые «механизмы честной игры» в активных системах).
В 1985 г. Мертенсом (J.-F. Mertens) и Замиром (S. Zamir) в рамках вероятностной информированности (представления агентов включают в себя следующие компоненты: вероятностное распределение на множестве состояний природы; вероятностное распределение на множестве состояний природы и распределениях на множестве состояний природы, характеризующих представления остальных агентов, и т. д.) было построено универсальное пространство возможных взаимных представлений (universal beliefs space). При этом игра формально сводится к некоей «универсальной» байесовой игре, в которой типом агента является вся его совокупность представлений, представлений о представлениях и т.д. Однако предложенная Мертенсом и Замиром конструкция настолько громоздка, что найти решение «универсальной» байесовой игры в общем случае, по-видимому, невозможно.
Таким образом, актуальной является проблема разработки и исследования теоретико-игровых моделей управления в условиях нетривиальной информированности («конечной» иерархии взаимных представлений агентов), занимающей «промежуточное» место между общим знанием (и моделью Харшаньи), с одной стороны, и моделью Мертенса-Замира с другой.
Целью работы является разработка и исследование теоретико-игровых моделей эффективного информационного управления в активных системах.
Реализация поставленной цели предполагает решение следующих задач:
-общая постановка задачи информационного управления в теоретико-игровой ситуации при наличии нескольких агентов с несовпадающими интересами и различной информированностью;
-описание информированности агентов, включающей их взаимные представления об информированности друг друга (информационную рефлексию); исследование различных вариантов взаимной информированности;
-описание и классификация методов информационного воздействия на агентов;
- разработка теоретико-игровой модели принятия агентами решений на основе их субъективной информированности и решение задачи информационного управления; 4 - .....
- исследование стабильности возникающей в результате осуществления информационного управления теоретико-игровой ситуации с учетом того, что представления агентов могут быть ложными;
-выявление зависимости между рангом информационной рефлексии агентов и возможностями управляющего органа по осуществлению информационного управления;
-разработка комплекса прикладных теоретико-игровых моделей информационного управления в активных системах.
Основным методом исследования является математическое моделирование, базирующееся на использовании аппарата современной теории управления, в частности - системного анализа, теории игр и теории активных систем.
Научная новизна работы состоит в обосновании единого методологического подхода к разработке и исследованию теоретико-игровых моделей информационного управления в активных системах, заключающегося в общности их описания и техники исследования и использующего концепцию информационного равновесия как решения рефлексивной игры управляемых субъектов.
На основе предложенного подхода:
1. Сформулирована общая теоретико-игровая модель информационного управления как целенаправленного формирования у агентов информированности, предопределяющей желательные для центра действия. Разработана концепция информационной структуры: определены и исследованы адекватность, взаимность, одинаковость информированности агентов, а также глубина и сложность информационной структуры.
2. Предложена концепция рефлексивной игры и информационного равновесия, являющегося обобщением равновесия Нэша в некооперативных играх: сформулированы и доказаны достаточные условия существования информационного равновесия. Исследованы условия, при выполнении которых информационное равновесие является стабильным, т.е. когда агенты не меняют своих представлений в результате наблюдения результатов игры.
3. Описаны, классифицированы и исследованы способы осуществления центром информационного воздействия на агентов с целью формирования той или иной структуры информированности - информационное регулирование, рефлексивное управление и активный прогноз.
4. На основании анализа рефлексивных отображений сформулированы условия того, что требуемый управляющему органу результат
рефлексивной игры достигается посредством формирования структуры информированности управляемых субъектов, соответствующей не более чем второму рангу их рефлексии.
5. Введено и исследовано свойство рефлексивной неманипули-руемости механизмов планирования, заключающееся в существовании подструктур информированности, побуждающих агентов сообщать центру достоверную информацию. Описана и исследована рефлексивная игра поиска подвижного объекта на плоскости, сформулирован и решен ряд задач информационного управления в области корпоративного управления, экономики, маркетинга, политики.
Практическая ценность работы определяется разработанными автором методическими рекомендациями по построению комплекса эффективных прикладных механизмов информационного управления. Разработанные модели и методы информационного управления дают возможность значительно расширить рамки применения теории игр в управлении реальными активными системами, повысить эффективность управления ими.
Общность использованного подхода к разработке и исследованию моделей информационного управления позволяет распространить полученные в диссертационном исследовании теоретические и прикладные результаты на широкий круг активных систем и может служить основой переноса результатов решения практических задач из одних областей в другие.
Исследования по теме диссертационной работы проводились в соответствии с планами научных исследований Института проблем управления им. В.А. Трапезникова РАН в рамках координационных планов научных исследований РАН.
Апробация работы. Основные результаты докладывались и обсуждались на конференциях и симпозиумах «Лобачевский и современная геометрия» (Казань, 1992), «Понтрягинские чтения-ГУ» (Воронеж, 1993), «Когнитивное моделирование переговорного процесса» (Москва, 1997), «Функциональные пространства. Дифференциальные операторы. Проблемы математического образования. Международная конференция, посвященная 75-летию Л.Д. Кудрявцева» (Москва, 1998), «Инвариантные методы исследования на многообразиях структур геометрии, анализа и математической физики. Международная конференция, посвященная 90-летию со дня рождения Г.Ф. Лаптева» (Москва, 1999), «Современные сложные системы управления» (Липецк, 2002; Старый Оскол, 2002; Воронеж, 2003; Тверь, 2004), «Когнитивный анализ и управление развитием ситуаций» (Москва, 2002,
2003, 2004), «Проблемы управления безопасностью сложных систем» (Москва, 2002, 2003, 2004), «Теория активных систем» (Москва, 2003), «Рефлексивные процессы и управление» (Москва, 2003), «Вторая международная конференция по проблемам управления» (Москва, 2003), «Нелинейная динамика процессов и систем» (Липецк, 2003), «Идентификация систем и задачи управления» (Москва, 2003), «Математическое моделирование социальной и экономической динамики» (Москва, 2004), семинарах Московского государственного университета, Института проблем управления РАН, Российской экономической школы, Московского физико-технического института, Центрального экономико-математического института РАН и ряде других конференций и семинаров.
Публикации. По теме работы опубликовано 70 научных работ общим объемом более 90 печатных листов. В том числе: монографии «Теоретико-игровые модели информационного управления», «Рефлексивные игры», «Активный прогноз», «Прикладные модели информационного управления» и учебники для вузов «Математические методы в управлении» и «Математические методы и модели в управлении», а также 16 статей в ведущих рецензируемых научных журналах, рекомендованных ВАК.
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и списка литературы. Работа содержит 256 страниц текста, список использованной литературы включает 207 наименований.
Содержание работы
Во введении обоснована актуальность темы диссертационной работы, определены цель и задачи исследования, охарактеризованы используемые методы, описана структура работы и краткое содержание ее разделов.
Первая глава посвяшена обсуждению общей проблематики информационного управления в активных системах. В разделе 1.1 дан краткий обзор роли теоретико-игрового моделирования в экономике и управлении.
В разделе 1.2 описана модель рационального поведения в индивидуальном принятии решений. Пусть принимающий решение агент должен выбрать некоторое действие х из множества X допустимых действий. В результате выбора действия х е X агент получает выигрыш Ах), где /: - действительнозначная целевая функция,
отражающая предпочтения агента. В соответствии с гипотезой рационального поведения предполагается, что агент с учетом всей имеющейся у него информации выбирает действия, которые наиболее предпочтительны с точки зрения значений его целевой функции, т.е. на которых достигается максимум целевой функции.
В разделе 1.3 описана модель интерактивного принятии решений. В случае, когда агентов несколько, необходимо учитывать их взаимное влияние: в этом случае возникает игра - взаимодействие, в котором выигрыш каждого агента зависит как от его собственного действия, так и от действий других агентов. Если в силу гипотезы рационального поведения каждый из агентов стремится выбором действия максимизировать свою целевую функцию, то в случае нескольких агентов индивидуально рациональное действие каждого из них зависит от действий других агентов.
Рассмотрим теоретико-игровую модель взаимодействия между п агентами. Каждый агент осуществляет выбор действия х„ принадлежащего допустимому множеству Х„ I е М, где N = {1,2, «} -множество агентов. Выбор действий агентами осуществляется однократно, одновременно и независимо.
Выигрыш г'-го агента зависит от его собственного действия х, е Х„ от вектора действий оппонентов
Х-, - (хь х2> х>-\, Хн1,...,хп) е X., = X;
и от состояния природы в е П и описывается действительнозначной функцией выигрыша /,-/,{в, х), где
л: = (х„ х.,) = (хь х2, ..., х„) е X" = {"[ Х}
J€N
- вектор действий всех агентов. Состояние природы может быть, в том числе, вектором, компоненты которого отражают индивидуальные характеристики (типы) агентов. При фиксированном значении состояния природы в совокупность Г = (Ы, {X,}, е № {/,()}, е л>) множества агентов, множеств их допустимых действий и целевых функций называется игрой в нормальной форме.
Существуют различные концепции решения игры, среди которых наиболее распространенной является концепция равновесия Нэша. Равновесие Нэша - это ситуация, в которой каждый агент выбирает наилучшее для себя действие при фиксированных действиях остальных (или, иначе говоря, от которой каждому агенту невыгодно откло-
няться в одиночку). Более строго: вектор действий (х*,...,х*п) называется равновесным по Нэшу, если
V/еN х, е Ащтах /1{в,х\,...,х]^,х1,х1+у..,х'п).
В этом определении существенным является тот факт, что конкретное значение в является общим знанием среди участников игры. Термин «общее знание» (common knowledge) был введен Д. Льюисом (D.Lewis) в 1969г. для обозначения факта, удовлетворяющего следующим требованиям:
1) о нем известно всем агентам;
2) всем агентам известно 1;
3) всем агентам известно 2 и т.д. до бесконечности. Формальная модель общего знания предложена Р. Ауманом (R. Aumann) в 1976 г. и получила развитие во множестве работ (в основном зарубежных исследователей). До этого наличие общего знания в теоретико-игровых построениях предполагалось неявно. Отметим, что многие авторы и сейчас считают возможным обходиться без этого термина, считая кортеж Г «по умолчанию» общим знанием среди участников игры.
Качественно, общее знание необходимо для того, чтобы каждый из агентов мог промоделировать принципы принятия решений другими агентами, в том числе учитывающими его собственные принципы принятия решений и т.д. Реализуемость равновесия Нэша подразумевает возможность агентов (и управляющего органа - центра, или исследователя операций, если они обладают соответствующей информацией) априори и независимо рассчитать равновесие Нэша, и в од-ношаговой игре сразу выбрать равновесные по Нэшу действия (при этом отдельный вопрос заключается в том, какое из равновесий выберут агенты и центр, если равновесий несколько).
В разделе 1.4 приводится классификация управлений активными системами. Предметом рассмотрения в диссертационной работе является информационное управление, то есть управление информированностью участников активной системы, осуществляемое с целью добиться требуемого их поведения как равновесия соответствующей игры.
Сделаем важное терминологическое замечание. Под информационным управлением иногда понимают информационное воздействие -сообщение определенной информации. Мы же рассматриваем «информацию» как объект управления (а не как средство управления), то
есть исходим из того, что центр может сформировать у агентов ту или иную структуру информированности (из некоторого множества структур), и исследуем, что в результате этого получается. За рамками наших рассмотрений остается вопрос о том, как именно центру следует формировать у агентов эту структуру.
В разделе 1.5 приведена общая постановка задачи информационного управления. Предлагаемая модель представлена на рис. 1.
Модель включает в себя агента (агентов) и управляющий орган -центр. Каждый агент характеризуется циклом «информированность агента —> действие агента -» наблюдаемый агентом результат —> информированность агента», и у разных агентов эти три компоненты цикла являются, вообще говоря, различными. В то же время (и это отражает надпись «Агент(ы)» на рис. 1), можно считать этот цикл общим для всей управляемой подсистемы, т.е. для всего набора агентов.
Рис. 1. Модель информационного управления
Что касается взаимодействия агента (агентов) и центра, то оно характеризуется:
■ информационным воздействием центра, формирующим ту или иную информированность агента (агентов);
■ реальным результатом действия агента (агентов), который оказывает влияние на интересы центра.
Далее, в главах 2-5, исследованы различные компоненты представленной модели. Компонента «информированность агента -» действие агента» исследована в главе 2. Компонента «действие агента —» наблюдаемый агентом результат -» информированность агента» исследована в главе 3. Компонента «центр -» информированность агента» исследована в главе 4. Наконец, компонента «информированность агента —> действие агента —> центр» исследована в главе 5.
Введение общей модели информационного управления позволило систематически перечислить задачи диссертационного исследования (см. выше). Главы 2-5 посвящены решению теоретических задач, глава 6 - прикладных.
Вторая глава содержит исследование информационной структуры игры, а также информационного равновесия - результата взаимодействия агентов.
Раздел 2.1 содержит определение рефлексивной игры. Рассмотрим множество jV = {1,2, .., п} агентов. Если в ситуации присутствует неопределенный параметр (9е Q (будем считать, что множество С2 является общим знанием), то структура информированности I, (как синоним будем употреблять термины информационная структура и иерархия представлений) /-го агента включает в себя следующие элементы. Во-первых, представление /-го агента о параметре в — обозначим его в„ 9, е О.. Во-вторых, представления /-го агента о представлениях других агентов о параметре в - обозначим их в,р 9V е Q, j е N. В-третьих, представления /-го агента о представлении j-то агента о представлении k-то агента - обозначим их 9ф 9ф е Г\j, к е N. И так далее.
Таким образом, структура информированности I, /-го агента задается набором всевозможных значений вида 6lh h, где I пробегает
множество целых неотрицательных чисел, ji, ...,ji е N, а вщ h е Q.
Аналогично задается структура информированности I игры в целом - набором значений h , где / пробегает множество целых
неотрицательных чисел, jt, ...,ji е N, а в h е П. Подчеркнем, что
структура информированности / «недоступна» наблюдению агентов, каждому из которых известна лишь некоторая ее часть (а именно — /,).
Таким образом, структура информированности - бесконечное п-дерево (то есть тип структуры постоянен и является н-деревом), вершинам которого соответствует конкретная информированность агентов.
Рефлексивной игрой Г/ назовем игру, описываемую следующим кортежем: Г/ = {./V, (X,), е ^/,{■), где N - множество реальных
агентов, X, - множество допустимых действий /-го агента, /(■): О х X" 1 - его целевая функция, г е Л^, П - множество возможных значений неопределенного параметра, I - структура информированности. Отметим, что сам термин «рефлексивная игра» был введен В.А. Лефевром в 1965 году, однако формальной модели и решения этой игры предложено не было.
Рефлексивная игра является обобщением понятия игры в нормальной форме, задаваемой кортежем {Ы, (X,), с №/,(■), с л-}, на случай, когда информированность агентов отражена иерархией их представлений (информационной структурой Г). В рамках принятого определения «классическая» игра в нормальной форме является частным случаем рефлексивной игры (а именно случаем, когда имеет место общее знание и все элементы структуры информированности совпадают). Когда состояние природы является общим знанием, предлагаемая в настоящей работе концепция решения рефлексивной игры (информационное равновесие - см. далее) переходит в равновесие Нэша.
Совокупность связей между элементами информированности агентов можно изобразить в виде дерева (см. рис. 2). При этом структура информированности г-го агента изображается поддеревом, исходящим из вершины в,.
Рис. 2. Дерево информационной структуры
Сделаем важное замечание: в настоящей работе мы ограничиваемся рассмотрением «точечной» структуры информированности, компоненты которой состоят лишь из элементов множества Q (более общим случаем является, например, интервальная или вероятностная информированность).
Итак, рефлексивной является игра, в которой информированность игроков не является общим знанием. С точки зрения теории игр и рефлексивных моделей принятия решений целесообразно разделять стратегическую (см. ниже) и информационную рефлексию.
Информационная рефлексия - процесс и результат размышлений игрока о том, каковы значения неопределенных параметров, что об этих значениях знают и думают его оппоненты (другие игроки). При этом собственно «игровая» компонента отсутствует, так как никаких решений игрок не принимает.
Иными словами, информационная рефлексия относится к информированности агента о природной реальности (какова игра), и о рефлексивной реальности (какой видят игру он сам и другие).
Информационная рефлексия логически предшествует рефлексии несколько иного рода- стратегической рефлексии.
Стратегическая рефлексия - процесс и результат размышлений игрока о том, какие принципы принятия решений используют его оппоненты (другие игроки) в рамках той информированности, которую он им приписывает в результате информационной рефлексии.
Таким образом, информационная рефлексия имеет место только в условиях неполной информированности, и ее результат используется при принятии решений (в том числе - при стратегической рефлексии). Стратегическая рефлексия имеет место даже в случае полной информированности, предваряя принятие игроком решения о выборе действия (стратегии). Другими словами, информационная и стратегическая рефлексии могут изучаться независимо, однако в условиях неполной информированности (в т.ч. взаимной) обе они имеют место.
Введем следующие обозначения: - множество всевозможных конечных последовательностей индексов из N; S - объединение £ с пустой последовательностью; |а) - количество индексов в последовательности сг (для пустой последовательности принимается равным нулю).
Если Û, - представления /-го агента о неопределенном параметре, а в„ - представления г-го агента о собственном представлении, то естественно считать, что 0„ = в,. Иными словами, /-й агент правильно
информирован о собственных представлениях, а также считает, что таковы и другие агенты и т. д. Формально это означает, что выполнена аксиома автоинформированности, которую далее будем предполагать выполненной: У i & N V г, сг е £ 0т(Т- вТ1„.
Эта аксиома означает, в частности, что, зная вТ для всех г е £+ таких, что | ч\ = у, можно однозначно найти вт для всех re таких, что
\А<у-
Наряду со структурами информированности I„ i е N, можно рассматривать структуры информированности 1и (структура информированности у'-го агента в представлении /-го агента), I¡jk и т.д. Отождествляя структуру информированности с характеризуемым ею агентом, можно сказать, что, наряду с п реальными агентами (i-агентами, где i е N) со структурами информированности /„ в игре участвуют фантомные агенты (т-агенты, где г е |т) > 2) со структурами информированности /г= {вга}, ere Е. Фантомные агенты, существуя в сознании реальных агентов, влияют на их действия, о чем пойдет речь далее.
Определим фундаментальное для дальнейших рассмотрений понятие тождественности структур информированности.
Структуры информированности и 1И (Л, р е £+) называются тождественными, если выполнены два условия:
1) вха= вца ДЛЯ любого СГ€
2) последние индексы в последовательностях Я и р. совпадают.
Будем обозначать тождественность структур информированности
следующим образом: /я=
Первое из двух условий в определении тождественности структур прозрачно, второе же требует некоторых пояснений. Дело в том, что далее мы будем обсуждать действие г-агента в зависимости от его структуры информированности 1Т и целевой функции /,(■), которая определяется последним индексом последовательности г. Поэтому удобно считать, что тождественность структур информированности означает в том числе и тождественность целевых функций.
Утверждение 1. /¿=Ifl о V сг€ Б /Л(Т=
Содержательный смысл утверждения 1 состоит в том, что тождественность двух структур информированности в точности означает тождественность всех их подструктур.
Следующее утверждение является, по сути, иной формулировкой аксиомы автоинформированности.
Утверждение 2. V i е N V г, а е £ !„,„= /псг.
Определение тождественности структур информированности (как и последующие, приводимые в разделе 2.1) можно переформулировать так, чтобы соответствующее свойство структуры информированности выполнялось не объективно, а х-субьективно - в представлении г-агента (геЕ+): структуры информированности h и (Я, ¡j. е £+) называются т-субъективно тождественными, если IT¿ = 1ТМ.
В дальнейшем будем формулировать определения и утверждения сразу r-субъективно для re I, имея в виду, что если г- пустая последовательность индексов, то «г-субъективно» означает «объективно».
Назовем Я-агента г-субъективно адекватно информированным о представлениях //-агента (или, короче, о //-агенте), если IrXf, = hf, (Л // е Z+, г е Е).
Будем обозначать г-субъективную адекватную информированность Я-агента о //-агенте следующим образом: h>tI¡¡.
Утверждение 3. Каждый реальный агент г-субъективно считает себя адекватно информированным о любом агенте, то есть VieN V reí VcreZ* /,>„/„.
Содержательно утверждение 3 отражает тот факт, что рассматриваемая точечная структура информированности подразумевает наличие у каждого агента уверенности в своей адекватной информированности о всех элементах этой структуры.
Будем говорить, что Я-агент и //-агент являются г-субъективно взаимно информированными, если одновременно выполнены тождества IrXfi = Izfi, Itua = hx (Я, ¡j. e S+, г e 2).
Обозначим г-субъективную взаимную информированность Я-агенга и //-агента следующим образом: h ><г .
Будем говорить, что Я-агент и //-агент являются г-субъективно одинаково информированными о сг-агенте, если Iria = IzMo{<y, л, м € S+, Г е Z).
Обозначим г-субъективную одинаковую информированность Л-агента и //-агента о ¿^агенте следующим образом: h >а<т^м-
Назовем Я-агента и //-агента т-субъективно одинаково информированными, если V i е N 1Ть = 1Тр (Я, // е Е., те Е).
Будем обозначать г-субъективную одинаковую информированность Я-агента и //-агента следующим образом: ~т /„.
Отметим, что отношения одинаковой информированности о каком-либо агенте и одинаковой информированности являются отношениями эквивалентности, т.е. рефлексивны, симметричны и транзитив-
ны на множестве агентов. Можно также показать, что одинаковая информированность равносильна одинаковой информированности о любом агенте.
Утверждение4. ce £+ Ix>¿<rIM.
Приведенные определения показывают, что описание ситуации в содержательных терминах адекватной, взаимной и одинаковой информированности опирается на тождество соответствующих структур информированности. Следующее утверждение касается связи введенных понятий друг с другом.
Утверждение 5. Для любого re I следующие три условия равносильны:
1) любые два реальных агента r-субъективно являются взаимно информированными;
2) все реальные агенты г-субъективно являются одинаково информированными;
3) для любого i е N значение г-субьективно зависит только
от i.
Иными словами, для любого re Е выполнено:
(V i,j е NI, ><rIj)« (Л~г...~г/И) « (V / е ATV ст е £ /„,= /„).
Понятие тождественности структур информированности позволяет определить их важное свойство - сложность. Заметим, что наряду со структурой I имеется счетное множество структур /„ reí,, среди которых можно при помощи отношения тождественности выделить классы попарно нетождественных структур. Количество этих классов естественно считать сложностью структуры информированности.
Будем говорить, что структура информированности / имеет конечную сложность v — ЦТ), если существует такой конечный набор попарно нетождественных структур {IT¡, ..., /г }, г/е£+,
1 е {1,..., v}, что для любой структуры ere I., найдется тождественная ей структура Iv¡ из этого набора. Если такого конечного набора не существует, будем говорить, что структура I имеет бесконечную сложность: ЦТ) = оо.
Структуру информированности, имеющую конечную сложность, будем называть конечной (еще раз отметим, что при этом дерево структуры информированности все равно остается бесконечным). В противном случае структуру информированности будем называть бесконечной. Ясно, что минимально возможная сложность структуры
информированности в точности равна числу участвующих в игре реальных агентов.
Будем говорить, что структура информированности I, ЦТ) < оо, имеет конечную глубину у~ /(Г), если
1)для любой структуры /„ сгб £+, найдется тождественная ей структура 1п г е Е+, |г| </;
2) для любого целого положительного числа £ %<у, существует структура суе не тождественная никакой из структур /„ те Е+,
Если ЦТ) = со, то и глубину будем считать бесконечной: у(Г) = оо.
Понятия сложности и глубины структуры информированности игры можно рассматривать г-субъективно. В частности, глубину структуры информированности игры с точки зрения г-агента, те будем называть рангом рефлексии г-агента.
Имея описание структуры информированности, можно рассматривать процесс совместного принятия решений реальными и фантомными агентами, что приводит к понятию информационного равновесия (решения рефлексивной игры), которое определяется в разделе 2.2. Если задана структура I информированности игры, то тем самым задана и структура информированности каждого из агентов (как реальных, так и фантомных). Выбор г-агентом своего действия хт в рамках гипотезы рационального поведения определяется его структурой информированности /г. Выбирая свое действие, агент моделирует действия других агентов (осуществляет рефлексию), поэтому при определении исхода игры необходимо учитывать действия как реальных, так и фантомных агентов.
Набор действий хт, те назовем информационным равновесием, если выполнены следующие условия:
1) структура информированности/имеет конечную сложность у;
2) V е Ы, еХ = => хх, = х^ ;
3) V / е ЛГ, V <т е £
(1) еА^шах/С^,,*^,,...,** „Х..Х* ).
Первое условие в определении информационного равновесия означает, что в рефлексивной игре участвует конечное число реальных и фантомных агентов.
Второе условие отражает требование того, что одинаково информированные и имеющие одинаковые целевые функции агенты выбирают одинаковые действия.
И, наконец, третье условие отражает рациональное поведение агентов - каждый из них стремится выбором собственного действия максимизировать свою целевую функцию, подставляя в нее действия других агентов, которые оказываются рациональными с точки зрения рассматриваемого агента в рамках имеющихся у него представлений о других агентах.
В соответствии с условием (1), для определения информационного равновесия требуется решить, казалось бы, бесконечное (счетное) число уравнений и получить столько же значений хг. Однако оказывается, что на самом деле число уравнений и значений конечно.
Утверждение 6. Если информационное равновесие хт, те I , существует, то оно состоит из не более чем V попарно различных действий, а в системе (1) содержится не более чем V попарно различных соотношений.
Таким образом, для нахождения информационного равновесия хг,
г е Е+, достаточно записать у условий для каждого из у попарно *
различных значении хт, отвечающих попарно различным структурам информированности 1Т. В случае, когда все реальные агенты являются одинаково информированными, информационное равновесие переходит в равновесие Нэша (фантомных агентов «не возникает»).
Следующее утверждение дает достаточное условие существования информационного равновесия.
Утверждение 7. Пусть в рефлексивной игре со структурой информированности конечной сложности множества действий X, - выпуклые компактные подмножества евклидовых пространств, для каждого агента целевая функция/,{в,х\, ..., х„) при любом в<= О. непрерывна по всем переменным и строго вогнута по переменной х,. Тогда в этой игре существует информационное равновесие.
В разделе 2.3 вводится понятие графа рефлексивной игры, наглядно показывающего взаимосвязь между действиями агентов (как реальных, так и фантомных), участвующих в равновесии. Вершинами этого ориентированного графа являются номера г реальных или фантомных агентов, ге I,, являющихся попарно различными, т.е. отвечающих попарно нетождественным структурам информированности /г.
Между вершинами проведены дуги по следующему правилу: к каждой вершине <л проведены дуги от (п - 1) вершин, отвечающих структурам /отяу е Лг\ {/}. Если две вершины соединены двумя противоположно направленными дугами, будем изображать одно ребро с двумя стрелками.
Итак, граф О] рефлексивной игры Г/, структура информированности которой имеет конечную сложность, определяется следующим образом:
- вершины графа б/ соответствуют реальным и фантомным агентам, участвующим в рефлексивной игре, то есть попарно нетождественным структурам информированности;
- дуги графа б; отражают взаимную информированность агентов: если от одного агента (реального или фантомного) идет стрелка к другому агенту, то второй адекватно информирован о первом.
Если в вершинах графа О/ изображать представления соответствующего агента о состоянии природы, то рефлексивная игра Г/ с конечной структурой информированности / может быть задана кортежем Г/ = {М, (X,), е дг,Д •), е /у-, С?/}, где N — множество реальных агентов, X, - множество допустимых действий г'-го агента, /(•): П х X'—9?' -его целевая функция, / £ -/V, - граф рефлексивной игры.
Отметим, что во многих случаях рефлексивную игру более удобно (и наглядно) описывать именно в терминах графа СгЛ а не дерева информационной структуры.
Приведем два примера нахождения информационного равновесия, в которых участвуют три агента с целевыми функциями следующего вида: /;(0,х„х2,х3) = (в-х]-х2 -х3)х,где х,>0,
¿ы
/ е ЛГ= {1,2, 3};0еО = {1,2}.
Содержательно, например, х, - объем выпуска продукции г-ы агентом, в- спрос на производимую продукцию. Тогда первое слагаемое в целевой функции может интерпретироваться как произведение цены на объем продаж - выручка от продаж, а второе слагаемое - как затраты на производство (это, по существу, известная модель олигополии Курно).
Для краткости будем называть агента, считающего, что спрос низкий (0= 1), пессимистом, а считающего, что спрос высокий (6= 2) - оптимистом. Рассмотрим два варианта.
1. Пусть первые два агента оптимисты, а третий - пессимист, причем все трое одинаково информированы (соответствующий граф изображен на рис. 3). Тогда действия реальных агентов в ситуации информационного равновесия будут следующими: Рис 3. Граф рефлексивной игры. хх~х2=\11, х3' = 0. Все агенты одинаково информированы
2. Пусть теперь первые два агента оптимисты, а третий - пессимист, который считает всех трех агентов одинаково информированными пессимистами. Первые два агента одинаково информированы, причем оба они адекватно информированы о третьем агенте (соответствующий граф изображен на рис. 4).
Рис 4 Граф рефлексивной игры Первые два агента одинаково информированы и адекватно информированы о третьем агенте; третий агент (ошибочно) считает всех трех агентов одинаково информированными
В этом случае действия реальных агентов в ситуации информационного равновесия будут следующими: Х\ =х2 = 9/20, хз =1/5.
Приведенные примеры показывают, что, изменив лишь представления агентов о представлениях друг друга, можно повлиять на выбираемые ими действия.
Если априори имеется (например, построено исходя из содержательных соображений) конечное дерево, отражающее несколько первых уровней представлений агентов, то в общем случае нельзя однозначно сказать, какой бесконечной информационной структуре оно соответствует. Поэтому для определения информационного равновесия по конечному дереву представлений агентов необходимо введение дополнительных предположений. В разделе 2.4 введено понятие регулярной структуры информированности, каждая из которых может быть заданы в виде регулярного конечного дерева (РКД). Для регулярных структур информированности сформулировано достаточное условие существования равновесия.
Утверждение 8. Пусть для любого непустого множества N с N справедлив следующий факт: для любых е П, к е N , и любых х*т £ Хт, т £ N, существует равновесие Нэша в игре с общим знанием ¿-агентов, то есть существуют хк , к е N , удовлетворяющие х'к еА^тахквЫ.
*кеХц
Тогда для любой конечной структуры информированности существует информационное равновесие.
В третьей главе исследуются специфические типы информационных равновесий. В контексте описанной в разделе 1.4 модели информационного управления материал данной главы охватывает цепь «действие —» наблюдаемый результат информированность» (см. рис. 1).
В разделе 3.1 рассматривается свойство стабильности равновесия, состоящее в том, что каждый агент наблюдает именно тот результат игры, который ожидает в момент выбора действия. Тем самым, информационная структура игры не меняется.
Напомним, что рефлексивная игра задается кортежем {Ы, (X,), е 6 № /}, где //={1,2,..,«} - множество участников игры (игроков, агентов), X,- множество допустимых действий /-го агента, /,(■): П х X'-> 1 - его целевая функция, / е Ы, I - структура информированности. Дополним эту конструкцию набором функций м>,(-): х X' IV,, / е 7/, которые отображают вектор (в, х) в элемент ч>, некоторого множества Этот элемент м>, и есть то, что /-й агент наблюдает в результате разыгрывания игры.
Функцию ч>,() будем называть функцией наблюдения ¡-го агента. Будем считать, что функции наблюдения являются общим знанием среди агентов.
Если м>,(в, х) = {в, х), т.е. W, = Í2 х X', то г-й агент наблюдает как состояние природы, так и действия всех агентов. Если, напротив, множество W, состоит из одного элемента, то г'-й агент ничего не наблюдает.
Информационное равновесие хп, riel,., будем называть стабильным при заданной структуре информированности I, если для любого tí € выполняется (2) w, (9п, Хяъ Xqj •••jXpn)
— w, xt\, .., xrl.\, хп, xr,+1, ..., xm).
Информационное равновесие, не являющееся стабильным, будем называть нестабильным.
Утверждение 9. Пусть структура информированности / имеет сложность v и существует информационное равновесие xn, tí е X.. Тогда система соотношений (2) содержит не более чем v попарно различных условий.
В разделе 3.2 стабильные информационные равновесия подразделяются на истинные и ложные.
Пусть набор действий х„, tí el.,, является стабильным информационным равновесием. Будем называть его истинным равновесием, если набор (х\, ...,х„) является равновесием в условиях общего знания о состоянии природы в (или о наборе (гь , г„) типов агентов). Из данного определения, в частности, следует, что в условиях общего знания любое информационное равновесие является истинным. Рассмотрим еще один случай, когда этот факт имеет место.
Утверждение 10. Пусть целевые функции агентов имеют вид /, (Л,xh ..., х„) = ер, (г„х„yiix.,)), а функции наблюдения - вид х) =у,(x.¡), i е N. Тогда любое стабильное равновесие является истинным.
Стабильное информационное равновесие, не являющееся истинным, назовем ложным. Таким образом, ложное равновесие - это такое стабильное информационное равновесие, которое не является равновесием в случае одинаковой информированности агентов (в условиях общего знания).
В разделе 3.3 рассматривается случай, когда в результате игры действия агентов становятся общим знанием. Доказывается ряд утвер-
ждений, проясняющих взаимосвязь стабильности равновесия и свойств структуры информированности игры.
В частности, пусть вектор х' = (х'х') является стабильно-равновесным (т.е. является «реальной» частью стабильного информационного равновесия). Определим для каждого 1 е N следующие множества: р, = {г,е ЧЯ+\х' е В^ , ) }.
Утверждение 12. Пусть х - стабильно-равновесный вектор действий реальных агентов. Если для любого ; е N множество р, состоит ровно из одного элемента, то вектор типов является общим знанием (и, соответственно, равновесие истинное).
Утверждение 13. Если вектор действий реальных агентов х является стабильно-равновесным при некоторой структуре информированности, то для элементов этой структуры при любых г е N и <те I выполняется гт е р,.
В разделе 3.4 проводится аналогия между рефлексивными играми и байесовыми играми, введенными в конце 60-х годов XX в. Дж. Харшаньи, - альтернативным способом моделирования принятия решения в ситуации с неполной информированностью. Решением байесовой игры является равновесие Байеса-Нэша, определяемое как набор стратегий агентов, максимизирующих математические ожидания соответствующих целевых функций. Подчеркнем, что в байесовой игре стратегией агента является не действие, а функция - зависимость действия агента от его типа.
Если в игре участвуют два агента, представления которых задаются точечной структурой информированности, то нахождение равновесия Байеса-Нэша сводится к решению системы двух соотношений, определяющих две функции, каждая из которых зависит от счетного числа переменных. При этом оказывается, что применение концепции равновесия Байеса-Нэша к агентам со структурой информированности бесконечной глубины дает парадоксальный результат - при определенных дополнительных условиях равновесным является любое допустимое действие. Соответствующее утверждение 14 обосновывает необходимость ограничения ранга рефлексии агентов. Это обстоятельство, по-видимому, свидетельствует о нецелесообразности рассмотрения структур бесконечной глубины как в терминах информационного равновесия, так и в терминах равновесия Байеса-Нэша.
В четвертой главе выделены способы осуществления центром информационного воздействия на агентов с целью формирования той или иной структуры информированности - информационное регули-
23
рование, рефлексивное управления, активный прогноз. В контексте описанной в разделе 1.4 модели информационного управления материал данной главы охватывает цепь «центр -»информированность агента (агентов) (см. рис. 1)».
В разделе 4.1 обсуждается проблематика моделирования информационного воздействия на реальных людей и на модельных «умных и рациональных» агентов.
В разделе 4.2 исследуются информационное регулирование и рефлексивное управление. Простейшим случаем информационного воздействия является следующий: центр собрал вместе всех агентов и во всеуслышание сообщил им значение неизвестного параметра в -
величину в . В этом случае естественно предположить, что образовавшаяся структура информированности игры имеет глубину 1 и состоит из единственного элемента в , т.е. для любых /еЯи сг е Е выполняется равенство в,а= в . Иными словами, общим знанием
среди агентов становится то, что неопределенный параметр равен в .
Такое информационное регулирование называется однородным. Предположение о том, что при сообщении центром единственной
величины в она становится общим знанием, назовем предположением По. Собственно говоря, предположение По означает, что агенты доверяют центру, и это является общим знанием.
Более сложным случаем информационного регулирования является следующий: центр сообщает /-му агенту в, - значение неизвестного параметра в. В этом случае примем предположение Я/, состоящее в том, что образовавшаяся структура информированности игры состоит из п элементов и при этом для любых / е ЛГ и а е £ выполняется равенство в10 = в,. Иными словами, каждый 1-й агент считает общим знанием, что неопределенный параметр равен в,. Образующаяся при этом структура информированности имеет, вообще говоря, глубину 2.
Такое информационное регулирование называется неоднородным. Ясно, что однородное информационное регулирование является частным случаем неоднородного (при этом вх = в2 = — = 9п - в и структура информированности имеет глубину 1).
Пусть теперь центр сообщает г-му агенту не только значение неизвестного параметра, но и то, что о значении параметра думают другие агенты. Таким образом, г-му агенту сообщается набор чисел в,} (/=1,2,...,«) представлений о неизвестном параметре каждого /-го
агента. Примем в этом случае предположение П2, состоящее в следующем: /-й агент считает, что каждый j-й агент, j * i, субъективно считает значение неопределенного параметра 9и общим знанием. В этом случае образовавшаяся структура информированности игры имеет глубину 3 и любых i,j е N,j Ф г, и а sS выполняется равенство в,,о = 9,j. Эта ситуация является примером рефлексивного управления.
Следует отметить, что на сегодняшний день существует несколько трактовок терминов «рефлексия» и «рефлексивное управление», не вполне совпадающих с принятыми в диссертационной работе. Наиболее известными являются подход школы В.А. Лефевра и концепция рефлексивности, развиваемая в ряде работ Дж. Сороса.
В разделе 4.2 исследуется активный прогноз - сообщение информации о будущих значениях неких параметров, зависящих от состояния природы и действий агентов.
Пусть в ситуации имеется неопределенный параметр, от которого зависят целевые функции агентов (хотя бы одного из них). Если при осуществлении информационного регулирования и рефлексивного управления центр сообщает агенту некий «факт» (информацию о неопределенном параметре либо о представлениях оппонентов), то в задаче активного прогнозирования сообщается прогноз - некая величина, общеизвестным образом зависящая от неопределенного параметра и действий агентов (например, суммарное действие агентов). Центр как бы сообщает агентам: «Если вы будете действовать рационально, т.е. выберете равновесные действия, то результат будет таким, как я прогнозирую». В этом смысле прогнозом, сообщаемым агенту, может быть и его (агента) собственное действие.
Далее каждый агент на основании прогноза может «восстановить» информацию о состоянии природы и использовать эту информацию (как и при информационном регулировании) при вычислении равновесных действий (в том числе и собственного действия). При этом формируется структура информированности игры единичной глубины с одинаковыми представлениями всех агентав о состоянии природы.
В пятой главе систематизированы общие подходы к постановке и исследованию задач информационного управления. В контексте описанной в разделе 1.4 модели материал данной главы охватывает цепь «информированность —> действие -> центр» (см. рис. 1).
В данной главе в разделе 5.1 дается постановка и классификация задач информационного управления. Задача информационного управ-
ления понимается как поиск структуры информированности игры, при которой действия агентов оказываются выгодными для центра.
Определим следующие множества:
- множество Ч* пар (х, I) таких, что х е Х\ I е 3 и вектор действий реальных агентов х является равновесным (т.е. является «реальной» частью информационного равновесия, являющегося набором действий как реальных, так и фантомных агентов) при структуре информированности /, где 3" - множество всевозможных структур информированности.
- множество 4^7) с X' векторов действий реальных агентов, являющихся равновесными при структуре информированности /;
- множество Т/Ос) с Л" информационных структур, при которых вектор действий реальных агентов х является равновесным (решение обратной задачи).
Определим также подмножества этих множеств, выделяемые требованием стабильности информационного равновесия:
- множество Ч*1 пар (х, Г) таких, что х е X', I е 3" и вектор х является стабильно-равновесным при структуре информированности/;
- множество Ч'/О с X' векторов действий агентов, являющихся стабильно-равновесными при структуре информированности 7;
- множество Ч'/Ух) с З1 информационных структур, при которых вектор действий реальных агентов х является стабильно-равновесным.
Обозначим через /0 структуру информированности единичной глубины, которая соответствует тому, что вектор г истинных типов агентов является общим знанием. Заметим, что Ч//(/0) = Ч^/о) -любой равновесный вектор, соответствующий общему знанию, -является стабильно-равновесным.
Пусть на множестве действий реальных агентов и структур информированности задана целевая функция центра Ф(х, 7). Пусть, далее, центр может сформировать любую структуру информированности из некоторого множества 3"с3'. При структуре информированности I е 3' вектор действий реальных агентов является элементом множества равновесных векторов 4*^7). Множество Ч^Т) может быть пустым, тогда центр, ввиду отсутствия равновесия, не может рассчитывать на тот или иной исход игры. Поэтому введем множество допустимых структур, для которых существует хотя бы одно равновесие: 3= {I е 3"\х¥^])*0}.
Если при заданной структуре I е 3 множество равновесных векторов ^хО) состоит более чем из одного элемента (мы исходим из того, что агенты выбирают действия в рамках одного равновесия, даже если это равновесие не единственно), то обычно принимается одно из следующих двух предположений:
1. гипотеза благожелательности (ГБ), состоящая в том, что у центра есть возможность обеспечить выбор агентами «нужного» равновесия;
2. принцип максимального гарантированного результата (МГР), состоящий в том, что центр рассчитывает на наихудшее для себя равновесие игры агентов.
В соответствии с ГБ и МГР получаем, соответственно, постановку задачи информационного управления в двух вариантах:
(3) шах Ф(х,Л—гг->шах;
(4) min Ф(х,1)—г^г->тах.
xeVxd) ;<е3
Разумеется, в случае, когда для любого 7 € 3 множество Ч^Г) состоит ровно из одного элемента, (3) и (4) совпадают.
Задачу (3) (либо (4)) будем называть задачей информационного управления в форме целевой функции.
Опишем теперь задачу информационного управления в несколько иной постановке, не зависящей от целевой функции центра. Пусть центр стремится добиться от агентов выбора вектора действий х е X'. Зададимся вопросом: для каких векторов х и каким образом (т.е. при помощи формирования какой структуры I) центр может это сделать? Иначе говоря, вторая возможная постановка задачи информационного управления состоит в нахождении множества достижимости -множества векторов х е X', для каждого из которых множество структур Ч'Х*) п Лне пусто, а также соответствующих допустимых структур информированности I е *Р/(х) гл Я для которых
(5) вектор х является равновесным, либо
(6) вектор х является единственным равновесным. Условие (5) соответствует ГБ, условие (6) - МГР.
Задачу (5) (либо (6)) будем называть задачей информационного управления в форме множества достижимости.
Еще раз подчеркнем, что вторая постановка не зависит от целевой функции центра и отражает лишь его возможность при помощи информационного управления привести систему в то или иное состояние.
Как в первой, так и во второй постановке центр может либо интересоваться, либо не интересоваться стабильностью получившегося информационного равновесия. Если требуется осуществить стабильное информационное управление, т.е. привести систему в стабильное информационное равновесие, то в приведенных выше постановках требуется заменить на Ч*5, а термины «равновесие» и «равновесный» - на «стабильное равновесие» и «стабильно-равновесный» соответственно.
Подытожим вышесказанное. Задачу информационного управления можно рассматривать
■ в форме целевой функции либо множества достижимости;
■ с использованием гипотезы благожелательности (ГБ) либо принципа максимально гарантированного результата (МГР);
■ с требованием стабильности или без требования стабильности.
Выбор одного из этих восьми вариантов определяется конкретной
моделируемой ситуацией. Однако в любом случае необходимым этапом является установление связи между структурой информированности и вектором действий агентов, т.е. исследование информационного равновесия (см. выше).
Решение задачи информационного управления означает, так или иначе, нахождение наилучшей структуры информированности игры из заданного множества структур. Проблема нахождения такой структуры в общем случае представляется довольно сложной. Поэтому в разделе 5.2 рассмотрена важная вспомогательная конструкция, которая позволяет в ряде случаев существенно упростить ситуацию.
Для начала сделаем следующее предположение: структура информированности является конечной и регулярной (см. раздел 2.4). Напомним, что для конечной регулярной структуры можно последовательно найти все равновесные действия реальных и фантомных агентов, двигаясь от висячих вершин РКД к корню.
Обозначим множество параметрических (параметр - вектор в = (в], ..., в„) е С2") равновесий Нэша
ЫО) = {{*,}, е N е X' 1 V / 6 N. Vу, е Х„Ш хь ..., хп) >
ж&1, х\, ..., х,.\, уь ..., х„)}.
Предположим, что на нижнем уровне {<9П7}7 £ Л- конечной регулярной структуры информированности имеет место субъективное общее знание фантомных агентов. Тогда с точки зрения л-агента возможными являются равновесия их игры из множества 0^}, € Введем
множество наилучших ответов /-го агента на выбор оппонентами действий из множества X, при множестве Q возможных состояний природы: BR,{Q,X.,) = (J Argmax/(0, ¡ е N> а также
следующие величины и множества:
£л<= [)En (0) - К = Proj, En, i е Д
вбО" J*'
где
(7) Xf = ВД,{Ц X*;1), lfc = 1,2,..., ¿G№
Отображение BR,(-,): Qxl, ->X, называется рефлексивным отображением /-го агента, / е ÍV.
Утверждение 15. Для любых к = 0,1, ... и i е N имеет место соотношение X, с Х*+1, то есть с ростом ранга рефлексии /-го агента
множества (7) его возможных наилучших ответов не сужаются (напомним - см. раздел 2.1, - что рангом рефлексии /-го агента является глубина дерева /,).
Исследование свойств рефлексивных отображений оказывается существенным при рассмотрении задачи о максимальном целесообразном ранге рефлексии, в рамках которой для каждого реального агента требуется определить минимальный ранг рефлексии, при котором множество его равновесных действий охватывает все возможнью равновесные действий в рефлексивной игре (при различных вариантах структуры информированности). Данная задача является математической формулировкой вопроса о том, насколько сложную структуру информированности требуется сформировать центру при осуществлении информационного управления.
Рефлексивное отображение /-го агента называется стационарным,
если Xf+l = Xf, к = 0,1,... .
Утверждение 16. Если рефлексивные отображения всех агентов стационарны, то множество действий /-го агента, которые могут быть реализованы как компоненты информационного равновесия, реализуется в рамках структуры информированности глубины не более двух и
составляет
X, , / е N. При
этом ранг рефлексии каждого агента равен
единице, а множество равновесных действий реальных агентов составляет Е=\\■
•eN
Таким образом, если рефлексивные отображения стационарны, то при осуществлении информационного управления увеличение ранга рефлексии свыше первого не приводит к появлению новых информационных равновесий.
В общем случае возможны три варианта:
1) если рефлексивные отображения стационарны, то множество субъективных равновесий есть J^0 сГ, то есть является подмно-
jeJV
жеством (быть может, собственным) множества X' допустимых действий агентов;
2) если рефлексивные отображения не стационарны, то множество субъективных равновесий может совпадать с множеством X7 допустимых действий агентов;
3) если рефлексивные отображения не стационарны, то множество субъективных равновесий может быть строго шире ]~[ , но не
16 n
совпадать (быть уже) с множеством X" допустимых действий агентов.
В разделе 5.3 рассмотрен случай взаимодействия двух агентов, имеющих квадратичные по своему действию целевые функции. Для этого случая сформулировано достаточное условие стационарности рефлексивных отображений (утверждение 19). при выполнении которого для решения задачи информационного управления можно ограничиться, согласно утверждению 16, формированием структуры информированности глубины 2.
В разделе 5.4 обобщается известное свойство неманипулируемо-сти механизмов планирования. Именно, вводится понятие рефлексивной неманипулируемости - свойства механизма планирования, при котором существуют такие структуры информированности участников игры, что сообщение достоверной информации является компонентой информационного равновесия. Сформулировано и доказано достаточное условие рефлексивной неманипулируемости (утверждение 20).
Наконец, в разделе 5.5 приведена общая технология постановки и поэтапного исследования задач информационного управления.
В целом, проведенный анализ показывает, что информационное управление позволяет во многих случаях расширить множество исходов игры и тем самым увеличить возможности центра по управлению.
Наряду с нормативным аспектом, интерес представляет и дескриптивный аспект: многие наблюдаемые на практике ситуации, которые не могут быть интерпретированы как «обычные» равновесия Нэша в условиях общего знания, являются информационными равновесиями (при некоторых структурах информированности).
Оба этих аспекта были использованы в шестой главе при рассмотрении набора прикладных задач информационного управления. В этих моделях основное внимание уделяется информационной стороне моделируемого взаимодействия, остальные типы управлений предполагаются либо невозможными (в данной ситуации), либо фиксированными.
В разделе 6.1 «Корпоративное управление» рассматривается корпорация, организационная структура которой (см. рис. 5) содержит следующие уровни:
- уровень 1 - корпоративный центр;
- уровень 2 - подразделения корпорации, подчиняющиеся корпоративному центру;
- уровень 3 - активные элементы (АЭ), каждый из которых подчиняется одному из подразделений корпорации.
Внешняя среда корпорации предполагается состоящей из потребителей (клиентов), конкурентов, поставщиков, субподрядчиков, акционеров (владельцев) и инвесторов. В каждом из подразделов раздела 6.1 рассматривается определенная модель взаимодействия элементов корпорации между собой либо с элементами внешней среды. На рис. 5 числами от 1 до 12 обозначены номера подразделов раздела 6.1, где рассматриваются модели взаимодействия соответствующих элементов (корпоративного центра, подразделений, акционеров и пр.). Отметим, что в большинстве моделей (кроме 8, 9 и 11) за счет информационного управления достигается расширение множества равновесий.
В подразделе 6.1.1 рассматривается модель «Производитель и посредник», в которой участвуют производитель (подразделение корпорации) и корпоративный центр, выступающий в роли посредника между производителем и рынком (покупателями). Предполагается, что посредник точно знает рыночную цену, а производитель - нет.
Выбор посредником сообщения о рыночной цене может трактоваться как информационное управление. Стабильным будет такое информационное управление, при котором реальный доход производителя равен тому доходу, на который он и рассчитывал, исходя из сообщения посредника.
^^Акционеры^ ^Инвесторы^ ^ГТотребители^ (^КонкурентьГ
Поставщики ^ ^^ Субподрядчики^^
Рис. 5. Корпорация (выделена пунктирной рамкой) и ее внутренние и внешние взаимодействия
Производитель и посредник заранее оговаривают пропорцию, в которой они будут делить доход, затем посредник сообщает производителю информацию (не обязательно достоверную) о рыночной цене, и, наконец, производитель выбирает объем производства.
Оказывается, что, выбирая надлежащим образом информационное управление, посредник обеспечивает себе максимум дохода независимо от пропорции дележа (иными словами, посредник может соглашаться на любую долю, свой выигрыш он получит в любом случае). Интересно, что при этом в некоторых случаях производитель получает
большую прибыль, чем получил бы, если бы посредник сообщал истинное значение цены.
Модель «Совместное производство» рассмотрена в подразделе 6.12. Агенты (подразделения) производят однородную продукцию, реализуемую на внешнем рынке. Затем суммарный доход распределяется между агентами в соответствии с фиксированными долями. Каждый агент стремится максимизировать прибыль (доход минус затраты), а корпоративный центр заинтересован в максимизации суммарной прибыли агентов. Неопределенным параметром в данном случае является рыночная цена продукции.
Рассмотрены различные способы формирования структуры информированности игры - информационное регулирование, активный прогноз, рефлексивное управление. Оказывается, что в данном случае эффективность этих трех способов одинакова: формирование центром более сложных структур информированности агентов не дает увеличения эффективности по сравнению с информационным регулированием и активным прогнозом. При этом интересно, что выигрыш каждого из агентов (а также и центра) будет меньше ожидаемого, но больше того выигрыша, который он получил бы в случае сообщения центром истинной цены.
В модели «Конкуренция на рынке» (подраздел 6.1.3) цена на продукцию агентов зависит от суммарного объема производства. В качестве неопределенного параметра выступают эффективности производителей-агентов. Рассмотрена задача активного прогнозирования: центр влияет на рыночную цену, сообщая агентам суммарный объем производства (т.е. сумму их действий). Оказывается, что при некоторых предположениях сообщение точного прогноза минимизирует цену.
Модель «Аккордная оплата труда» (подраздел 6.1.4) описывает ситуацию, в которой вознаграждение коллектива агентов за работу имеет следующий вид: каждый агент получает фиксированное вознаграждение, если агрегированный результат деятельности агентов (например, сумма их действий) превышает заданный норматив; вознаграждение равно нулю, если норматив не выполнен. Модель отражает взаимодействие корпоративного центра и подразделений, либо подразделения и АЭ.
Агенты имеют иерархию представлений о нормативе. Помимо общего знания рассматриваются следующие варианты:
- представления агентов о нормативе попарно различны; тогда либо никто из агентов не работает, либо один агент выполняет весь объем работ;
-если структура информированности имеет глубину два, и каждый из агентов субъективно считает, что играет в игру с асимметричным общим знанием, то множество возможных равновесных ситуаций максимально и совпадает со множеством индивидуально рациональных действий;
- если структура информированности имеет глубину два, и на ее нижнем уровне имеет место симметричное общее знание, то и в этом случае множество информационных равновесий является максимально возможным.
Полученные результаты полностью подтверждают интуитивно правдоподобный качественный вывод: в коллективе работников совместная работа возможна (является равновесием) лишь в том случае, когда имеется общее знание о том, какой объем работ необходимо выполнить для получения вознаграждения. Кроме того, незначительное изменение информационной структуры приводит к существенному изменению информационного равновесия.
Интересно, что возможно следующее стабильное информационное равновесие: каждый агент считает, что именно за счет его усилий выполнен весь объем работ и это всем известно (и даже является общим знанием).
В модели «Продавец и покупатель» (подраздел 6.1.5) продавец и покупатель, имеющие иерархию взаимных представлений о ценности продаваемого товара, должны прийти к соглашению о цене, по которой произойдет сделка купли-продажи. Модель отражает взаимодействие АЭ и поставщика, либо корпоративного центра и одного из потребителей.
Необходимым условием заключения сделки оказывается следующее: с точки зрения обоих участников субъективные цены (то есть субъективные меры ценности товара) всех реальных и фантомных продавцов не превышают субъективных цен каждого из реальных и фантомных покупателей. Наиболее простой структурой информированности, которую следует сформировать у покупателя и продавца для того, чтобы сделка произошла по требуемой для центра цене, является следующая - они должны быть уверены, что для всех их фантомных агентов (покупателя с точки зрения продавца, продавца с точки зрения покупателя и т.д.) ценность товара в точности равна цене, требуемой для центра.
В подразделе 6.1.6 рассмотрена модель «Заказчик и исполнитель», в которой неопределенным для заказчика параметром является известная исполнителю эффективность его работы. В этом случае, варьируя представления заказчика об эффективности работы исполнителя (то есть в рамках структуры информированности глубины два), стоимость договора из определенного в работе промежутка можно сделать стабильным информационным равновесием. Модель отражает, в частности, взаимодействие АЭ и субподрядчика.
В модели «Активная экспертиза», рассматриваемой в подразделе 6.1.7. описывается ситуация принятия решений коллективом экспертов, каждый из которых имеет собственные представления о том, каким должен быть результат экспертизы, и стремится соответствующим образом на него повлиять. Проблема манипулирования информацией со стороны агентов является традиционной в теории выбора, задача же манипулирования результатами экспертизы со стороны центра - организатора экспертизы - до сегодняшнего дня не рассматривалась. Модель отражает, в частности, взаимодействие корпоративного центра и акционеров, принимающих то или иное решение путем голосования.
Пусть центр имеет возможность сформировать у экспертов представления о мнениях оппонентов. Тогда оказывается, что достаточно широкий диапазон коллективных решений может быть реализован как информационное равновесие (а иногда и единогласное решение) рефлексивной игры экспертов.
В модели «Олигополия Курно», рассматриваемой в подразделе 6.1.8, агенты - производители некоторой продукции - выбирают объемы производства. Рыночная цена на продукцию убывает с ростом суммарного объема производства и зависит от спроса. Модель отражает взаимодействие подразделений корпорации, а также их конкурентов.
Если неопределенным параметром являются затраты агентов, относительно которых каждый из агентов имеет собственную иерархию представлений, то информационное равновесие существенным образом зависит от этих взаимных представлений. Однако в стабильной ситуации возможно лишь истинное равновесие, однозначно определяемое истинными типами агентов.
Модель «Распределение ресурса» (подраздел 6.1.9) описывает ситуацию распределения центром ограниченного ресурса между агентами на основании заявок последних. Модель отражает взаимо-
действие корпоративного центра и подразделений, либо подразделения и подчиненных ему АЭ.
В силу активности агентов, они способны к искажению информации, и в равновесии часть агентов (так называемые диктаторы) получают оптимальное для себя количество ресурса, а остальные агенты -меньше оптимального.
Предположим, что агенты имеют иерархию представлений о том, кому из них какое количество ресурса необходимо. Оказывается, что во многих механизмах распределения ресурса стабильные неадекватные представления могут существовать только относительно агентов, не входящих в число диктаторов. При этом, однако, вектор распределяемых ресурсов оказывается таким же, как и в случае полного знания.
В модели «Страхование» (подраздел 6.1.10) страхователи имеют иерархию взаимных представлений о вероятностях наступления страховых случаев и сообщают страховщику желательные размеры своих страховых взносов. Модель отражает взаимодействие подразделений и корпоративного центра, либо инвесторов и корпоративного центра.
Оказывается, что информационным равновесием является любой набор заявок, обладающий следующим свойством: с точки зрения любого агента (как реального, так и фантомного) сумма заявок (реальных) страхователей равна ожидаемым суммарным потерям от страховых случаев, а каждая из заявок не превосходит ожидаемого страхового возмещения. При этом все равновесные действия реальных страхователей достигаются в рамках их субъективного общего знания друг о друге.
Основная идея модели «Конкурс», рассматриваемой в подразделе 6.1.11, заключается в том, что, влияя на представления участников конкурса о параметрах оппонентов, центр (организатор конкурса) может влиять на его результаты. Однако стабильным это информационное управление будет лишь в том случае, когда действия агентов совпадают с их действиями в условиях общего знания. Модель отражает взаимодействие корпоративного центра и субподрядчиков или поставщиков, либо инвестора и корпорации и ее конкурентов.
В подразделе 6.1.12 рассматривается модель «Формирование команды», в которой неопределенными параметрами являются эффективности деятельности агентов. Модель отражает взаимодействие подразделений корпорации, либо подчиненных одному подразделению АЭ.
Оказывается, что стабильность команды может достигаться и при ложных представлениях членов команды друг о друге. Выход из
ложного равновесия требует получения агентами дополнительной информации друг о друге.
Остальные модели, рассматриваемые в настоящей главе, независимы одна от другой.
В разделе 6.2 «Игры поиска» рассматривается игра с двумя участниками, которые управляют точечными объектами: ищущим объектом 1 и уклоняющимся объектом 2 (в дальнейшем будем отождествлять игроков и управляемые ими объекты). Поисковой областью, где перемещаются объекты, является прямоугольник евклидовой плоскости {(х, у) | 0 < х < Д 0 <у < 2 I)}, ДI > 0. Ищущий объект начинает движение из точки (Д Ь) и движется по отрезку у = I с выбранной им скоростью а, 0 < а < А, А > 0. Он обнаруживает объект 2 в некоторый момент, если расстояние между объектами в этот момент сократилось до величины /= в- к а, к>0. Содержательно величина / интерпретируется как «зоркость» ищущего (которая уменьшается с ростом его скорости) - расстояние, на котором он может обнаружить уклоняющегося. Уклоняющийся объект может выбрать точку в прямоугольнике для своего местоположения. Ясно, что это должна быть точка на отрезке у = 0 либо на отрезке у- 21. Поэтому можно считать, что выбор объекта 2 определяется одним числом 8, 0 < 8< Д - абсциссой точки, где он «прячется».
Ищущий объект стремится обнаружить уклоняющегося, причем за как можно меньшее время. Если обнаружение не происходит, то для ищущего более выгодно,, чтобы уклоняющийся находился от него на как можно меньшем расстоянии (это расстояние характеризуется выбором б).
С учетом вышесказанного целевую функцию ищущего зададим следующим образом:
где М> 0 - «премия» за обнаружение (которое происходит, если / > I), a c(S) - возрастающая функция, для которой с(0) = 0, характеризующая потери игрока 1 в случае, если обнаружение не происходит. Игра является антагонистической, так что интересы игрока 1 строго противоположны интересам игрока 2.
Таким образом, игра характеризуется целевой функцией j{a, ó), положительными параметрами Д L, А, М, к, в а функцией с{8). Будем считать общим знанием для первого и второго игроков функцию
М-^-, 0>L + kcc, -£-c(¿), в<L + ka,
f(a, S),значения параметров D, L, А, M, к, а также тот факт, что функция с(8) возрастает и с(0) = 0. Будем также считать, что общим знанием является выполнение двойного неравенства:
(3) L + —*—г <9 <L + kA.
v ' MD-'+A-'
Параметр вне является общим знанием, и у игроков 1 и 2 существуют точечные регулярные структуры информированности.
Оказывается, что в описанной ситуации максимальный целесообразный ранг рефлексии ищущего игрока равен трем, а уклоняющегося - двум. При этом у уклоняющегося, в зависимости от структуры информированности, имеются лишь две равновесные стратеши - 0 («стоять на месте, пытаясь отсрочить момент обнаружения») и S=D («пытаться прорваться как можно раньше»).
В разделе 6.3 («Принцип дефицита») описана модель, объясняющая случай кажущейся нерациональности поведения экономических агентов, описанный в книге американского психолога Р. Чалдини «Психология влияния». Агентов (клиентов компании, занимающейся оптовыми поставками говядины) разделили на три категории. После этого каждой категории сообщили «свою» информацию. В результате действия агентов различных типов (т.е. попавших в разные категории) оказались различными.
Оказывается, чго действия агентов можно объяснить, если предположить, что различные информационные воздействия формируют у агентов различные структуры информированности.
В модели «Коррупция» (раздел 6.4) каждый из чиновников имеет субъективные представления о силе штрафов, накладываемых в случае обнаружения факта взяточничества и зависящих от «среднего уровня коррумпированности». Оказывается, что, если чиновники наблюдают средний уровень коррумпированности, то этот средний уровень в стабильной ситуации не зависит от взаимных представлений коррупционеров о типах друг друга. При этом не важно, являются ли сами эти представления истинными или ложными.
Отсюда вытекает, что невозможно повлиять на уровень коррумпированности лишь путем изменения взаимных представлений чиновников друг о друге, и любое стабильное информационное управление приводит к одному и тому же уровню коррумпированности.
В разделе 6.5 описана модель «Биполярный выбор», в которой рассматривается ситуация, когда агенты осуществляют выбор между двумя альтернативами, которые дня общности называются позитивным и негативным полюсами. Например: кандидат на выборах (голо-
совать «за» или «против»), продукт или услуга (покупать или нет), этический выбор (поступить «хорошо» или «плохо») и пр.
Пусть имеются агенты трех типов: первые безусловно выбирают положительный полюс, вторые - выбирают положительный или отрицательный полюс в зависимости от того, как с их точки зрения поведут себя остальные агенты, третьи безусловно выбирают отрицательный полюс.
Предположим теперь, что центр имеет возможность повлиять на ситуацию и стремится увеличить вероятность позитивного выбора в «популяции» в целом. Для этого центр может повлиять на агентов второй и третьей группы (агенты первой группы и так производят требуемый выбор). Во-первых, центр может повлиять на третью группу, затратив некий ресурс (например, финансовый) и переведя некоторую долю ее членов во вторую. Во-вторых, центр может повлиять на вторую группу, изменив представления ее членов о доле агентов третьего типа. В последнем случае влияние состоит в формировании у второй группы следующего представления: «определенная доля членов третьей группы перешла во вторую». Формирование такого представления также требует определенных затрат.
Иными словами, центр может изменить либо реальную, либо «фантомную», воображаемую, долю агентов третьего типа. При этом совокупный ресурс (бюджет), которым располагает центр, фиксирован. Задача центра состоит в следующем: распределить фиксированный ресурс на реализацию информационных воздействий таким образом, чтобы доля агентов, осуществивших позитивный выбор, была максимальной.
Оказывается, что если ресурса у центра «не очень много», то оптимальным управлением является, в зависимости от соотношения между параметрами, вложить весь этот ресурс либо в реальное, либо в «воображаемое» (происходящее в сознании агентов второго типа) изменение доли агентов третьего типа.
В разделе 6.6 рассматривается модель «Реклама товара», в которой агент принимает решение о приобретении товара не только в зависимости от собственных предпочтений, но и от того, какая часть других агентов, с его точки зрения, собирается приобрести товар или ожидает от него приобретения данного товара.
Оказывается, что большинство реальных рекламных кампаний могут быть описаны в рамках модели информационного управления с первым или вторым рангом рефлексии агентов.
Раздел 6.7 посвящен рассмотрению модели «Предвыборная борьба», в которой информационное управление заключается в убеждении избирателей, поддерживающих определенных кандидатов, что их кандидаты не будут избраны и следует под держать других кандидатов. Оказывается, что получающееся в итоге такого управления информационное равновесие может быть стабильным, и более того-истинным.
В заключение еще раз отметим, что рассмотренные в шестой главе модели иллюстрируют новые эффекты и возможности, которые появляются при осуществлении информационного управления (переходе от равновесия Нэша к информационному равновесию рефлексивной игры управляемых субъектов). В частности, в следующих прикладных моделях (модели обозначены номерами соответствующих разделов шестой главы) множество исходов игры расширяется за счет информационного управления (возрастает эффективность управления): 6.1.1-6.1.7, 6.1.10, 6.1.12, 6.2, 6.3, 6.5-6.7. В следующих моделях возможны только истинные стабильные равновесия, однако взаимные представлениях агентов могут быть ложными: 6.1.8,6.1.9,6.1.11,6.4.
Основные результаты и выводы
На основании выполненных исследований разработаны теоретические положения, совокупность которых можно квалифицировать как новый крупный вклад в развитие информационного управления активными системами. В работе обоснован единый методологический подход к разработке и исследованию теоретико-игровых моделей информационного управления в активных системах, заключающийся в общности их описания и техники исследования и использующий концепцию информационного равновесия как решения рефлексивной игры управляемых субъектов. Проведенный анализ позволяет сделать вывод, что рассмотрение взаимной информированности агентов дает возможность, во-первых (с нормативной точки зрения), расширить множество рациональных исходов их игры, что, в свою очередь, увеличивает эффективность управления (а также иногда позволяет достичь достоверности сообщаемой агентами информации). Во вторых (с дескриптивной точки зрения), многие наблюдаемые на практике ситуации, которые не могут быть интерпретированы как «обычные» равновесия Нэша в условиях общего знания, являются информационным равновесием. На основе предложенного подхода:
1) сформулирована общая теоретико-игровая модель информационного управления как целенаправленного формирования у управляемых субъектов информационной структуры, предопределяющей желательные для управляющего органа действия;
2) разработана концепция информационной структуры, описывающей информированность субъектов о существенных параметрах ситуации и о представлениях оппонентов; определены и исследованы адекватность, взаимность, одинаковость информированности агентов, а также глубина и сложность структуры информированности;
3) для описания зависимости между информационной структурой и набором действий участников игры предложена концепция информационного равновесия, являющегося обобщением равновесия Нэша в некооперативных играх; сформулированы и доказаны достаточные условия существования информационного равновесия;
4) исследовано свойство стабильности информационного равновесия, при выполнении которого управляемые субъекты не меняют своих представлений в результате наблюдения результатов игры.
5) показано, что ограниченность ранга рефлексии является необходимым условием рационального принятия решения: если ранг рефлексии бесконечен, то любое допустимое действие является равновесным;
6) описаны, классифицированы и исследованы способы осуществления центром информационного воздействия на агентов с целью формирования той или иной структуры информированности - информационное регулирование, рефлексивное управление и активный прогноз;
7) на основании анализа рефлексивных отображений сформулированы условия, при выполнении которых требуемый управляющему органу результат рефлексивной игры достигается посредством формирования структуры информированности управляемых субъектов, соответствующей не более чем второму рангу их рефлексии;
8) введено и исследовано свойство рефлексивной неманипули-руемости механизмов планирования, состоящее в существовании таких подструктур информированности, что при любых типах управляемых субъектов сообщение ими достоверной информации является информационным равновесием;
9) описана и исследована рефлексивная игра поиска подвижного объекта на плоскости, найдены максимально целесообразные ранги рефлексии ищущего и уклоняющегося игроков;
10) сформулированы и решены прикладные задачи информационного управления в области экономики, маркетинга, политики и т.д. (в том числе - комплекс моделей информационного управления в корпоративных структурах).
Основные публикации по теме диссертации
1. Выборное P.A., Чхартишвили А.Г. Активный прогноз как средство управления // Труды XLV научной конференции МФТИ. Долгопрудный: МФТИ, 2002, часть I. С. 61.
2. Выборное P.A., Чхартишвили А.Г. Рефлексивная модель коррупции // Современные сложные системы управления: Материалы IV международной конференции. Тверь: ТГТУ, 2004. С. 186- 189.
3.Губайдуллин С.М., Чхартишвили А.Г., ШикинЕ.В. Геометрические свойства следящей области в задачах поиска // Тезисы докладов международной конференции «Лобачевский и современная геометрия», Казань, 18-22 августа 1992 г. Часть 1. 1992. С. 27-28.
4. Казанцев С.Б., Новиков Д.А., Чхартишвили А.Г. Об условиях стационарности линейных рефлексивных отображений // Системы управления и информационные технологии. 2004. № 5. С. 20 - 22.
5. Казанцев С.Б., Чхартишвили А.Г. О достаточных условиях стационарности рефлексивных отображений // Труды XLVI научной конференции МФТИ. Долгопрудный: МФТИ, 2003, часть I. С. 83.
6. Казанцев С.Б., Чхартишвили А.Г. Технология теоретико-игрового исследования задач информационного управления // Труды XLVII научной конференции МФТИ. Долгопрудный: МФТИ, 2004, часть I. С. 98.
7. Лысаков A.B., Чхартишвили А.Г. Рефлексивные модели переговоров // Системы управления и информационные технологии. 2003. №1-2(12). С. 53 - 57.
8. Новиков Д.А., Чхартишвили А.Г. Активный прогноз. М.: ИПУ РАН, 2002.-101 с.
9. Новиков Д.А., Чхартишвили А.Г. Математические модели информационного управления // Когнитивный анализ и управление развитием ситуаций. Труды 2-ой Международной конференции. М.: ИПУ РАН, 2002. Том 1. С. 13 - 20.
Ю.Новиков Д.А., Чхартишвили А.Г. Стабилизация информационного управления активными системами // Труды II Международной конференции «Идентификация систем и задачи управления» М.: ИПУ РАН, 2003. С. 1180-1183.
П.Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.: СИНТЕГ, 2003.-158 с.
12.Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры: математическое моделирование // Рефлексивные процессы и управление. Тезисы IV международного симпозиума. М.: Изд-во «Институт психологии РАН», 2003. С. 108 - 111.
1 З.Новиков Д.А., Чхартишвили А.Г. Информационное равновесие: точечные структуры информированности // Автоматика и Телемеханика. 2003. № 10. С. 111 - 122.
14.Новиков Д.А., Чхартишвили А.Г. СМИ и информационное управление // Современные сложные системы управления. Сборник трудов научно-практической конференции. Воронеж: ВГАСУ, 2003. Том 2. С. 383-385.
15.Новиков Д.А., Чхартишвили А.Г. Нелинейные рефлексивные отображения // Труды Международной научно-практической конференции «Нелинейная динамика технологических процессов и систем». Липецк: ЛГТУ, 2003. С. 31 - 37.
16. Новиков Д.А., Чхартишвили А.Г. Модель формирования команды // Информационная экономика и управление динамикой сложных систем: Сборник научных трудов. М.: Изд-во «Бизнес-Юнитек», 2004. С. 26 - 39.
17.Новиков Д.А., Чхартишвили А.Г. Рефлексия и ее математическое моделирование // Информационная экономика и управление динамикой сложных систем: Сборник научных трудов. М.: Изд-во «Бизнес-Юнитек», 2004. С. 271 -283.
18.Novikov D., Chkhartishvili A. Models of reflexive decision-making / Systems Sciense. Vol. 30. No. 2. 2004. P. 45 - 59.
19. Новиков ДА., Чхартишвили А.Г. Прикладные модели информационного управления. М.: ИПУ РАН, 2004. - 129 с.
20. Новиков ДА., Чхартишвили А.Г. Принятие решений, рефлексия, информационное управление // Когнитивный анализ и управление развитием ситуаций. Труды 4-й Международной конференции. М.: ИПУ РАН, 2004. Том 1. С. 114 - 118.
21. Новиков Д.А., Чхартишвили А.Г. Модели рефлексивного принятия решений // Проблемы управления. 2004. № 4. С. 62 - 70.
22.Новиков Д.А., Чхартишвили А.Г. Рефлексия в механизмах планирования // Системы управления и информационные технологии -2004. №5. С. 27-38.
23.Новиков Д.А., Чхартишвили А.Г. Стабильность информационного равновесия в рефлексивных играх // Автоматика и Телемеханика. 2005. №3. С. 125-132.
24.Овчинникова Т.И., Чхартишвили А.Г. Рефлексивные модели страхования / Управление большими системами. Сборник трудов. Выпуск 6. М.: ИЛУ РАН, 2004. С. 96-104.
25.Чхартишвили А.Г. Об одном геометрическом свойстве следящей области в задачах поиска // Вестник Московского университета. Серия 1. Математика. Механика. 1992. № 3. С. 7 - 10.
26.Чхартишвили А.Г. Дифференциальные уравнения в задачах поиска с переменными скоростями объектов // Функциональные пространства. Дифференциальные операторы. Проблемы математического образования. Тезисы докладов международной конференции, посвященной 75-летию Л.Д. Кудрявцева. М., 1998. С. 180.
27. Чхартишвили А.Г. Дифференциальные уравнения в задачах динамического поиска-уклонения // Функциональные пространства. Дифференциальные операторы. Проблемы математического образования. Труды международной конференции, посвященной 75-летию Л.Д. Кудрявцева. Т.2. М., 1998. С. 194-197.
28.Чхартишвили А.Г. Переменные множества на плоскости и поиск объектов // Инвариантные методы исследования на многообразиях структур геометрии, анализа и математической физики. Материалы международной конференции, посвященной 90-летию со дня рождения Г.Ф. Лаптева (Москва, 25-30 октября 1999 года). М., 1999. С. 53.
29. Чхартишвили А.Г. О траекториях уклонения на плоскости // Веста. Моск. ун-та. Сер. 1, Математика. Механика. 2000. № 3. С. 6466.
30. Чхартишвили А.Г. Стабильное информационное управление // Современные сложные системы управления: Сборник трудов международной научно-технической конференции. Липецк: J11 ЧУ, 2002. С. 115-117.
31. Чхартишвили А.Г. Моделирование информационного управления // Современные сложные системы управления: Сборник трудов международной научно-технической конференции. Старый Оскол: СПИ, 2002. С. 130.
32. Чхартишвили А.Г. О некоторых аспектах информационного управления социально-экономическими системами // Проблемы управления безопасностью сложных систем: Труды X международной конференции. М.: РГГУ, 2002. Часть 2. С. 94 - 96.
ЗЗ.Чхартишвюти А.Г. Информационное равновесие / Управление большими системами. Сборник трудов. Выпуск 3. М/. ИЛУ РАН, 2003. С. 100-119.
34.Чхартишвили А.Г. Рефлексивные игры и информационное равновесие в активных системах // Современные сложные системы управления: Сборник трудов научно-практической конференции. Воронеж: ВГАСУ, 2003. Том 1. С. 21 - 25.
35.Чхартишвили А.Г. Информационная и стратегическая рефлексия в интерактивном принятии решений // Труды второй международной конференции по проблемам управления М.: ИЛУ РАН, 2003. Том 1.С. 113.
Зб.Чхартишвили А.Г. Моделирование информационной рефлексии в активных системах // Теория активных систем: Труды международной научно-практической конференции. М.: ИЛУ РАН, 2003. Том 1.С. 80-82.
37.Чхартишвили А.Г. Структуры информированности бесконечной глубины и равновесие Байеса-Нэша // Когнитивный анализ и управление развитием ситуаций. Труды 3-й Международной конференции. М.: ИГТУ РАН, 2003. Том 2. С. 109 - 115.
38.Чхартишвили А.Г. Информационная рефлексия и ее влияние на безопасность функционирования социально-экономических систем / Труды международной научно-практической конференции «Проблемы управления безопасностью сложных систем». М.: ИГТУ РАН, 2003. Часть 1.С. 183- 185.
39.Чхартишвили А.Г. Равновесие Байеса-Нэша: точечные структуры информированности бесконечной глубины // Автоматика и Телемеханика. 2003. № 12 С. 105 - 111.
40.Чхартишвшш А.Г. Об одной рефлексивной игре поиска / Управление большими системами. Сборник трудов. Выпуск 5. М.: ИЛУ РАН, 2003. С. 123 - 128.
41.Чхартишвили А.Г. Информационное управление и принятие решений // Современные проблемы информатизации в непромышленной сфере и экономике. Выпуск 9. Воронеж: Научная книга, 2004. С. 51-52.
42.Чхартишвили А.Г. Роль информированности агентов / Раздел
5.4 в «Институциональное управление организационными системами». М.: ИЛУ РАН, 2004. С. 40 - 54.
43.Чхартишвили А.Г. Управление нормами деятельности / Раздел
5.5 в «Институциональное управление организационными системами». М.: ИЛУ РАН, 2004. С. 54 - 61.
44. Чхартишвили А.Г. Рефлексивная игра «аккордная оплата труда» / Управление большими системами. Сборник трудов. Выпуск 6. М.: ИПУ РАН, 2004. С. 143 - 149.
45.Чхартишвили А.Г. Стабильное информационное равновесие // Современные сложные системы управления: Материалы IV международной конференции. Тверь: ТГТУ, 2004. С. 477 - 479.
46.Чхартишвили А.Г. Рефлексивные модели переговоров / Раздел 6.2 в «Договорные отношения в управлении проектами». М.: ИПУ РАН, 2004. С. 74 - 86.
47. Чхартишвили А.Г. Рефлексия в художественных произведениях // Современные сложные системы управления: Материалы V международной конференции. Краснодар, 2004. С. 26 - 29.
48. Чхартишвили А.Г. Теоретико-игровые модели информационного управления. М.: ПМСОФТ, 2004. - 227 с.
49.Чхартишвили А.Г. О теоретико-игровом моделировании информационного управления // Когнитивный анализ и управление развитием ситуаций. Труды 4-й Международной конференции. М.: ИПУ РАН, 2004. Том 1. С. 119 - 123.
50. Чхартишвили А.Г. Стабильность информационного равновесия и управление социально-экономическими системами / Труды международной научно-практической конференции «Проблемы управления безопасностью сложных систем». М.: ИПУ РАН, 2004. С. 191-192.
51 .Чхартишвили А.Г. «Принцип дефицита»: всегда ли нарушается рациональность? / Управление большими системами. Сборник трудов. Выпуск 9. М.: ИПУ РАН, 2004. С. 143 - 149.
52. Chkhartishviii A.G, Novikov D.A. Reflexive mappings and nonlinear dynamics / Proceedings of the International Conference «Mathematical modeling of Social and Economical Dynamics». Moscow: RSSU, 2004. P. 91-92.
53.Чхартишвили А.Г., Шикин E.B. Задачи поиска и обнаружения на некоторых поверхностях // Понгрягинские чтения-IV. Весенняя воронежская математическая школа, 3-8 мая 1993 г. Тезисы докладов. Воронеж, 1993. С. 205.
54.Чхартишвили А.Г., Шикин Е.В. Метод следящих областей в задачах поиска // Математический сборник. 1993. Т. 184. № 10. С. 107-134.
55.Чхартишвили А.Г., Шикин Е.В. Динамические задачи поиска и обнаружения на некоторых замкнутых поверхностях // Дифференциальные уравнения. 1993. Т. 29. № 11. С. 1948 - 1957.
56.Чхартишвили А.Г., Шикин Е.В. Следящая область в пространстве Лобачевского // Вестник Московского университета. Серия 1. Математика. Механика. 1994. № 2. С. 36 - 41.
57.Чхартишвили А.Г., Шикин Е.В. Об одном геометрическом подходе к решению динамических игр поиска // Дифференциальные уравнения. 1994. Т. 30. № 6. С. 1097 - 1098.
58.Чхартишвили А.Г., Шикин Е.В. О простых играх поиска на бесконечном круглом цилиндре // Математические заметки. 1995. Т. 58. №5. С. 762 - 772.
59.Чхартишвили А.Г., Шикин Е.В. Динамический поиск объектов. Геометрический взгляд на проблему // Фундаментальная и прикладная математика. 1995. Т. 1. Вып. 4. С. 827 - 862.
бО.Чхартишвили А.Г., Шикин Е.В. Динамические игры простого поиска // Квант. 1996. № 1. С. 6-12.
61.Чхартишвили А.Г., Шикин Е.В. Поисковая проблематика. Геометрический взгляд // Международная геометрическая школа-семинар. Абрау-Дюрсо, 27 сентября -4 октября 1996 г. Тезисы докладов. Ростов-на-Дону, 1996. С. 94.
62.Чхартишвили А.Г., Шикин Е.В. Геометрия поисковых задач с информационной дискриминацией // ВИНИТИ, серия «Современная математика и приложения. Тематические обзоры». 1996. Т. 32. Динамические системы. С. 92 - 113.
бЗ.Чхартишвили А.Г., Шикин Е.В. О математических курсах в ИГУиСИ // Вестник Московского университета. Серия 18. Социология и политология. 1997. № 1. С. 69 - 74.
64.Чхартишвили А.Г., Шикин Е.В. Математические методы в управлении. М.: УГЛ, 1997. - 101 с.
65.Чхартишвили А.Г., Шикин Е.В. Математические методы и модели в управлении. М.: УГЛ, 1997. - 129 с.
бб.Чхартишвили А.Г., Шикин Е.В. Геометрические методы решения задач динамического поиска // Международная конференция по геометрии «в целом», г. Черкассы (Украина). Тезисы докладов. Черкассы, 1997. С. 87.
67.Чхартишвили А.Г., Шикин Е.В. Геометрия динамического поиска объектов // Инвариантные методы исследования на многообразиях структур геометрии, анализа и математической физики. Материалы международной конференции, посвященной 90-летию со дня рождения Г. Ф. Лаптева (Москва, 25-30 октября 1999 г.). М.: 1999. С. 53.
68.Шикин Е.В., Чхартишвили А.Г. Математические методы и модели в управлении. М.: Дело, 2000. - 440 с.
69.Шикин Е.В., Чхартишвили А.Г. Математические методы и модели в управлении. 2-е изд., испр. М.: Дело, 2002. - 440 с.
70.Шикин Е.В., Чхартишвили А Г. Математические методы и модели в управлении. 3-е изд., испр. (Сер. «Классический университетский учебник»). М.: Дело, 2004. - 440 с.
Личный вклад автора в работах, опубликованных в соавторстве, заключается в следующем: в [2, 4, 5, 7, 9, 11-22,24, 52] автору принадлежат определения структуры информированности, рефлексивной игры и информационного равновесия, а также результаты исследования прикладных моделей информационного управления, в [10, 23] -результаты исследования стабильности и других свойств информационных равновесий и информационного управления, в [1, 7] - моделирование информационных воздействий, в [6] - общая схема исследования задач информационного управления, в [53-62, 66, 67] - метод применения переменных информационных множеств, в [63-65, 68-70] - разделы об управлении активными системами.
»§ 1 О 4 5 9
РНБ Русский фонд
2006-4 7975
Оглавление автор диссертации — доктора физико-математических наук Чхартишвили, Александр Гедеванович
Введение.
Глава 1. Теория игр и проблемы информационного управления в активных системах.
1.1. Теоретико-игровые модели в экономике и управлении.
1.2. Индивидуальное принятие решений: модель рационального поведения.
1.3. Интерактивное принятие решений: игры и равновесия.
1.4. Классификация управлений активными системами.
1.5. Общая постановка задачи информационного управления.
Глава 2. Рефлексивные игры.
2.1. Информационная структура игры.
2.2. Информационное равновесие.
2.3. Граф рефлексивной игры.
2.4. Регулярные структуры информированности.
Глава 3. Информационные равновесия.
3.1. Стабильные информационные равновесия.
3.2. Истинные и ложные равновесия.
3.3. Случай наблюдаемых действий агентов.
3.4. Рефлексивные игры и байесовы игры.
Глава 4. Информационные воздействия.
4.1. Проблемы моделирования информационного воздействия.
4.2. Информационное регулирование и рефлексивное управление
4.3. Активный прогноз.
Глава 5. Информационное управление.
5.1. Классификация задач информационного управления.
5.2. Рефлексивные отображения.
5.3. Стационарность линейных рефлексивных отображений.
5.4. Рефлексивная неманипулируемость механизмов планирования.
5.5. Общая технология постановки и исследования задач информационного управления.
Глава 6. Прикладные модели информационного управления.
6.1. Корпоративное управление.
6.1.1. Производитель и посредник.
6.1.2. Совместное производство.
6.1.3. Конкуренция на рынке.
6.1.4. Аккордная оплата труда.
6.1.5. Продавец и покупатель.
6.1.6. Заказчик и исполнитель.
6.1.7. Активная экспертиза.
6.1.8. Олигополия Курно.
6.1.9. Распределение ресурса.
6.1.10. Страхование.
6.1.11. Конкурс.
6.1.12. Формирование команды.
6.2. Игры поиска.
6.3. «Принцип дефицита».
6.4. Коррупция.
6.5. Биполярный выбор.
6.6. Реклама товара.
6.7. Предвыборная борьба.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Чхартишвили, Александр Гедеванович
Настоящая работа посвящена рассмотрению математических моделей информационного управления в активных системах. Управлением называется воздействие на управляемую систему с целью обеспечения требуемого ее поведения. Активные системы включают в себя людей (отдельных индивидуумов, их группы и коллективы), поэтому управление такой системой заключается в побуждении людей к требуемому поведению. Однако человек самостоятельно принимает решения, значит, для того, чтобы влиять на его поведение, необходимо иметь модель принятия им решений.
Господствующая в науке на протяжении последнего полувека модель принятия субъектом решений (гипотеза рационального поведения) заключается в следующем: субъект стремится выбрать наилучшую в рамках имеющейся у него информации альтернативу. При этом в модель принятия решений входят, как минимум, множество альтернатив, из которого производится выбор, а также предпочтения субъекта на этом множестве, которые обычно описываются функцией полезности.
В случае, когда имеется только один субъект, дело обстоит достаточно просто - считается, что он выбирает из множества допустимых альтернатив такую альтернативу, на которой достигается максимум его функции полезности (выигрыша). Отметим, что при этом существенной является информированность субъекта - та информация, которой он обладает на момент принятия решений о допустимых альтернативах, их предпочтительности, последствиях выбора той или иной альтернативы и т.д.
Если субъектов несколько и выигрыш каждого зависит от выборов всех, то ситуация усложняется — для того чтобы выбрать собственное действие, субъект должен «предсказать», какие действия выберут его оппоненты. Моделями совместного принятия решений субъектами, интересы которых не совпадают, занимается теория игр, одной из основных задач которой является предсказание решения игры - устойчивого в том или ином смысле исхода взаимодействия рациональных субъектов.
Актуальность темы. Задача управления активной системой с теоретико-игровой точки зрения состоит в том, чтобы создать для управляемых субъектов {агентов) игру с такими правилами, чтобы ее исход был как можно более благоприятным для управляющего органа {центра). Поэтому необходимыми этапами решения задачи управления являются теоретико-игровой анализ, позволяющий центру спрогнозировать реакцию управляемой системы на те или иные управляющие воздействия, и синтез оптимального управления.
Теоретико-игровые модели управления активными системами исследовались в работах многих отечественных и зарубежных авторов, среди которых: В.Н. Бурков, А.А. Васин, Ю.Б. Гермейер, В.А. Горелик, Ф.И. Ерешко, В.А. Ириков, В.В. Кондратьев, А.Ф. Кононенко, Н.С. Кукушкин, В.В. Кульба, В.А. Лефевр, Н.Н. Моисеев, Д.А. Новиков, Т.А. Таран, R. Aumann, J. Geanakoplos, J. Harsanyi, N. Howard, E. Maskin, H. Moulin, R. Myerson, J. Sakovics и другие.
Предметом настоящей работы является информационное управление, т.е. воздействие на информированность агентов, осуществляемое центром с целью побуждения их к совершению требуемых для него действий.
Традиционно, начиная с Дж. фон Неймана и Дж. Нэша, в теории игр предполагалось, что все существенные параметры являются общим знанием среди игроков (т.е. известны всем игрокам, всем игрокам известно, что всем это известно и т.д. до бесконечности). В 1968 г. Дж. Харшаньи (J. Harsanyi) ввел в рассмотрение байесовы игры, в которых информированность агентов не является общим знанием. В байесовых играх вся частная (т.е. не являющаяся общим знанием) информация, имеющаяся у агента на момент выбора им своего действия, называется типом агента. При этом каждый агент, зная свой тип, имеет и предположения о типах остальных
Реализация поставленной цели предполагает решение следующих задач:
- общая постановка задачи информационного управления в теоретико-игровой ситуации при наличии нескольких агентов с несовпадающими интересами и различной информированностью;
- описание информированности агентов, включающей их взаимные представления об информированности друг друга (информационную рефлексию); исследование различных вариантов взаимной информированности;
- описание и классификация методов информационного воздействия на агентов;
- разработка теоретико-игровой модели принятия агентами решений на основе их субъективной информированности и решение задачи информационного управления;
- исследование стабильности возникающей в результате осуществления информационного управления теоретико-игровой ситуации с учетом того, что представления агентов могут быть ложными;
- выявление зависимости между рангом информационной рефлексии агентов и возможностями управляющего органа по осуществлению информационного управления;
- разработка комплекса прикладных теоретико-игровых моделей информационного управления в активных системах.
Основным методом исследования является математическое моделирование, базирующееся на использовании аппарата современной теории управления, в частности - системного анализа, теории игр и теории активных систем.
Научная новизна работы состоит в обосновании единого методологического подхода к разработке и исследованию теоретико-игровых моделей информационного управления в активных системах, заключающегося в общности их описания и техники исследования и использующего концепцию информационного равновесия как решения рефлексивной игры управляемых субъектов.
На основе предложенного подхода:
1. Сформулирована общая теоретико-игровая модель информационного управления как целенаправленного формирования у агентов информированности, предопределяющей желательные для центра действия. Разработана концепция информационной структуры: определены и исследованы адекватность, взаимность, одинаковость информированности агентов, а также глубина и сложность информационной структуры.
2. Предложена концепция рефлексивной игры и информационного равновесия, являющегося обобщением равновесия Нэша в некооперативных играх: сформулированы и доказаны достаточные условия существования информационного равновесия. Исследованы условия, при выполнении которых информационное равновесие является стабильным, т.е. когда агенты не меняют своих представлений в результате наблюдения результатов игры.
3.Описаны, классифицированы и исследованы способы осуществления центром информационного воздействия на агентов с целью формирования той или иной структуры информированности — информационное регулирование, рефлексивное управление и активный прогноз.
4. На основании анализа рефлексивных отображений сформулированы условия того, что требуемый управляющему органу результат рефлексивной игры достигается посредством формирования структуры информированности управляемых субъектов, соответствующей не более чем второму рангу их рефлексии.
5.Введено и исследовано свойство рефлексивной неманипулируемости механизмов планирования, заключающееся в существовании подструктур информированности, побуждающих агентов сообщать центру достоверную информацию. Описана и исследована рефлексивная игра поиска подвижного объекта на плоскости, сформулирован и решен ряд задач информационного управления в области корпоративного управления, экономики, маркетинга, политики.
Практическая ценность работы определяется разработанными автором методическими рекомендациями по построению комплекса эффективных прикладных механизмов информационного управления. Разработанные модели и методы информационного управления дают возможность значительно расширить рамки применения теории игр в управлении реальными активными системами, повысить эффективность управления ими.
Общность использованного подхода к разработке и исследованию моделей информационного управления позволяет распространить полученные в диссертационном исследовании теоретические и прикладные результаты на широкий круг активных систем и может служить основой переноса результатов решения практических задач из одних областей в другие.
Исследования по теме диссертационной работы проводились в соответствии с планами научных исследований Института проблем управления им. В.А. Трапезникова РАН в рамках координационных планов научных исследований РАН.
Апробация работы. Основные результаты докладывались и обсуждались на конференциях и симпозиумах «Лобачевский и современная геометрия» (Казань, 1992), «Понтрягинские чтения-IV» (Воронеж, 1993), «Когнитивное моделирование переговорного процесса» (Москва, 1997), «Функциональные пространства. Дифференциальные операторы. Проблемы математического образования. Международная конференция, посвященная 75-летию Л.Д. Кудрявцева» (Москва, 1998), «Инвариантные методы исследования на многообразиях структур геометрии, анализа и математической физики. Международная конференция, посвященная 90-летию со дня рождения Г.Ф. Лаптева» (Москва, 1999), «Современные сложные системы управления» (Липецк, 2002; Старый Оскол, 2002; Воронеж, 2003; Тверь, 2004), «Когнитивный анализ и управление развитием ситуаций» (Москва, 2002, 2003, 2004), «Проблемы управления безопасностью сложных систем» (Москва, 2002, 2003, 2004), «Теория активных систем» (Москва, 2003), «Рефлексивные процессы и управление» (Москва, 2003), «Вторая международная конференция по проблемам управления» (Москва, 2003), «Нелинейная динамика процессов и систем» (Липецк, 2003), «Идентификация систем и задачи управления» (Москва, 2003), «Математическое моделирование социальной и экономической динамики» (Москва, 2004), семинарах Московского государственного университета, Института проблем управления РАН, Российской экономической школы, Московского физико-технического института, Центрального экономико-математического института РАН и ряде других конференций и семинаров.
Публикации. По теме работы опубликовано 70 научных работ общим объемом более 90 печатных листов. В том числе: монографии «Теоретико-игровые модели информационного управления», «Рефлексивные игры», «Активный прогноз», «Прикладные модели информационного управления» и учебники для вузов «Математические методы в управлении» и «Математические методы и модели в управлении», а также 16 статей в ведущих рецензируемых научных журналах, рекомендованных ВАК.
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и списка литературы. Работа содержит 256 страниц текста, включая 40 рисунков и 1 таблицу. Список использованной литературы включает 207 наименований.
Заключение диссертация на тему "Теоретико-игровые модели информационного управления в активных системах"
ЗАКЛЮЧЕНИЕ
На основании выполненных исследований разработаны теоретические положения, совокупность которых можно квалифицировать как новый крупный вклад в развитие информационного управления активными системами. В работе обоснован единый методологический подход к разработке и исследованию теоретико-игровых моделей информационного управления в активных системах, заключающийся в общности их описания и техники исследования и использующий концепцию информационного равновесия как решения рефлексивной игры управляемых субъектов. Проведенный анализ позволяет сделать вывод, что рассмотрение взаимной информированности агентов дает возможность, во-первых (с нормативной точки зрения), расширить множество рациональных исходов их игры, что, в свою очередь, увеличивает эффективность управления (а также иногда позволяет достичь достоверности сообщаемой агентами информации). Во вторых (с дескриптивной точки зрения), многие наблюдаемые на практике ситуации, которые не могут быть интерпретированы как «обычные» равновесия Нэша в условиях общего знания, являются информационным равновесием. На основе предложенного подхода:
1) сформулирована общая теоретико-игровая модель информационного управления как целенаправленного формирования у управляемых субъектов информационной структуры, предопределяющей желательные для управляющего органа действия;
2) разработана концепция информационной структуры, описывающей информированность субъектов о существенных параметрах ситуации и о представлениях оппонентов; определены и исследованы адекватность, взаимность, одинаковость информированности агентов, а также глубина и сложность структуры информированности;
3)для описания зависимости между информационной структурой и набором действий участников игры предложена концепция информационного равновесия, являющегося обобщением равновесия Нэша в некооперативных играх; сформулированы и доказаны достаточные условия существования информационного равновесия;
4) исследовано свойство стабильности информационного равновесия, при выполнении которого управляемые субъекты не меняют своих представлений в результате наблюдения результатов игры.
5) показано, что ограниченность ранга рефлексии является необходимым условием рационального принятия решения: если ранг рефлексии бесконечен, то любое допустимое действие является равновесным;
6) описаны, классифицированы и исследованы способы осуществления центром информационного воздействия на агентов с целью формирования той или иной структуры информированности — информационное регулирование, рефлексивное управление и активный прогноз;
7) на основании анализа рефлексивных отображений сформулированы условия, при выполнении которых требуемый управляющему органу результат рефлексивной игры достигается посредством формирования структуры информированности управляемых субъектов, соответствующей не более чем второму рангу их рефлексии;
8) введено и исследовано свойство рефлексивной неманипулируемости механизмов планирования, состоящее в существовании таких подструктур информированности, что при любых типах управляемых субъектов сообщение ими достоверной информации является информационным равновесием;
9) описана и исследована рефлексивная игра поиска подвижного объекта на плоскости, найдены максимально целесообразные ранги рефлексии ищущего и уклоняющегося игроков;
10) сформулированы и решены прикладные задачи информационного управления в области экономики, маркетинга, политики и т.д. (в том числе - комплекс моделей информационного управления в корпоративных структурах).
Библиография Чхартишвили, Александр Гедеванович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Автономов B.C. Модель человека в экономической науке. СПб.: Экономическая школа, 1998. - 230 с.
2. Айзеке Р. Дифференциальные игры. М.: Мир, 1967.
3. Айзерман М.А., Алескеров Ф.Т. Выбор вариантов: основы теории. М.: Наука, 1990. 236 с.
4. Анисимов О.С. Методологическая культура педагогической деятельности и мышления. Москва, 1991. 168 с.
5. Анисимов О.С. Методология: функции, сущность, становление. М.: РАГС, 1996. 380 с.
6. Бестужев-Лада И.В. Окно в будущее. М.: Мысль, 1970. 269 с.
7. Бондаревская Е.В., Кульневич С.В. Педагогика: личность в гуманистических теориях и системах воспитания. Ростов н/Д: Творческий центр «Учитель», 1999. 560 с.
8. Бурков В.Н. Основы математической теории активных систем. М.: Наука, 1977.-255 с.
9. Бурков В.Н., Данев Б., Еналеев А.К. и др. Большие системы: моделирование организационных механизмов. М.: Наука, 1989. 245 с.
10. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы стимулирования в вероятностных моделях социально-экономических систем // Автоматика и Телемеханика. 1993. № 11. С. 3 30.
11. И. Бурков В.Н., Еналеев А.К., Новиков Д.А. Механизмы функционирования социально-экономических систем с сообщением информации // Автоматика и Телемеханика. 1996. № 3. С. 3 25.
12. Бурков В.Н., Заложнев А.Ю., Кулик О.С., Новиков Д.А. Механизмы страхования в социально-экономических системах. М.: ИПУ РАН, 2001.
13. Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. М.: СИНТЕГ, 2001.
14. Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Управление риском: механизмы взаимного и смешанного страхования // Автоматика и Телемеханика. 2001. № 1 о. С. 125 131.
15. Бурков В.Н., Ириков В.А. Модели и методы управления организационными системами. М.: Наука, 1994. 270 с.
16. Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. М.: Наука, 1981.
17. Бурков В.Н., Новиков Д.А. Как управлять организациями. М.: СИНТЕГ, 2003.
18. Бурков В.Н., Новиков Д.А. Как управлять проектами. М.: СИНТЕГ, 1997.
19. Бурков В.Н., Новиков Д.А. Теория активных систем: состояние и перспективы. М.: СИНТЕГ, 1999.
20. Васин А.А., Гурвич В.А. Коалиционные ситуации равновесия в метаиграх / Вестник МГУ. Вычислительная математика и кибернетика. 1980. №3. С. 38-44.
21. Вилкас Э.Й. Оптимальность в играх и решениях. М.: Наука. 1990.-256 с.
22. Вишнев С.М. Основы комплексного прогнозирования. М.: Наука, 1977.-289 с.
23. Воронин А.А., Мишин С.П. Оптимальные иерархические структуры. М.: ИЛУ РАН, 2003.-210 с.
24. Выборное Р.А., Чхартишвили А.Г. Активный прогноз как средство управления // Труды XLV научной конференции МФТИ. 29-30 ноября 2002 г., Долгопрудный: МФТИ, 2002, часть I — с. 61.
25. Выборное Р.А., Чхартишвили А.Г. Рефлексивная модель коррупции // Современные сложные системы управления (HTCS'2004): Материалы IV международной конференции. — Тверь: ТГТУ, 2004. С. 186-189.
26. Гвишиани Д., Лисичкин В. Прогностика. М.: Знание, 1968. — 112 с.
27. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976.
28. Гламаздин Е.С., Новиков Д.А., Цветков А.В. Механизмы управления корпоративными программами: информационные системы и математические модели. М.: Спутник+, 2003.
29. Горелик В.А., Горелов М.А., Кононенко А.Ф. Анализ конфликтных ситуаций в системах управления. М.: Радио и связь, 1991. -288 с.
30. Горелик В.А., Кононенко А.Ф. Теоретико-игровые модели принятия решений в эколого-экономических системах. М.: Радио и связь, 1982.- 144 с.
31. Громыко Ю.В. Оргдеятельностные игры и развитие образования / Технология прорыва в будущее. М.: Независимый методологический университет, 1992.- 191 с.
32. Губайдуллин С.М., Чхартишвили А.Г., Шикин Е.В. Геометрические свойства следящей области в задачах поиска // Тезисы докладов международной конференции «Лобачевский и современная геометрия», Казань, 18-22 августа 1992 г. Часть 1. 1992. С. 27-28.
33. Губко М.В. Механизмы управления организационными системами с коалиционным взаимодействием участников. М.: ИПУ РАН, 2003.
34. Губко М.В., Новиков Д.А. Теория игр в управлении организационными системами. М.: СИНТЕГ, 2002. — 148 с.
35. Данилов В.И. Лекции по теории игр. М.: Российская экономическая школа, 2002. 140 с.
36. Ерешко Ф.И., Лохныгина Ю.В. Рефлексивные стратегии в системах управления / Труды Юбилейной международной научнопрактической конференции «Теория активных систем». Общая редакция В.Н.Бурков, Д.А.Новиков. М.: СИНТЕГ, 1999. С. 211 -213.
37. Ерешко Ф.И., Лохныгина Ю.В. Исследование моделей рефлексивных стратегий в управляемых системах. М.: ВЦ РАН, 2001. 37 с.
38. Ерешко Ф.И. Моделирование рефлексивных стратегий в управляемых системах. М.: ВЦ РАН, 2001. 37 с.
39. Зимбардо Ф., Ляйппе М. Социальное влияние. СПб.: Питер, 2000.
40. Информационное общество: Информационные войны. Информационное управление. Информационная безопасность / Под ред. М.А. Вуса. Спб.: Издательство С.-Петербургского университета, 1999. -212 с.
41. Казанцев С.Б., Новиков Д.А., Чхартишвили А.Г. Об условиях стационарности линейных рефлексивных отображений // Системы управления и информационные технологии. 2004. № 5. С. 20 22.
42. Казанцев С.Б., Чхартишвили А.Г. О достаточных условиях стационарности рефлексивных отображений // Труды XLVI научной конференции МФТИ. 28-29 ноября 2003 г., Долгопрудный: МФТИ, 2003, часть 1-е. 83.
43. Казанцев С.Б., Чхартишвили А.Г. Технология теоретико-игрового исследования задач информационного управления // Труды XLVII научной конференции МФТИ. Долгопрудный: МФТИ, 2004, часть I. С. 98.
44. Караваев А.П. Модели и методы управления составом активных систем. М.: ИПУ РАН, 2003.
45. Ким Д.П. Методы поиска и преследования подвижных объектов. М.: Наука, 1989.
46. Козелецкий Ю. Психологическая теория решений. М.: Прогресс, 1979.-504 с.
47. Кононенко А.Ф., Халезов А.Д., Чумаков В.В. Принятие решений в условиях неопределенности. М.: ВЦ АН СССР, 1991. 197 с.
48. Коргин Н.А. Неманипулируемые механизмы обмена в активных системах. М.: ИПУ РАН, 2003.
49. Крылов В.Ю. Методологические и теоретические проблемы математической психологии. М.: Янус-К, 2000.
50. Кукушкин Н.С. Роль взаимной информированности сторон в играх двух лиц с непротивоположными интересами // ЖВМ и МФ.1972. Т. 12. № 4. С. 1029 1034.
51. Кукушкин Н.С., Морозов В.В. Теория неантагонистических игр. М.: МГУ, 1984.
52. Кульба В.В., Малюгин В.Д., Шубин А.Н., Bye М.А. Введение в информационное управление. СПб.: Изд-во С.-Петербургского ун-та, 1999.
53. Лезина З.М. Манипулирование выбором вариантов: теория агенды // Автоматика и телемеханика. 1985. № 4. С. 5 22.
54. Лефевр В.А. Исходные идеи логики рефлексивных игр /Материалы конференции «Проблемы исследования систем и структур». М.: Издание АН СССР, 1965.
55. Лефевр В.А. Конфликтующие структуры. М.: Советское радио,1973.- 158 с.
56. Лефевр В.А. Космический субъект. М.: Институт психологии РАН, 1997.
57. Лефевр В.А. Формула человека. Контуры фундаментальной психологии. М.: Прогресс, 1991. 108 с.
58. Лефевр В.А. Алгебра совести. М.: «Когито-Центр», 2003. -426 с.
59. Лефевр В.А. Рефлексия. М.: «Когито-Центр», 2003. 496 с.
60. Лысаков А.В., Чхартишвили А.Г. Рефлексивные модели переговоров // Системы управления и информационные технологии — 2003. -№ 1-2(12).-С. 53-57.
61. Мазманова Б.Г. Основы теории и практики прогнозирования. Екатеринбург: ИПК УГТУ, 1998. 128 с.
62. Майерс Д. Социальная психология. СПб.: Питер, 2001. — 752 с.
63. Малишевский А.В. Качественные модели в теории сложных систем. М.: Наука, 1998.
64. Мартино Д. Технологическое прогнозирование. М.: Прогресс, 1977.-591 с.
65. Мулен Э. Кооперативное принятие решений: аксиомы и модели. М.: Мир, 1991.
66. Найн А.Я. Рефлексивное управление образовательным учреждением. Шадринск: Исеть, 1999. -328 с.
67. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. — 708 с.
68. Новиков Д.А. Динамика поведения систем с большим числом целенаправленных элементов // Автоматика и Телемеханика. 1996. № 4. С. 187- 189.
69. Новиков Д.А. Механизмы стимулирования в динамических и многоэлементных социально-экономических системах // Автоматика и Телемеханика. 1997. № 6. С. 3 26.
70. Новиков Д.А. Закономерности итеративного научения. М.: ИПУ РАН, 1998.
71. Новиков Д.А. Институциональное управление организационными системами. М.: ИПУ РАН, 2003.
72. Новиков Д.А. Механизмы функционирования многоуровневых организационных систем. М.: Фонд «Проблемы управления», 1999.
73. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999.
74. Новиков Д.А. Сетевые структуры и организационные системы. М.: ИЛУ РАН, 2003.
75. Новиков Д.А., Смирнов И.М., Шохина Т.Е. Механизмы управления динамическими активными системами. М.: ИЛУ РАН, 2002.
76. Новиков Д.А. Стимулирование в организационных системах. М.: СИНТЕГ, 2003.
77. Новиков Д.А. Стимулирование в социально-экономических системах (базовые математические модели). М.: ИЛУ РАН, 1998.
78. Новиков Д.А., Цветков А.В. Механизмы стимулирования в многоэлементных организационных системах. М.: Апостроф, 2000.
79. Новиков Д.А., Цветков А.В. Механизмы функционирования организационных систем с распределенным контролем. М.: ИЛУ РАН, 2001.
80. Новиков Д.А., Чхартишвили А.Г. Активный прогноз. М.: ИЛУ РАН, 2002.
81. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры. М.: СИНТЕГ, 2003.
82. Новиков Д.А., Чхартишвили А.Г. Рефлексивные игры: математическое моделирование // Рефлексивные процессы и управление. Тезисы IV международного симпозиума 7-9 октября 2003 г., Москва. М.: Изд-во «Институт психологии РАН», 2003. - С. 108-111.
83. Новиков Д.А., Чхартишвили А.Г. Информационное равновесие: точечные структуры информированности // Автоматика и Телемеханика-2003.-№ 10.-С. 111-122.
84. Новиков Д.А., Чхартишвили А.Г. СМИ и информационное управление // Современные сложные системы управления (CCCY/HTCS'2003): Сборник трудов научно-практической конференции Воронеж, ВГАСУ - Т. 2. - 2003. - С. 383-385.
85. Новиков Д.А., Чхартишвили А.Г. Нелинейные рефлексивные отображения // Труды Международной научно-практической конференции «Нелинейная динамика технологических процессов и систем». Липецк: ЛГТУ, 22-24 декабря 2003 года. С. 31-37.
86. Новиков Д.А., Чхартишвили А.Г. Модель формирования команды // Информационная экономика и управление динамикой сложных систем: Сборник научных трудов. М.: Изд-во «Бизнес-Юнитек», 2004. С. 26-39.
87. Новиков Д.А., Чхартишвили А.Г. Рефлексия и ее математическое моделирование // Информационная экономика и управление динамикой сложных систем: Сборник научных трудов. М.: Изд-во «Бизнес-Юнитек», 2004. С. 271 283.
88. Новиков Д.А., Чхартишвили А.Г. Прикладные модели информационного управления. М.: ИПУ РАН, 2004. — 129 с.
89. Новиков Д.А., Чхартишвили А.Г. Принятие решений, рефлексия, информационное управление // Когнитивный анализ и управление развитием ситуаций. Труды 4-й Международной конференции. М.: ИПУ РАН, 2004. Том 1.С. 114-118.
90. Новиков Д.А., Чхартишвили А.Г. Модели рефлексивного принятия решений // Проблемы управления. 2004. № 4. С. 62 70.
91. Новиков Д.А., Чхартишвили А.Г. Рефлексия в механизмах планирования // Системы управления и информационные технологии2004. №5. С. 27-38.
92. Новиков Д.А., Чхартишвили А.Г. Стабильность информационного равновесия в рефлексивных играх // Автоматика и Телемеханика.2005. №3. С. 125- 132.
93. Овчинникова Т.И., Чхартишвили А.Г. Рефлексивные модели страхования / Управление большими системами. Сборник трудов. Выпуск 6. М.: ИЛУ РАН, 2004. С. 96-104.
94. ОлейникА.Н. Институциональная экономика. М.: ИНФРА-М, 2000.-416 с.
95. Опойцев В.И. Равновесие и устойчивость в моделях коллективного поведения. М.: Наука, 1977.
96. Оуэн Г. Теория игр. М.: Мир, 1971.-230 с.
97. Петраков С.Н. Механизмы планирования в активных системах: неманипулируемость и множества диктаторства. М.: ИПУ РАН, 2001.
98. Петросян JT.A., Гарнаев А.Ю. Игры поиска. СПб., Изд-во С.-Пб. ун-та, 1992.
99. Петросян JT.A., Зенкевич Н.А., Семина Е.А. Теория игр. М.: Высшая школа, 1998.-304 с.
100. Пиндайк Р., Рубинфельд Д. Микроэкономика. М.: Дело, 2001 -808 с.
101. Поппер К. Нищета историзма. М., 1993.
102. Прогностика. Терминология. М., 1990.
103. Рабочая книга по прогнозированию / Под ред. И.В. Бестужева-Лады. М., 1982.
104. Расторгуев С.П. Философия информационной войны. М.: Вузовская книга, 2001. 468 с.
105. Рефлексивное управление / Сборник статей Международного симпозиума. М.: Институт психологии РАН. 17-19 октября. 2000 г. -192 с.
106. Рефлексивные процессы / спецвыпуск журнала «Прикладная эргономика». 1994. № 1.
107. Рефлексивные процессы и управление / Тезисы III Международного симпозиума 8-10 октября 2001 г., М.: ИП РАН, 2001. 242 с.
108. Рудык Н.Б. Поведенческие финансы или между страхом и алчностью. М.: Дело, 2004, 272 с.
109. Саймон Г. Науки об искусственном. М.: Мир, 1972. 147 с.
110. Саркисян С.А., Голованов JI.B. Прогнозирование развития больших систем. М.: Статистика, 1975. 192 с.
111. ИЗ. Сидельников Ю.В. Теория и практика экспертного прогнозирования. М.: ИМЭМО РАН, 1990.-195 с.
112. Симонов К.В. Политический анализ. М.: Логос, 2002. - 152 с.
113. Сластенин В.А., Подымова Л.С. Педагогика: инновационная деятельность. М.: Магистр, 1997. 224 с.
114. Советский Энциклопедический словарь. М.: Советская энциклопедия, 1988. 1599 с.
115. Сорос Д. Алхимия финансов. М.: ИНФРА-М, 1999. 416 с.
116. Статистическое моделирование и прогнозирование / Под ред. А.Г. Гранберга. М.: Финансы и статистика, 1990. 383 с.
117. Сэндидж Ч., Фрайбургер В., Ротцолл К. Реклама: теория и практика. М.: Прогресс, 1989.
118. Таран Т.А. Логические модели рефлексивного выбора // Автоматика и Телемеханика. 2001. № 10. С. 103 117.
119. Твисс Б. Прогнозирование для технологов и инженеров. М.: 2000.-255 с.
120. Тейл Г. Прикладное экономическое прогнозирование. М.: Прогресс. 1970.-509 с.
121. Тейл Г. Экономические прогнозы и принятие решений. М.: Статистика, 1971. — 488 с.
122. Тырсиков Д.В. Методика развития интеллектуальной рефлексии у школьников. Ставрополь: ИРО, 1999. — 32 с.
123. Тюков А.А. Рефлексия в науке и в обучении. Новосибирск: НГУ, 1984.-124 с.
124. Харшаньи Д., Зельтен Р. Общая теория выбора равновесия в играх. СПб.: Экономическая школа, 2001. — 405 с.
125. Чалдини Р. Психология влияния. СПб.: Питер, 2001. 288 с.
126. Чхартишвили А.Г. Об одном геометрическом свойстве следящей области в задачах поиска // Вестник Московского университета. Серия 1. Математика. Механика. 1992. - № 3. - С. 7-10.
127. Чхартишвили А.Г. О траекториях уклонения на плоскости // Вестн. Моск. ун-та. Сер. 1, Математика. Механика. 2000. № 3. С. 64-66.
128. Чхартишвили А.Г. Стабильное информационное управление // Современные сложные системы управления CCCY/HTCS'2002: Сборник трудов международной научно-технической конференции. Липецк, 2002.-С. 115-117.
129. Чхартишвили А.Г. Моделирование информационного управления // Современные сложные системы управления CCCY/HTCS'2002: Сборник трудов международной научно-технической конференции. -Старый Оскол, 2002. С. 130.
130. Чхартишвили А.Г. Информационное равновесие / Управление большими системами. Сборник трудов. Выпуск 3. М.: ИПУ РАН, 2003. С. 100-119.
131. Чхартишвили А.Г. Рефлексивные игры и информационное равновесие в активных системах // Современные сложные системы управления (CCCy/HTCS'2003): Сборник трудов научно-практической конференции Воронеж, ВГАСУ - Т. 1. - 2003. - С. 21-25.
132. Чхартишвили А.Г. Информационная и стратегическая рефлексия в интерактивном принятии решений // Вторая международная конференция по проблемам управления (17—19 июня 2003 г.): Тезисы докладов в двух томах. Т. 1. М.: ИПУ, 2003. - С. 113.
133. Чхартишвили А.Г. Моделирование информационной рефлексии в активных системах // Теория активных систем / Труды международной научно-практической конференции. (17-19 ноября 2003 г., Москва, Россия). Т. 1. М.: ИПУ РАН, 2003. - С. 80-82.
134. Чхартишвили А.Г. Структуры информированности бесконечной глубины и равновесие Байеса-Нэша // Когнитивный анализ иуправление развитием ситуаций (CASC'2002). Труды 3-й Международной конференции в 2-х томах. Том 2. М.: ИЛУ РАН, 2003. - С. 109— 115.
135. Чхартишвили А.Г. Равновесие Байеса-Нэша: точечные структуры информированности бесконечной глубины // Автоматика и Телемеханика -2003. -№ 12.
136. Чхартишвили А.Г. Об одной рефлексивной игре поиска / Управление большими системами. Сборник трудов. Выпуск 5. М.: ИПУ РАН, 2003.-С. 123- 128.
137. Чхартишвили А.Г. Информационное управление и принятие решений // Современные проблемы информатизации в непромышленной сфере и экономике: Сб. трудов. Вып. 9. Воронеж: Изд-во «Научная книга», 2004. С. 51-52.
138. Чхартишвили А.Г. Роль информированности агентов / Раздел 5.4 в «Институциональное управление организационными системами». М.:ИПУ РАН, 2004. С. 40-54.
139. Чхартишвили А.Г. Пример управления нормами деятельности / Раздел 5.5 в «Институциональное управление организационными системами». М.:ИПУ РАН, 2004. С. 54-61.
140. Чхартишвили А.Г. Рефлексивная игра «аккордная оплата труда» / Управление большими системами. Сборник трудов. Выпуск 6. М.: ИПУ РАН, 2004. С. 143-149.
141. Чхартишвили А.Г. Стабильное информационное равновесие // Современные сложные системы управления (HTCS'2004): Материалы IV международной конференции. Тверь: ТГТУ, 2004. - С. 477-479.
142. Чхартишвили А.Г. Рефлексивные модели переговоров / Раздел 6.2 в «Договорные отношения в управлении проектами». М.:ИПУ РАН, 2004. С. 74-86.
143. Чхартишвили А.Г. Рефлексия в художественных произведениях // Современные сложные системы управления (HTCS'2004): Материалы V международной конференции. Краснодар, 2004. - С. 26-29:
144. Чхартишвили А.Г. Теоретико-игровые модели информационного управления. М.: ПМСОФТ, 2004. 227 с.
145. Чхартишвили А.Г. О теоретико-игровом моделировании информационного управления // Когнитивный анализ и управление развитием ситуаций. Труды 4-й Международной конференции. М.: ИПУ РАН, 2004. Том 1. С.119 123.
146. Чхартишвили А.Г. Стабильность информационного равновесия и управление социально-экономическими системами / Труды международной научно-практической конференции «Проблемы управления безопасностью сложных систем». М.: ИПУ РАН, 2004. С. 191-192.
147. Чхартишвили А.Г. «Принцип дефицита»: всегда ли нарушается рациональность? / Управление большими системами. Сборник трудов. Выпуск 9. М.: ИПУ РАН, 2004. С. 143 149.
148. Чхартишвили А.Г., Шикин Е.В. Задачи поиска и обнаружения на некоторых поверхностях // Понтрягинские чтения-IV. Весенняя воронежская математическая школа, 3-8 мая 1993 г. Тезисы докладов. Воронеж, 1993. С. 205.
149. Чхартишвили А.Г., Шикин Е.В. Метод следящих областей в задачах поиска // Математический сборник. 1993. - Т. 184, № 10. - С. 107-134.
150. Чхартишвили А.Г., Шикин Е.В. Динамические задачи поиска и обнаружения на некоторых замкнутых поверхностях // Дифференциальные уравнения. 1993. -Т. 29, № 11.-С. 1948-1957.
151. Чхартишвили А.Г., Шикин Е.В. Следящая область в пространстве Лобачевского // Вестник Московского университета. Серия 1. Математика. Механика. 1994. — № 2. - С. 36—41.
152. Чхартишвили А.Г., Шикин Е.В. Об одном геометрическом подходе к решению динамических игр поиска // Дифференциальные уравнения. 1994. - Т. 30, № 6. - С. 1097-1098.
153. Чхартишвили А.Г., Шикин Е.В. О простых играх поиска на бесконечном круглом цилиндре // Математические заметки. — 1995. Т. 58, №5. -С. 762-772.
154. Чхартишвили А.Г., Шикин Е.В. Динамический поиск объектов. Геометрический взгляд на проблему // Фундаментальная и прикладная математика. 1995. - Т. 1, Вып. 4. - С. 827-862.
155. Чхартишвили А.Г., Шикин Е.В. Динамические игры простого поиска // Квант. 1996. № 1. С. 6-12.
156. Чхартишвили А.Г., Шикин Е.В. Поисковая проблематика. Геометрический взгляд // Международная геометрическая школа-семинар. Абрау-Дюрсо, 27 сентября 4 октября 1996 г. Тезисы докладов. Ростов-на-Дону, 1996. С. 94.
157. Чхартишвили А.Г., Шикин Е.В. Геометрия поисковых задач с информационной дискриминацией // ВИНИТИ, серия «Современная математика и приложения. Тематические обзоры». 1996. Т. 32. Динамические системы.
158. Чхартишвили А.Г., Шикин Е.В. О математических курсах в ИГУиСИ // Вестник Московского университета. Серия 18. Социология и политология. 1997. - № 1. - С. 69-74.
159. Чхартишвили А.Г., Шикин Е.В. Математические методы в управлении. М.: УГЛ, 1997 г.
160. Чхартишвили А.Г., Шикин Е.В. Математические методы и модели в управлении. М.: УГЛ, 1997 г.
161. Чхартишвили А.Г., Шикин Е.В. Геометрические методы решения задач динамического поиска // Международная конференция по геометрии «в целом», г. Черкассы (Украина). Тезисы докладов. Черкассы, 1997. С. 87.
162. Шейнов В.П. Скрытое управление человеком (психология манипулирования). М.: ООО «Издательство ACT», 2002. 848 с.
163. Шеманов А.Ю. Самоидентификация на пороге «осевых времен» (к интерпретации модели рефлексии В. Лефевра) / От философии жизни к философии культуры. СПб., 2001. С. 137 158.
164. Шикин Е.В., Чхартишвили А.Г. Математические методы и модели в управлении. — М.: Дело, 2000 г. 440 с.
165. Шикин Е.В., Чхартишвили А.Г. Математические методы и модели в управлении. 2-е изд, испр. - М.: Дело, 2002 г. - 440 с.
166. Шикин Е.В., Чхартишвили А.Г. Математические методы и модели в управлении. 3-е изд, испр. - (Сер. «Классический университетский учебник») - М.: Дело, 2004 г. - 440 с.
167. Шрейдер Ю.А. Человеческая рефлексия и две системы этического сознания. // Вопросы философии. 1990. № 7. С. 32 42.
168. Щедровицкий Г.П. Принципы и общая схема методологической организации системно-структурных исследований и разработок / Системные исследования. М., 1981. С. 193 -227.
169. Эйрес Р. Научно-техническое прогнозирование и долгосрочное планирование. М.: Мир, 1971. — 295 с.
170. Ambroszkiewicz S. On the concepts of rationalizability in games // Annals of Operations Research. 2000. № 97. P. 55 68.
171. Aumann R.J. Agreeing to disagree // The Annals of Statistics. 1976. Vol. 4. №6. P. 1236- 1239.
172. Aumann R.J. Interactive epistemology I: Knowledge // International Journal of Game theory. 1999. № 28. P. 263 300.
173. Aumann R.J., Brandenbunger A. Epistemic conditions for Nash equilibrium // Econometrica. 1995. Vol. 63. № 5. P. 1161 1180.
174. Bernheim D. Rationalizable strategic behavior // Econometrica. 1984. №5. p. Ю07- 1028.
175. Chkhartishvili A.G, Novikov D.A. Reflexive mappings and nonlinear dynamics / Proceedings of the International Conference «Mathematical modeling of Social and Economical Dynamics». Moscow: RSSU, 2004. P. 91-92.
176. Dasgupta P., Hammond P., Maskin E. The implementation of social choice rules: some general results on incentive compatibility // Review of Economic Studies. 1979. Vol. 46. № 2. P. 185 -216.
177. Fagin R., Halpern J., Moses Y., Vardi M.Y. Reasoning about knowledge. Cambridge: MIT Press, 1995.
178. Fagin R., Halpern J., Moses Y., Vardi M.Y. Common knowledge revisited // Annals of Pure and Applied Logic. 1999. Vol. 96. P. 89 105.
179. Fagin R., Halpern J., Vardi M.Y. A model-theoretic analysis of knowledge // Journal of Assoc. Comput. Mach. 1991. Vol. 38. № 2. P. 382 -428.
180. Fudenberg D., Tirole J. Game theory. Cambridge: MIT Press, 1995. -579 p.
181. Geanakoplos J. Common Knowledge / Handbook of Game Theory. Vol. 2. Amsterdam: Elseiver, 1994. P. 1438 1496.
182. Halpern J., Moses Y.O. Knowledge and common knowledge in a distributed environment // Journal of Assoc. Comput. Mach. 1990. Vol. 37. № 3. P. 549-587.
183. Harsanyi J. Games with incomplete information played by "Bayes-ian" players // Management Science. Part I: 1967. Vol. 14. № 3. P. 159 -182. Part II: 1968. Vol. 14. № 5. p. 320 334. Part III: 1968. Vol. 14. № 7. P. 486-502.
184. Hart O.D., Holmstrom B. Theory of contracts // Advances in economic theory. 5-th World Congress. Cambridge: Cambridge Univ. Press, 1987. P. 71-155.
185. Howard N. Theory of meta-games / General systems. 1966. №11. P. 187-200.
186. Howard N. "General" metagames: an extension of the metagame concept / Game theory as a theory of conflict resolution. Dordrecht: Reidel, 1974. P. 258-280.
187. Jenkins G.M. Some practical aspects of forecasting in organizations //Journal of forecasting. 1982. Vol. 1. P. 3 -21.
188. Lewis D. Convention: a philosophical study. Cambridge: Harvard University Press, 1969.
189. Mas-Colell A., Whinston M.D., Green J.R. Microeconomic theory. N.Y.: Oxford Univ. Press, 1995.
190. Mertens J.-F., Zamir S. Formulation of Bayesian analysis for games with incomplete information // Int. J. Game Theory. 1985. № 14. P. 1 29.
191. Morris S. Approximate common knowledge revisited // International Journal of Game Theory. 1999. Vol. 28. P. 385 408.
192. Morris S., Shin S.S. Approximate common knowledge and coordination: recent lessons from game theory // Journal of Logic, Language and Information. 1997. Vol. 6. P. 171 190.
193. Myerson R.B. Game theory: analysis of conflict. London: Harvard Univ. Press, 2001. 4th printing - 568 p.
194. Nash J.F. Non-cooperative games / Ann. Math. 1951. Vol. 54. P. 286-295.
195. Novikov D., Chkhartishvili A. Models of reflexive decision-making / Systems Sciense. Vol. 30. No. 2. 2004. P. 45 59.
196. Pearce D.G. Rationalizable strategic behavior and the problem of perfection // Econometrica. 1984. № 5. 1029 1050.
197. Sakovics J. Games of incomplete information without common knowledge priors // Theory and decision. 2001. № 50. P. 347 366.
198. Schelling T.S. The Strategy of Conflict. Cambridge, Mass.: Harvard University Press/
199. Simon R.S. The difference of common knowledge of formulas as sets // International Journal of Game Theory. 1999. Vol. 28. P. 367 384.
-
Похожие работы
- Разработка системы информационной и программно-технической поддержки принятия решений в конфликтных ситуациях
- Теоретико-игровые модели на линейных когнитивных картах в задачах информационного управления
- Лингвистическое обеспечение игровой обучающей информационной системы
- Исследование и разработка теоретико-игровых моделей распределенных систем принятия решений
- Модели и алгоритмы поддержки принятия управленческих решений в системах комплексной безопасности многофункциональных высотных зданий
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность