Динамика информационных процессов в неантагонистических играх

Мохонько, Елена Захаровна

Теоретические основы информатики

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Динамика информационных процессов в неантагонистических играх

доктора физико-математических наук: Мохонько, Елена Захаровна
город: Москва
год: 1997
специальность ВАК РФ: 05.13.17

Диссертация по информатике, вычислительной технике и управлению на тему «Динамика информационных процессов в неантагонистических играх»

Текст работы Мохонько, Елена Захаровна, диссертация по теме Теоретические основы информатики

РОССИЙСКАЯ АКАДЕМИЯ НАУК ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР

На правах рукописи

МОХОНЬКО Елена Захаровна

ДИНАМИКА ИНФОРМАЦИОННЫХ ПРОЦЕССОВ В НЕАНТАГОНИСТИЧЕСКИХ ИГРАХ

05.13.17 - Теоретические основы информатики

Диссертация на соискание ученой степени доктора физико-математических наук

Научный консультант д. ф.-м. н., профессор Кононенко А.Ф.

Москва 1997

Ыо

ОГЛАВЛЕНИЕ

Введение.................................................... 4

Глава 1. Дискретный и непрерывный режимы получения

информации в повторяющейся игре............35

1. Зависимость множества ситуаций равновесия от

ограничений на время наблюдения...................40

2. О необходимом времени наблюдения в динамической

игре с дополнительным платежом................... 53

Глава 2. Управление режимами получения информации в

неантагонистической дифференциальной игре..117

3. Введение в задачу................................. 11Т

4. Справочные материалы пд.. позиционным

дифференциальным играм............................121

5. Ситуация равновесия в гэ - стратегиях..............139

6. Об одном частном случав гз - стратегий...;.........158

Глава 3. Дифференциальные игры как средство

исследования свойств информации............184

7. О зависимости полезности информации от свойств получателя............. .............................184

Глава 4. О дифференциальной игре с неточным знанием

терминального выигрыша............................214

8. Игровая модель классического и граничного

информационных случаев............................218

Заключение..................................................276

• Литература ........................................278

Приложение , Информация и воспринимающие системы...........291

ВВЕДЕНИЕ

Динамические игры стали уже обычным инструментом исследователей, занимающихся анализом всевозможных конфликтных ситуаций. Примеры игровых динамических моделей конфликтных ситуаций многочислены: [107, 111, 108, 109, 23, 82, 113, 110, 112, 114, 79, 105, 117, 118, 106, 130, 60, 56, 123, 127].

Особый интерес вызывают динамические модели неантагонистическйх конфликтных ситуаций. Они имеют хорошие перспективы использования, т. к. по мере развития человеческого общества и его гуманизации большинство конфликтов осознаются как именно неантагонистические конфликты. В создание хорошо развитой теории неантагонистических динамических игр существенный вклад внесли такие зарубежные исследователи как Базар Т., Кейз Д.Х., Круз Д., Мицуками К., Олсдер Г., Толвинский В. [104,32, 83, 119, 131] и отечественные ученые Горелик В. А., Жуковский В. И., Кононенко А. Ф., Малафеев О.А., Меньшиков И.О., Петросян Л. А., Тынянский Н. Т., и их ученики Захаров В. В., Кузютин Д.В., Чистяков Ю.Е. и др. [16, 17 , 8 , 22 , 33 , 44 , 46, 128 , 23, 116 , 96, 107, 120 , 25,403.

Ее развитие стало возможным также и благодаря успехам ученых, работавших в области теории антагонистических динамических игр: [41, 47, 72, 74, 75, 77,78,81,95,103,19,20,29,115,43,45,70, 76,86,132,97]. Математический аппарат, который они развивают, во многих случаях является основой для построения моделей более общих неантагонистических конфликтов.

При построении моделей приходится игнорировать многие черты реальных моделируемых явлений, чтобы найти и предложить

способ разрешения конфликта "в принципе". Но при внедрении рекомендованных решений в жизнь важные неучтенные особенности моделируемого объекта могут сделать найденное решение непригодным. Такими особенностями, в частности, являются временные режимы при которых участники конфликта способны получать и обрабатывать информацию. Например, в модели может быть предусмотрено, что игроки получают точную информацию непрерывно и немедленно на нее реагируют. Но при реализации модели может наблюдаться медленная обработка полученных сведений, сведения поступают с запаздыванием, а управляющие воздействия осуществляются не непрерывно, а через определенный промежуток времени. Все эти особенности могут привести к тому, что партнер отклонится от предлагаемого моделью поведения и договор будет нарушен, несмотря на то, что при непрерывном режиме получения информации и реагирования на нее (как это предполагается в модели) договор действительно бы выполнялся и его нарушение не было бы выгодно никому.

Изучение допустимых режимов получения информации необходимо и тогда, когда имеет место обратная картина: используя неточную информацию, получаемую в отдельные моменты времени , а не непрерывным образом, игроки получают те же результаты, что и при непрерывном получении информации.

Это очень полезное свойство рассматриваемого конфликта в тех случаях, когда точную информацию получить трудно или она дорогая, а непрерывное получение, обработка информации и принятие по ней управляющих решений трудноосуществимы. Но насколько неточной может быть при этом информация в разные

моменты времени, как редко можно ее получать, каков оптимальный режим получения при характерной для данного участника конфликта скорости обработки информации и принятии управляющего решения? Эти вопросы актуальны для участников конфликта.

Таким образом, по мере развития теории моделирования динамических конфликтов и формализации их решения возникает необходимость включения в модель и исследования более тонких, но существенных черт. Такими чертами конфликта являются допустимые и оптимальные временные режимы, т. е. динамика получения информации и принятия управляющих решений участников, обладающих конкретными способностями и особенностями своих воспринимающих систем. Возникает необходимость строить модели, с помощью которых наряду с динамикой хода конфликта нужно исследовать и динамику получения информации и принятия управляющих решений.

Естественно считать оптимальным такой режим получения информации и управления^ при котором управляемая система выполняет свою функцию наилучшим образом и при этом не разрушается раньше времени. Можно высказать гипотезу, что каждая система управления (СУ) имеет свой оптимальный информационный режим. Он в большинстве случаев отличается от оптимальных режимов для СУ других управляемых систем. Оптимальные режимы могут быть самые разные. Например, режим непрерывного получения точной информации или дискретный, с запаздывающей информацией.

Дж. Форрестер в [913, продемонстрировал неоптимальность режима получения точной информации без запаздывания для той

управляемой системы "производящий продукцию завод - склада -магазины по продаже продукции", которую он рассмотрел в книге.

Можно привести и другие примеры, демонстрируещие важность оптимальных информационных режимов. Соционики констатируют [26 ], что успех или неуспех сотрудничества людей зависит, в частности, от частоты и мощности поступаемого от партнера сигнала. Если они оптимальны для человека данного типа, то, скорее всего, сотрудничество, взаимопонимание будет хорошим.

По-видимому, внедрение ЭВМ и современных средств связи, уменьшающее запаздывание и неточность информации, не всегда приводит к улучшению работы существующей системы управления. При таком внедрении, хотя бы для того, чтобы сохранить эффективность работы системы на прежнем уровне, требуется изменение способов управления. Например, могут быть необходимы периоды игнорирования поступающей информации, или ее агрегирование и управление по этой агрегированной информации. Возможно также, что требуется перестройка структуры всей управляемой системы. Значит, изменение информационных режимов -это разрушающий старые и создающий новые структуры фактор, а тот период, который мы все сейчас переживаем - период внедрения ЭВМ и современных средств связи - это время, когда исследования по определению допустимых и оптимальных режимов получения информации и управления являются особенно необходимыми. Всегда ли желательны такие разрушения?

Надо определить реальную опасность неоптимального информационного воздействия как средства разрушения.

Простейшие информационные системы не могут игнорировать

поступающую информацию. Очевидно, почему такая система может погибнуть, если информация поступает реже, чем при оптимальном режиме. Но опасно и более частое поступление информации именно из-за неспособности эту информацию игнорировать. Простейшая воспринимающая система начинает реагировать чаще, чем необходимо, неправильно взаимодействует со средой, быстро изнашивается сама. И в результате гибнет. А ведь человек состоит из множества простых информационных подсистем.. Кроме того, даже он не всегда способен игнорировать поступающую информацию.

Опасность этого явления и в том, что, поскольку оно не осознается, гибель людей и других живых существ, а также социально -экономических и информационных технических систем из - за неоптимального информационного воздействия воспринимается как естественная, как ненасильственная смерть. Следовательно, не принимаются никакие меры по защите от такого воздействия. Возникает вопрос, а не является ли количество гибнущих от неоптимального информационного воздействия людей сравнимым с количеством людей, гибнущих от тяжелых болезней, от эпидемий?

Обратим внимание на то, что приходится исследовать явление, которое может быть вредно одновременно как для живых существ, так и для социально - экономических и технических систем.

Тут говорится только об оптимальных режимах информационного воздействия и ничего не говорится о том, что содержание информации тоже может быть средством как положительного так и отрицательного воздействия на воспринимающую систему. По-видимому, эта сторона явления хорошо знакома научным

работники гуманитарных профессий. Отметим только, что некоторые моральные нормы - это стихийный учет того, что для нормального развития человека некоторые истины о мире следует узнавать в определенном возрасте, не раньше, и не позже.

По - видимому, нужно создавать новую науку - информационную экологию. Для ее развития необходимо объединять усилия научных работников как технических, так и гуманитарных профессий, и, особенно тех, кто профессионально занимается информационными явлениями, например, специалистов в области исследования операций.

Оказанное дает основания полагать, что тематика диссертационной работы, как и все исследования, связанные с изучением допустимых и оптимальных информационных режимов являются актуальными как с теоретической^ так и с прикладной точек зрения.

Естественная схема исследований динамики получения информации и принятия управляющих решений при учете особенностей воспринимающих систем участников

неантагонистического конфликта такова.

1.Выяснить, все ли моменты получения информации важны, нельзя ли без какой-либо информации обойтись. Первой работой в теории не антагонистических игр, в которой исследовались данные вопросы, была работа А. Ф. Кононенко С353.

2.Выяснить, в какие моменты и насколько неточной и запаздывающей может быть информация, на основании которой принимаются управляющие решения, чтобы эти недостатки информации не влияли отрицательно на результат неантагонистического конфликта.

3.Определить допустимые и оптимальные в том или ином смысле режимы получения информации при данных особенностях в работе систем восприятия участников неантагонистического конфликта.

4.Зафиксировать ограничения на способность воспринимать информацию. Выяснить, какие конфликты при этом ограничении уже нельзя будет успешно довести до конца, а какие - все -таки можно.

5.Реальны небольшие отклонения от договора, связанные с неблагоприятными внешними условиями, не зависящими от участников неантагонистического конфликта. Как такие небольшие отклонения скажутся на оптимальных режимах получения информации?

6.Оценить полезность получаемой информации для участников неантагонистического конфликта в разные моменты времени, определить факторы^ от которых эта полезность зависит.

7.Исследовать оптимальные режимы получения информации разного качества, а именно рассмотреть более сложные информационные потоки.

Приведем такой пример. Информация - это результат определенного воздействия на субъект и того, как субъект данное воздействие расшифровал. Кодом расшифровки является модель мира. Мир изменяется, изменяется и его модель. Как часто субъекту необходимо менять модель мира, т. е. код расшифровки информационных воздействий? В этом случае субъект сталкивается с необходимостью работать с двумя информационными потоками. Первый поток -это информационные воздействия, связанные с ходом неантагонистического конфликта, второй - это информация об изменениях в

мир©.

8.И, конечно, такие исследования дают возможность углубить понимание самого явления информации, ее природы.

Целью данной работы является разработка схемы исследования и математического аппарата для решения задач оптимизации динамики получения информации и принятия управляющих решений при учете особенностей систем восприятия информации участников неантагонистического динамического конфликта.

В диссертации рассматриваются повторяющиеся неантагонистические игры и дифференциальные неантагонистические игры. В диссертации исследуются повторяющиеся игры с непрерывным временем, с побочными платежами и без побочных платежей.

Как отмечается в [291, сейчас можно выделить два направления в развитии динамических игр. Первое -углубленное изучение задач в традиционных постановках (например, разработка численных методов поиска решения игры). Во втором "широко изучаются новые постановки задач. В частности, задачи, при которых расширен класс действий игроков, усложнены ограничения на поведение игроков". Рассматриваемые в диссертации игры вписываются во второе направление.

Они возникли как естественное развитие идей Воробьева H.H. С101, Гермейера Ю.Б.[12,133 Моисеева H.H. [153, а также других исследователей, изучавших игры с неполной информацией, с памятью, с запаздыванием информации, с помехами, с возможностью получать дискретную информацию в непрерывной игре. Назовем хотя бы монографии Красовского Н. Н., Субботина А.ИЛ413, Куржанского А. Б. [433, Петросяна Л. А.[743, Черноусько Ф.Л.,

Меликяна А. А.[953, работы Кононенко А. Ф. [35, 36], §3 главы I из диссертации Клейменова А.Ф. [303.

Сформулируем основные результаты исследований автора, содержащиеся в диссертации.

1 .Рассмотрена неантагонистическая повторяющаяся игра без дополнительного платежа. В ней суммарное время Т, которое игрок может потратить на наблюдение за партнером меньше длительности игры. Определено как изменяется множество ситуаций равновесия в зависимости от величины Т, насколько оно уменьшается по сравнению со случаем непрерывного получения информации (п.1. из

1 гл.).

2.Определены оптимальные режимы получения информации в повторяющейся игре с непрерывным временем и дополнительным платежом (п.2 из гл. I ).

3.Для повторяющихся игр без дополнительного платежа и с дополнительным платежом доказана непрерывная зависимость минимального суммарного времени, соответственно, Т^) и Т(д,К) от величин д и К, характеризующих ситуацию равновесия и дополнительный платеж (п.2 из гл.1 ).

Показано, что величина изменения минимального суммарного времени на возмущающее воздействие зависит от момента этого воздействия и от самой рассматриваемой ситуации равновесия ( п.

2 из гл. I ).

4. В неантагонистической дифференциальной игре показано, с какой частотой необходимо получать информацию о ходе игры, какие неточность и запаздывание допустимы, чтобы сохранить существующую в этой игре ситуацию равновесия в позиционных

стратегиях (гл. II).

5.На примере трех неантагонистических дифференциальных игр показано существование зависимости прагматической ценности информации от свойств получателя информации (гл. III).

6. Рассмотрена неантагонистическая дифференциальная игра с уточняемым по ходу игры видом функции цели. Дано определение Мг - стратегии. Она позволяет управлять игрой , используя как сведения о фазовых координатах игры, так и информацию -уточнение вида целевой функции. Найдены Мг-стратегии, образующие ситуацию равновесия и позволяющие получать приблизительно тот выигрыш, который намечался в начале игры (гл. IV).

7. Выработаны идеи воспринимающей системы, волн изменений, нового способа всесторонней качественной оценки получаемой информации, идея относительности информации ( приложение ).

Диссертация состоит из введения, четырех глав, 8 параграфов, заключения, списка цитированной литературы и приложения.

Первая глава посвящена повторяющимся играм. Повторяющиеся игры изучались в различных постановках, в частности, их рассматривали Гермейер Ю.В., Кононенко А.Ф., Стронгин Р.Г., Штильман М.С., Партхасаратхи Т. (И43, [343, С9ЭЗ, С393, [53, [743). В данной работе рассматриваются повторяющиеся игры с непрерывным временем.

Первая глава состоит из двух пунктов. Второй пункт разбит на более мелкие пункты.

В__пункте__первом рассматривается повторяющаяся игра

с непрерывным временем, протекающая на отрезке [0,13.

■ь

Похожие работы

Информатика, вычислительная техника и управление
05.13.00