Информационные модели двухуровневых иерархических систем, функционирующих в условиях неопределённости

Родюков, Александр Витальевич

Теоретические основы информатики

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Информационные модели двухуровневых иерархических систем, функционирующих в условиях неопределённости

кандидата физико-математических наук: Родюков, Александр Витальевич
город: Борисоглеб
год: 2009
специальность ВАК РФ: 05.13.17

Диссертация по информатике, вычислительной технике и управлению на тему «Информационные модели двухуровневых иерархических систем, функционирующих в условиях неопределённости»

Автореферат диссертации по теме "Информационные модели двухуровневых иерархических систем, функционирующих в условиях неопределённости"

На правах рукописи

РОДЮКОВ Александр Витальевич

ИНФОРМАЦИОННЫЕ МОДЕЛИ ДВУХУРОВНЕВЫХ ИЕРАРХИЧЕСКИХ СИСТЕМ, ФУНКЦИОНИРУЮЩИХ В УСЛОВИЯХ НЕОПРЕДЕЛЁННОСТИ

05.13.17 - теоретические основы информатики

Автореферат диссертации на соискание учёной степени кандидата физико-математических наук

- з ДЕК 2

МОСКВА 2009

003486038

Работа выполнена на кафедре прикладной математики и информатики

физико-математического факультета ГОУ ВПО "Борисоглебский государственный педагогический институт"

Научный руководитель

Официальные оппоненты

Ведущая организация

доктор физико-математических наук профессор

ТАРАКАНОВ Андрей Фёдорович

доктор физико-математических наук старший научный сотрудник МОХОНЬКО Елена Захаровна

кандидат физико-математических наук КУЗНЕЦОВ Олег Анатольевич

Учреждение Российской академии наук Институт проблем управления им. В.А. Трапезникова РАН

Защита состоится «21» декабря 2009 г. в 17 ч. 00 мин. на заседании Диссертационного совета Д 212.154.32 при Московском педагогическом государственном университете по адресу: 107140, г. Москва, ул. Краснопрудная, д.14, математический факультет МШ У, ауд. 301.

С диссертацией можно ознакомиться в библиотеке Московского педагогического государственного университета по адресу: 119992, г. Москва, ул. Малая Пироговская, д. 1.

Автореферат разослан «20» ноября 2009 г.

Ученый секретарь Диссертационного совета уу/^"" МУРАВЬЕВА О.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность. Информатизация современного общества - объективный, постоянно расширяющийся и углубляющийся процесс, причём практически не имеющий временных границ. Поэтому одной из важнейших задач является создание и исследование информационных моделей, информационных структур и характеризующих их процессов.

Построение информационной модели какой-либо системы (процесса) основано на сборе и обработке информации, установлении информационных взаимосвязей между её структурными элементами. Многие реальные модели разрабатываются как оптимизационные с целью экономии ресурсов, обеспечения эффективного функционирования системы. Значит определение оптимальных решений, установление их свойств и условий оптимальности являются главными этапами процесса исследования информационных моделей.

Наиболее сложными и в меньшей степени изученными являются информационные модели организационных систем, непосредственными участниками которых являются люди, объединенные общей целью, которая достигается на основе обговорённых правил обмена информацией. С 60-х годов прошлого века такие модели начали изучаться в формальном виде на основе системного анализа - нового научно обоснованного метода исследования сложных систем, разработанного академиком Н. Н. Моисеевым.

Построением теоретических основ информационных моделей организационных систем на основе различных подходов занимались Гермейер Ю. Б., Горелик В. А., Журавлев Ю. И., Краснощекое П. С., Кононенко А. Ф., Матросов В. Л., Моисеев Н. Н., Мохонько Е. 3., Петров А. А., Рудаков К. В., Федоров В. В. и другие. Работы Буркова В. Н., Новикова Д. А. и их сотрудников в этой области посвящены исследованиям в рамках теории активных систем.

Построение моделей с передачей информации представляет собой сложный процесс, который характеризуется количеством участников, их взаимоотношениями, определением порядка принятия решений и целями на каждом этапе. Необходимость точной фиксации соответствующих предположений об информации в каждый момент принятия решения позволяет создать правильное представление о процедурах и способах принятия решений. Очевидно, что само понятие оптимального решения может преобразовываться с изменением уровня информированности, так как, поведение лица, принимающего решение (ЛПР), является функцией от той информации, которой он располагает на данный момент времени.

Исследование информационных систем в рамках общей теории принятия решений является составной частью научной дисциплины "Теоретические основы информатики" (ТОЙ), в которой изучаются процессы создания, накопления и обработки информации, методы преобразования информации в данные и знания.

Как известно, многие организационные системы имеют иерархическую структуру, когда имеется руководящий Центр (на верхнем уровне иерархии) и исполняющая его решения подсистема (на нижнем уровне). Возникновение иерархической структуры обусловлено, как правило, трудностями для единого управляющего Центра своевременно собрать и обработать информацию об управляемых процессах. Это приводит к потере полноты и актуальности информации, что негативно сказывается на качестве решений, поэтому Центр предоставляет определённые права принятия решений подсистемам, которые на своём уровне используют достоверную информацию.

Важной особенностью функционирования иерархических систем является наличие различного рода возмущений или неконтролируемых факторов, и тогда говорят, что ЛПР действует в условиях неопределённости.

Исходя из информированности ЛПР, в системном анализе выделяют две группы неконтролируемых факторов: случайные и неопределённые. Неопределённые факторы характеризуются лишь областью возможных значений и являются наиболее часто встречающимися на практике, поэтому их учёту посвящено большое количество работ, например, Горелика В. А., Жуковского В. И., Кононенко А. Ф., Куржанского А. Б., Новиковой Н. С., Федорова В. В.

Возникновение неопределённости в процессе принятия решения можно объяснить тем, что при построении математической модели учесть всё множество ограничений, в рамках которых протекает процесс, зачастую просто не представляется возможным, а также при передаче информации может происходить частичная её потеря или искажение, из-за чего при обмене ею вероятны конфликтные ситуации. Однако в процессе принятия решения возникающий конфликт не подразумевает непременное столкновение противоположных интересов, но в первую очередь является способом взаимодействия сложных систем, побуждает их к обмену информацией. В частности, это становится причиной появления в формальной постановке задачи принятия решения многих целей, многих критериев оптимальности.

В настоящее время наибольший интерес представляют исследования иерархических систем в условиях неопределённости, которые, помимо неоднозначности выбора решений, включают неоднозначность внешней среды ("природы"). Дополнительные особенности вносит и независимая активность подсистем нижнего уровня. Для анализа иерархических систем был развит и стал общепринятым теоретико-информационный подход. Дополнительный учёт неопределённых факторов даёт новые возможности для анализа моделей управляемых процессов и решения проблем обработки и передачи информации. Такие модели являются одними из основных видов информационных моделей, рассматриваемых в ТОЙ.

В информационной модели иерархической системы задача Центра состоит в том, чтобы в процессе функционирования системы в условиях неопределённости добиться максимального гарантированного значения своего критерия эффективности. Данная цель при фиксированном способе передачи информации с заданными интересами нижнего уровня приводит к задаче определения максимина на связанных множествах (см., например, работы Гермейера Ю. Б, Горелика В. А., Новиковой Н. С., Федорова В. В.).

Решение задачи Центра можно определить с двух позиций: в виде пошагового описания взаимодействия или в виде равновесия структуры "Центр-Подсистема". В рамках указанных выше подходов различные равновесия в иерархических системах (моделях) при неопределённости исследовались, например, в работах Баратовой Е. Д. и Тараканова А. Ф., Кукушкина Н. С., Чумакова В. В. В трудах Новикова Д. А. и Чхартишвили А. Г. рассматривалась концепция построения информационного равновесия в рефлексивных моделях принятия решений в случае взаимной информированности о значении неопределённости и о представлениях других участников.

Как показано в работах Жуковского В. И. и Салуквадзе М. Е. качество решения ЛПР можно оценивать не только значением его критерия, но и значением функции риска. Первоначально термин "риск" применялся в экономике и характеризовал возможные потери в результате принятия решения из-за недостаточной

информированности ЛПР. В работах Бардина А. Е. и Жуковской Л. В. показано, что и в других областях приходится принимать решения, связанные с риском, он оказывается неизбежным, уклониться от рисковых решений просто невозможно.

Общее однозначное определение понятия риска дать сложно, и скорее всего невозможно из-за широкого спектра использования данного термина. Например, по определению Жуковского В. И., риск - это возможность отклонения каких-либо величин от желаемых значений, возможность ненаступления каких-либо ожидаемых событий.

Современный взгляд на понятие "риск" основан на предположении, что он вызывается тем или иным действием ЛПР, а также наличием неопределённости, которая дополнительно может появляться из-за неполной информированности относительно параметров внешней среды и о принципах поведения других объектов модели. Оценка величины риска (значение функции риска) характеризует возможные потери ЛПР (не обязательно финансовые). Риск может оцениваться критерием минимаксного сожаления, который впервые предложил Savage L.Y. (1951) для принятия решений в однокритериальных статических задачах. За меру риска берётся разница между максимальным возможным значением показателя эффективности функционирования процесса и его реализовавшимся значением.

Иерархические модели принятия решения с передачей информации в условиях неопределённости с риском ранее не рассматривались.

Резюмируя вышесказанное, можно утверждать, что направления, связанные с исследованием иерархических моделей с передачей информации, являются перспективными как в плане развития собственно информационной теории сложных систем, так и в плане приложений к практике. Поэтому актуальная научная задача заключается в построении информационных моделей иерархических систем с передачей информации в условиях неполной информации о внешней среде, формализации соответствующих решений на основе понятия риска, изучении их свойств и получении условий оптимальности.

В диссертации решения формализуются с двух позиций: 1) описание информационного взаимодействия (указанием правил обмена информацией и порядка ходов), 2) реализация равновесия в системе (на основе соответствующего определения). Определённые позиции определили и способы получения условий оптимальности - на основе принципа Лагранжа и аппарата штрафных функций. Заметим, что метод штрафов, как способ снятия разнообразных ограничений и связей, позволяет решать проблемы, связанные и с наличием в задачах неопределённых параметров, и этот факт играет существенную роль.

Объектом исследования являются организационные системы, функционирующие в условиях неопределённости.

Предмет исследования - информационные модели двухуровневых иерархических систем с передачей информации при неопределённости с использованием функций риска, процессы принятия решений в таких системах, их свойства и условия оптимальности.

Целью диссертации является построение математических информационных моделей двухуровневых иерархических систем, функционирующих в условиях неопределённости, формализация процессов принятия решений в них с использованием функций риска, установление свойств этих решений, получение условий оптимальности и демонстрация их работоспособности на модельных примерах.

В основу исследования положена следующая гипотеза: с учётом способов взаимодействия и передачи информации между уровнями иерархии (внутренние свойства системы) в условиях неопределённости, зафиксированных в математической модели иерархической системы, могут быть определены содержательные понятия решений с использованием функций риска, получены условия оптимальности и алгоритмы решения.

Для достижения поставленной цели и проверки гипотезы потребовалось решить следующие задачи:

1) определить решения с использованием функций риска (в форме описания информационного взаимодействия и в форме равновесия);

2) установить свойства указанных решений;

3) установить свойства индивидуальной и суммарной функций риска;

4) построить необходимые условия оптимальности решений, найти коэффициентные критерии в линейно-квадратичном случае;

5) построить алгоритмы, позволяющие численно решать задачи оптимизации в иерархических моделях.

Методологическую основу настоящего исследования составляют: выпуклый анализ, теория матриц, теория оптимизации, системный анализ, теория риска, информационная теория иерархических систем.

Научную новизну диссертации составляют результаты исследования моделей двухуровневых иерархических систем с передачей информации при неопределённости с учётом индивидуальных рисков и суммарного риска участников иерархической системы на основе теоретико-информационного подхода. Эти результаты относятся к области исследования специальности 05.13.17 - теоретические основы информатики:

• исследование информационных структур, разработка и анализ моделей информационных процессов и структур.

Практическая значимость исследования заключается в прикладной актуальности исследования информационных моделей иерархических систем. Используемый теоретико-информационный подход позволяет с достаточной степенью адекватности строить модели иерархических систем при неопределённых факторах, отвечающих реальным представлениям. Предложенные пути к выработке оптимальных решений на основе понятия равновесия и схем информационного взаимодействия учитывают различные ситуации, которые могут встречаться на практике, а использование критерия оптимальности в виде функции риска соответствует тому, что решения приходится принимать в условиях неопределённости.

Основные положения, выносимые на защиту:

1. Анализ моделей информационного взаимодействия уровней иерархии в условиях неопределённости на основе принципов благожелательности и максимального гарантированного результата с использованием функций риска.

2. Анализ моделей взаимодействия Центра с подсистемами в условиях неопределенности при бескоалиционном и кооперативном вариантах взаимоотношений подсистем с использованием функций риска.

3. Обоснование метода штрафных функций для исследования информационных моделей иерархических систем с передачей информации в условиях неопредёленности (теоремы сходимости и оценка скорости сходимости).

4. Теоремы о необходимых условиях оптимальности решения Центра в условиях неопредёленности на основе принципов благожелательности и максимального гарантированного результата.

5. Свойства равновесия между уровнями иерархии в условиях неопределённости и необходимые условия оптимальности равновесия на основе принципа Лагранжа.

Апробация. Результаты, полученные в диссертации, докладывались на следующих международных конференциях: «Системы компьютерной математики и их приложения», (Смоленск, СмолГУ, 2008, 2009); V Московской международной конференции по исследованию операций (Москва, ВЦ им. А. А. Дородницына РАН, 2007); «Управление большими системами» (Москва, ИПУ им. В. А. Трапезникова РАН, 2007,2009); «Информационные и коммуникационные технологии в образовании IX» (Борисоглебск, ГОУ ВПО «БГПИ», 2008).

Материалы работы представлялись на XXXVIII региональной молодежной школе-конференции "Проблемы теоретической и прикладной математики" (Екатеринбург, Институт математики и механики, 2007); Воронежской весенней математической школе «Современные методы теории краевых задач. Понтрягинские чтения XVIII, XIX» (Воронеж, ВГУ, 2007, 2008); научно-практических семинарах кафедры прикладной математики и информатики (Борисоглебск, ГОУ ВПО «БГПИ», 2004-2009); семинарах по теории управления организационными системами (Москва, ИПУ им. В. А. Трапезникова РАН, 2007-2009); семинаре отдела информационно-вычислительных систем в секторе математического моделирования конфликтных ситуаций (Москва, ВЦ им. А. А. Дородницына РАН, 2009).

Публикации. Основное содержание диссертационного исследования опубликовано в 14 работах, из них 4 статьи в ведущих рецензируемых научных журналах по специальности 05.13.17, рекомендованных ВАК.

Структура работы. Работа состоит из введения, трёх глав, заключения и списка использованной литературы в алфавитном порядке, содержащего 114 источников. Полный объём диссертации составляет 151 страница, основная часть - 140 страниц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность исследования информационных моделей иерархических систем в условиях неопределённости и формулируется научная задача, определяется цель работы, выдвигается положенная в основу исследования гипотеза, формулируются математические задачи, которые необходимо решить для реализации поставленной цели и проверки выдвинутой гипотезы, указывается методологическая основа исследования, раскрывается его научная новизна и практическая значимость, выдвигаются основные положения, выносимые на защиту, представлено основное содержание работы.

В первой главе строится общая информационная модель принятия решений в двухуровневой иерархической системе, создаваемой для разделения функций обработки информации и принятия решений в условиях неопределённости с использованием функций риска.

Предполагается, что нижний уровень иерархии представлен одним участником -подсистемой. Разработан необходимый математический аппарат и доказываются теоремы о сходимости метода штрафных функций для снятия ограничений в задаче вычисления максимального гарантированного результата Центра в предположении однозначности реакции нижнего уровня.

В пункте 1.1 осуществляется построение информационной модели двухуровневой иерархической системы в условиях неполной информации о внешней среде, заданной набором

(м = {1Л},х„х2,г,х2,у)}м:1). 0)

Множество М содержит номера участников: 1 - Центр и 2 - подсистема, х = (х,,х2) -ситуация, образованная значениями х, б Х1 с Л"', которые выбирают участники, уеТсЯ" - неопределённый фактор, функция выигрыша задана непрерывной на К" хЯ" (« = «,+ п2) скалярной функцией /,{х,у), Я* {к = щ,п2,т) - евклидово векторное пространство. В совокупности функции /](х,у) образуют векторный критерий /(х,у) = (/х(х,у),/2(х,у)). Все множества Хп У считаются компактными. Функции х,у) непрерывны по совокупности переменных на Х,хУ.

Предполагается, что цель каждого элемента иерархической системы - оценка выбранной им стратегии с точки зрения возможных потерь, которые вычисляются с помощью следующих функций риска:

г,«*,

Рг (*,. . У) = /2 (*,. *2. У)-тах /2 (ж,, г2, у) < 0.

'2 "г

Множества стратегий Центра и подсистемы задаются в виде X, = {х, е Я"' | Ял(х() г ОД = Ш , <= 1,2, где функции g¡k непрерывно дифференцируемы и удовлетворяют условию р-регулярности.

Содержательно процесс информационного взаимодействия уровней иерархии основан на следующих предположениях. Анализ модели (1) производится с позиции Центра с учётом его субъективных представлений о подсистеме и информационных процессах на основе имеющейся у него информации. Центр задаёт значение при этом ему известно множество Х2 стратегий подсистемы и его функция риска. Центру и подсистеме при выборе своих стратегий известно лишь множество У возможных значений неопределённого фактора, из-за чего они ориентируются на реализацию наихудшего значения неопределённости, при которой для любых х, е Х1 их функции риска будут принимать минимальные значения ш^(х,,х2,>>), / = 1,2.

уеГ

Способ построения подсистемой своей стратегии заключается в построении функции от управления Центра, реализующей максимум своей функции Г2(х1,х2,у) в ответ на любое решение Центра х, е X,. В результате реакция подсистемы (его реакция на х,) описывается отображением

Л(х,) = {х2° е Х2\ттР2{хх,х1,у) = т&хттРг{хх,г2,у)}. (2) Предполагается, что множество /?(*,) при фиксированном х, состоит из одного элемента

*?(*,) = аг§ тах тт Р2(хгх2,у). Тогда максимальный гарантированный результат (минимальный риск) Центра равен т',Р(х°>х2 (х°)>У) = тах тю^(х„х2°(х1),7) = . (3).

уег х1еХ1 уеУ

В случае однозначной реакции нижнего уровня существования оптимальной стратегии достаточно непрерывности /,(хпх2,у) на произведении компактов Хх х Х2 х У. Так как оптимальное значение критерия Центра является главной целью, то

возможно снять все ограничения, связанные с деятельностью подсистемы, с помощью метода штрафных функций.

Пункт 1.2 посвящен описанию метода штрафных функций и получению необходимых условий оптимальности для модели (1). В п. 1.2.1 введён критерий Ф(х,, хг, z2) = min F, (х, ,х2,у)- min F. (х, ,z2,y),

позволяющий Центру вычислить оптимальную стратегию подсистемы, а равенство тахттФ(х],х2,г2) = 0 можно рассматривать как дополнительное ограничение в задаче

определения гарантирующей стратегии Центра.

Операции минимума в выражении Ф снимаются внешними штрафными функциями

<р21(х1,х2,со21,Л1) = т 2i - Л, J(min[0, F2 (х, , х2, у) - co2i }fa(dy), / = 1,2,

которые дифференцируемы по переменным xi,x1,z2,a>h и вогнуты по co2l, а также монотонно неубывают по Л.. Здесь Я, >О - параметры штрафа, переменные со2],а>22 принимают значения из отрезка [а,Ь\, заведомо для любых (х,,х2) б!,хХг содержащего minF2(x,,x2,>>), а er - мера в метрическом пространстве Rm z>Y такая,

уеГ

что непустое пересечение Y с любым открытым множеством из Rm имеет положительную меру, а мера У конечна.

Пусть й^Дхр^Д) - точки глобального максимума функций <р2Дх^^.й^Д,) при фиксированных х,, £2, Л1 > 0. Далее доказывается теорема, обосновывающая первый этап используемой формы метода штрафов:

Теорема 1. Для любых фиксированных (х, ,^2)еХ,хХ2 имеют место равенства Иm <u2, (х,, £ Д ) = lim max <р2,(х,,&,со2,Д) = minF2(х,,g2,y), / = 1,2.

Полученный результат позволяет ввести функцию

min ц/{х„ х2, z2, т2,, о22 Д ,Л,) = тт[р2Дх,,.х2,,а21, А,) - q>22 (х,z2, со22

и методом штрафов снять операцию минимума:

ф(х^,х1,и,ш2Х,со11,Л,Л2,р) = u-р J[min(0,v/(x1,x2,22,G)2,,fi>22,/i,,/ij)-a)]2<T(ife2)-

х,

Тогда критерий

L (х„ х2, и, со2,, ®22 Д, Лз, = min F, (х,, х2, у) + ф (х,, х2, и, <а2,, а>22 Д, Л?, ц) сводит задачу max min ,F(x,, х\ (х,),у) к задаче max max minF.(x,,x2,;y) при

Jtie^i У=-У л.е V, >еУ

ограничении ф(х^,х2,и,со21,а22,Л1,Л2,/л) = 0.

Теорема 2. Для любых х, е , Л,,Я2,/г > 0 имеет место равенство

= max min F. (x,, x2 (x,), y) — lim lim max ¿(х.,х2,м,й)2|,£У22Д,Я,,р).

XjeX, vc.У Л, Si—**- ß-*?- jt,еЛ"|

xltX, flSU ,£Ü22 ÄA

Наконец, штрафные функции АДх,) = ¿(min[0,gli(xj)])2, / = 1,2, снимают ограничения

на стратегии (замена их штрафами представляет собой элемент моделирования информационной системы и позволяет оценить стоимость нарушения ограничений):

L(ä1,ä2,/j,jj)= max (L(x¡,x2,u,o}2],co22,AvÁ2,M)-Tj(hí(xí) + h2(x2)).

«¡sí"2 aZu,w1i,a>J1iA

Оценка скорости сходимости метода штрафов с помощью формулы £(ái,á2,/j,tj) = L(ái,/L2,/í,t;)-w'' к0 даёт условия согласования штрафных констант. Теорема 3. Имеет место равенство

lim L{l.,L,u,n)=max max min F. (x,, x,, y) = .

¿,,¿¡./1.Ч-*» L J.eJT, Xi*Xi yer

iücJi,,

В п. 1.2.2 максиминная задача (3) сводится к семейству (по всем штрафным параметрам) обычных задач на максимум:

где

V(x,, xv и, а,, й>2, , an, Л,, Л,, ц, Tj,v) = a,-v J[min(0, Fl (х, ,хг,у)-о\)\a(dy) +

+ U-/и J-j min(0, [а2] - А, I(min[0, F2 (х, ,х2,у)-а>21 ])2 o(dy) -

~0гг + Л2 |(min[0,F2(x„z2,y)~ &22]fa(dy)}-и) j a{dz2)-r¡(h1(x,) +к(x2)),

v > 0 - параметр штрафа.

Затем доказывается теорема о необходимых условиях оптимальности. Теорема 4. Пусть е X¡ и w" - соответственно оптимальный выбор Центра и гарантированная оценка его эффективности при передаче информации в информационной модели (1). Тогда существуют неотрицательные ограниченные суммируемые функции хА.У), ZiÍA)' ХЛгиУ)> XÁ^,y) и числам >0, ¿6>0 такие, что

у ох, 8х1

+ j{ ¡¿i (*, > >) (*?' > >y)~^F2 . . №2) = 0,

¡ZM^-F^xlxlyMdy) + ZtJLg2t(x°2) + у дх2 дх2

У X,

¡¡хЛъ

хгг хгу

В п. 1.2.3 приведён пример.

В пункте 1.3 на основе индивидуальных функций выигрыша в случае однозначной реакции подсистемы формулируется определение равновесия в виде тройки

(л:,0, (лс,), >"0), что даёт возможность получить векторную гарантию по значению неопределённого фактора и условия оптимальности, а также изучить свойства предлагаемого равновесия.

Определение. Тройку (xj,x2(xj),ya) назовём равновесием в информационной модели, заданной набором (1), если выполняются следующие условия:

а) неопределённость у" е У минимальна по Слейтеру, то есть при фиксированных (х°,х2) для любых уеУ несовместна система неравенств

|/2 (*,", *2 > / ) > /2 (*1° . 4 > У)>

б) выполняются равенства

/2(х,,х2(*,),/) = шах /2(х,,х2,у°), Vx, е X,,

л2еЛ2

xiexi

Пункт 1.3.1 посвящен выводу необходимых условий оптимальности на основе принципа Лагранжа с ограничениями на стратегии участников. Вводится функции Лагранжа

к , х2 (х,), у,Л) = А (х,, х2 (х,), у) + (Л, g, (х,)}, h (*,, х2, у, И) = /2 (ж,,*2, у) + {ц> g2 (*2)), где Л,р>0 - векторные множители Лагранжа, gi(xl) = (gn(xl),...,g^(xl)), ¿ = 1,2, а также свёртка функций риска Центра и подсистемы

Ф(х„х2,у) = a,f1(x„x2(x]),y) + a2f2(xl,x2,y), а,+а2 = 1, а,>0. Теорема 5. Пусть выполнены следующие условия:

1) функция fx(x]tx2,y) и вектор-функция g,(x,) непрерывно дифференцируемы по всем переменным, вогнутые по совокупности переменных;

2) функция f2(x,,x2,y) и вектор-функция g,(x2) дважды непрерывно дифференцируемы по всем переменным;

3) функция f2(xx,x2,y) строго унимодальна по х2;

4) x2°(x1) = argmax/2(x1,*2,/);

5) = arg max /j (х,, х2° (х, ),/);

6) у" - минимальная со Слейтеру неопределённость;

7) в точке х2° = х° (х°) е Хг выполнены достаточные условия максимума второго порядка для функции f2(x° ,х2, у"); то есть

8) градиенты

4M*?)

dXj

линейно независимы для всех j е Jt = {!,...,&,}, при которых

= причём Яj >0;

9) градиенты

äg2j(x 2°) dx,

, k = 1 ,к2, линейно независимы для всех j eJ2 = {!,...,&,}, при

которых g2¡ (х°) = 0, причём > 0.

Для того чтобы тройка (х°,х°(х1),у0) была равновесием в информационной модели (1), необходимо выполнение соотношений:

Sxj Зх2 efe,

= ye./,,

= 0,

где матрица

/дФ(х°,х°2,у°) \ ду

dx¡(x,)

,y-y')Z0,yeY,

dx,

определяется из матричного соотношения

dx¡ = -М

dß\x,)

1 J

8L2(xi ,х2,у ,ц ) дххдхг dg2(x¡) dx,

М =

dx¡

dg2(4)

dx,

В п. 1.3.3 приведён модельный пример. В п. 1.3.4 получены достаточные условия оптимальности с квадратичными критериями без ограничений на стратегии. В явном виде выписаны гарантирующие стратегии и функции риска Центра и подсистемы. В п. 1.3.5. рассмотрен пример. В п. 1.3.6 устанавливаются свойства равновесия, а именно, компактность множества равновесий, взаимозаменяемость ситуаций равновесия, неулучшаемость, связь с седловой точкой, внутренняя устойчивость, получены различные оценки значений критериев и их связь с максиминами. В п.1.3.7 даётся определение равновесия с суммарной функцией риска

Я*,, W) = (/ (*, , W) + /2 (х,, х2, у)) - тах(/ (х, ,x2,y) + f2 (х,, х2, у)),

а также изучены свойства функции суммарного риска, получены оценки её значений и установлена связь с суммой функций индивидуальных рисков Центра и подсистемы. В п. 1.3.8 приведён пример.

Вторая глава посвящена исследованию построенной в первой главе модели (1) с отказом от однозначности реакции подсистемы. Решение строится с точки зрения I Центра в форме информационного взаимодействия уровней иерархии. В п. 2.1. рассмотрен благожелательный вариант поведения подсистемы в отношении Центра, введение которого означает стремление подсистемы сделать свой выбор (2) (среди равнозначных для неё) так, чтобы по возможности помочь Центру в увеличении выигрыша всей иерархии в целом и увеличению значения F^x^x^y), то есть х° (х,) = arg max min F, (х,, х,, j/). Реальность такого предположения может быть

x2e/t(xi) уе/

основана на некоторой дополнительной информации, которая передаётся Центром нижнему уровню.

Задача Центра состоит в вычислении своего максимального гарантированного результата

w" = шах max minF.(x.,x,,y) (4)

ггеЯ(х,) уеУ 1 1 2 J'

и представляет собой вычисление максимина на связанных множествах. Так как оптимальное значение критерия Центра является главной целью, то ограничение, связанное с многозначностью выбора подсистемой своей стратегии, снимается с помощью метода штрафных функций.

В п. 2.1.1 описывается информационная модель иерархической системы, вводятся условия регулярности для функций, задающих множества ограничений на стратегии Центра и подсистемы, непрерывности по Хаусдорфу многозначного отображения M(xl) = {x2 е Хг \mmF2(xl,x2,y~) = maxminF2(xl,z2,y)},

yeY z2e*2 уеУ

что обеспечивает существование оптимальной стратегии .

Далее (п. 2.1.2) с помощью аппарата штрафных функций осуществляется переход от задачи со связанными переменными к задаче с распадающимся переменными. Для учёта многозначности отображения R(x,) вводится функция

Ф(х,, х2,02, Л) = max , х2, а>2, Л) - <р(х^, х2, ео2, Л).

Затем исходная задача определения гарантирующей стратегии Центра сводится к задаче на максимин при параметрическом ограничении Ф(лг,,лг2,й>г,Д) = 0. С помощью функции

L(xt ,x2,a2,Ä,/u) = m'mFl (х, ,х2,у)~ рФ(х1, х,, <а2, Л), где ju> 0 - параметр штрафа.

Теорема 6. Для любых х, е X,, Л,/л > 0 имеет место равенство

w" = шах шах min F. (х. ,х,, v) = lim lim max max Их., x,, о,, Л, u).

J.sA', I,<=«(*,) уеГ ' * " Л-»»

айщйЬ

В результате задача (4) сведена к задаче Цхрх2,(У2Д,//) шах .

В п. 2.1.3 вводятся штрафные функции за нарушение ограничений по стратегиям, тогда вместо функции Ь{х1,хг,о)г9Л9/л):

L(X,fi,v) = max max(minFAx,,x2,y)~¿/Ф(х,,х2,со2,л)~v(hx(x,) + h2(x2))),

хгеН"г уеУ

aUä i <h

где v > 0 - параметр штрафа.

Доказана сходимость используемой формы метода штрафов и получена оценка его скорости сходимости. Эта оценка обеспечивает переход от повторного предела к обычному на основе согласования скорости роста штрафных параметров. Теорема 7. Имеет место равенство

lim L(Ä,u,v)-maxmaxmmF,(x,,x2,y) = w0.

X,fi,v-*«> xleXl хгеХг уеУ

В результате задача Центра формулируется как обычная задача на максимум уже на всём пространстве стратегий. Выводятся необходимые условия оптимальности в интегральной (по неопределённости) форме (п. 2.1.4). В п. 2.1.5 приводится решение модельной задачи в пакете Mathcad.

В п. 2.2 рассматривается случай недоброжелательного отношения подсистемы к Центру, из за чего последний применяет гарантированный подход. Центр предполагает, что подсистема в ответ на любое его решение выберет стратегию, которая будет доставлять Центру максимальный риск: x°(x,) = arg min _ min (х,, х2, у). Однако это не

означает, что подсистема специально "вредит" Центру, возможно, она вообще не информирована об интересах Центра. Тогда максимальный гарантированный результат Центра w° =max min minF.(x.,x2,y) вычисляется как решение максиминной задачи со

дг,еЛ"| дг2еЯ(дГ|) уеУ

связанными переменными. Далее аналогично п. 2.1 осуществляется переход от задачи со связанными переменными к задаче с распадающимися переменными. Доказано, что максимальный гарантированный результат Центра может быть вычислен путём повторного предельного перехода по штрафным параметрам (п. 2.2.2). В п. 2.2.3 доказана теорема, которая позволяет путём согласования роста штрафных параметров перейти от повторных пределов к одному пределу. В п. 2.2.4 максиминная задача с ограничениями сводится к семейству (по всем штрафным параметрам) обычных задач на максимум и доказывается теорема, обосновывающая данный шаг. Заметим, что и здесь предположение о неблагожелательности отразилось математически на критерии Центра: снятие операции минимума по стратегии подсистемы привело к появлению интеграла по множеству его стратегий. Необходимые условия оптимальности (подобно теореме 4) также получились интегральными (двойной интеграл по множеству стратегий подсистемы и по множеству неопределённостей). В п. 2.2.5 приводится решение модельной задачи в пакете Mathcad.

Третья глава посвящена исследованию построенной информационной модели при условии, что имеется Центр, управляющий деятельностью двух подсистем с учётом взаимоотношений между ними. При наличии горизонтальных связей поведение элементов уже не описывается стремлением к максимизации своих критериев по отдельности, а возникает необходимость введения некоторых принципов коллективного поведения, после чего реакция может быть выражена через критерий эффективности. Отмечается, что результаты очевидным образом распространяются на случай п подсистем.

В п. 3.1 описывается модель, делаются различные предположения о её параметрах, а также представлена общая схема процесса оптимального взаимодействия уровней иерархии. В п. 3.2 моделируется случай бескоалиционного взаимодействия подсистем

при благожелательном отношении к Центру. Содержательно предлагаемая схема взаимодействия основана на следующих предположениях. Центр делает ход первым, ему известно множество стратегий подсистем и их вспомогательный критерий эффективности. Он также знает, что подсистемам при выборе стратегий известно лишь множество возможных значений неопределённости, из-за чего они ориентируются на реализацию наихудшего её значения. Способ формирования подсистемами своих стратегий заключается в построении равновесия по Нэшу в виде функций (от стратегии Центра) (п. 3.2.1).

Между подсистемами равновесие по Нэшу определяется равенствами

min F2 (х, ,х2*(х,), х3" (х,), у) = шах min F2 (х,, х2, х3* (х,), у),

y&Y У^'

min F, (х,, х2" (х,), х3р (х, ),>>) = max min F3 (х,, х2" (х,), х„у).

yer Jtj ex j yer

Множество таких равновесий (х2 (х,), xf (х,)) при каждом xt образует многозначное отображение Л(х,) с Хг х X,. Предполагается, что подсистемы заранее договариваются, какое именно равновесие из возможных они будут использовать. Очевидно, что при решении задачи оценки эффективности стратегии х, на множестве R(xt) её приближённое сведение методом штрафных функций к задаче на максимум невозможно из-за "взаимной увязки" переменных х2,х, в равенствах, определяющих равновесие Нэша. В результате был построен критерий

Ф(Х], х2, х3, z2, z3) = min F (х,, х2, х3, у) - min F2 (х,,z;,х3, у) +

yeY yeY

+ minF3(xl,x2,x},y)-minF1(xi,x2,z3,y),

>еГ >6/

максимизация которого позволяет получить равновесие Нэша. Поэтому можно построить многозначное отображение

Л(х,) = {(х2,х3)еХ2 хХг\ max Ф(х,,х2,х3) = 0},

где

Ф(х,,х2,х3)= min Ф(х,, х2, х,, z,, z3) < 0.

Благожелательность подсистем, известная Центру, математически выражается в минимизации его риска по стратегиям подсистем, в результате получается максиминная задача на связанных множествах, и максимальный гарантированный результат Центра равен w°=max max ттЛ(х.,х,,х,,у). В п. 3.2.2 с помощью метода штрафных

функций снимаются ограничения, связанные с деятельностью подсистем, в том числе многозначность выбора ими своих стратегий. Далее осуществляется переход от задачи со связанными переменными к задаче с распадающимися переменными. Затем исходная задача определения гарантирующей стратегии Центра сводится к задаче на максимин при параметрическом ограничении. В п. 3.2.3 доказана сходимость используемой формы метода штрафов и получена оценка его скорости сходимости. Далее методом штрафов снимаются ограничения на стратегии:

V{x^x2,x},u,v,Ä,fi,rj,K) = u-K Дтт(0, F, (х,, х2, х3, у) - «)f dy +

+ М

J[min(0, Ф (xl,x2,x„z2,z,)-v)fd(z2,z})

Х,хХ,

-77[/j1(x1) + /j2(x2) + ÄJ(x3)], h,(х,) = (min[0,g^(х,)])2, / = 1,2,3,

где Л,/и,г],к>0 - параметры штрафа, v,u - числовые параметры из достаточно большого отрезка числовой прямой, и задача Центра формулируется как обычная задача на максимум U(l,/2,r},ic) = maxV(xl,x2,x],v,u,A, /и,т],к) уже на всём пространстве

X^R"' (.1,2,3

стратегий.

В п. 3.2.4 выводятся необходимые условия оптимальности в интегральной (по неопределённости) форме. В п. 3.2.5 приводится решение модельной задачи в пакете Mathcad.

В п. 3.3 рассматривается случай кооперативного взаимодействия подсистем и строится равновесие между ними на основе принципа Слейтера (они могут предпринимать совместные действия) при неблагожелательном отношении к Центру. В п. 3.3.1 даётся определение равновесия по Слейтеру между подсистемами в виде пары {х\ (х,),х3X*,)), получаемой с помощью критерия эффективности подсистем Ф(х, ,х2,х3,а) = а min F2 (х, ,x2,x,,y) + (l-a)mmF3 (х., х2, х;, у), где 0<«<1

уеУ

информационный весовой коэффициент, который показывает какая из подсистем берёт на себя большую ответственность. Значение а Центру неизвестно, что создаёт дополнительную неопределённость, и он применяет гарантированный подход к его оценке minФ(х.(,х2,х3,ог).

Подсистемы выбирают такие свои слейтеровские стратегии, чтобы (хс2 (х,),х;;(х,)) = arg min minFx(x,,x2,x„y).

jr2,х,е«(*,) усГ

Оптимальный выбор Центра состоит в выборе стратегии

х,° £ Arg max min Ft (x,, x2 (x,), xf (x, ),y).

€A*j y&Y

Максимальный гарантированный результат Центра

w° = max min mmF,(x,,xy,x.,y)

>1Л€*(Х,) ys!" 141 ' 3

вычисляется как решение максиминной задачи со связанными переменными. В пункте 3.3.2 с помощью метода штрафных функций снимаются операции минимума у функций риска подсистем, формируется новый критерий их взаимодействия и осуществляется преобразование к максимину с распадающимися переменными:

, х2, х3, v2, v3, С, Л^, Л^) ~ = тахтахтт|тт^(х1,х2,х3,>') + тту/(х1,х2,хз,а,у2,уз,с,д,,лз)|,

("jctj " У^У •

lim lim lim maxmaxminL(x,,x,,x3,v,,v,,C,/i,, А.) = max min min F. (x., x,, x,, v) = w°.

д:,€Л-, VjeH, x,eX, 1 1 ' Ii' yty 1 '

Затем в п. 3.3.3 произведено согласование скорости роста штрафных параметров, в результате чего возможен переход от повторного предела к обычному:

1(С,Л2,Я},т)) =

= тахтах тт^т1п/](х1,х2,х3,>') + тту/(х1,х2,Хз,а,уг,Уз,С,Л,,/13) + ^(-/г,(х]) + /1г(х2) + /гз(л:з)]> lim L(C,Я,,Я,,77) = max min mm F,(x,,x2,x,,y).

(('(-Ч+Я,))'

Далее (п. 3.3.4) получены интегральные условия (интеграл по стратегиям подсистем и неопределённому фактору) оптимальности, приведён пример (п. 3.3.5).

В заключении диссертации сформулированы её основные результаты.

1. Разработаны модели информационного взаимодействия уровней иерархии в условиях неопределённости на основе принципов благожелательности и максимального гарантированного результата с использованием функций риска.

2. Формализованы задачи взаимодействия уровней иерархии в условиях неопределенности при бескоалиционном и кооперативном варианте взаимоотношений подсистем, сводящиеся к максиминам со связанными переменными.

3. Проведено обоснование используемой формы метода штрафных функций для исследования информационных моделей иерархических систем с передачей информации в условиях неопределённости (теоремы сходимости и оценки скорости сходимости).

4. Сформулированы и доказаны теоремы о необходимых условиях оптимальности управления Центра на основе принципов благожелательности и максимального гарантированного результата (аппарат - метод штрафных функций).

5. В случае однозначной реакции подсистемы на управление Центра сформулировано определение равновесия между уровнями иерархии в условиях неопределённости и исследованы его свойства (компактность множества равновесий, взаимозаменяемость ситуаций равновесия, неулучшаемость, связь с седловой точкой, внутренняя устойчивость, получены оценки значений функции полезности и их связь с максиминами).

6. Получены необходимые условия оптимальности равновесия в иерархических системах в условиях неопределённости на основе принципа Лагранжа.

7. Приведены модельные примеры, показывающие работоспособность предлагаемых методов и алгоритмов.

Результаты работы подтвердили выдвинутую гипотезу и представляют собой аппарат для исследования информационных моделей иерархических систем в условиях неопределённости. Изложение всех результатов построено таким образом, чтобы была возможность использовать их и основные приёмы доказательства для анализа более сложных по структуре информационных моделей, например, при других вариантах информированности Центра, а также для случая нескольких подсистем и Центров при наличии вертикальных и горизонтальных связей.

Основное содержание диссертационной работы изложено в работах:

1. Горелик В.А., Родюков A.B., Тараканов А.Ф. О взаимодействии игроков иерархической системы в условиях неопределённости и подход к решению методом штрафных функций // Системы управления и информационные технологии. -2008. - N4 (34). - С. 52-56. - 0,31 п.л. (авт. вклад - 30 %).

2. Родюков A.B., Тараканов А.Ф. О равновесиях и их свойствах в двухуровневых иерархических системах при неопределённости // Системы управления и информационные технологии. - 2008. - N2(32). - С. 16-20. - 0,31 п.л. (авт. вклад - 50 %).

3. Родюков A.B., Тараканов А.Ф. О решении иерархической игры при неопределённости с суммарным риском игроков // Известия РАН. Теория и системы управления. - 2007. - N 5. - С. 11-17. - 0,44 п.л. (авт. вклад- 50 %).

4. Горелик В.А., Родюков A.B., Тараканов А.Ф. Иерархическая игра в условиях неопределенности с использованием функций риска игроков и гарантированной оценки стратегий // Известия РАН. Теория и системы управления. - 2009. - N 6. -С. 94-101. - 0,5 п.л, (авт. вклад- 30 %).

5. Родюков A.B. Равновесие по Джоффриону с риском в иерархической игре при неопределённости // Современные методы теории краевых задач: материалы Воронежской весенней математической школы «Понтрягинские чтения - XVIII». -Воронеж: ВГУ. - 2007. - С. 139. - 0,06 пл.

6. Родюков A.B. Оптимальное поведение игроков в иерархической игре с риском в условиях неопределённости // Современные методы теории краевых задач: материалы Воронежской весенней математической школы «Понтрягинские чтения - XIX». -Воронеж: ВГУ.-2008.-С. 181-182. -0,12 п.л.

7. Горелик В.А., Родюков A.B., Тараканов А.Ф. Анализ модели иерархической системы с горизонтальными связями на нижнем уровне // Труды международной научно-практической конференции «Теория активных систем - 2009», Том I. - М.: Институт проблем управления им. В. А. Трапезникова РАН. - 2009. - С. 76-79. - 0,25 пл. (авт. вклад - 30 %).

8. Родюков A.B., Тараканов А.Ф. Математическая модель коалиционно-иерархической игры в условиях неопределённости с риском // Труды международной научно-практической конференции «Теория активных систем - 2007». - М.: Институт проблем управления им. В. А. Трапезникова РАН. - 2007. - С. 81-84. - 0,25 пл. (авт. вклад - 50 %).

9. Горелик В.А., Родюков A.B. Моделирование принятия решений в иерархических системах в условиях неопределённости с учётом риска // Системы компьютерной математики и их приложения: материалы международной конференции. Выпуск 10. -Смоленск: СмолГУ. - 2009. - С. 169-173. - 0,31 п.л. (авт. вклад - 50 %).

10. Горелик В.А., Родюков A.B., Тараканов А.Ф. Гарантирующее равновесие в иерархической игре двух лиц при неопределённости с риском // Системы компьютерной математики и их приложения: материалы международной конференции. Выпуск 9. -Смоленск: СмолГУ. - 2008. - С. 149-151. - 0,13 п.л. (авт. вклад - 30 %).

11. Горелик В.А., Родюков A.B., Тараканов А.Ф. О решении иерархической игры при неопределённости с функциями риска игроков // Моделирование, декомпозиция и оптимизация сложных динамических процессов. - М.: Вычислительный центр им. A.A. Дородицина РАН. - 2006. - С. 15-33. - 1,1 пл. (авт. вклад - 30 %).

12. Родюков A.B., Тараканов А.Ф. Гарантированное равновесие в иерархической игре с функциями риска игроков // Труды V Московской международной конференции по исследованию операций (ORM 2007), посвященная 90-летию со дня рождения академика H.H. Моисеева. - М.: МАКС Пресс. - 2007. - С. 287-289. - 0,19 п.л. (авт. вклад - 50 %).

13. Родюков A.B., Тараканов А.Ф. Гарантированное равновесие по Парето в иерархической игре с функциями риска игроков // Труды XXXVIII региональной молодежной школы-конференции «Проблемы теоретической и прикладной математики". - Екатеринбург: Институт математики и механики УрО РАН. - 2007 - С. 306-310. - 0,31 пл. (авт. вклад - 50 %).

14. Родюков A.B., Тараканов А.Ф. Иерархическая игра при неопределённости с функциями риска // Современные наукоемкие технологии. - 2007. — N 5 — С.11—16. — 0,38 пл. (авт. вклад - 50 %).

Подп. к печ. 17.11.2009 Объем 1 п.л. Заказ №. 179 Тир 100 экз.

Типография Mill У

Оглавление автор диссертации — кандидата физико-математических наук Родюков, Александр Витальевич

ВВЕДЕНИЕ.

Глава 1. АНАЛИЗ ИНФОРМАЦИОННОЙ МОДЕЛИ ИЕРАРХИЧЕСКОЙ СИСТЕМЫ С ОДНОЗНАЧНОЙ РЕАКЦИЕЙ НИЖНЕГО УРОВНЯ.

1.1. Построение модели двухуровневой иерархической системы.

1.2. Метод штрафных функций и необходимые условия оптимальности.

1.2.1. Метод штрафных функций.

1.2.2. Сведение к задаче на максимум и необходимые условия оптимальности.

1.2.3. Пример.

1.3. Равновесие в иерархической системе.

1.3.1. Определение равновесия на основе функций выигрыша.

1.3.2. Необходимые условия оптимальности на основе принципа Лагранжа.

1.3.3. Пример.

1.3.4. Необходимые условия оптимальности в квадратичном случае.

1.3.5. Пример.

1.3.6. Свойства равновесия.

1.3.7. Равновесие с суммарным риском.

1.3.8. Пример.

ГЛАВА 2. СХЕМА ИНФОРМАЦИОННОГО ВЗАИМОДЕЙСТВИЯ УРОВНЕЙ ИЕРАРХИИ ПРИ БЛАГОЖЕЛАТЕЛЬНОМ И НЕБЛАГОЖЕЛАТЕЛЬНОМ ОТНОШЕНИИ НИЖНЕГО УРОВНЯ.

2.1. Учёт Центром благожелательности нижнего уровня.

2.1.1. Описание модели.

2.1.2. Переход от задачи со связанными переменными к задаче с распадающимся переменными.

2.1.3. Скорость сходимости метода штрафов.

2.1.4. Сведение к задаче на максимум и необходимые условия оптимальности.

2.1.5. Пример.

2.2. Гарантированная оценка стратегий подсистемы Центром.

2.2.1. Описание модели.

2.2.2. Переход от задачи со связанными переменными к задаче с распадающимся переменными.

2.2.3. Скорость сходимости метода штрафов.

2.2.4. Сведение к задаче на максимум и-необходимые условия оптимальности.

2.2.5. Пример.

2.3 Сравнительный анализ.

ГЛАВА 3. АНАЛИЗ ИНФОРМАЦИОННОГО ВЗАИМОДЕЙСТВИЯ В ИЕРАРХИЧЕСКОЙ СИСТЕМЕ С ДВУМЯ ЭЛЕМЕНТАМИ НИЖНЕГО УРОВНЯ.

3.1. Описание модели.

3.2. Бескоалиционный вариант (равновесие по Нэшу на нижнем уровне)

3.2.1. Построение вспомогательного критерия эффективности.

3.2.2. Переход от задачи со связанными переменными к задаче с распадающимся переменными.

3.2.3. Скорость сходимости метода штрафов.

3.2.4. Сведение к задаче на максимум и необходимые условия оптимальности.

3.2.5. Пример.

3.3. Кооперативный вариант (равновесие по Слейтеру на нижнем. уровне).

3.3.1. Описание модели.

3.3.2. Переход от задачи со связанными переменными к задаче с распадающимися переменными.

3.3.3. Оценка скорости сходимости.

3.3.4. Сведение к задаче на максимум и необходимые условия оптимальности.

3.3.5. Пример.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Родюков, Александр Витальевич

Актуальность. Информатизация современного общества -объективный, постоянно расширяющийся и углубляющийся процесс, причём практически не имеющий временных границ. Поэтому одной из важнейших задач является создание и исследование информационных моделей, информационных структур и характеризующих их процессов.

Построение информационной модели какой-либо системы (процесса) основано на сборе информации и установлении информационных взаимосвязей между её структурными элементами. Многие реальные модели разрабатываются как оптимизационные с целью экономии ресурсов, обеспечения эффективного функционирования системы. Значит определение оптимальных решений, установление их свойств и условий оптимальности являются главными этапами процесса исследования информационных моделей. Результаты такого исследования определяют важнейшее свойство модели - её предсказательную способность.

Наиболее сложными и в меньшей степени изученными являются информационные модели организационных систем, непосредственными участниками которых являются люди, объединенные общей целью, которая достигается на основе обговоренных правил обмена информацией. С 60-х годов прошлого века такие модели начали изучаться в формальном виде [7, 110]. Этому способствовали развивающиеся быстрым темпом социально-экономические организации, а также новый научно обоснованный метод исследования сложных систем - системный анализ.

Построением теоретических основ информационных моделей организационных систем на основе различных подходов занимались Бурков В. Н. [9], ГермейерЮ. Б. [20], Горелик В. А. [26], Евтушенко Ю. Г. [43], ЕрешкоФ. И. [13] Журавлев Ю. И. [51], Краснощекое П. С. [54], Кононенко А. Ф.[38], Матросов В. Л. [59], Моисеев Н. Н. [53], Мохонько Е. 3. [64], Петров А. А. [51], Рудаков К. В. [89], Новиков Д. А. [69], Федоров В. В. [98] и многие другие. Последние работы в этой области [8,10,16] посвящены исследованиям в рамках информационной теории активных систем (которая является разделом математической теории управления организационными системами).

Построение моделей с передачей информации представляет собой сложный процесс, который характеризуется количеством участников, их взаимоотношениями, определением порядка принятия решений и целями на каждом этапе. Необходимость точной фиксации соответствующих предположений об информации в каждый момент принятия решения позволяет создать правильное представление о процедурах и способах принятия решений. Очевидно, что само понятие оптимального решения может преобразовываться с изменением уровня информированности, так как поведение лица, принимающего решение (ЛПР), является функцией от той информации, которой он располагает на данный момент времени.

Исследование информационных систем укладывается в рамках общей теории принятия решений, являющейся составной частью научной дисциплины "Теоретические основы информатики" (ТОЙ), в которой изучаются процессы создания, накопления и обработки информации, методы преобразования информации в данные и знания.

Важной особенностью функционирования сложных систем является наличие различного рода возмущений или неконтролируемых факторов, и тогда говорят, что ЛПР действует в условиях неопределённости. Возникновение неопределённости в процессе принятия решения можно объяснить тем, что при построении математической модели учесть всё множество ограничений, в рамках которых протекает процесс, зачастую просто не представляется возможным, а также при передаче информации может происходить частичная её потеря или искажение, из-за чего при обмене ею вероятны конфликтные ситуации.

В процессе принятия решения возникающий конфликт не подразумевает непременное столкновение противоположных интересов, но в первую очередь является способом взаимодействия сложных систем, побуждает их к обмену информацией. Это становится причиной появления в формальной постановке задачи принятия решения многих целей, многих критериев оптимальности.

Многокритериальный подход к принятию решений развивается достаточно активно уже на протяжении почти 40 лет. Развитие теории многокритериальной оптимизации достаточно полно отражено в [47,48,71,76]. Основные методы теории многокритериальных задач нашли широкое применение в игровом подходе, так как он даёт возможность достаточно близко к реальности описывать сложные управляемые системы и принимать в них оптимальные решения. Теоретико-информационное моделирование выступает как метод исследования сложных социально-экономических систем.

Основы теоретико-игровых подходов при моделировании организационных систем в статических и динамических вариантах заложены в хорошо известных книгах АйзексаР. [1], БержаК. [5], БлэкуэллаД. и ГиршикаМ. [6], Воробьёва Н. Н. [15], КарлинаС. [52], Красовского Н. Н. [55], ЛьюсаР. Д. и Райфы X. [58], Неймана Дж. и Моргенштерна О. [65], Оуэна Г. [73]. Дальнейшие исследования в этой области отражены в работах [11, 22, 39, 75, 101-104,108-114].

Появление основ теории принятия решений при неопределённости следует отнести к началу второй половины XX века. В это время почти одновременно были предложены принципы максиминной полезности Вальда [114], минимаксного сожаления Сэвиджа [112] (идея которого использована в работе), пессимизма-оптимизма Гурвица [107], недостаточного основания Лапласа [106]. Каждому из принципов отвечает критерий оптимальности, использование которого приводит ЛПР к однозначному ответу.

Исходя из информированности ЛПР, в системном анализе [61] выделяют две группы неконтролируемых факторов: случайные и неопределённые. Неопределённые факторы характеризуются лишь областью возможных значений и являются наиболее часто встречающимися на практике. Поэтому их учету посвящено большое количество работ, например, [27,45,53,57,90,94]. Однако еще некоторые типы моделей принятия решений в организационных системах остались не исследованы, например, с критериями в виде функций риска.

Для информационной теории в условиях неопределённости популярны два общих подхода к принятию решений, названные соответственно "аналогом седловой точки" и "аналогом векторного максимина" [45,46,49] и основанные на использовании понятия векторной гарантии. В рамках этих подходов для формулировки определений гарантирующих решений широко используются принципы оптимальности Слейтера, Парето, Джоффриона, Нэша и др.

Как известно, что многие организационные системы имеют иерархическую структуру, когда имеется руководящий Центр (на верхнем уровне иерархии) и исполняющая его решения подсистема (на нижнем уровне). Иерархические отношения возникают, когда один или несколько ЛПР ограничивают множество решений (стратегий) остальных [17,20,26,40,64,72]. В соответствующей модели должны быть описаны принципы принятия решений Центром и подсистемой и процесс обмена информацией между ними.

Возникновение иерархической структуры обусловлено, как правило, трудностями для единого управляющего Центра своевременно собрать и обработать информацию об управляемых процессах. Это приводит к потере полноты и актуальности информации, что негативно сказывается на качестве решений. Поэтому Центр предоставляет определённые права принятия решений подсистемам, которые на своём уровне используют достоверную информацию. Информация в организационных системах является весьма приближенной. В такой ситуации большая точность при оптимизации бессмысленна и создает только ложное представление о степени достоверности результатов.

В настоящее время наибольший интерес представляют исследования иерархических систем в условиях неопределённости (или риска), которые, помимо неоднозначности выбора решений, включают неоднозначность внешней среды ("природы"). Дополнительные особенности вносит и независимая активность подсистем нижнего уровня. Дополнительный учёт неопределённых факторов даёт новые возможности для анализа моделей управляемых процессов и решения проблем обработки и передачи информации. Такие модели являются одними из основных видов информационных моделей, рассматриваемых в ТОЙ.

В рамках информационной теории иерархических систем и теории активных систем был развит и стал общепринятым теоретико-игровой подход к анализу и синтезу иерархических систем управления. В [26] был подведен некоторый итог развития информационной теории иерархических систем на основе гарантированного подхода к оценке стратегий в условиях неопределённости, связанной с самостоятельными действиями подсистем в условиях децентрализованной схемы принятия решений. А в [91] отмечено, что общие подходы к их решению можно условно разбить на два направления: 1) разработка необходимых и достаточных условий (на основе функции Лагранжа); 2) применение метода штрафов.

Аппарат информационной теории иерархических систем оказался эффективным, например, при исследовании экономических проблем и при управлении сложно структурированными системами. В частности, процесс компьютеризации общества привел к необходимости управления сложными компьютерными системами, когда отдельные её компоненты наделены правами принятия (локальных) решений, а вся система в целом подчиняется управляющему Центру (серверу). Выраженный экономический оттенок иерархических структур заставляет ЛПР сравнивать свои планируемые и реальные доходы. Поэтому исследование указанных систем началось на основе принципа минимаксного сожаления [106,111]. Наконец, отметим, что принятие решений может происходить либо централизованно (окончательное решение принимает верхний уровень) [16,30,56,60], либо децентрализованно (окончательное решение принимает нижний уровень) [90,93,105]. В диссертации рассмотрен централизованный способ управления иерархической системой. При этом одним из важнейших предположений является способность верхнего уровня уметь вычислять, при имеющейся у него информации, реакцию нижнего уровня на своё решение.

В информационной модели иерархической системы задача Центра состоит в том, чтобы в процессе функционирования системы добиться максимального гарантированного значения своего критерия эффективности. Данная цель при фиксированном способе передачи информации с заданными интересами нижнего уровня приводит к задаче определения максимина на связанных множествах [21, 23,37, 41, 42, 97].

Пару стратегий "Центр-Подсистема", как решение указанной только что задачи Центра, можно определить с двух позиций: в виде пошагового описания взаимодействия и в виде равновесия. В рамках указанных выше подходов различные равновесия в иерархических системах (моделях) при неопределённости исследовались, например, в работах Баратовой Е. Д. и Тараканова А. Ф. [2,92-96], Горелика В. А. [25-27], Кукушкина Н. С. [56], Чумакова В. В. [99]. В работах Новикова Д. А. [67,69] и Чхартишвили А. Г. [100,101] рассматривалась концепция построения информационного равновесия в рефлексивных моделях принятия решений в. случае взаимной информированности о значении неопределённости и о представлениях других участников.

Качество решения ЛПР можно оценивать не значением его функции выигрыша (полезности), а критерием оптимальности в виде функции риска. Первоначально термин "риск" применялся в экономике и характеризовал возможные потери в результате принятия решения из-за недостаточной информированности ЛПР. Постепенно стало ясно, что и в других областях приходится принимать решения, связанные с риском, он оказывается неизбежным, уклониться от рисковых решений просто невозможно [3,44,49].

Общее однозначное определение понятия риска дать сложно, и скорее всего невозможно из-за широкого спектра использования данного термина. Например, по определению Жуковского В. И. [50], риск - это возможность отклонения каких-либо величин от желаемых значений, возможность ненаступления каких-либо ожидаемых событий.

Современный взгляд на понятие "риск" основан на предположении, что он вызывается тем или иным действием ЛПР, а также наличием неопределённости, которая дополнительно может появляться из-за неполной информированности относительно параметров внешней среды и о принципах поведения других объектов модели. Оценка величины риска (значение функции риска) характеризует возможные потери ЛПР (не обязательно финансовые). Риск может оцениваться критерием минимаксного сожаления, который впервые предложил Сэвидж в 1951 г. [112] в виде принципа минимаксного сожаления для принятия решений в однокритериальных статических задачах и развит в [49] для статических и динамических многокритериальных задач и бескоалиционных игр при неопределённости. За меру риска берётся разница между максимально возможным значением показателя эффективности функционирования процесса и его реализовавшимся значением.

В [50] были изучены некоторые математические свойства функции риска и построен ряд гарантирующих равновесий для бескоалиционных моделей с квадратичными функциями выигрыша участников. Иерархические модели принятия решения с передачей информации в условиях неопределённости с риском не рассматривались.

В диссертации решения формализуются с двух позиций: 1) описание информационного взаимодействия (указанием правил обмена информацией и порядка ходов), 2) реализация равновесия в системе (на основе соответствующего определения). Указанные позиции определили и способы получения условий оптимальности - на основе принципа Лагранжа и аппарата штрафных функций. Заметим, что метод штрафов, как способ снятия разнообразных ограничений и связей, позволяет решать проблемы, связанные и с наличием в задачах неопределённых параметров (см., например, [23,31,92,93,97]), и этот факт, как будет показано в работе, играет существенную роль. Последние результаты, связанные с применением метода штрафов в организационных системах, получены в работах [2,21,36].

Объектом исследования являются организационные системы, функционирующие в условиях неопределённости.

В основу исследования положена следующая гипотеза: с учётом способов взаимодействия и передачи информации между уровнями иерархии внутренние свойства системы), зафиксированных в математической модели иерархической системы, могут быть определены содержательные понятия решений с использованием функций риска, получены условия оптимальности и алгоритмы решения.

Для достижения поставленной цели и проверки гипотезы потребовалось решить следующие задачи:

1) определить решения с риском (в форме равновесия и в форме описания информационного взаимодействия);

2) установить свойства указанных решений;

3) установить свойства индивидуальной и суммарной функций риска;

5) построить алгоритмы, позволяющие численно решать задачи оптимизации в иерархических моделях.

Методологическую основу настоящего исследования составляют:

• выпуклый анализ [78];

• теория матриц [4,18];

• теория оптимизации [12,62,77,92];

• системный анализ [61,74];

• теория риска [49,50];

• информационная теория иерархических систем [19,20,26,40,80]. Практическая значимость исследования заключается в прикладной актуальности исследования информационных моделей иерархических систем. Используемый теоретико-информационный подход позволяет с достаточной степенью адекватности строить модели иерархических систем при неопределённых факторах, отвечающих реальным представлениям. Предложенные пути к выработке оптимальных решений на основе понятия равновесия и схем информационного взаимодействия учитывают различные ситуации, которые могут встречаться на практике, а использование критерия оптимальности в виде функции риска соответствует тому, что решения приходится принимать в условиях неопределённости.

Основные положения, выносимые на защиту:

Апробация. Основные результаты, полученные в диссертации, докладывались на следующих конференциях и семинарах:

1. Семинарах по теории управления организационными системами, Институт проблем управления им. В. А. Трапезникова РАН, Москва, 20072009.

2. Семинаре отдела информационно-вычислительных систем в секторе математического моделирования конфликтных ситуаций, Вычислительный центр им. А. А. Дородницына РАН, Москва, 2009.

3. Международных конференциях «Системы компьютерной математики и их приложения», Смоленский государственный университет, Смоленск, 1921 мая 2008, 2009 гг.

4. XXXVIII региональной молодежной школе-конференции "Проблемы теоретической и прикладной математики" Институт математики и механики, Екатеринбург, 29 января-02 февраля 2007.

5. Воронежских весенних математических школах «Современные методы теории краевых задач. Понтрягинские чтения XVIII, XIX». Воронежский I государственный университет, Воронеж, 3-9 мая 2008, 209.

6. V Московской международной конференции по исследованию операций, посвященной 90-летию со дня рождения академика H.H. Моисеева, Москва, Вычислительный центр РАН, 10-14 апреля 2007.

7. Международных научно-практической конференциях «Управление большими системами-2007, 2009», Институт проблем управления РАН, Москва, 14-15 ноября 2007, 17-19 ноября 2009.

8. IX Международной научно-практической конференции «Информационные и коммуникационные технологии в образовании», Борисоглебский государственный педагогический институт, Борисоглебск, 5 ноября 2008 г.

9. Научно-практических семинарах кафедры прикладной математики и информатики Борисоглебского государственного педагогического института, Борисоглебск, 2004-2009.

Структура работы

Диссертация содержит введение, три главы, заключение и список литературы в алфавитном порядке.

Заключение диссертация на тему "Информационные модели двухуровневых иерархических систем, функционирующих в условиях неопределённости"

Заключение

В работе построен ряд математических информационных моделей двухуровневых иерархических систем, функционирующих в условиях неопределённости, с централизованным принципом управления.

При этом получены следующие основные результаты и выводы.

1. Разработаны модели информационного взаимодействия уровней иерархии в условиях неопределённости на основе принципов благожелательности и гарантированного результата с использованием функций риска.

2. Формализованы задачи взаимодействия уровней иерархии в условиях неопределённости при бескоалиционном и кооперативном варианте взаимоотношений подсистем, сводящиеся к максиминам со связанными переменными.

4. Сформулированы и доказаны теоремы о необходимых условиях оптимальности управления Центра на основе принципов благожелательности и гарантированного результата (аппарат - метод штрафных функций).

6. Получены необходимые условия оптимальности равновесия в иерархических системах на основе принципа Лагранжа.

7. Приведены модельные примеры, показывающие работоспособность предлагаемых методов и алгоритмов.

Изложение всех результатов построено таким образом, чтобы была возможность использовать их и основные приёмы доказательства для анализа более сложных по структуре информационных моделей, например, при других вариантах информированности Центра, а также для случая нескольких подсистем и Центров при наличии вертикальных и горизонтальных связей.

Практическая значимость работы заключается в прикладной актуальности исследования информационных моделей иерархических систем. Использованный при этом теоретико-информационный подход позволил с достаточной степенью адекватности построить модели систем при неопределённых факторах, отвечающих реальным представлениям. Предложенные подходы к выработке оптимальных решений на основе понятия равновесия и схем информационного взаимодействия учитывают различные ситуации, которые могут встречаться на практике. Использование критерия оптимальности в виде функции риска соответствует тому, что решения приходится принимать в условиях неопределённости.

Вычислительные эксперименты показали, что предложенные в работе алгоритмы позволяют находить решение.

Библиография Родюков, Александр Витальевич, диссертация по теме Теоретические основы информатики

1. Айзеке, Р. Дифференциальные игры Текст./ Р. Айзеке М.: Мир, 1967 — 479 с.

2. Баратова, Е.Д., Метод штрафов и необходимые условия оптимальности в дифференциальной иерархической игре при неопределенности Текст./ Е.Д. Баратова, А.Ф. Тараканов // Известия АН. Теория и системы управления-2003.- №4- С.342-348/.

3. Бардин, А.Е. Векторный риск в многокритериальных задачах Текст./ А.Е. Бардин, М.Е. Салуквадзе Тбилиси: Институт систем управления АН Грузии.- 1992.-28 с.

4. Беллман, Р. Введение в теорию матриц Текст./ Р. Беллман М.: Наука, 1969.-367 с.

5. Берж, К. Общая теория игр нескольких лиц Текст./ К. Берж- М.: Физматгиз, 1961.- 126'с.

6. Блекуэлл, Д. Теория игр и статистических решений Текст./ Д.Блекуэлл, М. Гиршик.-М.: ИЛ, 1958.-264 с.

7. Бурков, В.Н. Основы математической теории активных систем Текст./ В.Н. Бурков-М.: Наука, 1977.-255 с.

8. Бурков, В. Н. Как управлять организациями Текст./ В.Н. Бурков, Д.А. Новиков М.: Синтег, 2004 - 400 с.

9. Бурков, В.Н. Механизмы функционирования организационных систем Текст./В.Н. Бурков, В.В. Кондратьев-М.: Наука, 1981.-384 с.

10. Ю.Бурков, В.Н. Механизмы управления эколого-экономическими системами Текст./ В.Н. Бурков, Д.А. Новиков, A.B. Щепкин.- М.: Физматлит, 2008245 с.

11. П.Вайсборд, Э.М. Введение в дифференциальные игры нескольких лиц и их приложения Текст./ Э.М. Вайсборд, В.И. Жуковский.- М.: Советское радио, 1980.-304 с.

12. Васильев, Ф.П. Методы оптимизации Текст./ Ф.П. Васильев,- М.: издательство «Фактор-Пресс», 2004 824 с.

13. Ватель И.А. Математика конфликта и сотрудничества Текст./ И.А. Ватель. Ф.И. Ерешко М.: Знание, 1973 64 с.

14. Вилкас, Э.И. Аксиоматическое определение ситуации равновесия и значения бескоалиционной игры Текст. / Э.Й Вилкас // Теория вероятностей и её применение, 1968. Т. 13, №3.- С. 586-591.

15. Воробьев, H.H. Основы теории игр. Бескоалиционные игры Текст./ H.H. Воробьев,-М.: Наука, 1984.-496 с.

16. Воронин, A.A. Математические модели организаций Текст./ A.A. Воронин, М.В. Губко, С.П. Мишин, Д.А. Новиков.-М.: ЛЕНАНД, 2008.- 359с.

17. Воронин, A.A. Оптимальные иерархические структуры Текст./ A.A. Воронин, С.П. Мишин.- М.: ИПУ РАН, 2003.-214 с.

18. Гантмахер, Ф.Р. Теория матриц Текст./ Ф.Р. Гантмахер,- М.: Гос. издат. технико-теорет. лит-ры, 1953.-492 с.

19. Гермейер, Ю.Б. Введение в теорию исследования операций Текст./ Ю.Б. Гермейер- М.: Наука, 1971.-383 с.

20. Гермейер, Ю.Б. Игры с непротивоположными интересами Текст./ Ю.Б. Гермейер-М.: Физматлит, 1976-328 с.

21. Гермейер, Ю.Б. К задаче отыскания максимина с ограничениями Текст./ Ю.Б. Гермейер // Журн. вычисл. матем. и матем. физ- 1970 Т. 10, №1-С.39-54.

22. Гермейер, Ю.Б. К теории игр трех лиц Текст./ Ю.Б. Гермейер // Журн. вычисл. матем. и матем. физ 1973 -Т. 13, №6. С. 1459-1468.

23. Гермейер, Ю.Б. Приближенное сведение с помощью метода штрафных функций задачи определения максимина к задаче определения максимума Текст./ Ю.Б. Гермейер // Журн. вычисл. матем. и матем. физ 1969 - Т.9, №3.- С.730-731.

24. Горелик, В.А. Анализ модели иерархической системы с горизонтальными связями на нижнем уровне Текст./ В.А.Горелик, A.B. Родюков,

25. А.Ф. Тараканов // Труды междунар. научно-практич. конфер. «Управление большими системами 2009».- М.: ИПУ РАН,- 2009. - С. 76-79.

26. Горелик, В.А. Иерархическая игра в условиях неопределенности с использованием функций риска игроков и гарантированной оценки стратегий Текст./ В.А. Горелик, A.B. Родюков, А.Ф. Тараканов // Известия РАН. Теория и системы управления 2009, №6- С. 94-101.

27. Горелик, В.А. Анализ конфликтных ситуаций в системах управления Текст. / В.А. Горелик, М.А. Горелов, А.Ф. Кононенко М.: Радио и связь, 1991.-288 с.

28. Горелик, В.А. Гарантирующее абсолютное активное равновесие в статической коалиционной игре при неопределённости Текст./ В.А. Горелик, А.Ф. Тараканов // Моделирование, декомпозиция и оптимизация сложных динамических процессов М.: ВЦ РАН, 2004 - С.78-93.

29. Горелик, В.А. Гарантирующее равновесие в иерархической игре двух лиц при неопределенности с риском Текст./ В.А. Горелик, A.B. Родюков,

30. A.Ф. Тараканов // Системы компьютерной математики и их приложения. Материалы международной конференции. Выпуск 9 Смоленск: СмолГУ, 2008 - С.149-151.

31. Горелик, В.А. Основы исследования операций Текст./ В.А. Горелик, Т.П. Фомина // Учебное пособие.- М.: МПГУ, ЛГПУ, 2004.- 248 с.

32. Горелик, В.А. Иерархические оптимизационно-координирующие системы Текст./ В.А. Горелик // Кибернетика.- 1978, №1.- С. 87-94.

33. Горелик, В.А. Максиминные задачи на связанных множествах в банаховых пространствах Текст./ В.А. Горелик // Кибернетика 1983, № 1- С.64-67.

34. Горелик, В.А. Моделирование принятия решений в иерархических системах в условиях неопределённости с учётом риска Текст./

35. B.А. Горелик, A.B. Родюков // Системы компьютерной математики и их приложения. Материалы международной конференции. Выпуск Ю.Смоленск: СмолГУ, 2009-С. 169-173.

36. Горелик, В.А. О решении иерархической игры при неопределенности с функциями риска игроков Текст./ В.А. Горелик, A.B.Родюков, А.Ф. Тараканов // Моделирование, декомпозиция и оптимизация сложных динамических процессов-М.: ВЦ РАН, 2006 С. 15-33.

37. Горелик, В.А. Об одном подходе к решению минимаксных задач оптимального управления Текст./ В.А. Горелик, В.В. Федоров // Изв. АН СССР. Техн. кибернетика.- 1976, №1.-С.45-54.

38. Горелик, В.А. Приближенное нахождение максимина с ограничениями, связывающими переменные Текст. / В.А. Горелик // / Журн. вычисл. матем. и матем. физ.- 1972.- Т.5, № 2.- С.510-517.

39. Горелик, В.А. Теоретико-игровые модели принятия решений в эколого-экономических системах Текст./ В.А. Горелик, А.Ф. Кононенко М.: Наука, 1982.- 144 с.

40. Губко, М.В. Теория игр в управлении организационными системами Текст./ М.В. Губко, Д.А. Новиков.- М.: ИПУ РАН, 2005.-138 с.

41. Губко, М.В. Математические модели оптимизации иерархических структур Текст./ М.В. Губко.- М.: ЛЕНАНД, 2006.- 264 с.

42. Демьянов, В.Ф. А.М.Рубинов. Приближенные методы решения экстремальных задач Текст./ В.Ф.Демьянов, Рубинов A.M.- Л.: Изд-во Ленингр. ун-та, 1968 180 с.

43. Демьянов, В.Ф. Введение в минимакс Текст./ В.Ф.Демьянов, В.Н.

44. Малоземов -М.: Наука, 1972 368 с.

45. Евтушенко, Ю. Г. Некоторые численные методы решения игр с непротивоположными интересами Текст./ Ю.Г.Евтушенко // Исследование операций, Вып. 4.- М.: Изд-во ВЦ АН СССР, С.219-235.

46. Жуковская, Л.В. Математические основы риска в игровых системах Текст./ Л.В. Жуковская.- М.: РосЗИТЛП, 2002.- 104 с.

47. Жуковский, В.И. Кооперативные игры при неопределенности и их приложения Текст./ В.И. Жуковский М.: Эдиториал УРСС, 2001 - 336 с.

48. Жуковский, В.И. Линейно-квадратичные дифференциальные игры Текст./ В.И. Жуковский, A.A. Чикрий.-Киев: Наукова думка, 1994.- 320 с.

49. Жуковский, В.И. Оптимизация гарантий в многокритериальных задачах управления Текст./ В.И. Жуковский, М.Е. Салуквадзе- Тбилиси: МЕЦНИЕРЕБА, 1996.-480 с.

50. Жуковский, В.И. Равновесные управления многокритериальных динамических систем Текст./ В.И. Жуковский, Н.Т. Тынянский М.: Изд-во МГУ, 1984.-204 с.

51. Жуковский, В.И. Риск в многокритериальных и конфликтных системах при неопределенности Текст./ В.И. Жуковский, Л.В. Жуковская М.: Эдиториал УРСС, 2004.- 272 с.

52. Карлин, С. Математические методы в теории игр, программировании и экономике Текст./ С. Карлин.-М.: Мир, 1964 838 с.

53. Кононенко, А.Ф. Принятие решений в условиях неопределенности Текст./ А.Ф. Кононенко, А.Д. Халезов, В.В.Чумаков.- М.: ВЦ АН СССР, 1991.198 с.

54. Краснощеков, П.С. Принципы построения моделей Текст./ П.С.Краснощеков, A.A.Петров-М.: ФАЗИС, 2000.-424 с.

55. Красовский, H.H. Позиционные дифференциальные игры Текст./ H.H. Красовский, А.И. Субботин-М.: Наука, 1974.-456 с.

56. Кукушкин, Н.С. Бескоалиционные игры трех лиц с фиксированной иерархической структурой Текст./ Н.С. Кукушкин // Журн. вычисл. матем. и матем. физики.- 1979.- Т.19, №4.- С. 896-911.

57. Куржанский, А.Б. Управление и наблюдение в условиях неопределенности Текст./ А.Б. Куржанский М.: Наука, 1977 - 642 с.

58. Льюс, Р.Д. Игры и решения Текст./ Р.Д. Льюс, X. Райфа,- М.: ИЛ, 1961642 с.

59. Матросов, В.Л. Теоретические основы информатики. Текст./ Горелик В.А., Жданов С.А., Муравьева О.В., Угольникова Б.З. Учебное пособие- М.: МПГУ, 2005.-296 с.

60. Меньшиков, И.С. Игра трех лиц с фиксированной последовательностью ходов Текст./ И.С. Меньшиков // Журн. вычисл. матем. и матем. физики-1975,-Т.15, №5.-С.1148-1156.

61. Моисеев, H.H. Математические задачи системного анализа Текст. / H.H. Моисеев-М.: Наука, 1981.-488 с.

62. Моисеев, H.H., Методы оптимизации Текст./ H.H. Моисеев, Ю.П. Иванилов, Е.М. Столярова.-М.: Наука, 1978.-472 с.

63. Мохонько, Е.З. О дифференциальной игре с неточным знанием терминального выигрыша, I Текст./ Е.З. Мохонько // Сообщения по прикладной математике М.: ВЦ РАН, 1994 - 64 с.

64. Мохонько, Е.З. Управление информационными потоками в неантагонистических динамических играх Текст./ Е.З. Мохонько М.:ВЦ РАН, 1992.- 115 с.

65. Нейман, Дж. Теория игр и экономическое поведение Текст./ Дж. фон Нейман, О. Моргенштерн.-М.: Наука, 1973.-230 с.

66. Никайдо, X. Заметка о бескоалиционных выпуклых играх // Бесконечныеантагонистические игры Текст./ X. Никайдо, К. Исода. Под. ред. H.H. Воробьева-М.: Физматгиз, 1963- С.449-458.

67. Новиков, Д.А. Информационное равновесие: точечные структуры информированности Текст./ Д.А. Новиков, А.Г. Чхартишвили // Автоматика и телемеханика 2003, №10 - С.111-122.

68. Новиков, Д.А. Сетевые структуры и организационные системы Текст./ Д.А. Новиков,-М.: ИПУ РАН, 2003.- 102 с.

69. Новиков, Д.А. Стабильность информационного равновесия в рефлексивных играх Текст./ Д.А. Новиков, А.Г. Чхартишвили // Автоматика и телемеханика- 2005jä№2 С.1-9.

70. Новиков, Д.А., Теория управления организационными системами Текст./ Д.А. Новиков-М:. Физмалит, 2005 583 с.

71. Новикова, Н.М. Многокритериальные задачи принятия решения в условиях неопределенности Текст./ Н.М. Новикова, И.И. Поспелова М.: ВЦ РАН, 2000,- 64 с.

72. Новикова, Н.С. Игры двух и трех лиц со связанными ограничениями при фиксированном порядке ходов Текст./ Н.С. Новикова // Журн. вычисл. матем. и матем. физики.- 1976.-Т. 16, №2.-С. 326-329.

73. Оуэн, Г. Теория игр Текст./ Г. Оуэн М.: Мир, 1971 - 708 с.

74. Перегудов, Ф.И. Введение в системный анализ Текст./ Ф.И. Перегудов, Ф.П. Тарасенко.-М.: Высшая школа, 1989.-367 с.

75. Петросян, JI.A. Теория игр Текст./ JI.A. Петросян, H.A. Зенкевич, Е.А. Семина М.: Высшая школа, 1998 - 304 с.

76. Подиновский, В.В. Парето-оптимальные решения многокритериальных задач Текст./ В.В. Подиновский, В.Д. Ногин М.: Наука, 1982 - 254 с.

77. Понтрягин, Л.С. Избранные научные труды. Том 2 Текст./ Л.С. Понтрягин.- М.: Наука, 1988 576 с.

78. Пшеничный, Б.Н. Выпуклый анализ и экстремальные задачи Текст./ Б.Н. Пшеничный-М.: Наука. Глав, редакция физ.-матем. лит., 1980.-320 с.

79. Родюков, А.В. О равновесиях и их свойствах в двухуровневых иерархических системах при неопределенности Текст./ А.В. Родюков, А.Ф. Тараканов // Системы управления и информационные технологии.-2008, №2(32).-С. 16-20.

80. Родюков, А.В. Математическая модель коалиционно-иерархической игры в условиях неопределённости с риском Текст./ А.В. Родюков, А.Ф. Тараканов // Теория активных систем / Труды международной научно-практической конференции.-М.: ИПУ РАН, 2007 С.81-84.

81. Родюков, А.В. О решении иерархической игры при неопределенности с суммарным риском игроков Текст./ А.В. Родюков, А.Ф. Тараканов // Известия АН. Теория и системы управления.-2007, № 5- С. 11-17.

82. Родюков, A.B. Иерархическая игра при неопределенности с функциями риска Текст./ A.B. Родюков, А.Ф. Тараканов // Современные наукоемкие технологии,- 2007, № 5- С. 11-16.

83. Рудаков, К.В. Теория универсальных и локальных ограничений для алгоритмов распознавания / Диссертация на соискание ученой степени доктора физико-математических наук.- Москва, ВЦ РАН, 1992- 274 с.

84. Современное состояние теории исследования операций Текст./ Под ред. H.H. Моисеева-М.: Наука, 1979.-464 с.

85. Сухарев, А.Г. Курс методов оптимизации Текст./ А.Г. Сухарев, A.B. Тимохов, В.В. Федоров.-М.: Наука, 1986,- 328 с.

86. Тараканов, А.Ф. Децентрализованное управление иерархической системой в условиях неопределённости Текст./ А.Ф. Тараканов // Системы управления и информационные технологии: Сб. тр. Вып.9- Воронеж: Центральночернозёмное изд-во, 2002 С.93-98.

87. Тараканов, А.Ф. Дифференциальная игра двух коалиций в условиях неопределённости Текст./ А.Ф. Тараканов // Известия АН. Теория и системы управления.-2003, № 3. С.211-219.

88. Тараканов, А.Ф. Решение Нэша-Слейтера иерархической игры в условиях неопределённости Текст./ А.Ф. Тараканов // Известия АН. Теория и системы управления. 2000, № 4, С.70-77.

89. Тараканов, А.Ф. Решение Штакельберга-Слейтера статической иерархической игры в .условиях неопределённости Текст./ А.Ф. Тараканов, А.Н.Говоров // Успехи современного естествознания 2003, №10.-'С.116-127.

90. Федоров, В.В. О методе штрафных функций в задаче определения максимина Текст./ В.В. Федоров // Журн. вычисл. матем. и матем. физ-1972.- Т. 12, №2.- С.321-333.

91. Федоров, В.В. Численные методы максимина Текст./ В.В. Федоров.- М.: Наука, 1979.-280 с.

92. Чумаков, В.В. Определение и свойства оптимальных управлений согласованной иерархической системы при наличии неконтролируемых воздействий Текст./ В.В. Чумаков // Журн. вычисл. математ. и мат. физики.-1990.- Т.30, №10.- С.1443-1453.

93. Чхартишвили, А.Г. Информационное равновесие / Управление большими системами. Сб. тр. молодых ученых. Выпуск 3. Общая редакция -Д.А. Новиков. М.: ИЛУ РАН, 2003.- С. 94 109.

94. Чхартишвили, А.Г. Теоретико-игровые модели информационного управления Текст./ А.Г. Чхартишвили М.: ПМСОФТ, 2004- 227 с.

95. Arrow K.J. Alternative approaches to the theory of choice in risk-taking situations // Econometrica.- 1951- V.19 P. 404-437.

96. Aumann, R.J., Peleg, B. Von Neumann-Morgenstern solutions to cooperative games without side payments // Bull. Amer. Math. Soc. 1960. 66. P. 173-179.

97. Basar, T., Olsder, G.J. Dynamic Noncooperative Game Theory London: Academic Press, 1995.- 274 p.

98. Chen, C.J., Crus, J.B. Stackelberg solution for two-person games with biased information patterns // IEEE Trans. Automat. Contr- 1972 V. 17, No 6- P.791-798.

99. Ferro, F. Minimax theorem for vector-valued functions // J. Optimiz. Theory and Appl.- 1989 V.60- P. 19-31.

100. Hurwicz, L. Optimality criteria for decision making under ignorance // Cowles Commission Discussion Paper, Statistics. 1951. V.2.-P.370-375.

101. Jentzch, G. Some thoughts on the theory of cooperative games / Advances in game theory // Ann. Math. Studies.- 1964,- V.52.- P.407-442.

102. Mehlmann, A. Applied Differential Games.- New York: Plenum Press, 1991.-243 p.

103. Myerson, R. B. Game theory: analysis of conflict London: Harvard Univ. Press, 1991.-568 p.

104. Petit, M.L. Control Theory and Dynamic Games in Economic Policy Analysis Cambridge: Cambridge University Press, 1990. - 160 p.

105. Savage L.Y. The theory of statistical decision // J. American Statistics Association. 1951. N 46. P.55-67.

106. Simaan, M., Crus, J.B. On the Stackelberg's strategy in nonzero-sum games //J. Optimiz. Theory. Appl.- 1973.-V.ll, No.5.-P. 533-555.

107. Wald, A. Statistical Decision Functions-N.Y.: Wiley, 1950 320 p.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00