автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Гарантированные решения в многокритериальных динамических задачах
Автореферат диссертации по теме "Гарантированные решения в многокритериальных динамических задачах"
На правах рукописи
САЧКОВ Сергей Николаевич
ГАРАНТИРОВАННЫЕ РЕШЕНИЯ В МНОГОКРИТЕРИАЛЬНЫХ ДИНАМИЧЕСКИХ ЗАДАЧАХ
Специальность 05.13.17 - теоретические основы информатики
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва - 2003
Работа выполнена на кафедре математики и механики Московского факультета в Российском заочном институте текстильной и легкой промышленности.
Научный руководитель:
заслуженный деятель науки РФ, доктор физико-математических наук, профессор ЖУКОВСКИЙ Владислав Иосифович.
Официальные оппоненты:
академик международной академии информатизации, доктор физико-математических наук, профессор ГОРЕЛИК Виктор Александрович,
кандидат физико-математических наук, доцент МАТВЕЕВ Владимир Александрович.
Ведущая организация: Международный научно-исследовательский институт проблем управления.
Защита диссертации состоится « 2003 г. в
'...7... часов на заседании Диссертационного Совета К 212.154.11 при Московском педагогическом государственном университете по адресу: 107140, Москва, ул. Краснопрудная, д. 14, математический факультет МПГУ, ауд
Ш
С диссертацией можно ознакомиться в библиотеке МПГУ по адресу: 119435, Москва, Малая Пироговская ул., д. 1.
Автореферат разослан » 2003
года.
Ученый секретарь Диссертационного совета ---- ЧИКАНЦЕВА Н. И.
^ОО" м з
17ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность' темы. Целенаправленное управление многими системами многокритериально. Например, в процессе функционирования предприятия одновременно ставятся разные цели: получить максимально возможную прибыль, одновременно с этим выдержать установленные показатели по ассортименту, снизить себестоимость, добиться определенного уровня качества и рентабельности производимой продукции и т.д. Некоторые из этих показателей по тенденциям их реализации могут быть противоречивыми. В этом случае необходимо искать разумный компромисс, когда для принятого плана производства не достигаются потенциально возможные оптимальт ные значения отдельных целевых критериев, но каждый из них для этого плана принимает в той или иной мере близкое к оптимальному значение. Наличие нескольких критериев во многих прикладных задачах послужило причиной для возникновения теории многокритериальных задач. Математические модели "классической" теории многокритериальных задач охватывают обычно идеальные системы, в которых каждому решению отвечает единственное значение каждого критерия. Однако в реальных системах данное условие часто не выполняется. Типичной является ситуация, когда относительно некоторых параметров системы или внешних воздействий известны лишь границы их изменения, внутри которых эти параметры могут принимать любое, заранее непредсказуемое значение. Так, например, при планировании выпуска продукции не всегда можно учесть сбои в обеспечении сырьем, брак, поломки оборудования и т.д. Поэтому решения приходится принимать, считаясь с воздействиями неконтролируемых факторов - неопределенностей. При этом наличие неопределенности приводит к тому, что нельзя однозначно определить понятие решения многокритериальной задачи, а можно лишь указать "разумные, или хорошие в разных отношениях" решения. Поэтому необходимо стремиться к оптимальному использованию имеющейся информации относительно пл<"гат<пенной задачи, чтобы, взвесив все возможные варианты решений, постараться найти среди них наилучший.
РОС. НАЦИОНАЛЬНА* БИБЛИОТЕКА
Многокритериальные задачи при неопределенности - новое активно развивающееся направление теории принятия решений. До сих пор основные исследования многокритериальных задач при неопределенности ведутся в рамках подходящей модификации принципа гарантированного результата. Динамический вариант таких за^ач ь позиционных стратегиях активно исследуется в России профессором В.И. Жуковским и его учениками B.C. Молоствовым, Г.И. Житомирским, В.А. Матвеевым. Параллельно за рубежом ведутся работы по исследованию статического варианта (работы F. Ferro, О. Blackwell, Т. Tanaka, W.L. Chan и W.T. Lau, G.Y. Chen, J.G. Lin). Однако исследование многокритериальных задач при неопределенности в программных стратегиях до сих пор не проводилось, а такие задачи являются актуальными, особенно в вопросах планирования и прогнозирования. Диссертационная работа как раз и посвящена исследованию гарантированных решений в многокритериальных динамических задачах с программными управлениями и неопределенностями, при этом о последних известны лишь границы изменения, а какие-либо вероятностные характеристики отсутствуют.
Целью работы является исследование гарантированных решений в динамических многокритериальных задачах с программными управлениями и неопределенностями (ДМЗН), причем предполагается, что о неопределенностях известна лишь область возможных значений.
Объектом исследования являются динамические многокритериальные задачи принятия решений в условиях неопределенности.
Предмет исследования - векторные седловые точки, реализующие гарантированные решения в "непрерывных" и многошаговых ДМЗН.
Проблема заключается в способе формализации гарантированных решений ДМЗН с программными управлениями и неопределенностями и в поиске методов построения векторных седловых точек, реализующих такие решения.
В основу исследования положена следующая гипотеза: на основе модификации принципа гарантированного результата и понятий оп-
тимумов по Слейтеру, Парето, Борвейну, Джоффриону и А-оптимума (из теории многокритериальных задач) можно определить возможные решения ДМЗН и соответствующие векторные седловые точки, реализующие эти решения; основываясь на результатах из теории многокритериальных задач, теории игр и оптимального управления можно установить существование указанных седловых точек (а, следовательно, и гарантированных решений ДМЗН) и предложить способ их нахождения.
Для реализации поставленной цели и проверки сформулированной гипотезы потребовалось решить следующие задачи:
- формализовать понятия гарантированных решений для ДМЗН с программными управлениями и неопределенностями и векторных седловых точек, реализующих такие решения;
- установить связь гарантированных решений ДМЗН с равновесным решением специально построенной бескоалиционной игры двух лиц;
- выявить условия существования таких решений для "непрерывных" и дискретных ДМЗН с программными управлениями и неопределенностями;
- найти методы построения гарантированных решений, используя аппарат принципа максимума Л.С. Понтрягина;
- построить управление и неопределенность, реализующие гарантированное решение для линейно-квадратичных "непрерывной" и многошаговой задач;
- рассмотреть возможные приложения к конкретным экономическим задачам.
Методологическую основу работы составляют методы и подходы теории многокритериальных задач, теории игр, выпуклого анализа, теории матриц и квадратичных форм, дифференциальных и конечно-разностных уравнений, теории оптимального управления.
Научная новизна. До сих пор исследования ДМЗН велись в рамках "непрерывных" позиционных задач. Динамические "непрерывные" многокритериальные задачи при неопределенности с программными управлениями и неопределенностями, а также соответствующие многошаговые ДМЗН не рассматривались. Как раз этим вопросам посвящена диссертация. Поэтому результаты работы являются новыми.
Практическая значимость работы. Рассмотренный подход к определению решения для ДМЗН и предложенные способы построения гарантированных решений могут быть применены к различным прикладным задачам экономики, экологии, механики управляемых систем. В качестве приложений в диссертации рассматривается математическая модель задачи оптимизации размещения капитальных вложений и задача добычи некоторого биологического вида.
Основные положения, выносимые на защиту:
• формализовано понятие гарантированного решения для "непрерывных" и многошаговых ДМЗН с программными управлениями и неопределенностями;
• выделен класс "непрерывных" ДМЗН, в которых существует гарантированное по Джоффриону решение;
• найдены условия существования гарантированного по Слейтеру решения для многошаговых ДМЗН;
• сформулированы необходимые условия существования седловых точек по Слейтеру в форме принципа максимума;
• найден явный вид седловой точки по Слейтеру в "непрерывной" и многошаговой линейно-квадратичных ДМЗН, при этом были использованы необходимые условия и (для одной многошаговой задачи) метод динамического программирования;
• полученные результаты применены к построению гарантированных решений в двух конкретных экономических задачах.
Апробация. Результаты диссертации докладывались на научных семинарах кафедры математики и механики РосЗИТЛП, на научно-методическом семинаре кафедры информатики и дискретной математики МПГУ, на Международной школе по динамическим и управляемым системам (Суздаль, 2001), на Международной конференции по проблемам управления "Автоматика - 2001" (Одесса, 2001), на XII Крымской осенней математической школе-симпозиуме (Крым, Севастополь, 2001).
Публикации. По результатам диссертации опубликовано 10 печатных работ. Перечень публикаций приведен в конце автореферата.
Структура. Диссертация состоит из введения, трех глав, разбитых на 15 параграфов, заключения и списка использованной литературы. Объем диссертации 132 страницы.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, дан краткий обзор литературы на основе работ отечественных и зарубежных авторов, приведено краткое содержание диссертации по главам и основные положения, выносимые на защиту.
Первая глава ("Многокритериальные "непрерывные" задачи при неопределенности") состоит из шести параграфов и посвящена "непрерывным" ДМЗН с программными управлениями и неопределенностями.
Рассматривается "непрерывная" динамическая задача при неопределенности
г = (Е,г/, мадя)},^).
Здесь функционирование управляемой динамической системы I! рассматривается на отрезке времени [¿о^К где 0 < ¿о < г? — фиксированные моменты начала и окончания процесса. Текущее состояние системы 22 в каждый момент времени £ характеризуется фазовым еетстпорсм х С задало начальное состояние х(£у) = Хц. Изменение фазового вектора с течением времени £ описывается векторным
дифференциальным уравнением
х — х, и, г), х(Ц) = аг0, (1)
где п-вектор-функция г) определена для любых значений век-
торных переменных х£Ип, и£.С) С Кг, г£Р С К'. Управление и. которым распоряжается ЛПР (лицо, принимающее решения), отождествляется с функцией и = и{£) (11-ти{-)), определенной на интервале [¿О, ■&) времени t и принимающей значение при всех í € [¿о, #) в множестве <3 С Н.г, Множество всех управлений {/ обозначим через Ы. Используемые управления являются функциями, зависящими только от времени t, и называются программными. Аналогично вводится программная неопределенность Z -т г=г{-), £е[£о> б^Сй' при всех £ £ [¿0, #), тогда 2 £ 2 - множеству неопределенностей.
Процесс принятия решения в задаче Г происходит следующим образом. ЛПР выбирает и использует некоторое конкретное управление 17 -т- ■«(•), 11 £ Ы. Независимо от ЛПР реализуется неопределенность Z -т- г(-), 2 € 2, о которой ЛПР в каждый момент времени £ известно лишь множество возможных значений Р. Затем определяется решение х(1) системы (1) при и=и(Ь), г=г{€). На полученных тройках (ж(£),и(£),2(£) ) £()<£< #) заданы N функционалов (критериев)
<5
Ми, г)= /ж*, х(г),«(*),й+ф^о?)), »€N={1,2,..,л^}. (2)
«о
Далее предполагаем, что функции и Ф^(х)(г£1Ч) не-
прерывны по совокупности своих аргументов и интегралы
1?
Уж(£),и(£), *;(£)) <й существуют и ограничены при любых непре-
«о
рывйых я(£), ¿о < £ < тЗ, и допустимых О" £ £ £
Вектор J{U,Z) = (^(и, ..., ¿Г)) называется векторным критерием для задачи Г.
Определение. Пару (С/'*, ЕМх Н.^ назовем К -решением га-р апт.ир о в оЛь/гЫл'с по X/ для задачи Т*, если существует такля неопределенность ^ € 2, что
1° управление ик является /¿"-максимальным в задаче = ZL), которая получается из Г при фиксированной неопределенности
2° неопределенность Z[l является Ь-минималыюй для задачи Г({7 = 11к), полученной из Г при фиксированном управлении
и = ик ей,
з° я = и*,гь) = {мик, ..., мик,гь)).
Пара {ик, Еь) € Кх2, реализующая ^-решение гарантированное по Ь для задачи Г, называется КЬ-седловой точкой в задаче Г.
При этом минимальность по Ь (максимальность по К) означает: при Ь = 5 {К = 5) - минимальность (максимальность) по Слейтеру, при Ь = Р (К = Р) - минимальность (максимальность) по Парето, при Ь — В (К — В) - минимальность (максимальность) по Борвейну, при Ь — (? (К = С?) - минимальность (максимальность) по Джоффри-ону, при Ь = (К = А?) - ^^минимальность (Аг-максимальность) (известные понятия оптимумов из теории многокритериальных задач).
Вектор ^ = является векторной гарантией для зада-
чи Г, т.е. одновременно не могут выполняться неравенства
^{ик,гь) > ^ = г), чгег {% е г*).
Далее устанавливается связь гарантированных решений задачи Г с равновесным решением специальным образом построенной вспомогательной бескоалиционной игры двух лиц
({1,2}, Е, и, я, -щад, Ыът. (з)
в которой 1, 2 - порядковые номера игроков; роль первого игрока выполняет ЛПР, формирующий программные стратегии II € 1А, а второй - фиктивный игрок - выбирает программные неопределенности Z £ -2, динамическая система множества Ы и 2 те же, что и в задаче Г; функции выигрыша ^(и, Z), ,1р{и, г) первого и второго
игрока соответственно имеют вид
ми, г) = Е оцЦи, г), да г) = Е А-ад я), «=1 ;=1
n n
где числа а,- < 0, г £ N. Е &{ = -1; /Зг > 0, г <Е N. = ,/г(г7, £),
¿=1 ¿=1 г £ N. определены в (2). Цель ^'-того игрока {] = 1,2) - достичь
возможно меньшего значения своей функции выигрыша.
Пара (II*, £*) £Ых2 называется ситуацией равновесия по Нэшу, если
= Е (4)
е 4=1 ¿=1
тш Е = Е (5)
"6М >=1 1=1
Утверждение 1. Пусть в задаче Г критерии ./¿(¡У,^ (г £ ]Ч) являются вогнуто-выпуклыми на Ы у. 2 (вогнутыми по и и выпуклыми по тогда нахождение 55-седловой точки (по Слейтеру) в задаче Г эквивалентно нахождению ситуации равновесия по Нэшу в бескоалиционной игре двух лиц (3).
Один из методов построения ситуации равновесия по Нэшу в программных стратегиях для игры (3) (а, следовательно, и 55-седловой точки для задачи Г) основывается на принципе максимума Понтря-гина.
С помощью необходимых условий в форме принципа максимума найден явный вид Аг-А^седловой точки для линейно-квадратичной динамической двухкритериальной задачи.
В качестве приложения построена 55-седловая точка, реализующая 5-решение гарантированное по 5 (по Слейтеру) в математической модели распределения капитальных вложений между отраслями.
Вторая глава ("Многошаговые многокритериальные задачи при неопределенности") состоит из шести параграфов и посвящена гарантированным решениям многошаговых ДМЗН:
Гт. = <53, г/, г, {М^г)}^),
где изменение текущего состояния х(Ь) 6 Л" управляемого объекта 23 происходит в соответствии с векторным разностным уравнением
= х{О)=х0, 1 = 0,1, ...0-1, (6)
$ > 0 - фиксированный момент окончания процесса и Хо - фиксированное начальное состояние в момент Ь = 0; п-вектор-функция <р(ж, и, 2,£) = (ц>х(ж, и, г, £), ...,<рп(х,и, управляющее воздействие в момент времени £ есть и(Ь) 6 С К.г; г{Ь) £ Р( С Л1 - неопределенный фактор в момент £. Под управлением {/ понимается последовательность управляющих воздействий (7 -г- (и(0),..,и(р - 1)}. Через обозначено множество всех управлений. Под неопределенностью Z будем понимать набор неопределенных факторов Е ~ {^(0), г(1),— 1)}. Через 2 обозначено множество неопределенностей. Считаем, что о неопределенных факторах известны лишь границы изменения, т.е. множества Ри а какие-либо статистические данные о их распределениях отсутствуют.
Эффективность процесса управления объектом Е оценивается набором из N критериев, имеющих следующий вид:
Ь{илг) = Е^(а;(£),и(£),2(£),£)+Фг(а:(1?)), ¿£N={1,2,(7)
4=0
где ^(ж, и, г, £) и Ф;(ж) (г € N) - заданные скалярные функции.
Далее везде считаем, что ,г,£), ^(х,и,г,Ь) и Фг(а;), г £ ]М,
непрерывно дифференцируемые функции переменных х>и,г.
В качестве решения задачи Г,т рассматривается ^-решение гарантированное по Ь, приведенное выше (нахождение такого решения сводится к построению .КХ-седловой точки).
Утверждение 2. Пусть в задаче Гт,
1° уравнения (6) линейны, именно при £ = 0,1,..., «9 — 1
х[Ь + 1) = Л(£)ж(£) + В(£)и(£) + Д(Ф(0> = ж0, где А(£), .£?(£), Д(£) -- матрицы соответствующих размерностей;
2° при всех ¿ = 0,1, ...,13 - 1 множества и Р4 выпуклые;
3° для каждого г € N функция Фг-(а;) - линейна по а: £ И";
4° функции = С^)х + где для каждого t =
= 0,1,...,??— 1 (г £ N1 - п-вектор-столбцы, скалярные
функции д{(и, х, £), г 6 К, вогнуты по и € при любом фиксированном г € Рь и выпуклы по 2 £ Рг при любом фиксированном и 6
Тогда все критерии /¿(£7, г € N, из (7) являются вогнуто-выпуклыми на ¡А х 2.
Утверждение 3. Пусть в задаче Ггаз критерии </¿(0, .2), г € IV, являются вогнуто-выпуклыми на прямом произведении выпуклых множеств Ы х 2. Тогда для того, чтобы пара (£/*,.£») € Ы X 2 была
55-седловой точкой в задаче Г,П8 необходимо и достаточно, чтобы су-
n n
ществовали числа а; < 0, г 6 ГЧ, £ ац = -1 и р,- > 0, г Е 14, Е А = 1
¿=1 4=1
такие, чтобы выполнялись равенства (4) и (5).
Поставим в соответствие задаче Гт., вспомогательную многошаговую бескоалиционную игру двух лиц (без неопределенностей), построенную аналогично (3):
({1,2}, х, и, 2, ши,г), ми, г)}). (8)
В качестве решения игры (8) будем рассматривать ситуацию равновесия по Нэшу (11*, Еч) е Ы х 2, которая как раз и определяется равенствами (4) и (5). Поэтому для задачи Г справедливо утверждение, аналогичное утверждению 1.
Устанавливается существование 55-седловой точки в задаче Гта. Теорема. Пусть задача Г,П8 удовлетворяет всем требованиям утверждения 2, кроме того, множества и Рг, 4 = 0,1, — 1, являются компактами и функции ^¿(а:,1£, ;?,£), г € 1М", из (7) непрерывны по совокупности переменных (х, и, г). Тогда в задаче Г^ существует 55-седловая точка.
ГТля задачи предлагается метод нахождения 55-седлсвсй тем ки, основанный на необходимых и достаточных условиях в форме принципа максимума для дискретных систем управления, и найден
явный вид 55-седловой точки в линейно-квадратичной задаче. Затем для одной многошаговой многокритериальной линейно-квадратичной задачи методом динамического программирования найден явный вид 55-седловой точки.
В качестве приложения построена 55-седловая точка, реализующая 5-решение гарантированное по 5, для задачи добычи некоторого биологического вида.
В третьей главе ("Существование гарантированных решений"), которая состоит из трех параграфов, снова рассматривается "непрерывная" динамическая многокритериальная задача при неопределенности, выделен класс таких задач, для которых существуют (?-решения гарантированные по О (по Джоффриоку) и, следовательно, ^-решения гарантированные по Ь при всех К,Ь = 5, Р, В, О.
Для этого была построена вспомогательная бескоалиционная игра двух лиц (без неопределенностей)
({1,2}, Е, {и, 2}, {адя), адя)}), (9)
в которой ситуация равновесия по Нэшу и является С&'-седловой точкой для исходной ДМЗН. В (9) система множество Ы программных стратегий [7 Ч- и(-) первого игрока, множество 2 стратегий 2 -т-второго игрока те же, что и в Г; функции выигрышей игроков
ни, г) = £ г), 12(и, г) = £ [-ДЛ^.
1=1 1=1
где > 0 (г £ N5, Е а = 1, £ /3 = 1, определены в
«=1 1=1
(2). В игре (9) игроки, выбирая соответственно стратегии и е Ы и ¿7 £ 2, стремятся получить возможно большее значение каждый своей функции выигрыша.
Затем задача построения ситуации равновесия по Нэшу (IIе, Ze) для игры (9) была приведена к нахождению седловой точки специальной антагонистической игры
<Е„, М, М, 1{Р,(?)),
(10)
динамика которой описывается системой
х = !р(Ь,х,ри,дг), х(Ц) = г0,
У = У> Яп,Рг), У(к) = ®0, (И)
V = (р^,и,ди,дг), «(¿о) = ж«;
здесь (х,у,у) € 113п; время £ 6 вектор-функции <£>(£, х,ри, дг),
у, 9,1,рл) и <р(Ь,у,ди,дг) те же, что и в правой части системы (1), только по сравнению с (1), например для <р^,х,ри,дг) в (р^,х,и,г) управляющее воздействие - вектор и - заменено на ри, неопределенный фактор г на дг; аналогичным образом произведены замены в следующих двух подсистемах из (11). Программные стратегии первого игрока Р-р(-) = (ри(-),Рг('))> р = £ М = Ы х 2, а программные стратегии второго игрока Я -т- д(-) — (?и(')> Зг('))> Я — [Яи>Яи) & М = Ы х 2. Функцию выигрыша первого игрока (проигрыша второго) определим функционалом
1(Р,Я) = 1г(Ри,Яг) + НЯи,Р*) ~ НЯпЯ,) - где
/1 = Е СцЩР^,), к{Яи>Рг) = Е [-/^(^.Л)] ,
1=1 г=1
1=1 ¿=1 В игре (10) первый игрок за счет выбора своей стратегии Р £ М стремиться максимизировать, а второй игрок выбором Я £ /Л стремиться наоборот минимизировать функционал 1(Р,(3). Решением игры (10) является седловая точка (Р°,<3°) £ М2:
та%1(Р,Я°) = I=
Связь между ситуацией равновесия по Нэшу (IIе, £е) £ К х 2 (ие Ч- ис{-), ~ ге(-)) бескоалиционной игры (9) и седловой точкой (Р°,<30) £МхМ (Р°+р°(-), Я" + д°(-)) антагонистической игры (10) устанавливает
Утверждение 4. Предположим, что
- пара (Р°,Я°) = {Р°,Р*,Я1,Я°:) £Ых2хЬ(х2 = МхМ = = М2 является седловой точкой в антагонистической игре (10);
- множество М в игре (10) выпукло;
- функционал I(P, Q) является сильно вогнутым по Р на М при каждом Q € A4 и сильно выпуклым по Q на М. при каждом
Рем.
Тогда
1°) ситуация Q° = (Ql,Q°z) — (Ue,Ze) £ М является равновесной по Нэшу в бескоалиционной игре (9),
2°) вектор-функции р°(-) = q°(-) при почти всех t 6 [io, т?], где
-/(•) = (ri(-).rf(-)), *«»(•) = (я°»(-),чШ ,
С помощью теорем существования седловых точек в дифференциальных антагонистических играх и установленных связей между исходной задачей Г и специальным образом построенными бескоалиционной и антагонистической играми, устанавливаются условия существование G-решения гарантированного по G для задачи Г.
В заключении сформулированы основные результаты диссертации.
Публикации по теме диссертации
1. Сачков С.Н. А-седловая точка в одной многокритериальной многошаговой задаче // Известия Российской Академии Естественных Наук. Дифференциальные уравнения. 2001. N. 5. Рязань, 2001. С. 152 - 153. 0,1 п.л.
2. Сачков С.Н. Аналог седловой точки для многокритериальной задачи при неопределенности // Современные методы в теории краевых задач "Понтрягинские чтения XII" .Тез. докл. Воронеж: ВГУ, 2001. С. 195 - 196. 0,1 п.л.
3. Сачков С.Н. Об одной векторной гарантии // Математика. Компьютер. Образование. Тез. покл. VTT Межггунар. конф. Лубна. 23 - 30 января 2000 года. М.: Прогресс Традиция, 1999. С. 288. 0,1 п.л.
4. Сачков С.Н. Принцип максимума для многокритериальной динамической задачи при неопределенности // Известия института математики и информатики. Выпуск 1(21). Ижевск: Изд-во Удмуртского гос. ун-та, 2001. С. 83 - 92. 0,7 п.л.
5. Сачков С.Н. Структура гарантированных решений в многошаговой многокритериальной задаче // Тез. докл. 5-й Российской университетско - академической научно - практической конференции. 4.10. Ижевск, 2001. С. 41 - 42. 0,1 п.л.
6. Сачков С.Н., Жуковский В.И. Гарантированные решения в многошаговой многокритериальной задаче // Алгоритмический анализ неустойчивых задач: Тез. докл. Всерос. науч. конф., Екатеринбург, 26 февр. - 2 марта 2001 года. Екатеринбург: йзд-во Уральского ун-та, 2001. С. 184 - 185. 0,1 п.л. (Авт. вклад 50%)
7. Sachkov S.N. A two-criterial problem, under uncertainty // Дифференциальные и интегральные уравнения. Математические модели. Тез. докл. междунар. конференции, 4-8 февраля 2002 года, г. Челябинск. Челябинск, 2002. С. 126. 0,1 п.л.
8. Sachkov S.N. About a solution of multicriterial problem under uncertainty // Математика. Образование. Экономика. Экология. Междисциплинарный семинар "Нелинейные модели в естественных и гуманитарных науках": Тез. докл. IX междунар. конф. Чебоксары: Изд-во Чувашского ун-та, 2001. С. 98. 0,1 п.л.
9. Sachkov S.N. Saddle point by Slater in multicriterial positional problem // Материалы международной конференции по проблемам управления " Автоматика - 2001", 10 - 14 сентября 2001, Одесса, Украина. Одесса, 2001.Т. 1. С. 84 - 85. 0,1 п.л.
10. Zhukovskiy V.l., Sachkov S.N. Multicriterial problems under uncertainty // Материалы международной конференции по проблемам управления " Автоматика - 2001", 10 - 14 сентября 2001, Одесса, Украина. Одесса, 2001. Т. 1. С. 71. 0,1 п.л. (Авт. вклад 50%)
Подп. к печ. 03.07.2003 Объем 1.0 пл. Заказ №298 Тир. 100 Типография МПГУ
Ii 13 7 9 7
Оглавление автор диссертации — кандидата физико-математических наук Сачков, Сергей Николаевич
Введение.
Глава 1. Многокритериальные "непрерывные" динамические задачи при неопределенности
§1. Постановка задачи. Формализация решения.
§ 2. Векторные гарантии
§ 3. Гарантированные решения
§ 4. Необходимые условия
§ 5. К оптимизации распределения капитальных вложений между отраслями
§ 6. Линейно-квадратичная двухкритериальная задача.
Глава 2. Многошаговые многокритериальные задачи при неопределенности
§ 7. Постановка задачи. Формализация решения.
§ 8. Необходимые и достаточные условия.
§ 9. Линейно-квадратичная задача.
§ 10. Существование 55 -седловой точки
§11. Применение динамического программирования
§ 12. Задача управления добычей некоторого биологического вида
Глава 3. Существование гарантированных решений
§ 13. Постановка задачи
§ 14. Сведение к антагонистической игре.
§15. Существование С -решения гарантированного по 6?
Введение 2003 год, диссертация по информатике, вычислительной технике и управлению, Сачков, Сергей Николаевич
Разумная человеческая деятельность в большинстве случаев состоит в том, что человеку для достижения тех или иных целей приходится принимать решения. При этом представляется вполне естественным стремление принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени. Проблемы, связанные с выбором оптимальных решений, встречаются в экологии, военном деле, экономике, технике и т.д. По мере развития и математизации этих сфер человеческой деятельности соответствующие процессы принятия решений формализуются и приобретают характер математических моделей. Математическая модель отражает проблему принятия решений в абстрактной форме и позволяет учесть большое число разнообразных характеристик, от которых зависит функционирование конкретного объекта управления. Анализ и расчет математической модели позволяют выбрать оптимальные решения поставленной задачи и обосновать этот выбор.
Теория математических моделей принятия оптимальных решений составляет содержание исследования операций. Задачи исследования операций можно классифицировать по уровню информации о ситуации, которой располагает лицо, принимающее решения (ЛПР) [52, с.7]:
• детерминированные - в этих задачах условия, в которых принимаются решения, известны полностью;
• стохастические, в которых известно множество возможных вариантов условий и их вероятностное распределение;
• неопределенные, когда известно множество возможных вариантов, но без какой-либо информации об их вероятностях. Такой уровень информации о ситуации является наиболее сложным, так как могут быть не ясны сами принципы оптимального поведения.
Методы решения задач первых двух типов изучаются в курсах: математического программирования. При этом на первый план выходит изучение динамических систем. Исследованием таких задач занимается математическая теория оптимального управления. Основы этой теории были заложены в конце 50-х годов академиком Л.С. Понтрягиным и его учениками [54], центральным, стержневым результатом здесь является принцип максимума. Большая значимость и популярность этого подхода привели к тому, что и в теории дискретных задач оптимизации (широкий интерес к которым возник несколько позже) были в первую очередь предприняты попытки найти дискретный аналог принципа максимума.
Одновременно был создан новый подход к решению задач оптимального управления - метод динамического программирования, - предложен американским математиком Р. Беллманом [3].
Математический аппарат теории дискретных оптимальных процессов развит в трудах В.Г. Болтянского [5], Л.И. Розоноэра [58], Ф.М. Кирилловой и Р. Габасова [12, 13], А.И. Пропоя [55], Р. Ариса [2] и др.
Эволюция теории оптимального управления происходит преимущественно в направлении изучения все более сложных систем. Одним из таких усложнений является увеличение числа оптимизируемых параметров, поскольку целенаправленное функционирование многих систем по своей природе многокритериально. Такие задачи возникают, например, в экономике, когда в процессе функционирования предприятия одновременно ставятся разные цели: добиться максимально возможных прибыли и выпуска продукции в натуральном или стоимостном выражении, одновременно с этим выдержать установленные показатели по номенклатуре или ассортименту, снизить себестоимость, добиться определенного уровня качества и рентабельности производимой продукции и т.д. Некоторые из этих показателей по тенденциям их реализации могут быть противоречивыми. В этом случае необходимо искать разумный компромисс, когда для принятого плана производства не достигаются потенциально возможные оптимальные значения отдельных целевых критериев, но каждый из них для этого плана принимает в той или иной мере близкое к оптимальному значение. Наличие нескольких критериев во многих прикладных задачах послужило причиной для возникновения нового направления - теории многокритериальных задач.
Основы теории многокритериальной оптимизации - в работах итальянского экономиста В. Парето (1848 - 1923). Одним из основных понятий этой теории является понятие оптимального по Парето или эффективного решения. Оно представляет собой обобщение понятия максимума числовой функции на случай нескольких функций: решение Парето-оптимально, если значение любого из критериев можно улучшить лишь за счет ухудшения значений хотя бы одного из остальных критериев.
На первых порах изучались статические задачи [53],[72],[79]. Однако запросы практики вскоре потребовали исследования и динамических многокритериальных систем управления [28].
Математические модели "классической" теории многокритериальных задач охватывают обычно идеальные системы, в которых каждому решению отвечает единственное значение каждого критерия. Однако в реальных системах данное условие часто не выполняется. Типичной является ситуация, когда относительно некоторых параметров системы или внешних воздействий известны лишь границы их изменения, внутри которых эти параметры могут принимать любое, заранее непредсказуемое значение. Так, например, при планировании выпуска продукции не всегда можно учесть сбои в обеспечении сырьем, брак, поломки оборудования и т.д. Поэтому решения приходится принимать, считаясь с воздействиями неконтролируемых факторов - неопределенностей. Многокритериальные задачи при неопределенности - новое активно развивающееся направление теории принятия решений.
Для однокритериальных (скалярных) задач при неопределенности в 50-х годах прошлого века были созданы несколько принципов, на основе которых могут быть построены оптимальные решения [40]. К ним относятся - принцип гарантированного результата (максиминной полезности или принцип Вальда), принцип минимаксного сожаления (принцип Сэвиджа), принцип пессимизма-оптимизма (принцип Гурвица) и др. До сих пор основные исследования многокритериальных задач при неопределенности ведутся в рамках подходящей модификации принципа гарантированного результата. Динамический вариант таких задач в позиционных стратегиях активно исследуется в России профессором В.И. Жуковским [26],[28],[29], [91] и его учениками B.C. Молоствовым [27], Г.И. Житомирским [23], В.А. Матвеевым [41], В.В. Мухиным [45], И.В. Чернявским [69]. Параллельно за рубежом ведутся работы по исследованию статического варианта: работы F. Ferro [76],[77], О. Blackwell [71], T. Tanaka [87],[88],[89] W.L. Chan и W.T. Lau [73], G.Y. Chen [74], J.G. Lin [80]. Однако в вопросах прогнозирования и планирования актуальным является исследование динамических многокритериальных задач с программными управлениями и неопределенностями, а также соответствующих многошаговых задач. Именно таким задачам и посвящена диссертация.
Неопределенность занимает особое место среди условий, в которых приходится принимать решения. Это особое положение определяется, в первую очередь, практической необходимостью принимать решения в условиях, когда не удается полностью учесть влияние каких-либо факторов. Такая ситуация встречается в подавляющем большинстве областей техники, экономики, экологии и социальных науках. При этом наличие неопределенности приводит к тому, что нельзя однозначно определить понятие решения многокритериальной задачи, а можно лишь указать "разумные, или хорошие в разных отношениях" решения. Поэтому необходимо стремиться к оптимальному использованию имеющейся информации относительно поставленной задачи, чтобы, взвесив все возможные варианты решений, постараться найти среди них наилучший.
Отметим, что задачи принятия решений при неопределенности (в том числе и многокритериальные) связаны с теорией игр. Следуя определению H.H. Воробьева, теория игр - это теория математических моделей принятия оптимальных решений в условиях неопределенности, когда принимающий решение субъект ("игрок") располагает информацией лишь о множестве возможных ситуаций, в одной из которых он в действительности находится, о множестве решений (стратегий), которым он может следовать, и о количественной мере того "выигрыша", который он мог бы получить, выбрав данную стратегию (Воробьев H.H. Философская энциклопедия.- Т.5. - М., 1970, - С.208 - 210). Задачу принятия решений в условиях неопределенности зачастую можно трактовать как конфликтную ситуацию для двух игроков, одним из которых является ЛПР, а в качестве второго игрока рассматривается гипотетический индивид, формирующий неопределенность. При этом, если придерживаться принципа гарантированного результата (или его модификаций для многокритериальных задач), то следует считать, что второй игрок стремится всячески навредить первому, препятствуя достижению его целей.
Теория игр возникла вначале XX века и первые ее результаты систематически изложены в известной монографии Джона фон Неймана и Оскара Моргенштерна (на русском языке - [68]), опубликованной в 1944 году. Первые этапы развития теории игр были посвящены изучению "статических" игр , в них не учитывалась динамка объекта управления, но уже во второй половине XX века начинает активно развиваться теория динамических игр - дифференциальных ([1],[17], [36],[43],[47],[48],[20] - [22], [24],[31], др.), многошаговых ([19],[70],[75] и др.)» Результаты и подходы теории игр широко используются в исследовании многокритериальных задач при неопределенности.
Теперь перейдем к непосредственному рассмотрению динамической многокритериальной задачи при неопределенности (ДМЗН). Под ДМЗН обычно понимают упорядоченный набор
53, м, г, (о.1)
В (0.1) символом 53 обозначается управляемая динамическая система (объект). В экономике это могут быть промышленные предприятия, разного рода объединения, супермаркеты и так далее, в экологии - те же предприятия, очистные сооружения или среда обитания определенных биологических видов, в механике - группа кораблей, самолетов. Предполагают обычно, что функционирование объекта 53 происходит на заданном временном интервале - от фиксированного момента начала ¿о > 0 до фиксированного момента окончания процесса $ > ¿о • При этом, если информация о состоянии объекта 53 и управление процессом осуществляются "непрерывно" в каждый момент Ь 6 , то такую ДМЗН будем, следуя [5], называть "непрерывнойЕсли же информация о состоянии процесса и управление процессом осуществляются в дискретные моменты времени + 1,£о + 2,.,$ — 1, т.е. по шагам, то соответствующая ДМЗН называется многошаговой или дискретной. Множество указанных выше моментов времени, в которые возможно влиять на состояние системы, обозначим через ©, тогда для "непрерывных" задач 0 = [¿о, тд) , а для дискретных ДМЗН будет 0 = {¿о> ¿о + •••■> $ — 1} •
Параметры (состояние) объекта Е в каждый момент времени £ £ 0 описываются фазовым п -вектором х(£). Под влиянием управляющих воздействий ЛПР и неопределенностей фазовый вектор х £ Кп изменяется во времени. Это изменение описывается дифференциальным (в случае "непрерывной" ДМЗН) или конечно-разностным (в случае многошаговой ДМЗН) уравнением.
В каждый момент времени ¿60 ЛПР выбирает и реализует решения на основе некоторой информации о текущем и / или предыдущих значениях фазового вектора. Подобной информацией может обладать и неопределенность. Ту информацию, которой владеет ЛПР на момент времени Ь обозначим через г)\, а ту, которая присуща неопределенности — через 772 • Тогда множества
Ф1 = {!?{,« €©}, ф 2 = Н,«€в} определяют информационную структуру конкретной ДМЗН. При этом, если Ы • Г}) = {х(к),к< t}yt е ©},j = 1,2, (0.2) то соответствующая ДМЗН называется позиционной. Если же Н : ^ = е 0} , j = 1,2, (0.3) то ДМЗН называется задачей с программными управлениями и неопределенностями.
Через U в (0.1) обозначено множество управлений, выбором которых распоряжается ЛПР. Конкретный элемент множества U обозначим через U. В экономических и экологических задачах управлениями могут быть штрафы, премии, объем инвестиций или производства, внедрение новых технологий и т.д., в механических - угол поворота руля. ЛПР, обладая той или иной информацией о состоянии системы Е, выбирает конкретное управление U е U. При этом, если информационная структура задачи имеет вид (0.2), то управление формируется как функция времени и состояния, то есть »
U + y(t,x), 16 0, если же информационная структура имеет вид (0.3), то управление является функцией только времени, а именно
U -f 7(i), t G О. ,
Множество Z состоит из неопределенностей Z, о которых ЛПР в каждый момент t е 0 известна лишь область возможных значений. В экономических системах появление неопределенностей может быть вызвано как внешними факторами (недопоставки сырья, появление новых технологий, появление конкурентов), так и внутренними (срыв планируемых сроков пуска технологической линии, поломка оборудования, брак), в механических системах причиной возмущений могут быть температурные, погодные условия. Отметим, что неопределенности отождествляются с функциями, зависящими от времени t и состояния системы х, то есть z + x{t,x,), tee позиционные неопределенности") или с функциями, зависящими только от времени t: z + x(t), tee 8 программные неопределенности").
В результате воздействия управления U Е Ы и неопределенности Z Е Z на X, система £ "вырабатывает" величины Ji(U,Z), г € N = = {1,2,., N}, - критерии, характеризующие эффективность процесса управления "с точки зрения" ЛПР. Примем, что в интересах ЛПР выбрать такое управление U Е U., чтобы добиться одновременно возможно больших значений каждого из N критериев. При этом ЛПР должен каким-то образом учесть возможность реализации любой, заранее непредсказуемой неопределенности Z Е Z.
Под решением ДМЗН будем понимать конкретное управление U* Е Е U, которое следует выбрать лицу, принимающему решение (ЛПР) и векторную гарантию J* = (Jj",., Jjy) Е R^, которую ЛПР "обеспечивает себе", следуя управлению U*. Каждая компонента J*,i Е N, вектора J* определяет то гарантированное значение соответствующего критерия Ji(U, Z), i Е N, на которое ЛПР может рассчитывать при реализации любой неопределенности Z Е Z.
Одним из возможных подходов к формализации такого решения является применение принципа гарантированного результата к каждому критерию Ji{U,Z)ji Е N, в отдельности, а именно:
Определение. Вектор J9 = («7f,., JgN) называется минимальной векторной гарантией в задаче (0.1) при фиксированном управлении U* G W, если
J? = min Ji{U\Z)y -¿EN. (0.4)
Недостатком данного определения является то, что, как правило, минимум в каждом из N равенств (0.4) достигается на разных неопределенностях ZW Е Z: min Ji(U*, Z) = Ji(U\ ZW), г E N.
Однако в задаче (0.1) реализуется лишь одна из неопределенностей. Поэтому в диссертации рассматриваются только те векторные гарантии, которые реализуются на одной и той же неопределенности. Такой подход был предложен профессором В.И. Жуковским [91] и связан с применением понятий векторных минимумов (по Слейтеру, Парето, Борвей-ну, Джоффриону и А-минимума) из теории многокритериальных задач. Именно данный подход и применяется в диссертации.
Целью работы является исследование гарантированных решений в динамических многокритериальных задачах с программными управлениями и неопределенностями, причем предполагается, что о неопределенностях известна лишь область возможных значений.
Объектом исследования являются динамические многокритериальные задачи принятия решений в условиях неопределенности.
Предмет исследования - векторные седловые точки, реализующие гарантированные решения в "непрерывных" и многошаговых ДМЗН.
Проблема заключается в способе формализации гарантированных решений ДМЗН с программными управлениями и неопределенностями и в поиске методов построения векторных седловых точек, реализующих такие решения.
В основу исследования положена следующая гипотеза: на основе модификации принципа гарантированного результата и понятий опти-мумов по Слейтеру, Парето, Борвейну, Джоффриону и А-оптимума из теории многокритериальных задач можно, следуя [91], определить возможные решения ДМЗН и соответствующие векторные седловые точки, реализующие эти решения; основываясь на результатах из теории многокритериальных задач, теории игр и оптимального управления можно установить существование указанных седловых точек (а, следовательно, и гарантированных решений ДМЗН) и предложить способ их нахождения.
Для реализации поставленной цели и проверки сформулированной гипотезы потребовалось решить следующие задачи:
- формализовать понятия гарантированных решений для ДМЗН с программными управлениями и неопределенностями и векторных седловых точек, реализующих такие решения;
- установить связь гарантированных решений ДМЗН с равновесным решением специально построенной бескоалиционной игры двух лиц;
- выявить условия существования таких решений для "непрерывных" и дискретных ДМЗН с программными управлениями и неопределенностями;
- найти методы построения гарантированных решений, используя аппарат принципа максимума Л.С. Понтрягина;
- построить управление и неопределенность, реализующие гарантированное решение для линейно-квадратичных "непрерывной" и многошаговой задач;
- рассмотреть возможные приложения к конкретным экономическим задачам.
Методологическую основу работы составляют методы и подходы теории многокритериальных задач, теории игр, выпуклого анализа, теории матриц и квадратичных форм, дифференциальных и конечно-разностных уравнений, теории оптимального управления.
Научная новизна. До сих пор исследования ДМЗН велись в рамках "непрерывных" позиционных задач. Динамические "непрерывные" многокритериальные задачи при неопределенности с программными управлениями и неопределенностями, а также соответствующих многошаговые ДМЗН не рассматривались. Как раз этим вопросам посвящена диссертация. Поэтому результаты работы являются новыми.
Практическая значимость работы. Рассмотренный подход к определению решения для ДМЗН и предложенные способы построения гарантированных решений могут быть применены к различным прикладным задачам прогнозирования и планирования в экономике, экологии, механике управляемых систем. В качестве приложения в диссертации рассматривается математическая модель задачи оптимизации размещения капитальных вложений и задача добычи некоторого биологического вида.
Основные положения, выносимые на защиту:
• формализовано понятие гарантированного решения для "непрерывных" и многошаговых ДМЗН с программными управлениями и неопределенностями;
• выделен класс "непрерывных" ДМЗН, в которых существует гарантированное по Джоффриону решение;
• найдены условия существования гарантированного по Слейтеру решения для многошаговых ДМЗН;
• сформулированы необходимые условия существования седловых точек по Слейтеру в форме принципа максимума;
• найден явный вид седловой точки по Слейтеру в "непрерывной" и многошаговой линейно-квадратичных ДМЗН, при этом были использованы необходимые условия и (для одной многошаговой задачи) метод динамического программирования;
• полученные результаты применены к построению гарантированных решений в двух конкретных экономических задачах.
Апробация. Результаты диссертации докладывались на научных семинарах кафедры математики и механики РосЗИТЛП, на научно-методическом семинаре кафедры информатики и дискретной математики МПГУ, на Международной школе по динамическим и управляемым системам (Суздаль, 2001), на Международной конференции по проблемам управления "Автоматика - 2001" (Одесса, 2001), на XII Крымской осенней математической школе-симпозиуме (Крым, Севастополь, 2001).
Перейдем к краткому изложению содержания диссертации. Диссертация состоит из трех глав, разбитых на пятнадцать параграфов.
В первой главе (§§1 — 6) вводятся гарантированные решения в "непрерывной" ДМЗН с программными управлениями и неопределенностями, исследуются седловые точки, реализующие эти решения. Именно, в §1 определяются основные составляющие элементы "непрерывной" ДМЗН, описывается процесс принятия решения, определяются цели, на достижение которых направлен процесс управления, приводится определение векторной гарантии. В §2 рассматриваются различные виды векторных гарантий, определенных на основе понятий минимумов по Слейтеру, Парето, Борвейну, Джоффриону, А -минимума из теории многокритериальных задач. В третьем параграфе, следуя [91], формализуются возможные решения ДМЗН и векторные седловые точки, реализующие эти решения, устанавливается связь между приведенными решениями и седловыми точками. Необходимым и достаточным условиям существования ¿>5 -седловых точек, реализующих гарантированное по Слейтеру решение ДМЗН, посвящен §4. Здесь же предложен способ нахождения -седловых точек, основанный на применении аппарата принципа максимума Понтрягина, приведены условия, при выполнении которых принцип максимума является не только необходимым, но и достаточным условием существования указанных седловых точек. Утверждения и алгоритмы из §4 применены в следующих двух параграфах для нахождения седловых точек в конкретных задачах. Именно, в §5 рассмотрена задача оптимизации распределения капитальных вложений между отраслями и для нее найдена 55 -седловая точка, а в §6 найден явный вид А2А1 -седловой точки в линейно-квадратичной двухкритериальной задаче.
Содержание второй главы (§§ 7 - 12) составляет формализация гарантированных решений и исследование векторных седловых точек, реализующих эти решения в многошаговых ДМЗН. В §7 - постановка задачи, описание процесса управления, формализация предлагаемого решения. В §8 устанавливаются необходимые и достаточные условия существования 55-седловых точек, реализующих 5-решение гарантированное по 5 (по Слейтеру), в форме принципа максимума. В §9 выделен класс задач, в которых существует 55-седловая точка. Далее необходимые и достаточные условия из §8 применяются в §10 для нахождения явного вида 55-седловой точки в одной линейно-квадратичной двухкритериальной задаче. В §11 для другой линейно-квадратичной N -критериальной задачи седловая точка найдена с помощью метода динамического программирования. В заключении второй главы в §12 рассмотрена задача "разумной" добычи некоторого биологического вида (например, рыбы из водоема), для которой найден явный вид 55-седловой точки, реализующей предложенное гарантированное решение.
В третьей главе выделен класс "непрерывных" ДМЗН, в которых существует О -решение гарантированное по С? (по Джоффриону). В §13 рассматриваются ограничения на управляемую систему, управления, неопределенности и критерии, и исходной задаче ставится в соответствие специальная вспомогательная бескоалиционная игра двух лиц (без неопределенности). В следующем §14 для указанной бескоалиционной игры строится специальная антагонистическая игра. Приводятся условия существования седловой точки антагонистической дифференциальной игры в двух случаях: когда заданы ограничения на множества стратегий игроков, и когда такие ограничения отсутствуют. Устанавливается связь равновесной ситуации бескоалиционной игры с седловой точкой построенной антагонистической игры. Основываясь на результатах предыдущих параграфов в §15 установлены условия существования О -решения гарантированного по <2 (по Джоффриону) в исходной задаче.
Основные результаты исследований опубликованы в работах [60] - [65], [84] - [86], [90].
Заключение диссертация на тему "Гарантированные решения в многокритериальных динамических задачах"
Основные результаты
1) получены достаточные условия существования гарантированных решений для "непрерывных" и дискретных ДМЗН с программными управлениями и неопределенностями;
2) предложены методы (основанные на аппарате принципа максимума и динамического программирования) построения седловых точек, реализующих гарантированные решения исследуемых задач;
3) найден явный вид управления и неопределенности, которые реализуют гарантированное решение для линейно-квадратичных "непрерывной" и многошаговой задач;
4) в качестве приложения построены седловые точки, реализующие гарантированные решения, для математической модели оптимизации размещения капитальных вложений между отраслями и в задаче оптимизации добычи одного биологического вида.
Заключение
Многокритериальные задачи при неопределенности - новое активно развивающееся направление теории принятия решений, которое, по сравнению с классическими теориями, предоставляет, на наш взгляд, более адекватный аппарат для описания реальных прикладных задач экономики, экологии, механики и др. Особое место в этой теории занимают динамические задачи с программными управлениями и неопределенностями (ДМЗН), которые являются актуальными в вопросах прогнозирования и планирования. Исследованию таких задач и посвящена настоящая работа. При этом были получены следующие
Библиография Сачков, Сергей Николаевич, диссертация по теме Теоретические основы информатики
1. Айзеке Р. Дифференциальные игры. М.: Мир, 1967.
2. Арис Р. Дискретное динамическое программирование. М.: Мир, 1969.
3. Беллман Р. Динамическое программирование. М.: ИЛ, 1960.
4. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969.
5. Болтянский В.Г. Оптимальное управление дискретными системами. М.: Наука, 1973.
6. Вайнберг М.М. Вариационные методы исследования нелинейных операторов. М.: Гостехиздат, 1956.
7. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977.
8. Васильев Ф.П. Методы оптимизации. М.: Факториал Пресс, 2002.
9. Воробьев H.H. Основы теории игр. Бескоалиционные игры. М.: Наука, 1984.
10. Воробьев H.H. Современное состояние теории игр // Успехи матем. наук. 1970. 25, вып. 2. С. 81 140.
11. Воробьев H.H. Теория игр для экономистов-кибернетиков. М.: Наука, 1985.
12. Габасов Р., Кириллова Ф.М. К вопросу о распространении принципа максимума JI.С. Понтрягина на дискретные системы // Автоматика и телемеханика. 1966. 27, N 11. С. 11 23.
13. Габасов Р., Кириллова Ф.М. Основы динамического программирования. Минск: Издательство БГУ, 1975.
14. Гермейер Ю.Б. Введение в исследование операций. М.: Наука, 1971.
15. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976.
16. Горелик В.А. Принцип гарантированного результата в неантагонистических играх двух лиц с обменом информацией // Исследование операций. М.: ВЦ АН СССР. 1971. Вып.2. С. 102 108.
17. Горелик В.А., Горелов М.А., Кононенко А.Ф. Анализ конфликтных ситуаций в системах управления. М.: Радио и связь, 1991.
18. Горелик В.А., Ушаков И.А. Исследование операций. М.: Машиностроение, 1986.
19. Горелик В.А., Федоров В.В. Решение многошаговых игр с полной информацией методом штрафных функций // III Всесоюзная конференция по теории игр. Одесса, 1974. Тезисы докладов. Одесса, 1974. С. 214 215.
20. Дифференциальные игры со многими участниками. Указатель литературы за 1968 83 / Под ред. В.И. Жуковского, Д.Т. Дочева. Болгария, Русе: Центр по Математике, 1985.
21. Дифференциальные игры со многими участниками. Указатель литературы за 1984 88 / Под ред. В.И. Жуковского, В.Н. Ушакова. Свердловск: УрО АН СССР, 1990.
22. Дифференциальные игры со многими участниками. Указатель литературы за 1989 94 / Под ред. В.И. Жуковского, В.И. Ухоботова. Челябинский Госуниверситет, 1995.
23. Житомирский Г.И. Конфликтные динамические задачи: Автореф. дис. . канд. физ.-матем. наук. ЛГУ, 1989.
24. Жуковский В.И. Введение в дифференциальные игры при неопределенности. М.: Международный НИИ проблем управления, 1997.
25. Жуковский В.И К теории дифференциальных игр с интегральной платой I // Кибернетика. 1971. N 4. С. 130 142.
26. Жуковский В.И., Молоствов B.C. Многокритериальная оптимизация систем в условиях неполной информации. М.: Международный НИИ проблем управления, 1990.
27. Жуковский В.И., Молоствов B.C. Многокритериальное принятие решений в условиях неопределенности. М.: Международный НИИ проблем управления, 1988.
28. Жуковский В.И., Салуквадзе М.Е. Многокритериальные задачи в условиях неопределенности. Тбилиси: МЕЦНИЕРЕБА, 1991.
29. Жуковский В.И., Салуквадзе М.Е. Оптимизация гарантий в многокритериальных задачах управления. Тбилиси: МЕЦНИЕРЕБА, 1996.
30. Жуковский В.И., Тынянский Н.Т. Равновесные управления многокритериальных динамических систем. М.: Издательство Московского университета, 1984.
31. Жуковский В.И., Чикрий A.A. Линейно-квадратичные дифференциальные игры. Киев: Наукова думка, 1994.
32. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974.
33. Карлин С. Математические методы в теории игр, программировании и экономике. М.: Мир, 1964.
34. Коддингтон Э.А., Левинсон Н. Теория обыкновенных дифференциальных уравнений. М.: Изд-во иностр. лит-ры, 1958.
35. Кононенко А.Ф., Халезов А.Д., Чумаков В.В. Принятие решений в условиях неопределенности / Под ред. Л.Г. Турина. М.: Вычислительный центр АН СССР, 1991.
36. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
37. Левитин Е.С., Поляк Б.Т. Методы минимизации при наличии ограничений. // ЖВМ и МФ. 1966. 6, N 5. С. 787 823.
38. Ли Е.Б., Маркус Л. Оптимальное управление нелинейными системами // Кибернетический сборник. 1966. Вып. 2. С. 57 68.
39. Ли Е.Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.
40. Льюс Р.Д., Райфа X. Игры и решения. М.: Иностр. литература, 1961.
41. Матвеев В.А. Многокритериальная позиционная задача для параболической системы: Автореф. дис. . канд. физ.-матем. наук. Екатеринбург: УрГУ, 1992.
42. Многокритериальные динамические задачи при неопределенности / Сборник научных трудов. Орехово-Зуево, 1991.
43. Мохонько Е.З. Динамика информационных процессов в неантагонистических играх: Дис. . докт. физ.-матем. наук. М. : ВЦ РАН, 1997.
44. Мохонько Е.З. О дифференциальной игре с неточным знанием терминального выигрыша. М.: ВЦ РАН, 1994.
45. Мухин В.В. Парето оптимальные гарантии в динамических системах: Автореф. дис. . канд. физ.-матем. наук. М.: Ун-т Дружбы народов, 1990.
46. Немыцкий В.В., Степанов В.В. Качественная теория дифференциальных уравнений. М.: ГИТТЛ, 1949.
47. Никольский М.С. О гарантированных оценках в дифференциальных играх с векторным критерием качества // Известия АН СССР. Техническая кибернетика. 1980. N 2. С. 37 43.
48. Никольский М.С. Первый прямой метод Л.С. Понтрягина в дифференциальных играх. М.: Издательство МГУ, 1984.
49. Основы теории оптимального управления: Учеб. пособие для экон. вузов / В.Ф. Кротов, Б.А. Лагоша, С.М. Лобанов и др.; Под ред. В.Ф. Кротова. М.: Высшая школа, 1990.
50. Партхасаратхи Т., Рагхаван Т. Некоторые вопросы теории игр двух лиц. М.: Мир, 1974
51. Петросян Л.А., Захаров В.В. Математические модели в экологии. СПб.: Издательство СПбГУ, 1997.
52. Петросян JI.А., Зенкевич H.A., Семина Е.А. Теория игр. М.: Высшая школа, 1998.
53. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982.
54. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.
55. Пропой А.И. Элементы теории оптимальных дискретных процессов. М.: Наука, 1973.
56. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980.
57. Рихтер К. Динамические задачи дискретной оптимизации. М.: Радио и связь, 1985.
58. Розоноэр Л.И. Принцип максимума Л.С. Понтрягина в теории оптимальных систем, III // Автоматика и телемеханика. 1959. 20, N 1. С.31 43.
59. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1971.
60. Сачков С.Н. А-седловая точка в одной многокритериальной многошаговой задаче // Известия Российской Академии Естественных Наук. Дифференциальные уравнения. 2001. N. 5. Рязань, 2001. С. 152 153.
61. Сачков С.Н. Аналог седловой точки для многокритериальной задачи при неопределенности // Современные методы в теории краевых задач "Понтрягинские чтения XII" .Тез. докл. Воронеж: ВГУ, 2001. С. 195 196.
62. Сачков С.Н. Об одной векторной гарантии // Математика. Компьютер. Образование. Тез. докл. VII Междунар. конф. Дубна. 23 -30 января 2000 года. М.: Прогресс Традиция, 1999. С. 288.
63. Сачков С.Н. Принцип максимума для многокритериальной динамической задачи при неопределенности / / Известия института математики и информатики. Выпуск 1(21). Ижевск: Издательство Удмуртского гос. университета, 2001. С. 83 92.
64. Сачков С.Н. Структура гарантированных решений в многошаговой многокритериальной задаче // Тез. докл. 5-й Российской универси-тетско академической научно - практической конференции. 4.10. Ижевск, 2001. С. 41 - 42.
65. Трухаев Р.И., Хоменюк В.В. К теории неклассических игровых задач // Тез. I Всес. конф. по теории игр. Ереван, 1968. С. 102.
66. Филиппов А.Ф. О некоторых вопросах теории оптимального управления // Вестник МГУ, серия матем., мех., астр., физ., химии. 1959. N 2. С. 25 38.
67. Фон Нейман Дж., Моргенштерн Н.О. Теория игр и экономическое поведение. М.: Наука, 1973.
68. Чернявский И.В. Гарантии в многокритериальных задачах: Авто-реф. дис. . канд. физ.-матем. наук. М.: МГУ, 1988.
69. Basar Т. On the uniqueness of the Nash solution in linear-quadratic differential games // Int. J. Game Theory. 1976. Vol. 5, N 2 3. P. 996 - 999.
70. Blackwell O. An analog of the minimax theorem for vector pay-offs // Pasific J. Math. 1956. N6. P. 1 8.
71. Borwein J. Proper efficient points for maximization with respect to cones // SIAM J. Control and Optimiz. 1957. Vol. 15, N I. P. 57 63.
72. Chan W.L., Lau W.T. Vector saddle point and distributed parameter differential games // Comput. and Math. Appl. 1989. 18, No 1 - 3. P. 195 - 207.
73. Chen G.Y. A generalized section theorem and minimax inequality for a vector valued mapping // Optimization. 1991. 22. P. 745 - 754.
74. Dolezal J. Open-loop and closed-loop equilibrium solutions for multistage games // Banach Center Publ. Vol. 1. Proc. Conf., Zakopanne, 1974. Warszawa: PWN, 1976. P. 73-81.
75. Ferro F. Minimax theorem for vector valued functions //J. Optimiz. Theory and Appl. 1989. 60. P. 19 - 31.
76. Ferro F. Minimax theorem for vector valued functions. Part 2. // J. Optimiz. Theory and Appl. 1991. 68, No 1. P. 35 - 48.
77. Friedman A. Linear-quadratic differential games with nonzero-sum and with N-players // Arch. Ration. Mech. And Analysis. 1969. 34, N 3. P. 165 187.
78. Multiple criteria problems under uncertainty: Abstracts the Third International Workshop. Orekhovo-Zuevo, Russia, 1994.
79. Multiple criteria problems under uncertainty: Abstracts the Fourth International Workshop. Moscow, Russia, 1996.
80. Sachkov S.N. A two-criterial problem under uncertainty // Дифференциальные и интегральные уравнения. Математические модели. Тез. докл. междунар. конференции, 4-8 февраля 2002 года. Челябинск, 2002. С. 126.
81. Sachkov S.N. Saddle point by Slater in multicriterial positional problem // Материалы международной конференции по проблемам управления " Автоматика 2001", 10 - 14 сентября 2001, Одесса, Украина. Одесса, 2001.Т. 1. С. 84 - 85.
82. Tanaka Т. Cone convexity of vector - valued function // The Science Reports of the Hirosaki University. 1990. 37. P. 170 - 177.
83. Tanaka T. Generalized quasiconvexities cone saddle points and minimax theorem for vector valued function // J. Optimiz. Theory and Appl. 1994. 81, No 2. P. 335 - 337.
84. Tanaka T. Two types of minimax theorem for vector valued function // J. Optimiz. Theory and Appl.1991. 68, No 2. P. 321 - 334.
85. Zhukovskiy V.I., Sachkov S.N. Multicriterial problems under uncer--tainty // Материалы международной конференции по проблемам управления " Автоматика 2001", 10 - 14 сентября 2001, Одесса, Украина. Одесса, 2001. Т. 1. С. 71.
86. Zhukovskiy V.I., Salukvadze М.Е. The Vector-Valued Maximin. New York, etc.: Academic Press, 1994.
-
Похожие работы
- Гарантированное по конусу решение многокритериальной задачи
- Многокритериальные задачи ранцевого типа
- Бескоалиционная игра трех лиц при неопределенности и с изменением цели у одного из участников
- Многокритериальная задача покрытия предфрактальных графов простыми цепями
- Гарантированные решения в игре с побочными платежами
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность