автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Многокритериальные задачи стохастического оптимального управления в дискретном времени

кандидата физико-математических наук
Гасанов, Игорь Искендерович
город
Москва
год
1990
специальность ВАК РФ
05.13.16
Автореферат по информатике, вычислительной технике и управлению на тему «Многокритериальные задачи стохастического оптимального управления в дискретном времени»

Автореферат диссертации по теме "Многокритериальные задачи стохастического оптимального управления в дискретном времени"

АКАДЕЮ НШ СССР Вычислительный центр

На правах рукописи

ГАСАНОВ Игорь Искендерович

УДК 519.857,519.87:627.8

МНОГОКРИТЕРИАЛЬНЫЕ ЗАДАЧИ СТОХАСТИЧЕСКОГО ОШШАЛЬНОГО УПШВЛЕНШ В ДИСКРЕТНОМ ВБЕМЕНИ

05.13.16 - Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)

Автореферат

диссертации на соискание ученой степени кандидата физико-математических наук

Москва - 1990

Работа выполнена в Вычислительном Центре АН СССР

Научный руководитель - кандидат физико-математических наук

доцент Ф.И.Ерешко

Официальные оппоненты - доктор физико-ыатеиатических наук

Ю.А.Яйвров

- кандидат физико-иатеиатических наук С.К.Завриев

Ведущая организация - Всесоюзный научно-исследовательский

институт системных исследований АН СССР

Защита состоится 19^>г.

в /3°-^ часов на заседании специализированного совета в ВЦ АН СССР по адресу: 117333, ул. Вавилова д.40, конференц-зал

С диссертацией можно ознакомиться в библиотеке МИ АН СССР. Автореферат разослан ф?ЙраЛ£. 199ог. Ученый секретарь

специализированного совета доктор физ.-матем. наук

© Вычислительный центр АН СССР, 1990

.' : : I

- - > ' ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Отдал

- с>еч:Дктуальность темы. При моделировании экономических и иных управляемых объектов зачастую не удается ограничиться каким-то единственным критерием эффективности. Этим поддерживается постоянный интерес к изучении задач оптимизации в многокритериальной постановке. Для задач этого класса исследуются свойства множеств эффективных (паретовских) и полуэффективных решений, разрабатываются процедуры поиска таких решений. Кроме того, создаются методы построения и визуализации множества достижимости многокритериальной задачи, т.е. совокупности всех значений векторного критерия, реализуемых на множестве допустимых управлений.

Данная диссертационная работа посвящена изучению задачи стохастического оптимального управления с дискретным временем в ее многокритериальной постановке.

Теория стохастического оптимального управления в дискретном времени (теория динамического программирования в дискретном времени со случайным возмущением процесса) получила интенсивное развитие в последние десятилетия. В диссертационной работе рассматривается наиболее изученный в теории случай конечного отрезка времени, однако, в отличие от классической постановки, формулируются и исследуются задачи не с одним критерием, а с конечным набором критериев.

Целью диссертационной работы является обобщение структурных и аналитических свойств множеств решений однокритериальной задачи стохастического оптимального управления с дис!фетным конечным отрезком времени на случай многих критериев, а также формулировка условий выпуклости множества достижимости указанной многокритериальной задачи в классе чистых стратегий.

Методика исследования базируется на аппарате теории стохастического оптимального управления в дискретном времени, а также использует элементы математического анализа, теории многозначных отображений, теории выпуклых множеств и аппарата многокритериальной оптимизации.

Научная новизна. Для борэлевсной и полунепрерывной моделей стохастического оптимального управления исследованы: структура множеств достижимости в различных классам управлений;

зависимость множеств достижимости от начального состояния процесса; условия существования равномерно эффективных стратеги! управления; взаимосвязь множества достижимости и его границь Парето. Сформулированы простые достаточные условия выпуклосti множества достижимости многокритериальной борелевскай модели i классе нерандомизированных (чистых) стратегий. На основе полученных теоретических, результатов изучена модель управлекж водохранилищем сезонного типа регулирования и предложен мето; построения правил управления таким водохранилищем.

Практическая ценность. Полученные теоретические результаты могут быть использованы при решении конкретных прикладные задач оптимального управления, для которых существенна много-критериальность, и характеризующихся наличием случайных факторов. Изложенный метод выбора правил управления ГЭС после дальнейшей проверки может быть предложен как основа для построена таких правил управления для объектов рассмотренного ' в работ! типа. Диссертация выполнена по плану научных работ ВЦ АН ССС] по теме "Разработка математических моделей в региональных хозяйственных системах" Н.Г.Р. 01.86.0, I30462i

Апробация работы. Основные результаты работы докладывались и обсуждались на: 12-й областной школе-семинаре "Матема тическое моделирование в проблемах рационального природополь зования" (г.Ростов-на-Дону, 1988 г.); 4-й Всесоюзной школе семинаре по системным исследованиям водных проблем (пос.Зимен ки Моск. обл., 1989 г.); научно-исследовательском семинаре се ктора "Математические модели рационального использования ресу рсов" ВЦ АН СССР (1988 г.); научно-исследовательском семинар отдела "Информационно-вычислительные системы" ВЦ АН СССР (1989 г.).

Публикации. Основное содержание диссертации отражено 4-х научных работах [1-4].

Структура и объем работы. Диссертация состоит из введе ния, двух глав, заключения, списка литературы из 21-го найме нования,6-ти рисунков. Общий объем работы - 118 стр., в тс числе 110 стр. основного текста.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность исследования и дается краткая, характеристика работы.

Глава_1_ посвящена теоретическому изучению многокритериальной задачи стохастического оптимального управления. Исследуется то, как результаты, известные для одного критерия, обобщаются на случай многих критериев, изучаются: структура множеств достижимости в разных классах управлений; зависимость множества достижимости от начального состояния процесса; взаимосвязь множества достижимости и его границы Парето и другие близкие вопросы.

В §1.1 вводится используемый в дальнейшем математический аппарат и определяются изучаемые в работе модели стохастического оптимального управления.

Рассмотрим управляемую марковскую цепь (у.м.ц.), задаваемую таким набором элементов:

t = т,т+1____,Г - последовательные моменты времени; Х^- пространства состояний, непустыа борелевские пространства; и пространства управлений, непустые борелевские пространства; 11ь(х)с иь- множества допустимых управлений при х е Хъ,

V г { Хь; Т^. = {(х,и) и&ь{х)~} - аналитические множества

в ^((¿г'|х,и), t = т+1,х+2 х € и е -

переходные функции ( стохастические ядра ), из пространства в пространство вероятностных мер на Хь, измеримые по

Борэлю на множестве |1х- вероятностная мера на прос-

транстве X .

Стратегией управления марковской цепью будем называть

набор % = )....., где

= (X ,и ,х ......х. ч .и, , ,х. ), х € X . и € и ,

t х х х+1 х+1 t-1 Н; з а. з з'

t = а = т,тг+1 тс^ - функции из пространства

Нъ = в пространство вероятностных мер на

17 такие, что мера ) при любой фиксированной предыстории

Ь. € Н^ сосредоточена на множестве и^(хъ). (Меру множе-

ства Б е иъ будем обозначать "^(О^).)

Обозначим класс стратегий у.м.ц.

* = (1|ч(\),1,ч+1(\+1).....таких, что функции чс%Щ%)

универсально измеримы на Яt для всех 4 = г,т+1

Известно, что для любой стратегии тс € существует единственная вероятностная мера в пространстве № = Нт*ит, такая, что для любой универсально измеримой ограниченной функции

1'их+1.....Хц*^™* =

= I ( I < Г (■■■( / ( Г .....-^г.V

.....ит_1,хт) (лгт |хт_ 1, ^ _,))...) •

•^-И (<ИЧ+1 > К^ IV ^ (<и?х ).

Модель 1а (борелевская). Для определенной здесь у.м.ц. введем текущую плату - набор ограниченных измеримых по Борелю

функций ГС1, г = т,т+1.... ,Т, 1 = 1,2, ...Г.

Модель 16 (полунепрерывная). Так обозначим модель 1а со следующими дополнительными свойствами: множества 0 компактны; множества Тх замкнуты; переходные функции ^ непрерывны на

Т^.,; .функции полунепрерывны сверху на Т^; t = т,т+1,...,Т;

С ~ 1 |2) ■ • • |Ха

Модель 1в (непрерывная). Так обозначим модель 16, в которой функции непрерывны на множествах Т^. , t = т,т+1,...,Т,

£ ® ] 1 ш » * } Л *

В качестве критериев в модели 1 будем рассматривать функции

~ \ 2 * X 2 % € 1=1,2.....х.

Через К (к) и къ(х,и) будем обозначать векторы (К1 (тс), Кг (%),... .К1 [%)) и (к!(х,и),к+ (х,и).....к*(х,и)) соответствен-

х х и ъ и

но. Через К*(х,%) обозначим величины , I = 1,2,...,!,

при условии, что мера цт сосредоточена в точке х. Определим вектор Кт(х,%) равным 4

Обозначим 7^ множество стратегий % = (тс^.т ^....я^) € таких, что = гс (я ) V t=^:t1+1 ,...,Т (марковские страте-

гии). Через V" обозначим множество стратегий % = (я^ .'п:т+1. ...,-пгт) е , для которых при всех t = х,т+1,...,2' существуют функции иь: II^ такие, что (д:)} \х) =1 V г €

(нерандомизированные марковские стратегии). В этом случае функции управления тс^ будем отоздествлять с функциями Через 75 обозначим множество стратегий тс = {% ,% ,...,%Т)€У° , для которых 1^(71,.) - ^ ) V t=%,г+^.. ,Т , причем являются однозначными функциями из пространства в прос-

транство иъ (нерандомизированные полумарковские стратегии).

Множество стратегий % = ... ,%т) из классов ,

V® таких, что функции я измеримы по Борелю при всех t = т,т+1,...,Т, обозначим 7во, 7ВМ, 7ВН соответственно.

' % ' х * т

Для произвольного класса стратегий Г с определим = {V |тс е П - множество стратегических мер в пространстве РР.

Через обозначим множество достижимости модели 1 при стратегиях управления из некоторого класса с^,

3 § 1.1 дается сводка известных в случае единственного критерия свойств рассматриваемых в работе моделей.

Важную роль в дальнейшем исследовании играют следующие, определенные в § 1.1, конструкции.

Через Гр обозначим совокупность ортонормированных систем векторов {р3.}"=1 с к". Для системы р = {р1>"=1 € п" и вектора

г € К11 через рг обозначим вектор (р1 г", р2г,..., рпг) е Я?1.

В пространстве рассмотрим отношение лексикографического порядка: для векторов г1 = (г].г^,..е К*1 и г2 = (г^... € К*1 будем писать г1-ч г2 , если для некоторого

индекса з < N г1з < г2 и rj = r^ v i<s; будем писать r1d г2,

если либо г1-« г2, либо г1» г2.

Назовем лексикографическим максимумом множества Gc®1^ будем обозначать lexmax G такую точку х € G, что у d х V у <е G.

Для G , ограниченного множества из lf , р е # определим

вектор a(G,p) = lexmax ру и множество A (G,р) = Arg lexmax ру.

yeG n у е g

В § 1.2 исследуется многокритериальная борелевская модель. Все основные результаты, полученные в данном параграфе, сведены в теореме 1.1.

Введем еще ряд обозначений.

Для произвольного множества й с к" через [Я] будем обозначать его замыкание, а через conv(H) его выпуклую оболочку.

Через будем обозначать cony([Q°)). Через G%(x) обозначим множество G , если мера |хг сосредоточена в точке х.

Для вероятностных мер Н-,» » заданных на борелевском пространстве X , определим их выпуклую комбинацию , меру Яр^+О 0 < X < 1, таким образом, что для любого борелев-

ского мноаества D е X (Хр,1 + (1 -Я)|л2) (U) = Äft1 (D) + (1-Ä.)p2(D).

Назовем Я , множество вероятностных мер на X , выпуклым, если (7^ + (1 - Л.)ц2) € Я V ц, ,ц2 € Я, \ € С0,1].

Теорема I.I. Пусть р е П* . Для модели 1а верни следующее утверждения.

Io = conv{L°), Q° = 0м = сото«3") = conv((F).

X X Т X л л

Бели модель 1а для каждого множества Tt, í = т,т+1,... ,Т, допускает измеримый по Борело выбор, то для такой модели

Ъ° = 1во= conv{T?°), Iм = LB\iN =

XX 1 % X % X

(3° = q» = of= coroíQf) = coro(qf), = Qf.

a(G.p) = X a(GT(r),p)M.x(dj:). (1)

Отображения G,Am- Х^ 2R , а: ^ Ш® такие, что

G(x) ^ Gx(x), Ám(x) = Am(GT(x),p), a(x) = a(Gz(x),p),

универсально измерили и ограничены.

Для любого числа е > 0 найдется стратегия % е V"® такая,

что min _ |i£ (х,%) -у| U i i е X .

yeAm(Gi;(x).p) х

Существует последовательность стратегий tufb^c такая,

П.б.ц"1

что К (х,Xй) -*■ А [G (х) ,р) на X .

х ___ т t ^ -t

п—«о

Равенство (1) обобщает аналогичное равенство для оптимума однокритериальной модели. В то же время такое же обобщение на вектора a{Gx(x),р) уравнения Беллмана в случае борелевской модели оказывается невозможным, в § 1.2 строится соответствующий пример. Данный пример показывает также, что не всегда существует равномерно s-оптимальная, в смысле реализации вектора a{G^(x) ,р), марковская стратегия.

Универсальной измеримости оптимума как функции начального состояния в многокритериальном случае можно сопоставить универсальную измеримость как многозначных функций начального состояния множества G^(x) и его подмножеств Am[G^(x),р).

Как известно, в однокритериальной борелевской модели оптимальные значения в стратегиях общего вида, рандомизированных и нерандомизированных марковских стратегиях совпадают. Аналогичное совпадение множеств достижимости в рандомизированных и . нерандомийированных марковских стратегиях многокритериальной борелевской модели, вообще говоря, не обязательно. Однако, как

следует из теоремы 1.1, Q^ = соnu(Q^).

В § 1.3 изучаются полунепрерывная и непрерывная многокритериальные модели. Все основные результаты данного параграфа сведены в теореме 1.2.

Введем ряд определений.

Обозначим через П^ совокупность систем р = <pi>"_] =

С(р|,р|,...,р^)П^-таких, что Q * pJ & .....К11

1 J = 1,2,..., N. Если при этом 0 -i р3 V J = 1,2,. .-..ff, то со-зокупность гакиу систем будем обозначать П^.-

Пусть К - метризуемое топологическое пространство, - ограниченная функция, Ф(г)- множество предельных точек функции / в точке х t X, т.е.

Ф(х) 4 Су € К11 I Э С®-)*.^ I : X-* х и /(х )-* у}.

~ п.—п—*а>

Назовем функцию / лексикографически полунепрерывной (¿-полунепрерывной) сверху, если 1ехдох Ф(г) =1 /(х) V хеХ.

Для множества Н из критериального пространства К1 через Г (Я) обозначим его границу Парето.

Теорема 1.2, а) Кроле утверждений, сформулированных в теореме 1.1 для модели 1а, Зля модели 10 справедливы следующие утверждения:

Ь° = 1во= сопу(Ъво), Xм = 1™ 1к = Ьш, д° = 0®°= 0м = о™«

х г г ' т: х х -с х

сопи(0®м) = сотиЧО®11), о" = о®1, Г(б ) с 0®м.

Т< V X X XI«

— ™т

Пусть система, р ^ г , тогда:

существует стратегия % € У®1* такая, что рК^х.и:) = а^СхЬр) V I £ ^ , 1 =

определенное в теореме 1.1 отображение а Ъ-полунепреривно сверху Си, следовательно, измеримо по Борелю);

» _ лт

Пусть в определенном в теореме 1.1 отображении Ат» р € Гг, тогда отображение Ат измерило по Борелю, при этом множества А (х) принадлежат Г(С (х)) V х € .

б) Для модели 1в верш все утверждения, справедливые для модели 16, причел для модели. 1в от системы р во всех случаях требуется лить, чтобы р € П*.

Кроме того, для модели 16 справедливы следующие утверждения: множество замкнуто;

определенное в теореме 1.1 отображение б непрерывно.

Как следует из теоремы 1.2, для полунепрерывной и непрерывной моделей на многокритериальный случай удается обобщить уразнения Беллмана. При этом оптимальному значению критерия

соответствует вектор а(С^.(х) ,р) (от системы р требуется, чтобы

р £ а вместо максимума рассматривается лексикографический

максимум.

Полунепрерывное™: сверку оптимума однокритериальной полунепрерывной модели как функции начального состояния, в многокритериальном случае соответствует Х-полунепрерывность вектор-

функции а(Сх(х) ,р) (при р € П*). Однако и в непрерывной модели

функции а(0г(:г),р) ^-полунепрерывны (при любых р е П*), но,

вообще говоря, не непрерывны, тогда как оптимум непрерывной модели непрерывным образом зависит от начального состояния. В то же время непрерывности максимального и минимального значений критерия непрерывной однокритериальной модели можно сопоставить в многокритериальном случае непрерывность в метрике Хаусдорфа множеств (х) как многозначных функций начального состояния х.

Реализуемость в марковских стратегиях максимума и минимума критерия однокритериальной непрерывной модели переходит в многокритериальном случае в замкнутость множества достижимости в марковских стратегиях, а реализуемости в марковских стратегиях максимума критерия однокритериальной полунепрерывной модели соответствует в случае многих критериев реализуемость границы Парето множества достижимости.

В случае одного критерия в полунепрерывной модели существует равномерно оптимальная измеримая по Борэлю нерандомизированная марковская стратегия. Соответственно в многокритериальном случае существует стратегия из того же класса, равномерно

— — ~г

реализующая вектор а(Ст(х) ,р) ( р е Гг для полунепрерывной модели и р € П* для непрерывной модели ).

В § 1.4 изучаются вопросы, связанные с выпуклостью множеств достижимости борелевской модели. Как следует из теоремы 1 . 1 , множества достижимости борелевской модели в стратегиях общего вида и рандомизированных марковских стратегиях выпуклы. В то же время легко видеть, что множество достижимости такой модели в нерандомизированных марковских стратегиях, вообще говоря, невыпукло. Выпуклость множества достижимости многокритериальной задачи управления значительно упрощает методы построения и исследования такого множества. С другой стороны, при разработке правил управления реальными экономическими объек-

тами предпочтительно ограничиться управлениями в чистых ( нерандомизированных ) стратегиях. Поэтому представляют интерес условия выпуклости множества достижимости Оорелевской модели в нерандомизированных марковских стратегиях. В теореме 1.3 формулируются простые и не очень обременительные достаточные условия выпуклости такого множества.

Теорена 1.3. Пусть в модели 1а леры |лЛ, |г,и) являются непрерывными (несвиошчеотшл) при всех (х,и) е ,

г=т+1,х+2,...,Г. Тогда в этой модели = = = сспи(О^).

Исследуя условия выпуклости множеств достижимости, естественно рассмотреть более общий вопрос о выпуклости множеств стратегических мер. Так утверждение теоремы 1.1 о выпуклости множеств достижимости Оорелевской модели в стратегиях общего вида и рандомизированных марковских стратегиях является'прямым следствием выпуклости множества стратегических мер для стратегий общего вида. В § 1 Л показано, что, за исключением некоторых вырожденных случаев, множество стратегических мер борелев-ской модели для рандомизированных марковских стратегий невыпукло; показано, что такое же множество для нерандомизированных марковских стратегий выпукло в том и только том случае, если оно одноточечно.

Во второй главе диссертации на базе теоретических результатов главы 1 проводится исследование модели управления одиночным водохранилищам сезонного типа регулирования. Изучается реальный экономический объект - Павловское водохранилище, расположенное на р.Уфа в Башкирской АССР.

Конкретность данного исследования не препятствует применению предлагаемого в работе метода Построения правил управления водохранилищем к другим одиночным водохранилищам аналогичного типа.

В § 2.1 дается характеристика исследуемого объекта и выписываются соотношения, задающие математическую модель функционирования водохранилища и расположенной на ней ГЭС.

Календарный год делится на 18 интервалов (месяцы в меженный и декады в паводковый периоды) с номерами от Т0 = -9 до

Т - 1 =8. Период, соответствующий первым десяти интервалам,

■будем называть навигационным, а последующим восьми - расчетным. Обозначим:

х± - запас вода в водохранилище к началу интервала времени г^. - приток (количество вода, поступившее в водохранилище, за

вычетом возможных отъемов и потерь на испарение, фильтрацию и шлюзование) за интервал времени t; иь - попуск (количество вода, сброшенной из водохранилища) за интервал времени I.

Динамика воды в водохранилище описывается балансовыми уравнениями: = хх + г±- и^ , г = Т0 ,Г+1,...,Т1-1.

Запасы воды в водохранилище ограничены неравенствами о"11" $ хх $ ? = Т0,Т0+1,...,37,-1 , где а*11" определяется

УМО (уровнем мертвого объема), а г™"- НПУ (нормальным подпорным уровнем).

и^ 0 = Та ,2'0+1,...,Т1-1.

Пусть - продолжительность интервала времени гв(•),

2я(•) - некоторые функции, описывающие уровни верхнего и нижнего бьефов водохранилища ( уровни воды в водохранилище и нэ-

X +х

посредственно за плотиной ); г® = гв( ь ) - средний уровень верхнего бьефа водохранилища за интервал времени t;

^ ) - средний уровень нижнего бьефа водохранилища

за интервал времени t; ^ - - напор; #ст- установленная мощность генератора ГЭС; т} - коэффициент, характеризующий производительность турбины.

Энергия, вырабатываемая ГЭС за интервал времени t, определяется по формуле: ^(х^г^.,^)= т!л51.#СТ) В дальнейшем более удобно использовать безразмерную величину £.,.(•) = 1 •), где е - характерная величина энергии,

принятая за единицу измерения.

В § 2.2 формулируется и исследуется задача управления рассматриваемым объектом. Управление водохранилищем осуществляется посредством выбора величин попусков и^. Целью управления в навигационный период является обеспечение нормальных

условий судоходства, для чего требуется поддержание объема воды в водохранилище на уровне не меньшем некоторой величины я®. Для указанного периода времени известны правила управления

и"^,^), t = ?'0> Г0+1,... ,0 ( и" (•) - однозначные кусочно-

линейные функции ), которые в настоящей работе рассматриваются заданными и не подлежащими оптимизации. Таким образом, соблюдение режима судоходства в модели зависит только от приточнос-ти в навигационный период и уровня наполнения водохранилища к началу этого периода.

Целью управления в расчетный период является максимизация суммарной выработки энергии ГЭС, соблюдение некоторого гарантированного режима выработки электроэнергии ( Е^(•) $ ) и

обеспечение к концу данного периода достаточного для судоходства объема вода в водохранилище.

Неопределенный фактор, сезонная боковая приточность, моделируется в работе в виде простого марковского процесса с функциями•распределения

Р^г) * Р(гь< г), t = т0 ; к

где г^ - случайная величина, соответствующая боковой приточ-

ности в период t, t = Т +1,Т+2.....Т1 -1.

Функции распределения Р выбирались непрерывными и таким образом, чтобы выполнялось естественное условие неотрицательности притоков: (г) = О V г < О, ■Рь(г|г\ь_1 ) = О V г < О,

г1._1> 0, % = Т0+1 ... ,Г,-1 - Выбор не зависящей от пред-

ыстории функции оправдан тем, что оценка корреляции между

притоками смежных лет практически равна нулю.

Функции Р и управления ин(•) таковы,, что в навигационный период практически всегда найдется интервал времени, в который объем воды-в водохранилище достигает НПУ (сезонный тип регулирования ).

Формулируется задача управления водохранилищем на бесконечном интервале времени. Рассматривается класс стратегий тс =

(■к. _ (•) ■) „ _-<-), ТЦ (•),...)

' • хо * о '1 о '

(тс t(•) - функции управления в период î года п), для которых

управления в навигационный период каждого года совпадают с

lîh(■), а управления расчетного периода являются универсально измеримыми рандомизированными функциями от всей предыстории.

(Ср. с классом V^ из гл.1). Рассматриваются два критерия, имеющих смысл средней годовой выработки энергии ГЭС и частоты лет 5ез нарушения судоходного и энергетического режимов:

S1 (%) â iun с 1 £Ek(.), B1wâiimE 1 2Д_(-).

ri—*«о k=1 п—k=1

Здесь Bk - суммарная выработка электроэнергии в год к, величина Вк равна 1, аели в год к не происходит нарушений энергети-îecKoro, либо судоходного режимов, 0 в обратном случае.

Обозначим через <} множество достижимости по этим критериям (ограничиваясь лишь такими стратегиями, для которых определены выписанные выше пределы).

Отраженные в модели свойства моделируемого объекта ( се-юнность регулирования ) позволяют свести исходную задачу к *вухкритериальной задаче стохастического оптимального управле-шя следующего вида. Рассматривается интервал управления рав-шй расчетному периоду одного года. К переменным модели добав-шются переменные At:

1 = 1, д = i 1 ' если 1 ' ,и^) * ^ •

1 * ь 1 0, в остальных случаях,

гри t = 2,3,... . Текущее состояние процесса определяется

тройкой (^t,rt,At) , t = 1,2,...,ÎP —t. Для t = 1 вычисляется

юкоторое начальное распределение в пространстве состояний. Гереходные функции определяются балансовыми уравнениями дина-шки запаса вода в водохранилище, формулами, задщими At и функциями F . Рассматриваются две текущие платы:

, 1, если t = Г,-1, At= 1, ть+ rt- ut2 2й,

1 О,

tv t' t' t' ^ t в остальных случаях,

> (X г и) f ^ t < V Ь

4 * 1 St(rt,rt,ut).+ при t = Г,-1,

где В®(г) - математическое ожидание энергии, вырабатываемой в

о

навигационный период ( 2 Е^(хь,г±,иъ) ) для траекторий, проходящих через точку х = х при правилах управления и11 (•) • ■"-о

Стратегии управления Екбираются из класса нерандомизированных марковских измеримых по Борелю стратегий (класс V®11 из гл.1).

Критерии сформулированной таким образом задачи стохастического оптимального управления имеют смысл обеспеченности (вероятности соблюдения) энергетического и судоходного режимов и математического ожидания суммарной годовой выработки электроэнергии.

Данная задача удовлетворяет условиям теоремы 1.3, поэтому (¿2 - множество достижимости этой задачи - является выпуклым. В работе доказывается, что множество <2г совпадает с Г01 ], замыканием множества достижимости исходной задачи.

Как очевидно, в случае двух критериев построение выпуклого множества достижимости не представляет трудности и осуществляется решением серии задач максимизации линейной свертки критериев при различных коэффициентах свертки. Каждая из таких задач, в данном случае, является обычной задачей динамического программирования с одним критерием (сверткой).

В § 2.3 даются описание и анализ вычислительных экспериментов с моделью Павловского водохранилища. Для проведения ■ расчетов на ЭВМ исходная модель заменялась ее дискретным аналогом. После этого решалась серия задач динамического программирования с дискретным временем и дискретными пространствами состояний и управлений. Частота сетки, использованной для дискретизации исходной задачи позволяет добиться высокой точности аппроксимации исходного множества достижимости.

Специалист, выбирающий режим эксплуатации ГЭС, имеет возможность выбрать любую, устраивающую его по значениям оптимизируемых критериев, точку на границе построенного множества достижимости и соответствующие этой точке правила управления объектом. Эти правила могут быть оформлены как набор помесячных ( подекадных в половодье ) таблиц, в которых по уровню вода в водохранилище и ожидаемому на ближайший промежуток време-

ни притоку определяется на этот промежуток времени попуск воды через створы ГЭС. Серьезной проблемой, однако, является адекватность используемой модели, поскольку для моделирования случайного фактора имеется лишь небольшой ряд наблюдений. Недостаточность данных не позволяет уверенно судить ни о точности выбора параметров марковского процесса,ни о корректности выбора самой модели случайного процесса. Поэтому для оценки качества получаемых правил управления был использован широко принятый в инженерной водохозяйственной практике подход [11], состоящий в проверке правил управления на уже известному ряду наблюдений. Данный подход не является методологически безупречным, поскольку один и гот же ряд наблюдений служит и для выработки и для проверки правил управления. В связи с этим в работе определенное место уделяется критическому анализу использования такого подхода как в традиционных инженерных расчетах, так и к описанному в диссертации методу построения правил управления. В этом методе предлагается видеть некоторый вспомогательный прием, позволяющий в достаточно широком классе стратегий управления отыскать набор рациональных стратегий, окончательный выбор из которых производится не по значениям критериев исследуемой задачи, а по их оценкам по календарному ряду наблюдений, и позволяющий в значительной мере сгладить влияние связанных с такими оценками отрицательных эффектов.

Следует отметить, что управления, получаемые предложенным в диссертации методом, зависят от того, нарушался ли в текущем году до момента принятия решения энергетический режим, что экономически вряд ли оправдано. И хотя для рассматриваемого в работе объекта влияние данного эффекта на представляющие практический интерес стратегии управления весьма незначительно, его все же необходимо учитывать. Это еще раз заставляет рассматривать получаемые таким методом стратегии управления как опорные, возможно, требующие определенной коррекции.

Параграф 2.3 завершается описанием результатов расчетов с использованием различных моделей неопределенного фактора и сравнением эффективности найденных правил управления с полученными инженерными методами диспетчерскими правилами.

Результаты расчетов представлены на графиках в приложении.

В заключении сформулированы основные результаты работы:

1. Для борелэвской модели: исследована взаимосвязь множеств достижимости в различных классах стратегий; доказана измеримость критериев лексикографического типа и множеств достижимости как функций начального состояния; обосновано представление критерия лексикографического типа как интеграла по множеству начальных состояний; построен пример модели, в которой не существует равномерно е-оптимальной марковской стратегии для критерия лексикографического типа я для которой некорректно обобщение на такой критерий уравнений Беллмана.

2. Для полунепрерывной модели: обоснованы уравнения Беллмана и существование равномерно оптимальной марковской стратегии для критерия лексикографического типа; доказано, что множество достижимости в рандомизированных марковских стратегиях содержит свою границу Парето.

3. Для непрерывной модели: доказана замкнутость множеств достижимости в рандомизированных марковских стратегиях и их непрерывная зависимость от начального состояния.

4. Выведены достаточные условия выпуклости множества достижимости борелевской модели в чистых марковских стратегиях.

5. Изучена модель функционирования водохранилища сезонного типа регулирования. Предложен метод построения правил управления таким водохранилищем, основанный на решении многокритериальной задачи стохастического оптимального управления.

Основные результаты диссертации опубликованы в следующих печатных работах:

1. Гасанов И.И., Чебанюк Ю.М. Многокритериальная стохастическая задача управления водохранилищем сезонного регулирования. - М.: ВЦ АН СССР, 1988.

2. Методы расчета в задачах управления режимами водохранилищ / Г.А.Агасандян, И.И.Гасанов, И.С.Меньшиков и др.//Кибернетика и вычислительная техника: Сб. статей / Под ред. В.А.Мельникова. - М.: Наука, 1987. - Вып.З.

3. Гасанов И.И. Многокритериальная задача стохастического оптимального управления в дискретном времени.-М.: ВЦ АН СССР, 1989.

4. Гасанов И.И., Чебанюк Ю.М. Задача управления водохранилищем энергетического назначения. // Математическое моделирование в проблемах рационального природопользования.: Тез. докл. 12-й областной школы-семинара, Ростов-на-Дрну, 1988.