автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы аппроксимации в стохастических задачах управления и оценка качества субоптимальных алгоритмов

доктора технических наук
Фетисов, Вячеслав Николаевич
город
Москва
год
1997
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Методы аппроксимации в стохастических задачах управления и оценка качества субоптимальных алгоритмов»

Автореферат диссертации по теме "Методы аппроксимации в стохастических задачах управления и оценка качества субоптимальных алгоритмов"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ПРОБЛЕМ УПРАВЛЕНИЯ

ч

\

На правах рукописи

Фетисов Вячеслав Николаевич

МЕТОДЫ АППРОКСИМАЦИИ В СТОХАСТИЧЕСКИХ ЗАДАЧАХ УПРАВЛЕНИЯ И ОЦЕНКА КАЧЕСТВА СУБОПТИМАЛЬНЫХ АЛГОРИТМОВ

Специальность 05.13.01 Управление в технических системах

Автореферат диссертации на соискание ученой степени доктора технических наук

Москва 1998

Работа выполнена в Центральном научно-исследовательском институте комплексной автоматизации

Научный консультант

доктор технических наук Ш.Е.Штейнберг Официальные оппоненты:

доктор технических наук, профессор В.П.Бородок, доктор физико-математических наук, профессор В.Б.Колмановский,

доктор технических наук, профессор В.А.Лотоцкий.

Ведущая организация: Институт системного анализа РАН

Защита состоится « 23 » МОЯ'&РЯ_ 1998 г.

в /^час. _ мин. на заседании Специализированного Совета Д 002.68.02 Института проблем управления по адресу: 117806, Москва, Профсоюзная, 65

С диссертацией можно ознакомиться в библиотеке Института проблем управления РАН.

Автореферат разослан «_» _ 1998 г.

Ученый секретарь Специализированного Совета Доктор технических В.К.Акинфиев

ОБЩАЯ ХАРАКТЕРИСТИКА. РАБОТЫ Актуальность темы

Проблема управления объектами, существенно подверженными стохастическими воздействиями, является одной из центральных в современной теории управления, поскольку в отличие от детерминированных систем задача построения оптимального алгоритма управления для стохастической значительно сложнее. Поэтому обычно на практике разрабатывают упрощенные - субоптимальные алгоритмы.

Начало интенсивных исследований проблемы создания как оптимальных так и субоптимальных алгоритмов управления стохастическими объектами, а так же исследований характерных свойств стохастических систем приходится на 60-е годы. Значительный вклад в ее развитие внесли российские ученые: Фельдбаум A.A., Цыпкин Я.З., Пугачев B.C., Красовский A.A., Райбман Н.С., Стратонович P.JI. , Казаков И.Е., Черноусько Ф.Л. а также зарубежные ученые Беллман Р., Острем К., Бар Шалом Я., Ли Р., Флеминг У., Калман П.Е., Аоки М., Джакобс О., Патчелл И..

Сложность самой проблемы стохастического управления и' индивидуальные особенности каждого конкретного объекта не позволили к настоящему времени выработать единую методологию выбора тех или иных упрощений и тем более общей методики построения субоптимального управления. Поэтому разработчикам алгоритмов часто приходится проводить громоздкие научно-исследовательские работы по созданию и обоснованию правомерности как упрощений математической модели так и самих алгоритмов.

Разработка алгоритмов управления для стохастического объекта требует привлечения высококвалифицированных научных кадров, длительного периода разработки и существенных финансовых затрат. Поэтому проблема снижения трудностей в

разработке, сокращение сроков, и тем самым снижение стоимости научных исследований, является крайне актуальной.

Цель» настоящей работах является разработка строго обоснованных методов аппроксимации, имеющих единую ' теоретическую базу и предназначенных для упрощений исходной модели объекта в задаче стохастического управления, а также создание эффективного математического аппарата для исследования правомерности выбора тех или иных упрощений исходной задачи.

Кроме того, целью работы является разработка тестов на правомерность использования классических методов аппроксимации - получение оценок допустимых потерь критерия качества управления.

Разрабатываемые методы аппроксимации должны приводить к задаче субоптимального управления, имеющей строго обоснованные либо аналитическое решение,.либо легко реализуемое численное решение.

Общая методика исследования, проводимого в диссертационной работе, основана на современных концепциях теории оптимального управления стохастическими процессами, современной теории стохастических процессов и последовательностей, математической статистике и математического программирования.

Научная новизна. В работе сформулированы и развиты основные положения новой теории аппроксимации задач стохастического управления. Результаты, полученные автором в совокупности определяют новое научное направление в теории управления стохастическими процессами: «Теорию аппроксимации в стохастических задачах управления».

Практическая ценность, работы состоит в экономическом эффекте, получаемом как от повышения качества управления так и снижения расходов на исследование и разработку системы за счет эффективности методов, предложенных

4

автором, и как следствие - сокращения сроков проектирования и внедрения алгоритмов управления.

Реализация работы. На основе предложенной теории был разработан ряд алгоритмов управления промышленными объектами, которые вошли в состав АСУ ТП на Криворожском металлургическом комбинате (Украина), Ново-Липецком металлургическом комбинате и Магнитогорском металлургический комбинате.

Апробация работы. Основные результаты, полученные в диссертационной работе, докладывались и обсуждались на ряде всесоюзных конференций и совещаний:

- на 6-м Всесоюзном Совещании по теории инвариантности, теории чувствительности и их применениям, Москва,1982,

- на 9-м Всесоюзном Совещании по проблемам управления, Ереван, 1983,

- на Всесоюзной конференции "Теория адаптивных систем и ее применения", Ленинград, 1984.

Публикации. По теме диссертации автором опубликовано 20 научных работ, 7 из которых - в соавторстве.

Структура и объем диссертации. Диссертационная работа состоит из 10 глав, изложенных на 169 страницах машинописного текста, 4-х рисунков и списка, использованной литературы, содержащей 117 наименований.

СОДЕРЖАНИЕ РАБОТЫ Во введении раскрывается актуальность работы и ее цель, характеризуется научная новизна и практическая значимость, обосновывается структура работы. Здесь же проводится общая классификация подходов к задаче упрощения исходной.

Имеются две основные концепции упрощений задачи управления стохастическим объектом: сужение класса управляющих воздействий и упрощение математической модели.

Подход к упрощению путем сужения класса управляющих воздействий (например, ПИ и ПИД регуляторы), как правило, частично сохраняет свойства характерные для стохастических систем. В частности, сужение класса часто приводит к робастной системе управления, но не позволяет простым путеь оценить потери критерия качества по отношению к оптимальному алгоритму. Такой подход к упрощению в стохастичёском случае обычно требует привлечения численных методов для реализации алгоритма управления.

• Подход к управлению путем упрощения математической модели (например, замена стохастической модели детерминированной) часто приводит к аналитическому решению для упрощенной задачи, но при этом полностью могут быть потеряны свойства стохастического оптимального управления вплоть до потери устойчивости реализованной системы управления. Поэтому очень важно выработать правила построения алгоритма управления, которые бы позволяли восстанавливать потерянные свойства исходной задачи, кроме того, необходимо разработать математический аппарат, с помощью которого можно было бы оценить потери критерия качества управления от подобных упрощений.

Ниже приводится рисунок, иллюстрирующий два основных подхода к упрощению:

Рис.1 Основные концепции упрощения задачи управления

6 -

В диссертации изучаются и предлагаются способы решения задачи аппроксимации как для аналитической модели, так и для модели, построенной статистическими методами.

Указывается на ряд принципиальных трудностей решения проблемы разработки стохастического управления: учет стохастических факторов приводит к громоздким научным исследованиям по созданию и обоснованию правомерности как упрощений математической модели, так и самих алгоритмов. Обычно для разработки алгоритма управления стохастическим объектом привлекается целый арсенал научных методов (см. рис.2, где центральные квадраты изображают этапы разработки, а квадраты с жирным контуром - научные дисциплины).

Теория Выбор модели

Аппроксима- объекта

ции

[*

Теория чувствительности

Статистическое моделирование

А

Критериальны е неравенства

Выбор

алгоритма

управления

Декомпозиция

(разделение)

Алгоритм фильтрации

Теория

адаптивных

систем

Теория фильтрации и оценивания

Теория

робастных

систем

Методы синтеза и прогноза

Рис.2. Арсенал научных методов для разработки

алгоритма управления стохастическим объектом.

В 1-й главе дается обзор основных положений теории

стохастических систем управления, и раскрываются

7

принципиальные отличия стохастических задач управления от детерминированных. Формулируются важнейшие принципы стохастических систем: «принцип осторожности», «принцип разделения» и «принцип дуальности».

Формулируется класс задач (общая задача управления по неполным данным) для которого в следующих главах строго формулироруются и решаются новые задач аппроксимации.

Указывается на важное свойство детерминированнных и "марковских задач управления - зависимость оптимального управляющего воздействия лишь от координат в предыдущий момент времени, что указывает на целесообразность применения этих задач как аппроксимирующих.

Во 2-й главе формулируются требования к субоптимальным алгоритмам.

Хорошее качество алгоритма управления - близость к оптимальному в смысле критерия качества, не является единственным требованием, которое предъявляется к субоптимальному управлению стохастическим объектом. Вторым важным- требованием является грубость (робастность) алгоритма по отношению к неточностям математических моделей объекта и стохастическим воздействиям. Кроме указанных основных свойств алгоритм должен быть наделен быстродействием, достаточным для работы в темпе с управляемым процессом. Он должен быть удобен в эксплуатации, в частности, занимать не слишком большую память ЭВМ, иметь приемлемое время на разработку и наладку. В случае существенного изменения производственной технологии управляемого процесса он должен быть легко приспосабливаемым к изменениям математической модели.

Поэтому часто приходится упрощать алгоритм иногда даже в ущерб качеству управления. На практике, тем не менее, нередко значительные упрощения приводят к незначительным потерям качества. Конечно, успех работы существенно зависит

8

от подготовленности разработчика, от которого требуются как хорошие знания арсенала средств разработки, так и умение находить оригинальные эмпирические решения для конкретного управляемого объекта.

Приводится пример использования- аппроксимации нелинейного стохастического объекта двумя классическими линейными моделями:

Пусть х. обозначает выходную координату объекта, и„ -управление, ю, - последовательность независимых случайных величин, п - дискретное время. Тогда выражения

определяют линейные модели авторегрессии и скользящего среднего соответственно. Здесь а, Ь, Ьп а, у - неизвестные параметры, которые обычно определяются методами математической статистики по выборке случайных значений х„,и„, полученных на объекте.

Предпочтение при выборе модели чаще отдается выражению (2.1). Поскольку число неизвестных параметров здесь меньше и оно более "физично" (именно такого типа модели разрабатывают физики и экономисты).

Одним из недостатков модели скользящего среднего (2.2) можно считать существенное превышение величины ^ по сравнению с величиной р в модели регрессии при условии равноценного качества' прогноза, построенного с использованием рассматриваемых моделей. * .

Величина д определяет "глубину" динамической предыстории процесса (более точно - полноту учета управляющих воздействий от прошлых моментов времени).

(2.1)

м

»

(2.2)

Теперь предложим упрощение метода скользящего среднего, основанное на эффекте "сглаживания по времени" управляющих воздействий от прошлых временных моментов.

Разобьем прошедшее время до момента г на участки (»' = 1,..,,/?), сделаем на этих участках неизвестные коэффициенты Ь, постоянными (Ь, едк), и просуммируем

(проинтегрируем) на этих участках управление. Тогда модель для упрощенного метода определяется выражениями:

=1(2.3)

¡-I

. . (2.4)

7-1 »-У-

где - число моментов времени содержащихся на участке

разбиения под номером к, Ь, - неизвестные коэффициенты,

постоянные на участках разбиения.

р

Обозначим у, = .

*->+!

Теперь (2.4) можно переписать в рекуррентном виде А» = 5(,»-1 + ~ 4,-г,., •

Заметим, что выбор величин дк является самостоятельной экстремальной задачей. В простейшем случае дк могут быть равными. Второй способ выбора - линеаризация исходного

уравнения и поиск из условия минимума ошибки от

разбиения временного интервала.

Далее указывается некоторый класс задач, для которого метод модифицированного скользящего среднего оказывается более эффективным нежели метод авторегрессии как в смысле точности моделирования {прогноза выходной координаты) так и в смысле пр; стоты вычислительной процедуры определения неизвестных параметров.

Дается обзор ряда известных подходов к созданию субоптимальных алгоритмов управления. Показано использование важнейших принципов стохастических систем (прежде всего принципов "разделения" и "осторожности" ) при выборе структуры субоптимального управления. На примерах простейших задач показан эффект уменьшения трудностей при практической реализации, который получается от использования методов аппроксимации.

В 3-й глава формулируется задача аппроксимации в строгой математической постановке и предлагаются неравенства необходимые для получения оценок качества аппроксимации.

Задача оптимального управления стохастическим объектом определена как задача минимизации функционала /(и), где и управление, принадлежащее некоторому множеству I/ из линейного метрического пространства. Управление, доставляющее 1{и) минимальное значение,

обозначим и':

Пусть на том же множестве определен вспомогательный функционал 0(и) и пусть и" - его точка минимума. Определение 3.1. Будем говорить, что управление и" аппроксимирует и , если величина

М = 1{и")-/(«) (3.1)

допустимо мала. Величину Ы будем называть точностью аппроксимации .•

Лемма 3.1. Пусть для всех иеС/ имеет место неравенство /(м)£<2(и) . (3.2)

Тогда справедливо неравенство

Неравенство (3.2) для задач аппроксимации в стохастическом случае часто выполняется. В общем случае справедливо следующее неравенство

А/^2яч)|/(«)-е(«)| . (3.4)

м11

Неравенства (3.3) и (3.4) не содержат в правых частях управления и* и поэтому их удобно использовать для оценки качества аппроксимации. В 3-й главе дается ряд примеров оценки качества субоптимального управления (в том числе дается пример аппроксимации детерминированной задачей и пример аппроксимации линейным уравнением).

В дальнейшем символами М и О будем обозначать соответственно математическое ожидание и дисперсию случайной величины.

Пусть объект описывается уравнением *„ =9>(х„.,Ли,), х0 = с, где х,- выходная координата объекта, и,- управление, которое является функцией от наблюдаемых х,, в - случайный параметр с дисперсией а\, и пусть критерий качества, . управления определен формулой

т=1о(и,в)т0), (3.5)

Где

е(«.в>=1йп1м|>„'

и /г. - функция распределения случайной величины в. (>(и,&) - выпукла по ' в при любом и и при любом и дважды дифференцируема по в.

Пусть и' - точка минимума функционала О{и,ЪЛ0).

Тогда получим критериальное неравенство

Д/£2рв-^- , (3.6)

1-сг

где а = тах|<г>|| <1, /3=тах|^| и р = 28ир|х, |.

В 3-й главе показана связь рассматриваемых в диссертации задач с задачами робастных систем управления.

Проблема робастности для оптимальных стохастических систем в случае корректно выбранного критерия оптимизации в-общем случае неактуальна, поскольку сам процесс оптимизации автоматически учитывает неопределенность случайных параметров, и обеспечивает «осторожность» управляющих воздействий, что гарантирует устойчивость замкнутой системы в случае конечности критерия качества. Таким образом, для стохастических систем управления критерием робастности является критерий качества. В линейном случае выполнение принципа "осторожности" означает смещение полюсов замкнутой системы к центру единичного круга. Таким образом, в стохастическом случае свойство "осторожности" замкнутой системы по смыслу близко к понятию робастности для детерминированных систем.

В случае аппроксимации детерминированной задачей без сохранения свойства осторожности, система управления может потерять даже устойчивость.

В случае, когда а< 1, проблема робастности синтезированной системы с управлением и" не возникает вообще (в силу (3.6)). Заметим, что условие а< 1, вообще говоря, является достаточным, но вовсе не необходимым для робастной устойчивости. Поэтому в случае линейной замкнутой системы, которая получена в результате аппроксимации, можно иногда не учитывать стохастическую природу вектора в и воспользоваться частотными методами проверки на робастность. В нелинейном случае можно предложить несколько способов: способ который требует небольших вычислительных усилий - это тестирование задачи методом статистических испытаний на устойчивость в

13

окрестности М0. В качестве более надежного метода проверки, но требующего больших вычислительных затрат, можно воспользоваться статистической оценкой величины

/(«") •

Далее даны практические примеры использования предложенных оценок качества управления.

В 4-й главе формулируются положения предложенной автором новой теории чувствительности для стохастических задач управления (кратко - стохастической теории чувствительности), которая эффективно применяется для анализа правомерности введения тех или иных упрощений в стохастическую модель.

Вопрос применения теории чувствительности для анализа и синтеза стохастических задач управления является гораздо более актуальным, чем использование методов чувствительности в исследовании детерминированных систем, поскольку трудоемкость прямого исследования стохастических систем гораздо выше.

В дальнейшем будет подразумеваться, что под критерием качества управления понимаются средние потери. Отсюда естественным образом следует, что под характеристиками чувствительности следует понимать некоторые средние показатели отклонений в поведении объекта. Было бы естественным ввести термин «чувствительность в среднем», и поэтому в дальнейшем встречающийся в тексте термин «чувствительность» следует понимать как «чувствительность в среднем», хотя для практической работы будут предложены некоторые оценки сверху характеристик чувствительности.

Пусть объект представлен уравнением

+ х0=с, (4.1)

где е„- последовательность независимых случайных величин с одинаковыми функциями распределения таких, что

Мг, =0,0«; =1 . И пусть критерий качества управления характеризует средние потери, которые определены формулой

= , (4.2)

л-1

где - функции, ограниченные по абсолютной

величине константой р, плотность распределения вероятностей р„(дг|*;<7) - дифференцируема по вектору в под знаком интеграла. Тогда имеем покоординатное неравенство

. ¿&<«о|*/>|]/|У,(х)|А. (4.3)

где обозначает градиент р"(х;0) по вектору в (таким

образом, вектор Уя(х) определяет функцию чувствительности).

Теорема 4.1 (Основная теорема стохастической теории чувствительности) Пусть р„(дг)г;0) - непрерывно дифференцируема по 9 и равномерно непрерывна по 1. Тогда справедливо покоординатное неравенство

\\Уя{х№&у., (л = 1,...), где у» удовлетворяют уравнению

Г.-^М + АЛчЛ- О, (4.4)

= , (4.5)

• (4.6)

(Здесь без нарушения общности опущено обозначение =".<*»-1) •)

Параметры 4,(0) и 1,(0) имс от следующую физическую

интерпретацию:

Вектор Л(^) определяет чувствительность состояния объекта в момент времени п к вариации вектора в. Матрица Ьп(0) с элементами

=У2 ш /*>„(*,

определяет чувствительность вариации состояния объекта в момент времени и-1 на состояние объекта в момент времени и и характеризует "динамику" объекта.

В случае, когда переходная плотность не зависит от г (случай статического объекта), то* нетрудно проверить, что ¿„(&)а0. Заметим также, что всегда 1„(0)£1.

Таким образом, чтобы получить оценку градиента критерия качества.управления, нужно решить уравнение(4.6), что не представляет труда, если характеристики ^(0) и Ья(в) известны.

Далее для наиболее часто встречающихся на практике законов распределения вероятностей приводятся формулы для расчета характеристики 4.(0) и Ья{в) .

Значения характеристик и Ь„{в) для марковской

модели (4.1)и различных законов распределения случайных величин ц=ав приведены в таблице 4.1, где обозначено: <р'к{в) = тах|с?/£Врв(г,0)|, Д„ « вир \<рл{2\,в)-ря(г2М,

' ¡ьих

<р1(9), <р\{6) - значения функций <рщ(г1,в), <р,(г2,в)

соответственно и зависимость а от времени не показана в целях избежать громоздкость в обозначениях.

Таблица 4.1

плотность Ш

1 в-«,/(2»«) л/2На (яПУ^чзЦв)!^ • \п д/^У'1 у^сЬс, 4< 0 1 4.=®

0, х*[±43а] 3-шр'(в)/(г Д„ / (2%/Зст), Д„<2л/3сг 1, Д„ £ 2л/3<т

-е-'", х*0 а 0, * < 0 9'{в)/ст 1-е-4'", Д„ <°о .1. А.'»«

Далее, в случае дополнительных условий, наложенных на функцию <р, рабочие формулы для расчета и

существенно упрощаются. В частности, для гауссовского закона и дифференцируемой по обоим аргументам функции д> имеют место равенства

д

= (2/тг) тах

Ж

1. 8ир|<р;(г,б)|г1

1<У„, (4.7)

Ц9)>

(4.8)

вир \<р',{г,в)\, вир 1|< 1

Приводятся примеры использования новой теории чувствительности для получения критериальных оценок потери качества управления от упрощений модели объекта.

В задаче аппроксимации функции д> степенным полиномом показана связь полученного автором критериального неравенства с р" - критерием Р.Фишера.

Даются практические рекомендации по использованию стохастической теории чувствительности.

В 5-й глазо предложена новая концепция аппроксимации стохастической задачи управления марковской. Марковская модель является наиболее простой аппроксимирующей моделью, которая не теряет динамические свойства исходной задачи управления. Более того, практически любая случайная последовательность, или непрерывный во времени процесс, могут быть аппроксимированы марковскими процессами с любой наперед заданной точностью.

Пусть объект описывается стохастическим разностным уравнением

=?(*.-!»и„)+7.» л = 1.2,-,ЛГ, (5.1)

где х0 - фиксированное число, ц, - последовательность случайных величин, и„ - управления, которые являются

функциями от *„,,.,,и выбираются так, чтобы критерий качества управления

(5.2)

принимал наименьшее значение.

В диссертации предложено последовательность г}п представлять в виде.суммы

Ч.^е.+в, , (5-3)

где е, - взаимно независимые случайные величины, а случайные величины 9Я имеют малые дисперсии. Такое разложение не единственно. Будем искать разложение (5.3), дополнительно потребовав независимость вектора

от вектора и потребуем равенство

дисперсий случайных величин е,.

Пусть <7={'й.....*7д/} ~ невырожденный гауссовский

случайный вектор. Очевидно, что для разложения (5.2.3) справедливо представление

Р(7) = 0(^) + аЕ, (5.4)

где Л(ф,Щв) - ковариационные матрицы векторов ц и соответственно, Е - единичная матрица, а положительное число такое, что О(е) = а£ . Наилучшим разложением будем считать такое, для которого 0(0) имеет минимальную сумму диагональных элементов.

Пусть а - минимальное собственное число матрицы НС;) • Тогда наилучшим разложением будет такое, для которого выполняется равенство

Щф = 1>(0)+аЕ . (5.5)

Пусть ц, - стационарная невырожденная гауссовская последовательность.

Пусть имеет место разложение (5.3), где £п и 6>„ взаимно независимые последовательности, величины е„

18

независимы взаимно. Тогда, по аналогии с векторным случаем, имеет место представление

И,'-1^ + 04 , (5.6)

где К?.К? - автокорреляционные функции

последовательностей ц, и ^ соответственно, 8„ = 0 если л * 0 и <50 = 1.

Условием наилучшего разложения служит равенство а^ф/2, где ф - минимальное число в спектре последовательности ц,.

Автокорреляционная функция последовательности 9п определяется равенством

+ (5.7)

Поскольку а = ф/2 является минимальным собственным числом для , то определение наилучшего разложения сводится к определению наименьшего собственного числа И?.

В диссертации предложен также простой приближенный способ построения разложения стационарного процесса непосредственно по выборке статистических данных.

После того как разложение найдено, естественно для практических целей при построении оптимального управления пренебречь случайными величинами в„ и искать оптимальное управление для модели, которая описывается стохастическим разностным уравнением вида

. (5.8)

Пусть в задаче стохастического управления вместо уравнения (5.1) рассматривается уравнение (5.8), функции г в критерии управления (5.2) выпуклы и ограничены по абсолютной величине константой р а последовательность 9„ в разложении (5.3) не обязательно стационарная.

Справедливо общее неравенство

г (5.9)

а-1 г.|

где А и £ определяются с помощью стохастической . теории чувствительности, рассмотренной в 4-й главе.

Далее в 4-й главе рассмотрено несколько частных

задач, для которых оценка потерь качества управления (5.9)

»

существенно упрощается.

Пусть О(0Я) = (п = 1,2,...) и I < 1. Тогда получим 1-1"

Л/^рШст,-^-. (5.10)

Рассмотрим критерий качества управления вида Я^НтМ^х,)///

при условии, что уравнение (5.1) определяет стационарную последовательность. Для данной задачи, используя (5.9), получим

М^рЛсгв/(1-Ц. (5.11)

В случае, когда уравнение (5.1) имеет вид

Хп ~ ?К*«-| »Ц|) + >

где щ^<р'г(г,и"(гУ^ = а<\ и независимые случайные величины в

X

распределены по гауссовскому закону, то приходим к неравенству

Д/(5.12)

0-е) о-

Результаты 5-й главы иллюстрируются примерами из практики.

В б-Й глава решается задача аппроксимации стационарной последовательности, действующей на объект в качестве помехи, последовательностью авторегрессии.

Оставляя те же обозначения, что и в главе 5, будем аппроксимировать объект определяемый уравнением (5.1) уравнениями

*„-*(*.-!.'«.) + (6.1) +<«.. (6.2)

1-1

г0=С0 >2-1 =С1>" >г-р+|г=Ср-|, где г; - независимые гауссовские случайный величины, Мг;аО, 0<?„ а1.

Теперь система уравнений (6.1), (6.2) определяет марковский процесс порядка р, и оптимальное управление для такой задачи будет зависить от координат объекта'в п-\,п-2,...,п-р моменты времени.

Аппроксимирующий процесс авторегрессии будем строить из условия минимума по а и а величины

Л0А(а.о-,Р) - - Я!(а,<г,р), (6.3)

где р - фиксировано, Д,' и - автокорреляционные функции последовательности и последовательности,

определяемой уравнением (6.2) соответственно, при условии, что неотрицательно определённая.

Условие неотрицательной определённости означает выполнение неравенства

а, 20 (б-4>

(.1

для всех л и последовательностей ук. Поэтому минимизация (6.3) при условии (6.4) не может привести, например, к отрицательности величины Я$(а,сг,р) и имеет

смысл говорить о некотором случайном процессе Л,, для которого Л? (а,а,р) -является автокорреляционной функцией, а величина Я£(а,(Т,р) - дисперсией.

Обозначим а*, а* - точку минимума (б.З) при выполнении условия (6.4). Смысл минимизации (6.3) заключается в том, что справедливо разложение

которое необходимо для решения поставленной задачи аппроксимации. Здесь в, подчиняется уравнению

1-1

где ея - независимая гауссовская последовательность, у которой Мг; в 0, Т>ея в 1. Последовательность Д„ (которую будем называть существенно зависимой частью разложения последовательности ц,) - гауссовская и имеет автокорреляционную функцию 11£(а*,сг*,р). Используя результаты 4-й главы, получим оценку потерь критерия качества управления от аппроксимации в виде неравенства

(6.5)

О" №1 '"А

где (т(А,р)=[я^(а*,а*,р)]П.

Пусть в задаче стабилизации критерий управления определен формулой

и пусть выполняется неравенство зир^'Сг.и**^))!*9 а <1. Тогда для гауссовских шумов получим неравенство

Л/5(2. (6.6)

(1-а) <т

Далее в б-й главе предлагается простой способ разложения случайной последовательности 7, по выборке статистических данных, полученной на объекте управления.

В 7-й главе рассмотрена задача аппроксимации оптимального прогноза, который используется в практике создания суСоптимальных алгоритмов управления стохастическими объектами для метода квазиразомкнутого управления (управление с прогнозатором). (Под оптимальным прогнозом обычно подразумевается математическое ожидание выходной координаты объекта управления).

Для аппроксимации прогноза часто используются классические методы (например, метод семиинвариантов), а для вычисления ошибки применяется статистическое моделирование. В практике использования управления с прогнозатором, когда все вычисления производятся на стадии реализации, применение классических методов затруднено из-за громоздкости вычислительных алгоритмов.

В данной главе рассматривается простейший способ аппроксимации прогноза, который аналогичен замене математической модели ее детерминированным аналогом в задаче управления.

В качестве основного критерия точности прогноза обычно рассматривают смещение, т.е. отклонение значения прогноза от оптимального значения.

Далее, без потери общности результатов, управление в обозначениях не указывается.

Пусть модель объекта имеет вид

*„ =«».(*»-|) + 7,>*о =Сг (7.1)

где % (и = 1,2.....Щ - случайная последовательность с

известной совместной функцией распределения.

Для получения оптимального прогноза необходимо решить уравнение

М*я=М(ря(х,.1) + М7Ь ,

которое, как правило, из-за незнания функций распределения случайных величин х„, требует для решения громоздких численных методов. Простое решение получается лишь в случае, когда уравнение(7.1) линейно.

Пусть модель объекта -представлена разностным стохастическим уравнением (7.1) , где ц, - стационарная случайная последовательность с нулевым математическим ожиданием, - дважды дифференцируемая функция. И пусть

=| Мх. — у, | - обозначает ошибку (смещение) субоптимального прогноза уп, который реализуется с помощью решения уравнения

У„=<Рп(У»-д> Уо=с-Автором диссертации предложено неравенство

£ sup 19>'т (2) | (1 - а") /(1 - а), (7.2)

¿> ж м

где аг - дисперсия х„ и a = sup|^(a)|<l.

я,м

Далее неравенство (7.2) обобщается на непрерывное время. Рассмотривается объект, который описывается уравнением вида

dz

— = <!>(z) + f(0, 2(0) = С ,

где s(t) стационарный процесс с непрерывными траекториями, <p(z) дважды дифференцируемая функция и такая, что

справедливо неравенство sup—g>(z)<0 . В качестве прогноза

се

используется решение уравнения % = *(0)=с .

Тогда смещение прогноза £(/) удовлетворяет неравенству

где

а--

д

гир—<¡>(2)

Р = 5«р

ст3 = Ог

Приводится практический пример использования полученных результатов.

В 8-й глава рассматриваются вопросы использования метода Монте-Карло в задаче стохастического управления.

Суть метода состоит в использовании для получения аппроксимирующего'управления вспомогательного функционала вида

л Л.|

вместо исходного функционала /(и) = М/(«Д),

где в„ (и = 1,2,...,Л) - выборка независимых случайных (или псевдослучайных) величин, имеющих функцию распределения, совпадающую с функцией распределения случайной величины в.

Одной из проблем использования метода Монте-Карло в задачах оптимального управления является оценка длины выборки, необходимой для достижения заданной точности, поскольку формулы для' расчета длины выборки, применяемые . для вычисления интегралов, становятся непригодными.

Обозначим ик=ия(6{,...,#„)- одну из точек минимума функционала (?я(и) и рассмотрим функцию = .....вя))~1(и),

где и обозначает точку минимума функции /(и) .

Введем условия: а ) 5ирВДи, 9а) 5 1 > в>зир/(и,в0)<,.1, б) выполнены а) и в).

25

Пусть Л обозначает наименьшее из Л для которых справедливо неравенство

Р{д/„(0)>*} йд. (8.1)

В неравенстве (8.1) число £ обозначает допустимые потери

• • с

от применения управления и„ вместо и и о обозначает заданную вероятность потерь (надежность), превышающих уровень е .

Теорема 8.1. Пусть множество Е состоит из конечного

числа элементов и ■1{и) имеет единственный минимум. Тогда « •

ик сходится с вероятностью единица кии справедливо неравенство

' 4Ш ег8

45(Я(Е)1П2-1П(5/2))

£Лпк(х£/А&) 45(Я(Е)1п2-1П(5/2))

при условии а) при условии б) при условии в)

(8.2)

где Н(Е) - энтропия множества Е , N - число элементов множества Е.

Теорема 8.2. Пусть Е - произвольное компактное метрическое пространство, функционал /(и) и все функционалы 0,(и) имеют единственный минимум, /(и,9) непрерывен на топологическом пространстве Ех£„ и достаточно продолжаем по условию Липшица на £ с

константой Ь, не зависящей от в. Тогда ил сходится с

»

вероятностью единица кии справедливо неравенство

16х2"'/к(Е)Л в*6

8*(Я„и(5)1п2-1п(<?/2)

£ЛглЛ(.У£78Л) 85(Я,;п(Н)1п2-1П(<У/2))

при условии а) при условии О) при условии в

(8.3)

еАгз й(£/8$)

где - абсолютная £ - энтропия пространства Н.

Приводятся примеры практического расчета длины выборки.

В 9-й главе теория стохастической чувствительности и задача марковской аппроксимации обобщаются на непрерывное время. Для стохастического уравнения вида

с1г](1)=<р(т}(0,е)Ж+сгс1со(1), (9.1)

где ¿а>(Г) винеровский процесс, в - числовой параметр, классическое уравнение чувствительности получим путем дифференцирования уравнения Колмогорова по параметру в :

а

~2 дЦ

2 (9.2)

где обозначает плотность ¿¡,., и V, обозначает частную

производную р,(£,0) по в.

Уравнение (9.2) мало пригодно в качестве практического инструмента для исследования задач стохастического управления.

Для получения неравенства, оценивающего потери от проведенной выше замены, вводятся специальные числовые характеристики семейства переходных вероятностей вида

Р.лхМ'.аО е А)=Р(з,х;1,А,в), которые определяются стохастическим уравнением (9.1).

Обозначим - измеримое пространство, Р, и Р2

вероятностные меры на нем. Пусть V - конечное (или счетное) семейство множеств А, (/ = 1,2,...) таких, что

= £1.ДГЦ = 0 (i*j).

Обозначим

J| P, (do>)-P2 (de>) |=suPpP, (Л)-Р2(Л()|

T*(h,t,e,d4)fi= \P{t-h,x-t,dS,0)^dx). Определение 9.1.

Будем говорить, что переходные вероятности P(t-h,x-,t,d$,0) удовлетворяют условию Липшица с константами

Л"(6»)=HJHAlk-', £'(0)= IijH(£;-\)h-', (9.3)'

если выполняются неравенства

l-A

J| Ti,в,dt)^-r*(h,t,9,I

для всех

Физическая интерпретация величин и L"h(0)

соответствует интерпретации величин Я(в),Ь(9) введенных в 4-й главе для дискретного времени. Заметим, что всегда справедливо неравенство ¿'(0)^0. Обозначим v, = lim f| PJ («/>;,)-P: (dtj2)\/A9,

где Д0=|02—1.

Справедливо неравенство |v, где у, является

решением стохастического'уравнения чувствительности ■

ь=0 . (9.4)

dt

Далее в 9-й главе показано, как определять параметры Л '(9) и Ly{9) на практике. В частности, для дифференцируемой по обоим аргументам функции <р так, что

равномерно по 9 выполняется неравенство $ир^<0, из

п

результатов 4-й главы следует

Л\(9)= ^гИгИвир\<р'в\!а ,

ч

¿¡;(0)=1-Л5ирр; . ч

Переходя к пределу в (9.3), получим

Я'(9)=л[2/пщ><р'в/сг, (9.5)

ч

Ь'(9)=тр<р\ . (9.6)

ч

В 9-й главе уравнение чувствительности обобщается на произвольные марковские процессы. В частности, рассмотрены процессы с конечным числом состояний, которые используются в задачах массового обслуживания.

Решаются задачи аппроксимации марковской моделью. Результаты главы иллюстрируются примерами из практики.

В 10-й глава показано использование результатов диссертации на примере разработки алгоритма управления процессом выплавки стали в кислородном конвертере. Данный алгоритм используется в АСУ ТП кислородно-конвертерными цехами на нескольких металлургических комбинатах в РФ и СНГ.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ РАБОТЫ

В диссертации разработаны новые концепции исследования точности и создания субоптимальных алгоритмов управления для стохастического, объекта. Совокупность полученных в работе результатов можно считать новым научным направлением в теории управления стохастическими системами.

Подход к построению алгоритмов управления, предложенный автором работы, позволяет более эффективно использовать метод статистических испытаний, а нередко и вовсе отказаться от емких численных методов, что может

существенно снизить затраты и сократить как сроки разработки алгоритма так и сроки всего проекта системы управления.

Разработанная автором диссертации теория чувствительности в задачах стохастического управления позволяет не только проводить анализ влияния стохастических факторов на выходную координату объекта управления, но и содержит математический аппарат для получения критериальных неравенств, оценивающих качество аппроксимации математической модели в задаче стохастического управления.

Автором предложено критериальное неравенство, позволяющее применять детерминированный прогноз в задаче стохастического управления с прогнозатором, что позволяет существенно снизить вычислительные затраты при управлении в темпе с функционированием управляемого объекта.

Установлена связь полученных некоторых критериальных неравенств с т7"—критерием Р. Фишера.

Указана связь между понятием «осторорожности» как свойством оптимальной стохастической системы с понятием "робастности" в теории управления детерминированными системами.

Предложенный автором метод аппроксимации задачи управления марковской задачей охватывает обширный класс задач управления и в случае практического использования существенно упрощает задачу построения алгоритма управления.

Полученные в диссертации новые результаты изложены в виде методик, направленных на практическое использование.

Все полученные результаты иллюстрируются практическими примерами.

На примере промышленного алгоритма коррекции кислородно-конверторной выплавки стали показано

использование всего арсенала методов, представленных в работе.

Полученные результаты могут эффективно использоваться в разработках алгоритмов управления для объектов, существенно подверженными стохастическими воздействиями.

К таким объектам относятся производства с интенсивным ведением технологического процесса ( ряд производств в черной металлургии, процессы легирования при выращивании монокристаллов, процессы в вакуумных дуговых печах при выплавке слитков из титановых сплавов и т.д.), задачи управления движущимися объектами при измерениях из космоса и т.д..

РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ В СЛЕДУЮЩИХ РАБОТАХ:

1. Фетисов В.Н., Штейнберг III.Е. Построение алгоритмов управления технологическими процессами при неточных результатах идентификации, Вопросы промышленной кибернетики

(Тр. ЦНИИКА),"Энергия", вып. 36, 1973, с.64-67.

2. Фетисов В.Н., Штейнберг Ш.Е. Управление одним классом технологических процессов при неточных результатах идентификации, Вопросы промышленной кибернетики (тр'. ЦНИИКА), вып. 37,1973, с.35-37.

3. Ворчик В.Г., Фетисов В.Н., Штейнберг Ш.Е Идентификация стохастической замкнутой системы, Автоматика и телемеханика, № 7, 1973, с.41-52.

4. Фетисов В.Н. К задаче управления объектом с неизвестным

параметром, Автоматика и телемеханика, Р 8, 1973, с.44-51.

5. Фетисов В.Н. Неравенство к методу Монте-Карло, Теория

вероятностей и ее прим.,т.19, № 1, 1974, с.224-226;

6. Фетисов В.Н., Щегляева Т.А., Штейнберг Ш.Е. Влияние ошибок идентификации на алгоритм оптимального

31

управления

процессом легирования полупроводниковых материалов, Приборы и системы управления, » 2, 1975, с.11-12.

7. Фетисов В.Н. Оценка длины выборки при решении экстремальных задач методом Монте-Карло. Журн. Вычисл. матем. и матем. физики, т.16, № 1, 1976, 256-262.

8. Фетисов В.Н. Марковская аппроксимация случайной последовательности в задачах оптимального управления, Известия АН СССР, Техническая кибернетика, № 1, 1979, с.37-43.

9. Петров А.Г., Стукова Л.С., Фетисов В.Н., Хасин A.B.

Простой алгоритм коррекции кислородно-конвертерной плавки, Проектирование математического и программного обеспечения АСУ ТП, Сб. научн. тр. ЦНИИКА, "Энергоиздат", 1981, с.41-43.

10. Фетисов В.Н. Теория чувствительности в задачах стохастического управления, тезисы докл.,6-е Всесоюзное Совещание по теории инвариантности, теории чувствительности и их применениям, Москва,1982, с.114-115.

11. Фетисов В.Н. Аппроксимация распределения вероятностей ошибки идентификации в задаче управления объектом с неизвестным параметром. Идентификация и управление технологическими процессами. Сб. научных тр. ЦНИИКА, "Энергоиздат", 1982, с.8-10.

12. Бубнов Ю.В., Фетисов В.Н., Шалашова В.П. Оценка величины смещения прогноза выходных координат

технологического процесса. Идентификация и управление технологическими процессами. Сб. научных тр. ЦНИИКА,"Энергоиздат", 1982, с.22-24.

13. Фетисов В.Н. Аппроксимация случайного процесса процессом авторегрессии в задачах стохастического управления, Автоматика и телемеханика, № 4,1983, 94-98.

32

14. Фетисов В.Н. Проблема аппроксимации случайных процессов марковским в задаче оптимального управления. В кн. Тезисы докл. 9-го Всесоюзного Совещания по проблемам управления. Ереван, М., 1983, 103-104.

15. Бузник И.П., Ермаков В.А., Иикович В.П., Фетисов В.Н., Чернова Т.Н. Модель оперативного планирования загрузки вакуумных дуговых печей при выплавке слитков из титановых сплавов, Технология легких сплавов: Научно-технический бюллетень ВИЛС, 1983, №3, 72-78.

16. Фетисов В.Н.' Сравнительная оценка качества управления с адаптацией и без адаптации, в кн. Тезисы докл.

Всесоюзной конф. "Теория адаптивных систем и ее применения", М.-Л., 1984, с. 280.

17. Фетисов В.Н. К задаче аппроксимации управляемого процесса марковским, Известия АН СССР, Техническая кибернетика,№ 6, 1984, с.184-188.

18. Фетисов В.Н. 0 двух подходах к задаче выбора математической модели стохастического объекта, в сб.

"Математическое моделирование в АСУ ТП", Тр. ЦНИИКА, М. 1991, с.31-40.

19. Фетисов В.Н. Применение метода скользящего среднего для одного класса задач прогноза и управления,

Интегрированные АСУ», Тр ЦНИИКА, М. 1992, с.55-58.

20. Фетисов В.Н. Методы аппроксимации стохастических моделей в задачах управления технологическими процессами, Приборы и системы управления,1994, № 6, с.15-17.

¿AK.se .тир,/?омпи

Текст работы Фетисов, Вячеслав Николаевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)



М - Г/бзс

аг

ЦЕНТРАЛЬНЫЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ __ ...........___КОМПЛЕКСНОЙ. ...ДВТОМАТЮМрИ

( Президиум ВАК России

| (решение от" " 19 ^г , №

| присудил ученую степень ДОКТОРА

__/Ук<)(ШЖ__наук

Начальник управления ВАК России

На правах рукописи

Фетисов Вячеслав Николаевич

МЕТОДЫ АППРОКСИМАЦИИ В СТОХАСТИЧЕСКИХ ЗАДАЧАХ УПРАВЛЕНИЯ И ОЦЕНКА КАЧЕСТВА СУБОПТИМАЛЬНЫХ АЛГОРИТМОВ

05.13.01 Управление в технических системах

Диссертация на соискание ученой степени доктора технических наук

Научный консультант -доктор технических наук Штейнберг Ш.Е.

ОГЛАВЛЕНИЕ

Введение....................................................6

0.1. Разработка алгоритма управления и классические

методы аппроксимации..................................8

0.2. Актуальность тематики, цель и новизна результатов

работы.....................................................12

0.3. Основные виды упрощений задачи стохастического

управления ...........................................16

Глава 1. Оптимальное управление стохастическим объектом.... 19

1.1. Детерминированное управление..........................19

1.2. Метод динамического программирования..................2 0

1.3. Задача управления марковским объектом.................22

1.4. Примеры марковских задач управления...................24

1.5. Задача управления по неполным'данным..................2 6

1.6. Общая задача управления по неполным данным............32

1.7. Заключение............................................33

Глава 2. Субоптимальные методы стохастического

управления........................................35

2.0. О требованиях, предъявляемых к алгоритмам управления..35

2.1. Пример сравнения двух классических аппроксимирующих моделей .............................................3 6

2.2. Аппроксимация нелинейностей..........................42

2.3. Аппроксимация гауссовским распределением.............4 3

2.4. Аппроксимация детерминированной задачей управления... 49

2.5. Замена стационарной последовательности независимой

Последовательностью..................................50

2.6. Принцип разделения...................................51

2.7. Конструирование регулятора...........................55

2.8. Методы стохастической оптимизации....................56

2.9. Локально оптимальные алгоритмы управления............57

2.10. Квазиразомкнутые методы..............................57

2.11. Заключение...........................................58

Глава 3. Строгий подход к построению субоптимального

алгоритма управления.................................60

3.1. Основные задачи.......................................60

3.2. Неравенства для оценки качества аппроксимации.........62

3.3. Использование статистического моделирования для оценки качества..............................................64

3.4. Замена случайной величины ее математическим ожиданием.66

3.5. Аппроксимация плотности распределения.................68

3.6. Аппроксимация линейной функцией.......................69

3.7. Линеаризация разрывной функции........................7 0

3.8. Аппроксимация детерминированной задачей...............7 0

3.9. Робастные аппроксимирующие управления.................72

3.10. Заключение...........................................7 3

Глава 4. Теория чувствительности в задачах

стохастического управления.........................75

4.1. Классическая теория чувствительности..................7 5

4.2. Уравнение стохастической чувствительности.............7 7

4.3. Характеристики чувствительности для некоторых законов распределения............................................7 8

4.4. Доказательство теоремы 4.2.1..........................80

4.5. Метод наименьших квадратов. Связь с Я"- критерием Фишера................................................82

4.6. Замена случайной величины ее математическим ожиданием.87

4.7. Практические рекомендации.............................8 9

4.8. Заключение............................................91

Глава 5. Аппроксимация случайного процесса марковским......93

5.1. О применении марковских процессов ....................93

5.2. Постановка задачи марковской аппроксимации............94

5.3. Разложение случайных последовательностей..............95

5.4. Неравенства для оценки точности.......................98

5.5. Пример использования. Аппроксимация задачи управления

по неполным данным.....................................9 9

5.6. Второй пример использования..........................100

5.7. Обобщение на бесконечный временной интервал..........102

5.8. Заключение...........................................102

Глава 6. Аппроксимация случайного процесса процессом

авторегрессии.....................................104

6.1. Постановка задачи....................................104

6.2. Решение задачи.......................................10 6

6.3. Упрощенный способ аппроксимации......................108

6.4. Обобщение на бесконечный временной интервал..........110

6.5. Аппроксимация объекта с распределенными парамтрами...110

6.6. Заключение...........................................112

Глава 7. Аппроксимация оптимального прогноза..............113

7.1. Прогноз в задачах управления.........................113

7.2. Пренебрежение случайными характеристиками в прогнозировании......................................115

7.3. Пример использования.................................116

7.4. Обобщение на непрерывное время.......................119

7.5. Заключение...........................................120

Глава 8. Метод Монте-Карло в задачах стохастического

управления..........................................121

8.1. О применении метода Монте-Карло на практике..........121

8.2. Задача оценки длины выборки..........................122

8.3. Определения..........................................123

8.4. Формулы для оценки длины выборки.....................12 6

8.5. Формулы для расчета е-энтропии.......................130

8.6. Пример использования.................................130

8.6. Заключение...........................................131

Глава 9. Аппроксимация случайного процесса марковским для

непрерывного времени............................132

9.0. Введение.............................................132

9.1. Постановка задачи аппроксимации......................133

9.2. Оценка потерь от аппроксимации.......................135

9.3. Дифференцируемые переходные вероятности..............138

9.4. Пример из практики - случайный процесс с конечным числом состояний.....................................140

9.5. Пример из практики - процесс, близкий к

диффузионному ......................................141

9.6. Стохастическое уравнение чувствительности для непрерывного времени.................................143

9.7. Заключение...........................................144

Глава 10. Алгоритм коррекции кислородно-конвертерной плавки ..........................................................145

10.0. Введение............................................145

10.1. Модель задачи коррекции кислородной плавки..........147

10.2. Требования к алгоритму коррекции....................149

10.3. Алгоритм для линейной модели конвертерной плавки.... 150

10.4. Структура субоптимального алгоритма.................151

10.5. Определение параметров кг и к2......................153

10.6. Алгоритм для расчета высоты фурмы и веса охладителя.154

10.7. Итоговая оценка точности аппроксимации..............157

10.8. Заключение..........................................157

Основные выводй работы. Рекомендации по использованию научных

выводов...................................................158

Литература................................................160

ВВЕДЕНИЕ

Проблема субоптимального управления объектами, существенно подверженными стохастическими воздействиями, является одной из центральных в современной теории управления. К таким объектам относятся производства с интенсивным ведением технологического процесса (ряд производств в черной металлургии, процессы легирования при выращивании монокристаллов, процессы в вакуумных дуговых печах при выплавке слитков из титановых сплавов и т.д.), задачи управления движущимися объектами при измерениях из космоса и т.д.. Как правило, эти объекты к тому же содержат существенные нелинейности, что делает часто разработку оптимального управления практически невозможным и разработчики систем управления прибегают к использованию упрощенных алгоритмов.

Подразумеваются следующие подходы к проблеме упрощения:

1. Не упрощая исходных математических моделей, найти структуру алгоритма управления, которая хотя и не может быть строго обоснована как близкая к оптимальной в математическом смысле, но тем не менее исходя из здравого смысла ее можно использовать без риска получить неудовлетворительное качество управления. Классические примеры - ПИ и ПИД регуляторы в задачах стабилизации.

2. Перейти к более простой модели объекта, для которой оптимальное управление может быть легко реализовано (желательно решение в аналитическом виде).

На практике находят применение оба подхода (часто используется их комбинация).

По поводу второго подхода следует сделать несколько замечаний.

Прежде всего следует заметить, что в практике разработки алгоритмов управления техническими системами следует выделять из общего технического объекта именно объект управления и не

рассматривать полное и точное математическое описание технической системы в целом. К примеру, для регулирования скорости вращения коленчатого вала двигателя внутреннего сгорания совсем не нужно моделировать законы движения его впускных и выпускных клапанов ( законы движения клапанов практически не влияют на качество регулирования и их можно не включать в объект управления).

Поэтому в дальнейшем будет предполагаться, что объект управления правильно выделен из технической системы и в данном аспекте его упрощение невозможно. Более того, в дальнейшем не будут рассматриваться упрощения, законность которых очевидна. Например, для регулирования температуры в промышленном холодильнике его вовсе не следует рассматривать как объект с распределенными параметрами и моделировать распространение тепла в его корпусе с помощью дифференциальных уравнений в частных производных. Данный объект достаточно представить в виде апериодического звена второго порядка с запаздыванием.

Следующее замечание связано со способом получения упрощений модели объекта. Возможны два подхода. Первый -классический: перейти от некоторой исходной математической модели к более простой. Второй - получение простой математической модели непосредственно по выборке статистических данных, полученных на объекте (в практике разработки АСУ ТП второй подход встречается гораздо чаще). Эти подходы существенно отличаются по используемым математическим методам. В данной работе будут изучаться оба подхода.

И наконец, дадим самое важное замечание по отношению к эффекту, к которому может привести упрощение модели объекта: оптимальное управление для упрощенной модели может потерять ряд свойств присущих оптимальному управлению для исходной модели в плоть до потери устойчивости.

Обоснованные методы упрощений исходной модели управления в данной работе будут называться методами аппроксимации.

Начало интенсивных исследований проблемы создания как оптимальных так и субоптимальных алгоритмов управления стохастическими объектами приходится на 60-е годы. Значительный вклад в ее развитие внесли российские ученые: Фельдбаум A.A., Цыпкин Я.З., Пугачев B.C., Красовский A.A., Райбман Н.С., Стратонович P.JI. , Казаков И.Е., Черноусько Ф.Л. а также зарубежные ученые Беллман Р., Острем К., Бар Шалом Я., Ли Р., Флеминг У., Калман П.Е., Аоки М., Джакобс О., Патчелл И..

Теперь укажем на некоторые проблемы, возникающие при разработке субоптимальных алгоритмов управления.

0.1.Разработка алгоритма управления и классические методы аппроксимации

Методы аппроксимации получили развитие в основном благодаря необходимости представлять в аналитическом виде результаты физических экспериментов. На практике обычно эти методы применялись к функциям одного или (что было гораздо реже) нескольких аргументов. В случае нескольких аргументов исследователи часто упрощали задачу, применяя декомпозицию, и, тем самым, заменяя исходную задачу более простой.

Теория аппроксимации - это математическая наука, которая изучает способы преобразования информации сколь угодно большого объема, заложенной в понятие функциональной зависимости, в информацию конечного объема [74]. Знание методов классической теории аппроксимации очень полезно в практической работе с современными математическими моделями технологических процессов.

Ряд вопросов теории был изучен уже в работах Эйлера Л., Гаусса К.Ф., Вейерштрасса К. , но как самостоятельная математическая наука (а не область математического анализа) она становится после работ Чебышева П.Л..

Полноценный обзор классических методов аппроксимации с изложением основных идей теории приводится в справочной монографии Гутера P.C. и др.[25]. Там же можно найти обширную библиографию работ математиков по теории аппроксимации.

К методам аппроксимации обычно предъявляются следующие требования:

1. Обязательное наличие критерия качества аппроксимации, который отвечает требованиям практического использования результата работы.

2. Класс аппроксимирующих функций должен соответствовать особенностям исходной функции так, чтобы при заданной точности число параметров, определяющих упрощенную функцию, было близким к минимально возможному ( класс аппроксимирующих функций должен быть в определенном метрическом смысле близок к аппроксимируемой функции).

3. Множество аппроксимирующих функций должно содержать последовательность, сходящуюся к искомой функции в смысле заданного критерия.

4. Наличие простых неравенств, оценивающих погрешность аппроксимации при выборе аппроксимирующего класса функций.

Следует заметить, что задача получения неравенств, оценивающих качество аппроксимации для конкретной (известной) исходной функции не имеет смысла, поскольку ошибку в этом случае легко вычислить непосредственно.

Роль неравенств, используемых для оценки погрешности от упрощений, существенно повышается в задачах разработки численных методов решения нелинейных дифференциальных уравнений, когда точное решение уравнения неизвестно. В случае задачи определения неизвестных функций ( хотя некоторые их характеристики могут считаются известными, в частности, заранее может быть известно сколько раз неизвестную функцию можно дифференцировать) разработан специальный математический аппарат для оценки погрешности

аппроксимации (табулирования) с помощью понятия е -энтропии.

Итак, использование неравенств уместно в случае, когда исходная функция нам неизвестна. Именно такие неравенства нужны для обоснования субоптимального алгоритма, поскольку сравнивается качество разрабатываемого алгоритма с оптимальным, который обычно нам неизвестен.

Существует ряд причин, из-за которых классические методы аппроксимации (в частности, численный подход к поиску решения) мало применимы при решении задач оптимального управления стохастической системой.

Одна из этих причин - многомерность, что вытекает из сути процедуры синтеза оптимального управления. Даже для задачи управления объектом с одним входом и одним выходом приходится решать функциональное уравнение Беллмана, а аппроксимация математической модели с одним выходом и п входами степенным

полиномом k-го порядка потребует определения пк неизвестных коэффициентов.

В монографии Немировского A.C., Юдина Д.Б.[4 9] сделан количественный анализ объема вычислений при использовании классических методов аппроксимации при решении задач оптимизации. В монографии Острема К., Виттенмарка Б. [51] рассмотрены вычислительные вопросы при использовании ЭВМ в управлении.

Казалось, что бурное развитие ЭВМ решит вычислительную проблему, но этого не произошло, поскольку в темпе с развитием ЭВМ расширялся и класс объектов, требующих качественного управления.

В случае стохастического объекта объем вычислений в задаче построения алгоритма управления значительно возрастает. Происходит это из-за того, что для определения стохастической модели требуется знать информацию гораздо большего объема, чем для детерминированной.

Покажем это на тривиальном примере. Пусть уравнение объекта имеет вид:

у = ах , (0.1.1)

где х - вход и у выход.

Здесь, чтобы определить объект, требуется задать всего одно число а .

Пусть, далее, объект описывается уравнением

у=ах+£ , (0.1.2)

где £ - случайная величина. Теперь, чтобы определить объект, требуется задать число а и функцию распределения случайной величины е, а это означает, что для стохастического объекта нужно определить бесконечное множество чисел.

В практике разработки алгоритмов управления для такой модели используются два важных ее свойства. Первое - в большинстве случаев распределение случайной величины, описывающей шум в техническом объекте, хорошо аппроксимируется гауссовским распределением, которое определяется всего двумя числами. Второе - статический управляемый объект является довольно грубым к неточностям в определении выходной величины. Поэтому, для такого объекта можно пренебречь случайной величиной £, заменив ее математическим ожиданием, и далее воспользоваться моделью (0.1.1).

Здесь уместно заметить, что в технических приложениях чисто детерминированных систем не существует, и разработчики алгоритмов управления обычно пренебрегают случайными факторами, когда эти факторы достаточно малы. Основанием для пренебрежения в этом случае является факт, что после практической реализации алгоритма наблюдается приемлемое качество управления.

На практике упрощают и гораздо более сложные объекты (когда правомерность упрощения не вполне очевидна), и пренебрегают не только случайными факторами: переходят

к линейной модели, снижают размерно