автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование субоптимальных алгоритмов управления билинейными системами на основе рациональных функций от вектора состояния
Автореферат диссертации по теме "Разработка и исследование субоптимальных алгоритмов управления билинейными системами на основе рациональных функций от вектора состояния"
2 6 ДПР 1393
российская академия наук Институт проблем управления
На правах рукописи
шумскии андреи владимирович
разработка и исследование субоптимальных алгоритмов управления билинейными системами на основе рациональных функции от вектора состояния
¡ециальность о5.13.01 - Управление в технических системах
автореферат • диссертации на соискание ученой степени кандидата технических наук
МОСКВа - 1993
Рабата выполнена в Институте проблем управления Научный руководитель:
Доктор технических наук, профессор И.Б.Ядыкин Официальные оппоненты:
Доктор технических наук, профессор В.Н.Афанасьев Кандидат технических наук Э.Д.Аведьян Ведущая организация:
Центральный научно-исследовательский институт комплексной автоматизации (ЦНИИКА).
Защита состоится _ 1993 года в___на
заседании специализированного совета Д 002.68.ог в Институте проблем управления по адресу: 117806, Москва, Профсоюзная ул.,65.
С диссертацией можно ' ознакомиться в библиотеке Института проблем управления.
Автореферат разослан _ 1993 года
Ученый секретарь специализированного совета доктор технических наук
Б.К.Акинфиев
ОБКЛЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблема. Одной из ваянкх задач, стоящих перед современной теорией управления, язляется разработка катодов синтеза алгоритмов, обеспечивающих высокое качество управления технологическими процессами. Многие объекты управления в той или иной степени нелинейны. Учет нелинейности позволяет обеспечить более высокое качество управления при широком диапазоне изменения состояния объекта. Билинейные модели занимают промежуточное положение между традиционными линейными моделями и нелинейными моделями общего вида. Структура билинейной модели достаточно содержательна для аппроксимации широкого класса нелинейных систем. Математическая простота билинейного описания облегчает синтез алгоритмов управления. Многие реальные процессы описываются билинейными моделями. Билинейные модели успешно применяются в ядерной физике, биохимии, механике, химическом производстве и в других областях. Для стабилизации состояния билинейного объекта были предложены линейные, линейно-квадратичные, минимизирующие обобщенную дисперсию выхода, обеспечивающие линейность замкнутой системы и др. законы управления. Однако в случае традиционного квадратичного критерия не удается получить явное аналитическое выражение для оптимальной стратргки управления и задача синтеза новых более эффективных стратегий управления остается актуальной.
Цель работы. Целью диссертационной работы является синтез, исследование и практическое применение субоптималь-' кых алгоритмов управления бил «шейными системами.
Для достижения поставленной цели последовательно ста-
вятся следующие задачи:
1) разработка методов синтеза алгоритмов субоптимального управления билинейными стохастическими системами;
2) исследование свойств алгоритмов субоптимального управления билинейными системами;
3) разработка методов анализа качества алгоритмов оценивания и стабилизации скалярного выхода на основе нижней границы среднеквадратичной ошибки оценивания и управления;
4) разработка алгоритмического и программного обеспечения идентификации параметров билинейной модели для микропроцессорной системы управления температурой диффузионного оборудования.
Методы исследования Основные результаты и выводы диссертационной работы были получены с использованием матричного исчисления, математического анализа, свойств условных математических ожиданий, методов теории дискретных систем управления, теории условно-гауссовских последовательностей и линейной алгебры.
Научная новизна. В работе получены следующие научные результаты:
- обоснован принцип разделения задачи оптимального управления по неполным данным билинейным стохастическим объектом на задачу оценивания состояния исходного объекта и задачу управления нелинейной системой с известным вектором состояния;
- на основе рациональных функций построена субоптимальная стратегия управления билинейным объектом с квадратичным критерием качества;
- исследованы свойства субоптимальной стратегии: для детерминированного случая доказана асимптотическая устойчивость замкнутой сястемы и асимптотическая оптимальность стратегии при малых отклонениях состояния; для билинейного объекта первого порядка выполнено сравнение разработанной стратегии с оптимальной, доказана устойчивость замкнутой системы в целом и асимптотическая оптимальность стратегии при бесконечно больших значениях состояния;
- для одного класса объектов управления получено аналитическое выражение для нижней границы среднеквадратичной ошибки оценивания и стабилизации скалярного выхода;
- для центральной зоны диффузионной электрической печи построена билинейная модель тепловых процессов, которая позволила объяснить несимметрию реакции установки на нагрев и охлаждение.
Практическая ценность и реализация результатов работы.
Полученные алгоритмы управления билинейными системами могут быть использованы в микропроцессорных системах управления технологическими процессами в энергетике, металлургии, химии, нефтехимии, нефте- и газопереработке и других в отраслях.
На основе результатов полученных в диссертации была проведена'оценка качества Функционирования системы автоматического управления технологическим процессом смешения Сгнзн-ка на Рязанском Нефтеперерабатывающем заводе, что позволило рекомендовать данную систему к внедрению на заводах отрасли. Экономический эффект обусловленный результатами диссертация :оставляет то тыс. руб. по ценам 1987 г.
Результата диссертации были использованы при разработке
регулятора температуры диффузионного оборудования РТИ 12, который прошел этап опытно-промышленных испытаний в НИИТМ (г.Зеленоград) и выпускается серийно. Расчетный экономический эффект от внедрения регулятора, обусловленный результатами диссертации, составляет 315 тысяч рублей в год на одну установку.
Апробация работы Результаты диссертации докладывались на семинарах лаборатории N 42 Института проблем управления в 1990, 1991, 1992 годах и IX Всесоюзной конференции "Планирование и автоматизация экспериментов в научных исследованиях" (Москва 198Э). Основные результаты диссертации опубликованы в б работах.
Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, списка литературы и приложений. Объем диссертации составляет 150 машинописных страниц, 26 иллюстраций, 4 таблицы, 163 литературных источника. В приложениях представлены доказательства некоторых теоретических результатов, справки о внедрении и иллюстрации.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается выбор избранной теш и ее актуальность, излагаются теоретические основы исследования, являющиеся результатом анализа научной литературы по теме, определяются цели исследования, приводится структура диссертации, указывается научная новизна, апробация и промышленное внедрение основных результатов.
В первой главе диссертации рассматривается задача
стабилизации стохастического билинейного объекта
в
х(1+1) = диыи+ВНМ^+Е и. и)Р (Охи)+5и),
(1)
• у(0 = си)хи) + Л( ь), ь = 0,1,2,...,
где ь - дискретное время, х(1) - вектор состояния размерности п, и(0 - вектор управления размерности т, и (О - координата 1 вектора управления и (О, у(г) - вектор
наблюдений размерности 1, A(t), B(t), c(t), F^(t) (i = l,m) - известные матрицы соответствующих размерностей.
Векторы возмущений £(t), n(t) (t=0,l,2,..) независимые гауссовскиа случайные векторы с нулевыми математическими ожиданиями и известными дисперсионными матрицами D{n(t)} = D^(t), D{£(t)} = D^(t). Начальное состояние x(О) - независимый случайный гауссовскиа вектор. Точные значения вектора состояния x(t) предполагается неизвестными.
Качество управления на интервале t<4 0,T-l] оценивается с помощью квадратичного Функционала
J = E{TÊ1[xt(t)Q ::( t ) + 2хт ( t )Q u(t) + u'ftiQ u(t)] + t.o
+ xT (T)QiX(T)}. (2)
Доказано разделение задачи оптимального управления билинейным объектом <i) с критерием ( 2 ) на задачу оценивания состояния исходного билинейного объекта и задачу управления нелинейной системой с полной информацией о состоянии.
Оценки x(tlt), x(t*ilt) вектора состояния x(t) билинейного объекта (2) вычисляются согласно уравнениями оптимального услсвно-гауссозского фильтра
x(tlt) = x(tlt-l) + K(t,yt_l )[y{t) - C(t)x(tlt-1)],
î(t+llt) = A(t)x(tlt) + B(t)u(t,y4) +
+ Ê u (t.y1)f (t)x(tlt), i -1
К ( t, y1 ~ 1) . P(tlt-l)CT(t)* (3)
*[C(t)P(tlt-l)CT(t) + D4(t)]+,
P(tlt) = P(tlt-l) - Kd.y*"1 )C(t)P(tlt-l),
P(t+llt) = [A( t ) + Ê u^t.y* )Fi (t)]P(tlt)*
*
* {A( t ) + £ u (t.y* )F (t)]1 + D (t), 1 • l
где элементы матриц Kd.y*"1) - коэффициенты усиления фильтра, у1 - обозначает совокупность наблюдений y(k) k=o,t, x(tlt)=E{x(t)lyl}, x(t+llt)=E{x(t+i)ly*} -условные математические ожидания вектора состояния x(t), p(tlt)=D{x(t)ly*}. p(t+iIt)=D{x(t+i) Iу4} - матрицы условной ковариации ошибок оценивания. Начальные условия фильтра: х(оЮ) = е{х(0)}, р(0Ю) = D{x(о)}. Фильтр (3) синтезирован на основе теории условно-гауссовских последовательностей изложенной в работе Р.Ш.Липцера и А.Н.Ширяева.
Синтез оптимальной стратегии сводится к решению уравнений динамического программирования Беллмана. При этом для стратегии не удается получить явное аналитическое выражение. Численное решение требует использования значительных вычислительных ресурсов и на современном уровне развития техники практически неприемлемо. Поэтому на основе принципов приближенного разделения и локально-оптимального управления ищется субоптимальная стратегия, минимизирующая локальный критерий
J(t)=xT (t+llt)S(t+l)x(t+lltî + 2xT(tit)Q u(t) + (4)
X и
+ uT(t)Q u(t),
u
где сценки 'x(tlt), ":<(t + llt) определяются уравнениями фильтра (3), матрица s(t+i) - решение уравнения Ркккати
G ( к ) = А1 ( к ) S ( к+1 ) А( к ) - [ Ат ( к ) S ( к+1 ) В ( к ) + Q ]- (5)
х U
•[Q + В1(к)Ь(к+1)В(к)]+[BT(k)S(k+l)А(к) + QT ] + Q ,
U X ц *
к = Т-1,1 ,
с начальным условием s(t) = q . Матрицы q ,q
T X X u u T
задаются критерием ( 2).
Минимизация локального критерия (3) сводится к вычислению минимума квадратичной формы от управления u(t). Стратегия управления имеет вид рациональной вектор-функции
u(t) = -[Qu+ RT(x(tlt)),t)S(t+l)n(x(tlt),t)]+* (6)
*[Q1 + RT(x(tlt),t)S(t+l)A(t)]x(tlt),
X u
S(x(tIt),t) = 3(t) + Z x (tlt)G (t), i « 1
элементы матриц G^ ( t ) связаны с элементами матриц f^ ( t ) уравнений (1)
f^Mt) = g^'(t) i =T7T. k =T7ÏT, j =T7n". (7)
Стратегию (6) можно рассматривать как результат приближенного решения уразнений динамического программирования Беллмака для объекта (1) с критерием (2), когда билинейные уравнения (1) заменяются на линеаризованные на всех тактах управления кроме текущего и не учитывается зависимость условной дисперсии D{x(t+l)ly*} от текущего управления u(t). Стратегия (6) стремится к оптимальной при малых дисперсионных матрицах d{х(о)}, D (t), n (t) и малых отклонениях
вектора состояния x(t). Таким образом стратегия (6) является субоптимальной.
Во второй главе исследованы свойства стратегии (б). Анализируется устойчивость замкнутой системы и асимптотическая оптимальность стратегии.
Рассмотрен случай, когда в билинейном объекте (1) отсутствуют возмущения s(t)=o, t=o,i.2,..., а значение вектора состояния x(t} известно точно. Тогда уравнения объекта (1), критерий (2) и стратегия (6) принимают вид:
x(t+l) = A(t)x(t)+B(t)u(t)+£ ut(t)Ft(t)x(t), <8)
l > l
I -1
J = E [xT(t)Q x(t)+2xT(t)Q u(t) + u1(t)Q u(t)] +
X xu u
t ■ 0
+ xt(T)QtX(T), (9)
u(t) = -[Q + RT(x(t),t)S(t+l)R(x(t),t)]+* (10)
U
«[Q1 + R1(x(t),t)S(t+l)A(t)]x(t),
XU
B(x(t),t) = B(t) + z x <t)G (t), Jж l J
где матрицы s(t+i), G^tt) определяются согласно (5) и (7).
Билинейному объекту управления (8) можно поставить в соответствие линеаризованный объект
x(t+i) = A(t)x(t) + B(t)u(t), (11)
t = 0,1,2, ... .
Свойства стратегии (10) сформулированы в виде следующих теорем:
Теорема 1. Пусть u (t,x) - оптимальная стратегия
--opt
управления билинейным объектом (8) с критерием (9) на интервале te[o,T-i], ug(t,x) - приближенная стратегия (Ю). Тогда
Эи (t,x) __
Эх.
3us(t,x)
= L(t),
3x
х ■ о
где ь(1) - матрица коэффициентов ЛК регулятора для линеаризованного объекта (11) с критерием (9) на интервале
Если билинейный объект (8) стационарен (А(ь)=А, в(г)=в), существует стационарное положительно определенное решение э уравнения Риккати {5), и^ (х) - стационарная стратегия (ю) ( б (1) =з), то
Эи"(х)
= L, *. о
ах
где l - патрица коэффициентов стационарного ЛК регулятора для- линеаризованного объекта (11) с критерием (9) при Т — *ч>.
Теорема 2. Пусть билинейный объект (8) стационарен (A(t)=A, B(t)=B), в критерии (9) Q =0, Q , Q - симмзт-
х а х и
ричкые положительно определенные матрицы. Существует стационарное симметричное положительно определенное решение s уразнения Риккати (5).
Тогда замкнутая система (8), (10) асимптотически устойчива по Ляпунову:
рассмотрим билинейный объект первого порядка, заданный уравнением
x(t+l) = ах(t) + (Ь + fx(t))u(t), ............ (12)
где x(t) - скалярное состояние, u(t) - скалярное управление, а,ь,f - известные скаляртеэ коэффициента. Введем квадратичный критерий качества на бесконечно»! интервале управления
со
J = £ [хг (t) + q u* (t)J , q >0. (13)
,-0
В случае билинейного объекта первого порядка (12) и Функционала критерия качества (13) стратегия < i о) задается
рациональной функцией
а х(t) (Ь + f x(t))
u(t)=----- , (14)
q + (b + f x(t)Г
где параметр q>0 определяется по формулам:
q=s_1q , u
s = 0.5 + (q (a2 - 1) + /~d)/b2 , (15)
U
d = (q (1 - a2) - b2 )2 + 4q b2 .
u u
Теорема 3. Замкнутая система (12), (14) асимптотически устойчива в целом при 1а1<1, q>0.
Теорема 4. Пусть и (х) оптимальная стратегия управле-
--opt
ния билинейным объектом (12) с критерием (13), и (х) -
R
стратегия (14), v (х(о)), v (х(0)) - функционал (13),
opt в
вычисленный на траектории (12) при u(t)=u (x(t)) и
opt
u(t)=u (x(t)). Коэффициент f в (12) не равен нулю. Тогда
q а2
lim (V <х)-х2) = lim (V (х)-х2) = --- , (1G)
opt в ег
lim u (х) = lim и (х) = - - .
„,«. fi f
Отметим, что традиционные линейно-квадратичные стратегии не обладают свойством асимптотической оптимальности (16).
Я.З. Цыпкиным было предложено оценивать качество алгоритмов идентификации путем сравнения матрицы ковариации ошибок с нижней границей Рао-Крамера. Во второй главе диссертации аналогичный подход используется для анализа качества функционирования алгоритмов оценивания и стабилизации скалярного выхода. Исследуются линейные и билинейные системы.
Рассмотрим скалярную случайную величину выхода v и
связанный с ней случайный вектор выполненных наблюдений у.
Пусть v(y) - оценка v по наблюдениям у, a v (у) - заданное
э
значение, относительно которого при управлении стабилизируется величина v. Для функций v(у), vo(у) от вектора у 5удем использовать общее обозначение v(y).
Если v(у) - произвольная борелевская функция и Е{уг}<», го условная среднеквадратичная ошибка оценивания или стабилизации величины v ограничена снизу условной дисперсией
- Е{(v-v(y))2 1 у> г D{vI у} . Таким образом з качестве нижней границы среднеквадратичной эшибки оценивания и стабилизации скалярного выхода 'v можно выбрать нижнюю границу условной дисперсии данного выхода
E{(v-v(y))2} i E{D{vI у}} * min {D{vly}. (17)
3 частном случае удается получить явное аналитическое зыражение для нижней границы условной дисперсии. Объект управления описывается системой уравнений:
y(t) = A(t,yt_1)e + T)(t), t=l,2,3,..., (18)
v(t) = [l u'ft.y* )]B + £(t),
'Де y(t) - вектор наблюдений, у4 - совокупность векторов {эблядеикЗ (у(1), у(2), ..., y(t)), в - ненаблюдаемый слу-•:сйиый эоктор неизвестных параметров, A(t,y'"1) - известные «атричнке функции времени и прошлых наблюдений, v(t) -:каляркый ненаблюдаемый выход, uft.y') - вектор-функция $ремени и прошлых наблюдений, n(t) - последовательность соррелированных случайных векторов, £(t) - последователь-юсть независимых скалярных случайных величин.
Зависимость матриц Aft.y*'1), и векторов u(t,y') от >реме:-:и t и прошлых наблюдений позволяет описывать
уравнениями (18) замкнутые системы с различными обратными связями а также объекты с программными управляющими воздействиями. Едийица во втором уравнении (18) используется для учета неизвестной константы.
Для произвольного момента времени I систему рекуррентных уравнений (18) можно представить в виде:
у = А(у)8 + л, (19)
у=[1 ит ]8 + С,
где у - вектор, состоящий из координат векторов наблюдений
у(1). у(2), ..., у(г), в - ненаблюдаемый .случайный вектор
неизвестных параметров из уравнений (18), А(у) - известная
матричная функция от у, определяющая связь меаду у и о
согласно (18), л - случайный вектор, состоящий из координат
векторов п(1), л(2).....ли), и=ии,-/>, с=г;и).
Теорема 5. Пусть в представлении (19) системы (18)
случайные векторы 0, л и случайная величина гс независимы
друг от друга и имеют гауссовские распределения. Заданы
дисперсионные матрицы йа=о{0}, р =о{л} и дисперсия
и м
Тогда, если матрица с неособенная, то существует нижняя граница условной дисперсии
VIу) = (сГ 1 +ат (у)0~ 1 а (у))"1 + 0_ ПРИ ¿>0, (20) и 1 Л 1 5.
й{у1у} = Т>- пря с!:0,
и
где величина а при детерминированном векторе и определяется равенством
с? р{у} - ^
а в случае когда неособенная матрица
Вектор а (у) в (20) - первый столбец матрицы А(у),
зперация (■) t означзет элемент 11 матрицы (■)•
Возможности практического применения нижней границы
условной дисперсия (20) продемонстрированы на примере ана-
1иза качества функционирования системы автоматического
травления технологическим процессом смешения бензинов
'язанского нефтеперерабатывающего завода.
В процессе смешения бензина исходные компоненты посту-
1ают в трубопровод где перемешиваются. Полученный бензин
скапливается в товарном резервуаре. Управляющие воздействия
¡адают текущее соотношение исходных компонент в смеси. На
:аждом такте управления хроматографом измеряются качествен-
;ые показатели (октановое число, упругость паров и др.)
¡екзина в трубопроводе. По результатам измерений вычисляются
овке управляющие воздействия. Цель управления заключается в
табилизации качественных показателей полученного бензина.
Для произвольного качественного показатепя процесс
мешения можно описать моделью
y(t) = [1 u' (t)]9 + Ç(t), (21)
z(t) ='y(t) + n(t), t
. v(t) = - £ y(k) , t = l ,2.....T ,
1
че y(t) - текущий качественный показатель бензина в трубоп-эвсде, u(t) - вектор управляющих воздействий, z(t) - изме-зние текущего качественного показателя бензина в трубопро-зде, v(t) - среднее значение качественного показателя жзина в товарном резервуаре, в - независимый гауссовский ¡учайный вектор неизвестных коэффициентов модели, £(t.), t) - независимые гауссовские случайные величины с диспер-
сиями = } , 0^ = 0(11(0}, (1=1,2,... ,т>.
Обозначим через г* совокупность измерений г<к) (к=1. Предполагается, что вектор управления иЮ ограниченная функция времени и выполненных измерений и(1)=и(г,2'). При любом детерминированном векторе и(ъ) дисперсия величины y^t) ограничена неравенством
о»уи)} г ь^* а, <1*0, 1=1,2,...,т .
Последнее соотношение определяет точность стабилизации качественного показателя бензина в трубопроводе у{ь) при отсутствии текущих измерений.
В качестве следствия теоремы 5 получены следующие киание границы условной дисперсии в модели (21)
* (а"1. (22)
) I г* } ^ и+1)~г05* (с!"1.
У С ^.+1 > I г* ) * * (сГ'+ МО + I),)"1)"1.
1С. '»с.
Проведено имитационное моделирование система управления процессом смешения бензина и выполнено сравнение среднеквадратичных ошибок оценивания к стабилизации качественных показателей полученного бензина с нижними границами (22). Показано, что среднеквадратичные ошибки оценивания и стабилизации близки к минимально возможным.
В третьей главе на примере решения задачи управления температурой центральной зоны диффузионной электрической печи исследуются свойства стратегии (14).
Диффузионные электрические печи вютолняют до 40% всех технопогических операции, необходимых для иропаводства больших и сверхбольших интегральных микросхем. Повышение
точности стабилизации температуры в реакторе приводит к уменьшению разброса параметров микросхем и к увеличению фоцента выхода годных пластин. Таким образом, можно ожидать [то разработка и применение алгоритмов, обеспечивающих исокую точность управления температурой диффузионных !лектрических печей, даст существенный экономический эффект.
Описывается конструкция диффузионной ,.<зчи, . приводится бзор результатов физических исследований тепловых процессов диффузионных печах, рассматривается физическая модель стаковки, разработанная В 1992 году Н. De Waard, W.L. De oning
dT(t)
- = A T(t) + A T*(t) + Bu(t) , (23)
dt 1 2
T4 . CT1 , t h
де т - вектор температур элементов установки, т4 - вектор емператур элементов установки в четвертой степени, T4h эктор температур термопар в четвертой степени, u(t) эктор управления, определяющий мгновенные мощности электро-1гревателей, д , , в, с - постоянные матрицы, зависящие г конструкции установки.
По результатам активных экспериментов выполнена лденти-псация параметров приближенных линейных и билинейных моде-установки. В качестве управляющих воздействий в экспери-¡нтах использовались ступенчатые и независимые двоичные :евдослучайные сигналы. Идентификация проводилась методами [«меньших квадратов и максимального правдоподобия. Рассмат-вались традиционные линейные arx и armax модели в прос-анстпе вход-выход, а также билинейные модели (центральной ны) вида
у(0 = £ а уи-Л + Е Ь и(1-1) + (24)
+ £ * уК-1)иЦ-1) + е(1) + I с^Ц-П, 1-1 1» 1
где у(и - температура центральной зоны реактора, хи) -ненаблюдаемый вектор состояния, и(0 - температура нагревателя центральной зоны, е(ъ) - последовательность независимых случайных величин с нулевым математическим ожиданием, а1,Ь1,Г1,С1 - постоянные коэффициенты. Билинейной модели (24) в пространстве вход-выход соответствует параметризация в пространстве состояний
х(г+1) = Ах(1:) + Ви(0 + Рх(Оии) + Сеи), У(г) = [10 ... 0]х(и + е(Ь),
где
(25)
а г 0 . . . 0
а1 I г 0 0
А = 2 п- 1 К = 2 1
. а 0 ... 0 . { 0 • • 0
в'
[Ь ,Ь ,..•,Ь ],
12 п
Ст [с ,с , . . . ,с ],
1 2 п
Для описания тепловых процессов з центральной зоне реактора диффузионной печи предлогэна билинейная модель первого порядка, корректно описывающая весишетрш динамических характеристик печи при нагреве к охлаждении
у<1) = с0 + 8^(1-1) + Ь1и(е-1) + (26)
+ Г у(г-1)ии-1) + е(0 + с1«{ ,
Приведены результата испытаний матричного ПИ регулятора температуры. Испытания проводились на пятизонной диффузионной печи. Результата испытаний показали, что в установившемся режиме матричный ГШ регулятор обеспечивает приемлемую точность стабилизации температуры в зонах реактора.
Исследованы возможности улучшения качества стабилизации температуры за счет использования нелинейного закона управления. Для билинейной модели первого порядка центральной зоны реактора (12) и квадратичного функционала критерия качества (13) проведено численное решение уравнений динамического программирования Беллмана и найден закон оптимального управления. Исследованы свойства оптимального управления. Выполнено сравнение линейного, оптимального и заданных рациональными функциями законов управления. Коэффициенты рациональных функций определялись аналитически в соответствии с уравнениями (14), (15) а также оптимизировались численно. Показана эффективность использования рациональных функций в качестве закона управлен и я билинейными объектами при широком диапазоне изменении состояния.
В заключении обобщаются и анализируются основные результаты проведенных исследований.
основные результаты работы
1. Рассмотрена задача синтеза оптимального управления по неполным данным многомерным билинейным стохастическим объектом с квадратичным критерием качества. Доказан принцип разделения задачи управления на задачу оценивания состояния исходного билинейного объекта и задачу управления нелинейной системой с полной информацией о состоянии.
2. Синтезирован алгоритм оптимальной фильтрации для оценивания ненаблюдаемого вектора состояния билинейного объекта.
3. На основе рациональных функций построена субопти-кальная стратегия управления билинейным объектом с квадратичным критерием качества. Для детерминированного . случая
доказана асимптотическая устойчивость замкнутой системы и асимптотическая оптимальность стратегии.
4. Для одного' класса объектов управления построена нижняя граница среднеквадратичной ошибки оценивания и стабилизации скалярного выхода. На основе полученной нижней границы исследовано качество функционирования алгоритмов системы автоматического управления технологическим процессом смешения бензинов на Рязанском Нефтеперерабатывающем заводе. Показано, что среднеквадратичные ошибки стабилизации качественных показателей полученного бензина близки к минимально возможным.
5. Разработано алгоритмическое и программное обеспечение для идентификации параметров билинейных моделей по экспериментальным входо-выходным данным технологического процесса;
6. На основании обработки результатов технологических экспериментов для центральной зоны диффузионной электричес-. кой печи построены линейные модели различной" степени сложности. Синтезирована билинейная модель, корректно описывающая несимметрию динамических характеристик печи при нагреве в охлаждении.
7. Получек оптимальный закон управления температурой центральной зоны диффузионной электрической печи (для билинейной модели объекта управления). Проанализированы свойства оптимального управления.
8. Синтезирован субоптимальный алгоритм управления температурой центральной зоны диффузионной электрической печи (для билинейной модели объекта управления). Исследованы свойства алгоритма управления.
9. Результаты исследований внедрены при разработке регулятора температуры РТИ-12, который прошел этап спытно-промышленных испытаний на пятизонной диффузионной электрической печи типа "Оксид" и выпускается серийно. Расчетный экономический эффект от внедрения регулятора, обусловленный результатами диссертации, составляет 315 тысяч рублей в год на одну установку.
Основные результаты диссертации опубликованы в работах:
1. Шумский A.B. Анализ точности оценивания и стабилизации скалярного выхода с помощью нижней границы среднеквадратичной погрешности. Рукопись представлена Институтом проблем управления. Деп. в ВИНИТИ.
2. Шумский A.B. Субоптимальное управление билинейными системами на основе рациональных Функций от оценки вектора состояния. Рукопись представлена Институтом проблем управления. Деп. в ВИНИТИ.
3. Шумский В.М., Шумский A.B. Субоптимальное управление одним классом непрерывных технологических процессов. Динамика неоднородных систем. Сборник трудов. Вып 14. М.: Всесоюзный научно-исследовательский институт системных исследований. 1988 Г., С. 105-110.
I. Шумский В.М., Кузьмин С.Т., Шумский A.B. Моделирование . алгоритма управления технологическим процессом смешения бензинов. Нефтепереработка и нефтехимия No 2, 198Э г., С. 34-37.
Шумский В.М., Кузьмин С.Т., Шумский A.B. Моделирование алгоритма управления технологическим процессом смешения бензинов. Нефтепереработка и нефтехимия No 8, 1989 г., С. 29-34.
6. Шумский В.М., Шуйский A.B. Нижняя граница точности оценивания ненаблюдаемых показателей качества по данным' пассивного эксперимента с учетом динамики в измерительных каналах. - В кн. Тезисы докладов IX Всесоюзной конференции "Планирование и автоматизация экспериментов в научных исследованиях", .Часть 1 Москва, 1989, С. 152-153.
Личный вклад В совместных работах Шумсккм A.B. сделано следующее: в [3] предложена стратегия субоптимального управления. в [4] и [5] разработано соответствующее программное обеспечение в проведено имитационное моделирование алгоритмов управления; в [6] построена икгняя граница среднеквадратичной ошибки оценивания.
3tx.S2. Тир. 100.
117806, Москм, ГСП-7, Профооизны, 65 Институт цроблем упрылсикя
-
Похожие работы
- Разработка методов и вычислительных алгоритмов реализации и идентификации стохастических билинейных систем
- Разработка общей билинейной окрестностной модели, алгоритмов идентификации и функционирования систем на основе матрицы структуры
- Разработка билинейных окрестностных моделей и алгоритмов смешанного управления аэрационными системами очистки сточных вод
- Задача оптимального управления для билинейных динамических систем с терминальным квадратичным функционалом
- Разработка и реализация эффективных численных методов моделирования и оптимизации на основе метода моментов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность