автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Интегральные операторы наблюдения и идентификации динамических систем

доктора физико-математических наук
Заика, Юрий Васильевич
город
Санкт-Петербург
год
1998
специальность ВАК РФ
05.13.16
Диссертация по информатике, вычислительной технике и управлению на тему «Интегральные операторы наблюдения и идентификации динамических систем»

Текст работы Заика, Юрий Васильевич, диссертация по теме Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)

• к/~ /

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПЕТРОЗАВОДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

Заика Юрий Васильевич /

-- сЛл,

ИНТЕГРАЛЬНЫЕ ОПЕРАТОРЫ НАБЛЮДЕНИЯ И ИДЕНТИФИКАЦИИ ДИНАМИЧЕСКИХ СИСТЕМ

05.13.16 — применение вычислительной техники, математического моделирования и математических методов в научных исследованиях

Диссертация на соискание ученой степени доктора физико-математических наук

Научный консультант:

доктор физико - математических наук,

профессор, член.-корр. РАН Зубов В.И.

Санкт-Петербург — 1998

- 2 -Оглавление

ВВЕДЕНИЕ............................... 5

ГЛАВА 1. Интегральные операторы наблюдения и прогнозирования нелинейных систем................ 21

§1. Постановка задачи...................... 21

§2. Сопряженная задача управления и наблюдение по конечному числу моментов.................... 28

§3. Описание множества достижимости Вт с помощью

функциональных рядов................... 46

§4. Частные способы построения управлений в сопряженной

системе.................................69

§5. Нелинейные интегральные операторы наблюдения ... 86 §6. Интегральные операторы идеального наблюдения .... 94

§7. Построение стабилизирующего управления с помощью

интегрального оператора прогнозирования ........ 104

ГЛАВА 2. Оценка функционалов на решениях возмущаемых систем с запаздыванием по неполной обратной связи . . 114

§1. Постановка задачи.......... ..................114

§2. Необходимые представления функционалов задачи . . . 119 §3. Интервальные оценки возможных значений функционала 3...................................124

§4. Локально оптимальные интегральные операции наблюдения .............................136

§5. Метод малого параметра в случае параметрического возмущения ...................................146

ГЛАВА 3. Идентификация модели переноса газа сквозь мембраны с динамическими граничными условиями .... 153

§1. Постановка задачи......................153

§2. Методика экспериментов и модель измерений......157

- з -

§3. Математическое обоснование модели...........160

§4. Численный метод идентификации модели ........194

§5. Метод концентрационных импульсов.......... . 224

ЗАКЛЮЧЕНИЕ ............................233

ЛИТЕРАТУРА ............................ . 234

Основные обозначения

(/,#)- наблюдаемая динамическая система, где /- правые части уравнений движения (х = /(¿,ж)), у = уравнение измерений; 11т- область неопределенности начальных данных ({х(Т)} = 11т); у(-]х,Т)~ функция измерений у(Ь) = на отрезке времени [О,Г], параметром служит искомый фазовый вектор х = х(Т) £ 11т', От = {г;(Г, •) : 11т М1}- множество достижимости сопряженной к (/,#) системы управления ^ + г;ж/ = > г;(0,ж) = 0;

= г-я производная д вдоль поля /; <8>- прямое (кронекерово) произведение матриц;

Мг = Мп х /г>, 0], Мп)- фазовое пространство системы с запазды-

вающим аргументом;

щ- фазовый вектор системы с запаздывающим аргументом, щ =

(®(0,®«(-))€М2, «((0) = ®(* + 0), 0е[-м];

возмущения правых частей уравнений движения и ошибки измерений;

Т*- сопряженный оператор к оператору сдвига Т : Мч —» Мг, Тжо = жл, для однородной системы с запаздыванием;

..., матрица Грама элементов ТДС- метод термодесорбционной спектрометрии; I), оц, <7, 6, коэффициенты диффузии водорода, взаимодействия с ловушками, равновесия поверхностной концентрации с объемной, десорбции, прилипания из газовой фазы к поверхности; До,..., Еа- соответствующие энергии активации; с(£, ж), конценхрация растворенного (атомарного) водо-

рода в металле, концентрация захваченного в ловушках диффузанта, концентрации на входной и выходной поверхностях мембраны;

давление газа с входной и выходной сторон мембраны; J(t)- десорбционный поток водорода с поверхности мембраны.

- 5 -Введение

Работа посвящена проблемам наблюдения, оценивания и идентификации динамических систем, моделируемых дифференциальными уравнениями. Эта область математики (обратные задачи) чрезвычайно обширна. Неполное представление о направлениях исследований можно получить по приведенному списку литературы. В нем отражены лишь те работы, которые в той или иной мере использовались автором в процессе работы над излагаемым материалом.

Целью работы является развитие теории и применение интегральных операторов восстановления по неполной обратной связи неизвестных априори значений заданных функционалов (в частности, компонент фазового вектора, параметров уравнений движения). При наличии в модели неконтролируемых возмущений речь, естественно, идет не о точном восстановлении, а об оценивании. Использование интегральных операций обработки измерений и их описание в терминах сопряженных задач управления приводит к определенной помехоустойчивости вычислительных алгоритмов и возможности применения техники математической теории управления. В линейной теории динамических систем двойственность задач наблюдения-оценивания и управления является известным фактом. Ниже рассматриваются в основном нелинейные задачи. Вероятностные аспекты по существу не затрагиваются. Значительное внимание уделяется алгоритмической стороне излагаемых методов.

Актуальность исследований. Математическое моделирование является одним из наиболее интенсивно развивающихся направлений научных исследований. Как правило, параметры моделей неизвестны, априори имеются лишь грубые оценки. Экспериментальная информация обычно носит косвенный характер. Следовательно, необходимы математические методы, позволяющие корректно с вычислительной точки зрения обрабатывать информацию с целью уточнения моде-

лей. В общей постановке трудно рассчитывать на создание какой-либо универсальной конструктивной теории. Усилия сосредоточены на разработке конкретных классов задач, важных для приложений.

В работе рассмотрены задача наблюдения фазового состояния нелинейных динамических систем по неполной обратной связи на конечном (фиксированном) отрезке времени, методы оценивания функционалов на решениях систем с запаздыванием в условиях неопределенности начальных данных и неконтролируемых возмущений в уравнениях движения и измерений, модели (и алгоритмы их идентификации) процесса переноса водорода сквозь конструкционные материалы с учетом физико-химических процессов на поверхности и обратимого захвата ловушками (неоднородностями структуры материала). Для первых указанных задач развиваются качественная теория интегральных разрешающих операторов и вычислительные методы. Исследуемые математические модели переноса водорода не относятся к классическим. Интерес к проблеме взаимодействия водорода и его изотопов с металлами и полупроводниковыми материалами носит многоплановый характер. Достаточно упомянуть задачи энергетики, защиты конструкционных материалов от водородной коррозии (водородного охрупчивания металлов), проектирования химических реакторов, ракетостроения, вакуумной техники и технологии. В частности, поскольку в термоядерных реакторах предполагается использовать радиоактивный изотоп водорода — тритий, то возникает проблема возможных диффузионных утечек трития и его накопления в первой стенке реактора. Рассматриваются и другие перспективы использования водорода в качестве энергоносителя. Опыт показывает, что наряду с диффузионными, определяющее значение имеют адсорбционно-десорбционные процессы. Их моделирование приводит к динамическим граничным условиям. Необходимы математическое обоснование соответствующих краевых задач математической физи-

ки и алгоритмы идентификации моделей по экспериментальным данным. Это позволяет не только решать задачу выбора конструкционных материалов, но и уточнять физические представления о моделируемом процессе.

Перейдем к краткому содержанию работы.

Предметом первой главы является задача вычисления (наблюдения и прогнозирования) фазового состояния нелинейных динамических систем по неполной обратной связи. Закон движения и доступная информация о движении моделируются уравнениями

dx/dt = /(i,œ), у = g(t,x), f : W IT, g : W Rm

Из возможных постановок задач наблюдения-оценивания остановимся на следующей: построить операцию восстановления фазового вектора х(Т) G Ut по информации y(t) = g(t,x(t)), t G [О,Г]. Здесь Ut - заданная априори подобласть Rn допустимых значений ж(Т), начальные данные неизвестны, отрезок наблюдения [О,Т] фиксирован. Теория асимптотических наблюдателей в работе не затрагивается.

В специальной литературе достаточно подробно исследованы различные задачи линейной теории наблюдения, оценивания и идентификации, в том числе и при наличии последействия [1,7, 10, 11, 25, 26, 30-35, 37-42, 46, 47, 68-74, 77, 80, 82, 85, 91, 98, 100, 101, 103, 106, 112-118, 120-122, 124, 126, 128-131, 145, 150]. Нелинейная теория в алгоритмическом плане менее разработана, что связано со значительными математическими трудностями решения подобных обратных задач [4, 12, 15-17, 31, 47, 52-64, 70, 71, 78-82, 87, 88, 94, 95, 106, 132-134, 137-141, 146].

Из всего многообразия результатов отметим работы Н.Н. Красов-ского [100], В.И. Зубова [47], Н.Е. Кирина [77-83], М.С. Никольского [121-122], Y. Inoye [188] и К.Е. Старкова [137-141] , которые послужили для автора отправной точкой и основным ориентиром исследований первой главы.

Развиваемый в главе метод нелинейной теории наблюдаемости динамических систем состоит в построении для нелинейного случая аналога теории двойственности Р. Калмана - Н.Н.Красовского. Таким образом, задача понимается не столько в смысле поиска критериев наблюдаемости, сколько в построении разрешающих операций. В дальнейшем удобно проводить аналогию с линейным случаем [100].

Пусть уравнения модели линейны: йх/М = у = С{1)х. Опре-

делим сопряженную систему управления

= + <?(<Ж0. У(0) = о.

Множество достижимости И? = (У(Т)} дает описание всех наблюда-мых по у : [0,Т] —>• М.т проекций Ых(Т) : К Е От. Соответствующее вектору к управление к(-) определяет интегральный оператор восстановления проекции:

Ъ!х{Т) = [Т к\т)у(т)(1т ЩТ) е мп. «У о

Пара (?) полностью наблюдаема тогда и только тогда, когда сопряженная система полностью управляема.

Обобщение этого подхода на нелинейный случай, предложенное Н.Е. Кириным [78, 79] состоит в описании наблюдаемых "нелинейных проекций"

ф(т)) = ¡отк(тМт))<1т щт) е ит

в терминах множества достижимости Дг = {г>(Т, •) : 17т —> К1} сопряженной распределенной системы

- /(Ь,х) = к(1,д^,х)), у(0,х) = 0.

В операторных обозначениях ей можно придать "стандартный вид" линейной системы управления (но уже не в Еп, а в функциональном пространстве). Построение интегрального оператора восстановления

ip(x(T)) по y(') эквивалентно решению выбором к(-, •) задачи управления: v(T, •) = (р.

Отметим, что нелинейная задача построения операции восстановления х(Т) по у(-) для области Ut С М.п является по существу распределенной. Поэтому возникновение уравнения в частных производных естественно, если не ограничиваться лишь установлением самого факта наблюдаемости. Важно, что это уравнение линейное по паре (k,v) и имеется возможность применения более развитых теории управления, численных методов решения линейных граничных задач. В самом общем виде этот подход имеет глубокие корни . Достаточно обратиться к работам В. И. Зубова и, в конечном итоге, к идеям второго метода A.M. Ляпунова исследования устойчивости движения. Уместна и некоторая аналогия с методом динамического программирования Р. Беллмана. Предметом теории является изучение поведения функций (функционалов) на траекториях динамических систем.

В работах [70, 78-83] можно найти развитие и различные обобщения такого подхода на задачи оценивания и управления в общих динамических системах, в моделях с запаздыванием, неконтролируемыми возмущениями, с дискретным временем, с частными производными. Спектр исследований здесь достаточно широк. Что касается места результатов первой главы представленной диссертации в этом спектре, то, кратко говоря, на базе аппарата многомерного комплексного анализа построена аналитическая теория метода для класса вектор -функций голоморфных по фазовым переменным. При этом функция измерений y{t) = g(t,x(t)) может быть недифференцируемой.

Первый параграф содержит постановку задачи и определения. Во втором приведены полученные автором критерии наблюдаемости по конечному числу проекций (моментов) (к, у) — (k,y)i2. Практическая реализация вычислений требует "конечного" представления измерений у(-). Поэтому с вычислительной точки зрения принципиален

следующий вопрос. Не происходит ли потеря информации о х(Т) при сужении у(-) до значений конечного числа функционалов Jj(y(-))?

В работе Y.Inoye [188] показано, что если /, g стационарны, полиномиальны и пара (f,g) наблюдаема, то х(Т) однозначно определяется по конечному числу производных выхода у(-) в момент Т. В [138] К.Е. Старковым этот результат обобщен (локально в Ut) на случай вещественных аналитических /, д. Задача выбора конечного числа замеров y(U) для определения х(Т) в наблюдаемой стационарной аналитической системе (/,<?) рассматривалась в [87, 97, 106, 141]. В частности, в работе К.В. Козеренко [97] показано , что , в принципе , достаточно ограничиться 2п + 1 замером y(U), г — 1, 2п + 1. Алгоритмическая "составляющая" проблемы в этих работах не является первостепенной. Использование на практике измерений лишь в заранее фиксированных моментах времени и особенно производных может привести к некорректной процедуре вычисления х(Т). Автором в §2 исследован вопрос о применении интегральных операций обработки измерений, как более "устойчивых" при наличии возмущений в каналах связи. Доказано, что из любой полной в L^ системы вектор-функций можно выделить такие к\,... ,кр, что "усечение" у(-) до значений конечного числа моментов г = 1 не приводит к

потере информации о х(Т) (теоремы 2,3). Этот результат справедлив для произвольного компакта M С Ut-

Если не ограничивать принадлежность к(-) фиксированной заранее (удобной по техническим соображениям) полной в Х2 системе вектор-функций, то справедливо следующее утверждение (теорема 4): аналитическая по фазовым переменным пара (/, д) наблюдаема в области Ut тогда и только тогда, когда найдутся такие ki G С([0, Т], К7"), что

((¿О, У ),..., (¿2«, У» *>х(Т) 6 ит.

Таким образом, в принципиальном плане в алгоритме восстановления х{Т) вместо "континуальной" информации у(-) можно опериро-

вать 2п + 1- мерным вектором проекций (к{,у), г = 0,2п.

Далее, в терминах множества достижимости Бт сопряженной системы описаны наблюдаемые и прогнозируемые компоненты (р(х(Т)) пары (/, д). При этом вместо понятия линейной используется понятие функциональной зависимости.

Поскольку восстановление х(Т) сводится к решению системы уравнений вида х) = (к1,у), то необходимо аналитическое описание элементов множества достижимости Бт как функций ж. Этот вопрос исследуется в §3. Вначале описана техника степенных рядов. Здесь можно провести полную аналогию с линейным случаем - только соответствующие матрицы коэффициентов становятся бесконечномерными. В стационарном случае на базе теории ростков аналитических функций получено (вообще говоря, локальное) представление элементов Дг (теорема 7):

у(Т,х) = (То(х)Ьо(х) + ... + <тр-1(х)Ьр-1(х),

где вектор-функции Ь^х) (£0 = д, — (¿¿)ж/) - не что иное, как "столбцы матрицы управляемости" сопряженной системы. Это представление конечно, хотя коэффициенты а{ являются специальными функциями. В классе постоянных коэффициентов в общем случае такое разложение возможно лишь при р = +оо в форме ряда. Результат обобщает известный факт в линейной теории (/ = ^сс, д = (Уж, Ь{(х) = v(t,x) = У'(£)ж): множество достижимости {У(Т)}

описывается как линейная оболочка столбцов матрицы управляемости (С, ..., Р'п~1С). Но в отличие от конечномерного (линейного) случая "столбцы матрицы управляемости" Ь^ = Ь^д сами не принадлежат множеству достижимости Ит-

В заключение §3 решена (на качественном уровне) задача о локальной устойчивости свойства однозначности определения х(Т) по конечному числу моментов при малых возмущениях /сД ) (те-

орема 8).

Следующий §4 посвящен в основном технической стороне дела -частным способам построения весовых элементов к(-) в интегральных операциях обработки измерений (к,у}. При этом в силу описанного принципа двойственности вектор-функции к(-) интерпретируются как управления в сопряженной системе, что позволяет использовать алгоритмы теории управления. В теореме 11 получен критерий принадлежности заданной функции множеству достижимости Д^. Для задачи прогнозирования (у(-)|д х(Т), А = [0,«], в < Т) необходимо считаться с дополнительным ограничением = 0, £ 6 Т7].

В общем случае система уравнений ^(Т,х) = для определе-

ния х = х(Т) может оказаться весьма сложной. Поэтому естественно попытаться за счет расширения множества управлений в сопряженной системе до нелинейных к(Ь,у) "максимально" ее упростить. В §5 рассмотрен класс нелинейных /, д (ограничения касаются коэффициентов разложения в степенные ряды), для которых возможно построение к(^,у) в форме сходящихся степенных рядов по у из условий

= ^ ^(т,у(т))^т, г = 17гг.

Таким образом, применение нелинейного интегрального оператора обработки измерений сразу дает компоненту фазового вектора (в окрестности сходимости рядов).