автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методы идентификации стохастических систем на основе линеаризованных представлений входо-выходных моделей

кандидата физико-математических наук
Чернышев, Кирилл Романович
город
Москва
год
1998
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Методы идентификации стохастических систем на основе линеаризованных представлений входо-выходных моделей»

Текст работы Чернышев, Кирилл Романович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

////У // V &/7 £.7

/¿/¿7 //£?(7 ¡У ту ' ^

ИНСТИТУТ ПРОБЛЕМ УПРАВЛЕНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК

на правах рукописи ЧЕРНЫШЕВ КИРИЛЛ РОМАНОВИЧ

УДК 681.511

МЕТОДЫ ИДЕНТИФИКАЦИИ СТОХАСТИЧЕСКИХ СИСТЕМ НА ОСНОВЕ ЛИНЕАРИЗОВАННЫХ ПРЕДСТАВЛЕНИЙ ВХОДО-ВЫХОДНЫХ МОДЕЛЕЙ

(Специальность 05.13.01 - «Управление в технических системах»)

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата физико-математических наук

Научный руководитель кандидат технических наук Ф.Ф. ПАЩЕНКО

Москва -1998

Оглавление

Введение 4 Глава 1 Анализ методов идентификации нелинейных динамических

стохастических систем 9

1.1. Общие представления нелинейных систем 10

1.2. Идентификация моделей с блочной структурой 11

1.3. Идентификация полулинейных систем с параметрами, 22 зависящими от переменных

1.4. Идентификация линейных по параметрам нелинейных 24 динамических систем

1.5. Выводы и постановка задачи 40 Глава 2 Непараметрическая идентификация на основе состоятельных

мер зависимости случайных процессов 46

2.1. Идентификация одномерных систем 46

2.2. Свойства максимальной корреляционной функции 56 и существование оптимальных операторов

2.3. Специальные классы систем 62

2.4. Доказательство теоремы 2.1 74

2.5. Выводы по главе 79 Глава 3 Расширение методов статистической линеаризации 82

3.1. Представления линеаризованных моделей 82

3.2. Критерий минимума нормы ошибки линеаризации 89

3.3. Системы с несколькими входами 94

3.4. Критерий совпадения норм выходов 98

3.5. Стационарные системы и оценки дисперсионных функций 99

3.6. Выводы по главе 106

Глава 4 Представления и состоятельность рекуррентных алгоритмов 108 параметрической идентификации

4.1. Задача параметрической идентификации 108

4.2. Выбор алгоритмов идентификации 114

4.3. Алгоритмы идентификации 118

4.4. Специальные случаи 130

4.5. Доказательство некоторых утверждений 132

4.6. Выводы по главе 141 Выводы по диссертации 142 Литература 143

ВВЕДЕНИЕ

Задача идентификации систем играет существенную роль при исследовании объектов управления и протекающих в них процессов. Эта роль заключается, главным образом, в построении математической модели системы по наблюдениям значений ее входных и выходных сигналов. Необходимость повышения эффективности моделирования и создания систем управления вызвали за последние десятилетия значительный прогресс собственно методологии идентификации систем. При этом первоначально методы идентификации и управления системами основывались на применении линейных моделей, в то время как большинство объектов управления, исследование которых диктуется целями практического применения, являются в той или иной степени нелинейными. Данное обстоятельство, естественно, не исключает принципиальной возможности линейного описания таких систем при условии, что их поведение на некотором суженном классе протекающих в этих системах процессов может моделироваться в рамках линейного подхода. Однако, только нелинейные модели могут достаточно адекватно отражать процессы, протекающие в нелинейных системах, на всей области их изменения.

Поскольку поведение различных нелинейных систем имеет существенные различия, вызванные сложностью и многообразием протекающих в них процессов, одной из главных трудностей в этой области является создание наиболее общего математического подхода к решению задачи идентификации нелинейных систем. В числе первых при этом возникает проблема выбора класса моделируемых систем, особенно в условиях ограниченного объема адекватной априорной информации. Правильность выбора модели играет существенную роль в решении вопросов дальнейшего применения математической модели, например в задачах прогнозирования и управления.

В настоящее время можно выделить два главных направления в развитии методов идентификации нелинейных систем. Первое из них заключается в выделении некоторых специальных классов моделей. Второе направление связано с применением общего описания моделируемых процессов. В свою очередь, в рамках первого направления существует множество различных подходов, наиболее развитые из которых опираются на применение: моделей с блочной структурой, получаемых с помощью комбинации нелинейного статического и линейного динамического звеньев. Примерами такого описания являются хорошо известные модели классов Гаммерштейна, Винера, Винера-Гаммерштейна; полулинейных моделей, описание входо-выходных отображений в которых осуществляется с помощью соотношений, линейных по параметрам, которые в свою очередь, зависят от переменных модели; моделей, описываемых нелинейными дифференциальными (разностными) уравнениями, линейными по параметрам. Такие модели используются при наличии достаточного объема априорной информации о внутренней структуре объекта.

Методы построения моделей, используемых в рамках второго направления решения задачи идентификации нелинейных объектов, основаны либо на применении функциональных рядов Вольтерра или Винера, либо на применении теоремы Вейерштрасса-Огоуна, согласно которой любая непрерывная на заданном интервале действительная функция является пределом некоторой равномерно сходящейся последовательности многочленов. В этом последнем случае все подходы в рамках данного направления как в задачах с непрерывным, так и в задачах с дискретным временем, предполагают построение полиномиальных моделей, линейных по параметрам.

Главным достоинством моделей специальных классов является относительное удобство их применения для идентификации нелинейных систем. Однако подобные подходы имеют и определенные общие для всех классов моделей недостатки. Первый из них заключается в том, что модели специального

класса имеют соответствующий каждому такому классу достаточно узкий круг нелинейных объектов, описываемых ими. Второй недостаток состоит в том, что при использовании данных методов внутренняя структура входо-выходного отображения систем предполагается хорошо известной.

Однако во многих случаях, когда объем подобного рода априорной информации об объекте мал, либо такая информация отсутствует, целесообразно ослабить зависимость результата решения задачи идентификации от ограничений, накладываемых априорными предположениями. При этом выбор модели объекта должен диктоваться ее гибкостью, то есть способностью модели описывать достаточно широкий класс нелинейных систем. По этим причинам для широкого класса нелинейных объектов возникает проблема создания возможно более общего и, соответственно, унифицированного подхода к их идентификации и моделированию.

Цель работы

Цель данной диссертационной работы состоит в разработке методов решения задач непараметрической и параметрической идентификации моделей нелинейных динамических стохастических систем в условиях, когда объем знаний об исследуемой системе может изменяться в широких пределах -от отсутствия информации о структуре системы в целом до неопределенностей значений параметров модели системы.

Актуальность работы

Актуальность настоящей диссертационной работы определяется результатом приведенного анализа значения разработки методов идентификации нелинейных систем и состояния данной проблемы:

Успех решения задач идентификации и управления нелинейными системами самым существенным образом зависит от выбора модели, которая

используется для представления системы в процессе ее исследования. Для решения этой задачи предложены разнообразные подходы. При этом в большинстве разработанных методов предполагается, что так называемая истинная структура системы принадлежит какому-либо определенному классу структур, из которого надлежит выбрать модель исследуемой системы. Однако с практической точки зрения подобные априорные предположения представляются трудно применимыми, что обусловливает необходимость выбора такой модели, или структуры системы, которая дает удовлетворительную в определенном смысле аппроксимацию характеристик системы, представляющих интерес в каждой конкретной постановке задачи.

Научная новизна работы

Научная новизна данной диссертационной работы состоит:

• в разработке нового метода непараметрической идентификации моделей не линейных динамических систем на основе состоятельных мер зависимости случайных процессов, построения общих условий идентифицируемости нелинейных систем при помощи данного метода. При этом предлагаемый в настоящей работе метод идентификации является естественным развитием линейного метода Винера-Хопфа на случай идентификации нелинейных систем;

• в развитии методов статистической линеаризации на основе подхода, использующего методы теории функциональных пространств. При этом преодолевается тот известный недостаток корреляционного подхода к статистической линеаризации, который связан с применением взаимных корреляционных функций в качестве мер стохастической зависимости входных и выходных процессов системы;

• в разработке сильно состоятельных рекуррентных алгоритмов адаптивной идентификации линейных по параметрам динамических систем при широких предположениях относительно внешних аддитивных возмущений.

Алгоритмы, получаемые таким образом, не используют обращения матрицы Гессе критерия идентификации и устойчивы как изменению ее степени обусловленности, так и степени автокоррелированности возмущений.

Настоящая работа состоит из четырех глав. Для нумерации формул принята трехпозиционная нумерация: первая позиция - номер главы, вторая -номер параграфа в данной главе, третья - порядковый номер формулы в данном параграфе. При ссылке на формулу внутри одного параграфа указывается только номер этой формулы; при ссылке на формулу из другого параграфа той же главы указываются только номер параграфа и номер формулы; при ссылке на формулу из другой главы указывается полная нумерация.

Глава 1

АНАЛИЗ МЕТОДОВ ИДЕНТИФИКАЦИИ НЕЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СТОХАСТИЧЕСКИХ СИСТЕМ

По сравнению с линейными системами, для которых известно множество методов идентификации как по накопленным данным, так и для случая текущих наблюдений [10, 153], обладающих достаточной степенью универсализации, применимость теоретические методы идентификации нелинейных систем обычно существенно ограничена классом исследуемых систем. При этом существуют различные алгоритмы, область использования которых варьируется от задач идентификации нелинейных систем на основе их наиболее общих представлений - в виде функциональных рядов [2, 34, 115]-до задач, допускающих применение методов, разработанных для линейных систем и применимых в таких случаях, как, например, системы Гаммерштейна [182].

Алгоритмы идентификации нелинейных динамических систем следует рассматривать в соответствии с классами моделей и методов получения данных наблюдений. В основном в качестве таких классов нелинейных моделей выделяются [44, 109, 132]:

• модели, получаемые на основе общих представлений входо-выходного отображения с помощью рядов Вольтерра и Винера;

• модели с блочной структурой;

• полулинейные модели с параметрами, зависящими от переменных системы;

• линейные по параметрам модели.

Кроме того, самостоятельное направление образуют методы исследования адекватности получаемой модели практически используемой

нелинейной системе [58, 148]. При этом на практике первичную задачу, связанную с идентификацией нелинейных систем, представляет собой выяснение того, является ли данная система линейной или нелинейной. Соответствующие методы известны как "тесты на нелинейность" [22, 56, 58].

1.1. Общие представления нелинейных систем

Ряды Вольтерра. Для общего класса нелинейных систем не существует унифицированных методов идентификации. Во многих работах рассматриваются представления входо-выходного отображения входного процесса и(т), ге(-оо;/) в выходной процесс у(/) на основе функциональных рядов Вольтерра

со

Х0 = £ {••■ ¡И„(т1}...,тп)и&- г,)..2/(7 - тп)атх..Ятп

п=1

где кп - ядро Вольтерра порядка п. Идентификация систем на основе такого представления сводится к оцениванию ядер Вольтерра. Соответствующие методы идентификации разработаны как для детерминированных, так и для случайных входных процессов [36, 177]. В то же время, представление с помощью рядов Вольтерра справедливо, вообще говоря, для систем с аналитическими нелинейностями [62, 174]. Тем самым, для многих нелинейных систем, содержащих элементы, описываемые нелинейными разрывными функциями, не существует адекватного представления с помощью рядов Вольтерра при любом входном процессе. В то же время для идентификации некоторых видов разрывных нелинейностей было предложено использовать их разложение в ряд Вольтерра-Фурье [38].

Ряды Винера. Другое представление выходного процесса системы

п= 1

где Сгл - некоторые функционалы известного вида, но содержащие неизвестные ядра кп, было введено Винером [2]. В этом случае в предположении гауссовости и белошумности входного процесса, должны быть определены ядра Винера кп [34, 143, 200]. В условиях, когда входной процесс не является ни гауссовским, ни белошумным в работе [130] была применена процедура ортогонализации наблюдаемых данных.

1.2. Идентификация моделей с блочной структурой

Модели с блочной структурой состоят из статического нелинейного и линейного динамического звеньев. Такие системы часто встречаются на практике. Системы, содержащие нелинейное статическое звено перед линейным динамическим, принадлежат к классу систем Гаммерштейна описываемых функционалом Гаммерштейна

уЦ) = \ + \g{t - т)т(и(т))(}т,

—СО

Соответственно, системы, в которых линейное динамическое звено предшествует нелинейному статическому, принадлежат к классу систем Винера, рис. 1.1.

нелинейное линейное

статическое звено динамическое звено

а)

линейное нелинейное

динамическое звено статическое звено

б)

Рис 1.1. Модели с блочной структурой:

а) модель класса Гаммерштейна;

б) модель класса Винера.

Системы класса Гаммерштейна

Примеры практических задач, в которых возникают такие системы, включают нелинейную фильтрацию [110], моделирование процессов шума [154], нелинейные сети [73], выделение сигнала на фоне негауссовских помех [158], нелинейное прогнозирование [156, 157], системы подавления помех [184], биологические системы [116, 131], исследование органов чувств - слуховой аппарат [168], зрительный аппарат - [113, 127], системы управления [141], анализ образов [176].

Идентификация систем Гаммерштейна включает оценивание обеих подсистем по наблюдениям входных и выходных процессов всей системы. При этом промежуточный сигнал, связывающий обе подсистемы, обычно предполагается ненаблюдаемым. Такая постановка задачи представлена во многих работах, в частности [7, 8, 50, 52, 53, 64, 71, 86, 87, 112, 117, 118, 142, 160, 187, 189, 192]. Во всех этих работах представлены алгоритмы идентификации обеих подсистем, но без проведения детальных исследований сходимости. При этом относительно нелинейного элемента т(•) предполагалось выполнение такого ограничительного условия, как представимость его в виде многочлена известного порядка L, то есть

т(и) = ахи + а2и2 +...+aLuL ,

где а1,...,а1 - неизвестные параметры. В данных работах оцениваются весовая функция или коэффициенты передаточной функции линейной подсистемы и коэффициенты а1,...,а1 . Однако, если входной процесс не является гауссовским, соответствующие алгоритмы не сходятся [87, 187]. Кроме того, такие процедуры идентификации линейной и нелинейной частей являются взаимно зависимыми, то есть параметры одного звена рассматриваются в качестве заданных констант при идентификации другого звена.

Идентификация линейного динамического звена легко осуществима с помощью корреляционных соотношений, и основную задачу при построении систем Гаммерштейна составляет идентификация нелинейного безынерционного звена в условиях, когда его вид не ограничивается предположениями, подобным приведенным выше [102]. За последнее время в целом ряде работ предложены методы идентификации. применимые к широкому классу нелинейностей систем Гаммерштейна. Отмечая тот факт, что нелинейное звено может быть выражено как условное математическое ожидание выходного процесса относительно входного, в работе [161] предложен и исследован алгоритм идентификации на основе оценивания регрессионной функции с помощью гистограмм.

Большое место в непараметрических методах идентификации систем Гаммерштейна занимает применение ядерных оценок функции регрессии. Эти оценки впервые были предложены [11] и [196]

т(и) -

где К - некоторая ядерная функция в Я'1, [/?(/?)] - убывающая к нулю последовательность положительных чисел, г = 0,1,... - взаимно

независимые пары наблюдений. Отношение % рассматривается как 0. В работе

0

[78] предложена модификация данной оценки для рекуррентного оценивания по текущим наб�