автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Информационная технология построения математических моделей динамических объектов
Автореферат диссертации по теме "Информационная технология построения математических моделей динамических объектов"
На правах рукописи
1 О - '»■ >.":--> I с >■■■■■>
МАРКОВСКИЙ Михаил Валентинович
Информационная технология построения математических моделей динамических объектов
05.13.01 - управление в технических системах 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов, систем и сетей
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Автор: ^ Научный руководитель:
^ . доктор технических паук, профессор
Чалый Виктор Дмитриевич
Москва, 1997 г.
Работа выполнена в Московском государственном инженерно-физическом институте (техническом университете).
Научный руководитель:
Официальные, оппоненты:
Ведущая организация:
доктор технических наук, профессор Чалый В.Д.
доктор технических наук, профессор Александров В.М. кандидат технических наук Кудрявцев К.Я.
ГосНИИЛС
Защита состоится " 4 " 1997 г. в час. па заседании
диссертационного совета Д053.03.04 в МИФИ но адресу: 115409, Москва, Каширское шоссе, д.31, МИФИ, тел. 323-9157, 324-8498.
С диссертацией можно ознакомиться в библиотеке МИФИ.
1997 г.
// /V/
Автореферат разослан I " ** /
Просим принять участие в работе совета или прислать отзыв в одном экземпляре, заверенный печатью организации.
Ученый секретарь диссертационного совета доктор технических наук, профессор
Вольфенгагеи В.Э.
Подписано и печать ¿-i.Di.gj Заказ ¿З*- Тираж 30 экз
Типография МИФИ, Каширское шоссе, д. 31.
Общая характеристика работы.
Актуальность темы.
Формирование моделей на основе информации о поведении объектов и исследование их свойств представляет, по существу, основное содержание науки. Совокупность методов, с помощью которых производится получение, преобразование, обработка и использование информации об исследуемых объектах в заданной предметной области, объединяется под общим понятием "информационная технология".
Характерной особенностью многих объектов и процессов является зависимость текущих значений выходных координат не только от текущих значений входных воздействий, но и от предыдущих значений выходных координат и входных воздействий. Такие объекты называются динамическими. Для математического описания динамических объектов используются системы дифференциальных уравнений, а также модели, полученные па их основе. Сущность информационной технологии построения математических моделей динамических объектов заключается в преобразовании информации о динамическом объекте, представленной в форме последовательностей экспериментальных данных о его состоянии, различных для разных начальных условий, в компактную форму системы дифференциальных уравнений. В основе технологии лежат математические методы построения моделей динамических объектов.
Математические методы моделирования динамических объектов активно развиваются с конца 50-х годов. Большой вклад в разработку методов идентификации динамических объектов и управления внесли отечественные ученые Л.С.Понтрягин, А.Н.Колмогоров, В.В.Солодовников, В.В.Семенов, Н.Н.Красовский, А.А.Воронов, Н.С.Райбман, В.М.Чадеев, Я.З.Цыпкин, А.А.Красовский, Б.Н.Наумов, С.В.Емельянов, Ю.В.Леиник, В.В.Налимов, К.А.Пупков и многие другие. Среди зарубежных ученых большую роль в развитии методов построения математических моделей динамических объектов, оценки их параметров и состояния сыграли Р.Беллман, Н.Винер, Г.Кифер, Р.Калман, П.Эйкхофф, К.Острем.Э.Сейдж, Дж.Мелса, Д.Гроп и др.
. Существующие методы построения моделей динамических объектов можно разделить на две группы: непараметрические методы и методы параметрического оценивания.
. Непараметрнческие методы позволяют получить описание динамического объекта в виде весовых и передаточных функций. Эти методы являются классическими и широко используются для определения динамических характеристик объектов. Однако можно отметить и их серьезные недостатки, такие как: применимость только к линейным стационарным объектам или к линейным объектам со слабой нестационарностыо; необходимость генерации специальных входных сигналов; сложность с переходом от весовых или передаточных функций, получаемых в результате применения непарамег-
ричсских методов, к дифференциальным уравнениям, описывающим исследуемый объект.
Методы параметрического оценивания работают с априорно заданной структурой модели. Со времени первой работы Калмана, посвященной вопросам прогнозирования и линейно-квадратичного управления, преобладающим способом описания динамических объектов является описание в пространстве состояний, где моделью объекта является система обыкновенных дифференциальных уравнений первого порядка для вектора переменных состояния, однозначно описывающих состояние динамического объекта.
Широко распространенными и легко реализуемыми на ЭВМ являются регрессионные и градиентные методы, основанные па критерии наименьших квадратов. Эги методы позволяют оценисать параметры моделей на основе экспериментальных данных без использования какой-либо дополнительной априорной информации. Но применение этих методов для оценки коэффициентов дифференциальных уравнений требует знания значений производных, поэтому обычно дифференциальные уравнения сводят к линеаризованными разностными уравнениями, либо заменяют полиномиальными моделями, что во многих случаях неприемлемо.
Существуют методы, позволяющие одновременно оценивать коэффициенты систем нелинейных дифференциальных уравнений и переменные состояния объекта. К ним ■ относится метод квазилинеаризации и метод инвариантного погружения, предложенные в работах Беллмана для решения двухточечных краевых задач. Однако эти методы достаточно сложные и требуют больших вычислительных затрат.
В целом, анализ существующих методов показал отсутствие единой формализованной универсальной технологии, основанной на методах построения моделей динамических объектов по результатам экспериментов, применимой к произвольным линейным и нелинейным динамическим объектам, легко алгоритмизируемой и не требующей больших вычислительных затрат. Следовательно, важной и актуальной задачей является разработка такой технологии.
Автором предлагается новая универсальная информационная технология построения математических моделей произвольных динамических объектов и явлений, определяющая методы получения, преобразования, обработки и использования информации о динамических объектах. Технология основана на математических методах, отличающихся от существующих универсальностью, простотой и надежностью построения математических моделей как линейных, так и нелинейных объектов.
Разработанная авто-ром информационная технология построения математических моделей динамических объектов обеспечивает значительное сокращение экспериментальных исследований в различных областях науки и техники, в особенности при фундаментальных исследованиях, где не открыты законы природы или велики затраты на проведение экспериментов. Использование технологии открывает возможность онтн-
мизацнп объекта, поиска оптимального управления и прогнозирования поведения объекта или явления за пределами экспериментальной области, которая не может быть достигнута или по техническим, или по финансовым соображениям.
Цель работы.
Целыо работы является создание универсальной информационной технологии построения математических моделей динамических объектов па основе экспериментальных данных, обеспечивающей значительное сокращение экспериментальных исследований п различных областях науки и техники, в особенности при фундаментальных исследованиях, где не открыты законы природы или велики затраты на проведение экспериментов.
Достижение указанной цели предполагает решение следующих задач:
- анализ существующих методов построения математических моделей динамических объектов;
- разработка единого представления произвольных линейных и нелинейных динамических объектов;
- теоретическое исследование возможности применения критерия наименьших квадратов для оценки коэффициентов систем дифференциальных уравнений и решение связанной с этим проблемы смещения оценок и вычисления значений производных переменных состояния объекта;
- вывод формул для оценки коэффициентов систем дифференциальных уравнений по экспериментальным данным и разработка методик их применения;
- анализ вычислительной сложности разработанных методов и определение целесообразности применения того или иного метода;
• - формализованное построение универсальной информационной технологии моделирования динамических объектов в виде последовательности этапов получения, обработки и использования экспериментальной информации об объекте;
- программная реализация разработанных методов и создание пакета программ для построения математических моделей динамических объекюв в виде систем дифференциальных уравнений;
- экспериментальная проверка информационной технологии на реальных объектах.
Методы исследования.
В основе выполненных в диссертационной работе исследований лежит использование регрессионных и градиентных методов с оценкой параметров по критерию наименьших квадратов, методов аппроксимации, численного интегрирования, теории матриц, теории систем обыкновенных дифференциальных уравнений, а также различных методов вычислительной математики. Программная реализация разработанных методов основывается на современной технологии объектно-ориентированного программирования.
Научная новизна.
В диссертационной работе автором получены следующие научные результаты:
1. Теоретически обоснована и исследована возможность создания универсальной информационной технологии построения математических моделей произвольных динамических объектов в риде систем дифференциальных уравнений по экспериментальным данным.
2. Разработано единое представление произвольных линейных и нелинейных дина-, мичсских объектов в виде систем дифференциальных уравнений, линейных по коэффициентам, основанное па разделении объекта на статическую нелинейную компоненту и динамическую линейную компоненту.
3. Предложена и теоретически разработана универсальная информационная технология построения математических моделей динамических объектов, определяющая методы получения, преобразования, обработки и использования информации о динамических объектах и явлениях. Дано формализованное описание разработанной информационной технологии в виде последовательности этапов, которые необходимо выполнить для получения математической модели динамического объекта в виде системы дифференциальных уравнений.
4. Обоснована возможность использования критерия наименьших квадратов для оценки коэффициентов систем дифференциальных уравнений. Для минимизации смещения оценок и решения проблемы вычисления значений производных переменных состояния предложено объединить метод наименьших квадратов с методами аппрок-. симации и методами кусочного интегрирования. .
5. Выведены расчетные формулы для оценки коэффициентов систе»-! дифференциальных уравнений на основе экспериментальных данных и разработаны методики их применения.
6. Теоретически исследованы основные виды систем взаимодействия динамических и стохастических объект(?в. Даны рекомендации по выбору структуры соответствующих им систем дифференциальных уравнений и экспериментально измеряемых переменных состояния.
Практическая значимость.
Практическая значимость полученных в работе результатов заключается в следующем:
1. Разработанная информационная технология построения математических моделей динамических объектов позволяет значительно сократить экспериментальные исследования, поскольку экспериментальные данные снимаются только для одного набора начальных условий, по которым строится система дифференциальных уравнений. Дальнейшее исследование объекта осуществляется путем большого числа решений системы уравнений при различных других наборах начальных значений зависимых пе-
ременных состояния объекта. При этом цикл общего исследования может быть сокращен от единиц до нескольких десятков раз, что особенно эффективно для дорогостоящих экспериментов или для объектов, где время проведения опытов велико.
2. Особенностью технологии является возможность построения как линейных, так и нелинейных систем обыкновенных дифференциальных уравнений.
3. Для ранее неисследованных объектов и явлений природы информационная технология позволяет открывать приближенные законы их функционирования, раскрывающие существующие взаимосвязи между элементами объекта.
4. Открывается возможность оптимизации объекта, поиска оптимального управления и прогнозирования поведения объекта или явления за пределами экспериментальной области, которая не, может быть достигнута по техническим или но финансовым соображениям.
5. Созданный на основе разработанных методов пакет программ позволяет синтезировать системы дифференциальных уравнений по экспериментальным данным. Программное обеспечение написано на языке С++ и может быть легко адаптировано под различные платформы.
На защиту выносится:
- единое представление произвольных линейных и нелинейных динамических объектов;
- методы оценки коэффициентов систем дифференциальных уравнений по экспериментальным данным;
- формализованное описание информационной технологии построения математических моделей динамических объектов;
- программная реализация разработанных методов и их экспериментальная проверка. '
Апробация работы.
Основные положения диссертационной работы докладывались и обсуждались на:
- международной математической конференции "Проблемы математики и информатики", Гомель, 1994;
- московской конференции "Студенческая научная осень - 94", Москва, МИФИ, 1994, где автор был награжден дипломом по итогам открытого конкурса;
- международной математической конференции "Алгебра и кибернетика", Гомель, 1995;
- международной конференции "НТИ-96 - Информационные продукты, процессы и технологии", Москва, ВИНИТИ, 1996.
Разработанный пакет программ для построения математических моделей динамических объектов демонстрировался на конференции "Телекоммуникационные системы и
новые информационные технологии в системе лицей-ВУЗ", Москва, МИФИ, 1997, где . по результатам конкурса получил премию и был награжден дипломом.
Публикации.
Полученные в работе результаты изложены в 7 опубликованных статьях.
Структура диссертации.
Диссертация содержит введение, 4 главы, заключение, 2 приложения, 23 рисунка, 28 таблиц. Общий объем - 212 страниц. Список использованных источников литературы содержит 108 наименований.
Содержание работы.
Основой разрабатываемой информационной 'технологии являются математические методы построения моделей динамических объектов. Общая формулировка задачи построения модели динамического объекта по записям результатов его функционирования следующая. Предполагается, что состояние исследуемого объекта однозначно описывается набором переменных состояния, составляющих вектор состояния х(/). На вход объекта воздействует входной сигнал и(/) и внешнее возмущение w(i). а на выходе наблюдается выходной сигнал у(0 (зависящий от состояния объекта), искаженный шумом v(/). Вектор состояния объекта х(/) и связанный с ним наблюдаемый выход объекта у(/) описываются системой
^P = f(x(O,u(í),w(O,P(O,0 y(0 = h(x(0,v(0,p(0)
где р(/) - вектор неизвестных параметров объекта и устройства наблюдения. Эта система является описанием динамического объекта в пространстве состоянии. Решение задачи построения математической модели объекта в пространстве состояний должно включать определение оценки вектора параметров р(/) и вида функций fn h, если они неизвестны.
Помимо описания в пространстве состояний объект может рассматриваться как "черный ящик", связь между входными и выходными сигналами которого выражается в общем случае в операторной форме:
y(O = G(u(/),v(O.P(O.0
где d - оператор связи выхода объекта со входом. Это выражение называется описанием объекта в терминах "вход'выход". Решение задачи построения математической модели объекта, заданного в терминах ""вход/выход", состоит в определении оператора связи G и, если он зависит от вектора параметров р(0, то в оценке этого вектора.
Существует ряд признаков, по которым динамические объекты могут быть разделены на несколько классов. В диссертации рассмотрены следующие виды моделей динамических объектов, соответствующих различным классам объектов: модели линейных динамических объектов; модели, линейные по параметрам; модели нелинейных динамических объектов; модели объектов с распределенными параметрами.
Далее проводится обзор существующих методов построения моделей динамических объектов. Все методы могут быть разделены на непара.четричсские методы и методы параметрического оценивания. Непараметричсские методы основаны на том, что линейные стационарные объекты могут быть описаны своими передаточными функциями и связанными с ними весовыми функциями (импульсными реакциями).
Из непараметрпческнх методов в работе кратко рассмотрены методы получения временных характеристик' объекта (анализ импульсной реакции, анализ реакции на ступенчатое воздействие, определение весовой функции методами корреляционных функций) и методы определения частотных характеристик (частотный анализ, гармонический анализ, корреляционный анализ, спектральный анализ). Непарамстрические методы применимы только к линейным стационарным динамическим объектам или к объектам со слабой нестационарностыо. Большинство из них требуют подачи на объект специальных сигналов, что предполагает проведение активного эксперимента вне режима нормальной работы объекта. Кроме того, переход от весовых или передаточных функций к дифференциальным уравнениям, описывающим исследуедшй объект, далеко не всегда тривиален.
Методы параметрического оценивания осуществляют поиск наилучшей модели среди моделей с априорно заданной структурой посредством решения задачи оценивания параметров. В диссертации рассмотрены регрессионные методы, методы последовательной регрессии, градиентные методы, методы стохастической аппроксимации и обучающиеся модели, метод оценки параметров динамических объектов по областям достижимости, метод квазилинеаризацни и метод инвариантного погружения.
Применение регрессионных и градиентных методов, а также методов стохастической аппроксимации для оценки коэффициентов дифференциальных уравнений требует знания значений производных,, поэтому обычно дифференциальные уравнения сводят к линеаризованными разностными уравнениями, либо заменяют полиномиальными моделями, что во многих случаях неприемлемо. Метод оценки параметров по областям достижимости требует знания границ этих областей. Для сходимости методов квазилинеаризацни и инвариантного погружения необходимо некоторое обоснованное начальное приближение к величинам параметров и порядку величии других начальных условий, при этом процедура оценки требует больших вычислительных затрат.
На основе проведенного анализа существующих методов делается вывод об отсутствии единой формализованной универсальной технологии построения моделей динамических объектов по результатам экспериментов, применимой к произвольным .ш-
иейным и нелинейным динамическим объектам, легко алгоритмизируемой и не требующей больших вычислительных затрат. Отсутствие такой технологии свидетельствует об актуальности темы диссертационной работы, посвященной разработке новой универсальной информационной технологии построения математических моделей произвольных динамических объектов и явлений, основанной на методах, отличающихся от существующих универсальностью, простотой и надежностью построения моделей произвольных объектов.
Универсальность технологии обеспечивается единым представлением произвольных линейных и нелинейных динамических объектов, основанным на модели Гам-мерштейна. Динамический объект представляется в виде суперпозиции статической нелинейной компоненты и динамической линейной стационарной компоненты. Статическая нелинейная компонента осуществляет в общем случае функциональную связь между переменными состояния, управляющими сигналами и независимой переменной I. На выходе статической нелинейной компоненты формируются функции
=17'
{/,к (х(')>и0> которые становятся входными сигналами линейной динамиче-
скои компоненты.
Математической моделью подобного объекта в пространстве состояний является система:
=Ъи.гЛтлоА=ъ^мпмоА
^г=Ъл* (тмФ)=ь1г„(х(о,и(о,0
*=I
(о
где Г,(х(0,и(<).') - /и,--мерная вектор-функция компонент /'-го уравнения системы, а Ь, - п>1 -мерный вектор коэффициентов 1-го уравнения.
Задача построения математической модели динамического объекта формулируется следующим образом. Пусть в результате эксперимента получены значения вектора состояния {х(Г0),х(/1),х(/2)>...,х(/Лг)}> соответствующие значениям независимой переменной /у €[/0,/^]. При этом вектор управления принимал значения {и(/0),и(/1),и(г2)>...,и(/^)}. Кроме того, пусть задано п вектор-функций {^(х(О,и(О,0};_57,> определенных на отрезке н зависящих в общем случае от
х(0> и(/) и I. Необходимо найти оценки {ь,}. ^ векторов коэффициентов дифференциальных уравнений Для которых поведение объекта на отрезке [/0,'л-]
при тех же значениях вектора управления адекватно описывалось бы системой обыкновенных дифференциальных уравнений (1).
В соответствии с теорией подобия, для построения математической модели необходимо привести величины в физических единицах к безразмерным нормированным величинам. Нормирование производится по формулам:
где переменные с символом выражены в физических единицах, а переменные без этого символа являются безразмерными. При таком нормировании значения переменных состояния и управляющих сигналов не выходят за границы отрезка [- 1;]].
Поскольку при проведении эксперимента независимая переменная также измеряется в физических единицах, необходимо перейти к безразмерной переменной:
Г-Л,
Д,
где Д, - определенным образом выбираемый масштаб независимой переменной, -минимальное значение переменной I в физических единицах, /() - минимальное значение безразмерной независимой переменной I. В работе доказана теорема: для системы со стационарными уравнениями сдвиг независимой переменной от <п до /„' коэффициенты не изменяет, а изменение масштаба независимой переменной от А, до Л,'
вызывает изменение коэффициентов уравнений в раз.
Далее в диссертации теоретически разрабатываются методы оценки коэффициентов системы дифференциальных уравнений. Все они основаны на критерии наименьших квадратов. Стандартной формулой оценки коэффициентов 1-го уравнения системы (1) по методу наименьших квадратов является
Ь, = (5)
где Р, - матрица значений компонент вектор-функции Г, (х(/),и(/),/), х, - вектор значений производных переменной состояния х,, \У, - диагональная матрица весов измерений, Ь,- - оценка вектора коэффициентов /-го уравнения системы (I). Число экспериментальных точек должно быть больше либо равным т, + 1.
Использование формулы (5) сталкивается с двумя проблемами:
I. Отсутствие экспериментальных значений производных переменных состояния. В подавляющем большинстве случаев значения производных непосредственно во время эксперимента не измеряются, поэтому их приходится вычислять косвенным образом через значения переменных состояния. От точности вычисления производных в большой степени зависит точность результатов и, следовательно, адекватность полученной модели.
2. Смещение оценок. При наличии ошибок измерений оценка коэффициентов I), оказывается смешенной, поскольку не только вектор х,, но и матрица Р( вычисляется па основе экспериментальных значений переменных состояния, которые могут быть зашумлены.
Автором предлагается использовать аппроксимацию переменных состояния и компонент вектор-функций правой части дифференциальных уравнений системы (1) для вычисления производных переменных состояния и минимизации смешения оценок. Для аппроксимации следует использовать методы, обеспечивающие сглаживание ошибок измерений. При этом оценка коэффициентов системы дифференциальных уравнений производится на основе результатов аппроксимации.
Пусть (0}д._07 " система аппроксимирующих функций, определенных на отрезке [/и,/а {<71 }А д-, " коэффициенты аппроксимации /-й переменной состояния Тогда лг, (/) па отрезке ['о,'у] можно оценить с помощью выражения
*,(') = Ъа Ик (I)
Л =11
Для аппроксимации следует выбирать системы функций, производные которых |Йк могут быть найдены аналитически. В этом случае х:(1) может быть оце-
. иена с помошыо выражения
Ч(0 = Х<71Л(0 • (6)
Пусть также " коэффициенты аппроксимации функции Д(х(/),ц(0,'),
являющейся у-й компонентой вектор-функции {¡(х(1),и(1),^. Тогда Д (0 на отрезке ['о>',\ ] можно оцепить с помощью выражения
(7)
4=0
Процесс оценки коэффициентов системы дифференциальных уравнений по формуле (5) с использованием аппроксимации состоит из следующих этапов:
1. Выбор системы гладких функций {Нк(производные которых могут быть
найдены аналитически.
2. Проведение аппроксимации экспериментальных значений переменных состояния и компонент вектор-функций С,-(х(<),и(/),/) по методу, обеспечивающему сглаживание ошибок и вычисление коэффициентов аппроксимации {<71-}^ ¡р 11 {т9;*^. (| /
(> = и).
3. Вычисление значений производных переменных состояния по формуле (6) и сглаженных значений компонент вектор-функций ^(х(/),и(/),') по формуле (7). Из
этих значений строятся вектора х, и матрицы Р, для /.= 1,//.
4. Оценка коэффициентов каждого из уравнений системы (I) по формуле (5).
Дальнейшим развитием идеи аппроксимации является переход от дискретной формы критерия наименьших квадратов к непрерывной. При этом в формулу для оценки коэффициентов /-го уравнения системы дифференциальных уравнений (I) входят уже не экспериментальные значения, а полученные на их основе коэффициенты аппроксимации:
¿^(р/НР^'У'Сс!,
г ^ l=\Jll1
где Р; - матрица коэффициентов аппроксимации \Р)к]к , компонент вектор-функций Г,(х(/),и(/),/), (], - вектор коэффициентов аппроксимации , пере-
менной состояния .V,, II - матрица скалярных произведений аппроксимирующих функций, в - матрица скалярных произведений аппроксимирующих функций на их производные.
Приведенные выше формулы требуют обращения матрицы, количество элементов которой равно квадрату числа коэффициентов /-го уравнения системы (1). С увеличением числа оцениваемых коэффициентов может возникнуть переполнение разрядной сетки компьютера при обращений мафии. Для того, чтобы этот избежать, используются методы последовательной регрессии и градиентные методы.
Для критерия наименьших квадратов в дискретной форме получена следующая рекуррентная формула последовательной регрессии:
Ь„ = ь„-, + щлмЦх,«,) -
где - значение производной /-й переменной состояния в момент /г,-вычислен-
ное с помощью аппроксимации, ^ (/,) - значение вектор-функции 1"((х(/),н(/),') в момент !г, вычисленное с помощью аппроксимации, <У„. - вес измерении в момент 1г, - оценка коэффициентов по Г - 1 измерениям, Ь(/. - оценка коэффициентов по г измерениям, Z,r - симметрическая матрица, г меняется от 0 до А', а начальные оценки равны
Ь,„ = 0; г,„ =-1, ¿-->0
В процессе вычислений переменная Ъ1Г сходится к оценке 6, коэффициентов ¿-го уравнения системы (1) по методу наименьших квадратов. Для хорошей сходимости необходимо наличие достаточно большого числа экспериментальных точек.
При оценке коэффициентов системы дифференциальных уравнений с помощью последовательной регрессии каждое новое измерение уточняет оценку, сделанную по предыдущим измерениям. При использовании градиентных методов оценка коэффициентов производится сразу по всем измерениям. В работе получен следующий итерационный процесс оценки коэффициентов 1-го уравнения системы (I) градиентным методом при дискретном критерии наименьших квадратов:
ь г1 =6; +/1'р,г\У,.С:1
е;=х,-РХ с начальной оценкой Ь) =/("Г,1 \У,х, .
Так же, как и для предыдущих формул, вектор х( и матрица Р( вычисляются с помощью аппроксимации. Алгоритм выбора шага Л' предлагается следующий. Начальное. значение А0 может быть произвольным числом больше нуля, например, единицей. Значения на следующих итерациях вычисляются по формуле -
^\а-И',а>\, при < | \р-И',Ъ<р<\, лрИ|ф'|сГ!|
Если используется критерий наименьших квадратов в непрерывной форме, то итерационный процесс оценки преобразуется к виду:
Ь'+1 = Ь' + /ГР,тс'] с; = Gq; - НРХ с начальной оценкой 6] = ЛnPIгGq,
Помимо использования аппроксимации автором предлагается еще одни способ решения проблемы вычисления производных переменных состояния и смещения оценок: кусочное интегрирование.
Проинтегрировав каждое уравнение системы (1) на каждом отрезке ] полу-
чим систему алгебраических уравнений
*«(<«)=ЕМ«('/)
<4,
/ = О.М-1 (8)
'1.1
где *,('/)= *|('м)-■*(('/); **('/)= \/,М')М1\1)сН
Оценка bf вектора коэффициентов b¡ /'-го уравнения системы (8) по методу пан-меньших выполняется по формуле
ь,. =(ф1'|ЧУ,Ф1)"'Ф;ЧУ,5,
где 5, - вектор значений £,('/), Ф, - матрица значений ф1к(/,), NV, - диагональная матрица весов измерений переменной состояния x¡ на отрезках ['/,'/+]]. / = О,N - I,
Элементы матрицы Ф, MoiyT быть найдены с помощью какого-либо из способов численного интегрирования.
Рекуррентная формула последовательной регрессии для оценки коэффициентов системы (8) выглядит следующим образом:
b,; = b,>-, + ffl„ZA(o(£,(fr j - ФУ(',)Ь,>-|)
с начальными условиями b,u = 0; Z,„= — I, >0,
£
гдсф|(/г) = [Лч('г) ФаМ ..." ^Cr)]1. •
Итерационный процесс оценки коэффициентов системы (8), основанный на градиентном методе, выполняется по формуле:
. Ь,г+1=ЬГ+/|,Ф(т\У1.еГ1 еГ = 8,-ФХ
с начальной оценкой b'i=h°OjWi8j
В диссертации проведено исследование вычислительной сложности разработанных методов. Для каждого метода получены оценки количества необходимых операций умножения и сложения в зависимости от числа экспериментальных данных, числа оцениваемых коэффициентов и размерности системы аппроксимирующих функций. В результате исследовании установлено, что сложность всех разработанных методов является полиномиальной.
Приведены графики зависимости времени вычисления оценок коэффициентов от числа экспериментальных точек, числа оцениваемых коэффициентов одного уравнения и размерности системы аппроксимирующих функций при использовании разработанных методов оценки. Измерения времени вычисления производились на компьютере Pentium- 100MHz с помощью программы TurboProfiler Ver 4.5 (с) Borland International. Результаты измерений показывают, что оценка коэффициентов системы дифференциальных уравнений на компьютере с процессором Pentium при числе нере-
менных состояния, измеряемом десятками, и числе экспериментальных точек, измеряемом тысячами, занимает время, измеряемое единицами и десятками секунд.
Разработанные методы яь-ляются основой для создания универсальной информационной технология носграсния математических моделей динамических объектов и явлений на основе экспериментальных данных. Сущность технологии заключается в преобразовании информации о динамическом объекте, представленной в форме последовательностей экспериментальных данных о его состоянии, различных для разных начальных условий, в компактную форму системы дифференциальных уравнений. Информационная технология построения математических моделей динамических объектов на основе экспериментальных данных состоит из нескольких этапов.
Первым этапом информационной технологии является анализ имеющейся априорной информации об исследуемом объекте и определение факторов, которые характеризуют состояние объекта. Эти факторы называются переменными состояния объекта и обозначаются через .V,, х,, .... л'„, где п - число выбранных переменных. В качестве
переменных состояния могут выступать практически любые характеристики объектов. В диссертации рассматриваются основные виды систем взаимодействия динамических и стохастических объектов, даются рекомендации по выбору переменных состояния.
Обязательным требованием к выбираемым переменным состояния является возможность их экспериментального измерения. Для сложных объектов число факторов, определяющих состояние, может быть очень большим, причем не все из них могут быть измерены во время эксперимента. В этом случае в качестве переменных состояния могут быть выбраны наиболее существенные измеряемые факторы. При этом в получаемой математической модели влияние пеизмеряемых переменных состояния может быть выражено в виде нелинейности и/или нестацнопарности. .
На втором этане проводится эксперимент, в течение которого с объекта снимаются значения переменных состояния объекта^ , образующих вектор состояния
), и управляющих сигналов {"у} ц, образующих векгор управления П(Г), в моменты (Символ означает, что все величины измеряются в физических
единицах). В работе приведены рекомендации по выбору экспериментального интервала ['о'' V ] для периодических и апериодических процессов, а также но определению шага дискретизации независимой переменной.
Каждая из переменных состояния объекта и управляющих сигналов имеет свои физический смысл и измеряется в своих физических единицах, а диапазоны значении, полученных во время эксперимента, могут различаться на несколько порядков. Независимая переменная также измеряется в физических единицах. Поэтому третьим этапом является переход к безразмерным нормированным значениям переменных состояния и управляющих сигналов и независимой переменной. Этот переход выполняется по формулам (2), (3) и (4).
После получения экспериментальных значении и их нормирования на четвергом этапе производится анализ информации о поведении переменных состояния и произ-■ водится определение структуры модели. Структура /'-го уравнения системы дифференциальных уравнений определяется цектор-функцией Г((х(/),п(/),/), состоящей из т: компонент. Вид каждой мз компонент отражает тип взаимодействия элементов обьекта (системы). В работе исследованы основные виды взаимодействий в динамических объектах и даны рекомендации по выбору структуры соответствующих им систем дифференциальных уравнений.
Пятым этапом является вычисление оценок коэффициентов системы дифференциальных уравнений на основе нормированных экспериментальных-значений переменных состояния и управляющих сигналов с помощью разработанных методов. В диссертации проведено сравнение разработанных методов и указана целесообразность применения того или иного метода в зависимости от числа экспериментальных точек и числа оцениваемых коэффициентов. *
Результатом обработки экспериментальной информации являются оценки коэффициентов системы дифференциальных уравнении. Полученная система дифференциальных уравнений является компактным представлением информации о поведении исследуемого объекта для некоторого диапазона начальных условий и управляющих сигналов. Прежде чем использовать эту информацию, необходимо убедиться, что она адекватно описывает исследуемый объект. Эта проверка выполняется на тестом этапе.
Для проверки адекватности системы дифференциальных уравнений объекту производится ее интегрирование от момента 10 до момента /Л, при начальных условиях,
равных нормированным начальным условиям эксперимента, и значениях вектора н, совпадающих с нормированными значениями управляющих сигналов, подававшихся па объект во время эксперимента. В процессе интегрирования системы в каждой экспериментальной точке вычисляются квадраты отклонении предсказываемых
моделью значений от нормированных экспериментальных значений:
*'('/) = (*,('/)-*,С/))2. = / = ^
По величине квадратов отклонений Л',2(//) можно судить о том, насколько полученная система дифференциальных уравнений адекватна исследуемому объекту.
В случае, когда точность предсказания значений переменных состояния неудовлетворительна, необходимо возвратиться к одному из предшествующих этапов построения математическом модели. Возможными причинами получения неадекватной модели являются: использование неподходящих методов оценки коэффициентов, переполнение или потеря точности во время вычислений; неправильный выбор структуры модели; недостаточное число экспериментальных данных, неправильно выбранный экспериментальный отрезок или слишком большие величины помех; неправильный выбор переменных состояния. В работе даны рекомендации но устранению этих причин.
'Заключительным седьмым этапом информационной технологии является использование математической модели. Полученная модель в виде системы дифференциальных уравнений позволяет значительно сократить затраты на проведение экспериментов па реальном объекте, так как получить информацию о поведении объекта при различных начальных условиях и управляющих сигналах можно посредством решения системы дифференциальных уравнений. При этом для ранее неисследованных объектов и явлений природы система дифференциальных уравнений является приближенным законом их функционирования, раскрывающим существующие взаимосвязи между элементами объекта (системы).
Полученная модель может быть использована при решении задач оптимизации объекта и поиска оптимального управления. Большим преимуществом модели в виде системы дифференциальных уравнений является возможность значительно более точного (по сравнению с полиномиальными моделями) прогнозирования поведения объекта за пределами экспериментальной области, которая не может быть достигнута по техническим или по финансовым соображениям.
На основе разработанной автором информационной технологии построения матсма-, тичсских моделей динамических объектов создан пакет программ, позволяющий оценивать коэффициенты системы дифференциальных уравнений и выполнять проверку адекватности получившейся модели. Пакет программ написан на языке С++ с использованием библиотеки экранного интерфейса "TurboVision" (с) .Borland International и математической библиотеки "М++" (с) Symantec Corp., реализующей операции матричной алгебры. Трансляция программных модулей осуществлялась компиляторами Borland С++ 4.5 (с) Borland International и Zortech С++ 3.0 (с) Zortech Ink. Работа с пакетом программ описана в диссертационной работе.
Далее в работе проводится экспериментальная проверка разработанных методов оценки коэффициентов систем дифференциальных уравнений. Установлено, что при малом числе экспериментальных точек целесообразно использовать методы, основанные на кусочном интегрировании,'а при большом числе точек - методы, основанные на аппроксимации. ,
Экспериментальные исследования позволили:
- В области химической технологии оценены константы скоростей реакция, протекающих при синтезе дивинила. На основе полученной модели проведена оптимизация, направленная на увеличение выход дивинила за заданное время.
- В биологии применение информационной технологии позволило построить математическую модель распространения заболевания в колонии лабораторных мышей и определить его параметры.
- В области электроники построены системы нелинейных дифференциальных уравнений, описывающие негармонические колебания в электрических цепях, содержащих нелинейные элементы. Исходя из полученных моделей колебательных процес-
сов получены оценки вольт-амперных характеристик нелинейных элементов и определены их электрические параметры.
В целом, экспериментальная проверка показала эффективность разработанной информационной технологии построения математических моделей динамических объектов, ее универсальность и применимость к линейным и нелинейным объектам из различных областей науки и техники.
Основные результаты работы.
Основные результаты диссертационной работы заключаются в создании универсальной информационной технологии построения математических моделей динамических объектов на основе.экспериментальных данных. Разработанная информационная технология может быть применена в широком спектре областей науки и техники: физических объектах и установках, технологических процессах, энергетике, металлургии, химической технологии, микроэлектронике, биотехнологии, экологии, медицине, экономике и т.д. Особенностью технологии является возможность построения как линейных, так и нелинейных систем обыкновенных дифференциальных уравнений. При этом возможности разработанных методов допускают исследование объектов ог нескольких единиц до нескольких десятков зависимых переменных, а в качестве независимой переменной может выступать как время, так и координата пространства. Наиболее целесообразной областью применения разработанной информационной технологии могут, служить фундаментальные исследования по изучению новых областей науки, где проведение экспериментов требует больших затрат времени и средств, поскольку цикл общего исследования может быть сокращен от единиц до нескольких десятков раз. Для ранее неисследованных объектов и явлений природы информационная технология позволяет открывать приближенные законы их функционирования, раскрывающие существующие взаимосвязи между элементами объекта. Открывается возможность оптимизации объекта, поиска оптимального управления и прогнозирования поведения объекта или явления за пределами экспериментальной области, которая не может быть достигнута по техническим или по финансовым соображениям.
В процессе разработки информационной технологии в диссертационной работе были решены следующие проблемы:
1. Теоретически обоснована и исследована возможность создания универсальной информационной технологии построения математических моделей произвольных динамических объектов в виде систем дифференциальных уравнений по экспериментальным данным. Разработано единое представление произвольных линейных и нелинейных динамических объектов в виде систем дифференциальных уравнений, линейных по коэффициентам, основанное на разделении объекта на статическую нелинейную компоненту и динамическую линейную компоненту.
2. Предложена н теоретически разработана универсальная информационная технология построения математических моделей динамических объектов, определяющая методы получения, преобразования, обработки и использования информации о динамически х объектах и явлениях. Дано формализованное описание разработанной информационной технологии в виде последовательности этапов, которые необходимо выполнить для получения математической модели динамического объекта в виде системы дифференциальных уравнений.
3. Обоснована возможность использования критерия наименьших квадратов для оценки коэффициентов систем дифференциальных уравнений. Для минимизации смещения оценок и решения проблемы вычисления значении производных переменных состояния предложено объединить метод наименьших квадратов с методами аппроксимации и методами кусочного интегрирования. Выведены расчетные формулы для оценки коэффициентов систем дифференциальных уравнений на основе экспериментальных данных и разработаны методики их применения. Проведен анализ разработанных методов, исследована их вычислительная сложность и указана целесообразность применения того или'иного метода.
4. Теоретически исследованы основные виды систем взаимодействия динамических и стохастических объектов. Даны рекомендации по выбору структуры соответствующих им систем дифференциальных уравнений и экспериментально измеряемых переменных состояния.
5. Указаны основные требования к проведению эксперимента на объекте. Предложен способ перехода от физических значений переменных состояния, управляющих сигналов и независимой переменной к безразмерным нормированным значениям. Исследованы основные причины получения неадекватных моделей и предложены рекомендации по их устранению.
6. На основе разработанной информационной технологии создан пакет программ, позволяющий синтезировать системы дифференциальных уравнений по результатам экспериментов. Пакет программ позволяет за время, измеряемое единицами и десятками секунд, оценивать на компьютере с процессором Pentium- коэффициенты системы дифференциальных уравнений при числе переменных состояния, измеряемом десятками, и числе экспериментальных точек, измеряемом тысячами. Программное обеспечение написано на языке С++ с использованием распространенных интерфейсных и математических библиотек, что позволяет достаточно легко адаптировать пакет программ под различные платформы.
7. Проведена экспериментальная проверка разработанных методов оценки коэффициентов систем дифференциальных уравнений на объектах из различных областей науки и техники. Экспериментальные исследования позволили:
a) В области химической технологии оценены константы скоростей реакция, протекающих при синтезе дивинила. На основе полученной модели проведена оптимизация, направленная на увеличение выход дивинила за заданное время.
b) В биологии применение информационной технологии позволило построим, математическую модель распространения заболевания п колонии лабораторных мышей и определить ег о параметры.
c) В области элекгроннки построены системы нелинейных дифференциальных уравнений, описывающие негармонические колебания в электрических пенях, содержащих- нелинейные элементы. Исходя из полученных моделей колебательных процессов получены оценки вольт-амперных характеристик нелинейных элементов и определены их электрические параметры.
Публикации по теме диссертации.
Основные результаты диссертации опубликованы в следующих работах:
). Марковский М.В., Чалый В.Д., Шубная Е.Г. Методика идентификации обьектои системами дифференциальных уравнений. Труды международной математической конференции "Проблемы математики и информатики", чаегь 2. - Гомель, 1991.
2. Марковский М.В., Чалый В.Д. Идентификация и моделирование динамических объектов. Труды международной математической конференции "Алгебра и кибернегика", часть 2. - Гомель, 1995.
3. Марковский М.В., Чалый В.Д. Методы повышения точности идентификации объектов системами дифференциальных уравнений. Труды международной магматической конференции "Алгебра и кибернетика", часть 2. - Гомель, 1995.
4. Марковский М.В. Идентификация динамических объектов. Материалы московской конференции "Студенческая научная осень - 94", часть 4, "Компьютерные нау-
' ки". - М.: МИФИ, 1995.
5. Марковский М.В., Чалый В.Д. Информационная технология построения математической модели динамического объекта гго экспериментальным данным. Журнал московского физического общества "Физическое образование в ВУЗах", серия "В", том 2. № 1 - М.: Издательский дом московского физического общества, 1996..
6. Марковский М.В., Чалый В.Д. Информационная технология идентификации динамических объектов. Материалы международной конференции НТП-96 "Информационные продукты, процессы и технологии". - М.: ВИНИТИ, 1996.
7. Марковский М.В. Описание и методика использования пакета программ для построения математических моделей динамических объектов в виде систем дифференциальных уравнении на основе экспериментальных данных. Материалы конференции "Телекоммуникационные системы и новые информационные технологии в системе лицей-ВУЗ". - М.: МИФИ, 1997.
-
Похожие работы
- Метод и имитационная модель прогнозирования характеристик региональных информационно-коммуникационных систем
- Моделирование ограниченными сетями Петри динамических информационных структур
- Технология разработки интернет-приложений на основе встроенных динамических моделей и XML
- Алгоритмы и комплекс программ непараметрической идентификации сложных нелинейных динамических объектов методом ближайших узлов
- Математические модели, алгоритмы и системы сбора, обработки и интерпретации медицинской информации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность