автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Синтез интервального наблюдателя для линейных систем с переменными параметрами
Автореферат диссертации по теме "Синтез интервального наблюдателя для линейных систем с переменными параметрами"
Санкт-Петербургский Национальный Исследовательский Университет Информационных Технологий, Механики и Оптики
На правах рукописи
005537440
...оотарев Станислав Геннадьевич
СИНТЕЗ ИНТЕРВАЛЬНОГО НАБЛЮДАТЕЛЯ ДЛЯ ЛИНЕЙНЫХ СИСТЕМ С ПЕРЕМЕННЫМИ ПАРАМЕТРАМИ
Специальность 05.13.01 —Системный анализ, управление и обработка информации (в технических системах)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
7 НОЯ 2013
Санкт-Петербург - 2013
005537440
Работа выполнена в Санкт-Петербургском Национальном Исследовательском Университете Информационных Технологий, Механики и Оптики
Научный руководитель:
Официальные оппоненты:
Кандидат технических наук, доцент Кремлев Артем Сергеевич
Шишлаков Владислав Федорович, доктор технических наук, профессор, заведующий кафедрой Управления в технических системах Санкт-Петербургского Государственного Университета Аэрокосмического Приборостроения
Новожилов Игорь Михайлович Кандидат технических наук, доцент кафедры Автоматики и процессов управления Санкт-Петербургского Государственного Электротехнического Университета «ЛЭТИ»
Ведущая организация:
Институт проблем машиноведения РАН
Защита состоится 28 ноября 2013 года в 16 часов 00 минут на заседании диссертационного совета Д 212.227.03 при Санкт-Петербургском национальном исследовательском университете информационных технологий, механики и оптики по адресу: 197101, Санкт-Петербург, Кронверкский пр., д. 49, НИУ ИТМО, ауд. 285.
С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского национального исследовательского университета информационных технологий, механики и оптики.
Автореферат разослан «ат Ск7"_2013 г.
Ученый секретарь диссертационного совета доктор технических наук, профессор
Ожиганов Александр Аркадьевич
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность. Одна из проблем, с которой сегодня сталкиваются разработчики, состоит в необходимости оценивания состояния объекта в условиях меняющегося окружения и варьирующихся параметров самого объекта. Множество факторов, такие как внешние возмущения, старение оборудования, погрешности измерений, оказывают негативное влияние на систему, что приводит к тому, что параметры объекта при анализе и синтезе задаются неточно. Такие системы называются системами с неопределенными параметрами. Эти параметры могут бьггь как интервальными, так и периодически изменяющимися или функциями некоторых переменных. Поэтому проблема оценки неизмеряемого вектора состояния очень актуальна, и на сегодняшний день ее решение требуется во многих приложениях.
Стоит отметить ряд существенных преимуществ использования устройств и систем оценки вектора состояния. Во-первых, возможность восстановить недоступные для измерения переменные позволяет исключить установку дополнительных датчиков, что способствует улучшению эксплуатационных и стоимостных характеристик систем управления. Во-вторых, наличие датчиков требует учета в модели объекта управления дополнительной динамики самих датчиков, что может вызвать проблемы синтеза обратной связи в связи с чрезмерным ростом порядка модели объекта управления.
Задача построения наблюдателя заключается в синтезе динамической системы, с помощью которой можно получить оценку вектора состояний по измеряемым данным, таким как вход и выход системы. Большое число научных работ посвящено решению данной задачи для разных классов объектов управления при различных свойствах и параметрах системы, а также доступной информации.
Основы теории наблюдателей для линейных стационарных систем управления были заложены математиком Д. Люенбергером в 1963 году. На сегодняшний день продолжается поток научных трудов, посвященных развитию данной теории, ее применению к новым классам объектов управления в разной постановке задач.
На текущем этапе развития теории автоматического управления задача оценивания неизмеряемого вектора состояния для полностью определенных линейных стационарных систем решена. Но если рассматривать системы с неопределенностями, то для них данная задача еще не нашла окончательного и однозначного решения. Работы, посвященные построению устройств оценки вектора состояния систем с неизвестными возмущениями, продолжают появляться.
Что же касается нелинейных объектов управления, то здесь задача построения наблюдателя имеет гораздо более сложный характер, и на данный момент имеет решение только для некоторых отдельных классов нелинейных динамических систем.
Множество моделей, в том числе и моделей роботов, и различных робототехнических комплексов, описываются уравнениями с неопределенными параметрами, что приводит к затруднению синтеза наблюдателей, используя классические методы синтеза. Таким образом, на практике существуют ситуации, когда классические методы построения наблюдателей, оценки которых сходятся к точному значению состояния при отсутствии шума (например, наблюдатель Люенбергера), не применимы. В основном, причиной тому становится наличие в системе параметрической неопределенности.
Одним из возможных решений является использование алгоритмов интервальной оценки, под которой понимается синтез интервального наблюдателя, гарантирующего оценивание множества допустимых значений для вектора состояния системы (т.е. интервал значений). Решение поставленной задачи осложняется параметрической и
сигнальной неопределенностью матриц модели рассматриваемой системы, что затрудняет применение классических методов синтеза наблюдателей (для линейных или нелинейных систем).
Стоит отметить, что большинство стандартных разработанных подходов имеют строгое обоснование лишь для случаев, когда модель объекта наблюдения частично линейна или близка к линейной, что затрудняет их применение во многих прикладных областях, например в робототехнике. С другой стороны, широкий класс нелинейных и неопределенных систем может быть эквивалентно описан так называемыми ЛПП-системами («линейные с переменными параметрами», от англ. LPV - Linear Parameter-Varying). Часто, в нелинейном случае, построение наблюдателя или регулятора основано на преобразовании системы в канонические формы, что может быть сложно реализуемо на практике. Именно поэтому класс ЛПП-систем стал очень популярным во многих практических задачах. С целью расширения спектра рассматриваемых классов систем, в данной работе будут рассматриваться ЛПП-системы, описание которых будет приведено позже.
В этом случае алгоритмы построения наблюдателей для указанного класса систем, описываемые в данной диссертационной работе, могут найти широкое применение в науке и технике.
Таким образом, развитие методов интервальной оценки и алгоритмов построения интервальных наблюдателей для систем, обладающих параметрической неопределенностью, является актуальной задачей. Бурно развивающаяся практика привела к развитию аппарата для учёта неопределённостей нестатистической или, в общем случае, неизвестной природы. Этот фактор послужил развитию интервального анализа, подходящего для исследования содержательных моделей, которые основаны на достаточно общих допущениях о характере неопределённости, когда отсутствует какая-либо предварительная информация о рассматриваемых величинах, кроме знания некоторых ограниченных множеств, к которым принадлежат значения этих величин.
Интервальные наблюдатели генерируют два вектора оценок: минимальных и максимальных значений для каждого элемента вектора состояний объекта. При построении оценки для J11 Ill-систем часто не удается применять методы адаптивного управления, основанные на предположении о квази-стационарности неизвестных параметров. Методы робастного управления и оценивания или методы гибридных систем (систем с переключениями) могут приводить в таких случаях к сложно реализуемым и сложно анализируемым на практике решениям.
Оценка неизмеряемого вектора состояния относится к фундаментальным проблемам современной теории автоматического управления. На протяжении последних десяти-пятнадцати лет теория интервальной оценки имела достаточно широкое развитие и распространение. Используемый в данной работе подход к синтезу интервальных наблюдателей основан на теории кооперативных систем (Gouzd et al„ 2000; Kieffer & Walter, 2006; Smith, 1995; Walter & Kieffer, 2003).
Кооперативные системы составляют подкласс монотонных систем, состояние и выходные траектории которых сохраняют относительный порядок в каждый момент времени. Благодаря свойству кооперативности удается обеспечить положительность ошибки наблюдения, что необходимо для построения интервального наблюдателя. Более подробно оно рассматривается в первой главе работы.
Подобные системы имеют практическое приложение в области робастного управления, где предполагается наличие различного рода неопределенностей в динамике системы; технических областях, таких как робототехника, горно-
добывающая отрасль, оборудование заводов и цехов; системах управления летательным аппаратами, двигателями; системах, относящихся к космической области, изучению океана, сельскому хозяйству, военному делу; транспортных системах, строительстве и других отраслях промышленности. Но при этом единых алгоритмов построения интервальных наблюдателей для данного класса систем разработано не было.
Следовательно, существует необходимость в разработке алгоритмов построения интервальных устройств оценки для различных классов систем в присутствие параметрической неопределённости, которые можно представить в виде модели ЛПП-систем, что подчеркивает актуальность данной работы. Использование интервального наблюдателя позволяет построить область, гарантированно ограничивающую реальную траекторию протекания процессов в рассматриваемой динамической системе.
Другими словами, предложенный алгоритм производит трансформацию заданного интервала неопределенности для начальных условий объекта и вектора неизвестных параметров и входов во множество допустимых значений переменных состояния. В этом случае, наблюдатель восстанавливает не оценку текущего состояния объекта (в возмущенном случае реальное состояние находится в некоторой, требующей дополнительного определения, окрестности этой оценки), а интервал, гарантированно содержащий вектор состояния системы. Подобная постановка задачи может быть востребована при наблюдении, к примеру, за мехатронными и робототехническими комплексами, подверженными воздействию быстро меняющихся неизвестных возмущений и вариациям параметров.
Цель диссертационной работы. Целью диссертационной работы является разработка алгоритмов оценивания вектора состояния динамических систем с существенной сигнальной и параметрической неопределенностью математической модели в условиях, когда классические алгоритмы оценивания не могут быть применимы.
Поставленная цель достигается с использованием методов интервального оценивания. В ходе исследования разработаны алгоритмы синтеза интервальных наблюдателей для класса ЛПП-систем.
Научная новизна. Впервые интервальные наблюдатели для конкретного класса систем были предложены в 2000 году в работе Gouzc J.-L., Rapaport A., Hadj-Sadok Z. "Interval observers for uncertain biological systems", посвященной наблюдению за биореактором. Два классических наблюдателя оценивали нижнюю и верхнюю границы области, содержащей значения вектора состояния. Изначально, коэффициент усиления наблюдателя выбирался таким образом, чтобы ошибка наблюдения обладала свойством кооперативносги. Т.е. построение интервального наблюдателя было возможным только для кооперативных систем, что являлось серьезным ограничением. В диссертационной работе это ограничение будет снято.
Этот результат был расширен на случай набора наблюдателей в работе Bernard О., Gouzc J. L. (2004) "Closed loop observers bundle for uncertain biotechnological models". Рассматривалось пересечение всех интервальных оценок для улучшения скорости сходимости и уменьшения размеров полученной области. Наконец, в работе Moisan М., Bernard О., Gouze J. L. (2009) "Near optimal interval observers bundle for uncertain bioreactors" данный результат был улучшен путем введения критерия оптимальности для системы наблюдателей, позволяющего получить оптимальный наблюдатель. В
статье приведено доказательство применимости такого подхода для биотехнологических систем с большими неопределенностями в описании.
Как видно, понятие интервального оценивания (interval/set-membership estimation) было известно и ранее, но существовавшие алгоритмы имели высокую вычислительную сложность, затруднявшую их практическую применимость в системах наблюдения реального времени. За прошедшие годы теория интервальных наблюдателей получила широкое распространение. Однако единых алгоритмов построения интервальных наблюдателей для ЛПП-систем разработано не было, несмотря на высокую практическую значимость этих классов объектов управления. Новизна диссертационной работы заключается в развитии алгоритмов оценивания вектора состояния динамических систем с существенной неопределенностью математической модели и алгоритмов построения интервальных наблюдателей для данного класса систем.
Теоритическая и практическая значимость. Проводимые в рамках данной научной работы исследования являются фундаментальными исследованиями, нацеленными на практические приложения, которые могут использоваться в различных отраслях промышленности и техники, где затруднено применение классических методов оценивания. Примерами реальных технических систем, к которым могут быть применены разработанные алгоритмы интервальной оценки, являются робототехнические комплексы, используемые для экспериментальных результатов в данной диссертационной работе.
Также, наглядным примером являются системы обнаружения сигнала, которые используются для большого количества различных систем диагностики и мониторинга. В данном контексте, в подобных системах решается задача робастного обнаружения ошибок. Для обеспечения робастности и изоляции возмущений при классическом подходе требуется знание сигналов, которые могут быть неизвестны в связи с неопределенностью модели, для того, чтобы максимизировать чувствительность к определенным ошибкам.
Основной идеей применения интервальной оценки является рассмотрение неопределенности в интервале и проверка принадлежности измерений интервалу всех возможных значений выходов. Для решения этой задачи, оценка данного интервала вычисляется с использованием интервального наблюдателя. Основным преимуществом является то, что априори должны быть доступны только границы неопределенности.
Примером подобной задачи может служить гидравлическая лаборатория, где поддерживается определенный уровень воды в резервуарах. Неисправность соответствует выходу уровня воды из заданного интервала. Подробнее данный пример рассмотрен в диссертационной работе.
Соответственно, в тех случаях, когда в самой постановке задачи присутствует понятие интервала, методы интервальной оценки хорошо применимы.
Алгоритмы построения интервальных наблюдателей, представленные в данной диссертационной работе, также могут быть использованы в качестве основы решения других смежных задач теории управления. Например, в задачах стабилизации параметрически возмущенных систем с использованием информации, полученной интервальным наблюдателем. Некоторые результаты в данном направлении уже были получены автором и его коллегами и представлены на одной из конференций. Было показано, что если выполняются интервальные соотношения (истинное значение состояния гарантированно находится внутри интервала оценки) и траектории наблюдателя сходятся к одному положению равновесия, то состояние системы тоже
будет сходиться к этому положению равновесия. Т.е. управление строится с целью стабилизировать именно интервальный наблюдатель, что приводит к стабилизации объекта управления.
Также полученные результаты применимы в задачах оценки влияния внешних воздействий на динамическую систему.
Решение задачи оценки состояния систем в условиях неопределенности их модели при использовании интервальных методов позволяет не только достичь поставленных целей в области оценивания вектора состояния систем, но и дает возможность развить различные теоретические результаты, расширить область применения полученных алгоритмов оценки, создать новые алгоритмы и технологии оценивания.
Важно отметить, что в результате научных исследований в рамках данной диссертационной работы удалось в значительной мере ослабить требования к построению интервальных наблюдателей, что, в свою очередь, значительно расширяет область их возможного применения.
Важным пунктом является значимость данного проекта в образовательном процессе. Результаты работы могут быть использованы в широко распространенных мехатронных учебно-исследовательских комплексах, которые входят в лабораторное оборудование многих отечественных и иностранных высших учебных заведений, для проведения научных исследований и учебного процесса в области мехатроники, робототехники и систем автоматического управления.
Методы исследования. Теоретической основой исследований служит применение теории автоматического управления, интервальной арифметики, методов, использующих аппарат функций Ляпунова. Достижение результатов диссертационной работы осуществляется за счет применения теории кооперативных систем, дифференциальных неравенств, математического моделирования.
Положения, выносимые на защиту:
Методы синтеза интервальных наблюдателей для ЛПП-систем с существенной неопределенностью математической модели (в условиях, когда применение стандартных методов оценивания затруднено):
1. Интервальный наблюдатель для кооперативной ЛПП-системы, позволяющий получить множество допустимых значений вектора состояния, для случая с измеряемым вектором переменных параметров.
2. Интервальный наблюдатель для некооперативной ЛПП-системы, с заменой координат, обеспечивающей свойство кооперативности исходной системе, для случая с измеряемым вектором переменных параметров.
3. Интервальный наблюдатель для кооперативной ЛПП-системы для случая с неотрицательными значениями состояния и не измеряемым вектором переменных параметров.
4. Интервальный наблюдатель для кооперативной ЛПП-системы для случая со знакопеременными значениями состояния и не измеряемым вектором переменных параметров.
Апробация работы. Основные результаты диссертации докладывались на следующих конференциях:
1. 18th International Conference on Methods and Models in Automation & Robotics, 26-29 August 2013, Miçdzyzdroje, Poland. Analysis conditions on interval observer synthesis for linear systems with variable parameters.
2. 9th IFAC Symposium on Nonlinear Control Systems, 4-6 September, 2013, Toulouse, France. On Interval Observer Design for a Class of Continuous-Time LPV Systems.
3. XLI научная и учебно-методическая Конференция, 31 января - 3 февраля 2012 г. Построение интервальных наблюдателей для линейных систем с переменными параметрами.
4. XIV конференцию молодых ученых «Навигация и управление движением», 13-16 марта 2012 г. Синтез интервального наблюдателя для линейных систем.
5. The 51st IEEE Conference on Decision and Control, Maui, Hawaii, December 10-13, 2012. On Set-Membership Observer Design for a Class of Periodical Time-Varying Systems.
6. I Всероссийский конгресс молодых ученых, 10-13 апреля 2012 г. Интервальное оценивание параметров линейных систем.
7. II Всероссийский конгресс молодых ученых, 9-12 апреля 2013. Разработка интервального наблюдателя для линейных систем с переменными параметрами при различных начальных условиях.
8. XLII научная и учебно-методическая конференция НИУ ИТМО, 29 января - 1 февраля 2013. Разработка систем интервального наблюдения для нестационарных систем с переменными параметрами применительно к мехатронным и робототехническим комплексам.
9. XLII научная и учебно-методическая конференция НИУ ИТМО, 29 января - 1 февраля 2013. Разработка методов построения интервальных наблюдателей для линейных нестационарных систем с неизвестными параметрами.
10. XLII научная и учебно-методическая конференция НИУ ИТМО, 29 января — 1 февраля 2013. Анализ условий синтеза интервальных наблюдателей для линейных систем с переменными параметрами.
Автор проходил ряд научных стажировок, среди которых:
1. Центральная школа г. Лилль и Государственный Институт Исследований в Информатике и Автоматике INRIA LNE (team Non-A), г. Лилль, Франция, 11.06.2012 -30.06.2012.
2. Лаборатория интегрированных материалов и систем АРИА ИМС (Laboratoire de l'Intégration du Matériau au Système), Университет Бордо 1, г. Бордо, Франция, 09.05.2011-26.05.2011.
3. Лаборатория интегрированных материалов и систем АРИА ИМС (Laboratoire de l'Intégration du Matériau au Système), Университет Бордо 1, г. Бордо, Франция, 05.12.2010-11.12.2010.
Работа выполнена на кафедре «Систем Управления и Информатики», исследование выполнено при поддержке гранта Президента Российской Федерации № МК-464.2013.8, а также при поддержке Министерства образования и науки Российской Федерации, соглашение 14.В37.21.1928 и 14.В37.21.0875.
Для апробации разработанных алгоритмов интервального наблюдения был использован исследовательский комплекс на базе Lego Mindstorm NXT. На основе данной платформы были сконструированы «робот-сегвей» (Segway) и «робот-болбот»
(Ва11Во1), кинематические схемы, конструкции, математические описания и технические особенности которых подходят для изучения и раскрытия содержания алгоритмов, разработанных в рамках данной работы.
Публикации. Материалы диссертации опубликованы в 9 печатных работах, а также статьях и сборниках научных трудов всероссийских и международных конференций. Среди опубликованных трудов 6 работ отпечатаны в рецензируемых журналах [1-6], входящих в перечень ВАК.
Личный вклад автора. Представленные в диссертационной работе результаты получены либо лично соискателем, либо при его непосредственном участии.
Структура и объем диссертации. Диссертация состоит из введения, четырех основных глав с примерами и заключениями. Основная часть работы изложена на 114 страницах. Список литературы включает 149 наименований.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во Введении обоснована актуальность представленной диссертационной работы, сформулирована основная цель и задачи исследования, аргументирована научная новизна работы, приведена теоретическая и практическая значимость полученных результатов, а также перечислены выносимые на защиту научные положения.
В первой главе представлен аналитический обзор существующих научных источников и информационных ресурсов, относящихся к теме диссертационной работы: рецензируемые научные журналы, сборники трудов конференций, интернет. Произведен обзор систем с переменными параметрами, в котором представлены основные концепции и приведен ряд аналитических подходов для работы с данным классом систем, их происхождение, уделено внимание вопросам анализа устойчивости. Также перечислены возможные области применения.
Во второй части первой главы представлено введение в теорию интервальных наблюдателей, начиная с их происхождения до описания подходов, лежащих в основе данной теории, их сравнение с классическими методами оценки переменных состояния.
Также произведен обзор работ по данному направлению и приведены результаты анализа ЛПП-систем для построения интервального наблюдателя. Сформулирована обобщенная постановка задачи для диссертационной работы.
Основные понятия
Линейные с переменными параметрами (ЛПП) системы.
ЛПП-системы относятся к линейным динамическим системам, представление которых в пространстве состояний зависит от нестационарных параметров:
х = А{е(г))х + В(в«))и,
у = С{в(1))х,
где х — вектор состояния системы, и - входное воздействие, у - выходная величина, в — вектор переменных параметров, имеющих зависимость от времени. Матричные функции А, В и С - матрица системы, матрицы управления и выхода соответственно.
Широкий класс нелинейных систем может быть представлен в виде ЛПП-систем, в то время как частичная линейность ЛПП-моделей позволяет применять все подходы, разработанные для линейных систем. Далее в работе, говоря о системах вида (1), также будет рассматриваться ЛПП-система с нелинейностью:
х = АЦ,у,и)х+/(1,х,и,д), ^
у = С(1,и)х,
где х е К", и е К™, у <е К'' — состояние, вход и выход системы (2) соответственно, ^е@с1* - вектор неизвестных сигналов или параметров, компактное множество © дано, матричные функции -»ИГ", С: К™+| —> К'"" и функция
/":К"+"+,+1 даны.
Систему (2) можно записать в виде ЛПП-модели, обозначая <9(7) = (7,_у,и]7, где в — вектор переменных параметров.
Интервальный наблюдатель
Определим понятие интервального наблюдателя. Для системы (1) или (2) система £ = [х7 х ]' = к(^,у,и) называется интервальным наблюдателем, если для
V/ > О состояние системы удовлетворяет неравенствам х(1) < х{1) < х{1) при условии, что х(0) < х(0) < х(0). Две переменные х,х оценивают нижнюю и верхнюю границы для значений состояния системы в реальном времени. Таким образом, интервальный наблюдатель трансформирует неопределенность, заложенную в начальных условиях, переменных параметрах и неизвестных входах в интервал оценки [*,*].
Примерами областей применения подобных систем являются: управление полетом и системы автопилота для ракет, турбореактивные двигатели, магнитные подшипники, автомобильные системы, энергетика и т.д.
В ряде случаев, в связи с наличием неопределенности (параметрической и/или сигнальной), построение классического наблюдателя, сходящегося при отсутствии шума к истинному значению состояния, невозможно. Особенно когда речь идет о работе с математическими моделями ЛПП-систем. Именно для таких систем возможна и актуальна интервальная оценка переменных состояния. Под ней здесь понимается результат работы интервального наблюдателя, который гарантирует оценивание множества допустимых значений вектора состояний системы.
На рис. 1 для сравнения приведены результаты работы классического и интервального наблюдателя.
В первой главе представлено введение в используемый математический аппарат: мецлеровы матрицы, кооперативные системы и интервальные вычисления. Ниже эти сведения приведены в краткой форме.
Мецперова матрица
В теории кооперативных систем важным свойством является мецлеровость матрицы. Запись АеМ означает, что матрица А мецлерова, т.е. имеет неотрицательные элементы вне главной диагонали. Элементы на главной диагонали могут иметь любой знак. Свойство мецлеровости матрицы необходимо для следующего определения.
Кооперативная система
Любое решение линейной системы
х = Ах + аз{1), (3)
с хб1", положительным вектором а и мецлеровой матрицей А поэлементно неотрицательно для всех t > 0 при условии, что начальные условия неотрицательны х(0)>0. Такие динамические системы называются кооперативными. Подробнее с данным определением можно ознакомиться в работах H. L. Smith (см. "Monotone dynamical systems: an introduction to the theory of competitive and cooperative systems").
Интервальные вычисления
Введем некоторые обозначения. Для матрицы A g К"*" определим А* = max {О, Л}, А'-А*-А. Следовательно матрицы А*, А' содержат только неотрицательные элементы. Для двух векторов х„х2 еМ" или матриц Л^,А2 еК", отношения дг, ¿х2 и А1<Аг понимаются поэлементно. Символы -?,>- используются при обозначении отрицательной и положительной определенности симметричных матриц соответственно.
Лемма 1. Пусть хеПГ будет вектором переменных состояния, х<,х<\ для некоторых х,х е R", и А е М"х" будет постоянной матрицей, тогда
А*х-А'х < Ах < А*х-А'х.
Лемма 2. Даны матрицы А е К""", R е К""" и С е К'"". Если существует матрица L бК™' такая, что матрицы A-LC и R имеют одинаковые собственные значения, тогда существует Se ИГ*" такая что R = S~'(A-LC)S, при условии, что пары (A—LC,et) и (Я,е2) наблюдаемы для некоторых е,,е2 е К1*".
Этот результат может быть использован для построения интервальных наблюдателей для линейных стационарных систем с мецлеровой матрицей R.
Лемма 3. Пусть А <. А <, А для некоторых A,A,A<eR"*" hi2i<ï для х,х,х eR", тогда
А*х*-1*х'-А'х*+1-х- < Ах < А*х* - Л*5Г -А~х +А~х~ (4)
Если -А = А £ 0 й А, тогда неравенство (4) может быть упрощено: -Я(х*+х~) < Ах < Л(х*+х~).
После определения класса рассматриваемых в диссертационной работе систем (ЛПП-системы), определения интервальных наблюдателей и краткого введения в аппарат кооперативных систем и интервальную арифметику, в первой главе приведена классификация рассматриваемых ситуаций в соответствие с тремя критериями:
1. Измеряемость вектора переменных параметров 0(1):
a. Вектор переменных параметров 0(1) доступен для измерения.
b. Вектор переменных параметров в(() не доступен для измерения.
2. Мецлеровость матрицы динамики системы:
a. Существует коэффициент усиление наблюдателя Ь такой, что А-ЬС является мецлеровой
3 Ь:(А(0)-1С)еМ.
b. Коэффициент усиления наблюдателя Ь обеспечивает только свойство гурвицевости, а далее предлагается статическое преобразование координат с матрицей преобразования 5, которое обеспечивает требуемое свойство кооперативности
35: Я = 5"' (А(в)- ¿С)5 б М.
3. Положительность вектора состояний рассматриваемой системы:
a. Вектор состояний системы положительный
b. Вектор состояний системы знакопеременный
хеК".
Классификация по первому критерию отражена во второй и третьей главах работы для случая а) и Ь) соответственно. В третьей главе представлен более общий случай. Классификация по второму критерию содержится в материале второй главы. Два случая, соответствующие третьему критерию, отражены в третьей главе диссертационной работы. Таким образом, в работе рассматриваются возможные варианты выполнения условий синтеза интервального наблюдателя по всем рассматриваемым критериям.
Постановка задачи. С учетом приведенных выше свойств, постановка задачи формулируется следующим образом: необходимо построить такой наблюдатель, который позволяет получить область (интервал) оценок переменных состояния системы, гарантированно содержащую истинное значение состояния в данный момент времени:
*(0£*(0 (5)
Построение интервального наблюдателя возможно, если удается обеспечить свойство кооперативности для ошибки оценивания. Данное свойство обеспечивает положительность ошибки наблюдения и выполнение соотношения (5).
Различные классы объектов управления, для которых требуется решить задачу синтеза интервального наблюдателя, будут определены по дополнительным требованиям к свойствам и матрицам системы в последующих главах работы.
Вторая глава посвящена построению интервального наблюдателя для систем с измеряемым вектором переменных параметров 0(t) = [t,y,u]T. Рассмотрен случай кооперативной и не кооперативной системы, построены интервальные наблюдатели. Предложено преобразование координат, обеспечивающее свойство кооперативности исходной некооперативной системе. Показано, что при некоторых нестрогих условиях, применяя подобное преобразование координат, можно привести систему к кооперативной форме.
Часто в работах по синтезу интервального наблюдателя рассматриваются случаи с постоянной матрицей А. В данной части диссертационной работы это ограничение будет снято.
Требуются следующие допущения:
Допущение 1. Состояниех и вход и системы ограничены. [;t]i X, ||u|¿U и ||jy||< Y , константы Х>0, U> О и У > О даны.
Допущение 2. Если даны границы х,х состояния х, то значения нелинейной функции/заключены в интервале [/,/].
Допущение 3. Существует коэффициент усиления наблюдателя L(t,y,u), который обеспечивает устойчивость нестационарной матрицы D(t,y,u) с матрицей функции Ляпунова P(t). Это определяет условия устойчивости динамики оценки.
В данной части работы для выбора матрицы коэффициентов наблюдателя L можно использовать алгоритмы расчета, разработанные для классических наблюдателей (типа Люенбергера) для неавтономных систем, с последующим решением уравнения Риккати для расчета матрицы преобразования S. Алгоритмы решения и условия разрешимости уравнений Риккати хорошо изучены.
При этих допущениях, если дополнительно предположить, что матрица D является мецлеровой, то может быть построен следующий интервальный наблюдатель:
х = A(t, у, и)х+f(t, x,x,u)+L(t,y,u)[y-C(t, u)*],
j. _ - (6)
* = A(t, y, u)x + f(t,x, x, u)+L(t, y, u)[y- C(t, u) x].
Теорема 1. Пусть выполнены Допущения 1-3 и матрица D(t,y,u) мецлерова для всех (>0и |и||<.i/,|>'||S Y. Пусть выполнено одно из следующих условий:
1) I f(t,x,x ,«)|<+оо, |/(7,х,*,1/)|<+со для любых f >О, И-17 и всех х,х eR";
2) Для любых / S О, M S Л', ||u|Sf7, де&ивсех x.JeR"
для некоторых и
/?/„-е+Лг<0, S = Rr>- 0.
Тогда в (2), (6) переменные x(e),x(t) остаются ограниченными для всех 1>0 и выполняется соотношение
X(t) <. x(t) S x(t),
при 2(0) £ *(0) ^ 3с(0).
Результат Теоремы 1 основан на довольно строгом допущении, что матрица D мецлерова. Все остальные допущения довольно часто встречаются в теории оценивания (ограниченность состояния х и входа и в Допущении 1, существование мажорирующей функции / из Допущения 2, существование коэффициента усиления
наблюдателя Ь с соответствующей матрицей Ляпунова Р в Допущении 3, Липшицева непрерывность или ограниченность /,/, указанные в теореме).
Для постоянной матрицы й это допущение снимается в Лемме 2, где показано, что в условиях Допущения 3 (матрица Г) является гурвицевой) существует вещественная статическая матрица преобразования подобия Я с , являющаяся
гурвицевой и мецлеровой. В нашем случае 0(1,у,и) является нестационарной матрицей, расширение Леммы 2 для этого случая представлено во второй главе диссертационной работы.
Далее предположим, что условия этой леммы выполнены в рассматриваемом случае и представлены в виде допущения.
Допущение 4. Пусть 1>(/,_у,и)еЕ — матрица, удовлетворяющая интервальным ограничениям Е = {О е К"" : /5 - А 5 Э < £>„ + Д} для некоторых ££ = Д, е К™" и Дб1"". Пусть для некоторой постоянной ¿¡еЕ и диагональной матрицы Те К*"" мецлерова матрица Я=¡лЕп - Т имеет те же самые собственные значения, что и матрица £>„.
При этом допущении существует ортогональная матрица 5 е К"*" такая, что матрицы 5г£)(/,1у,1/)5 мецлеровы для всех В(/,у,и)еН. Введем новую переменную состояния z = 8тх, тогда система (2) может быть переписана в новых координатах:
г = Б7 А«, у, и)&+ф{1, г, и, в).
Интервальный наблюдатель в новых координатах принимает вид, аналогичный
(6):
ъ =ЯГ А({,у,и)^+ф(1,1,1,и)+Зг Ц/,у,и)[у-С(Г,и№].
Теперь возможно доказать следующий расширенный вариант Теоремы 1.
Теорема 2. Пусть выполнены Допущения 1-4 и одно из следующих условий:
1) |/(/,х,Зс,и)|<+а>, |/(г,х,х,м)|<+оо для любых ¡¿0, |и||^и ивсех х,х ей";
2) Для любых * г 0, |л:|| < X, ||и| < и, £>е0 и всех 7,геК"
|ф(1,2,и,д)-ф{1,2,г,и)|2 + г,I,и)-фЦ,2,и,£>)|2 £ Р-г|2 + ¡}|г -г|2 + а
для некоторых агеК+,/?еК+ и
О, Я = ЯТ >-0.
Тогда в (7) и (2) переменные х(1),ЗГ(/) ограничены для всех / >0, и
выполняется соотношение
2(0 < дг(0 ^ х(0-
при 2(0) < 2(0) < 2(0).
Эта теорема предлагает интервальный наблюдатель для некооперативной системы, явно опуская требование мецлеровости матрицы В замкнутого контура.
Итак, во второй главе предложено преобразование координат, обеспечивающее свойство кооперативности исходной некооперативной системе. Снято допущение о том, что существует коэффициент усиления наблюдателя, который делает систему устойчивой и кооперативной. Коэффициент усиления наблюдателя должен обеспечить свойство гурвицевости, а далее предлагается соответствующая замена координат для обеспечения кооперативности.
В конце данной главы приводятся примеры компьютерного моделирования, которые демонстрируют эффективность предложенных алгоритмов.
13
Третья глава посвящена построению интервального наблюдателя для кооперативных ЛПП-систем с не измеряемым вектором переменных параметров. Рассмотрены два случая: система с неотрицательными значениями состояния и знакопеременными. Для обоих случаев предложены интервальные наблюдатели, их кооперативносгь и устойчивость выражаются через матричные неравенства.
Рассмотрим систему с переменными параметрами:
y = Cx+v(i), >^0,
где xel" - состояние, yeRp - доступный для измерений выход, 0(/)60cRr -вектор переменных параметров. Значения вектора переменных параметров в ограничены, но недоступны для измерений, множество допустимых значений 0 известно. Матрицы Д,€Г" и Се К'"'" известны, матричная функция ДЛ : 0 -> R"*" является кусочно-непрерывной и также известна для заданного множества 0. Сигналы Ь : R+ R" и и : Kt -» R* - внешний вход и измеряемый шум соответственно, точные текущие значения b(t) и и(1) недоступны. Будем использовать следующие допущения.
Допущение 5. Состояние x(t) системы (8) ограничено, измеряемый шум v(t) имеет верхнюю границу V и вход b(t) принадлежит известному ограниченному интервалу [fc(t),6(/)] для всех ieRt.
Допущение 6. Матрица А4(в) принадлежит интервалу [М,АЛ] для всех />0, который известен для заданного множества 0.
Рассмотрим два случая:
3.1 Неотрицательные системы с переменными параметрами
Это более простой для анализа случай неотрицательной системы (8) (однако, широко встречаемый в приложениях).
Допущение 7. *(г)еR" и i(()eR" положительные для всех tèO: ЛА = 0.
Из Допущений 5 и 7 также следует, что è(r),6(/)eR" положительные для всех <>0. Отметим, что условие 6(i)eR" является обязательным при АА(р) = 0, для того, чтобы система (8) была неотрицательной. Последнее условие А4 = 0 означает, что А^ является минимальным значением4,+АЛ(0) для ве© и АА>0, это условие всегда может быть удовлетворено, учитывая Допущение 6 и при подходящем сдвиге А0, ДА
и АА (для неотрицательных систем такое ограничение упрощает обозначения).
Обозначим как х,х нижнюю и верхнюю границы оценки состояния x(t) соответственно. Введем две матрицы коэффициентов усиления наблюдателя L,L eR™', значения которых будут определены позднее, тогда интервальный наблюдатель для неотрицательной системы (8) может быть записан следующим образом:
à = [A, ~LÇ]x + max{0,iy -Ш VEJ + b(t),
_ _ _ _ _ tg\
х=[А>-LC + &Âip+Ly-\L\VEn+b(t).
Теорема 3. Пусть Допущения 5-7 удовлетворяются, матрицы Д,-LC, A^-LC мецлеровы и следующие соотношения могут быть выполнены для некоторых Я, >0,Aj >0:
[Д, - ТС + Д^ уЦ + 2ТЕ, < О, А, — уЕп <0, / = 1,2, ¿С>0, ¿С£0
для скалярного />0 и 2еК""> Оо<п. Тогда в системах (8), (9) выполняется соотношение (5):
2(0 5 *(/) 5 л(г),
при условии, что *(0) < х(0) < л(0), а х(г) е К" положительный для всех /> 0 и х,3с ограниченны. В дополнение £, коэффициент передачи передаточной функции Ъ -» Хх и Ь меньше, чем у.
Матрицы 2 и ¿, вводятся в условия устойчивости интервального наблюдателя для того, чтобы можно было улучшить/регулировать точность интервальной оценки для некоторой части переменных (например, матрица X может выбрать все координаты состояния за исключением измеряемых переменных). Отметим, что передаточные функции Ь-*гх и Ь для (8) соответствуют передаточным функциям ¿-6— и Ь —Ь —для ошибок оценки, таким образом, коэффициент усиления у действительно определяет точность интервальной оценки для (8).
Выбор значений матриц коэффициентов усиления наблюдателей Ь,Ь осуществляется в процессе решения линейных матричных неравенств для заданных 1 и у.
Замечание 1. Требование того, что матрицы А^—ЬС, А^-Тс должны быть мецлеровыми снимается при помощи замены координат г = Тх с невырожденной матрицей Г такой, что матрицы 7~1(Л0-ЛС)7\ 7~\А^-ТС)Т мецлеровы. Матрица Т может быть найдена с помощью Леммы 2 (нахождение Ь = Ь = Ь) или леммы, соответствующей Допущению 4.
3.2 Общий случай систем с переменными параметрами
Когда система с переменными параметрами (8) не является положительной, уравнения интервального наблюдателя для системы (8) принимают вид:
¿ = Ц2]х +[М*х -АА*х~-М'х* + ДЛ~ЗГ]+£у-УЕ„ +Ь{!),
Отметим, что в отличие от (9) в связи с наличием х^,х~,х*,х~, интервальный наблюдатель (10) является глобально Липшицевой нелинейной системой.
Теорема 4. Пусть выполнены Допущения 5, 6 и матрицы /^-¿С, 4,-ГС мецлеровы. Тогда соотношение (5) выполняется при условии, что х(0) <, *(0) <, х(0). Если существует РеШ.2"*2",Р = РТ >-0 и у>0 такие, что выполняется следующее матричное неравенство Риккати
СТР+Рв+2 у-2Р2 + 4 /У 4, + 2Т2 -< 0,
4,-1С+м*
где ХеМ"2п, 0<1<2яиС =
-ДА А^-ЬС + АА
тогда х, х остаются ограниченными. Кроме того, система (10) для передаточной
b х
функции - —> Z _ имеет передаточный коэффициент меньше чем у.
Таким образом, эта глава посвящена построению интервальных наблюдателей для кооперативных систем с не измеряемым вектором переменных параметров. Рассмотрены два случая: система с неотрицательными значениями состояния и общий случай. Для обоих случаев предлагаются интервальные наблюдатели, их кооперативность и устойчивость выражается через матричные неравенства. Показано, что при некоторых дополнительных нестрогих ограничениях эти неравенства могут быть представлены в форме, пригодной для применения численных методов решения. Эффективность предложенных наблюдателей продемонстрирована на численном моделировании.
В главе четыре представлены результаты экспериментального исследования разработанных алгоритмов интервального наблюдения на примере исследовательского комплекса на базе Lego Mindstorm NXT. На основе данной платформы были сконструированы «робот-сегвей» (Segway) и «робот-болбот» (BallBot) и произведен анализ их математических моделей. В двух частях главы представлены кинематические схемы, конструкции, математические описания и технические особенности комплексов.
В первой части главы представлено моделирование системы для комплекса «Робот-сегвей». Сегвей - это балансирующий двухколесный мобильный робот. На рис. 2а представлена общая трехмерная модель балансирующей системы, в которой W — ширина системы, D - толщина, Н — высота, 0, и вг - углы поворота левого и правого колес соответственно, R - радиус колеса. Для стабилизации объекта необходимо перемещать в горизонтальной плоскости точку подвеса маятника, т.е. подвижное основание системы.
V
- /
Ш " о ' /
«УЧ
; « í:
Рисунок 2 - Система перевернутого маятника на подвижном основании
На рис. 26 изображен вид слева, а на рис. 2в - вид сверху и определена система координат х, у, z в рамках которой синтезируется математическая модель. Перевернутый маятник:
x¡ =х2; х2 = -0)(t)2 sin (л,)-k(t)x2 +b(t)u; y = x¡, где х, - угол отклонения конструкции от вертикальной оси, хг - угловая скорость. Параметры системы:
ю < w{t) < к < k{t) < к; Ь< b(t) < b; ш = 0.1; ¿» = 1.2; £ = 0.4; к =1.5; 6 = 0.5; ¿=2.5;
= 0.5(<у + й)); со(() = а>а+0.5(а>-(а)соэ(1); ка=0.5[к+к); Ак = кЦ)-ка; |М(0|<<% = 0.5(£-£); к(1) = ка+8Ь\п(/); Ьа = 0.5(Ь+Ь); б(/) = 6„+0.5(6-б)со5(2г), где (У - частота маятника, & - коэффициент трения, Ь - коэффициент управления.
Представим систему в векторно-матричном виде:
х = Ах + В(0(1 ))и + /(х,у, 0(0); у = Сх.
0
А =
О 1 О -к,.
/(*„Л2,0(О) =
£{х,х,у)=
7(х,Х,у) =
3(0яп (х,)-02(Ох.
О
(у) > 0: -¿г вш (у) < 0: - а2 вт (у) О
т (у) < 0: - а>2 $т (у)
; В (0(0) =
О
М1).
5к шах {|х21,\х, |}
г(у)>0: -т хт(у)
0 0
В{и) = Гн > 0: Ь ; !(«) = Гм>0: Ъ
><0: Ъ} 1 г/ > 0: Ъ ч ^ У
+ дк тах{ х2 , х2
Результаты интервальной оценки переменных х, и хг представлены на рис. 3 и 4, соответственно.
Рисунок 3 - Переменная х,, верхняя и нижняя границы интервала ее оценок
Рисунок 4 - Переменная х2, верхняя и нижняя границы интервала ее оценок
Во второй части главы представлено моделирование системы для комплекса «Робот-болбот». Болбот - это мобильный робот, основной задачей которого является удержание собственной конструкции в положении равновесия на сферическом катке (шаре).
Параметры системы:
п 2
g = 9.81; Ms =0.013; Rs =0.026; Js=2Ms-^~; Mw =0.015; Цг = 0.022;
JW=Q.5MWLW2\ Mb =0.682; ¿ = 0.17; Л,,, =0.021; Vm=10"S; A, =0.317;
/"„,=0.0022; /s =0; k =
К
(К + Ms ) Rs2 + Js + k2 (./,„ + Jw ) MbLRs eos(ч/)-к2 (j„, + J„,) Л/(^)= , 4 ;
MhLRs eos (y/)-i2 (./,„ + Jw) -Mbls +k2 (jm +J,r)
где ¿V/v - вес мяча, Rs - радиус мяча, Js - момент инерции мяча, Мь - вес корпуса, М„, — вес колеса, R,¡. — радиус колеса, - высота колеса, Jly - момент инерции колеса, L - расстояние между центром корпуса и центром мяча, Jт - момент инерции двигателя, К, - крутящий момент двигателя, fm — коэффициент трения между корпусом и двигателем, fs - коэффициент трения между мячом и полом.
Далее осуществляется линеаризация модели, где Мк - известный изменяющийся во времени сигнал, Si — неизвестное ограниченное возмущение;
у в ф)Т =A(Mb){i+S¡).
Затем производится расчет коэффициентов усиления наблюдателя и преобразование матрицы в мецлерову форму с помощью соответствующей замены координат.
Изменение массы устройства:
SMh = 0.15МЬ = 0.102; Mb(t) = Mb + SMb sin (/).
Изменение составляет 15% от общей массы, что достаточно существенно.
Внешнее возмущение:
Д = 0.0003; ¿(t) = Asin(l5 /).
На вход системы управления подается напряжение управления двигателями. Выходом системы являются значения с энкодеров угла поворота двигателя в и угловая скорость отклонения конструкции от вертикали ф.
Положение равновесия является неустойчивым. При минимальном отклонении, необходимо двигать болбот в направлении угла наклона конструкции, чтобы удержать баланс.
Графики переменных в,1//, управляющего воздействия и и переменной S(t), а также результаты интервальной оценки переменных в,ц/ представлены на рис. 5-8 соответственно.
t tc]
Рисунок 5 - Переменные в,ц/
t W
Рисунок 6 - Управляющее воздействие и и переменная S(t)
Рисунок 7 - Переменная в, верхняя и нижняя границы интервала ее оценок в,в
* [С]
Рисунок 8 - Переменная ц/, верхняя и нижняя границы интервала ее оценок
В данной главе эффективность и работоспособность интервальных наблюдателей подтверждена численными экспериментами.
ЗАКЛЮЧЕНИЕ
В результате исследований, связанных с задачей синтеза интервального наблюдателя для ЛПП-систем, проведенных в диссертационной работе, были разработаны алгоритмы оценивания вектора состояния динамических систем с существенной сигнальной и параметрической неопределенностью в условиях, когда классические алгоритмы оценивания не могут быть применимы. В частности, получены следующие результаты:
1. Сформулированы условия построения интервального наблюдателя для кооперативных и не кооперативных ЛПП-систем.
2. Предложен интервальный наблюдатель для кооперативной ЛПП-системы, который позволяет получить множество допустимых значений вектора состояния, для случая с измеряемым вектором переменных параметров.
3. Предложен интервальный наблюдатель для некооперативной ЛПП-системы, для случая с измеряемым вектором переменных параметров.
4. Предложено преобразование координат, обеспечивающее свойство кооперативное™ исходной некооперативной системе. Это позволяет явно опустить требование кооперативное™ для построения интервального наблюдателя.
5. Предложен интервальный наблюдатель для кооперативной ЛПП-системы для случая с неотрицательными значениями состояния и не измеряемым вектором переменных параметров.
6. Предложен интервальный наблюдатель для кооперативной ЛПП-системы для случая со знакопеременными значениями состояния и не измеряемым вектором переменных параметров.
7. Для всех рассматриваемых случаев сформулированы условия применимости разработанных интервальных наблюдателей, ограниченность траекторий наблюдателя и нахождение истинных значений вектора состояний внутри полученного интервала оценок доказаны в соответствующих теоремах.
8. Разработан программный пакет, реализующий алгоритмы интервального оценивания для двух робототехнических комплексов на базе Lego Mindstorm NXT и проведена апробация программных версий полученных алгоритмов.
ПУБЛИКАЦИИ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ
Статьи из перечня ВАК:
1. Чеботарев С.Г., Кремлев А.С. Анализ линейных систем с переменными параметрами для синтеза интервальных наблюдателей // Научно-технический вестник информационных технологий, механики и оптики. 2012. №06(82). С. 5053.
2. Chebotarev S., Efimov D., Raíssi Т., Zolghadri A. On Interval Observer Design for a Class of Continuous-Time LPV Systems. Proc. IFAC NOLCOS 2013, Toulouse, 2013, P. 68-73.
3. Efimov D.V., Raíssi Т., Chebotarev S.G., Zolghadri A. Interval state observer for nonlinear time varying systems // Automática. 2013. Iss. 1. N 49. P. 200-205.
4. Чеботарев С.Г., Кремлев А.С. Синтез интервального наблюдателя для линейной системы с переменными параметрами // Известия высших учебных заведений «Приборостроение». 2013. №4(56). С. 42-47.
5. Eflmov D.V., Rai'ssi Т., Chebotarev S.G., Zolghadri A. On Set-Membership Observer Design for a Class of Periodical Time-Varying Systems // Decision and Control. IEEE annual conference. 51st 2012. CDC 2012. 10 vols. P. 6767-6772.
6. Chebotarev S., Kremlev A. Analysis conditions on interval observer synthesis for linear systems with variable parameters // 18th International Conference on Methods and Models in Automation & Robotics. 2013. P. 390-392.
Другие работы:
7. Чеботарев С.Г. Синтез интервального наблюдателя для линейных систем // Сборник тезисов XIV конференции молодых ученых «Навигация и управление движением». 2012.
8. Чеботарев С.Г. Интервальное оценивание параметров линейных систем // Сборник тезисов докладов конгресса молодых ученых, Выпуск 1. СПб: НИУ ИТМО, 2012. С. 198-199.
9. Чеботарев С.Г., Кремлев A.C. Разработка интервального наблюдателя для линейных систем с переменными параметрами при различных начальных условиях // Сборник тезисов докладов конгресса молодых ученых, Выпуск 1. СПб: НИУ ИТМО, 2013. С. 255-256.
Подписано в печать 10.10.2013 Формат 60x90/16 Бумага офсетная. Усл. печ. л. 1,5 Тираж 100 экз. Заказ 488
Отпечатано в типографии «Адмирал» 199178, Санкт-Петербург, В.О., 7-я линия, д. 84 А
Текст работы Чеботарев, Станислав Геннадьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
Санкт-Петербургский Национальный Исследовательский Университет Информационных Технологий, Механики и Оптики
04201365517 На правах рукописи
Чеботарев Станислав Геннадьевич
Синтез интервального наблюдателя для линейных систем с переменными параметрами
Специальность 05.13.01 - Системный анализ, управление и обработка информации (в технических системах)
ДИССЕРТАЦИЯ
на соискание ученой степени кандидата технических наук
Научный руководитель кандидат технических наук, доцент Кремлев Артем Сергеевич
Санкт-Петербург -2013
ОГЛАВЛЕНИЕ
Введение...............................................................................................................4
1 Введение в теорию интервальных систем. Постановка задачи..........22
1.1 Основные понятия.......................................................................................22
1.2 Обзор ЛПП-систем (линейных с переменными параметрами)..............24
1.2.1 Происхождение...................................................................................25
1.2.2 Стационарные и нестационарные системы.....................................26
1.2.3 Связи с другими системами..............................................................28
1.2.4 Области применения..........................................................................29
1.2.5 Анализ устойчивости.........................................................................29
1.2.6 Заключительные замечания...............................................................42
1.3 Интервальные наблюдатели.......................................................................43
1.3.1 Введение в теорию интервальных наблюдателей...........................43
1.3.2 Обзор работ по теории интервальных наблюдателей....................45
1.3.3 Обобщенная постановка задачи........................................................51
1.4 Заключительные выводы по главе.............................................................54
2 Построение интервального наблюдателя для ЛПП-систем с
измеряемым вектором переменных параметров..............................56
2.1 Основной результат.....................................................................................58
2.2 Числовые примеры......................................................................................64
2.3 Заключительные выводы по главе.............................................................67
3 Построение интервального наблюдателя для ЛПП-систем с
неизмеряемым вектором переменных параметров..........................68
3.1 Основной результат.....................................................................................70
3.1.1 Интервальный наблюдатель для систем с неотрицательными
значениями состояния...............................................................................71
3.1.3 Интервальный наблюдатель для систем со знакопеременными значениями состояния...............................................................................75
3.2 Числовые примеры......................................................................................78
3.3 Заключительные выводы по главе.............................................................82
4 Экспериментальные результаты моделирования полученных
алгоритмов на примере робототехнических комплексов...............83
4.1 Робот-сегвей (8е§шау).................................................................................83
4.1.1 Описание, конструкция, математическая модель...........................83
4.1.2 Результаты математического моделирования.................................86
4.2 Робот-болбот (Ва11Во1;)................................................................................89
4.2.1 Описание, конструкция, математическая модель...........................89
4.2.2 Результаты математического моделирования.................................93
4.3 Заключительные выводы по главе.............................................................97
Заключение.......................................................................................................98
Список использованных источников........................................................100
ВВЕДЕНИЕ
Несмотря на большую историю, в развитие теории автоматического управления продолжается поток работ, посвященных устройствам оценки вектора состояния систем. Это свидетельствует о том, что многие вопросы до сих пор остаются нерешенными. Теория наблюдателей, развиваемая с начала 60-х годов прошлого столетия сначала к линейным, а позже и к нелинейным системам, находит в настоящее время широкое применение и на практике. Однако спектр актуальных вопросов несколько усложнился и сместился в область исследования систем управления с неопределенными (интервальными) параметрами, нестационарных систем и др.
Значительный вклад в решение поставленных задач внесли как отечественные, так и зарубежные ученые. Среди них можно назвать таких авторов, как Андреев A.A., Воронов A.A., Мирошник И.В., Попов Е.П., Никифоров В.О., Бесекерский В.А., Ляпунов A.M., Фрадков А.Л., Солодовников В.В., Desoer С.А., Kwakernaak Н., Chen С.Т. и другие, результаты работы которых отражены в различных научных трудах и изданиях [1,2, 3, 6, 7, 8, 12, 17, 18, 20, 89].
Большинство ведущих экспертных организаций предсказывают взрывной рост применения робототехники в промышленности и быту в ближайшие годы. Одна из проблем, с которой сталкиваются разработчики, состоит в необходимости оценивания состояния объекта в условиях меняющегося окружения (температура, влажность, радиация, внешние возмущения) и варьирующихся параметров самого объекта (масса, коэффициенты трения и т.п.). Поэтому проблема оценки неизмеряемого вектора переменных состояния очень актуальна, и на сегодняшний день ее решение требуется во многих приложениях [44, 70, 109].
В рамках области систем автоматического управления и контроля существуют две задачи:
1. Задача наблюдения сводится к восстановлению неизмеряемых переменных вектора состояния объекта.
2. Задача идентификации параметров, заключающаяся в восстановлении математической модели и оценивании неизвестных параметров системы.
Из поставленных задач возникают два понятия применительно к их решению: наблюдатели и идентификаторы.
Наблюдатель - это структурный блок или алгоритм, который занимается оценкой неизмеряемых переменных состояния ОУ х, или внешней среды [1,2,12, 89]. Наблюдатель вырабатывает текущие значения оценки х(0 вектора состояния х(0 и оценки у(0 выходной переменной уЦ). Подобные устройства используются в тех случаях, когда не все переменные состояния поддаются измерениям, или же в присутствие серьезных помех измерений.
Если говорить о математической модели ОУ, то она содержит коэффициенты в\, которые являются параметрами управляемого процесса или устройства. Эти параметры могут быть записаны в виде вектора параметров в = {в1). Идентификаторы параметров используются в системах с нестационарными или неизвестными параметрами [13, 30]. Также идентификаторы применяются в адаптивных системах управления, когда параметры регулятора настраиваются в ходе работы системы [18, 13].
Стоит отметить ряд существенных преимуществ использования устройств и систем оценки вектора состояния. Во-первых, возможность восстановить недоступные для измерения переменные позволяет исключить установку дополнительных датчиков, что способствует улучшению эксплуатационных и стоимостных характеристик систем управления. Во-вторых, наличие датчиков требует учета в модели объекта управления дополнительной динамики самих датчиков, что может вызвать' проблемы синтеза обратной связи в связи с чрезмерным ростом порядка модели объекта управления. В третьих, структура наблюдателя состояния
для линейных систем совпадает со структурой фильтра Калмана, что позволяет осуществить фильтрацию (в том числе и оптимальную) выходных переменных при наличии шумов в каналах измерения. Учитывая, что, как правило, сигналы датчиков содержат шумы, вопросы фильтрации все равно приходится рассматривать. Таким образом, устройства наблюдения выполняют в системах управления двойную функцию — с одной стороны, с их помощью получают информацию о векторе состояния и параметрах объекта управления, с другой - они являются фильтрующими элементами, что существенно при наличии шумов в каналах измерений и управлений. Для терминологической точности определим термин «фильтр» как устройство для фильтрации сигналов, термин «наблюдатель» как устройство для получения оценок компонент вектора состояния.
Задача построения наблюдателя заключается в синтезе динамической системы, с помощью которой можно получить оценку вектора состояний по измеряемым данным, таким как вход и выход системы. Большое число научных работ посвящено решению данной задачи для разных классов объектов управления при различных свойствах и параметрах системы, а также доступной информации.
Основы теории наблюдателей для линейных стационарных систем управления были заложены математиком Д. Люенбергером в 1963 году. На сегодняшний день продолжается поток научных трудов, посвященных развитию данной теории, ее применению к новым классам объектов управления в разной постановке задач.
На текущем этапе развития теории автоматического управления задача оценивания неизмеряемого вектора состояния для полностью определенных линейных стационарных систем решена. Но если рассматривать системы с неопределенностями, то для них данная задача еще не нашла окончательного и однозначного решения. Работы, посвященные построению устройств оценки вектора состояния систем с неизвестными возмущениями, продолжают появляться.
Что же касается нелинейных объектов управления, то здесь задача построения наблюдателя имеет гораздо более сложный характер, и на данный момент имеет решение только для некоторых отдельных классов нелинейных динамических систем.
Множество факторов, такие как внешние возмущения, старение оборудования, погрешности измерений, оказывают негативное влияние на систему, что приводят к тому, что параметры объекта при анализе и синтезе задаются неточно. Такие системы называются системами с неопределенными параметрами. Эти параметры могут быть как интервальными, так и периодически изменяющимися или функциями некоторых переменных.
Системам управления с неопределенными параметрами всегда уделялось большое внимание. Это связано с тем, что математические модели объектов управления не всегда точно описывают физические процессы и устройства. Существует множество вариантов описания таких объектов, а, следовательно, и методов решения задач анализа и синтеза систем управления.
Среди них можно выделить объекты, описываемые моделями с мультилинейной параметрической зависимостью; полиномами с коэффициентами, являющимися непрерывными (линейными) функциями от переменной в каком-либо интервале; дисковыми полиномами; сферическими семействами полиномов; интервальными полиномами.
В задачах, где неопределённости и неоднозначности возникают с самого начала и являются неотъемлемой частью постановки задачи, интервальный анализ и его специфичные методы имеют наивысшую ценность. Интервальный анализ применяется даже в задачах, формулируемых без привлечения понятия интервала. Например, в последние десятилетия интервальный анализ получил широчайшее распространение в качестве основы для так называемых доказательных (достоверных, надёжных) вычислений на ЭВМ, несмотря на то, что в
этих приложениях интервальные методы являются всего лишь вспомогательным средством для решения не интервальных задач.
До появления и широкого распространения вычислительной техники развитие интервального анализа было весьма затруднено, т.к. он, по своей сути, алгоритмичен. Для того чтобы довести решение до числа, требуется реализация на вычислительных машинах. Но с бурным развитием методов приближённых вычислений и активным распространением ЭВМ, потребность в интервальных методах и оценках стала ощущаться достаточно остро уже в середине прошлого века. В связи с этим, первые работы по интервальному анализу появились практически в одно время и независимо в разных странах.
Одним из истоков возникновения интервального анализа и его методов была задача автоматического учета ошибок округлений в расчетах с конечной точностью. Также, был выделен целый класс неопределенностей - ограниченных по величине неопределенностей (в англоязычной литературе bounded parameter model, bounded error approach, bounded disturbances и т.д.), для которых подобные методы были хорошо применимы. Интервальное представление неопределённости отвечает достаточно широкому классу прикладных задач, т.к. является наименее ограничительным. В таких задачах часто нет оснований или недостаточно информации для того, чтобы рассматривать эту неопределённость как случайную. В связи с этим, направление исследований на разработку систем интервального наблюдения более чем обоснованно.
Бурно развивающаяся практика требовала развития аппарата для учёта неопределённостей нестатистической или, в общем случае, неизвестной природы. Этот фактор послужил развитию интервального анализа, подходящего для исследования содержательных моделей, которые основаны на достаточно общих допущениях о характере неопределённости, когда отсутствует какая-либо предварительная информация о
рассматриваемых величинах, кроме знания некоторых ограниченных множеств, к которым принадлежат значения этих величин.
Всё это указывает на необходимость исследования и решения целого ряда интервальных задач, относящихся к теории оценивания неизвестных компонент вектора состояния, а также в целом к теории автоматического управления. В особенности это имеет отношение к применению подобных алгоритмов в целом ряде прикладных областей.
Множество моделей, в том числе и моделей роботов, и различных робототехнических комплексов, описываются уравнениями с неопределенными параметрами, что приводит к затруднению синтеза наблюдателей, используя классические методы синтеза. Таким образом, на практике существуют ситуации, когда классические методы построения наблюдателей, оценки которых сходятся к точному значению состояния при отсутствии шума (например, наблюдатель Люенбергера), не применимы. В основном, причиной тому становится наличие в системе параметрической неопределенности.
Одним из возможных решений является использование алгоритмов интервальной оценки, под которой понимается синтез интервального наблюдателя, гарантирующего оценивание множества допустимых значений для вектора состояния системы (т.е. интервал значений). Решение поставленной задачи осложняется параметрической и сигнальной неопределенностью матриц модели рассматриваемой системы, что затрудняет применение классических методов синтеза наблюдателей (для линейных или нелинейных систем).
Стоит отметить, что большинство стандартных разработанных подходов имеют строгое обоснование лишь для случаев, когда модель объекта наблюдения частично линейна или близка к линейной, что препятствует их применению во многих прикладных областях, например в робототехнике. С другой стороны, широкий класс нелинейных и неопределенных систем может быть эквивалентно описан так называемыми
ЛПП-системами («линейные с переменными параметрами», от англ. LPV — Linear Parameter-Varying), когда нелинейность модели трансформируется в расширенную параметрическую неопределенность эквивалентного описания. Часто, в нелинейном случае, построение наблюдателя или регулятора основано на преобразовании системы в канонические формы, что может быть сложно реализуемо на практике. Именно поэтому класс ЛПП-систем стал очень популярным во многих практических задачах. С целью расширения спектра рассматриваемых классов систем, в данной работе будут рассматриваться ЛПП-системы, описание которых будет приведено позже.
В этом случае алгоритмы построения наблюдателей для указанного класса систем, описываемые в данной диссертационной работе, могут найти широкое применение в науке и технике. Все это приводит к необходимости использования методов интервальной оценки.
Решение задачи оценки неизмеряемого вектора состояний на сегодняшний день решается различными способами. Говоря об интервальных алгоритмах оценки, можно отметить различные подходы к построению подобных наблюдателей [43, 82, 85, 112]. Особое внимание в данной научной работе уделяется подходу к построению интервального наблюдателя, основанному на теории кооперативных систем [43, 112]. Для нелинейных систем данный подход был расширен в работе [120] на случай с использованием J11И 1-представления с известными минорной и мажорной матрицами, а в работе [119] на случай наблюдаемых нелинейных систем.
Рассматривается ситуация, когда неопределенности в описании системы являются детерминированными неизвестным функциями, зависящими от времени. Тогда, при определенных условиях, можно оценить границы ненаблюдаемых переменных, используя «робастный» подход к оценке параметров.
Ситуации, когда невозможно использовать классические методы построения наблюдателей, оценки которых сходятся к точному значению
состояния при отсутствии шума, довольно часто встречаются в теории автоматического управления. Они могут возникать при наличии в описании системы параметрических неопределенностей. Это приводит к необходимости использования алгоритмов интервальной оценки, под которой понимается синтез интервального наблюдателя, гарантирующего оценивание множества допустимых значений для вектора состояния системы.
Таким образом, развитие методов интервальной
-
Похожие работы
- Математическое моделирование производственных систем с интервальной неопределенностью параметров
- Стабилизация управляемых систем с интервальными параметрами
- Методы представления интервальных динамических систем в пространстве состояний
- Разработка интервальных методов для синтеза, анализа и диагностики некоторых механических конструкций
- Аналитический синтез регуляторов в условиях неопределенности параметров объекта управления
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность