автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами

кандидата технических наук
Елисеев, Владимир Леонидович
город
Москва
год
2012
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами»

Автореферат диссертации по теме "Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами"

На правах рукописи

Елисеев Владимир Леонидович

Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами

05.13.01 - Системный анализ, управление и обработка информации

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

5 2012

Москва - 2012

005020035

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования "Национальный исследовательский университет "МЭИ".

Научный руководитель: доктор технических наук,

профессор,

Филаретов Геннадий Федорович Официальные оппоненты. доктор технических наук,

профессор,

Лохин Валерий Михайлович доктор технических наук, профессор,

Ермуратский Петр Васильевич Ведущая организация: ОАО "Газпром автоматизация"

Защита состоится 26 апреля 2012 г. в 17 часов на заседании диссертационного совета Д 212.157.08 при ФГБОУ ВПО "НИУ МЭИ" в малом актовом зале, расположенном по адресу: 111250, Москва, Красноказарменная улица, д. 14.

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО "НИУ МЭИ".

Автореферат разослан « ^ ? » ^^_2012 г.

Отзывы и замечания по автореферату в двух экземплярах, заверенные печатью, просьба высылать по вышеуказанному адресу на имя ученого секретаря диссертационного совета.

Ученый секретарь диссертационного совета, кандидат технических наук, доцент

Анисимов Д. Н.

Введение

Актуальность работы Искусственные нейронные сети (ИНС) в настоящее время находят широкое применение в самых разных предметных областях. Они используются для идентификации статических и динамических объектов, для построения ассоциативной памяти и моделей временных рядов, сжатия информации, в системах поддержки принятия решений, для целей прогнозировании, классификации и распознавания образов, а также как средство решения некоторых задач вычислительного характера.

Одним из важных направлений использования искусственных нейронных сетей являются системы автоматического управления (САУ) различных типов. Работы по данной проблеме велись и ведутся весьма интенсивно как отечественными (А. И. Галушкин, В. А. Терехов, А. Н. Горбань, В. И. Кома-шинский, Д. А. Смирнов, Т. А. Бондарь, А. С. Логовский и др.), так и зарубежными учеными (К. Нарендра, О. Сигсро, С. Хайкин, М. Гунта, С. Осов-ский и др.).

Вместе с тем, необходимо отметить, что многие вопросы, в первую очередь связанные с практическим использованием ИНС в САУ, исследованы еще недостаточно полно. Большинство работ либо носят постановочный абстрактный характер, где основное внимание уделяется доказательству принципиальной возможности использования нейросети некоторой разновидности в определенной предметной области, либо посвящены решению относительно узких прикладных задач и не содержат обобщений, позволяющих использовать полученные результаты для решения схожих задач. В частности, отсутствуют работы, посвященные задаче замены классических регуляторов на нейросетевые, обобщающие накопленный к настоящему времени опыт их использования. Очень слабо освещены вопросы синтеза нейросетевого регулятора по критерию минимума среднеквадратической ошибки в сопоставлении со свойствами традиционного линейного регулятора. Достаточно ограничен перечень работ по нсйросетевому управлению нестационарным объектом, где,

как правило, рассматривается только случай достаточно плавного непрерывного изменения свойств объекта управления. Всё это свидетельствует о необходимости дальнейшего развития исследований по данной проблематике, в первую очередь направленную на конкретизацию процедур синтеза нейросетевых регуляторов, корректное сопоставление их свойств со свойствами аналогичных классических регуляторов. Из изложенного вытекает актуальность темы диссертационной работы.

Цель исследований Целью диссертационной работы является разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами

Задачи исследований В соответствии с указанной целью в рамках диссертационной работы поставлены и решались следующие задачи:

1. Обзор и анализ известных вариантов применения ИНС в системах управления, используемых для этих целей методов и программных средств.

2. Разработка методики построения нейросетевого регулятора - аналога П, ПИ и ПИД регуляторов и сопоставительный анализ их свойств.

3. Исследование возможностей нейросетевого подхода при построении САУ по критерию минимума среднеквадратической ошибки.

4. Разработка нейросетевых алгоритмов управления нестационарными объектами для случая спонтанного скачкообразного изменения их свойств.

5. Применение полученных методических, математических и программно-алгоритмических результатов при решении практических задач управления подвижным роботом и в учебном процессе.

Научная новизна

1. Разработана методика построения нейросетевого регулятора - аналога П, ПИ и ПИД регуляторов, впервые позволившая формализовать решение задача его проектирования, включая выбор внутренней архитектуры и структуры входов используемой ИНС, оптимальное формирование обучающей выборки, процедуру обучения ИНС и анализ его возможностей для линейного и нелинейного динамических объектов.

2. Сопоставление свойств классического и предложенного в работе нейро-сетевого регуляторов, синтезированных но критерию минимума СКО, впервые позволило показать существенно меньшую чувствительность нейросетевого варианта к отклонениям параметров объекта и сигналов от использовавшихся при их синтезе.

3. Разработан алгоритм управления нестационарным объектом для случая спонтанного скачкообразного изменения его характеристик, в котором впервые предложено комбинировано использовать нейросетевые и статистические подходы, когда статистическая компонента обеспечивает наискорейшее обнаружение значимого изменения характеристик объекта на фоне помех и запуск механизма адаптации (дообучения).

Методы исследования Полученные результаты исследования базируются на использовании методов и средств теории искусственных нейронных сетей, теории автоматического управления, математической статистики, имитационного моделирования.

Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются результатами имитационного моделирования, которые для классических САУ совпадают с известными теоретическими результатами, данными о применении разработанных методов, алгоритмов и прикладных программ в рамках натурных экспериментов по унравле-

нию подвижным роботом, апробацией полученных результатов среди квалифицированных специалистов на Международном научном коллоквиуме, Германия, 2010 г., научном семинаре кафедры "Робототехнические системы и комплексы" в МГТУ им. Н.Э. Баумана (сентябрь, 2011 г.).

Практическая значимость работы Результаты исследований, выполненных в диссертационной работе, использованы при синтезе нейросетевого алгоритма управления подвижным роботом и опробованы на практике. Разработанный подход позволяет легко адаптировать нейросетевой алгоритм для управления широким классом мобильных устройств с различными массога-баритными характеристиками и динамическими свойствами без проведения их аналитической идентификации. Созданные алгоритмы легли в основу программного комплекса моделирования нейросстевых систем управления, который может использоваться для синтеза и исследования нейросстевых алгоритмов управления и их сравнения с альтернативными подходами. Данный комплекс является интерактивным, модульным, легко расширяется под специфические задачи. Его адаптированный вариант предназначен для применения в учебном процессе в качестве программного стенда при проведении лабораторных работ.

Реализация результатов Результаты работы были использованы:

• для разработки алгоритма нейросетевого управления автономным мобильным роботом в Московском государственном техническом университете им. Н.Э. Баумана;

• при создании учебно-практического лабораторного комплекса по курсу "Нейрокомпьютеры и их применение" в Национальном исследовательском университете МЭИ.

Апробация работы Результаты работы и се основные положения докладывались на российских и международных конференциях "Информационные

технологии и науке, образовании, телекоммуникации и бизнесе" - ITVSE (Ялта-Гурзуф, 2010 г., 2011 г.), "Информационные средства и технологии" (Москва, 1999 г., 2000 г.), "Актуальные проблемы защиты и безопасности" (Санкт-Петербург, 2006 г.), "International Scientific Colloquium" (Ильменау, Германия, 2000 г., 2010 г.), на заседании кафедры "Управление и информатика" Национального исследовательского университета МЭИ.

Публикации По результатам исследований опубликовано 13 научных работ, в том числе, 2 публикации в рецензируемых журналах, входящих в список ВАК РФ.

Структура и объем работы Диссертационная работа состоит из введения, шести глав, заключения и списка литературы из 85 наименований, включает 208 страниц текста, 75 рисунков, 14 таблиц.

Содержание работы

Во Введении обоснована актуальность диссертационной работы, сформулирована цель и аргументирована научная новизна исследований, показана практическая значимость полученных результатов, представлены выносимые на защиту научные положения.

Первая глава содержит обзор литературы и анализ современных тенденций применения нейронных сетей в задачах автоматического управления. Отмечено частое использование нейронных сетей (НС) для управления промышленными технологическими процессами, а также в робототехнике. Ключевыми преимуществами нейронных сетей в этих случаях являются обучение на примерах, не требующее аналитической идентификации, и нелинейная природа, адекватная нелинейным объектам.

Основными и наиболее перспективными ролями НС общепризнано считается их использование в качестве регулятора (в том числе, с регулятором

другого типа) и модели объекта управления. Прочие варианты (настройка регулятора другого типа, классификация состояний объекта и пр.), судя по публикациям, используются существенно реже. Тем не менее, задача сопоставления нейросетевых регуляторов с другими подходами, в частности, с ПИД регуляторами, систематически не решалась. В публикациях данная тема, как правило, затрагивается только с позиций показа преимуществ нейросетевых регуляторов, в то же время очевидно, что любой подход должен иметь свои ограничения и недостатки.

Другим неисследованным объектом сопоставления является линейный винеровский оптимальный регулятор. Критерий его синтеза — минимум сред-неквадратической ошибки управления (СКО) — совпадает с критерием обучения нсйросетевого регулятора в контуре управления во многих публикациях как в стационарных, так и нестационарных условиях. Однако такого сопоставления никто не проводил, несмотря на его корректность, а также очевидное научное и практическое значение.

Проблема нсйросетевого управления нестационарным объектом, как правило, рассматривается исследователями в постановке с гладким изменением параметров. Важный в теоретическом и практическом плане случай ступенчатого изменения параметров в опубликованных работах рассматривается редко и недостаточно систематически, что оставляет много вопросов по методике, быстродействию и устойчивости процесса адаптации нсйросетевого регулятора к изменившемся условиям.

Незавершенность теории НС делает обоснованным использование разнообразных эвристик, а также применение имитационного эксперимента как основного метода исследований. Это характерно для большинства опубликованных работ. В то же время, авторы редко аргументируют причины принятия тех или иных решений, а некоторые аспекты, например, формирование обучающей выборки, почти всегда остаются за рамками публикации.

Учитывая эвристический характер проектирования нейросетевых систем управления, особое значение приобретают программные инструментальные

средства, позволяющие быстро и удобно настраивать и моделировать такие системы, а также оценивать качество управления в сравнении с традиционными подходами. Для использования в учебном процессе такие программы должны быть просты в освоении, иметь скромные требования к производительности компьютера и, что весьма желательно, базироваться на открытых и бесплатных технологиях.

Вторая глава посвящена разработке методики синтеза нейросетевого аналога ПИД регулятора в системе управления с одномерным линейным объектом. Пусть вк — ошибка управления в момент времени t^, Uk — управляющее воздействие на объект, а /(е^, s) — функция ПИД регулятора (s — его состояние). Для обучения неиросетсвого аналога ПИД регулятора вне контура управления решалась оптимизационная задача вида:

£(/(et) s)-^(it))2->mm (1)

к

где J\fp — функция НС со структурой многослойного иерсептрона, it — значения на входах нейросети, I — область возможных значений входов для регулятора. Данная задача нейросетевой аппроксимации неизвестной таблично заданной функции / имеет типовое решение градиентным методом (например, back-propagation of error), однако говорить о методике синтеза можно только при обоснованном выборе набора входов НС, внутренней архитектуры и обучающих данных.

Эксперименты с различными наборами входов НС-Р выявили зависимость ошибки имитации от вида рабочего изменения уставки. Для постоянной уставки rfc = const оптимальным выбором являются е^ .. . efc_(j и е^., Де^, где d — длительность переходного процесса в исходной САУ в отсчетах. Для переменной уставки наилучший результат дают входы г^, е^. Для кусочно-постоянной уставки наилучшим является вариант гд-, ед.... e^-j.

При использовании правильно подобранной структуры входов зависимости качества имитации от количества слоев НС-Р и нейронов в них не было обнаружено. В этой связи представляется целесообразным использовать

простые двух- и трехслойные сети, теоретически обеспечивающие аппроксимацию произвольной функции. Выбор алгоритма обучения НС также не оказывает существенного влияния на ошибку имитации и управления НС Р, а определяет только скорость самого обучения.

В проведенных имитационных экспериментах было обнаружено, что наилучшим пробным сигналом для формирования обучающего множества является стохастический ряд, распределенный в диапазоне рабочих уставок. Использование моногармонического сигнала даст худший результат, а ступенчатый пробный сигнал совсем не позволил настроить НС Р подобно ПИД. Важным аспектом при формировании обучающей выборки является такое распределение амплитуд сигналов на входе и выходе регулятора, которое охватывает диапазон этих сигналов в основных рабочих режимах контура.

Анализ результатов экспериментов показал, что малая ошибка имитации вне контура не всегда обеспечивает малую ошибку управления в контуре синтезированным НС Р. В этом проявляется нелинейная природа НС Р. В частности, как уже отмечалось, настройка НС-Р по ступенчатому пробному сигналу не обеспечивает устойчивое управление в контуре по причине малой площади покрытия обучающими точками рабочего диапазона.

Отмечено, что синтезированный НС-Р в отличие от ПИД не обеспечивал нулевую ошибку управления даже по окончании переходного процесса. Эта ошибка в проведенных экспериментах не превышала 2% от ширины рабочего диапазона уставок. В то же время, сам переходный процесс под управлением НС-Р становился короче, а перерегулирование — меньше.

Предложенная методика замены ПИД регулятора на нейроссгевой применена для управления объектом третьего порядка в присутствии аддитивной помехи в канале наблюдения. Структура и параметры объекта Р*{г), исходного ПИД-рсгулятора Ср10(г), а также формирующего фильтра стоха-

стической уставки R*(z) и помехи N*(z) перечислены ниже:

z3 - 0 1

Р*(-,\ = _"___

W (z — 0.8)(г2 — О.Обг + 0.58)

= 0.01 (l + + (2)

N*(z) = 0.07

Архитектура предложенного НС Р представлена на рис. 1.

Рис. 1. Архитектура нейросетевого регулятора с входами г^, е^

В результате проведенной процедуры обучения был получен НС Р, обеспечивший на стохастической выборке снижение среднеквадратической ошибки управления на 33%, а максимальной ошибки управления — на 34% по сравнению с исходным ПИД регулятором. Аналогичные результаты получаются и для объектов более высокого порядка.

Разработанная методика не опирается на предположение о линейности объекта, поэтому она была проверена на существенно нелинейном объекте — химическом реакторе непрерывного действия с перемешиванием (continuous stirred-tank reactor). Синтезированный нейросетевой аналог ПИД регулятора обеспечил устойчивость контура управления, лучшее перерегулирование, более короткий переходный процесс, а также меньшую СКО управления.

В третьей главе предложен метод синтеза нейросетевого регулятора, минимизирующего СКО управления в контуре — нейросетевого оптимально-

го регулятора (НОР). Данный метод является развитием косвенного адаптивного управления, однако, в отличие от него, в качестве начального приближения берется НС-Р, полученный в результате имитации некоторого линейного регулятора по методике, изложенной в главе 2.

Критерий синтеза для объекта с наблюдаемой функцией д{ик, в) и аддитивной помехой в канале наблюдения пк:

{гк - д(щ, в) - щ)2 тт

(3)

где ик = ЛГр(1к) — управляющее воздействие НС-Р. Приведение ошибки управления к выходу НС-Р можно осуществить с помощью нейросетсвой модели объекта (НС-О) по схеме, показанной на рис. 2.

Рис. 2. Обучение нейросетевого регулятора с помощью инвертирования модели объекта.

Обратное распространение ошибки управления через НС-0 к НС-Р, обозначаемое как В°{щ, ук+\,гк+\), неявно вычисляет якобиан объекта

В"(ик,ук+1,гк+1) = г 1{ик) + {гш-ук)/^

(4)

Задача сформулирована в предположении фиксированной архитектуры НС-Р. В этом случае, вопросы выбора набора входов и архитектуры решались только для НС-О. Поскольку нейросетевая модель объекта с обратными связями имеет известные сложности в использовании (необходим анализ устойчивости, существует проблема исчезающего градиента при обучении),

за основу был взят многослойный нсрссптрон, реализующий модель предсказания выхода объекта за счет информации о прошлых выходах объекта и управляющем воздействии (рис. 3).

Рис. 3. Пример модели с повторением прошлых состояний = №(пк,Ук,Ук-1)-

Обучение НС-О вне контура управления осуществлялось по критерию: (<?(иь s) + щ - №{ик,..., ик-п, ук,..., ук-л))2 ->• min (5)

к

Эксперименты с устойчивыми минимальнофазовыми линейными объектами первого-третьего порядков показали, что существенным для обучения НС О является не порядок объекта, а его инерционность, то есть, длительность переходного процесса. Обучающее множество должно формироваться из временных рядов длины, не меньшей времени установления переходного процесса объекта.

Увеличение количества слоев с одного до двух и трех в проведенных экспериментах позволило ускорить обучение НС-0 и увеличить точность имитации. Число входных нейронов в случае многослойной сети в 1.5-3 раза превышало число входов, а каждый последующий слой состоял из меньшего числа нейронов, чем предыдущий.

Систематически исследовался вопрос формирования выборки для обучения НС-О. Было выявлено, что определяющим требованием к выборке является распределение амплитуд, соответствующее рабочей области возму-

щений и наблюдаемых выходов объекта. Пробный сигнал при этом может быть ступенчатым, гармоническим или стохастическим.

Для исследования влияния НС-0 и параметров обучения нейросстевого оптимального регулятора в контуре управления был проведен ряд имитационных экспериментов в специальных идеальных условиях повторяющегося псевдослучайного ряда уставки и помехи. Данный прием позволил установить ряд закономерностей, в частности, в противоположность результату из главы 2, было обнаружено, что более сложные архитектуры нейросстевого оптимального регулятора (НОР) оптимизируются быстрее, чем простые однослойные. В случае двух- и трехслойных НОР скорость обучения не зависит от архитектуры НС модели. Коэффициент скорости обучения при пакетном обновлении коэффициентов НОР в контуре управления целесообразно выбирать обратно пропорционально периоду обновления.

На рис. 4а показаны среднее значение и отклонение ошибки для финальной достигнутой СКО (при скорости спада СКО меньше Ю-5), а на рис. 46 — среднее и отклонение ошибки на тестовой выборке после обучения.

э о

0.0001 10000 1

100 IООО 10000

Длина эпохи б)

Рис. 4. Зависимость е2 от длительности эпохи по завершении обучения (а) и на тестовой выборке (б).

Анализ графиков свидетельствует, что в условиях эксперимента длитсль-

ность эпохи (период обновления весов НС-Р при обучении) целесообразно выбрать в пределах от 200 до 400. При меньшем значении обучение НОР подвержено случайным факторам и помехам, а при большем — увеличение длительности обучения не даст снижения СКО управления.

Проведено экспериментальное сопоставление классического винсровско-го и предложенного нсйросетсвого оптимального регулятора, синтезированного по критерию минимума СКО, в следующих условиях:

• при известной точной информации о характеристиках объекта и стохастических сигналов уставки и помехи;

• при отклонении характеристик объекта и сигналов от значений, использовавшихся при синтезе САУ;

• при уставке нсстохастичсского вида (моногармоничсский и ступенчатый сигналы).

Показано, что с точки зрения качества управления нейросстевой вариант имеет существенно меньшую чувствительность к отклонению параметров объекта и сигналов от значений, использованных при синтезе САУ. Кроме того, отмечена меньшая зависимость ошибки управления от частоты гармонической уставки в контуре с НОР но сравнению с винеровским регулятором (рис. 5).

В четвертой главе рассматривается задача нейросетевого управления нестационарным объектом в условиях спонтанного скачкообразного изменения его характеристик. Предложен и исследован новый подход адаптации НС-Р к изменившимся условиям по обнаружению разладки. Он подразумевает, что НС -Р и НС-0 в стационарном режиме неизменны. При этом ошибка идентификации нейросстевой модели используется для обнаружения разладки по дисперсии с помощью алгоритма кумулятивных сумм (АКС).

По обнаружению разладки необходимо собрать данные для перенастройки нейросстевой модели объекта вне контура управления, обучить сё и, вернув в контур, начать обучение НС-Р подобно тому, как это описано в главе

Частота, 1/отсчеты

а)

0.1

Частота, 1/отсчеты

б)

Рис. о. Зависимость максимальной (а) и среднеквадратической ошибки управления (б) от частоты гармонической уставки при винеровском и нейросетевом оптимальном управлении.

3. При этом важно чтобы, с одной стороны, обучающая выборка для модели была как можно короче, чтобы быстрее начать подстройку НС Р, с другой стороны, выборка должна быть достаточного объема для обучения НС-О. Разработан оригинальный подход, позволяющий использовать данные двух последних процедур АКС и сформировать обучающую выборку оптимального размера на основе оценки параметров распределения точек (ыд.,у/с+1)-

Традиционным подходом нейросетевого управления нестационарным объектом является метод постоянной адаптации (ПА). В нем реализована схема косвенного адаптивного управления с постоянно обучающейся моделью объекта, таким образом, подстраиваются весовые коэффициенты как НС-Р, так и НС-0 независимо от того, изменился объект управления или нет. При изменении параметров объекта в схеме с ПА подстройка обеих НС начинается уже со следующей эпохи. В то же время, ПА подразумевает, что некоторые изменения НС-Р и НС-0 происходят даже в стационарных условиях.

Сравнительные испытания обоих адаптивных подходов проиллюстрированы на рис. 6. На графиках рис. 6а видно, что при ПА реакция на изменение объекта происходит быстрее, не допускается значительного увеличения ошибки управления, однако уровень СКО снижается достаточно медленно. Адаптация по разладке (АР) имеет задержку, вызванную сбором данных для

перенастройки НС-Р, однако СКО управления после этого снижается значительно быстрее. Кроме того, рассмотрение обоих подходов на длительном временном интервале выявляет неустойчивость подхода ПА (периоды роста ошибки на рис. 66).

а) б)

Рис. 6. Среднеквадратическая ошибка управления сразу после изменения параметров объекта (а) и во время длительного периода стационарности (б).

Пятая глава посвящена применению теоретических результатов глав 2 и 3 для решения одной из актуальных прикладных задач — управлению мобильным роботом при движении к неподвижной цели (маяку). Мобильный робот представляет собой тележку с тремя колесами, два из которых являются ведущими, расположены спереди и одно рояльное сзади. Управление движением робота осуществляется подачей одинакового или различающегося напряжения на ведущие приводы. Сенсором выступает видеокамера, с помощью которой определяется горизонтальное отклонение положения робота от направления на маяк.

Задача управления является нелинейной геометрически и динамически, имеет место ошибка в определении направления на маяк, кроме того, параметры приводов не известны точно. В таких условиях имевшийся на роботе линейный П регулятор давал существенную ошибку попадания в цель. По методикам, изложенным в главах 2 и 3 был сначала синтезирован НС-Р,

функционирующий подобно исходному П регулятору, а йотом с помощью настроенной нсйросетевой модели НС-Р был обучен в контуре управления для минимизации СКО. Поскольку постановка задачи подразумевает поддержание постоянного уровня уставки Гк = 0, а объект управления нелинейный, для НС-Р была выбрана трехслойная архитектура с пятью и тремя нейронами в скрытых слоях и входами еь Дед.. Модель объекта имела в качестве входов ик,ик-1,Ук,Ук-1 и один скрытый слой с пятью нейронами.

Эксперименты показали, что нейросетевое управление позволило существенно увеличить точность попадания в маяк по сравнению с исходным П регулятором: средняя ошибка уменьшилась с 49.6 мм до 19.1 мм, а срсдне-квадратическое отклонение уменьшилось с 206.6 мм до 33.0 мм. Графики изменения горизонтальной координаты маяка в поле зрения сенсора робота по времени приведены на рис. 7.

а

о

! ' ' / ' / 1 / /

и -

5

Е Я

ЕС

а

о

о «

; . 1 1в1 165! - 1 2пв ------- ■• ?...... • : - • зги (в«!........• ! 1 1 1ев1---- 5Л 1ю1------

Л' Г 1 < (ПК / - X /х^^ 61 —

Чу 1 ЧЛУ ^ 1 ' ' г ' ! "1

. / . . 1 __________1 _.....1 ___ __ _.....1 . . , . --

50 60 ТО 80

Время, отсчеты а)

Время, отсчеты б)

Рис. 7. Траектория координаты маяка в иоле зрения сенсора робота под управлением П регулятора (а) и нейросетевого регулятора но окончании его настройки в контуре (6).

В шестой главе описывается программный пакет для моделирования и обучения методам нейросетевого управления, разработанный для реализации методик, описанных в главах 2-4 и использовавшийся при проведении всех экспериментов, включая управление мобильным роботом. Пакет обес-

почивает полный комплекс инструментов для моделирования САУ включая нелинейные и нестационарные элементы, а также обладает средствами формирования архитектуры и обучения нейронных сетей регулятора и модели.

Состав программного обеспечения включает ряд вычислительных программ, написанных на языке С++ и реализующих алгоритмы моделирования и обучения нейронных сетей, а также интерактивные программы, написанные на языке Tcl/Tk, обеспечивающие простую и удобную для пользователя среду взаимодействия. Пакет разработан для ОС Linux, но может быть легко адаптирован для ОС Windows и MacOS X.

Для моделирования САУ и обучения нейронных сетей в различных схемах их использования в рамках пакета разработана объектно-ориентированная библиотека, использующая в качестве базовой абстракции сети Петри. Пакет открыт для интеграции и расширения функциональности путем разработки сторонних модулей.

Программный пакет адаптирован для использования в учебном процессе. На основе пакета разработаны лабораторные работы к учебному курсу "Нейрокомпьютеры и их применение" на кафедре "Управления и информатики" НИУ МЭИ по темам:

• Синтез нейросетевого оптимального регулятора для замены линейного.

• Сравнительный анализ НОР, вннеровского и ПИД регуляторов.

• Нейросетевое управление нестационарным объектом.

Основные результаты

1. Разработана и успешно опробована в ряде имитационных экспериментов методика замены линейных П, ПИ, ПИД регуляторов на нейросете-вой. В рамках методики решены актуальные вопросы выбора архитектуры нейронной сети регулятора, параметров экспериментальных выборок и алгоритма обучения. Исследовано влияние указанных аспектов,

а также вида и длины пробных сигналов на качество имитации традиционного регулятора нейросетевым. Показана применимость методики для управления линейными объектами первого и более высоких порядков, а также существенно нелинейным объектом.

2. Предложен алгоритм синтеза нейросетевого оптимального регулятора, минимизирующий среднеквадратическую ошибку управления. Алгоритм использует нейросетевую инверсию по модели предсказания объекта и рассматривается в случае стохастических сигналов уставки и помехи.

3. Показана большая робастность нейросетевого оптимального регулятора по сравнению с винеровским в условиях отличия характеристик объекта и сигналов от номинальных, использовавшихся при синтезе САУ. Кроме того, преимуществом нейросетевого оптимального регулятора перед винеровским является удобство синтеза, так как нет ограничений на физическую реализуемость и нет необходимости в аналитической идентификации объекта и сигналов.

4. Разработан и исследован нсйросетевой алгоритм управления нестационарным объектом с адаптацией по обнаружению разладки с помощью алгоритма кумулятивных сумм. Проведено сравнение разработанного алгоритма с распространенным методом постоянной адаптации. Отмечено, что алгоритм с обнаружением разладки обеспечивает большую экономичность и устойчивость управления, чем метод с постоянной адаптацией регулятора.

5. В натурных экспериментах решена задача нейросетевого управления автономным мобильным роботом при движении на неподвижный маяк. Использовались предложенные методики по замене линейного регулятора на нсйросетевой и синтеза нейросетевого оптимального регулятора.

6. Развитые методы нейросетевого управления реализованы в оригинальном модульном интерактивном программном пакете, обеспечивающем

полную среду для изучения и сопоставления нейросстевых алгоритмов в системах автоматического управления. Данный комплекс адаптирован для использования в учебном процессе в качестве базового для проведения лабораторных и исследовательских работ студентами.

Публикации по теме диссертации

1. Елисеев В. Л., Филаретов Г. Ф. Методика синтеза нейросете-вой системы управления нестационарным объектом // Вестник МЭИ. 2010. № 3. С. 100-106.

2. Елисеев В. Л., Филаретов Г. Ф. Программный пакет для моделирования и обучения методам нейросетевого управления // Открытое образование. 2011. № 2(86), 4.2. С. 98-101.

3. Елисеев В. Л. Нейросетевое оптимальное управление движением мобильного робота // Доклады 10-го Всероссийского семинара "Нсйроинформа-тика и ее приложения"'. Красноярск: 2002.—октябрь.

4. Елисеев В. Л. Методика построения обучающей выборки при нсйросе-тевой идентификации в условиях стохастических сигналов // Труды XXXVII международной конференции "Информационные технологии в науке, образовании, телекоммуникации и бизнесе''. Алушта: 2010. — май.

5 . Елисеев В. Л. Нсйросетевой аналог ПИД регулятора при управлении нелинейным объектом // Труды XVI всероссийской научно-техническом конференции студентов, молодых ученых и специалистов "Новые информационные технологии в научных исследованиях". Рязань: 2011. С. 199-201.

6. Елисеев В. Л., Зенкевич С. Л. Метод нейросетевого оптимального управления // Труды Девятой Всероссийской научно-практической конферен-

ции "Актуальные проблемы защиты и безопасности". Т. 5. Санкт-Петербург: 2006.-апрель. С. 251-256.

7. Елисеев В. Л., Филаретов Г. Ф. Моделирование ПИД-контроллсра с помощью искусственной нейронной сети // Перспективные технологии автоматизации. Вологда: 1999. С. 108.

8. Елисеев В. JL, Филаретов Г. Ф. Особенности настройки нейросетевого регулятора в контуре управления // Труды XV международного научно-технического семинара "Современные технологии в задачах управления, автоматики и обработки информации". Алушта: 2006. — сентябрь. С. 155.

9. Филаретов Г. Ф., Елисеев В. JI. Нейросетевой оптимальный регулятор // Доклады международной конференции "Информационные средства и технологии". Т. 3. Москва: 2000.-октябрь. С. 64-67.

10. Филаретов Г. Ф., Елисеев В. Л. Особенности применения нейронных сетей в системах управления // Доклады международной конференции "Информационные средства и технологии". Москва: 2003.— октябрь.

11. Филаретов Г. Ф., Елисеев В. Л., Аверченков Е. О. Разработка программных средств нейросетевого моделирования случайных процессов и систем управления // Доклады международной конференции "Информационные средства и технологии". Москва: 1999. — октябрь.

12. Elisccv V. L., Filaretov G. F. Software tool for neural network control algorithm research // 45h International Scientific Colloquium,. Ihnenau Technical University: 2000. - October.

13. Filaretov G. F., Eliscev V. L. Modified Algorithm of Neural Network Control for Non-stationary Object // 55h International Scientific Colloquium. Ilmenau University of Technology: 2010. — September.

Текст работы Елисеев, Владимир Леонидович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "МЭИ"

61 12-5/2235

На правах рукописи

Елисеев Владимир Леонидович

Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами

05.13.01 - Системный анализ, управление и обработка информации

ДИССЕРТАЦИЯ

на соискание ученой степени кандидата технических наук

Научный руководитель

доктор технических наук, профессор

Филаретов Геннадий Федорович

Москва - 2012

Содержание

Введение ........................................................................5

Глава 1. Современные тенденции применения нейронных сетей

в задачах автоматического управления..............................16

1.1. Области применения нейронных сетей в современных системах управления..............................................................16

1.2. Нейронные сети как объект проектирования........................21

1.3. Роли нейронных сетей в системах управления......................27

1.4. Нейросетевой регулятор................................................28

1.5. Идентификация и нейросетевая модель объекта управления ... 33

1.6. Прочие способы применения нейронных сетей......................40

1.7. Сопоставление нейросетевых и линейных регуляторов ............43

1.8. Программные комплексы для изучения нейросетевых систем управления ....................................................................49

1.9. Выводы..................................................................52

Глава 2. Методика замены линейного регулятора на нейросетевой ..............с................................................53

2.1. Постановка задачи......................................................53

2.2. Архитектура нейросетевого регулятора..............................56

2.3. Обучающие данные....................................................62

2.4. Обучение нейронной сети регулятора и контроль качества имитации ....................................................................67

2.5. Пример с линейным объектом третьего порядка....................71

2.6. Пример с нелинейным объектом управления........................73

2.7. Выводы..................................................................78

Глава 3. Синтез нейросетевого оптимального регулятора .... 80

3.1. Постановка задачи......................................................80

3.2. Принцип обучения нейрорегулятора с использованием инверсной модели ..................................................................83

3.3. Синтез нейросетевой модели объекта управления..................90

3.4. Данные для обучения нейросетевой модели..........................95

3.5. Анализ процесса обучения нейросетевого оптимального регулятора 108

3.6. Обучение нейросетевого оптимального регулятора в реальных условиях................................119

3.7. Сравнение с винеровским оптимальным регулятором ....... 128

3.8. Выводы.................................135

Глава 4. Нейросетевое управление нестационарным объектом . 137

4.1. Метод постоянной адаптации.....................138

4.2. Метод адаптации по обнаружению разладки............141

4.3. Эксперименты в стационарных и нестационарных условиях . . . 147

4.4. Выводы.................................151

Глава 5. Нейросетевое управление мобильным роботом.....152

5.1. Описание робота............................152

5.2. Задача движения на маяк ......................154

5.3. Синтез нейросетевого регулятора..................159

5.4. Сравнительный эксперимент.....................166

5.5. Выводы.................................167

Глава 6. Программный пакет для моделирования и обучения методам нейросетевого управления...................168

6.1. Описание программного пакета...................169

6.2. Применение пакета в курсе лабораторных работ..........189

6.3. Описание лабораторных работ....................192

6.3.1. Синтез нейросетевого регулятора..............192

6.3.2. Сравнение нейросетевого, винеровского оптимального и ПИД регулятора .......................193

6.3.3. Нейросетевое управление нестационарным объектом ... 195 6.4. Выводы.................................197

Заключение...................................198

Литература...................................200

Введение

Актуальность работы Искусственные нейронные сети (ИНС) в настоящее время находят широкое применение в самых разных предметных областях. Они используются для идентификации статических и динамических объектов, для построения ассоциативной памяти и моделей временных рядов, сжатия информации, в системах поддержки принятия решений, для целей прогнозирования, классификации и распознавания образов, а также как средство решения некоторых задач вычислительного характера.

Одним из важных направлений использования искусственных нейронных сетей являются системы автоматического управления (САУ) различных типов. Работы по данной проблеме велись и ведутся весьма интенсивно как отечественными (А. И. Галушкин, В. А. Терехов, А. Н. Горбань, В. И. Комашинский, Д. А. Смирнов, Т. А. Бондарь, А. С. Логовский и др.), так и зарубежными учеными (К. Нарендра, О. Сигеро, С. Хайкин, М. Гупта, С. Осовский и др.).

Вместе с тем, необходимо отметить, что многие вопросы, в первую очередь связанные с практическим использованием ИНС в САУ, исследованы еще недостаточно полно. Большинство работ либо носят постановочный абстрактный характер, где основное внимание уделяется доказательству принципиальной возможности использования нейросети некоторой разновидности в определенной предметной области, либо посвящены решению относительно узких прикладных задач и не содержат обобщений, позволяющих использовать полученные результаты для решения схожих задач. В частности, отсутствуют работы, посвященные задаче замены классических регуляторов на нейросетевые, обобщающие накопленный к настоящему времени опыт их использования. Очень слабо освещены вопросы синтеза нейросетевого регулятора по критерию минимума среднеквадратической ошибки в сопоставлении со свойствами традиционного линейного регулятора. Достаточно ограничен перечень работ по нейросетево-му управлению нестационарным объектом, где, как правило, рассматривается только случай достаточно плавного непрерывного изменения свойств объекта

управления. Всё это свидетельствует о необходимости дальнейшего развития исследований по данной проблематике, в первую очередь направленную на конкретизацию процедур синтеза нейросетевых регуляторов, корректное сопоставление их свойств со свойствами аналогичных классических регуляторов. Из изложенного вытекает актуальность темы диссертационной работы.

Цель исследований Целью диссертационной работы является разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами

Задачи исследований В соответствии с указанной целью в рамках диссертационной работы поставлены и решались следующие задачи:

1. Обзор и анализ известных вариантов применения ИНС в системах управления, используемых для этих целей методов и программных средств.

2. Разработка методики построения нейросетевого регулятора - аналога П, ПИ и ПИД регуляторов и сопоставительный анализ их свойств.

3. Исследование возможностей нейросетевого подхода при построении САУ по критерию минимума среднеквадратической ошибки.

4. Разработка нейросетевых алгоритмов управления нестационарными объектами для случая спонтанного скачкообразного изменения их свойств.

5. Применение полученных методических, математических и программно-алгоритмических результатов при решении практических задач управления подвижным роботом и в учебном процессе.

Научная новизна

1. Разработана методика построения нейросетевого регулятора — аналога П, ПИ и ПИД регуляторов, впервые позволившая формализовать решение задачи его проектирования, включая выбор внутренней архитектуры и структуры входов используемой ИНС, оптимальное формирование обучающей выборки, процедуру обучения ИНС и анализ его возможностей для линейного и нелинейного динамических объектов.

2. Сопоставление свойств классического и предложенного в работе нейросетевого регуляторов, синтезированных по критерию минимума СКО, впервые позволило показать существенно меньшую чувствительность нейросетевого варианта к отклонениям параметров объекта и сигналов от использовавшихся при их синтезе.

3. Разработан алгоритм управления нестационарным объектом для случая спонтанного скачкообразного изменения его характеристик, в котором впервые предложено комбинировано использовать нейросетевые и статистические подходы, когда статистическая компонента обеспечивает наискорейшее обнаружение значимого изменения характеристик объекта на фоне помех и запуск механизма адаптации (дообучения).

Методы исследования Полученные результаты исследования базируются на использовании методов и средств теории искусственных нейронных сетей, теории автоматического управления, математической статистики, имитационного моделирования.

Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются результатами имитационного моделирования, которые для классических САУ совпадают с известными теоретическими результатами, данными о применении разработанных методов, алгоритмов и прикладных программ в рамках натурных экспериментов по управлению подвиж-

ным роботом, апробацией полученных результатов среди квалифицированных специалистов на Международном научном коллоквиуме, Германия, 2010 г., научном семинаре кафедры "Робототехнические системы и комплексы" в МГТУ им. Н.Э. Баумана (сентябрь, 2011 г.).

Практическая значимость работы Результаты исследований, выполненных в диссертационной работе, использованы при синтезе нейросетевого алгоритма управления подвижным роботом и опробованы на практике. Разработанный подход позволяет легко адаптировать нейросетевой алгоритм для управления широким классом мобильных устройств с различными массогабаритны-ми характеристиками и динамическими свойствами без проведения их аналитической идентификации. Созданные алгоритмы легли в основу программного комплекса моделирования нейросетевых систем управления, который может использоваться для синтеза и исследования нейросетевых алгоритмов управления и их сравнения с альтернативными подходами. Данный комплекс является интерактивным, модульным, легко расширяется под специфические задачи. Его адаптированный вариант предназначен для применения в учебном процессе в качестве программного стенда при проведении лабораторных работ.

Реализация результатов Результаты работы были использованы:

• для разработки алгоритма нейросетевого управления автономным мобильным роботом в Московском государственном техническом университете им. Н.Э. Баумана;

• при создании учебно-практического лабораторного комплекса по курсу "Нейрокомпьютеры и их применение" в Национальном исследовательском университете МЭИ.

Апробация работы Результаты работы и ее основные положения докладывались на российских и международных конференциях "Информационные тех-

нологии в науке, образовании, телекоммуникации и бизнесе" - IT+SE (Ялта-Гурзуф, 2010 г., 2011 г.), "Информационные средства и технологии" (Москва, 1999 г., 2000 г.), "Актуальные проблемы защиты и безопасности" (Санкт-Петербург, 2006 г.), "International Scientific Colloquium" (Ильменау, Германия, 2000 г., 2010 г.), на заседании кафедры "Управление и информатика" Национального исследовательского университета МЭИ.

Публикации По результатам исследований опубликовано 13 научных работ [12-19, 38-40, 52, 54], в том числе, 2 публикации в рецензируемых журналах, входящих в список ВАК РФ: [18, 19].

Структура и объем работы Диссертационная работа состоит из введения, шести глав, заключения и списка литературы из 85 наименований, включает 208 страниц текста, 75 рисунков, 14 таблиц.

Краткий обзор глав В первой главе делается обзор прикладных областей, в которых активно исследуются вопросы применения нейронных сетей в системах управления. Дается краткий анализ причин актуальности этих исследований.

Рассматриваются основные архитектуры нейронных сетей, применяемые в системах управления. Описывается их устройство и проводится классификация по способу реализации динамических свойств. Перечисляются базовые и усовершенствованные алгоритмы обучения. Формулируются вопросы, возникающие при проектировании нейросети для решения конкретной прикладной задачи.

На основе анализа литературы перечисляются основные способы применения нейронных сетей в системах управления. Подробно рассматриваются и анализируются различные подходы к синтезу нейросетевого регулятора. Описываются основные схемы обучения, применяемые исследователями, и их свойства. Далее делается обзор методов нейросетевой идентификации и их сопоставление с методами линейной идентификации. Приводятся схемы реализации нейросете-

вых моделей и отмечаются характерные особенности при их синтезе и эксплуатации. В отдельную группу выделены прочие способы использования потенциала нейронных сетей. Сюда отнесены гибридные регуляторы, нейросети-настрой-щики регуляторов иных типов и алгоритмы нейросетевой фильтрации.

Подчеркивается важность проведения систематического сопоставления традиционных линейных и нейросетевых регуляторов, а также выявления отличительных свойств последних. Анализируются публикации по данной тематике. Отмечается целесообразность сравнения как с наиболее распространенным ПИД регулятором из-за высокой практической ценности такого исследования, так и с винеровским оптимальным регулятором в силу эквивалентности постановки задачи синтеза, что делает сопоставление максимально корректным.

Рассматриваются основные задачи, возникающие при изучении нейронных сетей в системах управления. Отмечается неполнота их реализации в основных пакетах универсального и нейросетевого моделирования. Отдельно рассматриваются опНпе-ресурсы, используемые для демонстрации нейросетевых алгоритмов и подчеркиваются их недостатки с точки зрения преподавателя высшей школы. Делается вывод об актуальности разработки программного пакета, совмещающего в себе возможности моделирования САУ и обучения нейронных сетей с целью использования в учебном процессе.

Во второй главе формулируется задача замены ПИД регулятора на нейросетевой с позиции аппроксимации функции ПИД регулятора нейросетью вне контура управления по критерию минимизации среднеквадратической ошибки имитации. Определяются основные этапы методики синтеза нейросетевого регулятора (НС-Р), среди которых выбор архитектуры нейросети, сбор обучающих данных, обучение, проверка качества имитации и функционирования.

Далее рассматривается вопрос выбора архитектуры нейросети регулятора. Под архитектурой понимается совокупность набора входов для реализации динамических свойств, количества слоев сети и распределения нейронов в них. Последовательно рассматриваются варианты компонентов архитектуры и в рам-

ках имитационных экспериментов выявляются наиболее приемлемые из них.

Проводится исследование о влиянии вида пробного сигнала, используемого для получения обучающей выборки, на качество имитации НС-Р. Последующий анализ позволяет сформулировать основной критерий, обеспечивающий качество результирующего нейросетевого регулятора — степень равномерности распределения облака обучающих точек в многомерном пространстве области определения функции аппроксимации. Достижение минимальной плотности покрытия области определения дает необходимую длину обучающей выборки.

Приводится алгоритм пакетного обучения НС-Р методом обратного распространения ошибки. Обсуждаются вопросы выбора коэффициента скорости обучения и критерия останова, а также контроля за обобщающей способностью сети в процессе обучения. Даются используемые автором эвристические решения этих вопросов. Отмечается неэквивалентность качества имитации исходного регулятора вне контура управления и в нём.

В условиях имитационного эксперимента проведена замена нейросетевого ПИД регулятора на нейросетевой в системе с устойчивым объектом третьего порядка. При включении обученнного нейросетевого регулятора в контур вместо исходного ПИД отмечено существенное уменьшение как среднеквадратической, так и максимальной ошибки управления.

В качестве примера сформулированной методики синтеза рассматривается задача управления температурой в химическом реакторе непрерывного действия с мешалкой. Объект управления является существенно нелинейным и управляется ПИД регулятором. Последовательно применяя рекомендации методики, синтезируется нейросетевой регулятор, обеспечивающий качество управления не хуже исходного. Отмечается важность выбора подходящей архитектуры НС-Р. Анализируются свойства полученного нейросетевого регулятора по сравнению с ПИД.

В третьей главе формулируется задача синтеза нейросетевого оптимального регулятора в постановке, аналогичной винеровской фильтрации. Отмечается

важность формирования эталона для обучения нейросетевого регулятора с помощью инверсии объекта управления.

Обосновывается необходимость использования нейросетевой модели объекта управления и показывается, как такая модель может и�