автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.14, диссертация на тему:Параллельные модели и нейросетевые алгоритмы управления робототехническими системами

кандидата технических наук
Богданов, Александр Александрович
город
Санкт-Петербург
год
1998
специальность ВАК РФ
05.13.14
Автореферат по информатике, вычислительной технике и управлению на тему «Параллельные модели и нейросетевые алгоритмы управления робототехническими системами»

Автореферат диссертации по теме "Параллельные модели и нейросетевые алгоритмы управления робототехническими системами"

Р Г Б ОД

1 к дчр

На правах рукописп

БОГДАНОВ АЛЕКСА11ДР АЛЕКСАНДРОВИЧ

ПАРАЛЛЕЛЬНЫЕ МОДЕЛИ И НЕИРОСЕТЕШЕ АЛ! ОР111МЫ УПРАВЛЕНИЯ РОБОТОТЕХПИЧЕСКИМИ СИСТЕМАМИ.

Специальность 05ЛЗЛ4: - Системы обработки информации и управлении

АНТОРЕФЕРА Т

лпееертцин на соискание ученой степени кандп;ииа 1е.\инмески.\ паук

Саикт-1 [егербург 1998

Работа выполнена в Балтийском государственном техническом университете "ВОЕНМЕХ" им. Д.Ф. Устинова

Научный руководитель:

доктор технических наук, профессор Тимофеев Адиль Васильевич

Официальные оппоненты:

д.т.н., проф. Челпанов Игорь Борисович, к.т.н., проф. Веселов Вячеслав Афанасьевич

Ведущая организация:

центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики

Защита состоится " А? " _1998 года в часов минут не

заседании диссертационного совета ССК 053.10.02 в Балтийском государственно;* техническом университете "ВОЕНМЕХ" им. Д.Ф. Устинова по адресу: Санкт-Петербург ул. 1-я Красноармейская, д. 1. <=?• ^'т2

Отзывы на автореферат направлять по адресу: 198005, Санкт-Петербург, ул. 1-5 Красноармейская, д.1, БГТУ.

С диссертацией можно ознакомиться в библиотеке Балтийского государственного технического университета "ВОЕНМЕХ" им. Д.Ф. Устинова по адресу: Санкт-Петербург, ул. 1-я Красноармейская, д.1.

Автореферат разослан " " 1998 г.

Ученый секретарь диссертационного совета, кандидат технических наук, доцент В.Ю.Емельянов

"ВОЕНМЕХ" им. Д.Ф. Устинова по адресу: г. Санкт-Петербург, 1-я Красноармейская ул., 1. С диссертацией можно ознакомиться в библиотеке университета.

ПРИЛОЖЕНИЕ: 1. Автореферат.

Ученый секретарь специализированного совета ССК 053.10.02

» То суд,

I [:"

В.Ю. Емельянов

Министерство обшего и профессионального образования Российской Федерации

БАЛТИЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ "ВОЕНМЕХ" имени Д.Ф.Устинова The Baltic State Technical University

198005, Санкт-Петербург, 1-ая Красноармейская ул., 1 тел/факс 3162409

198005 Russia, Sankt-Petersburg, 1-aja Krasnoarmejskaja 1 phone/fax 3162409

i тФН/ffC от -/ ¿-у/?/?, 1998 г.

Российская государственная библиотека

101000, Москва, ул. Воздвиженка, 3

A A IITT____________________»

Общая характеристика работы

Актуальность темы. В настоящее время теория управления хорошо разработана для определенного класса задач, при которых объекты управления имею г точное математическое описание. Классическая теория также стремится обеспечивать некоторую робастность систем, которая обычно имеет место лишь для омюепче.тыю малых диапазонов неопределенностей. Однако многие сиаемы управления должны работать и работают в условиях большой неопределенности процессов и для надежного функционирования требуют вмешательства человека. Непосредственное человеческое участие недопустимо в решении большинства прикладных задач реального времени особенно в экстремальных условиях. Кроме того, интеллектуальную обрабо1ку новых, непредвиденных ситуаций, необходимую в системах робототехники. трудно и иногда даже невозможно решить в реальном масштабе времени известными аналитическими методами. Искусственные нейронные сети (НС) в состоянии обобщэтъ (интерполировать и экстраполировать) зависимости "вход-выход", синтезируемые на базе избранных примеров, они работают быстро и эффективно. Из литературного обзора можно сделать вывод, что НС способны решать многие задачи управления в робототехнике. Они обеспечивают значительный выигрыш в быстродействии.

Целыо работы является разработка и исследование систем управления манипуляционных роботов с использованием НС. При этом решались следующие задачи:

1. Разработка и исследование новых алгоритмов оптимального и адаптивного управления роботами и способов их параллельной реализации.

2. Оценка робастноети разработанных алгоритмов нсйросегевого управления.

3. Разработка методики проектирования систем управления роботами на базе НС.

4. Разработка модели нейросетевого программатора движении и алгоритма настройки его параметров.

5. Разработка алгоритмов пейросетеной идентификации (аппроксимации) обратной модели динамики робота и управления роботами на ее основе в сочетании с традиционными алгоритмами управления.

6. Разработка специализированного прог раммного обеспечения для имитационного исследования и сравнительного анализа традиционного и ненросетевою подхода к управлению роботами.

7. Исследование практических примеров работы нейроеегевой системы управления манипуляппопиого робота.

Научная новизна работы заключается в следующем:

1. Сочетание традиционных методов нелинейного управления маиипуляционными роботами и предлагаемых нейросетевых методов структурно-параметрической идентификации модели динамики роботов позволяют достичь высокого качеава управления (априорно заданного характера затухания переходных процессов) в реальном масштабе времени.

2. Разработаны алгоритмы оптимального по бысфодепавшо управления маиипуляционными роботами на основе глобальной декомпозиции нелинейной модели динамики при заданных ограничениях на ускорения звеньев манипулятора, эффективно использующие принцип максимума Л.С. Понтрягнпа для обратимых нелинейных динамических обьектов. Показано, что программаторы оптимальных движений имеют структуру однослойной нейронной сети.

3. Модели нейросетевых обучаемых программаторов движений и адаптивных регуляторов переходных процессов построены на основе теорем А.Н. Колмогорова и Д.А. Шпрехера (о возможности представления функции нескольких переменных в виде суперпозиции и суммы функций меньшего числа переменных), являющихся теоретической основой для применяющейся в диссертации многомерной нейросетевой аппроксимации нелинейных моделей динамики роботов.

4. Оценки робастности разработанных алгоритмов нейросетевого управления связывают качество переходных процессов с параметрическими и внешними возмущениями, возникающими в системе нейросетевого управления манипуляционного робота.

Практическая значимость результатов диссертационной работы определяется тем, что разработан метод нейросетевого управления, связывающий традиционный и нейросетевой подходы в задачах управления. Этот метод реализован в разработанном учебно-исследовательском программном комплексе, который позволяет проводить имитационное моделирование, исследование и сравнительный анализ классических алгоритмов управления и разработанных нейросетевых алгоритмов управления на примере манипулятора с произвольным числом степеней свободы.

Вычислительные эксперименты по исследованию систем управления робота показали, что комбинация преимуществ мощных методов традиционного управления, обеспечивающих любой априорно заданный характер переходных процессов, и нейросетевых алгоритмов, аппроксимирующих сложную нелинейную модель динамики робота с перекрестными связями, может служить импульсом к развитию новых методог проектирования и реализации интеллектуальных адаптивных систем управленш роботов, решающих практические задачи в реальном времени.

Апробация работы. Результаты работы докладывались и обсуждались нг следующих конференциях: III С.-Петербургская международная конференцю "Региональная информатика - 94", С.-Петербург, 10-13 мая 1994 г.; всероссийски» рабочий семинар "Нейроинформатика и ее приложения", Красноярск, 7-10 октября 199^ г.; IV С.-Петербургская международная конференция "Региональная информатика - 95" С.-Петербург, 15-18 мая 1995 г.; Второй международный симпозиум пс нейроинформатике и нейрокомпьютерам, Ростов-на-Дону, 1995; V С.-Петербургска; международная конференция "Региональная информатика - 96", С.-Петербург, 13-16 м&

1996 г.; International conference "ITA-96", Troyan and Sofia, Bulgaria, May 12-24, 1996 XXIV международная летняя школа ученых-механиков "Анализ и синтез нелинейны: механических колебательных систем", С.-Петербург - Зеленогорск, 1-10 июля 1996 г. международная конференция по информатике и управлению, С.-Петербург, 9-13 июн

1997 г.; международная конференция по управлению колебаниями и хаосом, С. Петербург, 27-29 августа 1997 г.

По теме диссертации опубликовано 11 научных работ, включая 2 статьи, докладов и 4 тезисов докладов.

Объем и структура диссертации. Диссертация изложена на 162 страница машинописного текста, содержит 78 рисунков, 10 таблиц и состоит из введения, обзор литературы (одна глава), главы, описывающей основные полученные научны результаты и решение поставленных задач, главы с описанием алгоритмов обучения НС использовавшихся в диссертации, главы, описывающей разработанное учебнс исследовательское программное обеспечение (с экспериментальной частью), выводов списка литературы, включающего 114 наименований работ отечественных и зарубежны авторов и приложения.

Основное содержание работы.

Во введении изложены актуальность, научная новизна и практическая значимость работы, сформулированы цель и основные задачи проведенного исследования. _

" В 'первой" главе'приведен анализ литературных данных, характеризующих нейросетевое направление в теории управления роботами и искусственного интеллекта. Представлены различные виды и архитектуры искусственных НС и области их применения.

В главе представлены также методы описания динамики /л-звенных робоюв и выбрана для исследования модель динамики в форме уравнений Лт рапжа II рода:

Л(£<7)<7 + В(£,9,<7) = г<, <7(/0)=<70, Я(>») = с/„. (1)

где - матрица [тут], характеризующая массо-инерциопные свойства

манипулятора; В[с,ц,ц) - /«-мерный векгор. характеризующий действие сил тяжести, кориолисовых и центробежных сил, и - т-мерный вектор управляющих моментов, развиваемых в приводах манипулятора, £ - /7-мерный вектор параметров. Объединяя уравнения динамики электрических приводов на базе двигателей постоянною тока с уравнениями движения манипулятора (1), получим полное описание динамики электромеханического манипулятора в виде

+В1{4,Я,4) = и, <7(/0) = 4о. я('о) = яо (2)

для случая, когда индуктивностью Ь двигателя можно пренебречь, и

Л2(£<7)<7 + = <7('о) = <7О' 4(Л)) = '/О- У'(/о) = <7о (3)

в общем случае. Преимуществом этих уравнений является простои) аналитического синтеза па их основе различных регуляторов переходных процессов. К недостаткам можно отнести высокие вычислительные затраты при определении /»-мерного векюра управления (так. для вычисления управления по уравнениям (1) требуется 32//г"'+86'/!3+171//г2+53//;-128 умножений и 25//;4+66//;1+129//Г+42//г-96 сложений, где т -число степенен свободы манипулятора).

В диссертации использованы именно уравнения Лагранжа 11 рода, так как они наглядны, позволяют формально подойти к решению задач динамики для манипуляторов как с вращательными, так и с поступательными кинематическими парами. Однако при управлении с помощью НС не возникает проблемы значительных вычислительных затрат. которая является основным недостатком прямого использования уравнений Лагранжа II рода для аналшического синтеза законов управления.

Приведен обзор существующих алгоритмов и методов традиционного управления роботами: линейные регуляторы (ПД- и ПИД-регуляторы): регуляторы Лримою: программные регуляторы: программные регуляторы с обра! ион связью: стабилизирующие, декомпозирующие и модальные регуляторы. Рассмофены также традиционные методы адаптивного управления в условиях парамефической неопределенности и неполной информации о среде, осноианнме па решении целевых эстиматорных неравенств, связывающих управления, состояния и оценки неизвестных параметров модели динамики. Кроме традиционных алгоритмов управления роботами рассмотрены и нейросетевые. Представлен обзор известных методы адаптивного нейросетевого управления. В литературе отмечено, что часто для простых (т.е. линейных

п

р=1

и слабо нелинейных) объектов управления классические методы идентификации сходятся быстрее и более точно, чем нейросетевые. Однако с использованием НС можно идентифицировать существенно нелинейные объекты управления, имея весьма малые знания о классе, структуре и параметрах, где классические алгоритмы идентификации обычно не дают удовлетворительных результатов. С другой стороны, структурно-параметрическая идентификация на базе НС исходит из моделей динамики в виде "черного ящика". Поэтому считалось, что здесь нельзя применить известные аналитические методы теории управления. Однако, как показано в диссертации, это не всегда так. В частности, в главе 2 разработан метод сочетания традиционного и нейросетевого управления для существенно нелинейного объекта с перекрестными связями, основанный на свойстве обратимости на подпространстве уравнений динамики и глобальной управляемости, сформулированном A.B. Тимофеевым, и использовании обратной динамической модели, которая аппроксимируется нейронной сетью).

Введены основные определения и теоретические положения, используемые е диссертации. В частности использована теорема А.Н. Колмогорова о представлении функций нескольких переменных в виде суперпозиции и суммы функций одногс переменного:

2л+1

где функции Xq действительны и непрерывны, а функции ц/т являются монотонно возрастающими по построению.

Р. Хехт-Нильсен указал, что эта теорема означает, что любое непрерывно« отображение f: х е Е" —»(f( (х),..., fm (х)) е Rm представимо в форме четырехслойной НС у которой скрытые нейроэлементы описываются функциями у/, Теорема А.Н Колмогорова является теоремой существования указанного разложения функций нескольких переменных в базисе функций одной переменной и указывает ш возможность аппроксимации любой непрерывной функции многих переменных ( помощью НС. Как показано в диссертации, эта теорема имеет большое значение дл; построения нейросетевых программаторов движений и регуляторов переходны> процессов роботов.

В главе 1 также развит новый подход к оценке информативности и минимизации сложности НС. Разработаны соответствующие алгоритмы для порогово полиномиальных НС, обеспечивающие обучение НС за один "показ" обучающе! выборки и минимизацию сложности НС (минимальное количество нейроэлементе! первого и второго слоев), не ухудшающую экстраполирующие свойства НС, например, i задачах распознавания образов.

Показана возможность аппаратной реализации алгоритмов нейросетевогс управления на базе цифровых сигнальных процессоров и специализированных нейро СБИС.

Концепция нейросетевого управления, принятая в диссертации, базируется н< использовании возможностей НС для параллельной обработки информации \ аппроксимации действительных функций многих переменных на основе многомерно! интерполяции п экстраполяции по заданной обучающей выборке (обучающей баз» данных). Первое из указанных свойств позволяет ускорить вычисления npi использовании и распараллеливании традиционных методов управления (организации

параллельных вычислений с помощью НС). Второе свойство позволяет строить обучающиеся программаторы движений и системы адаптивного управления роботами, работающие на принципе нейросетевой идентификации модели динамики объекта управления (синтез нейросетевых программаторов движений и регуляторов переходных процессов на основе теоремы А.Н. Колмогорова).

Во второй главе развиты методы и разработаны алгоритмы нейросетевого управления роботами.

Наиболее простым является использование НС для распараллеливания вычислительных процессов. При этом структура НС задается специально для каждой вычислительной задачи. Обучение НС в подобных задачах не проводится, а весовые коэффициенты определяются по формулам, зависящим от решаемой чадами и исходных данных. Собственно о нейросетевом подходе здесь можно говорить лишь постольку, поскольку в разрабатываемых схемах параллельных вычислений используют элементы и вычисления, свойственные НС. По существу речь идет только о нейросетевой реализации параллельных вычислений при управлении роботами в реальном времени.

Дана постановка задачи нейросетевого оптимального но быстродействию управления роботами и предложено ее решение на основе точного аналитического описания динамики исполнительных механизмов ш-звенного робота-манипулятора в виде нелинейных дифференциальных уравнений (1) или (2). дополненных внешними возмущениями я=я(1), а именно:

А{$,д)д + В^,д,д) = и + л. (4)

Требуется синтезировать оптимальное программное движение и оптимальный регулятор переходных процессов, обеспечивающие перевод исполнительною механизма из заданного начального состояния дЫ = д{).(ЦЬ>)~дв нелепое конечное состояние Ч(11> = Чт за минимальное время при заданном ограничении на ускорения

звеньев

\д,\ <а, , 1 = 1,2.....т. (5)

Дополнительно требуется разработать параллельную модель программа! ора оптимальных движений и дать ей нейросетевую интерпретацию.

Задача оптимального программного управления робоюм разделяется на две взаимосвязанные задачи: синтез оптимального программного движения д'}!" (О и синтез

оптимального закона регулирования в виде и",рГ (0. т.е. без обра шоп связи, пли в виде

и"1" д), т.е. с обратной связью по </, £/.

Синтезируем сначала закон оптимального программного управления в виде:

иор,( 0 = А(д°;',£)-д°рр1 +Ь(д°;",д;р',£). (6)

Пели начальные и внешние возмущения отсутствуют, то в силу единственности решения уравнения динамики (4) реальное и программное движения совпадаю!. В этом случае уравнение переходных процессов в замкнутой системе имеет вид

ё(г) = д(0-дЦп(0 = 0. г б[/0.А,-]. (7)

где д"рр'(0 - вектор обобщенных оптимальных программных ускорений.

удовлетворяющий условию (5). При этом замкнутая оптимальная система (4). (6) декомпозируется по управляемым координатам так. что

4,(0 = Ч°РР'(0, .....т, te[t„„tTi]c[to,tr], (8

где t0i - момент времени начала движения /'-й подсистемы (8), tT, - момент прихода /-i подсистемы в целевое состояние. Необходимо построить такое qj' (t), чтобь

наискорейшим образом попасть в точку фазового пространства с координатам! (qTl,qTi). Эта задача решается на основе принципа максимума JI.C. Понтрягина. В сил; соотношения максимума с учетом (5) находим

(9

где du, d2i - постоянные коэффициенты. Для полного решения задачи необходим! найти постоянные clu, d2i. При решении задачи на фазовой плоскости программато] оптимальных движений можно описать уравнениями

(0 = а,- • sign (- du • (f - t0i) + d2i), t e[i0l JTl},

q°pp;(t) = -arsign

4t (0 -?n + * la ' ■ siffift W -in)

(10

Также можно получить аналитическую структуру (модель) программатора оптимальны: движений с обратными связями по переменным состояния, обеспечивающего само коррекцию оптимального программного ускорения по сигналам обратной связи в виде:

<7,2 (0 ~Чт,

4% (Я, »9,-) = -«,■ • sign

4i(t)-qTi+-

2 • а,

■sign{qt{t)-qTi)

Используя формулу (11) при (0 = %' Яр! (0 = Чо, (т-е- в начальный момен времени), последовательно неизвестные параметры:

а2 -а2

¿2, = ~Чо, +Чп ~ -----~Чт<)-

2

й = -" ('я - 'о,)'

где 1$, решение системы нелинейных алгебраических уравнений вида

(12 (13

Яп = <7о, Чо,«п "'о ,)4<('о,И'г, ~tof-[ + S,gn^ 'П) +

есо,)-^, -/0,г

+ <?7 Со,) • ('s, - 'о,) ■ Сп - 's,) ~ l■ чТ Со,) • Cr, -'s, f

4n .Н'п-'У + 'М!*-^*

l+sign(tTl -tSi) 2

+ [<('„,Н'а -^-яТ'Ю-Ст, - 'д)]х 1 + 5/М2'П (И

Тогда закон оптимального программного управления без обратной связи имеет вид:

и°р'{{) = (15

Этот закон оптимального программного управления (15) обладает недостатком: в случа отклонения реального движения от программного, при подстановке управления (15)

1

модель динамики (4) получается нелинейное дифференциальное уравнение переходных процессов, отличающееся от (7). При этом замкнутая система не декомпозируется, и приведенные выше рассуждения теряют'силу. Для устранения этого недостатка рассмотрим оптималыюе программное управление с обратными связями по обобщенным координатам и скоростям вида .._.----

- -- Л'(,,с>-,/;;Ч/> (16)

Подставляя (16) в (4). всегда (при отсутствии внешних возмущений) получим (7). Синтезированный оптимальный регулятор (16) является декомпозируемым и обладает большей робастностыо. чем оптимальный программный регулятор (15). В случае присутствия начальных или внешних возмущений такой оптимальный регулятор не обеспечивает точное попадание в целевое состояние. Поэтому будем использовать модель программатора оптимальных движений с обратными связями но переменным состояния вида (11). При этом оптимальное программное ускорение д°!"(д,.д,) зависит только от текущих координат и граничных условий и обеспечивает точное попадание в целевое состояние за минимальное время. При этом модель оптимального регулятора принимает вид

иор,(Ч,ф=А(Ч,^-Грр'(Я,ф + Ь(Ч,с1,г). (17)

Для повышения робастности введем вспомогательное управление и такое, что

иор'(Ч,д) = А(д,4) ■ п(д.д) + Ь(Ш),

= + )•(?„ +Уи •(?,-Ярд + Ул "(<?, (18)

где р,=0, если ;-е звено робота (4) находится вблизи целевого состояния, и р, = \ - в противном случае, ук, (к=1,2) - коэффициенты усиления регулятора. Существует много способов выбора функции />,(</,<7). Например, можно предложить критерий насыщения стабилизирующего регулятора:

исг, = М, + Ь,(Я,<7, > и, . /= 1,2,...,/??, (19)

где М = А(д,£) ■ (др + Г2 ■ (д - др) + Г, • (д - др)), £/,|ШЧ - максимально допустимый сигнал. Рассмотренный регулятор (18) обладает переменной структурой п представляет собой комбинацию оптимального и стабилизирующего регуляторов. Использование такого регулятора позволяет избежать возникновения скользящего режима в окрестности целевого состояния.

Параллельная архитектура программатора (9) совпадает с архитектурой однослойной НС. Поэтому возникает идея о иейросстевой реализации оптимального программатора (9) с алгоритмом настройки коэффициентов синаптическнх связей йц, (12), (13). Структурная схема этого программатора представлена на Рис. 1.

Управление видов (17), (18) может быть трудно осуществимым в реальном масштабе времени, поэтому предлагается разработан, параллельную модель регулятора (17) для ускорения вычислений. Архитектура параллельного оптимального регулятора (17) представлена на Рис. 2. Эта параллельная модель реп.1яюра (17) напоминает по своей структуре НС. Она включает в себя суммаюры. перемножшелп и пороговые функции, т.е. компоненты, присущие нейроэлементам и ПС. и имеет три слоя нейроэлементов. Для управления роботом всего требуется т таких сетей (по одной на каждую управляемую координату и связанный с ней привод).

г{* 4 Ч/Ч

*п(0 9п(0

ч'Г(0

—йуОуПЗ"

<(0

орI

г орI

чЛО 9,(0

Рис.1. Архитектура параллельного нейросетевого программатора оптимальных

движений

Рис. 2. Архитектура параллельного оптимального регулятора с обратными связями.

Такая модель имеет недостаток: при использовании аналитически заданной модели динамики (4) львиная доля времени при вычислении значения управления будет затрачена на вычисление элементов матриц А и В. Поэтому для управления в реальном масштабе времени возникает необходимость вычислять обратную модель динамики (4) другими способами.

Рассмотрим работу оптимальных регуляторов вида (17) в случае, когда на систему (4) действуют внешние возмущения, т.е. или параметрические возмущения, такие что

и0"'(я,я) = Мд,д) + Ь(д,д, £). (20)

Тогда

д = ч> + /ГУд, £) • [л- + А/1 (ч,£) ■ * + Д Ь(я,ч, £)], (21)

-где

Уравнение (21) декомпозируется по управляемым координатам так, что

д. = У1>, +Д1( . (22)

Ф.Л. Черноусько показал, что системы вида (22) устойчивы всегда, если

«0,618а,. (23)

При таких уровнях возмущении система приходит в целевое состояние за конечное время (при этом может увеличиться только число переключений). Если возмущения превышают уровень (23), то при определенных условиях может произойти потеря устойчивости или бифуркация рождения предельного цикла.

Предложено решение задачи распараллеливания вычислений при адаптивном управлении, основанном на методе решения целевых эстиматорпых неравенств, для случая, когда неизвестны параметры модели динамики робота в форме Коши:

х = а С(х,г/)£, х(10)=х0, 1е{1„, /г]. (24)

Идентификация неизвестных параметров д может быть сведена к решению системы алгебраических линейных уравнений (предполагается, что модель динамики (24)

линейна относительно неизвестных параметров) вида:

)

|(?7[л:(0),и(0)]-С[л:(0),«(0)]<*0 • г — |С;/ [л-(б),!<(£>)] ■ ,\(в) Лв. (25)

Н ' 'о

Такая схема адаптивной идентификации привлекательна своей нросютой. Однако для фактического решения получающейся системы уравнений в сложных случаях может потребоваться значительное время. В то же время запаздывание в идентификации недопустимо, если искомые параметры дрейфуют достаточно быстро.

Рассмотрена задача адаптивной идентификации в реальном масштабе времени. Для модели динамики (24), заданной с точностью до варьируемых параметров £ предложена процедура идентификации неизвестных параметров, пригодная для использования в реальном масштабе времени. Она основана на ненросетевой модели идентификатора. Полный вид рекуррентной НС, решающей систему линейных уравнений, имеет вид: у(к) = /{А-т{к)-Ь),

т(к + ]) = т(к)-2-Л(к)-Ат-у(к), к = 0,1,2,..., где г(0) - начальная оценка (например, г(0)=0). Структура НС показана на Рис. 3. Как видно из (26), она представляет собой двухслойную НС с полными последовательными связями, (рхр)-входовыми нейроэлементами в первом и втором слоях, функцией активации /в первом слое и линейной функцией во втором: а также с ниш рнр.чошеп обратной связью, имеющей коэффициент усиления Л(к). При этом общая схема адаптивного нейросетевого регулятора представляется в виде, изображенном на Рис. 4.

Рис. 3. Архитектура иейросетевого идентификатора.

Регулятор . переходных поочгссов

tUWO», 't(tr)

ii_T

Динамическая модель робота

Настраиваемая модель

JU.

х

ч ,_,

, Критерий

^^ качества

Иейросетевой идентификатор

Рис. 4. Схема адаптивного управления с нейросетевым идентификатором.

К сожалению, в ряде конкретных задач точная идентификация принципиально невозможна. Известен предложенный В.А. Якубовичем и A.B. Тимофеевым общин подход к решению таких задач, согласно которому решение задачи адаптации сводится к синтезу алгоритмов решения эстиматорных неравенств вида

\\u(t)-G(x,x)-rf <8, (27)

где 6- параметр, определяющий точность решения. Построим первый слой НС в виде:

у) = f\ Tj]

чу=1

(28)

/

где ^(х,*)). синаптические веса входов нейроэлементов по г, /¡(*) - функция

активации нейроэлементов. Выход нейроэлементов первого слоя соответствует функции

от "невязки" решения неравенств (27). Поэтому представляется естественным задаться

р

линейной функцией активации с "зоной нечувствительности" равной еп где )2 = 3.

Второй слой нейроэлементов описывается линейной функцией

(р ' \

У?=/г ■ (29)

где //х) = 2 • Л(к) ■ х. НС дополняется интегрирующей обратной связью.

Более сложным и интересным методом использования НС в задачах управления

роботами является использование обучаемых моделей нейросетевых программаторов движений и регуляторов переходных процессов в сочетании с аналитически заданной моделью динамики.

Задача построения программного движения тесно связана с решением обратной задачи кинематики, т.е. с нахождением обобщенных координат, соответствующих заданным координатам и ориентации схвата п декартовой системе координат, связанной с рабочим пространством. Решение задачи построения программною движения сопряжено с большими трудностями, порожденными нелинейностью и высокой размерностью уравнений кинематики

Ф(д) = г. (30)

Ряд методов решения обратной задачи кинематики основывается на сведении решения уравнения кинематики к минимизации функционала вида

У(?Н|ф(<7)-4 (31)

Содержательно Ч'(д) означает расстояние между целевой точкой г> и положением схвата г-Ф(<]) и конфигурации д.

Часто при решении обратной задачи кинематики пытаются минимизировать функционал (31) градиентными методами. Однако при большом числе звеньев робота функционал (31) обладает множеством локальных минимумов, в которых может "застрять" алгоритм. Поэтому основным требованием при использовании градиентных алгоритмов является хорошее начальное приближение. Здесь возможно использование сеточного метода, когда все пространство обобщенных координат покрывается сеткой и в узлах этой сетки решается прямая задача кинематики, а затем в окрестностях узлов, где достигнуто наименьшее значение функционала (31) применяют градиешные метлы. Недостатком такого подхода является большой объем вычислений, связанный с вычислениями в узлах сетки и последующего градиентного спуска. Эго усугубляется тем. что для построения программного движения вдоль заданной траектории на ней выбирают несколько точек, для которых решают обратную задачу кинематики, а затем по полученным точкам в пространстве обобщенных координат строят интерполирующую кривую, т.е. искомое программное движение. Таким образом, обратная задача кинематики решается столько раз. сколько точек выбирается для интерполяции.

Для снижения вычислительных затрат при построении программного движения, а также для обеспечения построения программного движения в реальном масштабе времени будем использовать нейросетевую модель для решения обратной задачи кинематики, т.е. будем обучать НС аппроксимировать обратную кинематическую модель:

д = ф-'(г). (32)

Следует отметить, что уравнение (32) в общем случае имеем множество решений, поэтому для получения требуемого одного решения необходимо ввести некоторый параметр конфигурации манипулятора. Тогда (например, для двузвешюто манипулятора) получим расширенный вектор положения схвата манипулятора г=(.\-.у,/})г. Вместо параметра конфигурации р можно задавать ориентацию схвата (т.е. положение системы координат, связанной со схватом в базовой неподвижной системе координат).

Построена НС на основе теоремы А.Н. Колмогорова. Для этого функции ц/рЧх) и Хч(у) были выбраны следующим образом. Учитывая, что функции <//'"' являются

к р=1

к

1=1 (35)

монотонно возрастающими, а функции %ч Должны быть действительны и непрерывны, положим:

¥рч(хр) = ™2ряЧ*>1р1Хр+У^> Р=1.....к> .....2А+1, (33)

Хч{у) = ™)4у + ™]), (34)

, , „ 1 - ехр(-2х)

где Ш(х) =-—-1, к - размерность вектора аргументов аппроксимируемой

1 + ехр(-2х)

функции (32). Тогда, согласно теореме Колмогорова, НС, аппроксимирующая ;'-й элемент вектор-функции к переменных (32), будет описываться уравнением

24+1 <7=1

где >V1 р2 - вес смещения р-го нейроэлемента первого слоя НС, те", - вес смещения д-гс нейроэлемента второго слоя, м2рд - вес связи между р-и нейроэлементом первого слоя и <7-м нейроэлементом второго слоя, м3ч - веса нейроэлемента третьего слоя, т - число звеньев робота. Такая аппроксимирующая НС имеет к входов и один выход и состоит из трех слоев. Первый слой содержит к нейроэлементов, второй - (2к+1) нейроэлементов и третий - один нейроэлемент. Функциями активации нейронов первого и второго слоев являются гиперболические тангенсы, а у единственного нейрона третьего слоя функция активации отсутствует (он выполняет функцию масштабирования, выполняя взвешенное суммирование ограниченных значений выходных сигналов нейронов второго слоя). Такая НС аппроксимирует скалярную функцию к переменных. Поскольку функция (32] является вектор-функцией нескольких переменных, для ее аппроксимации потребуется столько НС, какова ее размерность (для двухзвенного манипулятора т=2, к=Ъ).

Для обучения нейросетевых программаторов движений зададим сетку е пространстве обобщенных координат с числом узлов / и по уравнению кинематической модели синтезируем обучающую выборку:

{?(0'г(0}!.1' (36: где г(:) - значения вектора обобщенных координат и расширенного векторе положения схвата в <-м узле построенной сетки. Для обучения построенных НС зададим целевую функцию ошибки на выходе /-й НС в виде

5[у>) = (д,-Ч1)г, /=1,2,...,/и, (37;

где - действительное значение выхода /-й НС, а д, - его желаемое значение. Далее настройка весов /-й НС производится с помощью алгоритма градиентного спуска получившего название алгоритма обратного распространения ошибки.

Наиболее сложным и гибким методом использования НС для управления роботам! является нейросетевое управление с обучением программаторов движений (которое было рассмотрено выше) и синтезом регуляторов переходных процессов на основе нейросетевой аппроксимации обратной модели динамики. Гибкость н адаптивность такого подхода заключается в том, что конструктору' даже не обязательно знаи структуру динамической модели. НС сама идентифициру ет обратную модель динамии робота в процессе обучения, которая затем используется в соответствующих закона:* управления. При этом предлагается в отличие от существующих подходов программной: нейросетевого управления или нейросетевой аппроксимации существующего регуляторе использовать нейросетевое стабилизирующее или субопти.малыюе по быстродействии:

управление, основанное на сочетании соответственно традиционного закона стабилизирующего или субоптимального по быстродействию управления с нейросетевой аппроксимацией обратной модели динамики робот, чю позволяет достичь требуемой точности управления при ошибках аппроксимации за счет выбора соответствующих параметров закона управления. Преимущества предлагаемого подхода заключаются в том. что НС, обученная аппроксимировать обратную модель динамики объекта управления, может быть использована для реализации различных законов управления, использующих обратную модель динамики объекта, без дополнительного переобучения. Тогда как известные методы предполагают полное переобучение НС при необходимости реализации на ее основе других алгоритмов управления. Будем называть НС. аппроксимирующую обратную модель динамики робота. НС-аппрокспмаюром.

Рассмотрена задача нейросетевой идентификации (пли аппроксимации) обратной модели динамики робота. Обратная модель динамики робота с т степенями подвижности может быть представлена в виде уравнений Лафанжа 11-1 о рола (I). Требуется синтезировать и обучить НС, выполняющую отображение

= ч(<о)~Яо, ?('<,) = <7о, (38)

такое что

\\и(д,д,д,$-и(Я,4,ч,$\\<е. (39)

Вектор-функция (38) зависит от Зт+р переменных Для манипуляторов с

вращающимися сочленениями обобщенные координаты входят в уравнение (1) только в виде тригонометрических функций типа 5т(<у/), соб^,-), а для манипуляторов с поступательными звеньями в виде д,. Пусть у манипулятора г звеньев вращательных и 5 звеньев поступательных. Тогда непросегевая модель, аппроксимирующая функцию (38) или (1), имеет вид:

й = 0[д^,...,</„. ,Б1п(<7,ч г ),соб(<7а.41 ),...,Бт(с7,ЛЧг ),со5(с/,^ . лт=ш, (40)

где <7 ,...,<7, - обобщенные координаты, соответствующие поступательным звеньям. <7 ,...,<7,^ - обобщенные координаты, соответствующие вранкнельным звеньям.

Вектор-функция (40) является функцией {2т+з+2г+р) переменных. Такое представление автоматически обеспечивает для вращательных звеньев условие однозначности <7,=0° и =360° и имеет практическое значение: многие датчики углов построены на основе сипусно-косинусных вращающихся трансформаторов, выходные сигналы коюрых пропорциональны синусу и косинусу измеряемого угла.

Построим НС на основе теоремы А.Н. Колмогорова и Д.А. Шпрехера. Для этого зададим функции у/'*'(х) и %ч(у) в виде (33). (34). Тогда ПС. аппроксимирующая /-П элемент вектор-функции А=(2ш+5+2г+/>) переменных (1) и соответствующая /-му элементу вектор-функции (40), описывается уравнением 2k+^

и,

ч

«И

к

I

К, ици-:,*.

I.....т. (41

вес

где х = ),соб(<7,^ ),д.д,^Т.

смещения у'-го нейроэлемента первого слоя НС. - вес смешения ¿у-го нейроэлемента второго слоя, ч'у,, - вес связи между у'-м нейроэлементом первого слоя и <7-м

нейроэлементом второго слоя, м3ч - веса нейроэлемента третьего слоя, т - число звенье) робота. Такая аппроксимирующая НС имеет к входов и один выход и состоит из тре; слоев. Первый слой содержит к нейроэлементов, второй - (2/с+1) нейроэлементов I третий - один нейроэлемент. Функциями активации нейронов первого и второго слое] являются гиперболические тангенсы, а у единственного нейрона третьего слоя функцш активации отсутствует (он выполняет функцию масштабирования, выполняя взвешенно« суммирование ограниченных значений выходных сигналов нейронов второго слоя) Такая НС аппроксимирует скалярную функцию к переменных и вырабатывает значенш управления для соответствующего ей привода. Поскольку функция (1) является вектор функцией к переменных, то для ее аппроксимации потребуется столько НС (41), каков; ее размерность (по одной НС на каждый элемент функции (1)). В качеств! минимизируемой целевой функции для г-й НС зададим функцию в виде

5{у/) = (щ-щ)г, |=1 ,...,т. (42

Настройка весов каждой НС производится с помощью алгоритма градиентного спуск; (обратного распространения ошибки). Отметим, что при обучении НС производя-идентификацию обратной модели динамики робота. Идентификация осуществляется 1 классе активационных функций нейронов.

Вычислительная сложность алгоритма (41) при программной реализации НС (т.е при последовательном выполнении алгоритма ее работы, что является наименее выгодным с точки зрения быстродействия) составляет 4кгт+4кт+т операцш умножения и 4к2т+4кт операций сложения, требующихся для вычисления все; элементов вектора управления. Если вектор параметров модели динамики известен, а ва сочленения робота вращательные, то к=2т, и для вычисления управления требуете; 16т3+8т2+т операций умножения и 1бт3+8т2 операций сложения (протш соответственно 32/я4+8б/п3+171т2+53/л-128 умножений и 25т4+66/л3+129ш2+42т-9( сложений необходимых при вычислении управления с использованием уравненш Лагранжа Н-го рода). Таким образом, даже в случае программной реализации алгоритм; работы НС (41) вычислительная сложность нейросетевого алгоритма управления ш порядок меньше, чем при реализации традиционного стабилизирующего управления. Ошибки нейросетевой аппроксимации обратной модели динамики неблагоприятне влияют на качество управления программным движением. Из-за неточно? аппроксимации в замкнутой системе возникают возмущения, которые изменяют желаемый характер переходных процессов. На практике они могут приводить (г приводят) к снижению точности отработки программного движения, к автоколебаниям \ даже к потере устойчивости.

Исследование влияния неточной нейросетевой аппроксимации проведено с позиций теории чувствительности.

Найдены оценки качества управления при произвольных ошибках нейросетевог аппроксимации А(0, удовлетворяющих лишь ограничению ||Д(/)]|<£\ Эти оценки показывают, что точность осуществления программного движения пршшипиальнс ограничивается уровнем ошибки НС и постоянно действующих возмущений.

Замкнутая система при Д(0*0 может оказаться на границе устойчивости или вообще потерять устойчивость. В первом случае в системе возникают автоколебания, вс втором - нарушаются ограничения на допустимые переменные состояния и управления, Вследствие этого утрачивается работоспособность системы.

Влияние неточности нейросетевой аппроксимации модели динамики на

функционирование оптимального по быстродействию нейросетевого регулятора (17) оценивается таким же образом, как и влияние внешних н параметрических возмущений. Полученные оценки согласуются с экспериментальными данными, которые показывают, что в случае действия ограниченных параметрических возмущений, связанных с неточной нейросетевой аппроксимацией модели динамики робота, не нарушающих устойчивости системыГувеличивается число переключении управления и величина перерегулирования. Однако эти недостатки компенсируются возможностью реализации управления в реальном масштабе времени при полностью неизвестной модели динамики робота.

В третьей главе описаны алгоритмы обучения моделей ПС, описанных в главе 2. За основу взят стандартный алгоритм обратного распространения ошибки, в настоящее время широко используемый для обучения многослойных ¡1С. В основе алгоритма обратного распространения ошибки лежит метод точного и эффективного вычисления градиентов в любых больших системах, составленных из элементарных подсистем, описанных известными дифференцируемыми функциями. Алгоритм обратного распространения ошибки выполняет задачу обучения НС "с учителем". Целью обучения с учителем является настройка связей НС таким образом, что ее фактические выходы и приближаются к некоторым желаемым выходам и для обучающей выборки, содержащей Т элементов. При этом НС приспосабливается решать задачу для элементов, не принадлежащих обучающей выборке, что базируется на свойстве обобщения (экстраполяции) НС. При обучении НС "с учителем" веса изменяются в направлении минимизации целевой функции в виде

1 = М(1р)= М(е2)= А-/((н-17)г). (43)

где М(*) означает операцию математического ожидания но множеству всех р нар обучающей выборки. Правило изменения весов ПС (обобщенное дельта-правило) для выходного слоя ЛГ записывается так:

= = 2рдхг (44)

а для скрытого слоя У

=-А?,, = 2 (45)

Однако при использовании методики синтеза НС, описанной в главе 2. необходимо соблгодать условие неотрицательности значений весовых коэффициентов нейроэлементов второго слоя. Для этого описанный алгоритм дополняется следующим условием: если изменение веса нейрона второго слоя таково, что он становится отрицательным, то изменения веса не происходит (вес "замораживается" на текущем шаге), т.е.

- о=+А< если +(А) * (■»«

если рч + Аи'^ (к) < 0.

В отличие от оригинального алгоритма обратного распространения ошибки в качестве нелинейной функции активации применяются также и другие нелинейные функции. В частности, рассмотрена сигмоидальная функция вида

позволяющая получать на выходе нейронов как положительные, так и отрицательные значения сигналов, функция вида

1 + e

а также синусоидальная функция, также удовлетворяющая условиям теоремы А.Н. Колмогорова для нейроэлементов второго слоя. В последнем случае НС в процессе обучения будет производить идентификацию обратной модели динамики объекта в классе синусоидальных функций и функций, которыми описываются нейроэлементы первого слоя.

Рассмотрена модификация алгоритма обратного распространения ошибки с инерционными свойствами, причем "инерционность" алгоритма изменялась с течением времени, что позволило ускорить процесс обучения за счет избегания локальных минимумов целевой функции (одним из главных недостатков алгоритма обратного распространения ошибки является возможность попадания в локальные минимумы целевой функции в процессе обучения НС).

В четвертой главе приводится краткое описание программного обеспечения (ПО), реализующего рассмотренные алгоритмы и предназначенного для моделирования традиционного и нейросетевого управления роботами, а также для решения учебных задач и исследовательских задач диссертационной работы. ПО состоит из трех основных модулей: синтез и обучение НС, моделирование динамики манипулятора, графический интерфейс с пользователем. Все модули имеют общую оболочку, обеспечивающую оконный графический интерфейс с пользователем в среде Windows 3.x для управления работой программы и для ввода/вывода данных. В качестве примера было осуществлено моделирование традиционного и нейросетевого управления трехзвенным манипулятором с вращательными сочленениями. Исследование нейросетевой системы управления роботов на практическом примере трехзвенного манипулятора подтверждает работоспособность и высокую эффективность предложенных алгоритмов управления роботами.

Приложения содержат технические подробности разработанного программного обеспечения, а также акты внедрения и использования результатов работы.

Заключение.

В процессе диссертационных исследований получены следующие основные результаты:

1. Оригинальная методика проектирования нейросетевых субоптимальных (по быстродействию) и адаптивных систем управления роботов, основанная на сочетании традиционных и нейросетевых методов в задачах управления и обработки сенсорной информации.

2. Новые алгоритмы оптимального по быстродействию управления роботами, эффективно использующие принцип максимума J1.C. Понтрягина для нелинейной динамики роботов, и вычислительные архитектуры для их параллельной реализации в реальном масштабе времени.

3. Модели нейросетевых обучаемых программаторов движений и модели нейросетевых адаптивных регуляторов роботов, основанные на нейросетевой аппроксимации нелинейной динамики с использованием теоремы А.Н. Колмогорова.

4. Оценки вычислительной сложности и робастности разработанных алгоритмов нейросетевого управления.

Основные результаты работы изложены в следующих публикациях:

1. Богданов А.А., Соколов Д.О., Тимофеев А.В. Параллельные алгоритмы адаптивного распознавания и оптимального управления/ ТезТ докл. Ill Санкг-Петербургскои межд. конф. "Региональная информатика - 94", 10-13 мая 1994. - Санкт-Петербург. 1994. -Ч.1.-С.45.

2. Тимофеев А.В., Богданов А.А., Соколов Д.О. Вероятностные алгоритмы обучения нейронных сетей и нейронные оптимальные рехуляторы/ Прщрамма и тезисы докладов всероссийского рабочего семинара "Нейроннформачика и ее приложения", 7-10 октября 1994 г. - Красноярск, КГТУ, 1994. - С. 32.

3. Серия компьютерных учебников для компьютерных сетей университетов и технология их создания/ А.А. Богданов, Е.К. Ермолаева, Н.В. Иванова, А.В. Тимофеев, З.М. Шибзухов/ Тез. докл. IV Санкт-Петербургской межд. конф. "Региональная информатика - 95", 15-18 мая 1995 г. - Санкт-Петербург, 1995. - ч. 2. -С. 217-218.

4. Timofeev A.V., Bogdanov А.А. Synthesising Principles of neural controllers for robots optimal control/ Proc. of the 2-nd International symposium on neuroinformatics and neurocomputers, 1995. - Rostov-on-Don, Russia, 1995. - P. 189-193.

5. Адаптивные и нейросетевые алгоритмы обработки информации при управлении транспортными роботами/ А.В. Тимофеев, А.А. Богданов, В.В. Звонцов, Ф.А. Колушев/ Тез. докл. V Санкт-Петербургской межд. конф. "Региональная информатика - 96", 13-16 мая 1996 г. - Санкт-Петербург, 1996. - ч. 2. - С. 237.

6. Timofeev A.V., Bogdanov А.А. Methods of non-linear neural element informativity evaluation in neural networks//Int. journal of information theories and applications. - 1996. - Vol. 4. - P. 22-29.

7. Тимофеев A.B., Богданов А.А. Синтез нейросетевых регуляторов для оптимального управления роботами и мехатронными системами// Робототехника и мехатроника: периодич. науч.-тех. сб. тр./ Изд-во РАН, РНК по ТММ РАН, БГТУ, вып. 1. - М,-СПб., 1996.-С. 115-125.

8. Bogdanov. А.А., Kolushev, F.A. Optimal Path Planning and Adaptive Neural Control of Robots/ Proc. of Int. conf. on informatics and control, June 9-13, 1997. - Saint Petersburg, 1997.-P. 600-605.

9. Bogdanov A., Popov I., Tarnovsky S. Neurob - Software for Simulation and Comparative Analysis of Traditional and Neural Methods of Robots Control/ Proc. of Int. conf. on informatics and control, June 9-13, 1997. - Saint Petersburg, 1997. - P. 621-628.

10. Bogdanov A.A., Timofeev A.V. Neural algorithms of optimal and adaptive control of

mechanical systems/ Proc. of Int. conf. "Control of oscillations and chaos", August 27-29. 1997. - Saint Petersburg, Russia, 1997. - Vol. 3. - P. 532-535.