автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Системы прогнозирующего нейроуправления нелинейными динамическими объектами

кандидата технических наук
Ноткин, Борис Сергеевич
город
Владивосток
год
2006
специальность ВАК РФ
05.13.06
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Системы прогнозирующего нейроуправления нелинейными динамическими объектами»

Автореферат диссертации по теме "Системы прогнозирующего нейроуправления нелинейными динамическими объектами"

На правах рукописи

Ноткин Борис Сергеевич

СИСТЕМЫ ПРОГНОЗИРУЮЩЕГО ИЕЙРОУПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ

Специальность 05.13.06 - Автоматизация и управление технологическими процессами и производствами

Автореферат диссертации на соискание ученой степени кандидата технических наук

Владивосток - 2006

Работа выполнена на Кафедре автоматизированных производственных систем Дальневосточного государственного технического университета (ДВПИ им. В.В. Куйбышева), г. Владивосток.

Научный руководитель

кандидат технических наук, доцент К.В. Змеу

Официальные оппоненты

доктор технических наук, профессор А.А. Дыда

кандидат технических наук, доцент А.Ю. Торгашов

Ведущая организация .

Институт автоматики и процессов управления ДВО РАН

Защита состоится_2006 г. в_часов на заседании диссертационного совета К212.055.03 Дальневосточного государственного технического университета (ДВПИ им. В.В. Куйбышева) по адресу: 690950, г. Владивосток, ул. Пушкинская, 10, ДВГТУ, ауд. Б-107.

С диссертацией можно ознакомится в библиотеке Дальневосточного государственного технического университета (ДВПИ им. В.В. Куйбышева).

Автореферат разослан_2006 г.

Ученый секретарь диссертационного совета ~~ Ю М Го бенко

кандидат технических наук, доцент СЗ^ ' " р

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Современные задачи автоматического управления характеризуются усложнением объектов управления (ОУ) в сочетании с повышением требований к качественным показателям технических систем в целом. Практическое решение таких задач неизбежно связано с неопределенностью, порождаемой отсутствием в реальных условиях знания точного математического описания динамики ОУ и характеристик действующих на него неконтролируемых возмущений и помех. Наиболее распространенные в таких условиях подходы к синтезу систем автоматического управления (САУ) опираются на математические модели неопределенности, построенные из предположения либо вероятностных свойств процесса, либо ограниченного диапазона вариаций его параметров. Вместе с тем, в последнее время активно развиваются подходы к синтезу САУ, базирующиеся на мягких вычислениях. Такие подходы предъявляют менее жесткие требования к формализации задач управления, позволяя ограничиться лишь общими физическими соображениями, например, предположением о квазистационарности процессов.

Парадигма мягких вычислений существенным образом связана с использованием искусственных нейронных сетей (ИНС), получивших значительное развитие в последние два десятилетия. Однако ожидавшегося быстрого прогресса в реальном использовании ИНС в системах управления пока не произошло, что позволяет делать выводы о существовании нерешенных проблем, препятствующих практическому внедрению таких систем и требующих изучения и решения.

Целью диссертационной работы является разработка и исследование практически реализуемых конкурентоспособных нейросетевых подходов к управлению динамическими объектами в условиях неопределенности. Для достижения общей цели были поставлены и решены следующие задачи.

1. Исследование наиболее распространенных видов нейросетевых систем управления (НСУ): выявление основных недостатков и путей их устранения.

2. Исследование взаимного соответствия традиционных и нейросетевых подходов.

3. Анализ целесообразности использования аппарата ИНС в известных и предложенных НСУ.

4. Разработка конкурентоспособных методик синтеза НСУ.

5. Экспериментальное исследование предложенных подходов на примерах управления реальными объектами.

Методы исследования. При исследованиях применялись методы классической и современной теории автоматического управления, в частности, теории инверсного, адаптивного, прогнозирующего и оптимального управления, а также теория ИНС и методы нейроинформатики. Проверка полученных в ходе работы теоретических результатов выполнялась средствами численного моде-

лирования в среде MATLAB и подтверждалась результатами натурных экспериментов на лабораторных установках.

Научная новизна полученных результатов состоит в следующем.

1. Предложены системы непосредственного инверсного и адаптивного ней-роуправления с регенерируемым эталонным переходным процессом.

2. На примере линейных объектов управления показана возможность обучения нейрорегулятора адаптивной системы непосредственно по ошибке управления.

3. Предложен подход к синтезу линейных законов управления одним классом нелинейных динамических объектов.

4. Предложен подход к синтезу САУ в условиях неопределенности — безмодельное прогнозирующее нейроуправление.

На защиту выносятся положения, представляющие наибольшую практическую ценность.

1. Методика синтеза систем безмодельного прогнозирующего инверсного нейроуправления, позволяющая в условиях неопределенности реализовы-вать свойства систем, близких к прогнозирующему управлению с моделью. " 2. Методика синтеза систем безмодельного прогнозирующего релейного нейроуправления, позволяющая в условиях неопределенности реализовывать свойства систем, близких к оптимальным по быстродействию.

3. Структурная схема и методика настройки системы модифицированного ПИД-регулирования, обеспечивающая качественное управление широким классом нелинейных ОУ, отличающаяся организацией интегрального канала и допускающая расширенное использование производных. Реализация результатов работы. Научные и практические результаты диссертационной работы внедрены в учебный процесс Дальневосточного государственного технического университета; рекомендованы к внедрению в Институте автоматики и процессов управления ДВО РАН при разработке систем многокоординатного управления подводными аппаратами; на базе лаборатории Automatic Control Telelab1 (Италия) реализованы в форме установки для демонстрации эффективности современных алгоритмов управления.

Апробация работы. Основные результаты исследования по теме диссертации изложены в 11 печатных работах и докладывались на V и VI Международных форумах молодых ученых стран АТР, г. Владивосток, 2003, 2005 гг.; на Региональной научной конференции "Молодежь и научно-технический прогресс", г. Владивосток, 2004, 2006 гг.; на IV Международной конференции "Идентификация систем и задачи управления", Институт проблем управления им. В.А. Трапезникова РАН, Москва, 2005 г. С рейтинговыми показателями предлагаемых решений и практической реализацией системы двухкоординат-ного управления лабораторной установкой "Helicopter СЕ-150" можно ознакомиться посредством Интернет-ресурса лаборатории Automatic Control Telelab.

1 http://www.dii.unisi.it/~controI/act/home.php

Публикации. Основные результаты исследования по теме диссертации изложены в 11 печатных работах.

Структура и объем работы. Диссертация состоит из введения, шести глав с предварительными выводами после четвертой главы, заключения и списка литературы, содержащего 140 наименований. Текст работы изложен на 210 страницах, содержит 96 рисунков, 26 таблиц и 2 приложения.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы диссертации, определены цель и задачи исследований, выделены основные положения работы, имеющие новизну и практическую значимость.

В первой главе рассмотрены базовые положения ИНС и наиболее распространенные схемы применения этого аппарата для решения задач автоматического управления. Среди этих задач принято выделять задачи синтеза нейросе-тевых моделей прямой (1) и инверсной (2) динамики объекта управления (наиболее распространенные схемы обучения, одномерный случай):

N 2

+ .....u[i],u[i-1],...,ф-ет])) =>min; (1)

<=i

N 2

£ (u[i) - ИНСим (Я/ +1], Я*]» :.,y[i-n], u[i -1],..., u[i - /и])) min, (2) i=i

где N- объем выборки экспериментальных данных вход-выход ОУ, u[i] и y[i] -входная и выходная переменные ОУ соответственно, тип — величины определяющие размерности регрессионных векторов, ИНСПМ (•) и ИНСим (•) - искомые нейросетевые преобразования. Прототипом нейросетевых моделей динамических объектов являются широко распространенные линейные регрессионные модели. Использование для целей идентификации аппарата ИНС (нелинейной регрессии) позволяет получать описания в форме нелинейных регрессионных моделей, охватывающих более широкую область современных задач управления. Недостатком методов нейроидентификации, как и других методов идентификации нелинейных объектов в форме "черного ящика" являются ограничения на использование таких моделей в комплексе с большинством аналитических методов анализа и синтеза САУ. Однако существует ряд подходов к синтезу САУ, позволяющих рассматривать модель объекта лишь как преобразование вход-выход. Наиболее распространенными в этом классе являются: непосредственное инверсное управление (Direct Inverse Control), инверсная модель объекта используется непосредственно в качестве регулятора; инверсное управление с пассивной адаптацией (Nonlinear Internal Model Control), кроме инверсной модели в структуре системы управления присутствует модель прямой динамики; прогнозирующее управление с моделью (Model Predictive Control), модель объекта используется для выполнения прогноза. Существенная часть известных к сегодняшнему дню нейросетевых подходов получена путем

заимствования принципов, лежащих в основе вышеперечисленных решений, и их реализации в нейросетевом базисе.

Другой класс НСУ - адаптивное нейроуправление. Это семейство решений основано на возможности обучения ИНС непосредственно в процессе регулирования. В большинстве случаев в таких НСУ в качестве механизма адаптации используется обучение ИНС методом обратного распространения ошибки или его специализированными под задачи управления модификациями. Обучаемой частью системы может быть как нейрорегулятор, так и нейросете-вая реализация параметров какой-либо традиционной структуры, например, коэффициентов ПИД-регулятора. Наиболее распространенным решением в этом классе является адаптивное нейроуправление с эталонной моделью (Model Reference Adaptive Control), где в качестве ошибки обучения нейрорегулятора используется ошибка между эталонным и фактическим выходом ОУ. Меньшее распространение получил подкласс систем адаптивного нейроуправления, именуемый "адаптивно критической схемой" (Adaptive Critic Control), в основном базирующийся на парадигме "обучения поощрением" (Reinforcement Learning). •В целом этот подход можно обозначить как "метод проб и ошибок". Его преимуществом являются менее жесткие требования к формированию ошибки обучения ИНС.

Обзор литературных источников выявил еще ряд способов интеграции аппарата ИНС в САУ. Однако именно рассмотренные решения, образуя два основных направления (нейроидентификация и обучение ИНС непосредственно в контуре управления), являются наиболее распространенными подходами к синтезу НСУ в условиях неопределенности. Следующий этап работы состоит в исследовании наиболее распространенных представителей каждого из этих направлений, а также выявлении и устранении их основных недостатков.

Вторая глава посвящена исследованию систем непосредственного инверсного нейроуправления (рис. 1). В состав этой системы входят: предварительно обученная нейросетевая модель инверсной динамики объекта (ИМ), выполняющая функцию регулятора и эталонная модель (ЭМ), определяющая желаемую динамику системы.

ЭМ

ф+1]

щ

им

и[1.]

ОУ

ыо

г

Рис. 1. Общий вид системы инверсного нейроуправления (ЛЗ — линия задержки с отводами)

Интеграция инверсной модели в конгур управления состоит в замене входа, используемого при ее обучении какд>|7+1] (2), на значение желаемого выхода системы г[/+1], подаваемое с выхода эталонной модели:

= ИНСии (г[/ +1], >>[/],..., у[1 — и], и[1 — 1],..., и[/ — т]); (3)

* ' я т

+ = (4)

,., . . .. ' У-о У=0 ,

где параметры п и т и постоянные коэффициенты а^ и ¿у определяют порядок и динамику эталонной модели, которая в данном случае представлена в форме

линейной регрессионной модели, — сигнал задания. При условии соответствия инверсной модели инверсному оператору ОУ, вне зависимости от вида эталонного переходного процесса, в системе непосредственного инверсного ней-роуправления для любых i выполняется тождество:

ЯО-ФЪ (5)

что создает иллюзию простого и надежного решения задачи управления. Однако численные эксперименты показывают, что функционально эта система немногим отличается от традиционного пропорционального регулирования с бесконечно большим коэффициентом усиления. Ее ограниченная функциональность отмечается и другими исследователями в области НСУ. Поясняя эту ситуацию, принято ссылаться на известную сложность построения инверсных моделей динамических объектов. Стремление преодолеть эту проблему привело к появлению ряда решений, основанных на инверсии прямых нейросетевых моделей, в частности, к системе управления на основе линеаризации (Feedback Linearization Control), чаще называемой по типу используемой модели NARMA-L2 (Nonlinear AutoRegressive-Moving Average), имеющей специальную легко обратимую структуру. Однако численные эксперименты показывают, что такие решения проблемы не снимают.

Суть проблемы может быть проиллюстрирована на основе временных характеристик системы (рис. 2). В моменты дискретных отсчетов времени желаемая и фактическая координата выхода ОУ совпадают (отмечено графически), т.е. инверсная модель реализует возложенную на нее функцию и тождество (5) выполняется, однако переходный процесс может оказаться неустойчив или сильно колебателен. Таким образом, причиной ограниченной функциональности системы непосредственного инверсного нейроуправ-ления является не инверсная модель, а целевая функция системы. Одним дискретным управлением в общем случае нельзя одновременно обеспечить желаемые приращения по всем координатам фазового вектора ОУ . Поэтому, обеспечивая на каждом интервале управления высокую точность по координате выхода ОУ, мы "собственными руками" способствуем ошибкам по его остальным фазовым координатам, что и приводит к рассогласованию эталонных и фактических состояний, проявляясь в виде колебательности или неустойчивости переходного процесса.

Для решения этой и еще ряда проблем, связанных с функционированием системы непосредственного инверсного нейроуправления в условиях ограниченной амплитуды управлений, низким качеством обучения инверсной модели, влиянием возмущающих воздействий и другими факторами, ведущими к рассо-

У, г ко /Л \у и =Г л Я, i

А! а. скретное в[ ЮМ

% —1 1 0 I 2 ;3 А 4 п 5 6 7 8 9 .i

Рис. 2. Пример функционирования системы инверсно-

го нейроуправления

2 Аргументы не распространяются на динамические объекты первого порядка, для которых "состояние" и "координата выхода" объекта — тождественные понятия.

гласованию эталонных и фактических состояний ОУ, предлагается использовать следующий способ формирования эталонного переходного процесса:

(6)

г[/ + 1] = £ауУ[1-Л+]Гд.с/[1--Л.

у.0 у=о

Выражение (6). получено путем сохранения структуры и коэффициентов базового уравнения эталонной динамики (4), но замены в нем вектора задержанных значений выхода эталонной модели г[/']...г(7 — й] на вектор задержанных значений фактического выхода ОУ Вычисление эталонного выхода системы г[/ + 1] относительно фактических координат ОУ >'[']•••>'['-«] обеспечивает согласованность состояний эталонного и фактического переходных процессов и названо регенерируемым эталонным переходным процессом. Численные эксперименты показали, что этот технически необременительный прием избавляет систему от критического снижения качества регулирования с повышением порядка ОУ (обязателен учет неизбежных на практике ограничений амплитуды управлений). Выполненное на примерах управления нелинейными •объектами сравнение с более сложными с точки зрения синтеза и реализации альтернативными НСУ (построенными независимыми специалистами и также основанными на использовании нейросетевых моделей ОУ) показало, что предложенная система непосредственного инверсного нейроуправления с регенерируемым эталонным переходным процессом не уступает, а в некоторых случаях и превосходит их в качестве.

Несмотря на преимущества предложенного решения особых надежд на него мы не возлагаем. Преодоление условий неопределенности за счет решения задачи идентификации сложно признать оригинальным приемом, равно как и применение для этих целей методов нелинейной регрессии (в данном случае аппарата ИНС). Получившие преимущественное распространение схемы ней-роидентификации (1) и (2) имеют ограниченные перспективы практической реализации из-за негативного влияния шумов в каналах обратных связей реальных систем.

Третья глава посвящена исследованию систем адаптивного нейроуправления с эталонной моделью (рис. 3). Адаптация в этой системе обеспечивается за счет обучения нейросетевого регулятора Пщл (НР, АО - алгоритм обучения) непосредственно в процессе регулирования. Целью обучения НР является минимизация ошибки

= Ф1-Я'] (7>

между выходом эталонной модели (4) и фактическим выходом ОУ. Обучение, как правило, выполняется методом обратного распространения ошибки. Реализация этого алгоритма требует знания ошибки на вы-

т

эм

1-ш

НР

«и

ОУ

ко

Рис. 3. Общий вид системы адаптивного нейроуправления ( Д = г'1)

ходе ИНС, что в данном случае соответствует ошибке на выходе HP:

= (8) где ud[i-l] - желаемое управление, доставляющее

0, и[/-1] - фактически приложенное управление (рис. 4). Поскольку ошибка ey[i\ на выходе ОУ очевидно не равна ошибке е«[/-1] на выходе HP, то ее прямое использование в качестве ошибки обучения принято считать затруднительным. Для преодоления этой проблемы используются различные механизмы, большинство из которых опирается на информацию о динамике ОУ. Поэтому эту систему часто относят к разряду систем с косвенной адаптацией или непрямого управления (Indirect Control). Здесь можно выделить два основных подхода: использование Якобиана ОУ, позволяющего оценить необходимый для обучения ИНС градиент ошибки на выходе HP, и использование нейросетевой модели прямой динамики ОУ, через структуру которой с помощью того же метода обратного распространения ошибки (но без корректировки коэффициентов нейросетевой модели) сигнал £у[г] распространяется в обратном направлении (от выхода к входу), преобразуясь в оценку ошибки e„[i-l].

Выявим аналитическую связь между ошибками еД/] и е«[г-1] для случая линейности ОУ. Пусть нам известно уравнение инверсной динамики ОУ (в форме линейного разностного уравнения), его текущее состояние (в виде регрессионного вектора) и текущее значение желаемого выхода системы г[/]. С помощью этой информации мы не только можем восстановить фактически приложенное управляющее воздействие:

и+1 т+1

u[i -1] = a0y\i] + ]Г ajy[i - j] Аум[/ - j], (9)

M 1=2

но и вычислить такое управление ud[i — 1], при котором на г'-м дискретном отсчете цель адаптации была бы достигнута (см. рис. 4), т.е. гД/] = 0 => Я'] = ф]:

и+1 т+1

«¿и -1]=«о Ф]+Х«У>'[/ - л +1>,Ф -л. (ю)

У=1 У-2

Перепишем выражение (8) с учетом (9), (10) и (7):

V -!] = «„U~ 1] ~u[i-1] = fl0(r[/] -tf/]) = a0ey[i] . (11)

Таким образом, для случая линейности ОУ ошибки еДг] и eu[i-1] действительно алгебраически неравны, но с точки зрения их использования в качестве минимизируемых величин (ошибок обучения) они эквивалентны, поскольку связаны постоянным коэффициентом. Возможность упрощенного обучения HP непосредственно по ошибке еД/] подтверждается экспериментально, в том числе и для случаев нелинейности ОУ. Однако уже на примерах управления линейными объектами функциональные качества системы адаптивного нейро-

1-3 1-2 i-l i

Рис. 4. К вопросу о связи ошибок ey[i] И Еи[/' - 1]

управления с эталонной моделью не превосходят традиционное ПИ-регулирование. Причиной тому является целевая функция системы (г[1']-у[/]=>тт), которая эквивалента целевой функции (5) традиционной реализации системы непосредственного инверсного нейроуправления (рис. 1), чьи недостатки и ограниченная область применения были рассмотрены в предыдущей главе. Поэтому с позиций функциональных качеств различие между рассмотренными системами состоит лишь в том, что в первом случае система гарантированно имеет отмеченные недостатки, а во втором, система к ним стремится по мере обучения. Так же, как и в предыдущем случае, эта проблема может быть решена путем использования ранее предложенного регенерируемого эталонного переходного процесса (6), что с учетом (11) приводит к следующему виду ошибки для обучения НР адаптивной системы:

я+1 т+1

4'] = г[1] - Я/] = X а]У\1 - у] - у] - >•[/]. (12)

у=1 /=1

Численные эксперименты показали, что предложенная система адаптивного нейроуправления не уступает в качестве регулирования альтернативным НСУ, требующим предварительно этапа синтеза, а поэтому является более эффективным решением в условиях неопределенности. Вместе с тем, более глубокое изучение процессов обучения НР выявило, что обучение, как таковое, в системе отсутствует, а- ее работоспособность обеспечивается за счет функционирования НР в режиме локальной оптимизации. Более того, последовательное упрощение структуры НР оказывало только положительное влияние на качество регулирования и надежность системы в целом. Результатом этого упрощения стал полный отказ от использования нейросетевого аппарата в пользу более простых, но и более адекватных для данного случая механизмов адаптации, что, кроме всего прочего, позволило проанализировать задачу "адаптивного нейроуправления" в терминах классической теории автоматического управления. Этому анализу посвящена следующая глава работы.

Четвертая глава. Рассмотрим достаточно широкий класс нелинейных динамических объектов с общим математическим описанием в виде:

¿¡Г

+ /

с1-*у(0 2У(0

сНп

Ж"

МО л

(13)

где /(•) - нелинейная функция, п - порядок дифференциального уравнения, «(/) сигнал управления. Общим требованием при синтезе высококачественных САУ

является полнота информации о текущем состоянии ОУ. В соответствии с этим требованием на рис. 5 изображен общий вид структуры системы управления классом объектов (13). В представленном на рисунке

иЩ

1

1 | :

4*0

Объект управления'*.

Рис. 5. Общий вид нелинейной системы управления

виде, структура нелинейного ОУ (13) может рассматриваться как линейный интегратор п-то порядка с существенными возмущающими воздействиями 2{() на входе. Это позволяет рассматривать задачу синтеза нелинейной системы в линейном базисе.

Приведем схему на рис. 5 к виду системы подчиненного (каскадного) регулирования с двумя контурами (рис. 6). Объектом регулирования во внутреннем контуре является интегратор. Предположим, что этот контур настроен на бесконечно высокое быстродействие, т.е. мг2 (р) = к = со, что вне зависимости от характера возмущений 2(0, теоретически сводит его динамику к безынерционному звену с единичным коэффициентом усиления. В этом случае динамика всей системы определяется динамикой внешнего контура, причем вне зависимости от характера нелинейности ОУ (13), объектом регулирования в этом контуре всегда является интегратор (и-1)-го порядка.

¿'"Внутренний контур \Zffi

Рис. 6. Два контура системы управления с фазовым вектором в обратной связи

Таким образом, пренебрегая динамикой внутреннего контура, принимая желаемую динамику всей системы управления в форме линейного звена

ЛР)= „ . Л .-—7, (И)

+... + ахр +1'

олР Р

применяя методы модального управления и приводя полученное решение к ошибке е(0 на входе регулятора внутреннего контура, получим:

сГ-'Яг) _

*(0-«ко-

Л ¿"У® п

■а,—-т--а•

(15)

где е(() = у (О — ошибка регулирования, п = п — 1 и ах...аА — порядок и коэффициенты эталонной передаточной функции (14) соответственно.

Примечательно, что выражение (15) одновременно является и непрерывной формой записи ошибки (12), предложенной в предыдущей главе для обучения НР адаптивной системы. Эксперименты показали, что в адаптивной НСУ обучаемый по методу обратного распространения ошибки НР реализует закон управления близкий к интегральному, т.е. в целом свойства такой системы близки к свойствам системы на рис. 6 для случая И-регулятора во внутреннем контуре. Это — не лучшее решение с учетом требования высокого быстродействия внутреннего контура, которое должно существенно превышать быстродействие всей системы. С точки зрения быстродействия наилучшим здесь следует признать релейное управление в форме:

«(0 = с/тах*Ы*(')), : (16)

где итах — максимальная амплитуда управляющего воздействия. Обратим внимание, что (16) относительно ошибки (15) может рассматриваться как частный

случай закона управления системы, функционирующей по принципам скользящих режимов. Однако платой за высокое быстродействие закона (16) является его низкая помехоустойчивость. Этот недостаток в существенно меньшей мере присущ закону ПИ-регулирования, который и предлагается использовать в качестве регулятора внутреннего контура:

где кр и kt - коэффициенты пропорционального и интегрального каналов соответственно. Настройка этих коэффициентов позволяет соблюсти необходимый баланс между требуемым быстродействием внутреннего контура и его чувствительностью к составляющей шума в сигнале e(t). Эффективность предложенного решения подтверждена как численными, так и натурными экспериментами на примере управления одной из координат аэродинамической установки "Helicopter СЕ-150" (подробней будет рассмотрена далее), где выбранная в качестве базы для сравнения функционирующая по принципам скользящих режимов система при прочих равных условиях практически теряет работоспособность. Закон управления (17) относительно ошибки (15) назван модифицированным ПИД-регулированием (ПИД-м). Он унаследовал и приумножил положительные качества предложенной в предыдущей главе системы адаптивного нейроуправ-ления, хотя и потерял при этом формальные признаки адаптивности.

Выводы по главам 1-4. На примерах широко распространенных НСУ выполнено исследование двух основных нейросетевых подходов, ориентированных на синтез в условиях неопределенности. Показано, что собственно нейро-сетевая реализация процедур идентификации (глава 2) и адаптации (глава 3) не только не порождает новых принципов управления, но и может осложнить решение этих, в целом традиционных для автоматического управления, задач. Несмотря на преимущества в своем классе предложенных в работе нейросетевых решений, система непосредственного инверсного нейроуправления с регенерируемым эталонным переходным процессом остается труднореализуемой на практике, а реализация принципов предложенной системы адаптивного нейроуправления оказалась более эффективной за рамками нейросетевого базиса, в результате чего предложена система модифицированного ПИД-регулирования, функционально превосходящая нейросетевое решение.

Основной акцент в работе сделан на разработку методик синтеза САУ в условиях неопределенности, отвечающих трем требованиям: конкурентоспособность, практическая реализуемость и целесообразность использования аппарата ИНС. Проведенный обзор не выявил среди распространенных НСУ готовых решений, одновременно и в полной мере отвечающих этим требованиям. Предложенные подходы, направленные на устранение основных недостатков рассмотренных НСУ, также не привели к удовлетворяющему нас результату. В заключительной части работы предлагаются методики синтеза НСУ, которые, по нашему мнению, отвечают всем вышеперечисленным требованиям.

В пятой главе предлагаются две новых методики, позволяющие синтезировать нейрорегуляторы непосредственно по выборкам экспериментальных

(17)

данных вход-выход ОУ. Эти методики объединены общей идей, которая определена как безмодельное прогнозирующее нейроуправление.

Традиционное прогнозирующее управление с моделью (Model-based Predictive Control) требует знания математической модели ОУ. На ее основе в режиме реального времени с использованием методов численной оптимизации строиться прогноз и выбирается такая тактика управлений, которая в некоторой перспективе (называемой горизонтом прогноза) доставляет наилучшее совпадение прогнозируемой и желаемой траектории ОУ. Принцип удаляющегося горизонта устанавливает, что только первое из прогнозируемой последовательности управляющих воздействий прикладывается к ОУ. На следующем интервале управления весь объем вычислений повторяется для нового состояния ОУ.

Обучение ИНС в общем случае выполняется по примерам. В случае обучения HP это примеры закона управления, представленные в виде массива эталонных входов и выходов регулятора. Предлагаемая идея позволяет извлекать примеры вход-выход регулятора непосредственно из экспериментальных данных вход-выход ОУ. Ее суть состоит в том, что произвольные управляющие воздействия, оказываемые на ОУ и переводящие его в некоторое новое состояние, рассматриваются как примеры целенаправленных управлений. Для этого "цель" управлений определяется не в начале переходного процесса, а по факту . ее достижения, т.е. в качестве желаемого состояния, принимается то, которое фактически достигается при произвольном воздействии на ОУ.

На рис. 7 изображена одна из реализаций этой идеи, названная прогнозирующим инверсным нейроуправлением (ПИН). Здесь "текущее" состояние у[/] и "желаемое" состояние у[/+Я] разнесены во времени на интервал Л, который в данном случае определяет горизонт прогноза системы, и также используется принцип удаляющего горизонта. Обучение HP:

¿(ф]-ЯЯСя/,( у[/],у[/ + Я])) => min 5

/=1

где N - объем выборки экспериментальных данных, y[/]=0'[i'],...*y[/-v]) и у[/+Я]=(у[/+Д],...гу[/+Д-у]) - векторы текущего и желаемого состояния ОУ размерностью v. В контур управления обученный HP интегрируется в соответствии с назначением своих входов. Обратим внимание, что при Л=1 прогнозирующий инверсный регулятор приобретает одну из форм модели инверсной динамики ОУ (2), из чего и следует его название. Вместе с тем, горизонт прогноза является основным параметром при построении систем ПИН. Эта величина определяет быстродействие синтезируемых систем, позволяет регулиро-

"жепаемое"

i+1 1+2 i+3 <+4 /+5 Рис. 7. Графическая иллюстрация к ПИН

вать их чувствительность к шумам в каналах обратной связи, открывает способность к управлению объектами с неопределенным транспортным запаздыванием и неминимально-фазовыми свойствами. Однако чрезмерное повышение горизонта прогноза приводит к снижению обусловленности обучающего множества из-за расширения диапазона вариаций возможных управлений, что, в конечном счете, может привести к плохой обусловленности результатов обучения. Эксперименты показывают, что этот недостаток проявляется, как правило, за рамками практических потребностей. Тем не менее, его теоретически полностью лишена предлагаемая методика прогнозирующего релейного нейроуправ-ления (ПРИ).

В основу ПРН положены базовые принципы теории оптимального по быстродействию управления. Он обладает следующими отличиями от ПИН.

1. Выборка экспериментальных данных формируется на примерах произвольных релейных управлений максимальной амплитуды с изменяющейся частотой и скважностью.

2. Горизонт прогноза не является фиксированным по всей выборке и для • каждого ее участка выбирается таким образом, чтобы между "текущим" и "желаемым" состоянием находилось не более п-1 переключений управляющего воздействия, где п - порядок ОУ, что удовлетворяет теореме Фельдбаума о числе переключений для оптимального по быстродействию переходного процесса.

3. В общем случае не каждый из полученных в п.2 примеров может рассматриваться как пример для обучения НР оптимальному закону управления. Это обусловлено тем, что теорема Фельдбаума не является достаточным условием оптимальности. В работе условия ее достаточности выявлены для частного случая интегратора второго порядка. Их распространение на существенно более широкий класс динамических объектов, в том числе и на линейные общего вида, а также на нелинейные объекты, выходящие за рамки теоремы Фельдбаума, позволило сформулировать общие необременительные правила, позволяющие либо выбирать некоторые, либо рассматривать все получаемые в п.2 примеры как близкие к оптимальным по быстродействию. В последнем случае примеры интерпретируются как принадлежащие следящему закону регулирования.

Численные эксперименты показывают, что обученный в соответствии с вышеизложенной методикой НР в контуре управления обеспечивает высокое быстродействие, реализуя релейные управляющие воздействия, количественно отвечающие установленному теоремой Фельдбаума соответствию порядка ОУ с числом переключений на переходный процесс, в том числе и для случая нелинейных объектов.

Предложенные методики ПИН и ПРН позволяют в условиях неопределенности синтезировать системы управления с качеством регулирования на уровне современных аналитических стратегий управления. Их преимуществом является не только отсутствие необходимости знания математической модели ОУ, что существенно унифицирует процедуру синтеза, но и способность учитывать

те факторы, которые, как правило, модель ОУ не отражает, например качество обратной связи.

В шестой главе три из предложенных методик (ПИН, ПРН, ПИД-м) исследуются на примерах управления реальными объектами (рис. 8). Установки на рис. 8,а и 8,6 разработаны и реализованы на кафедре АПС ДВГТУ при поддержке Российско-Японского Центра передовых технологий при ДВГТУ. Синтез и реализация систем управления этими объектами выполнены в среде MATLAB при помощи пакета расширения Real-Time Windows Target Toolbox.

Рис. 8. Внешний вид лабораторных установок: а) звено пленарного манипулятора; б) лопасть в воздушном потоке; в) Helicopter СЕ-150

Звено планарного манипулятора (рис. 8,а) имеет широко распространенный на практике характер нелинейности, обусловленный вращением рабочего органа в вертикальной плоскости. Благодаря размещению измерительного преобразователя на валу двигателя и высокой редукции разрешение измерительной системы установки достигает 200000 импульсов на оборот звена. Этого оказалось достаточно для прямого вычисления полного вектора фазовых координат объекта. На этом объекте все рассматриваемые методики прошли успешную апробацию. Наилучшие показатели качества достигнуты в системе ПРН.

Как объект исследования больший интерес представляет лопасть в воздушном потоке (рис. 8,6). Это сложно фор- 40> мализуемый объект, управление которым существенно осложнено низким качеством обратной связи (аналоговый измерительный преобразователь потен-циометрического типа). Наивысшую помехоустойчивость продемонстрировала система ПИН (рис. 9; А=50; интервал дискретности At= 0.01 с; v=20; А^ 10000 (100 с)). Результаты ПРН этим объектом в работе не рассматриваются в виду сложности в таких условиях восстановления фазовых координат объекта (для ПРН эта информация необходима, равно как и для традиционных реализаций стратегии оптимального быстродействия).

Рис. 9. Управление положением лопасти в воздушном потоке (ПИН)

Основная часть натурных экспериментов выполнена на примере установки '.'Helicopter СЕ-150" (рис. 8,в). Это сложный, многосвязный, нелинейный и статически неустойчивый аэродинамический объект. Разрешение измерительных преобразователей обеих координат составляет 2048 имп./об. Эксперименты выполнены при помощи Интернет-ресурса лаборатории Automatic Control Telelab (ACT, http://www.dii.unisi.it/~control/act/home.php), университета города Сиена (Siena, Италия), обеспечивающей свободный дистанционный доступ к этой и ряду других установок. Преимуществом такого эксперимента является возможность объективного сравнения предлагаемых решений с альтернативными системами, разработанными независимыми исследователями. Один из разделов сайта ACT содержит рейтинговую информацию различных систем регулирования углом азимута установки "Helicopter СЕ-150". В качестве базы для сравнения выбрана занимающая верхнюю позицию в этом рейтинге система ПИД-регулирования. Ее результаты и результаты ПИН (Я=70; Л/=0.01 с; v=20; N=30000), ПРН (и-3) и ПИД-м-регулирования (и = 2, см. (15)), полученные в тех же условиях представлены на рис. 10. Реализация системы ПРН потребовала построения наблюдателя состояния, который был выполнен исключительно по экспериментальным данным вход-выход объекта, с использованием аппарата ИНС и методов цифровой фильтрации. Синтез системы ПРН осуществлен на базе выборки общей продолжительностью 600 с (At=0.01 с). Обобщенные характеристики представленных на рис. 10 переходных процессов и сегодняшнее состояние верхних позиций рейтинговой таблицы сайта ACT представлено в таблице.

Наилучшие результаты двухкоординатного управления установкой "Helicopter СЕ-150" получены в системе ПИН (Я=100; At=0.01 с; v=20; N=30000). Обучение регуляторов для каждой из координат:

¿(«Д/]-Я#Ся/, (G[/])) =>min и ¿(»Д/]-ЯЯСя, (С[/])) =*min;

.--i ** ,-i

100*1

-100

| Сигнал управления в системе ПРН ;

10

20

25

„ 15 Время, с

Рис. 10. Результаты регулирования углом азимута установки "Helicopter СЕ-150"

30

Фрагмент рейтинговой таблицы (ПП - переходный процесс)

Ранг Система Время ПП, с Перерегулирование, %

1 ПРН 1.37 1.230

2 ПИД-м 2.32 0.352

3 ПИН 2.55 1.055

4 пид 3.96 -0.352

Г i i i i л

V У=I У-l У-l У-1 у

где i/[i] и y[i] - скалярный вход и регрессор от выхода ОУ (индексы <р кц/ обозначают принадлежность к соответствующим координатам (см. рис. 8,в)). Благодаря дублированию элементов входного вектора HP их суммами (в контуре управления интегралами) в системе достигается астатизм. На сегодняшний день эта система размещена на сайте ACT в форме установки для демонстрации эффективности современных алгоритмов управления. С качеством ее функционирования и Simulink-моделью можно ознакомиться посредством Интернета.

Все рассмотренные в настоящей главе системы ПИН построены на базе линейных ИНС (линейная регрессия, параметризация методом наименьших квадратов), а системы ПРН на базе нелинейных ИНС, содержащих до шести нейронов в скрытых слоях (обучение методом Левенберга — Марквардта).

В приложениях приведено расширенное доказательство пропорциональной связи приращений выходной координаты и управления в линейной дискретной системе (глава 3) и доказательство условий достаточности теоремы Фельдбаума о числе переключений для частного случая (глава 5).

ЗАКЛЮЧЕНИЕ

Основные результаты диссертационной работы заключаются в следующем.

• Выполнен обзор наиболее распространенных способов использования аппарата ИНС в САУ, в рамках которых выявлены два основных подхода, ориентированных на синтез в условия неопределенности. Ими являются: построение нейросетевых моделей динамических объектов (аппарат ИНС реализует нелинейную регрессию) и обучение ИНС непосредственно в контуре управления (аппарат ИНС используется в качестве механизмов адаптации). Выполнено исследование двух решений, являющихся наиболее распространенными представителями этих подходов, и выявлены их недостатки, на основе чего предложены варианты систем непосредственного инверсного и адаптивного нейро-управления с регенерируемым эталонным переходным процессом, функционально не уступающие более сложным системам того же класса.

• На примере предложенной системы адаптивного нейроуправления с регенерируемым эталонным переходным процессом показана возможность перехода от нейросетевых к классическим принципам управления, в результате чего предложена система модифицированного ПИД-регулирования, совмещающая в себе положительные качества нейросетевого прототипа с простотой и надежностью систем ПИД-регулирования.

• Предложены методики безмодельного прогнозирующего инверсного и релейного нейроуправления, позволяющие в условиях неопределенности синтезировать САУ с качествами, соответствующими современным стратегиям прогнозирующего управления с моделью и оптимального по быстродействию управления. Предложенные методики значительно упрощают и унифицируют

процедуру синтеза САУ, не требуют знания математической модели объекта управления и позволяют учитывать факторы, влияющие на функционирование системы в замкнутом контуре.

• Практическая реализуемость и конкурентоспособность предложенных решений подтверждена численными и натурными экспериментами на широком классе линейных и нелинейных объектов управления, в том числе многосвязных.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

1. Notkin B.S., Zmeu K.V., On Adaptive Neurocontrol of the Nonlinear Dynamic Plant // Materials of the Fifth International Young Scholar's Forum of the Asia-Pacific Region Countries. Vladivostok, Russia, Far Eastern State Technical University, 2003, - part II, p. 10-14.

2. Боткин Б.С., Змеу K.B., Об условиях корректного функционирования статических ней-росетей с онлайновым обучением в динамических системах управления // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. - Владивосток: Изд-во ДВГТУ, 2004. - с. 228 -232.

■ 3. Ноткин Б.С., Степанюк В.В., Змеу К.В., Метод синтеза оптимальных нейросетевых регуляторов // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. - Владивосток: Изд-во ДВГТУ, 2004. - с. 232 -234.

4. Konstantin V. Zmeu, Boris S. Notkin, Vyacheslav V. Stepaniuk. Predictive Inverse Neurocontrol //Pacific Science Review. - Volume 6(1), 2004, Kokushikan University, Tokyo, Japan, pp. 22 -25. ISSN 1229-5450.

5. Ноткин Б. С., Змеу К. В. Эффективная нейросетевая идентификация инверсной динамики объекта управления для синтеза прогнозирующих систем управления // Труды IV Между-нар. конф. "Идентификация систем и задачи управления" (SICPRO'2005). — М.: ИПУ РАН. — 2005. —с. 887-900.

6. Stepanyuk V.V., Notkin B.S., Zmeu K.V. On-ofT Neural Network Control System. Materials of the Sixth International Young Scholars' Forum of the Asia-Pacific Regin Countries. Vladivostok, Russia. Far-Eastern National Technical University. 2005 - p.246 - part I, pp.171 - 174.

7. Дьяченко П.А., Ноткин B.C., Змеу K.B., Некоторые аспекты практического решения задачи быстрого прототипирования САУ в среде MATLAB // XI Международная научно-практическая конференция студентов, аспирантов и молодых ученых "Современные техника и технологии" (СТТ2005). Т.2. - Томск: Изд-во Томского политехи, ун-та, 2005. - с. 145 - 146.

8. Змеу К.В., Дьяченко П.А., Ноткин Б.С. О подходах к выбору базы для сравнения при разработке законов управления // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. — Владивосток: Изд-во ДВГТУ, 2006. — с. 147-149.

9. Змеу К.В., Ноткин Б.С. О линейном/нелинейном в одном классе нелинейных САУ // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. — Владивосток: Изд-во ДВГТУ, 2006. - с. 149-151.

10. Змеу К.В., Ноткин Б.С., Дьяченко П.А. Безмодельное прогнозирующее инверсное ней-роуправление // Мехатроника, автоматизация, управление. 2006. №9. с. 8-15.

11. Konstantin Zmeu, Boris Notkin, Vyacheslav Stepaniuk, Shengbo Li, Pavel Dyachenko, Predictive Inverse Neurocontrol: an experimental case study // Harbin Institute of Technology, China (принята к публикации)

Б.С. Ноткин

Системы прогнозирующего нейроуправления нелинейными динамическими объектами

Автореферат диссертации на соискание ученой степени . кандидата технических наук

Подписано в печать 11.09.06. Формат 60x84/16 Усл. печ. л. 1,16. Уч.-изд. л. 1,0 Тираж 100 экз. Заказ 125

Типография издательства ДВГТУ. 690950, Владивосток, Пушкинская, 10

Оглавление автор диссертации — кандидата технических наук Ноткин, Борис Сергеевич

Введение.

ГЛАВА 1. Искусственные нейронные сети и их применение для решения задач управления.

1.1. Искусственные нейронные сети: общие положения.

1.2. Искусственные нейронные сети: основные решаемые задачи.

1.3. Обучение искусственных нейронных сетей.

1.4. Этапы развития искусственных нейронных сетей с позиций сегодняшнего дня.

1.5. Статические нейронные сети и динамические задачи управления.

1.6. Классификация и обзор нейросетевых приемов управления.

1.6.1. Непосредственное инверсное управление (Direct Inverse Control).

1.6.2. Инверсное управление с пассивной адаптацией (Nonlinear Internal Model Control).

1.6.3. Адаптивное нейроуправление с эталонной моделью (Model Reference Adaptive Control).

1.6.4. Адаптивный нейро-ПИД регулятор.

1.6.5. Адаптивно-критическая схема (Adaptive Critic).

1.6.6. Прогнозирующее нейроуправление (Model Predictive NeurocontroI).

ГЛАВА 2. Нейросетевые модели динамических объектов и системы управления на их основе.

2.1. Непосредственное инверсное нейроуправление: основной принцип и связанное с ним заблуждение.

2.2. Новый подход к построению систем непосредственного инверсного нейроуправления.

2.3. Экспериментальное сравнение предложенного подхода с современными методами синтеза систем нейроуправления.

2.4. Теоретические свойства и практические трудности построения нейросетевых моделей динамических объектов.

2.5. Выводы по главе.

ГЛАВА 3. Системы адаптивного нейроуправления с эталонной моделью: анализ и новое решение.

3.1. Простая альтернатива методу обратного распространения ошибки регулирования сквозь структуру нейросетевой модели прямой динамики объекта для систем адаптивного нейроуправления.

3.2. Адаптивное нейроуправление с эталонной моделью: критический анализ основного принципа и его связь с ПИ-регулированием.

3.3. Новый подход к построению систем адаптивного нейроуправления с эталонной моделью и его сравнение с альтернативными методами управления.

3.4. Выводы по главе.

ГЛАВА 4. Линейные законы регулирования в нелинейных САУ: потенциал и связь с нелинейными подходами.

4.1. Об использовании линейных законов регулирования в нелинейных САУ.

4.2. Два шага от предложенной схемы адаптивного нейроуправления к предлагаемой структуре модифицированного ПИД-регулирования.

4.3. О связи ПИД-м-регулирования с известными подходами к решению задачи управления.

4.4. Экспериментальное сравнение линейного ПИД-м-регулирования с распространенными методами нелинейного нейросетевого управления.

4.5. Некоторые теоретические аспекты ПИД-м регулирования и его связь с принципами построения систем с переменной структурой.

4.6. Практический эксперимент: управление нелинейным многосвязным аэродинамическим объектом.

4.6.1. Описание лабораторной модели.

4.6.2. Практические результаты различных методов управления лабораторной установкой СЕ-150 «Helicopter Model».

4.7. Выводы по главе.

Выводы по

главам 1-4. Общий критический анализ широко распространенных методов нейроуправления.

В.1. Необходимые признаки конкурентоспособной системы нейроуправления.

ГЛАВА 5. Безмодельное прогнозирующее нейроуправление.

5.1. Общий принцип предлагаемого подхода к синтезу систем безмодельного прогнозирующего нейроуправления: прогнозирование через «воспоминания».

5.2. Безмодельное прогнозирующее инверсное нейроуправление.

5.2.1. Свойства систем безмодельного прогнозирующего инверсного нейроуправления в зависимости от горизонта прогноза.

5.2.2. Экспериментальное исследование некоторых свойств систем безмодельного прогнозирующего инверсного нейроуправления.

5.3. Прогнозирующее релейное нейроуправление.

5.3.1. Экспериментальное исследование некоторых свойств систем безмодельного прогнозирующего релейного нейроуправления.

5.4. Выводы по главе.

ГЛАВА 6. Сравнительное исследование предложенных подходов к синтезу САУ на примерах упраления реальными объектами.

6.1. Описание экспериментальных установок.

6.2. О возможности редукции размерностей ретроспективных векторов.

6.3. Системы управление положением звена планарного манипулятора.

6.4. Системы управления положением лопасти в воздушном потоке.

6.5. Системы управления «вертолетом».

6.5.1. Системы управления углом азимута.

6.5.2. Системы управления углом азимута в условиях возмущения со стороны угла атаки.

6.5.3. Системы двухкоординатного управления.

6.6. Экспериментальное подтверждение влияния фактора неопределенности динамики.

6.7. Выводы по главе.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Ноткин, Борис Сергеевич

Развитие теории автоматического управления, как и развитие любого другого направления науки, характеризуется усложнением решаемых задач и повышением качественных показателей требуемых решений. Модификация и совершенствование традиционных приемов управления не всегда обеспечивает выполнение современных требований. В этом случае возникает необходимость поиска альтернативных подходов, одним из которых на сегодняшний день является применение аппарата искусственных нейронных сетей (ИНС). ИНС уже успешно используются в различных областях науки и техники, дополняя или даже замещая традиционные подходы. Свойство ИНС обучаться на примерах делает их более привлекательными по сравнению с системами, которые следуют определенной системе правил функционирования, сформулированной экспертами. В области управления ИНС рассматриваются как подходящее средство для решения сложных нелинейных задач управления, для которых классические методы регулирования не дают удовлетворительных с практической точки зрения решений. Аппарат ИНС составляет основу «интеллектуального» подхода к синтезу систем автоматического управления (САУ). Для этого направления теории автоматического управления введено отдельное название -нейроуправление [120].

Ранние этапы развития многих направлений в науке сопряжены с возлагаемыми на них большими надеждами, которые по мере формирования прикладных областей приобретают более сдержанный характер. В этом отношении история развития нейроуправления не является исключением. Не последнюю роль в этом сыграло претензионное определение таких систем как «интеллектуальных». Распространенные к сегодняшнему дню методы нейроуправления не соответствуют изначально ожидаемой простоте и универсальности. К сегодняшнему дню системы нейроуправления пока не получили ожидавшегося широкого распространения на практике.

Целью диссертационной работы является разработка и исследование практически реализуемых конкурентоспособных нейросетевых подходов к управлению динамическими объектами в условиях неопределенности.

Для достижения цели были поставлены и решены следующие задачи.

1. Исследование наиболее распространенных приемов нейроуправления. Выявление основных недостатков и путей их устранения.

2. Анализ целесообразности использования нейросетевого аппарата в известных и предложенных нейросетевых системах управления.

3. Исследование возможности перехода от нейросетевых к классическим принципам управления.

4. Выявление признаков целесообразности применения нейросетевого аппарата в задачах управления и разработка конкурентоспособных методик синтеза систем нейроуправления.

5. Экспериментальное исследование предложенных подходов на примерах управления реальными объектами.

При исследованиях применялись методы классической и современной теории автоматического управления, в частности, теории инверсного, адаптивного, робастного, прогнозирующего и оптимального управления, а также теория искусственных нейронных сетей и методы нейрокибернетики. Проверка полученных в ходе работы теоретических результатов выполнялась средствами численного моделирования в среде MATLAB и подтверждалась результатами натурных экспериментов на лабораторных установках.

Научная новизна полученных результатов состоит в следующем.

1. Предложены системы непосредственного инверсного и адаптивного нейроуправления с регенерируемым эталонным переходным процессом.

2. На примере линейных объектов управления показана возможность обучения нейрорегулятора адаптивной системы непосредственно по ошибке управления.

3. Предложен подход к синтезу САУ в условиях неопределенности -безмодельное прогнозирующее нейроуправление.

Наибольшую практическую ценность представляют следующие результаты работы.

1. Методика синтеза систем безмодельного прогнозирующего инверсного нейроуправления, позволяющая в условиях неопределенности реализовывать свойства систем прогнозирующего управления с моделью.

2. Методика синтеза систем безмодельного прогнозирующего релейного нейроуправления, позволяющая в условиях неопределенности реализовывать свойства систем близких к оптимальным по быстродействию.

3. Структурная схема и методика настройки системы модифицированного ПИД-регулирования, обеспечивающая качественное управление широким классом нелинейных объектов, отличающаяся оригинальной организацией интегрального канала и допускающая расширенное использование производных.

Научные и практические результаты диссертационной работы внедрены в учебный процесс Дальневосточного государственного технического университета; рекомендованы к внедрению в институте автоматики и процессов управления ДВО РАН при разработке систем многокоординатного управления подводными аппаратами; на базе лаборатории Automatic Control Telelab [135] (университет Сиены, Италия) реализованы в форме установки для демонстрации эффективности современных алгоритмов управления.

Основные результаты исследования по теме диссертации изложены в 11 печатных работах и докладывались на V и VI Международных форумах молодых ученых стран АТР, г. Владивосток, 2003, 2005 гг. [90; 113]; на Региональной научной конференции "Молодежь и научно-технический прогресс", г. Владивосток, 2004, 2006 гг. [7; 8; 18; 19]; на IV Международной конференции "Идентификация систем и задачи управления", Институт проблем управления им. В.А. Трапезникова РАН, Москва, 2005 г. [17]. С рейтинговыми показателями предлагаемых решений и практической реализацией системы двухкоординатного управления лабораторной установкой «Helicopter СЕ-150» можно ознакомиться посредством Интернет-ресурса лаборатории Automatic Control Telelab [135].

Заключение диссертация на тему "Системы прогнозирующего нейроуправления нелинейными динамическими объектами"

6.7. Выводы по главе

В настоящей главе продемонстрирована практическая работоспособность и выполнено сравнение предложенных в ходе диссертационной работы систем управления, как между собой, так и с системами ПИД-регулирования. Выявленные в результате сравнительных экспериментов характеристики предложенных решений сведены в таблицу.

ЗАКЛЮЧЕНИЕ

Решаемые с помощью нейросетевого аппарата задачи неуникальны. В подавляющем большинстве случаев за термином «обучение искусственной нейронной сети» скрывается одна из вполне традиционных задач: аппроксимация, оптимизация, классификация или кластеризация. Эти задачи с равным успехом могут рассматриваться как в нейросетевом базисе, так и за его пределами. Однако лишь нейросетевые методы решения перечисленных задач принято относить к разряду интеллектуальных реализаций. Более того, сложилась традиция объединять такие реализации в отдельные предметные области. Нейроуправление является одной из таких областей.

Современное отношение к нейроуправлению неоднозначно. В отечественных и зарубежных литературных источниках нам не удалось найти четкого определения понятия «нейросетевая система управления». К сегодняшнему дню сложилась традиция относить к разряду нейросетевых любые системы, содержащие в своей структуре нейронные сети. Однако в отечественной литературе тенденция выделять такие решения в самостоятельную область прослеживается более явно. В зарубежной литературе термин «нейроуправление» (neurocontrol) не получил широкого распространения, и нейронные сети в большинстве случаев позиционируются как надстройка к существующим решениям или способ реализации тех или иных функций. Именно такое утилитарное понимание места нейросетей в задачах управления сложилось и у нас в процессе выполнения диссертационного исследования.

Если все же выделять нейросетевые системы управления в отдельный класс, то подавляющее большинство работ в этой области можно классифицировать как исследование возможности интеграции нейронных сетей в структуры систем автоматического управления. Существенная часть диссертационного исследования посвящена критическому анализу наиболее распространенных из таких нейросетевых решений. В этой части работы показано, что область целесообразного (конкурентного) применения нейросетевого аппарата в задачах управления существенно уже области его возможных применений. В частности, использование методов нейроаппроксимации в качестве методов идентификации динамических объектов и применение алгоритмов обучения нейросетей в качестве механизмов адаптации систем управления теоретически возможно, но практически связано с рядом трудностей и недостатков.

Нами предложен новый принцип синтеза систем нейроуправления -безмодельное прогнозирующее нейроуправление. В рамках этого принципа в работе предложены две методики: безмодельное прогнозирующее инверсное и релейное нейроуправление. В обеих методиках нейросетевой аппарат рассматривается исключительно как удобный, но не единственный механизм аппроксимации. Несмотря на возможность отказа от использования нейросетевого аппарата и на отмеченную неопределенность термина «нейросетевая система управления» предложенные методики определены как нейросетевые. Этим выбором мы стремились подчеркнуть принадлежность предложенных решений к парадигме мягких вычислений, которая на сегодняшний день в первую очередь связывается с нейронными сетями.

С точки зрения синтеза и качества получаемых решений, предложенные методики обладают основными преимуществами, ожидаемыми от реализации систем нейросетевого управления. Они не требуют знания математической модели объекта управления, отличаются существенной унификацией и способностью учитывать все факторы, влияющие на функционирование системы в замкнутом контуре.

Предложенные методики позволяют в условиях неопределенности синтезировать системы управления с качеством регулирования на уровне современных аналитических стратегий управления (прогнозирующее управление с моделью и оптимальное по быстродействию управление). Конкурентоспособность предложенных решений подтверждена численными и натурными экспериментами на широком классе линейных и нелинейных объектов управления, в том числе и многосвязных.

Библиография Ноткин, Борис Сергеевич, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)

1. Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит., 1960. 400 с.

2. Галушкин А. И. Теория нейронных сетей. Кн. 1://Сер. «Нейрокомпьютеры и их применение»/ Под ред. А. И. Галушкина. М.: Изд-во ИПРЖР, 2000.416 с.

3. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности / Вороновский Г.К., Махотило К. В., Петрашев С. Н., Сергеев С. А. X.: Основа, 1997. - 112 с.

4. Денис Дж., Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений: Пер. с англ. М.: Мир, 1998 - 440 с.

5. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х кн. М., 1986.

6. Змеу К.В., Дьяченко П.А., Ноткин Б.С. О подходах к выбору базы для сравнения при разработке законов управления // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. -Владивосток: Изд-во ДВГТУ, 2006. с. 147-149.

7. Змеу К.В., Ноткин Б.С. О линейном/нелинейном в одном классе нелинейных САУ // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. Владивосток: Изд-во ДВГТУ, 2006. - с. 149-151.

8. Интеллектуальные системы автоматического управления / Под ред. И.М. Макарова, В.М. Лохина. М.: ФИЗМАТЛИТ, 2001. - 576 с. - ISBN 59221-0162-5

9. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1984

10. Методы классической и современной теории автоматического управления: Учебник в Зх томах. Т.1. Анализ и статистическая динамика систем автоматического управления/Под ред. Н.Д.Егупова М.: Изд-во МГТУ им. Н.Э.Баумана, 2000 - 748 с. ил.

11. Методы классической и современной теории автоматического управления: Учебник в 3-х Т. Т.2: Синтез регуляторов и теория оптимизации систем автоматического управления / Под ред. Н. Д. Егупова.-М.: Изд.-во МГТУ им. Баумана, 2000.-736 е.: ил.

12. Методы робастного нейро-нечеткого и адаптивного управления: Учебник / Под ред. Н. Д. Егупова; издание 2-ое, стереотипное. М.: Изд-во МГТУ им. Н. Э. Баумана, 2002. 744 е., ил.

13. Назаров А.В., Лоскутов А.И. Нейросетевые алгоритмы прогнозирования и оптимизации систем Спб.: Наука и Техника, 2003. -384 е.: ил.

14. Нейроинформатика / А.Н. Горбань, В.Л. Дунин-Барковский, А.Н. Кирдин и др. Новосибирск: Наука. Сибирское предприятие РАН, 1998. -296с

15. Нейроинформатика и ее приложения // Материалы 3-го Всерос. семинара, 6-8 октября 1995 г. Ч. 1 / Под ред. А. Н. Горбаня. Красноярск. Изд-во КГТУ, 1995. 230 с.

16. Ноткин Б.С., Степанюк В.В., Змеу К.В., Метод синтеза оптимальных нейросетевых регуляторов // Сборник докладов конференции "Молодежь и научно-технический прогресс". Часть 1. Владивосток: Изд-во ДВГТУ, 2004. -с. 232-234.

17. Розенблат Ф. Принципы нейродинамики: Перцептрон и теория механизмов мозга. М.: Мир, 1965.

18. Сигеру Омату, Марзуки Халид, Рубия Юсоф. Нейроуправление и его приложения. Кн. 2.; Пер. с англ. Н. В. Батина; Под ред. А. И. Галушкина, В. А. Птичкина. М.: ИПРЖР, 2000. - 272 е.: ил. (Нейрокомпьютеры и их применение).

19. Справочник по теории автоматического управления/ под редакцией А.А. Красовского.-М.:Наука.1987. 712с.

20. Терехов В. А, Ефимов Д. В., Тюкин И. Ю. Нейросетевые системы управления. Кн. 8: Учеб. пособие для вузов / Общая ред. А. И. Галушкина. -М.: ИПРЖР, 2002.- 480 е.: ил. (нейрокомпьютеры и их применение). ISBN 593108-016-3.

21. Филаретов В.Ф., Алексеев Ю.К., Лебедев А.В. и др. Системы управления подводными роботами / Под ред. В.Ф. Филаретова. М.: Круглый год, 2001.288 с.: ил.

22. Филипс Ч., Харбор Р. Системы с обратной связью. М.: Лаборатория базовых знаний, 2001 - 616 е.: ил.

23. Ablameyko S., Goras L., Gori M. and Piuri V. Neural Networks for Instrumentation, Measurement and Related Industrial Applications, NATO Science Series, Series III: Computer and System Sciences Vol. 185, IOS Press, 2003

24. Agarwal M. A Systematic Classification of Neural-Network-Based Control//IEEE Control Systems. April, 1997. P. 75-93

25. Antsaklis P.J., "Neural Networks in Control Systems", IEEE Control Systems Magazine (special issue on neural control) 10, 3, April (1990).

26. Astrom К .J. and Hagglund Г., "Benchmark systems for PID control," in Proc. IFAC Workshop, Terrassa, Spain, 2000, pp. 165-166.

27. Astrom K. J., Hagglund T. Advanced PID Control. The Instrumentation, Systems, and Automation Society, 2005,461 pp. ISBN 1556179421

28. Barry T. and Wang L., "A Model-free Predictive Controller with Laguerre Polynomials", Proceedings of the 5th Asian Control Conference, Melbourne, Australia, July 20-23,2004.

29. Bhat N. V. Jr, Minderman P. A., McAvoy T. and Wang N. S. Modeling chemical process systems via neural computation // IEEE Control Systems Magazine, Vol. 10, pp. 24-30, 1990

30. Brown R.E., Maliotis G.N., Gibby J.A. PID Self-Tuning Controller for Aluminum Rolling Mill // IEEE Transactions on Industry Applications, 29(3), 1993, pp.578-583.

31. Camacho E.F., Bordons C. Model Predictive Control, Springer, 1999

32. Chen S., Billings S. A. and Grant P. M. Nonlinear system identification using neural networks. Int. Journal of Control, Vol. 51, pp. 1251-1228, 1990

33. Chen S., Billings S. A. Neural networks for non-linear dynamic system modeling and identification // Int. J. Control. 1992. Vol. 56, №2. - p. 319-349.

34. Chen, L. J., Narendra K. S. Nonlinear adaptive control using neural networks and multiple models, Automatica, 2001, pp. 1245-1255.

35. Chu S. R., Shoureshi R. and Tenoro M. Neural network for systems identification // IEEE Control Systems Magazine, Vol. 10, pp. 31-35,1990

36. Cybenko G. Approximation by superpositions of a sigmoidal function. // Math. Control Systems and Signals. 1989. №2. P. 303-314.

37. Favoreel W. and Moor B.De, "SPC:Subspace predictive control" ,Tech.report, Katholieke Universiteit Leuven, elgium,1998.

38. Frueh J.A. and Phan, M.Q. System Identification and Inverse Control Using Input-Output Data from Multiple Trials, Proceedings of the 2nd Asian Control Conference, Vol. 2, Seoul, Korea, July 1997, pp. 251-254.

39. Funahashi K. On the approximate realization of continuous mappings by neural networks. Neural Networks, 1989. № 2, P. 183-192.

40. Gawthrop P. J., Jones R. W. and Sbarbaro D. G. Emulator-based control and internal model control: Complementary approaches to robust control design. Automatica, 32(8): 1223-1227, August 1996.

41. Gil P., Henriques J., Dourado A. and Duarte-Ramos H. Constrained Neural Model Predictive Control with Guaranteed Free Offset., Proc. 2000 IEEE Int. Conf. on Industrial Electronics, Control and Implementation IEECON, Nagoya, Japan, pp. 1991-1996,2000.

42. Hagan M. and Latino C., "A Modular Control Systems Laboratory" Computer Applications in Engineering Education Vol. 3, No. 2, 1995, pp. 89-96.

43. Hagan M. Т., Demuth H. B, Beale M.H. Neural Network Design. Boston, MA: PWS Publishing, 1996.

44. Hagan M. Т., Demuth H. В., and Jesus O. D., «An introduction to the use of neural networks in control systems» International Journal of Robust and Nonlinear Control, John Wiley & Sons, 12(11), pp. 959-985, September 2002.

45. Hagan M., De Jesus O. and Schultz R., "Training Recurrent Networks for Filtering and Control," Chapter 11 of Recurrent Neural Networks:Design and Applications, L.R. Medsker and L.C. Jain, Eds., CRC Press, 1999, pp. 325-354.

46. Hagan, M. Т. and Demuth, H.B. 'Neural Networks for Control,' Proceedings of the 1999 American Control Conference, San Diego, CA, pp. 16421656, 1999.

47. Haykin S. Neural networks: A Comprehensive Foundation. N.-Y.: Macmillan, 1999, 842 P.

48. Haykin S., Neural Networks: A Comprehensive Approach", Macmillian College Publishing Company ed., New York, 1994.

49. Hebb D. 0. The organization of behavior: A neuropsychological theory. -N. Y.: Wiley, 1949.

50. Hecht-Nielsen R., Neurocomputing. New York: Addison-Wesley, 1989.

51. Но K.C., Ponnapalli, P.V.S., and Thomson, M.T. Modified direct inverse control of a CSTR process, Systems Science Journal, Vol.24 , No.4, January 1999.

52. Hopjield J.J. Neural networks and physical systems with emergent collective computational abilities // Proc. National Acad. Science. 1982. Vol. 79. -P. 2554-2558.

53. Hornick K., Stinchcombe M, and White H. Multilayer feedforward networks are universal approximators. Neural Networks, 1989, № 2, P. 359-366.

54. Hunt K. J., Sbarbaro D. Neural networks for nonlinear internal model control // IEEE proceeding. 1991. - Vol. 138, № 5. - P. 431-439.

55. Hunt K. J., Sbarbaro D., Zbikowski R., Gawthrop P. J. Neural networks for control systems A survey I I Automatica, Vol. 28, pp. 1083 - 1112, 1992.

56. Jacobs R.A., Jordan M.I., Nowlan S.J., Hinton G.E. Adaptive Mixtures of Local Experts, Neural Computation, 3, 1991, pp. 79-87.

57. Jordan M. I. Generic constraints on underspecified target trajectories. Proc. of Int. Joint Conf. on Neural Networks (IJCNN)'89, Washington, Vol. 1, pp. 217225, 1989

58. Jordan M. I., Rumelhart D. E. Forward models: Supervised learning with a distal teacher. CognitiveSience, Vol. 16, pp. 313-355, 1990

59. Jung S., Hsia Т. C., Neural network inverse control techniques for PD controlled robot manipulators. Robotica, pp. 461-455, vol. 19, no.3,2000.

60. Kadali R., Huang B. and Rossiter A., "A data driven subspace approach to predictive controller design" ,Control Engineering Practice 11 (20Q3),no.3, pp. 261 -278.

61. Karakuzu C., Oztiirk S., A Comparison of Fuzzy, Neuro and Classical Control Techniques Based on an Experimental Application., Journal of Qafqaz University Fall 2000, № 6, pp. 189-198.

62. Kohonen T. Self-organized formation of topologically correct feature maps //Biolog. Cybernetics. 1982. Vol. 43. - P. 59-69.

63. Kowato M, Furikawa K. and Suzuki R. A hierarchical neural network model for control and learning of voluntary movement. Biological Cybernetics, Vol.57, pp. 169-185, 1987.

64. Kowato M., Uno Y., Isobe M. and Suzuki R. Hierarchical neural network model for voluntary movement with application to robotics // IEEE Control Systems Magazine, Vol. 8, pp. 8-16, 1988.

65. Kraft L.G. and Campagna D.P., "A Comparison between CMAC Neural Network Control and Two Traditional Control Systems" IEEE Control Systems Magazine, vol. 10, no. 2, pp. 36-43, 1990.

66. Lakhmi, C.J., Clarence, S.fV. Intelligent adaptive control: Industrial Applications. CRC Press (1999)

67. Learning-logic: Casting the cortex of the human brain in silicon, Parker D. В.: Technical Report / Center for Computation Research in Economics and Management Science. TR-47. - Cambridge, MA: MIT, 1985. - 73 p.

68. LeCun, Y. Une procedure d'apprentissage pour reseau a seuil assymetrique // Cognitiva 85. 1985. - P. 599-604

69. Levin A. U., Narendra К S. Control of nonlinear dynamic system using neural networks. Part II: Observability, identification and control/ЛЕЕЕ Trans. Neural Networks. 1996. Vol. 7. № 1. P. 30-42.

70. Levin A.U., Narendra KS. Control of nonlinear dynamic system using neural networks: Controllability and stabilization // IEEE Trans. Neural Networks. 1993. Vol. 4. №2. P. 192-206.

71. Liu G. P., Kadirkamanathan V., Billings S. A. Predictive control for nonlinear systems using neural networks. Int. J. Control, 71: 1119-1132, 1998.

72. Maciejowski J.M. Predictive control with constraints. Prentice Hall, 2002

73. Martin Sanchez J.M., Rodellar J. Adaptive predictive control: from concepts to plant optimisation. Prentice Hall, 1996

74. McCulloch W., Pitts W. A logical calculus of the immanent in nervous activity // Bulletin of mathematical biophysics. 1943. - Vol. 5. - P. 115-133.

75. Miller, W.T., Sutton, R.S. and Werbos, P.J. (Eds.), Neural Networks for Control. Cambridge, Mass., MIT Press, 1995. Paperback ed. of the 1990 original. 524 pp.

76. Minsky M., Papert S. Perceptrons: An introduction to computational geometry. Cambridge (Massachusetts): Adison - Wesly, 1969. - 262 p.

77. Nahas E.P., Henso M.A. and Seborg D.E., Nonlinear Internal Model Control Strategy for Neural Models, Computers and Chemical Engineering, vol. 16, pp. 1039-1057, 1992.

78. Narendra K. S., Mukhopadhyay S. Intelligent control using neural networks. IEEE Control Systems Magazine 1992; 12(5): 11-18

79. Narendra K.S. and Lingji Chen. Identification and control of a nonlinear dynamical system E based on its linearization Part I. In Proceedings of the 37th IEEE Conference on Decision and Control, volume 3, pages 2977-2982,1998.

80. Narendra K.S., Xiang C., Adaptive Control of Discrete-Time Systems Using Multiple Models, IEEE Transactions on Automatic Control, 45(9), 2000, 1669-1686

81. Narendra, K.S. and K. Parthasarathy, 'Identification and Control of Dynamical Systems Using Neural Networks,' IEEE Transactions on Neural Networks, vol. 1,4-27, 1990.

82. Narendra, K.S. and Mukhopadhyay S. Adaptive Control Using Neural Networks and Approximate Models // IEEE Trans-actionson Neural Networks, vol. 8,475-485,1997.

83. Nguyen D. H. Widrow B. Neural network for self-learning control system // IEEE Control Systems Magazine, Vol. 10, pp. 18-23, 1990.

84. Norgaard, M., Ravn 0., Poulsen N.K. and Hansen L. K. Neural Networks for Modelling and Control of Dynamic Systems, Springer-Verlag, p. 246, London, 2000.

85. Notkin B.S., Zmeu К. V. On adaptive neurocontrol of the nonlinear dynamic plant// Proceeding of Fifth International Young Scholars Forum of the Asia-Pasific Region Countries. -23-26 September 2003.-Vladivostok.-2003.-P.10-14.

86. Omatu S. and Yoshioka M. Self-tuning neuro-PID control and applications, in 1997 IEEE Int. Conf. Syst., Man, Cybern., vol. 3,1997, pp. 1985-1989.

87. Omatu S., Fujinaka T. and M. Yoshioka M., Neuro-pid control for inverted single and double pendulums // IEEE Conference, pp. 2685- 2690,2000.

88. Passino K.M., "Bridging the Gap Between Conventional and Intelligent Control", Special Issue on Intelligent Control, IEEE Control Systems Magazine, Vol. 13, No. 3, pp. 12-18, June 1993.

89. Pesonen U. J., Steck J. E., K. Rokhsaz, N. Duerksen, S. Bruner, Adaptive Neural Network Inverse Controller for General Aviation Safety, AIAA of Guidance, Control, and Dynamics, vol. 27, no. 3, May June 2004, pp. 434-443.

90. Phan M.Q. and Longman, R.W. A Model Reference Adaptive Control Method for a Class of Linear Discrete Multivariable Systems. Modeling and Simulation, Instrument Society of America, Vol. 20, Part 5, 1989, pp. 1865-1869.

91. Phillips C. L., Harbor R. D. Feedback Control Systems, fourth edition, Prentice Hall, 2000

92. Polycarpou MM. Stable adaptive neural control scheme for nonlinear control // IEEE Transactions on Automatic Con-trol, vol. 41, no. 3, pp. 447-451, 1996.

93. Prabhu S. M., GargD. P. Artificial neural network based robot control: An overview. Journal of Intelligent and Robotic Systems, 15:333-365,1996.

94. Prokhorov V. and Wunsch D. C. Adaptive critic designs // IEEE Trans. Neural Networks, vol. 8, no. 5, pp. 997-1007, 1997.

95. Psaltis D., A. Sideris and A. Yamamura. A Multilayered neural network controller //IEEE Control Systems Magazine, Vol. 8, P. 17-21, 1988

96. Rao Y.N., Erdogmus D., Rao G.Y., Principe J.C. Fast Error Whitening Algorithms for System Identification and Control, Proceedings of NNSP'03, pp. 309-318, Toulouse, France, Sep 2003.

97. RayChaudhuri Т., Hamey L.G.C., BellR.D. From conventional control to autonomous intelligent methods, IEEE Control Systems Magazine, Volume 16, Issue 5, Oct. 1996 pp. 78-84

98. Richard S. Sutton and Andrew G. Bar to. Reinforcement Learning: An Introduction. The MIT Press, 1998.

99. Riedmiller M. and Braun H. A direct adaptive method for faster backpropagation learning: The RPROP algoritm // Proceedings of the IEEE International Conference on Neural Networks, 1993.

100. Rossiter, J.A. Model-based Predictive Control: a Practical Approach. CRC Press, 2003

101. Rumelhard D. E., Hinton G. E., Williams R. J. Learning representation by back propagation error // Nature (London). 1986. - N 323. - P. 533-536.

102. Saerens M., Soquet A. A neural controller based on backpropagation algoritm. Proc. of First IEEInt. Conf. on Artificial Neural Networks, London, pp. 211-215, 1989.

103. Saiful A. and Omatu S. Neuromorphic self-tuning PID controller. Proc. of 1993 IEEE ICNN. San Francisco, pp 552-447, 1993

104. Sanner R.M. and Slotine J.J.E. Gaussian Networks for Direct Adaptive Control // IEEE Transactions on Neural Networks, vol. 3, pp. 837-863,1992.

105. Spall J.C. and Cristion J.A. Model-free control of nonlinear stochastic systems with discrete-time measurements I I IEEE Transactions on Automatic Control, vol. 43, no. 9, pp. 1198-1210, 1998.

106. Stenman A., "Model on demand:Algorithms,analysis and applications", Ph.D.thesis, Dept of EE, Linkoping University,SE-581 83 Linkoping, Sweden, Apr 1999.

107. Suykens J., Bersini #., Neural control theory: an overview, Journal A, vol.37, no. 3, 1996, pp. 4-10.

108. The Control Handbook. William S.Levine, ed. CRC Press, IEEE Press, 1548 p. 1996.

109. Wang D. H. and Bao P. Enhancing the estimation of plant Jacobian for adaptive neural inverse control, International Journal Neurocomputing, Vol.34, pp.99-115,2000.

110. Werbos P, "Approximate dynamic programming for real-time control and neural modeling", in Handbook of Intelligent Control, White and Sofge, Eds., Van Nostrand Reinhold, 1992, pp 493 525.

111. Werbos P. J. "Overview of designs and capabilities", in Neural Networks for Control, MIT Pres, Cambridge, MA, pp. 59-65,1990

112. Werbos P. J. An overview of neural networks for control. IEEE Control Systems Magazine, January 1991, pp. 40-41

113. Werbos P. J. Backpropagation and neurocontrol: A review and prospectus // Proc. of International Conf. on Neural networks. Vol. 1. -Washington, DC. - 1989. - P. 209-216.

114. Werbos P. J. Beyond regression: New tools for prediction and analysis in the behavioral science: Ph.D. Thesis. Harvard University, Cambridge, MA, 1974. -120 p.

115. Werbos P. J. Neurocontrol and Supervised Learning: An Overview and Evaluation, Handbook of Intelligent Control, D. A. White and D. A. Sofge (eds.), pp. 65-86, Van Nostrand Reinhold, New York, 1992.

116. Widrow B. and Bilello M. Nonlinear adaptive signal processing for inverse control. Proc. World Congress Newral Networks, San Diego, 1994.

117. Widrow В., HoffM. E., Jr. Adaptive switching circuits // IRE WESCON Conventional Record. 1960. - P. 96-104.

118. Widrow В., Walach E. Adaptive Inverse Control, New Jersey: Prentice Hall, 1996

119. Wolpert D. M., Kawato M. Multiple paired forward and inverse models for motor control, Neural Networks, v.l 1 n.7-8, p. 1317-1329, Oct./Nov. 1998

120. Xiaohua L., Xiuhong W. and Yunge W. Generalized predictive control based on error correction using the dynamic neural network, Proc. of the 3rd World Congress on Intelligent Control and Automation, vol. 3, no. 28, pp. 1863-1865, July 2000.

121. Yasuhiro Wada, Mitsuo Kawato, A neural network model for arm trajectory formation using forward and inverse dynamics models, Neural Networks, v.6 n.7, pp. 919-932, 1993

122. Yoo S. J., ParkJ. B. and Choi Y. H. Stable Predictive Control of Chaotic Systems Using Self-Recurrent Wavelet. Neural International Journal of Control, Automation, and Systems, vol. 3, no. 1, pp. 43-55, March 2005.

123. Yun Li, Kiam Heong Ang, and Gregory C.Y. Chong, Advances in PID control. IEEE Control Systems Magazine, February 2006, pp. 42-53

124. Yun Li, Kiam Heong Ang, and Gregory C. Y. Chong, PID Control System: Analysis and Design. IEEE Control Systems Magazine, February 2006, pp. 32-41

125. Zamarreno J., Vega P., Garcia L. and Francisco M. State-space neural network for modeling, prediction and control., Control Engineering and Practice, vol. 8, pp. 1063-1075,2000.

126. Zmeu К. V, Notkin B. S., Stepaniuk V. V. Predictive Inverse Neurocontrol // Pacific Science Review Volume 6 (1), 2004, Kokushikan University, Tokyo, Japan, pp. 22 - 25. ISSN 1229-5450

127. Automatic Control Telelab Электронный ресурс. Режим доступа: http://www.dii.unisi.it/~control/act/home.php, свободный. - Загл. с экрана.

128. Официальный сайт компании Humusoft Электронный ресурс. -Режим доступа: http://www.humusoft.com, свободный. Загл. с экрана.

129. Официальный сайт компании KentRidge Instrument Электронный ресурс. Режим доступа: http://www.kri.com.sg, свободный. - Загл. с экрана.

130. Официальный сайт компании Mathworks Электронный ресурс. -Режим доступа: http:// www.mathworks.com, свободный. Загл. с экрана.

131. Официальный сайт компании National Instruments Электронный ресурс. Режим доступа: http:// www.ni.com, свободный. - Загл. с экрана.

132. Официальный сайт компании Sensorey Электронный ресурс. -Режим доступа: http:// www.sensorey.com, свободный. Загл. с экрана.