Теория и построение многомерных инвариантных и адаптивных систем управления динамическими объектами

Терехов, Валерий Александрович

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Теория и построение многомерных инвариантных и адаптивных систем управления динамическими объектами

доктора технических наук: Терехов, Валерий Александрович
город: Санкт-Петербург
год: 2002
специальность ВАК РФ: 05.13.01

Диссертация по информатике, вычислительной технике и управлению на тему «Теория и построение многомерных инвариантных и адаптивных систем управления динамическими объектами»

Оглавление автор диссертации — доктора технических наук Терехов, Валерий Александрович

1. Разработка и исследование систем и средств регулирования для класса линейных многомерных объектов на базе аналоговой и цифровой ~------' : ^ ' шенных системах

КНИГА ИМЕЕТ ивных систем и ктов в условиях яий. тения для класса ктов с неполной ционирования.

I на общем для IX регуляторов я оперативной кжове активных импульсных ДС-цепей, реализующих типовые алгоритмы регулирования. Оснополагающие идеи подхода были сформулированы, обоснованы и частично реализованы в промышленных системах автоматики в период с 1962 по 1968 годы коллективом сотрудников кафедры автоматики и телемеханики ЛЭТИ (ныне кафедры автоматики и процессов управления) под руководством А. А. Вавилова. В наибольшей степени развитие исследований многоканальных регулирующих устройств с типовыми законами регулирования получило б докторской диссертации В.Б. Яковлева (1978 г.). В работах этого периода автор принимал непосредственное участие как разработчик и соавтор публикаций, а впоследствии (с 1979 г.) возглавил продолжение исследований в качестве научного руководителя в организованной им отраслевой научно-исследовательской лаборатории систем и средств контроля и управления технологическими процессами (ОНИЛ СКУ) Минприбора СССР. В период с 1972 г. разработка многоканальных средств для систем автоматизации ряда крупных технических объектов промышленности осуществлялась на новой в то время технологической базе - микропроцессорной технике и в идеологии распределенного управления сложными системами.

Работы автора по второму направлению объединены своей принадлежностью к классу многомерных систем и технических средств регулирования, структурный и алгоритмический синтез которых осуществлялся на основе теорий инвариантности, чувствительности и теории адаптивного управления. Класс объектов управления в работах второго направления сохраняет линейную природу, либо приводится к классу линеаризованных.

Работы третьего направления составляют следующий этап эволюции методов построения систем управления с расширением класса используемых математических моделей до класса нелинейных многосвязных динамических объектов со структурно-параметрической неопределенностью, для управления которыми предложено использовать принципиально другой подход, базирующийся на использовании искусственных нейронных сетей, выполняющих функцию регулятора состояния.

Таким образом, обобщаемые в опубликованных работах автора направления исследований рассматриваются как этапы целенаправленной эволюции методов построения многомерных систем регулирования и управления по мере усложнения математических моделей динамических объектов, целей управления, в зависимости от уровня априорной и текущей информации о состоянии системы и эволюции адекватных методов технической реализации функций регулирования и управления.

I. Типовые аналоговые и микропроцессорные многомерные системы и средства регулирования

Работы автора [1- 23] по синтезу структур, алгоритмов и реализации типовых аналоговых и микропроцессорных многоканальных систем и средств регулирования охватывают следующие направления исследований.

1. Разработка и реализация принципов структурной организации типовых аналоговых и микропроцессорных многоканальных средств регулирования в составе комплекса агрегатных средств контроля и регулирования Государственной системы промышленных приборов и средств автоматизации (ГСП).

2. Разработка методик расчета параметров настройки многоканальных регуляторов с типовыми исполнительными устройствами.

3. Разработка и реализация систем регулирования промышленных многомерных объектов на базе типовых многоканальных аналоговых и микропроцессорных регуляторов.

Отечественный и зарубежный опыт разработки многоканальных средств автоматики, концепция автоматизации отраслевых технологических процессов на основе типовых функционально, метрологически и конструктивно совместимых блоков и устройств, обоснованной номенклатуры типовых моделей приборов и средств, сочетание которых позволяет проектировать специализированные системы управления в любых отраслях промышленности, стали основой для разработки и реализации комплексного подхода к построению функциональных структур и алгоритмов многоканальных регуляторов (МР)в соответствии с:

- принятой архитектурой многомерной системы регулирования и управления (МСРиУ) и доступной информацией для достижения поставленных технологических целей ;

- классом динамических объектов регулирования;

- концепцией унификации, типизации и агрегатирования технических средств автоматизации в проблемно-ориентированные комплексы для нижнего уровня управления с непрерывным или непрерывно-дискретным протеканием технологических процессов.

Первый фактор определяет синтез многомерных систем как локальных автономных систем, либо как подсистем в составе распределенных систем управления, объединяемых локальной вычислительной сетью и его учет влияет на конфигурацию и состав функциональных блоков многоканальных установок регулирования и управления.

Второй фактор характеризует используемый класс математической модели объекта и внешних условий его функционирования. Очевидно, влияние второго фактора сказывается на составе информационного, алгоритмического и программного обеспечения МСРиУ.

Влияние третьего фактора проявляется на уровне технической реализации аппаратных и программных средств многоканальных регуляторов как компонент типового унифицированного технического обеспечения промышленных МСРиУ.

Разработка типовых аналоговых МР для локальных СМР осуществлена на основе активных линейных импульсных ДС-цепей для класса многомерных линейных объектов с совмещением в МР приборного типа функций измерения, контроля, регулирования, индикации и регистрации процессов на выходах многомерного объекта [1]. Результатом этих исследований автора стал ряд новых структур МР, новизна которых подтверждена авторскими свидетельствами СССР [2-5, 9] и зарубежными патентами [6-8,10].

В работе [1] анализируются два новых типа структур многоканальных пропорционально-интегральных (ПИ) регуляторов приборного типа и их варианты. По одной из предложенных схем на кафедре автоматики и телемеханики ЛЭТИ автором была разработана принципиальная схема, изготовлен и исследован действующий жестиканальный ПИ-регулятор на базе автопотенциометра ЭПР-09РДМЗ [2]. Эта разработка послужила прототипом для всех последующих разработок многоканальных регуляторов приборного типа, защищенных авторскими свидетельствами СССР и зарубежными патентами [3-10]. Основные направления совершенствования технических характеристик МР включали в себя повышение точности регулирования за счет разделения во времени процессов измерения и процессов регулирования [3, 5-8,10], повышение надежности и упрощение схемотехники регулятора при управлении исполнительными устройствами постоянной скорости [4], устранение влияния взаимодействия каналов в моменты их коммутации [9]. В работе [11] показано, что для реализации ПИ-закона в каналах МСРиУ оптимальной по совокупности достоинств и недостатков является структура МР с широтно-импульсным управлением исполнительным двигателем (ИД) постоянной скорости и корректирующими обратными связями, охватывающими ИД. В числе ее достоинств - совмещение функций исполнительного и запоминающего устройства в каждом канале на время обегания остальных каналов; широкий диапазон независимых параметров настроек МР в каждом канале; широкая распространенность электромеханических исполнительных устройств типов МЭО, МЭМ и МЭП, в которых для управления ИД используется ШИМ; простота технического решения и как следствие - высокая эксплуатационная надежность.

Для типовой линейной модели промышленных объектов в [11] разработана методика выбора оптимальных параметров настроек многоканального ПИ-регулятора с широтно-импульсной модуляцией (ШИМ) 2-го рода на основе редко используемого, но эффективного критерия в виде интеграла произведения абсолютной ошибки на время J = \e{r)\dT (ITAE критерий). Особенностями методики явилась параметрическая оптимизация исходной нелинейной импульсной системы без наложения каких-либо ограничений на величину и скорость изменения рассогласования e(i) и диапазон изменения возмущений (нагрузки) и применение численных методов решения оптимизации на ЭВМ. Практическим результатом этой работы стали расчетные номограммы для выбора оптимальных параметров настройки многоканальных ПИ-ШИР в по заданию и по нагрузке в зависимости от параметров модели объекта (коэффициента передачи, постоянной времени и эквивалентного запаздывания). Эти номограммы дополнили хорошо известные методики расчета промышленных регуляторов, используемых с типовыми ИД постоянной скорости (В.Я. Ротач, А.М. Lopez, J.À. Miller, P.W. Murriel). Отметим, что аналогичный подход к оптимизации линейных одномерных систем с использованием ПИ- и ПИД-регуляторов типового объекта с применением пакета прикладных программ Process Plus для ПЭВМ фирмы IBM был применен много позже (1988 г.)1.

На основе исследований по разработке структур, схемотехнического обеспечения и методйки расчета MP в течение 1970-1973 г.г. совместно с ГСКБ СКА (г. Ленинград) были выполнены НИОКР по созданию промышленных образцов многоточечных приборов серии КС с функциями регулирования по ПИ-закону в каждом канале и установок многоточечного регулирования в микроэлектронном исполнении. Законченным результатом НИОКР, выполненных коллективом сотрудников кафедры автоматики и телемеханики ЛЭТИ под научным руководством автора, явились вошедшие в номенклатуру комплекса агрегатных средств контроля и регулирования (АСКР-ЭЦ) ГСП2 установки многоканального контроля и регулирования типов А305 (для исполнительных устройств пропорциональрого действия ) и А306 (для ИД

Ч. Gerry J.P. Find out how good that РШ tuning really is // Control Engin. 1988. v:35, № 7. P. 69-71.

2. Kaya A., Scheib T.J. Tuning of РГО controls of different structures // Control Engin. 1988. V. 35, № 7. P. 62-65.

Комплекс агрегатных средств контроля и регулирования АСКР-ЭЦ // Тр. ЦНИИТЭИПриборостроения. Сер. "Tbc. система пром. приборов и средств автоматизации (ГСП)" . М.: 1977. Т. 3, вып. 16. постоянной скорости с широтно-импульсным управлением), серийный выпуск которых в период 1976-78 г.г. осуществлял Харьковский завод контрольно-измерительных приборов. Эти установки служили средством локального регулирования в составе АСУ ТП и соответствовали в то время по своим характеристикам мировому уровню для подобных средств автоматики [15].

В период 1979-1987 г.г. под научным руководством и непосредственном участии автора коллективом сотрудников ОНИЛ СКУ Минприбора при ЛЭТИ был выполнен ряд технических проектов по автоматизации технологических процессов и производственных агрегатов на основе разработанных установок серии А-305 и А-306; в их числе такие НИОКР, как:

- создание и внедрение в эксплуатацию системы автоматизации мартеновской печи на заводе "Большевик" на основе установок А306-14;

- создание и внедрение в эксплуатацию АСУ ТП участка термообработки в металлургическом производстве [15] на базе разработанных в ОНИЛ СКУ многоканальной программно-задающей установки А318-01 (по классификации АСКР-ЭЦ ГСП) на базе микро-ЭВМ "Электроника-НЦ" и модификации установки многоканального контроля и регулирования А306-26;

- исследования совместно с ГОИ имени С.И. Вавилова технологических процессов производства особо чистого оптического стекла и оптических кристаллов, выращиваемых по различным технологиям, и разработке перспективных многоканальных систем и средств автоматизации этих процессов [41];

- исследования в содружестве с НПО "Буревестник" по созданию параметрического ряда средств контроля и управления технологическими процессами на базе микро-ЭВМ, предназначенных для работы в тяжелых эксплуатационных условиях;

- проектирование устройств регулирования повышенной надежности и живучести на базе микропроцессорной техники для системы автоматизации газоперекачивающего агрегата ГТН-25 для компрессорных станций магистральных газопроводов.

Отдельные результаты этих НИОКР отражены в авторских свидетельствах СССР [16-18], опубликованных автором совместно с его учениками и сотрудниками ОНИЛ СКУ. В частности, в [16] предложен оригинальный способ повышения точности и быстродействия регулирования теплового режима стекловаренных печей и установок для литья алюминиевых сплавов под давлением с коррекцией в зависимости от величины объема расплава. В работе [17] предложено устройство регулирования температуры в диапазоне 1000- 1800 °С с повышенной точностью в газопламенных печах в производстве оптического стекла по горшковой технологии. Устройство позволяет повысить точность измерения температуры горения факела по показаниям пирометрического датчика на 5%, что существенно при производстве оптического стекла. Адаптивное устройство для измерения температуры защищено авторским свидетельством [18]. В нем использована настраиваемая электронная модель термопреобразователя, описываемая квадратичной функцией ctQ+ait+aifi, где коэффициенты сч подстраиваются в зависимости от отклонения измеренной термодатчиком температуры от истинного ее значения.

По мере усложнения функциональных задач" автоматизации технологических процессов встала проблема синтеза типовых структур и алгоритмов многоканальных систем и средств. Для решения этой актуальной для приборостроительной промышленности страны проблемы на основе исследований более полутора десятков типовых ТП в нефтегазовой и химической отраслях промышленности, черной и цветной металлургии, в теплоэнергетике, строительной и электронной и других отраслях промышленности, выполненных автором в содружестве с ГСКБ СКА НПО (в составе НПО "Лентеплоприбор"), в работах [12,13] сформулированы типовые модели ситуаций. Модели ситуаций включают в себя совокупность признаков, характеризующих априорные сведения о структуре и уравнениях связей управляемой частей объекта или технологического процесса, внешних условиях, возможности непосредственного измерения технических параметров и т.д.

Опыт, полученный при выполнении этих работ, послужил базой для типизации микропроцессорных многоканальных средств контроля и управления для распределенных (децентрализованных) АСУ ТП [19,20,22,24]. Авторская концепция типизации комплексов технических средств контроля и регулирования (КТО) основана на изучении классов ТП, последовательного использования принципов проблемной, системной и объектной ориентации, принципа вложения, выполнения требований полноты технических решений, унификации технических проектов и эволюции КТС, (работы Л.О. Хвилевицкого, И.М. Борзенко, В.И. Грицкова, К.Я. Давиденко, В.Н. Смирнова) и сформулирована в работах [19,22,24]. В [22,24] разработана методика типизации, включающая в себя рекомендации по составлению исходной системы типизации, выбору критериев типизации и технологию типизации, т.е. реализацию процесса т.н. многоуровневой типизации. На ее основе под научным руководством автора сотрудниками ОНИЛ СКУ была спроектирована и изготовлена многоканальная установка контроля и регулирования на базе промышленной микро-ЭВМ, экспонировавшаяс на ВДНХ СССР (бронзовая медаль, 1975 г.). При непосредственно участии автора с применением разработанной методики по заказу НП "Ленэлектронмаш"! были выполнены исследования по формировани базового состава нового поколения комплекса агрегатных средств контроля регулирования в микроэлектронном исполнении (АСКР-М) ГСП.

Результаты исследований по первому направлению являютс теоретическим обобщением и развитием методов построения и расче аналоговых и микропроцессорных многоканальных средств регулировани типовых многомерных промышленных объектов. На основе анализ большого числа непрерывных и непрерывно-дискретных технологическ: процессов в различных отраслях промышленности,^принципов унификации типизации и агрегатирования разработана концепция типизации унификации технических средств многоканального регулировани общепромышленного назначения, использованная в последующем разработке перспективного агрегатного комплекса средств контроля регулирования в микроэлектронном исполнении (АСКР-М) в составе ГС В целом результаты исследований являются базовыми для построени промышленных систем автоматики с более сложной структурно организацией и алгоритмами управления динамическими многомерным объектами.

Опыт разработок и исследований аналоговых и цифровых многоканальнь систем и средств послужили основой для написания автором (совмести с сотрудниками кафедры) ряда учебных пособий [21-23}, в т.ч. совмести с В.Д. Родионовым и В.Б. Яковлевым первого в СССР учебного пособ для студентов вузов [24] (издательство "Высшая школа") по современны техническим средствам для АСУ ТП.

П. Многомерные инвариантные и адаптивные системы и средства управления

Последующее направление синтеза структур и алгоритмов управлени базируется на использовании идей и методов теорий инвариантности чувствительности и адаптации в автоматических системах. Эт позволило расширить класс регулируемых многомерных объектов д класса объектов с неконтролируемыми сигнальными и параметрическим возмущениями, учтенными в процессе формирования математической модел объекта и внешней среды, Линейные модели с неполной текущей информацие достаточно распространены и до настоящего времени актуальность зада автоматизации с применением таких моделей реальных объектов сохраняете g ' f^ir^i/JV '

В работах автора рассматривались как линейные, так и нелинейные нвариантные МСРиУ, в которых условия инвариантности выполняются ля дискретных моментов времени и на интервалах между квантами ремени. Развитием аналоговых многоканальных регуляторов приборного ипа с типовыми законами на импульсных RC- цепях стали регуляторы с освенным Измерением неконтролируемых возмущений [25]. Сам принцип освенного измерения возмущений и его применение в инвариантных епрерывных системах, рассмотренный в основополагающих работах .Г. Ивахненко, Б.М. Менского, Б.Н. Петрова, В.Ю. Рутковского, .М. Костюка и др. авторов. Вопросы теории линейных инвариантных мпульсных систем, к классу которых относятся и системы с МР, обсуждались трудах В.М. Кунцевича, Ю.В. Крементуло, С.М. Федорова, где достаточно бстоятельно исследовались, в первую очередь, импульсные комбинированные истемы. В работе [25] автором совместно с A.A. Вавиловым и .Б. Яковлевым впервые рассмотрены принципы построения многоканальных нвариантных регуляторов с косвенным измерением возмущений в каждом .нале и сформулированы условия полиинвариантности для дискретных оментов времени на основе анализа дискретных передаточных функций .налов многоканального ПИ-регулятора с введенными в его структуру .налами косвенного измерения возмущений и компенсации эквивалентного озмущения в каждом канале. Показано, что в многоканальных системах типовыми объектами в виде апериодических звеньев с запаздыванием змеренйе эквивалентных возмущений в каналах регулирования может ыть осуществлено за счет разделения во времени процессов регулирования процессов измерения реакции объекта на возмущение, необходимым словием чего служит условие окончания процессов регулирования за онечное время: 7Т + vT < 6Т < Т/2, где Т- период коммутации каналов; , v, 6 - соответственно относительная длительность замыкания каналов, тносительное время запаздывания объекта и относительное запаздывание амыкания коммутаторов в цепях компенсации. Такие МСРиУ относятся классу т.н. многократных импульсных систем с несинхронным и есинфазными периодами коммутации, посколько коммутация в каналах омпенсации осуществляется (в соответствии с приведенным соотношением) о меньшей мере с вдвое бблыней частотой, чем частота коммутации каналов регулирования. В работе [25] показано, что в МСРиУ с временным разделением процессов регулирования и измерения достигается двукратная инвариантность до е регулируемых переменных в дискретные моменты времени кТ, к = 1,2,. без использования моделей объектов в каналах.

Однако это свойство выполняется точно лишь для конкретных моделей возмущений, т.к. алгоритмы компенсации включают модифицированные ¿-преобразования эквивалентных возмущений.

В работе [26] получила развитие методика синтеза структур непрерывных промышленных регуляторов (как прототипов многоканальных импульсных регуляторов), где выполняются условия двукратной инвариантности. Подобная задача была поставлена и решалась Б.Н. Петровым и В.Ю. Рутковским в классе беспоисковых самонастраивающихся систем с моделью объекта. На возможность достижимости свойства двукратной инвариантности в системах регулирования с косвенным измерением возмущений обращал внимание в своих работах А.Г. Ивахненко. Автором показано, что в МР функциональные ДС-цепи могут быть использованы для реализации эталонных моделей в инвариантных МР. Путем такого совмещения могут быть реализованы промышленные МР с ПИ-законами для воспроизведения функций стабилизации и программного регулирования, при этом в каждом канале достигается двукратная инвариантность до е для дискретных моментов времени [27]. На основе анализа решений линейных дифференциальных уравнений с постоянными коэффициентами, вырождающимися в пределе (И.О. Градштейн), в работах [26,28] автором определены ограничения на малые параметры в реальных алгоритмах компенсации и сформулированы условия близости предельного и реального переходных процессов на конечном интервале времени по верхнему заданному значению модуля разности этих процессов. В частности, в [28] получено условие близости для инвариантной до е системы стабилизации инерционного объекта с запаздыванием, где совмещены функциональная положительная обратная связь в ПИ-регуляторе и эталонная модель системы, из которого выбираются допустимые значения параметров ПИ-регулятора и настраиваемый параметр алгоритма компенсации возмущений. Необходимость анализа близости предельных, т.е. при выполнении условий абсолютной инвариантности в каналах СМР, и реальных процессов (при выполнении условий инвариантности до е) обусловлена тем, что в системах с косвенным измерением возмущений при условиях абсолютной инвариантности происходит вырождение дифференциальных уравнений при старших производных. Свойство "идеальных" систем (и не только абсолютно инвариантных) быть негрубыми (по определению А.А.Андронова и Л.С.Понтрягина) дало основание оппонентам инвариантных систем с косвенным измерением возмущений считать их неработоспособными в реальных условиях из-за нарушений условий устойчивости. Однако, как показал анализ свойств рассматриваемого класса инвариантных систем, негрубость динамических систем не приводит к их неработоспособности. Напротив, вырождение дифференциального уравнения (системы уравнений), т.е. редукция фазового пространства, при выполнении условий абсолютной инвариантности, приводит к новому состоянию динамических систем, которое как раз и может быть желаемым с технологической точки зрения. Исследования автора, опубликованные в работах [25-28], легли в основу ряда НИР, выполненных под руководством и при непосредственном участии автора в период с 1972 по 1979 г.г. по заказу НПО "Лентеплоприбор". Целями этих работ стали разработки принципов построения многоканальных установок со свойствами адаптации для систем централизованного контроля и регулирования на базе микропроцессорных средств и промышленных микро-ЭВМ. Некоторые из результатов этих разработок - многоканальные регуляторы со свойствами т.н. "пассивной адаптации" - защищены авторскими свидетельствами СССР [29-31].

В [29,30] предложены структуры многоканальных регуляторов для МСРиУ, обеспечивающих в системе с типовыми объектами в каждом канале выполнение условий двукратной инвариантности независимо регулируемых переменных. В [29] использованы результаты исследований, опубликованных в работе [27], а реализация многоканального регулятора приборного типа осуществлена на основе многоточечного автоматического потенциометра с регулирующим устройством, приведенным в работах автора [1,2]. Структура МР с пассивной адаптацией, обобщающая возможность применения модификаций базовых моделей МР с типовыми законами А305, А306 совместно с реализацией каналов компенсации влияния как сигнальных, так и параметрических возмущений, предложена в работе [30].

В [31] предложен способ повышения точности регулирования многопараметрических технологических в независимых каналах СМР с разделением во времени процессов измерения и регулирования за счет введения каналов компенсации возмущенных движений в соответствии с результатами работы [27].

В работах [32,33], опубликованных совместно с В.Н. Антоновым и др. соавторами, предложен обобщающий подход к проектированию МР общепромышленного назначения и впервые исследованы многоканальные регуляторы для инвариантных автоматических систем с учетом нелинейности исполнительных устройств или регулирующих органов. Известные условия инвариантности (абсолютной или до е) непрерывных нелинейных динамических систем формулируются в виде:

- ограничений типа равенств или неравенств на функции чувствительности (JI.M. Бойчук, A.A. Вавилов, Д.Х. Имаев, E.H. Розенвассер, P.M. Юсупов, W.L. Luqben);

- уравнений дополнительных каналов передачи воздействий (принцип симметрирования) (С.А. Догановский, О.М. Костюк, Б.М. Менский, Б.Н. Петров, Г.М. Уланов, А.В.Фокин);

- условий, накладываемых на правые части нелинейных дифференциально-разностных уравнений, определяемых вариационным подходом к проблеме инвариантности (В.В. Величко, И.П. Лыткин, Л.И. Розоноэр, М.М. Хрусталев).

В математические формулировки условий инвариантности нелинейных систем входят также начальные условия и уровни сигналов. Условия инвариантности линейных импульсных систем гарантируют инвариантность переменных или показателей качества лишь в дискретные моменты времени t = кТ, где к = 0,1,2, Однако очевидно, что для регулирования непрерывных объектов и процессов необходимо сохранение инвариантных свойств и в интервалах между квантами времени. В совокупности все перечисленные факторы мотивировали выполнение исследований, результаты которых опубликованы в [32,33]. Принцип синтеза инвариантных регуляторов, рассмотренный в работах автора [25-31], распространен на квазистационарные нелинейные импульсные системы с широтно-импульсной модуляцией для управленияи исполнительными двигателями постоянной скорости и на системы с амплитудно-импульсной модуляцией и нелинейной непрерывной частью, к классу которых относятся системы с MP типов А306 и А305 соответственно [32]. В этой работе дана оценка эффективности инвариантного управления в многоканальных системах, рассмотренных в [26,29]. Для этого в [32] получены количественные оценки влияния нелинейностей указанного выше типа на инвариантные свойства импульсных систем стабилизации типового линейного объекта с передаточной функцией Wq(s) — к0 ехр(—tos)(Tos + I)-1. Параметр настройки импульсного регулятора - постоянная времени функциональной обратной связи Тос = ß, относительные параметры настройки канала компенсации Ai = ТК/Т0С, тк/Тк, где Тк и тк - соответственно основная и малая постоянные времени реального дифференцирующего звена первого порядка, относительные параметры объекта а\ = Т0/Т0С, ai = т0/Т изменяются неконтролируемым образом. Начальное значение параметра настройки импульсного регулятора ß° вычислено по методике, разработанной в [11], а из условия минимума интегральной обобщенной квадратичной оценки J\ получены начальные значения = /1(01,0:2) при А2 = const, значения прямых показателей качества а и ip = ip/T0C- Для значений А? = /1(0:1, 0:2) = const вычислены функции чувствительности: = ^==/4(01,02)' в области допустимых изменений параметров объекта и ограничений на допустимые значения a, tp и указанных функций чувствительности. Рассчитанные в [32] диаграммы качества характеризуют области , в которых достигаются требуемые характеристики процесса регулирования при начальных расчетных значениях параметров реальных дифференциаторов в каналах компенсации, весьма наглядно демонстрируют эффективность инвариантного регулятора (область в координатах а\, «2 существенно шире, чем для неинвариантных регуляторов) и позволяют обоснованно выбирать параметры настроек компенсирующих каналов, при которых достигнутые показатели качества сохраняются неизменными. Совокупность методик, изложенных в работах автора [11,31], позволяют производить расчет как типовых нелинейных многоканальных ПИ-регуляторов, так u МР, построенных по схеме с косвенным измерением возмущений.

Теоретической основой для решения задачи синтеза структур и алгоритмов инвариантных многомерных динамических систем является аналитическая формулировка условий абсолютной инвариантности, точное выполнение которых позволяет выявить предельные свойства анализируемой структуры. В работе [33] приводится решение такой задачи для класса нелинейных импульсных автоматических систем (НИАС), описываемых уравнениями состояния типа х= Ax(t) + Bu(ji(a, t),t) + Dv(t);

С rx(i); f(/x(a,i)), kT<t<kT + tn] о, kт+tti<t<(k + l)т, где < тц - длительность импульса на выходе импульсного модулятора (ИМ) (в МР функцию ИМ выполняют коммутаторы и распределители каналов); тц — Ьитах - время цикла; - вектор амплитудных характеристик ИМ МР; А, В, Б, С - махрицы коэффициентов; у(£) = /Зу*(£) - вектор внешних возмущений; - вектор нормированного воздействия; а, /3 - параметры СМР и функции возмущения; х(£) - вектор фазовых переменных CMP; ц(а, t) - вектор входных переменных ИМ; Т - период квантования в НИАС (или период обегания коммутаторов и распределителей в MP). Длительность импульса управления tK на каждом цикле подключения определяется модуляционной характеристикой ИМ: iH = к((л(а, t)), где к{ц{а, f)) - дифференцируемая по параметру а функция. Из условий непрерывности решений исходной системы уравнений функции чувствительности НИАС, как показано в [33], имеют следующий вид:

В(t) = H(t) (s+(tk) + Н(—т) [

§ + х(т) +

§u(r) + fgv(r)] dr) для интервалов кТ < t < kT + t, где H(i) = L~l |[sl — (а + B^Cr)]1J;

H*(i) = X-1 [(si — A)-1] - соответствующие переходные матрицы НИАС; s+(tk), s+(iEjt) ~ векторы чувствительности для соответствующих моментов времени переключения ИМ.

На основе приведенных соотношений в работе [33] получены решения уравнений чувствительности для различных типов НИАС, в том числе функции чувствительности к параметру а , периоду квантования Т и возмущениям v(f) для СМР с АИМ в линейной зоне и в зоне насыщения, с ШИМ при < Гц и ie = Гц. Анализ полученных условий инвариантности для НИАС позволил определить разнообразие форм и условий инвариантности в нелинейных импульсных системах, к классу которых относятся рассматриваемые СМР. Показано, что условия инвариантности для СМР с ШИМ при tH < тц и с АИМ в зоне насыщения одинаковые (за исключением условий для некоторых форм инвариантности к периоду квантования) и отличаются от условий инвариантности с АИМ в линейной зоне. Формы и условия инвариантности, приведенные в [33], в принципе позволяют определить классы инвариантных нелинейных импульсных систем и их структуры. При этом, как следует из анализа форм и условий, инвариантность физически достигается за счет двух факторов: во-первых, за счет достижения нулевой чувствительности к параметрам амплитудной характеристики ИМ а, /?, Т\ во-вторых, за счет компенсации сигналами, параметрами или комбинацией изменений фазовых переменных.

По результатам выполненных исследований инвариантных MP с учетом нелинейности исполнительных устройств под руководством автора аспирантом В.Н. Антоновым был разработан и изготовлен опытный образец трехканального регулятора приборного типа и в содружестве с ГСКБ СКА (Ленинград, 1975-76 г.г.) выполнена конструкторская разработка восьмиканального регулятора на средствах АСКР-М общепромышленного применения [37]. Результаты испытаний опытных экземпляров регуляторов одтвердиди правильность структурных решений и эффективность методики асчета параметров настройки МР.

Дальнейшее развитие идей синтеза структуры и алгоритмов регулирования ля МСРиУ с низкой чувствительностью к возмущениям обусловлено асширением диапазона возможных неконтролируемых параметрических сигнальных возмущений. Выполнение условий инвариантности (как бсолютной, так и до е) предполагает сохранение линейности левых астей дифференциальных уравнений при изменениях реальных параметров бъектов. Анализ допустимых изменений параметров, не приводящий необходимости перехода к другой линеаризованной модели объекта, существляется в каждом конкретном случае. Другой подход состоит в ереходе от классических инвариантных систем - систем с пассивной адаптацией - к системам с "активной" адаптацией. Как показали результаты сследования задач автоматизации в различных отраслях производства [12-14], тенденции развития перспективных средств автоматизации в СССР за рубежом явно просматривались в направлении адаптивных средств правления сложными технологическими объектами. Поэтому следующий тап эволюции методов построения многомерных систем управления содержит разработку и исследование промышленных адаптивных многоканальных егуляторов [34-44].

В работе [34] решена задача синтеза дискретной адаптивной системы с позиции теории инвариантности. Для непрерывных нестационарных объектов, описываемых линейными дифференциальными уравнениями с аддитивными неконтролируемыми вариациями коэффициентов правой и левой частей уравнения, решение подобной задачи содержится в работах В.Н. Петрова, С.Д. Землякова, Б.В. Павлова и В.Ю. Рутковского. В работе [34] используется нестационарная линейная модель с детерминированным неконтролируемым изменением параметров разностного уравнения. Из условия абсолютной инвариантности относительно параметрических возмущений получен дискретный вариант т.н. обобщенного настраиваемого объекта (ОНО). При весьма необременительном допущении о разности порядков правой и левой частей исходного разностного уравнения объекта, ОНО физически реализуем и может быть использован взамен исходной модели основного контура адаптивной системы идентификационного типа. Проведенные исследования показали, что такой подход к синтезу адаптивных систем уверенно оправдывает себя для адаптивного управления типовыми линейными объектами от первого порядка до третьего с запаздыванием, кратным периоду квантования и кратностью не выше 2-й.

В работе [35] автором предложена и исследована адаптивная система идентификационного типа с дискретным ОНО. В этой и последующих работах автора совместно с аспирантом А.Э. Янчевским [35,37,39] на базе дискретного ОНО разработаны и исследованы свойства адаптивных систем управления объектов при случайных воздействиях. Эти исследования составили теоретическую базу для разработки структур, алгоритмов м программных средств МР, реализуемых на микропроцессорных средствах.

В работе [37] предложена и обоснована оригинальная структура дискретной адаптивной системы с ОНО, реализующая условия инвариантности многомерного объекта по выходам к параметрическим и непараметрическим неконтролируемым внешним возмущениям в предположении, что определена некоторая расчетная модель поведения реального объекта. В целом такая структура обладает свойством аддитивности, т.е. компенсация независимых возмущений осуществляется раздельно. Анализ условий достижимости целей адаптации приводит к проблеме разрешимости задачи идентификации (оценивания) в замкнутых контурах. Решению этой задачи был посвящен ряд работ отечественных и зарубежных авторов. Так, условия идентифицируемости линейных объектов в непрерывной замкнутой системе с типовыми П-, ПИ- и ПИД-законами получены Ю.В. Паничем и М.А. Трачевским (1973 г.); в работах Б.Г. Ворчика исследовались усяови получения состоятельной последовательности оценок параметров объект в замкнутом контуре при случайных воздействиях. В работах К. Острей и Т. Волина в замкнутой системе с нелинейным регулятором условиям идентифицируемости в узком смысле являются полная наблюдаемость управляемость объекта, а управляющее воздействие удовлетворяет условия полного возбуждения (условия Чезаро).

В работе [39] получены общие структурные условия идентифицируемост в широком смысле (решение задачи - линейное многообразие) дл замкнутых систем с типовой линейной моделью объекта и случайно средой функционирования. Условия сформулированы в виде неравенст соотношений порядков полиномов дискретных передаточных функци объекта и регулятора в основном контуре адаптивной системы и нося необходимый и достаточный характер. Для идентифицируемости в узко смысле (единственное решение задачи) получены достаточные условия.

В работах [37,39] предложены алгоритмы идентификации оцено параметров линейных моделей объектов в случайной среде на основ рекуррентных алгоритмов максимального правдоподобия. Показано, чт для рассматриваемой структуры дискретной адаптивной системы пр определенных условиях функция плотности условного распределения невязки оценивания & интерполяционной моделистемы [39, 90-91] имеет один глобальный экстремум в пространстве параметров, аответствующее ей уравнение максимального правдоподобия для асимптотических выборок имеет один корень. Если принять критерий оценивания в виде к »1, то оценивание параметров модели объекта в структуре дискретной адаптивной системы с ОНО наиболее эффективно осуществляется с помощью алгоритма Гаусса-Ньютона со скользящим усреднением реализаций оценок. В работе [39] приводится ряд акселерантных алгоритмов оценивания параметров модели объекта 9 в реальном времени, "сконструированных" на основе алгоритма стохастической аппроксимации, использовании оценок информационной матрицы Фишера градиента логарифмической функции правдоподобия Уд^к на Анпаге вычислений и выбора шага в зависимости от изменения величины и направления вектора — Л^Ч^Ь^. Подобные алгоритмы сохраняют асимптотическую сходимость и вместе с тем позволяют ускорить процедуру оценивания при относительно малом числе итераций.

Совокупность научных результатов, содержащихся в работах [35,37,39] и принадлежащих лично автору, составляет основу для разработки функционального, алгоритмического и программного обеспечения многоканальных микропроцессорных регуляторов. В 1975-76 г.г. под научным руководством и при непосредственном участии автора по заказу ГСКБ СКА НПО "Леятеплоприбор" выполнены разработки многоканальных установок контроля и регулирования с применением микропроцессоров и микро-ЭВМ, в т.ч. разработка структуры, технического, алгоритмического и программного обеспечения многоканального адаптивного регулятора, которая была защищена авторским свидетельством СССР [36]. Подход автора к синтезу многоканальных и адаптивных инвариантных систем нашел применение в задаче автоматизации технологических процессов производства оптических сред, которая решалась коллективом отраслевой научно-исследовательской лаборатории Минприбора под научным руководством автора при выполнении НИР совместно с ГОИ имени С.И. Вавилова [41].

Выполненные автором за период с 1968 по 1978 г.г. исследования по разработке серии многоканальных регуляторов и установок по заказу предприятий ГСКБ СКА объединения "Лентеплоприбор" и затем "Ленэлектронмаш" Минприбора СССР стали теоретической основой для проектирования перспективного параметрического ряда типовых многоканальных установок контроля и регулирования в составе комплекса АСКР-М ГСП. Состав типовых функций параметрического ряда удовлетворяет составу типовых задач контроля, регулирования и управления в промышленных локальных систем автоматики и предназначен для применения в разработках типовых проектов автоматизации промышленных объектов и их серийного выпуска.

Компьютеризация технических средств систем управления, начавшаяся в 70-е годы прошедшего столетия, развитие таких технологий обработки информации как экспертные системы, теория нечетких множеств, позднее - теория искусственных нейронных сетей, развитие теории адаптивного управления и др. направлений информационных технологий поставили на повестку дня проблему интеллектуализации систем обработки информации и управления и, в частности, управления сложными многомерными многосвязными объектами с плохо формализованными моделями и функционирующими в условиях неконтролируемых изменений свойств объекта и внешней среды. В работе [42] автором выдвинута и обоснована концепция построения необходимого программно-технического комплекса интеллектуальных систем управления, включающего в свой состав функции и алгоритмы управления высокого уровня, такие как контроль и управление с применением математических моделей нелинейных объектов с неполной информацией о структуре операторов и ее параметров, многосвязное регулирование, адаптивное и оптимальное управление, идентификация, диагностика, интерпретация и анализ функционирования автоматической системы. В контексте этих задач и в развитие теории многомерных систем управления автором в период 1994 - 2002 г.г. выполнен ряд исследований по разработке теории нового класса многомерных систем - нейросетевых систем управления динамическими объектами.

Таким образом, результатами теоретических исследований по второму направлению служат методы построения новых классов многоканальных инвариантных и адаптивных регуляторов, методики расчета инвариантных регуляторов с учетом нелинейности характеристик промышленных исполнительных устройств и методики синтеза алгоритмов адаптивного управления с текущей идентификацией, предназначенных для управления типовыми промышленными объектами в условиях неконтролируемых сигнальных и параметрических возмущений при условии сохранения адекватности принятой линейной математической модели реальному объекту.

Наряду с перечисленными научно-техническими работами автор принимал участие в подготовке учебных и методических пособий по рассматриваемому направлению. В частности, автором лично и совместно со своими учениками и коллегами подготовлено и опубликовано 4 учебных пособия по адаптивному управлению в технических системах [38,39,40,43], содержание которых во многом определилось результатами выполненных научно-исследовательских и опытно-конструкторских работ.

III. Нейросетевые системы управления

Главной особенностью исследуемого в работах автора [44-75] класса динамических систем является применение в качестве многоканального регулятора нелинейных динамических многосвязных объектов обучаемых многослойных нейронных сетей (МНС). В сложных динамических системах множества входных и выходных переменных взаимосвязаны и описываются системой нелинейных дифференциальных уравнений. В принципиальном плане при полной априорной и текущей полноте информации о состоянии таких объектов решение типовых задач стабилизации, программного управления и слежения возможно аналитическими методами. Распространенным подходом в этих методах является декомпозиция исходной системы уравнений на множество независимых подсистем с применением в каждой из них одноканального регулятора (М. Уонем (1980 г.), А. Исидори (1995-99 г.г.), Е. Marino & Р. Tomei (1995 г.), И.В. Мирошник (1990-2000 г.г.) и др.). Решение задачи декомпозиции и стабилизации многоканальных систем относительно нетривиального пространственного аттрактора в фазовом пространстве предполагает адекватность исходной модели сложного нелинейного объекта реальному управляемому объекту. В противном случае проявляются следствия т.н. немоделируемой динамики, в результате чего эффективность стабилизирующих алгоритмов управления может быть существенно меньшей, чем это предполагается на стадии расчетов. Другой подход (A.A. Колесников), содержанием которого является метод аналитического конструирования нелинейных агрегированных регуляторов (АКАР), базируется на вариационных методах оптимизации динамических систем. Метод АКАР позволяет достаточно просто решать задачи управления нелинейными объектами высоких порядков с заданным качеством переходных процессов и в этом состоит его главное достоинство, в т.ч. с точки зрения существования проблемы разрешимости задачи синтеза нейросетевой системы управления. Критерий оптимальности в методе АКАР отражает качество системы на макроуровне и в этом смысле он не является полуопределенным в отличие от критерия обобщенной работы в классическом методе аналитического конструирования регуляторов Летова-Калмана.

Однако эти и другие известные подходы к синтезу нелинейных динамических систем управления таковы, что для каждой конкретной нелинейной задачи получается в определенном смысле уникальное решение. Возможная "чувствительность" выбранного метода к неопределенности математической модели объекта потенциально порождает различные структуры регуляторов для одного и того же объекта в зависимости от полноты априорной информации. Подобная информация, как правило, привносится на этапе создания адекватной объекту математической модели. Существующие к настоящему времени схемы устранения неопределенности сводятся к задачам адаптивного и робастного управления. Но нельз не отметить известную незавершенность существующих подходов адаптивном управлении, усугубляемую уровнем принимаемой обычн параметрической неопределенности. Предположение об априорно известности функциональной структуры модели на практике может оказатьс чрезмерно сильным требованием. Этот факт отмечен в работах ряда авторо (В.В. Путов, М. Krstic, I. Kanellakopoulos, P.V. Kokotovic), где рассмотрень методы адаптивного управления в условиях структурно-параметрическо неопределенности модели (метод мажорирующих функций, нелинейно демпфирование). В то же время в постановке задачи адаптивного управлени нелинейными объектами практически отсутствуют какие-либо требования качеству синтезируемой системы. Реальное применение распространенны рекуррентных алгоритмов адаптации ограничено классом динамически объектов с выпукло параметризованной моделью.

Автором предложен принципиально другой подход к синтез многоканальных нелинейных систем управления. В нем "конструирование алгоритмов управления в СМР из плоскости аналитического синтез оптимальных в каком-либо смысле законов с последующей их программно реализацией переносится в плоскость обучения (самообучения) в реально времени многослойной нейросети выбранной архитектуры, в результат чего нейронной сетью формируются управляющие сигналы на входа многомерного объекта. Поэтому одной из центральных проблем синтез функциональной структуры и алгоритмов обучения/управления в НС становится проблема формирования информации, требуемой в алгоритма настройки нейросети.

Известные многочисленные приложения искусственных нейронных сете включают в себя диагностику технологического оборудования, управлен подвижными объектами и технологическими процессами, прогнозирован ситуаций, оценка состояния и мониторинг технологических процессо обработка информации (классификация, распознавание, кластеризация) многое другое. Примеры такого рода приложений нейросетевых систе можно найти трудах российских авторов (А.И. Галушкин, В.А. Головко, А.Н. Горбань, В.В. Ефимов, В.М. Лохин, А.В.Тимофеев и др.) и во множестве зарубежных публикаций (A.J. Calise, М.М. Gupta, S. Haikin, K.J. Hunt, G.W. Irwin, H. Khalil, M.A. Lehr, A.U. Levin, P.L. Lewis, W.T. Miller, K.S. Narendra, D.H. Nguen, T. Parisini, J. Park, D. Psaltis, D.H. Rao, R. Rysdyk, D.E. Rumelhart, A. Sadegh, I.W. Sandberg, J.-J.E. Slotin, J.-A.K. Suykens, R.S. Sutton, K. Warwick, P.J. Werbos, B. Widrow, Ф. Уоссермен e.t.c.).

В работах автора содержание понятия "нейросетевые системы управления" ограничено функцией регулятора нелинейного динамического многосвязного объекта, выполняемого нейронной сетью. Существуют два варианта использования нейросети. В первом - нейросеть обучается и одновременно формирует управляющее воздействие на входе исполнительного устройства системы управления. Цель обучения сети и цель управления объектом совпадают, что отражается в задании единой целевой функции. Сеть обучается в реальном времени, в темпе протекания процессов в системе (режим on-line). Во втором варианте работа сети состоит из двух этапов: предварительного этапа обучения сети заданной оптимальной функции управления и этапа воспроизведения аппроксимации этой функции в режиме управления объектом при тех же условиях или близких к ним. Целевые функционалы обучения сети и управления объектом могут отличаться друг от друга. Такой вариант применения нейронной сети для управления - т.н. супервизорное управление - нашел преимущественное распространение до настоящего времени, хотя процесс синтеза нейросетевого контроллера и настройка его параметров в этом случае протекает не в реальном времени (режим off-line). Выбор конкретного подхода к обучению сети зависит от специфики задачи и, более того, определяет конкретный вид алгоритма обучения сети (беспоисковые/поисковые схемы, глобальная/локальная оптимизация и т.д.).

Основные научные результаты автора в этой части исследований относятся к управлению многосвязными линейными и нелинейными динамическими объектами в реальном времени с применением обучаемых многослойных нейронных сетей прямого распространения с нелинейными функциями активации. В силу архитектуры МНС нейросетевые системы управления по своей сущности являются многоканальными системами, но, в отличие от рассмотренных ранее многоканальных систем, это - многосвязные нелинейные динамические системы. Поэтому в дальнейшем термин "нейросетевые системы управления" по умолчанию означает их принадлежность к многоканальным системам управления.

Работы автора по разработке теории НСУ охватывают следующие направления.

1. Синтез динамических алгоритмов обучения МНС в реальном времени и исследование их свойств [44-55].

2. Синтез функциональных структур нейросетевых систем управления многосвязными объектами [56-66].

3. Синтез алгоритмов адаптивного управления на многообразиях и исследование их свойств [67-72].

В [44] используется структура в виде последовательного соединения обучаемой МНС и объекта управления, известная как схема "инверсного адаптивного управления" (В. Widrow). Такое соединение сети с динамическим объектом в последующих работах автора используется в качестве обобщенного настраиваемого объекта (ОНО) в составе систем управления. В работе вводятся два новых динамических алгоритма обучения МНС: скоростной алгоритм обратного распространения ошибки обучения (далее алгоритм SBP (от сокращ. speed back propagation)) и алгоритм обратного распространения прогноза ошибки (далее алгоритм ВРР (от сокращ. back propagation with prediction)). В вычислительной схеме первого алгоритма применяется градиент от скорости изменения функционала качества обучения в соответствии с дифференциальным уравнением ОНО подобно известному алгоритму скоростного градиента (А.Л. Фрадков). Второй алгоритм, сохраняя технику стандартного алгоритма обратного распространения ошибки (error back propagation, далее алгоритм BP), использует не саму ошибку обучения, а ее прогноз. Оба динамических алгоритма обеспечивают работу нейросети в режиме реального времени и могут быть использованы при синтезе систем управления.

На пленарном докладе 2-го Международного симпозиума по интеллектуальным системам INTELS'96 [45] автором впервые был изложен подход к синтезу НСУ на основе алгоритмов SBP и ВРР с использованием ОНО как базового элемента в трех структурах. В первой из них ОНО выполняет функцию системы воспроизведения с заданной динамикой. Во второй структуре ОНО выполняет функцию адаптивного контроллера для управления нелинейными многосвязными объектами с динамикой, заданной неявной эталонной моделью в структуре ОНО. В третьей структуре реализована самоалгоритмизация при неконтролируемых изменениях топологии фазового пространства системы управления, сформулированы условия устойчивости и ограниченности траекторий движения переменных системы. Эффективность динамических алгоритмов обучения МНС показана на примере управления нелинейным процессом с т.н. странным аттрактором. Эта работа стала одним из первых примеров по управлению динамическими объектами со сложной динамикой с помощью обучаемых в реальном времени МНС.

Важнейшим условием применимости МНС в динамических структурах служит устойчивость процессов преобразования информации в НСУ и обучения сети в режиме on-line [46]. В цикле работ автора совместно с его аспирантом И.Ю. Тюкиным [47-49] для решения проблемы устойчивости обучаемых по динамическим алгоритмам МНС применен метод функций Ляпунова. Алгоритм обучения сети может быть устойчивым или неустойчивым в зависимости от своих параметров - величины шага 7, числа слоев сети К, числа нейронов (базовых процессорных элементов (БПЭ)) в слое щ, класса функций активации f^(s) нейронов в слоях I — 1, К, значений весовых коэффициентов синаптических связей г-го БПЭ wfj в слое i\ j = 0, формы и значений компонент преобразуемого множества на входах сети Определение условий устойчивости процессов преобразования и обучения - настройки весовых коэффициентов w\ j сети в зависимости от перечисленного множества параметров в столь сложной нелинейной структуре, каковой является обучаемая МНС, становится весьма непростой задачей.

Непосредственное применение метода функций Ляпунова к анализу устойчивости процессов в обучаемой нейросети требует особых оговорок. Это обусловлено невыпуклостъю задачи оптимизации в симметричных обучаемых структурах, к числу которых относятся полносвязные многослойные сети прямого распространения. Действительно, при перестановке, например, г-го и j-ro базовых элементов в слое I вместе с весовыми коэффициентами ги^-1' и ш^1' в слое I + 1 (m = 1,щ+\), которые соединяют выходы г-го и j-ro элементов слоя i со входами элементов слоя i + 1, значение критерия обучения Q(w, и*) не изменится (здесь u* = q^ - вектор управления, формируемой на выходе нейросети). Это означает, что единственному значению функционала <3(w, и*) соответствует множество равноправных значений векторов весовых коэффициентов w и, следовательно, множество равноправных состояний равновесия эквивалентной системы (строго это показано в работе [50]). Поэтому в работах [47-49] приняты допущения о том, что начальные условия коэффициентов w выбраны в ограниченной окрестности Qw единственного положения равновесия w*. Кроме того, пусть для любого w £ Ow выполняется условие выпуклости по настраиваемым коэффициентам w: (w* — w) (dQ/dw) < Q(w) — Q(w*). Подобный выбор позволяет снять ограничения на применение метода функций Ляпунова, связанные с неединственостыо решения задачи обучения нейросети, но не снимает проблему определения условий глобальной устойчивости процессов в обучаемых нейросетях и нейросетевых системах. В дальнейшем анализ устойчивости процессов обучения сети проводился в предположения о существовании единственного положения равновесия, в окрестности которого и определены начальные условия w(i<j), q®(fo)

При выполнении этой гипотезы функции Ляпунова предлагается выбирать в классе функций типа

V(t) = Е (t, ; qW,., q<*>; w, q)) + 0,5 ||w* - w||2 ,£= где функции фг = </>i(i, w, q)(i = 1, n) - ограниченные дифференцируемые функции с ограниченными производными по времени, отражающие влияние внешних воздействий на обобщенную ошибку обучения. Функция Е(-) > 0 -знакопостоянная функция своих аргументов, в общем случае отличная от Q(w, и*), ограниченная снизу для значений w = w*, дифференцируемая на всей области определения и ее частные производные дЕ/дфг - конечные. Использование метода функций Ляпунова в принятом классе и допущениях направлено на достижение следующих целей [46]:

- оценка значений параметров алгоритмов обучения сети, гарантирующих устойчивость процессов в обучаемой сети для нестационарной обучающей последовательности;

- обеспечение устойчивости алгоритма обучения при изменениях числа слоев сети, числа нейронов в слоях и оценка влияния начального состояния МНС на устойчивость и качество процессов обучения.

Поставленные цели достигнуты последовательным решением следующих задач. В работе [47] каноническая структура полносвязной МНС приводится к структурам с нелинейными обратными связями и вводится эквивалентная система дифференциальных уравнений в расширенном пространстве состояния обучаемой нейросети. Показано, что при заданных начальных значениях q^0^такая система соответствует аффинной по управлению нелинейной системе с обратными связями. Введенное представление открывает путь для применения методов теории нелинейных динамических систем при исследовании процессов в обучаемых сетях и в задачах синтеза функциональных структзф, алгоритмов и анализа процессов в НСУ, т.е. позволяет распространить методы теории управления на исследования нейросетевых структур в целом. В работе [48] на основе уравнений эквивалентных преобразований и введенных ограничениях условиях в принятом классе функций Ляпунова обосновывается выбор конкретной функции Ляпунова (типа функций Ляпунова-Лурье) и анализируется устойчивость состояния равновесия w = 0 в пространстве координат wf \ qp. Из следуемого достаточного условия устойчивости свободных движений эквивалентной системы в общепринятых локальных ("мгновенных") квадратичных критериях обучения Q = О,5сгтсг, где а - вектор обобщенной ошибки обучения сети [47], становится возможным установить зависимость шага обучения 7 как функцию весов wf1 и указать допустимые границы, изменения 7 (i), дать качественную оценку влияния числа слоев и числа нейронов в слое на выбор 7 и прояснить влияние начального состояния сети на устойчивость процесса обучения. В работе [48] выполнен анализ устойчивости вынужденных решений эквивалентной системы дифференциальных уравнений обучаемой нейросети, из которого следуют ограничения на выбор 7.

В работе [49] методика исследования устойчивости МНС на основе метода функций Ляпунова распространена на исследование условий устойчивости

ОНО с обучением сети по динамическому алгоритму типа алгоритма обратного распространения ошибки сквозь время" (error back propagation through time (BPTT)) и приводятся оценки шага алгоритма настройки сети, обеспечивающие устойчивость процессов обучения МНС для квадратичного N функционала Q = £ сгт(к)а(к) в дискретные моменты времени к • At, к=

At = const, а ошибка обучения определяется как а (к) = у* (к) — у (к), где у*(к), у (к), к = 1,2,. - желаемый и реальный выходы ОНО соответственно. В совокупности результаты работ [46-49] составляют содержание методики исследования устойчивости процессов в обучаемых МНС и могут быть использованы для адаптивного выбора функции 7(i) в зависимости от числа слоев, числа нейронов в слое, начального состояния сети, текущих значений настраиваемых коэффициентов синаптических связей и в неявном виде, на качественном уровне, от вида функций активации, т.е., в конечном итоге, в зависимости от архитектуры сети и ее текущего состояния. Установленные условия устойчивости вынужденных движений при ненулевых производных по времени функций входа сети и функции обучения обосновывают эмпирически установленный факт необходимости периодического обучения сети на конечном числе уроков. В монографии [64] методика распространена на дискретные процессы обучения и на обоснование условий устойчивости для обобщенной интегральной квадратичной оценки качества процессов обучения J = (T2Q2 + <p2(Q)) dt. В работе [50] формулируется подход к решению задачи синтеза алгоритма обучения многослойной нейронной сети типа ВРТТ в составе ОНО по совокупности задаваемых значений у|. ,удг вектора выхода объекта управления, где 1, 2 ,., ЛГ- текущее время. Для алгоритма сформулированы и доказаны условия сходимости всех траекторий ОНО при достижении глобального минимума оценочного функционала С}. Приведенные в [49,50] результаты составляют содержание методики синтеза динамических алгоритмов обучения МНС в составе систем управления нелинейными динамическими объектами. В докладах [51,52] автора в соавторстве с его аспирантами на 1-й и 2-й международных конференциях по нейронным сетям и искусственному интеллекту 1США'99 (Брест) и 1США'01 (Минск) изложены обобщающие результаты выполненных исследований динамических алгоритмов обучения многослойных нейросетей в НСУ, где использована технология обучения по методу ВР.

В работах автора совместно с Д.В. Ефимовым [53,54] решается задача оптимального обучения многослойных нейронных сетей на основе вариационного метода оптимизации и вводятся новые оптимальные алгоритмы обучения многослойных нейронных сетей. Чувствительность алгоритма ВР как специализированного алгоритма градиентного спуска к локальным минимумам функционала обучения вызывают необходимость в конструировании вычислительных схем, лишенного этого недостатка, либо обладающих им в меньшей степени. Отличительная особенность алгоритмов вычислений, сконструированных на основе вариационных методов оптимизации, состоит в изменении знака шага обучения 7 в процессе обучения, т.е. в переключении положительной и отрицательной "обратной связи" в цепи настройки. Включение положительной обратной связи оказывается необходимым для выхода из локального минимума. Для заданных числа слоев, количества нейронов в слое, класса функций активации сети и начальных значениях вектора коэффициентов связей в момент времени £о на интервале [—0.5, 0.5] функциональное пространство обучения (ФПО) сети гц € А, I — 1,и в общем случае определяется множестве значимых переменных = {ш, . , q, . ^(^о-, ., а^), где я = со1{ (7х, ($> ••• ! 91/1) ~ вектор выходов всех слоев сети. Следуемый из условия минимума 7(у) = у, у(1),у^) (И]{у), где Р{-) непрерывная и дифференцируемая по всем своим аргументам функция, алгоритм обучения сети обеспечивает переход по кратчайшему расстоянию из одной точки ФПО при t = tQ в другую при £ = ^, ^ € [ £о, оо) и назван оптимальным алгоритмом обучения в пространстве переменных уД1), . Оптимальный алгоритм обучения обладает универсальностью в том смысле, что дает возможность составления субоптимальных алгоритмов обучения в зависимости от числа удерживаемых аргументов в подынтегральной функции т.е. от значения числа производных з €Е 0, п. В работе [54] исследован ряд субоптимальных алгоритмов, их сравнительные свойства и определены условия достижимости цели обучения для субоптимальных алгоритмов, в т.ч. правила выбора оптимальных коэффициентов 7 для соответствующих функционалов. Для субоптимальных алгоритмов не требуется вычисление матрицы производных да/д'«V, как в рассмотренных ранее алгоритмах ВР, БВР, ВРР, ВРТТ. В субоптимальных алгоритмах взамен да/длк используется постоянная матрица А, значение которой вычисляется до начала процесса обучения и целиком определяется параметрами только функционала обучения.

В работе [55] введена и исследована модификация динамического алгоритма ЭВР. Модифицированный алгоритм определен для нелинейного аффинного по управлению объекта в составе ОНО, желаемая динамика которого задается векторным линейным дифференциальным уравнением, а МНС обучается по локальному квадратичному критерию. Модифицированный алгоритм БВР определяется на условиях применимости алгоритма скоростного градиента в конечной форме (А.Л. Фрадков), а якобиевые матрицы д ч^/д в алгоритме вычисляются в соответствии с технологией метода обратного распространения ошибки. В отличие от исходного алгоритма БВР в его модификации алгоритма вместо параметризованной модели объекта используется ее вектор состояния, что позволяет снизить требования к объему требуемой информации для вычислений по алгоритму БВР, т. к. вектор состояния достаточно просто измеряется с помощью "модели прямого обучения" многослойной нейросети.

В совместных работах автора и его учеников [56-62,64] разработана двухэтапная процедура синтеза структуры НСУ. На первом этапе используются типовые функциональные структуры: 1) схемы многослойной сети с обучением по стандартному алгоритму ВР; 2) схемы инверсного обучения нейронной сети разомкнутого и замкнутого по выходам типа и 3) схемы прямого обучения. Известные в теории управления структурные схемы систем управления могут быть построены на базе перечисленных структур. Результатом синтеза на этом этапе являются базовые функциональные структуры НСУ [56,57,61-64]. Вторая составляющая процедуры синтеза состоит в формировании полной функциональной структуры, что становится возможным в результате синтеза алгоритмов обучения МНС, когда базовая функциональная структура НСУ дополняется каналами формирования дополнительной информации, в т.ч. информации, используемой в аргументе функционала обучения [58-60,62,63,65,66].

Пример формирования полной функциональной структуры НСУ рассмотрен [57] в типовой схеме инверсного обучения сети, в которой дополнительно предлагается изменение алгоритма настройки весовых коэффициентов подобно тому, как это осуществляется в системах с переменной структурой. Для этого в состав логического устройства включаются блоки анализа текущего состояния системы. В совместной работе автора, И.Ю. Тюкина и Д.В. Ефимова [59] приводятся результаты конструирования обобщенных ошибок обучения и соответствующих функциональных структур НСУ на основе схемы ОНО разомкнутого типа, с обучением нейросети по рассмотренным выше динамическим алгоритмам ЭВР и ВРР. Для полной функциональной схемы НСУ вводится функция Ляпунова, учитывающая процесс настройки весовых коэффициентов. Из ее анализа получены условия, гарантирующие асимптотическую устойчивость по Ляпунову процессов в НСУ. В этой работе автором впервые была выдвинут подход к синтезу НСУ на базе концепции теории синергетического управления и обучения МНС с использованием динамических алгоритмов обучения.

В работах [60-66] синергетический подход к синтезу НСУ получил дальнейшее развитие. Показано, что в алгоритмах обучения МНС целесообразно использовать обобщенные ошибки, формируемые в виде функций агрегированных макропеременных й = 1,2,., т < п, содержащих макроинформацию о состоянии системы (п - размерность полного фазового пространства нелинейной многосвязной динамической системы). Такие макропеременные должны удовлетворять ряду формальных требований. В содержательном смысле макропеременным соответствуют притягивающие многообразия или аттракторы = 0, на которых система управления удовлетворяет желаемым техническим требованиям. Если обобщенная ошибка обучения сети в системе управления а = <х(Ф5) и функционал обучения МНС <2 (с(Фв)) определены так, что С} (<т(Ф6.)) = 0 а=0"й>Ф„ = 0и этому соответствует желаемое состояние динамической системы, то функция оптимального управления, если она существует, может быть сформирована нелинейной, в частности, сигмоидной МНС в процессе ее обучения по обобщенной ошибке а — сг(Ф.5). и, таким образом, МНС выполняет функцию регулятора состояния многосвязного нелинейного объекта.

Метод АКАР взят автором в качестве прототипа при решении задач синтеза НСУ. Синтез алгоритмов обучения МНС включает выбор тех же макропеременных для вычисления обобщенных ошибок обучения, что и в методе АКАР. Это необходимо для того, чтобы нейронная сеть в процессе настройки своих весовых коэффициентов'формировала функцию управления, приближающую оптимальную функцию управления, рассчитанную методом АКАР, где используются те же макропеременные в качестве аргументов сопровождающих функционалов. Преимущество нейросетевого управления в этом случае состоит в том, что при настройке сети в реальном времени не требуется аналитическое задание конкретного оптимального закона. Достаточно знать, что такой закон существует при тех же исходных данных об объекте, начальных условиях, целевых условиях и выбираемых макропеременных. Задача аналитического синтеза систем с последующей компьтерной реализацией в задаче синтеза НСУ заменяется на задачу обучения сети выбранной архитектуры с использованием макропеременных или функций макропеременных в качестве обобщенных ошибок обучения. Решение комплекса сопровождающих задач, следуемых из сформулированного подхода содержится в работах автора [60-73].

В [60,61] формируются этапы синергетического синтеза НСУ с использованием базовых функциональных структур НСУ. В [60] базовой структурой выбрана схема ОНО с обратной связью по выходу. Для ОНО "внешнее" управление есть обобщенная ошибка обучения сг(Фя). На первом этапе составляется расширенная система нелинейных дифференциальных уравнений, включающая в себя эквивалентные уравнения обучаемой нейросети и уравнения связи. Расширенная система является аффинной по внешнему управлению а = На втором этапе выбираются макропеременные Показано, что выбор макропеременных для расширенной системы сводится к выбору их для объекта с заданной математической моделью. Отсюда следует, что макропеременные должны быть согласованы с уравнениями принятой модели и удовлетворять физическим процессам в реальном объекте. На третьем этапе осуществляется синтез "внешних управлений" а. Для этого, согласно методу АКАР, задается оптимизирующий сопровождающий функционал и отыскивается функциональное уравнение устойчивого подсемейства экстремалей сопровождающего функционала. Так как обучаемая нейронная сеть "решает" векторное уравнение ст( •) = 0, то в качестве обобщенной ошибки обучения естественно принять левую часть функционального уравнения семейства устойчивых экстремалей для сопровождающего функционала. Тем самым процессы обучения многослойной нейросети, решения уравнений устойчивых экстремалей и управления многомерным многосвязным объектом совмещаются в единый динамический процесс, а исходно статическая МНС с обучением по алгоритму BP приобретает свойства динамической сети. В целом результаты работ [59-62] составляют содержание метода конструирования алгоритмов и структур нейросетевых динамических систем управления. В книгах [63-65], написанных автором совместно со своими учениками, впервые дано систематическое изложение основ теории нейросетевых систем управления, как нового класса нелинейных многоканальных систем управления. В обзорном докладе автора совместно с И.Ю. Тюкиным [66] рассмотрены вопросы теории структурного синтеза нейросетевых систем, существующие проблемы и результаты. Исследованиям адаптивных свойств НСУ при неполной информации о динамических свойствах объекта посвящены работы автора [67,68]. В докладе [67] на 6-м Международном симпозиуме по теории адаптивных систем SPAS'99 предложен подход к синтезу алгоритмов адаптивного управления многосвязными нелинейными объектами в пространстве состояния, определенными с точностью до эталонной модели. Адаптивное управление на многообразиях (АУМ) - так назван этот подход - определяется как процесс целенаправленной самоорганизации на синтезируемых диссипативных структурах в расширенном фазовом пространстве системы. Важным элементом синтеза является выбор желаемых агрегированных макропеременных, согласованных с исходной системой уравнений нелинейного многосвязного объекта.

Класс математических моделей объектов управления описывается' системой дифференциальных уравнений весьма общего вида: x = f(x,0,u), хо = х(0) efix, где f : Rn х RTO —* Rn, f € С1; x € Rn- вектор состояния; в £ Пв С Rd-вектор неизвестных параметров. Целью управления является отыскание такой управляющей функции u(x, w) G Rm и такого закона А(~х., w) изменения параметров w € Rd регулятора основного контура, что в системе уравнений обобщенного настраиваемого объекта x = f(x, 0,u); u = u(x,w); щ = -7 Л»(х, w), 7 > 0,хо € w0 £ Длг, i = 1, d для каждой выбранной макропеременной Ф5(х) выполняются равенства gs(4>s,4>s, .,ф1п)) — 0, что равносильно достижению целевого условия /гшМооФв(х(4)) = 0.

Критерий настройки регулятора выбирается в классе функционалов

•) = <Э(з(ф.5П), Ф*,£))> где Q ( •)- дифференцируемая функция и

Q (•) = 0 только на экстремалях gs (Ф3, Ф3, ., Ф^) = 0 оптимизирующего сопровождающего функционала Js = J^ Fs(ys(x(t)),4?a(?c(t)), ., ф£*\х(г)))<Й, где к-я производная по времени функции Ф3(х). Предполагается, что операторы Ai(-) удовлетворяют неравенству Ai{-) dQ (-)/dwi > 0. Тогда алгоритмы адаптации ОНО могут быть записаны в общей форме:

Л дР Т ^(Ф^'.-.Ф^.Ф.^ЭФ^ ^ о

Wl- 7А1 А%- ^ ^

В работе [67] ' исследованы и проанализированы условия применимости алгоритмов этого класса. Практически важный случай представляют собой алгоритмы адаптации, синтезированные для квадратичного сопровождающего функционала (алгоритмы КСФ)

J = Т Т* Ф2(х(*)) + Ч>\ («Ьс(«))) dt> <Р- Rn R. € С1, ip (Фв)Ф8 > 0 ¿ при Фв ф 0; Ts > 0. Алгоритмы КСФ при квадратичном критерии настройки регулятора в ОНО Q (•) в общем случае записываются в виде: щ - -7 (ГА + ЫФз)) dlix) ditCr\

В работе дается анализ условия применимости алгоритмов КСФ и получены достаточные условия достижения цели управления /гШ4>00Фв(х(4)) = 0 (лемма, теоремы 1,2 соответственно в [67]). К числу основных и требующих отдельной проверки условий следует отнести условие выпуклости в форме неравенства dQ/8g^^(w* - w) < dQ/dg(Va{w*,0,x) - #e(w, 0,x)) и условие достижимости Фв(уг*,0,х) = —<р3(Ф3)Т~1.

Введенные алгоритмы служат исходной базой для синтеза целого ряда практических алгоритмов, а их реализация наиболее целесообразна в нейросетевых системах управления. В докладе [68], сделанном совместно с И.Ю. Тюкиным и Д.В. Прохоровым и опубликованном в трудах 39-й конференции IEEE CDC'2000 (Sydney, Australia) представлены результаты исследования и компьтерного моделирования, проведенного в содружестве с исследовательской лабораторией Ford Research Laboratory (Ford Motor Company, Dearborn, USA.), где для реализации алгоритмов КСФ в задаче АУМ использованы RBF-сети в качестве адаптивного контроллера для управления состоянием нелинейных объектов.

В работе [69] рассмотрены вопросы адаптивного управления на многообразиях нелинейными объектами со сложной и колебательной динамикой. В частности, алгоритм КСФ применен для адаптивного управления скоростью вращения коленчатого вала двигателя внутреннего сгорания в условиях периодически изменяющегося момента возмущающих сил с неизвестными параметрами примерной функции изменения (И.В. Бурков, А.Т. Заремба).

Важной составляющей синтеза алгоритма обучения МНС и, как следствие, синтеза полной функциональной структуры НСУ, является выбор агрегированных макропеременных Ф(х), х = col(xi, х?, . , хп) в расширенном п-мерном фазовом пространстве многосвязной нелинейной системы. Очевидно, что выбор Ф(х) подчинен физическим свойствам нелинейного объекта (если исходить из концепции синергетического управления), что a priori должно быть задано математической моделью. С такой точки зрения просматриваются возможные подходы к регулярным процедурам синтеза макропеременных, используемых далее в качестве аргументов в критериях настройки нейросети. В совместном докладе автора и его учеников на 5-м симпозиуме ИФАК NOLCOS'Ol [70] представлено решение задачи синтеза макропеременных на основе рекуррентного их построения. На каждом шаге вычисления макропеременная зависит от производной предыдущей макропеременной по времени, взятой в силу исходной системы дифференциальных уравнений объекта. Такое рекуррентное преобразование, как это показано в [70], приводит к тому, что на некотором шаге к < п синтезируется макропеременная, производная которой по времени явным образом зависит от вектора управления и. Тогда, конечная макропеременная, построенная в силу заданных уравнений объекта, может быть использована для расчета оптимального закона по методу АКАР и, следовательно, использована в алгоритме обучения МНС в составе НСУ. Другая регулярная процедура конструирования макропеременных Ф(х), гарантирующих "энергосберегающие" свойства синтезируемым управлениям для аффинных по управлению нелинейных многосвязных объектов, разработана в совместной работе автора и аспиранта Д.В. Ефимова [71].

В работе [72], выполненной совместно с И.Ю. Тюкиным и Д.В. Прохоровым, метод АУМ распространен на так называемые невыпуклые задачи управления, где термином "невыпуклые" определяется класс задач управления, гд нарушается условие выпуклости (или вогнутости) функций f(x, в, u(x, w)). Если функция f( • ) невыпукла по параметру w, то известные алгоритмь градиентного спуска неприменимы, так как не представляется возможны сказать что-либо определенное об устойчивости результирующей системы В [72] показано, что достижение цели управления объектами с невыпукло по параметрам управления правой частью уравнений состояния може быть реализовано за счет алгоритмов адаптации, в которых использован дополнительная информация в виде вспомогательных нелинейных функций, удовлетворяющих сформулированным в работе условиям- Для введенных алгоритмов адаптации доказаны теоремы достижимости цели управления. Сопутствующим результатом является ослабление условия выпуклости для алгоритмов адаптации до уровня проверки условий выпуклости лишь нелинейных по параметрам настройки функций правых частей уравнений объекта, что упрощает анализ и расширяет границы применимости рассматриваемых методов адаптивного управления. Для аффинного по управлению нелинейного многосвязного объекта, заданного векторным уравнением по ошибке (A.M. Annaswamy и др.), дополненного в замкнутой системе уравнениями адаптивного регулятора w = A(x,w), где функция /(х, в) - невыпуклая по параметру в, а в € a priori неизвестна, в доказано существование оператора Л(х, w), такого, что все траектории замкнутой системы ограничены. Более того, доказано, что задача синтеза адаптивного регулятора для объектов с невыпукло параметризованной моделью может быть переформулирована в задачу отыскания решения функционального неравенства на множестве функций tp(ip) и A(x,w). Эта задача, в свою очередь, сводится к решению задачи минимизации функционала по настраиваемым параметрам в £ Qg, w 6 Qw для всех х € Ох- Решение же этой задачи, как следует из теоремы об е - аппроксимации (G. Cybenko), осуществляется в процессе обучения многослойной рекуррентной нейросети. Этот вывод имеет весьма важное значение для синтеза НСУ реальными многосвязными нелинейными объектами, для которых не выполняются известные условия выпуклости, необходимые для использования обычных рекуррентных алгоритмов настройки параметров регулятора в основном контуре.

В опубликованных работах третьего направления выдвинут и обоснован новый подход к синтезу структур и алгоритмов многомерных систем управления классом многосвязных нелинейных динамических объектов, отличающийся от ранее известных применением в качестве регуляторов обучаемых в реальном времени нелинейных многослойных нейронных сетей прямого распространения, что позволяет проектировать системы автоматизации промышленными. объектами, описываемыми почти любым ф ~ /(х, w)-/(x, в)—<р(■ф)-, я.* , . \ —1 /А.Л классом линейных и нелинейных математических моделей со структурно-параметрической неопределенностью.

При участии автора были подготовлены и опубликованы учебные и методические пособия по использованию нейросетей в задачах управления техническими объектами [63,73], в их числе первое в России учебное пособие по нейросетевым системам управления для студентов вузов [73], обучающихся по направлению "Автоматизация и управление" и по специальности "Управление и информатика в технических системах".

Похожие работы

Информатика, вычислительная техника и управление
05.13.00