автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Применение нечеткой логики в системах автономного адаптивного управления
Автореферат диссертации по теме "Применение нечеткой логики в системах автономного адаптивного управления"
ИНСТИТУТ СИСТЕМНОГО ПРОГРАММИРОВАНИЯ РОССИЙСКОЙ АКАДЕМИИ НАУК
На правах рукописи
Караваев Максим Владимирович
ПРИМЕНЕНИЕ НЕЧЕТКОЙ ЛОГИКИ В СИСТЕМАХ АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ
Специальность 05.13.11 — математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва
2006
Работа выполнена:
в Институте Системного Программирования РАН.
Научный руководитель: доктор физико-математических наук
Жданов Александр Аркадьевич
Официальные оппоненты: доктор технических наук,
Ющенко Аркадий Семенович
доктор физико-математических наук, Рязанов Владимир Васильевич
Ведущая организация: Факультет Вычислительной математики
и кибернетики
Московского Государственного Университета им. М.В. Ломоносова
Защита диссертации состоится « 8 » сентября 2006 г. в 15°° часов на заседании диссертационного совета Д.002.087.01 при Институте Системного Программирования РАН по адресу:
109004, Москва, Б. Коммунистическая 25, Институт Системного Программирования РАН, конференц-зал.
С диссертацией можно ознакомиться в библиотеке Института Системного Программирования РАН.
Автореферат разослан «» && 2006 г.
Ученый секретарь специализированного совета
/Прохоров С.П./
Общая характеристика работы
Актуальность темы
Постоянно растущая сложность и разнообразие задач, решение которых возлагается на автоматические системы, в последнее время определяют повышенную потребность в системах управления с возможно более универсальными свойствами. Однако, ни один из существующих на текущий момент подходов к построению систем управления - ни теория автоматического управления (ТАУ), ни нечеткие системы, ни искусственные нейронные сети, ни другие технологии, не обладают необходимой универсальностью. С другой стороны, имеет место уверенность в возможности построения систем с искомыми свойствами, которая основана на наблюдении действия таких систем в природе -нервные системы живых организмов.
Возможно, что претендовать на более широкий охват типов решаемых задач могут методы, основанные на концептуальных подходах, моделирующих функциональность и структуру нервных систем живых организмов, поскольку в таких методах объект управления описывается совокупностью формализованных знаний, заранее заданных, либо эмпирически приобретенных системой, и менее привязанных к той или иной функциональной зависимости от параметров объекта управления, чем это имеет место в моделях, выраженных в аналитической форме уравнений. К таким концептуальным подходам относится и метод автономного адаптивного управления (ААУ), развиваемый в Отделе имитационных систем Института Системного Программирования РАН.
Метод ААУ определяет общие принципы и некоторые частные реализации систем управления объектами, для которых отсутствует математическая модель и его логико-лингвистическое описание, а известны только общие критерии качества управления (целевая функция).
Однако все первые системы ААУ строились на основе дискретных устройств, что ограничивало область их применения, в особенности, при работе таких систем управления в «реальном» непрерывном мире. Для обеспечения достаточно гладких зависимостей между входными и выходными переменными необходимо было разбивать входное и выходное признаковые пространства на достаточно большое количество диапазонов, и на каждом из них проводить пробные управляющие воздействия для нахождения закономерных реакций. Это приводило к экспоненциальному росту объема базы знаний и времени обучения
системы при линейном увеличении критериев качества управления или количества входных переменных системы.
Несмотря на то, что были разработаны специальные алгоритмы, позволяющие значительно ускорить обучение системы, основываясь на различных эвристиках, в целом эффективность систем ААУ оставалась реализованной далеко не полностью.
Применение нечеткой логики, основанное на теореме FAT (Fuzzy Approximation Theorem), доказанной Б. Коско (В. Kosko), и гласящей, что любая математическая система может быть аппроксимирована системой на основе нечеткой логики, значительно повышает эффективность систем ААУ.
Актуальность данной работы заключается, с одной стороны, в необходимости наделения систем ААУ непрерывными свойствами, за счет использования теории нечетких множеств, с целью улучшения их характеристик и расширения области применения. С другой стороны, в работе предлагаются возможности расширения области применения традиционных нечетких контроллеров (систем управления, работающих по закону, заданному набором нечетких продукционных правил) за счет применения в них методов обучения и адаптации, используемых в системах ААУ. Разработанные в работе методы могут использоваться для построения широкого класса прикладных систем управления.
Цель работы
Цель диссертационной работы состояла в том, чтобы найти подходы и разработать методы построения управляющих систем ААУ на основе теории нечетких множеств. Такие методы позволят преодолеть ограничения систем ААУ, связанные с обязательным требованием четкой дискретизации информационных объектов.
Для достижения указанной цели необходимо было решить следующие задачи:
1. Разработать метод автоматического определения входных и выходных нечетких множеств, заданных при помощи функций принадлежности.
2. Разработать метод автоматической генерации правил управления, описывающих функциональную взаимосвязь между входом и выходом.
3. Разработать метод автоматической адаптации набора правил базы знаний (БЗ) к изменяющимся свойствам объекта управления (ОУ) и среды.
4. Разработать метод оценивания образов и принятия решений.
5. Осуществить проверку работоспособности и эффективности разработанных методов на примерах прикладных систем.
Научная новизна
Научная новизна работы заключается в том, что в данной работе впервые была предпринята попытка построения способной к самообучению автономной адаптивной системы управления на основе нечеткой логики. А именно:
• введено описание системы ААУ в терминах теории нечетких множеств. Разработана кодировка входных и выходных нечетких множеств и нечетких правил управления специального вида;
• предложен метод генерации нечетких правил управления, а также входных и выходных функций принадлежности на основе модифицированного метода кластеризации методом вычетов;
• предложен метод адаптации набора правил в базе знаний к изменяющимся свойствам объекта управления и среды посредством введения для каждого правила специальной величины, названной «степенью адекватности», и способов вычисления ее значения;
• предложен метод принятия решений, учитывающий степени адекватности правил управления в базе знаний и оценки результирующих образов правил;
• на примере модели прикладной системы управления показаны преимущества разработанного подхода в скорости обучения перед системами управления, построенными на основе парадигмы обучения с подкреплением, в традиционной тестовой задаче балансирования перевернутым маятником.1
Практическая ценность
Практическая ценность работы состоит в том, что разработанные методы могут быть применены для построения прикладных самообучающихся управляющих систем для широкого класса объектов управления.
1 Задача состоит в том, чтобы при помощи перемещений тележки удерживать физический маятник, на который действует сила притяжения, в вертикальном положении. Маятник нижним концом прикреплен к тележке при помощи шарнира, а тележка может с помощью привода перемещаться вдоль прямой, лежащей на горизонтальной плоскости.
Возможность построения прикладных систем управления различными объектами и их преимущества показаны на примерах системы балансирования перевернутым маятником, системы стабилизации углового движения космического аппарата и системы управления моделью мобильного робота Pioneer P3-DX.
Апробация работы и публикации
По материалам диссертации опубликовано 10 работ [1-10].
Основные положения работы докладывались на следующих конференциях и семинарах:
• всероссийской научно-технической конференции Нейроинформатика-2004, 2005 МИФИ,
• семинаре «Экобионика» МГТУ им. Н.Э. Баумана,
• XXIX Академических чтениях по космонавтике, 2005 год,
• всероссийской научно-техническая конференции "Наука — производство -технологии - экология» ВятГУ (г. Киров).
Структура и объем диссертации
Работа состоит из введения, четырех глав, заключения и списка литературы. Общий объем диссертации составляет 106 страниц. Список литературы содержит 49 наименований.
Краткое содержание работы
В 1-й главе представлен обзор известных методов и проблем построения адаптивных систем управления.
Во 2-й главе приводится обобщенная формализация системы ААУ с применением теории нечетких множеств, а также описываются разработанные в диссертации методы синтеза таких нечетких систем ААУ и их адаптации к изменениям свойств объекта управления и среды.
В 3-ей главе приводится описание разработанной в ходе диссертационной работы модели прикладной системы управления.
В 4-ой главе представлены результаты нескольких серий экспериментов, в ходе которых производилось сравнение разработанной модели прикладной системы с аналогичными системами, а также уточнялись параметры разработанной системы управления, оптимальные для различных объектов управления и целевых функций.
В 1-ой главе представлен анализ основных технологий построения систем управления с точки зрения возможности организации самообучения и адаптации: теории автоматического управления, дискретных автоматов, нечетких систем управления (нечетких контроллеров), систем управления, построенных на основе искусственный нейронных сетей (нейроконтроллеров), и концептуальных моделей нервных систем.
Сделаны выводы, что системы ТАУ (построенные в соответствии с теорией автоматического управления), нечеткие и нейрокотроллеры обладают особенностями, которые затрудняют построение на их основе адаптивных самообучающихся систем управления. Для первых двух технологий это ограничение связано с тем, что они основываются соответственно на математической модели и логико-лингвистическом описании объекта управления, которые не всегда доступны и часто не поддаются изменениям в реальном времени. Как следствие - не существует хорошо разработанных методов наделения систем ТАУ и нечетких контроллеров свойствами адаптивности и самообучаемости. Такие методы отсутствуют и для нейроконтроллеров, которым свойственна проблема катастрофического забывания, вследствие чего нейросети теряют старые «навыки» в процессе получения новых. Помимо этого, для первоначального обучения нейросети необходимо иметь обучающую выборку, которая не всегда доступна.
Для дискретных автоматов существует большее количество алгоритмов их самообучения и адаптации, к тому же автоматы обладают активным поведением, в противовес реактивному поведению (при котором система лишь отвечает на входные воздействия), свойственному системам управления, построенным в соответствии с предыдущими методами. Однако при использовании автоматов для взаимодействия с реальным миром часто возникают сложности из-за несоответствия дискретной природы автоматов и непрерывной природы реального мира.
Среди известных концептуальных подходов к моделированию нервных систем до уровня решения прикладных задач доведены только исследования
французской лаборатории AnimatLab под руководством Ж. А. Мейера (J. А. Meyer), основывающиеся на парадигме обучения с подкреплением, и, в большей степени, - метод ААУ, развиваемый в отделе Имитационных систем ИСП РАН под руководством A.A. Жданова.
Однако все существующие методы построения прикладных систем по методу ААУ используют конечные автоматы и обладают всеми особенностями, присущими этим дискретным устройствам. Из этого вытекают и такие недостатки, как, например, экспоненциальный рост времени обучения и объема БЗ при увеличении количества входных переменных или необходимой точности управления. Такой экспоненциальный рост обусловлен равномерным разбиением множеств значений входных и выходных переменных системы на диапазоны и привязкой к каждому их сочетанию минимум одного элемента системы.
Устранение этих ограничений за счет применения нечеткой логики и является главной целью данной работы.
Во 2-й главе содержится обобщенная формализация системы ААУ с применением теории нечетких множеств, а также описываются разработанные в диссертации методы синтеза таких нечетких систем ААУ и их адаптации к изменениям свойств объекта управления и среды.
Краткое описание обобщенной системы автономного адаптивного управления в базисе теории нечетких множеств
Пусть в среде, близкой к стационарной, находится объект управления (ОУ) со встроенной управляющей системой (УС), состоящей из блока датчиков, блока формирования и распознавания образов (ФРО), БЗ, аппарата эмоций, блока принятия решений и исполняющих механизмов. Пусть УС является системой замкнутого цикла, в которой каждый блок периодически получает входные значения и формирует выходные значения, а моменты генерации выходных значений отстоят друг от друга на равные интервалы времени. Согласно базовым положениям метода ААУ, УС имеет две целевые функции: обеспечение выживания ОУ и накопление знаний о закономерностях его функционирования в среде.
Для наблюдения за параметрами ОУ и среды УС имеет N входных переменных, связанных с датчиками, а для воздействия на среду и объект - М выходных переменных, связанных с исполнителями. Датчики отображают значения некоторых параметров среды и ОУ в множества значений входных
переменных х¡, х2, ...хм. Множества значений выходных переменных обозначим у[, У2.-УМ- В общем случае все эти множества бесконечны, но обязательно имеют верхнюю и нижнюю границы. Тогда входные и выходные множества УС будут равны соответственно декартовым произведениям:
Х = х1>сх2х...ххц и У = у,ху2х...хум. (1)
В УС априорно заложено множество 5 оценок состояний ОУ, которое дискретно, полностью упорядочено и состоит из конечного числа элементов, т.е. 5 = {$1, в^—^р}, отношение порядка на нем: а также определенная на
подмножестве X" множества X функция Е(х), ставящая каждому элементу А" в соответствие один элемент множества Б (здесь использование подмножества Л" основано на том, что не все датчики измеряют параметры среды и ОУ, непосредственно влияющие на выживание ОУ). Таким способом задается первая целевая функция управления (обеспечение выживания ОУ в среде).
Для соблюдения одного из условий построения систем по методологии ААУ - условия дискретности, которое говорит о конечном количестве элементов в структуре УС (в том числе и элементов памяти) невозможно использовать элементы в общем случае бесконечных множеств X и У непосредственно для управления. Для соблюдения этого условия покроем множества X а У конечным количеством нечетких (возможно пересекающихся) подмножеств: О;, 02, ...О1 и А}, А2, ■■■Ак, которые назовем «образами» и «действиями» соответственно.
Для каждого нечеткого множества Оу, 02, ... 01_иА1, Аз, ... А/с зададим набор функций ц<,°(х,)... м№(хц) и Ц1Л(у!)... Цм(Ум), где » - номер входного образа, г=[1,Ь], а ] - выходного ]=[1,К], определяющих степени принадлежности им каждого элемента из множествен У соответственно. Пусть множеством значений всех функции принадлежности в системе являются действительные числа из диапазона [0;1]. При таком покрытии входного и выходного множеств нечеткими подмножества и заключается одно из ключевых отличий предлагаемого подхода от базовой методологии ААУ, в которой образы и действия носят исключительно дискретный характер.
Каждой входной и выходной переменной х}, х2,...хц и у/, уь-.ум можно поставить в соответствие лингвистическую переменную, которая будет принимать в качестве своих значений нечеткие множества, которыми покрывается диапазон значений соответствующей входной или выходной переменной.
Задачи и методы синтеза и адаптации нечетких систем ААУ
Для обеспечения выживания ОУ в среде и накопления знаний о ней, методология ААУ предписывает УС решать следующие задачи:
1. Нахождение закономерностей в информации, поступающей во входные переменные, сохранение их в виде образов и распознавание этих образов при появлении их признаков на входах, т.е. решение задач автоматической кластеризации, распознавания образов.
Для решения этих задач в структуре УС существует блок ФРО, который в нашем случае формирует образы О,, определяя параметры их функций принадлежности. Также на каждом такте блок ФРО вычисляет принадлежности текущих значений входных переменных каждому из сформированных образов, фактически выполняя традиционную для нечетких контроллеров процедуру фаззификации. Такой способ распознавания образов позволяет наделить базовый метод ААУ, в котором факт распознавания образа определялся лишь двумя числами 0 или 1, преимуществами нечетких контроллеров.
2. Оценивание образов с точки зрения полезности или опасности их для ОУ, используя множество «элементарных» оценок 5 и функцию Е(х), задающую отображение
Решением этой задачи в системе ААУ занимается другой блок - аппарат эмоций, который для каждого образа О,- вычисляет его качественную оценку Е,
3. Нахождение закономерностей управления ОУ в среде в виде продукций О, & А,■ Оь где О,- и Лу - нечеткие множества, которым принадлежали значения входных и выходных переменных на предыдущем такте, а О* - множество, которому принадлежат значения входных переменных на текущем такте.
БЗ сохраняет пространственно-временные закономерности в виде нечетких правил вида Ри: О/ & Aj -> Ок, где Рн - й-ое правило управления в БЗ.
4. Вычисление выходных воздействий на каждом такте работы УС, подаваемых в среду или ОУ через «исполнительные органы», основываясь на качественных оценках распознанных образов и обнаруженных закономерностях управления, сохраненных в БЗ.
Эту задачу решает блок принятия решений, который на каждом такте работы системы анализирует содержимое БЗ, вычисляет выходные значения всех
правил в текущей ситуации, и, принимая во внимание качественные оценки результирующих образов правил, вычисляет выходные воздействия УС (значения выходных переменных). Этот процесс схож с процедурой дефаззификации, при помощи которой происходит принятие решений в нечетких контроллерах. В отличие от базового способа принятия решений в методе ААУ, при таком подходе выходные значения блока ФРО могут носить непрерывный характер, а не выбираться из конечного набора фиксированных значений.
Рассмотрим решение этих задач, предлагаемых в данной диссертационной работе.
Формирование образов, как пространственных в блоке ФРО, так и пространственно-временных в БЗ, происходит с использованием процедуры кластеризации методом вычетов.
Входными данными для процедуры кластеризации является история управления, которая накапливается в специальной буферной памяти системы за определенное количество тактов работы УС и записывается в виде (2).
{Х),1, X {у и, У,,2, "' У ¡м)> {х 1*1,1: х 1+1.2, ■■■ {у У 1*1,2-— У1+1,м}> ■•• (2)
где х,1 - значение г-й входной переменной (показание /-го датчика) в момент времени Г, а уи - значение /-й выходной переменной (номер действия, выполненного г-ым исполнителем) в момент времени г, N и М — количество входных и выходных переменных соответственно.
Процедура генерации правил запускается при полном заполнении буферной памяти, после выполнения кластеризации память полностью очищается.
Для генерации однотакговых правил управления используются значения входных и выходных параметров ?-го такта и значения входных параметров (¡+1)-го такта, которые задают координаты одной точки в (Лг+М+ЛО-мерном пространстве.
Рассмотрим пример системы управления, балансирующей перевернутым физическим маятником, установленным на тележке. Маятник нижним концом прикреплен к тележке при помощи шарнира, тележка может с помощью привода перемещаться вдоль прямой, лежащей на горизонтальной плоскости. Задача состоит в том, чтобы при помощи перемещений тележки удерживать маятник, на который действует сила притяжения, в вертикальном положении.
Для решения задачи балансирования маятником система управления должна получать информацию о текущем угле и угловой скорости маятника и определять значение управляющего воздействия на тележку. В этом случае одна точка на входе процедуры кластеризации будет задаваться значениями угла, угловой скорости и управляющего воздействия на тележку на /-ом такте и значениями угла и угловой скорости на такте 1+1. В результате, на вход процедуры кластеризации поступает набор точек, заданных своими координатами в (Л^+М+ЛО-мерном пространстве. В примере с балансированием маятником размерность пространства получается равной 2+1+2=5.
Процедура кластеризации выполняется методом вычетов. На вход процедуры поступает набор точек и максимальный размер кластера К, а на выходе получается набор кластеров, заданных центральной точкой и набором точек, также принадлежащих кластеру.
Формирование входных нечетких множеств (функций принадлежности)
Входные нечеткие множества традиционно для нечетких контроллеров задаются при помощи функций принадлежности. Функции принадлежности имеют трапецеидальный вид и задаются а:-координатами четырех вершин трапеции: хц» Хц, хг„ и хгЬ (рис. 1). Такая форма задания позволяет определять помимо трапецеидальных функций, также функции треугольного вида (при дгЛ = хг,).
Выбор трапецеидального вида функций принадлежности основан на сравнительной простоте вычисления данного вида функций, а также возможности интерполяции с их помощью большинства распространенных функций принадлежности, например, треугольных и колоколообразных, с достаточной для большинства задач точностью. К тому же, часто объекты управления обладают поведением, близким к линейному на небольших интервалах значений входных и выходных переменных, поэтому для управления ими можно применять нечеткие контроллеры с трапецеидальными функциями принадлежности.
Функция принадлежности генерируется на основе набора точек, отстоящих не более чем на эвклидово расстояние Л от центра кластера, полученного в результате работы процедуры кластеризации.
Рассмотрим автоматическую процедуру генерации функций принадлежности по координатам точек кластера, соответствующим угловому отклонению (другими словами - по проекциям точек кластера на одну из осей координатного пространства).
№ А
Рггип О
Рисунок 1. Пример задания функций принадлежности для углового отклонения.
Пусть Я - максимальный размер кластера, с,- - координата /-ой точки кластера (например, г'-ое значение углового отклонения для системы управления перевернутым маятником), стШ - координата центра кластера, а N - количество точек в кластере (N>=2), причем точки кластера отсортированы по возрастанию значений. Тогда координаты вершин трапеции, задающей функцию принадлежности трапецеидального вида, будут вычисляться по формуле (3).
- 2-е, -с2
= 2 • Су —
Х„=Сг
:= См_1
(3)
При большом разбросе точек кластера может возникнуть ситуация, в которой ширина основания функции принадлежности - х1Ь) превысит максимальный размер кластера Я. В этом случае координаты корректируются по формулам (4).
ХгЬ=ХгЬ-((Хг„-Х1Ь)-К)-
Х,ь=Х,ь-((ХгЬ-Х,ь)-К)-
(ХгЬ-Хг1) + (Х11~Х1Ь)
(4)
(Х,Ь-Х„) + (Х„-Х1Ь)
Перед добавлением функции принадлежности в базу знаний, производится проверка на совпадение новой функции с уже существующими функциями в БЗ.
Пусть Gi - площадь под графиком ¡'-й функции принадлежности, уже существующей в БЗ (1=1,..А где О - количество функций принадлежности в БЗ), Сгс - площадь новой функции принадлежности, с - площадь пересечения двух
фигур (трапеций), образованных 1рафиками соответствующих функций. Тогда, при выполнении условия (5) для некоторого г, добавление новой функции в базу знаний не происходит, а вместо новой функции используется уже существующая функция / из БЗ, которая модифицируется в соответствии с формулой (6). Фактически формула (6) выполняет операцию дизъюнкции над новым и уже существующим нечеткими множествами.
(в, + вс-С,,,;/(в1 + 6У <Ра, (5)
где Ра - заданный априорно порог «похожести» двух функций принадлежности.
Х,ы = тт(Х1Ь„Хие)
Хн>1=тоах(ХгЬ„Хи>с) ^
Хш =тт(Хи,Л",к)
Х,й =тп-лх(Х„1,Хгк).
Генерация нечетких правил управления
После генерации блоком ФРО функций принадлежности для результирующего образа, вычисляется' качественная оценка Ен этого образа. Правило, с использованием выходных данных процедуры кластеризации, записывается в виде (7):
Рн: & Иа(х2) & ... & & Ш(уО & & ... & М,м(Ун» ~>
' (Х[) & 2* (*г) & ... »Ш & Ен , (7)
где выражение ((1,1 (х{) & & ... & задает входной образ (набор
входных множеств) правила, (/А?(уд & & — & !м1(Ум» — набор
управляющих воздействий, ¡(хд & А<+/ & ... & йи /(хц)) - образ результата (набор выходных множеств), который должен распознаваться при выполнении данного правила, а Ен — оценка результирующего образа.
Распознавание образов в нечетких системах ААУ
Процесс распознавания выполняется традиционной для нечетких контроллеров процедурой - фаззификацией, - вычислением степеней принадлежности текущих значений входных параметров входным нечетким множествам. Далее, по значениям входных функций принадлежности вычисляются результирующие посылки правил в соответствии с принятой в системе реализацией
операции «Г-конорма» (операция нечеткое «И» может быть реализована через умножение, взятие минимального числа или другую операцию над значениями функций принадлежности).
Значения результирующих посылок /?,- всех правил поступают на вход подсистемы принятия решений.
Принятие решений в нечетких системах ААУ
Алгоритм принятия решений состоит из следующих последовательных шагов:
1. Вычисление посылок каждого из правил в соответствии со значениями входных функций принадлежности.
2. Корректировка посылки каждого правила в соответствии со значением степени адекватности правила. Для /-го правила
д'=д-а. (8)
3. Корректировка посылки каждого правила в соответствии с оценкой результирующего образа правила по одной из следующих формул (выбирается в зависимости от вида объекта управления и других критериев):
о1ап
А'=А'--
^—0.5 1-13
•1.1
—+0.5, (9)
Д'=Д'<
га.1 р
Ч /
(10)
А'=
0, если Е <£ •Е
если (11)
где Ет1„ = [0,1] — коэффициент, задающий нижний порог, отсекающий правила с низкими оценками, иЕ^и - максимальное значение оценки.
Первая формула реализует сигмоидальную зависимость - она «подавляет» правила с низкой оценкой результирующего образа и «вытягивает» правила с оценкой выше перегиба функции (0.5).
Вторая формула реализует квадратичную зависимость посылки правила от оценки результирующего образа. Эту формулу следует применять для систем, в которых состояния с высокими оценками достижимы из большинства других состояний. Правила с низкими оценками в соответствии с этой формулой достаточно сильно «подавляются».
Третья формула задает пороговую зависимость посылок правил от оценок результирующих образов. Все правила с оценкой ниже порога исключаются из процесса принятия решения, тем самым исключается попадание ОУ в состояния с нежелательной оценкой. Эта формула пригодна для применения в системах, управляющих объектами, переход которых в состояние с низкой оценкой может привести к нежелательным последствиям.
Далее результирующие посылки всех правил суммируются и полученная сумма сравнивается с априорно заданным порогом Рлъй- Если величина суммы меньше порога, значит в БЗ недостаточно правил управления, предлагающих действия для текущего состояния ОУ, ведущие к состоянию с удовлетворительной оценкой, и действие выбирается случайным способом.
Если величина суммы больше порога, то происходит вычисление результирующего управляющего воздействия по одному из алгоритмов нечетких контроллеров: вычисления средневзвешенного значения (12), «победитель забирает все» (выбор управляющего воздействия правила с максимальной посылкой), или по методу центра масс (13).
О?)
Ъ = * Г ,, , ■ (13)
ь
где у^ — значение у'-ой выходной переменной, ]=[1,М], - значение результирующей посылки к-то правила, а1Ъ - значение выходного управляющего воздействия Л-го правила дляу'-ой выходной переменной.
Второй способ вычисления применим для объектов управления, ближайшие состояния которых по значениям параметров не всегда обладают близкими оценками. И наоборот, состояния с близкими оценками не всегда имеют близкие значения параметров.
Далее вычисленное управляющее воздействие подается на вход исполняющего органа, который в соответствии с ним воздействует на ОУ.
Адаптация (управление базой знаний) нечетких систем ААУ
Исходя из основного условия задачи, согласно которому система управления должна иметь способность управлять ОУ в близкой к стационарной среде, т.е. в такой среде, свойства которой могут меняться во времени, система должна адаптироваться к изменениям свойств среды.
Под адаптацией мы понимаем переобучение системы - изменение алгоритма управления объектом.
Ввиду того, что знания в системе хранятся в виде нечетких правил
управления (продукций), изменение алгоритма управления возможно двумя
способами: либо изменением уже существующих правил, либо удалением существующих правил и генерацией новых.
Исходя из рассмотренной организации БЗ, при которой описания входных и выходных нечетких множеств хранятся отдельно от правил, и каждое нечеткое множество может быть использовано несколькими разными правилами, изменение входных множеств нежелательно, поскольку попытка изменить одно правило может повлечь изменения в других правилах, изменять которые не нужно.
Если исходить из условия, что входные и выходные множества остаются неизменными, можно заключить, что первый способ изменения алгоритма управления равносилен второму. То есть адаптация системы осуществляется за счет удаления старых правил, которые становятся неадекватными изменившимся свойствам ОУ и среды, и генерации новых правил.
Каждое правило, находящееся в базе знаний, должно контролироваться с точки зрения адекватности описания им закономерностей взаимодействия ОУ и среды. Для этой цели введем для каждого правила некоторый параметр Qj, при помощи которого будем задавать степень адекватности у-го правила. Пусть = О говорит о полной неадекватности правила текущим свойствам ОУ и среды, а 0 = 1 - об обратном. Правила с Qj < 0М,Я, где Qm¡n - априорно заданный порог, ухудшают качество управления, и в некоторых реализациях систем управления могут быть удалены из БЗ для экономии памяти.
Очевидно, величина Qj должна меняться в процессе работы УС в соответствии с изменениями свойств объекта управления и среды. То есть значение
этой величины можно использовать для отслеживания изменений свойств объекта управления и среды.
Изменение величины Q¡ на очередном такте должно зависеть от того, насколькоу'-ое правило принимало участие в управлении на предыдущем такте и на сколько получившийся при этом результат ■ соответствует результату, предсказываемому правилом.
Тогда модуль изменения величины Q¡ на г-ом такте будет зависеть от степени принадлежности входных величин множествам входных переменных правила (посылка) и от степени принадлежности реально выполненного действия выходным переменным правила, что можно выразить в виде зависимости (14):
Щ-м,;^)-™/^), (14)
где, исходя из того, что
о'-> =
1 _ '-1
У\
I-
Уг
Ум
(15)
(16)
величины щ и м>/ примут значения
Знак и величина изменения степени адекватности должны зависеть от принадлежности результирующих величин образу, описываемому данным правилом.
Введем также некоторую величину д — константу, задаваемую априорно, которая будет определять скорость изменения степени адекватности правил -некоторый аналог скорости сходимости для нейронных сетей.
Тогда значение величины Qj на каждом такте работы УС можно записать в виде формулы (17):
0/+' =б/ + и-ДО'"1) • . д ■ (и>/(0') - е/). (17)
Полученное значение степени адекватности у'-го правила Q¡ может быть использовано в процессе двумя способами: как поправочный коэффициент,
корректирующий результирующую посылку у-го правила, и как индикатор необходимости присутствия данного правила в БЗ.
В 3-ей главе приводится описание разработанной в диссертации модели прикладной системы управления.
Разработка программной реализации нечеткой системы ААУ проведена с использованием САБЕ-системы 4014, созданной с участием автора специально для ускорения разработки и унификации интеллектуальных систем управления, основанных на методе ААУ. Схема системы изображена на рис.2.
Библиотека визуализирующих модулей
Подсистема визуализации
Runtime 4GN
Подсистема управления работой Application system
Подсистема настройки свойств блоков Application System
Application System
г
то
е-
Среда
Сенсоры
Исполн. Органы
Аппарат
Эмоций
База Знаний
Блок принятия решений
Блок ФРО
Редактор системы
Редактор межблочных соединений
Скрипт-редактор с компилятором С#
Библиотека готовых подсистем ААУ
Designer 4GN
Редактор нейросетей
Библиотека нейроноподобных элементов и связей
Рисунок 2. Общая схема системы 40№
Помимо структуры и основных функций 4GN, в главе описана структура разработанного в рамках данной диссертационной работы программного обеспечения. А именно: базовых классов системы ААУ для среды 4GN и модулей, реализующих:
• модель нечеткой системы управления ААУ, состоящей из блоков FuzzyPFR, FuzzyQAS, Fuzzy KB и FuzzyDM;
• модели объектов управления — перевернутого маятника и корпуса космического аппарата - PendulumCO и SatelliteCO;
• подсистемы визуализации реального времени для 4GN;
• модулей для подсистемы визуализации ViewMembershipFunctions, ViewString и ViewPendulum, отображающих соответственно функции принадлежности, правила управления в текстовом виде и изображение перевернутого маятника.
В 4-ой главе представлены результаты нескольких серий экспериментов, в ходе которых уточняются параметры разработанной системы управления, оптимальные для различных объектов управления и целевых функций.
На прикладной системе управления перевернутым маятником были исследованы зависимости качества управления, скорости обучения системы и эффективности базы знаний от максимального размера кластера и длительности периода генерации правил.
В частности, было экспериментально установлено, что
• эффективность БЗ линейно повышается при увеличения длительности периода генерации правил с 10 до 100 тактов;
• качество управления системы, а также количество правил в БЗ и время обучения системы падает при увеличении максимального размера кластера с 0,2 до 0,35. При значениях размера кластера, выходящих за пределы этого диапазона система теряет способность к обучению.
Также в этой главе разработанная прикладная система управления сравнивается с другими системами управления, решающими аналогичные задачи:
1. проводится сравнение разработанной системы с системами управления, основанными на различных нейросетевых реализациях обучения с подкреплением (reinforcement learning) на традиционной тестовой задаче
балансирования перевернутым маятником. В ходе проведения экспериментов, результаты которых представлены в таблицах 1 и 2, показано преимущество нечеткой системы ААУ над другими системами, участвовавшими в экспериментах в скорости обучения примерно на 9% при балансировании маятником из фиксированного начального положения и примерно на 115% при балансировании маятником из случайного начального положения при равных критериях качества управления;
Таблица 1. Результаты опытов по балансированию перевернутым маятником из фиксированного начального положения.
Система управления ОЕЫ1Т(Ж 1ее1 НАЛУ НААУ
Среднее количество попыток 1846 535 283 259 395
Стандартное отклонение (БИ) 1396 329 138 154 279
Максимальное отклонение маятника 12° 12° 12° 12° 8°
Таблица 2. Результаты опытов по балансированию перевернутым маятником из произвольного начального положения.
Система управления ОЕМТСЖ БАКЕ 1яе1 НААУ
Среднее количество попыток 2578 1691 967 448
Стандартное отклонение (БЭ) 2092 984 1148 84
Максимальное отклонение маятника 12° 12° 12° 12°
2. На примере задачи стабилизации углового движения космического аппарата проводилось сравнение разработанной нечеткой системы ЛАУ с ранее разработанными вариантами системы ААУ, не использующими нечеткую логику. В ходе экспериментов нечеткая система ААУ показала преимущество в скорости обучения примерно в 8 раз (таблица 3). На этой же задаче была продемонстрирована способность разработанной системы к переобучению (адаптации);
Таблица 3. Результаты опытного сравнения различных вариантов системы управления угловым движением космического аппарата.
Система управления Pilot 1 Pilot 2 НАЛУ 1 НААУ2
Среднее количество тактов обучения 7590 6905 862 925
Стандартное отклонение (SD) 972 735 176 115
3. На примере программной модели мобильного робота Pioneer P3-DX с целевой функцией избежания столкновения с препятствиями показала возможность применения разработанной нечеткой системы для управления объектами этого типа. Сравнение полученной системы управления с другими системами не проводилось из-за отсутствия общепринятых тестовых задач для мобильных роботов.
Основные результаты работы
В данной диссертационной работе представлен подход к построению систем автономного адаптивного управления на основе теории нечетких множеств.
Основные результаты работы:
1) разработано обобщенное описание системы ААУ па основе теории нечетких множеств;
2) разработаны методы синтеза подсистем системы ААУ на основе нечеткой логики, а именно:
• представление (кодирование) алгоритма работы системы управления в виде входных и выходных нечетких множеств и нечетких правил управления,
• метод автоматического разбиения множеств значений входных и выходных переменных системы на нечеткие множества, отражающие пространственные закономерности во входных и выходных данных системы,
• метод автоматической генерации нечетких правил управления с использованием автоматической кластеризации методом вычетов, при
помощи которых описываются функциональные взаимосвязи между входами и выходами системы;
• метод коррекции степеней адекватности правил управления, позволяющий менять влияние каждого правила на процесс управления, адаптируя алгоритм управления к изменениям свойств объекта управления и среды;
3) на основе разработанных методов создана модель прикладной системы управления в виде модуля для системы Ве51§пег40Ы на языке СИ, которая была отлажена на задачах балансирования перевернутым маятником, стабилизации углового движения космического аппарата и управления мобильным роботом;
4) проведены несколько серий компьютерных экспериментов с разработанной системой управления и моделями объектов управления:
• на примере системы балансирования перевернутым маятником нечеткая система ААУ показала высокую скорость обучения, которая на 9%-115% выше по сравнению с системами, построенными на основе обучения с подкреплением, при равных критериях качества,
• на примере системы стабилизация углового движения космического аппарата нечеткая система ААУ продемонстрировала существенное сокращение (примерно в 8 раз) скорости обучения, по сравнению с существующими системами ААУ,
• на примере системы управления мобильным роботом была продемонстрирована возможность применения разработанной системы для эффективного управления объектами этого типа.
Публикации
1. Жданов А. А., Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 3. - М.: ИСП РАН, 2002, с. 119-135.
2. Караваев М.В., Жданов А А. Применение нечеткой логики в системах автономного адаптивного управления. Сборник материалов всероссийской научно-технической конференции "Наука - производство - технологии -экология": Том 1. Киров: Изд-во ВятГУ, 2002, с. 13-14.
3. Alexander Zhdanov, Maxim Karavaev and Helen Maklakova, Claire Medigue, Michel Sorine. Simulation of control mechanisms in the cardio-vascular system. French-Russian A.M. Liapunov Institute for Applied Mathematics and Computer Science. Transactions. Vol. 4. Pp. 233-245. Moscow. 2003.
4. Караваев M. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 7 (под ред. А.А.Ждаиова). -М.: ИСП РАН, 2004, с. 41-53.
5. Караваев М.В. Правила формирования связей между нейроноподобными элементами в системах автономного адаптивного управления. С. 102-108. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2004: Часть 2. М.: МИФИ. С. 102-108.
6. Жданов А.А., Устюжанин А.Е., Караваев М.В. Нейросетевой самообучаемый метод адаптивного управления динамическими объектами. Материалы XXIX Академических чтений по космонавтике, 2005 год. М.: 2005. с. 93.
7. А.А. Жданов, А.Е. Устюжанин, М.В. Караваев, Д.Б. Липкевич. 4GN -инструмент для разработки нейроноподобных адаптивных систем управления на основе метода автономного адаптивного управления. Сборник научных трудов Всероссийской научно-технической конференции Нейроипформатика-2005: Часть 1. М.: МИФИ. С. 203-209.
8. Жданов А.А., Караваев М.В. Разработка адаптивной системы управления мобильным роботом с применением нечеткой логики. Всероссийская научно-техническая конференция "Наука - производство - технологии - экология". Сборник материалов: Том 1. Киров: Изд-во ВятГУ, 2005, с. 34-36.
9. М.В. Караваев. Применение нечеткой логики в системах автономного адаптивного управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.
10. М.В. Караваев, А.Е. Устюжанин, А.А. Жданов. 4GN - программный инструмент для проектирования интеллектуальных систем управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.
Напечатано с готового оригинал-макета
Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. Подписано к печати 28.07.2006 г. Формат 60x90 1/16. Усл.печл. 1, 5. Тираж 100 экз. Заказ 545. Тел. 939-3890. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 627 к.
Оглавление автор диссертации — кандидата физико-математических наук Караваев, Максим Владимирович
Список сокращений.
Введение.
Цели и задачи диссертационной работы.
Глава 1. Методы и проблемы построении адаптивных систем управления.
§1. Теория автоматического регулирования (управления).
§2. Конечные автоматы.
§3. Контроллеры на основе нечеткой логики.
§4. Контроллеры на основе искусственных нейронных сетей.
§5. Метод автономного адаптивного управления.
Глава 2. Обобщение метода и синтез систем ААУ на основе теории нечетких множеств
2.1. Анализ и описание системы ААУ на основе теории нечетких множеств.
2.1.1. Обобщение метода ААУ на основе теории нечетких множеств.
2.1.2. Основная схема системы ААУ и ее рекомпозиция.
2.2. Синтез систем ААУ с использованием нечеткой логики.
2.2.1. Обзор методов кластеризации и генерации правил.
§1. Существующие методы генерации правил.
§2. Методы кластеризации данных.
2.2.2. Разработанные методы синтеза подсистем системы ААУ на основе нечеткой логики
§1. Кодирование входной информации.
§2. Формирование входных нечетких множеств (функций принадлежности).
§3. Генерация нечетких правил управления.
§4. Подсистема распознавания образов.
§5. Подсистема принятия решений.
§6. Управление базой знаний.
Глава 3. Проектирование прикладной системы ААУ на основе теории нечетких множеств с использованием унифицированного языка моделирования UML.
§1. Разработка диаграммы базовых классов системы ААУ для среды 4GN.
§2. Разработка диаграммы классов системы управления.
§3. Разработка подсистемы визуализации.
Глава 4. Эксперименты с прикладной системой ААУ на основе нечеткой логики при управлении различными объектами.
§1. Методика расчета по покрытия правилами в БЗ входных и выходных множеств системы.
§2. Система управления перевернутым физическим маятником.
§3. Система стабилизации углового движения космического аппарата.
§4. Система управления мобильным роботом.
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Караваев, Максим Владимирович
Постоянно растущая сложность и разнообразие задач, решение которых возлагается на автоматические системы, в последнее время определяют повышенную потребность в системах управления с возможно более универсальными свойствами. Однако, ни один из существующих на текущий момент подходов к построению систем управления - ни теория автоматического управления, ни нечеткие контроллеры, ни искусственные нейронные сети, ни другие технологии, не обладают необходимой универсальностью. С другой стороны, имеет место уверенность в возможности построения систем с искомыми свойствами, которая основана на наблюдении действия таких систем в природе, это нервные системы живых организмов.
Возможно, что претендовать на более широкий охват типов решаемых задач могут методы, основанные на концептуальных подходах, моделирующих функциональность и структуру нервных систем живых организмов, поскольку в таких методах объект управления описывается совокупностью формализованных знаний, заранее заданных, либо эмпирически приобретенных системой, и менее привязанных к той или иной функциональной зависимости параметров объекта управления, чем это имеет место в моделях, выраженных в аналитической форме уравнений. К таким концептуальным подходам относится и метод автономного адаптивного управления (ААУ), развиваемый в Отделе имитационных систем Института Системного Программирования РАН.
Метод ААУ определяет общие принципы и некоторые частные реализации самообучающихся систем управления объектами, для которых отсутствует математическая модель и его логико-лингвистическое описание, а известны только общие критерии качества управления (целевая функция).
Однако все первые системы ААУ строились на основе дискретных устройств, что ограничивало область их применения, в особенности, при работе таких систем управления в «реальном» непрерывном мире. Для обеспечения достаточно гладких зависимостей между входными и выходными переменными необходимо было разбивать входное и выходное признаковые пространства на достаточно большое количество диапазонов, и на каждом из них проводить пробные управляющие воздействия для нахождения закономерных реакций. Это приводило к экспоненциальному росту объема базы знаний и времени обучения системы при линейном увеличении критериев качества управления или количества входных переменных системы.
Несмотря на то, что были разработаны специальные алгоритмы, позволяющие значительно ускорить обучение системы, основываясь на различных эвристиках, в целом эффективность систем ААУ оставалась реализованной далеко не полностью.
Целью настоящей работы является разработка подходов к применению нечеткой логики в системах ААУ, что должно повысить эффективность систем ААУ, наделив их непрерывными свойствами. При этом корректность такого применения нечеткой логики основывается на теореме FAT (Fuzzy Approximation Theorem), доказанной Б. Коско (В. Kosko) и гласящей, что любая математическая система может быть аппроксимирована системой на основе нечеткой логики.
Актуальность данной темы заключается, с одной стороны, в необходимости наделения систем ААУ непрерывными свойствами, за счет использования теории нечетких множеств, с целью улучшения их характеристик и расширения области применения, а, с другой стороны - в возможности расширения области применения традиционных нечетких контроллеров за счет применения в них методов обучения и адаптации, используемых в системах ААУ. Разработанные в работе методы могут использоваться для построения широкого класса прикладных систем управления.
Цели и задачи диссертационной работы
Цель диссертационной работы состоит в том, чтобы найти подходы и разработать методы построения управляющих систем ААУ на основе теории нечетких множеств. Такие методы позволят преодолеть ограничения систем ААУ, связанные с обязательным требованием четкой дискретизации информационных объектов.
Для достижения указанной цели необходимо решить следующие задачи:
1. Разработать метод автоматического определения входных и выходных нечетких множеств, заданных при помощи функций принадлежности.
2. Разработать метод автоматической генерации правил управления, описывающих функциональную взаимосвязь между входом и выходом.
3. Разработать метод автоматической адаптации набора правил базы знаний (БЗ) к изменяющимся свойствам объекта управления (ОУ) и среды.
4. Разработать метод оценивания образов и принятия решений.
5. Осуществить проверку работоспособности и эффективности разработанных методов на примерах прикладных систем.
Научная новизна
Научная новизна работы заключается в том, что в данной работе впервые предпринята попытка построения способной к самообучению автономной адаптивной системы управления на основе нечеткой логики. А именно:
• введено описание системы ААУ в терминах теории нечетких множеств. Разработана кодировка входных и выходных нечетких множеств и нечетких правил управления специального вида;
• предложен метод генерации нечетких правил управления, а также входных и выходных функций принадлежности на основе модифицированного метода кластеризации методом вычетов;
• предложен метод адаптации набора правил в базе знаний к изменяющимся свойствам объекта управления и среды посредством введения для каждого правила степени адекватности и правила изменения ее величины;
• предложен метод принятия решений, учитывающий степени адекватности правил управления в базе знаний и оценки результирующих образов правил;
• на примере модели прикладной системы управления показаны преимущества разработанного подхода в скорости обучения перед системами управления, построенными на основе парадигмы обучения с подкреплением, в традиционной тестовой задаче балансировки перевернутым маятником.
Практическая ценность
Практическая ценность работы состоит в том, что разработанные методы могут быть применены для построения прикладных самообучающихся управляющих систем для широкого класса объектов управления.
Возможность построения прикладных систем управления различными объектами и их преимущества показаны на примерах системы балансировки перевернутым маятником, системы стабилизации углового движения космического аппарата и системы управления моделью мобильного робота Pioneer P3-DX.
Апробация работы и публикации
Основные положения работы докладывались на следующих конференциях и семинарах:
• всероссийской научно-технической конференции Нейроинформатика-2004, 2005 МИФИ,
• семинаре «Экобионика» МГТУ им. Н.Э. Баумана,
• XXIX Академических чтениях по космонавтике, 2005 год,
• всероссийской научно-техническая конференции "Наука - производство -технологии - экология» ВятГУ (г. Киров).
Основные положения работы публиковались в журналах и трудах конференций:
1. Жданов А. А., Караваев М. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 3. - М.: ИСП РАН, 2002, с. 119-135.
2. Караваев М.В., Жданов А.А. Применение нечеткой логики в системах автономного адаптивного управления. Сборник материалов всероссийской научно-технической конференции "Наука - производство - технологии - экология": Том 1. Киров: Изд-во ВятГУ, 2002, с. 13-14.
3. Alexander Zhdanov, Maxim Karavaev and Helen Maklakova, Claire Medigue, Michel Sorine. Simulation of control mechanisms in the cardio-vascular system. French-Russian A.M. Liapunov Institute for Applied Mathematics and Computer Science. Transactions. Vol. 4. Pp. 233-245. Moscow. 2003.
4. Караваев M. В. Применение нечеткой логики в имитационной системе автономного адаптивного управления. Труды Института Системного Программирования Российской Академии Наук: Том 7 (под ред. А.А.Жданова). - М.: ИСП РАН, 2004, с. 41-53.
5. Караваев М.В. Правила формирования связей между нейроноподобными элементами в системах автономного адаптивного управления. С. 102-108. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2004: Часть 2. М.: МИФИ. С. 102-108.
6. Жданов А.А., Устюжанин А.Е., Караваев М.В. Нейросетевой самообучаемый метод адаптивного управления динамическими объектами. Материалы XXIX Академических чтений по космонавтике, 2005 год. М.: 2005. с. 93.
7. А.А. Жданов, А.Е. Устюжанин, М.В. Караваев, Д.Б. Липкевич. 4GN - инструмент для разработки нейроноподобных адаптивных систем управления на основе метода автономного адаптивного управления. Сборник научных трудов Всероссийской научно-технической конференции Нейроинформатика-2005: Часть 1. М.: МИФИ. С. 203-209.
8. Жданов А.А., Караваев М.В. Разработка адаптивной системы управления мобильным роботом с применением нечеткой логики. Всероссийская научно-техническая конференция "Наука - производство - технологии - экология". Сборник материалов: Том 1. Киров: Изд-во ВятГУ, 2005, с. 34-36.
9. М.В. Караваев. Применение нечеткой логики в системах автономного адаптивного управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.
10. М.В. Караваев, А.Е. Устюжанин, А.А. Жданов. 4GN - программный инструмент для проектирования интеллектуальных систем управления. Труды Международных научно-технических конференций «Интеллектуальные системы» (AIS'05) и «Интеллектуальные САПР» (CAD-2005). Научное издание в 4-х томах. - М.: ФИЗМАТЛИТ, 2005.
Структура и объем диссертации
Работа состоит из введения, четырех глав, заключения и списка литературы. Общий объем диссертации составляет 106 страниц. Список литературы содержит 49 наименований.
Заключение диссертация на тему "Применение нечеткой логики в системах автономного адаптивного управления"
Выводы по экспериментам с системой стабилизации углового движения КА.
В результате проведения экспериментов с прикладной системой стабилизации углового движения КА, показано, что нечеткая система ААУ обучается в среднем в 8 раз быстрее разработанных ранее систем ААУ, решающих эту задачу. Подробные результаты экспериментов представлены в таблице 4.4. Также на • примере этой системы показана способность разработанной нечеткой системы ААУ к адаптации.
§4. Система управления мобильным роботом
Система управления мобильным роботом с функцией выработки стереотипов поведения при взаимодействии с препятствиями пока не имеет такого же ярко выраженного практического значения, как две предыдущие прикладные системы. Более того, в этой области, несмотря на большое количество разработок и публикаций [1,2, 3,5,11,20,22], пока не существует общих критериев и тестовых задач для сравнения систем управления. Поэтому в данном случае система ААУ разработана для демонстрации широты применения разработанного подхода, а не для сравнения с аналогичными системами управления.
В качестве модели робота была выбрана широко распространенная программная модель реального робота Pioneer2DX, работающая в симуляторе реального времени Player/Stage. Эта модель, как и реальный робот, имеет 8 сонарных датчиков, расположенных по периметру робота и измеряющих расстояния до ближайших препятствий в 8ми направлениях. В качестве управляющих параметров модель принимает значение линейной скорости движения и угловой скорости поворота робота относительно центра (рисунок 4.14).
Сонары
S1
S2
S8 —>
Система управления
Угловая скорость поворота
3£—^
Скорость движения
Рисунок 4.14. Входные и выходные данные системы управления мобильным роботом
Рисунок 4.15. Расположение датчиков и возможные направления движения робота
Для упрощения задачи, чтобы сузить пространство поиска, и свести две выходные переменные системы к одной - «номер действия», из всех возможных значений скоростей движения и поворота были выбраны 6 пар, задающих движение робота во всех основных направлениях (рис.4.15), а также механизм преобразования номера действия в значения скорости движения и скорости поворота (рис. 4.17). На рисунке изображены также примеры нескольких сформированных входных множеств Д/.D,4 и выходных А/, А2, .Ав
File View Action г • у
С и 1 п /V! \
J и X rt ] □
L J п ! гп 1 гп
LJ Ц- 1 1 J LJ i
Рисунок 4.16. Внешний вид робота в лабиринте среды эмулятора Player/Stage
Входная лингвистическая переменная S i («Расстояние»)
Выходная лингвистическая переменная А («номер действия»)
АО ' * А1 («вперё Д») («ВП| \2 У эаво») \3 А («на: 4 А5 / зад») ' («вл \ /|\ / \ /1 \ / \ / ■ \ / \ / 1 \ / \/ < \/ X 1 X /\ 1 /\ / \ | / \ / \ | / \ / \ 1 / \ / \i/ \ \б ево») ( А1 «вперёд») \ л ■ 'гловая ( 1 1 1 коросгь (поворот? 1 1 / 1 \ / 1 \ / 1 \ / 1 \ / / Ai V F
У 1 \ | л 1 \ 1 \ 1 1 1 Скорость движе 1 1 > г— 1 / 1 / ния 0 / Ai v V N
1 / 1 / 1 1 0 Ai
Рисунок 4.17. Графическая интерпретация лингвистических переменных «расстояние», номер действия и их отображение на области значений входных и выходных переменных
Лабиринт с препятствиями квадратной формы, в котором проводились эксперименты с роботом, изображен на рисунке 4.16.
Аппарат эмоций в данной реализации системы управления каждому нечеткому образу на входе ставит в соответствие некоторую оценку, которая говорит о степени близости текущего нечеткого образа к целевому. В данном случае - это удаленность препятствий по всем направлениям от робота. Зависимость между входными образами и их оценками выражается соотношением (4.9).
E = (\-rnax(DXJ).Emm, (4.9) где i=l.N, а Етах - максимальное значение оценки.
Тем самым, минимальная оценка получается в тех случаях, когда ближайшее с любой стороны от робота препятствие расположено вплотную к нему, максимальная - при удалении от него на такое расстояние, на котором показания всех сонаров выходят из области значений нечеткой переменной Z)/.
В ходе проведения серии из 5 экспериментов, было получено среднее время обучения системы до полного избегания столкновений робота с препятствиями системы - около 2000 тактов. Несколько большее время обучения, по отношению к предыдущим реализациям нечеткой системы ААУ, обусловлено большим количеством входных переменных системы в последнем случае.
83 165 247 329 411 493 575 657 739 821 903 985 1067 1149 1231 1313 1395 1477 1559 1641
Такты работы системы
Рисунок 4.18. Изменение качества управления мобильным роботом в процессе обучения системы
Ход одного из экспериментов изображен на рисунке 4.18 в виде зависимости оценки качества управления от номера такта работы системы. Максимальной оценкой в данном случае являлось число 1,0. Провал на графике в районе 1000-1200 тактов объясняется так же, как и в случае с экспериментами с системой стабилизации углового движения - попаданием робота в неизученную ситуацию (место в лабиринте).
В результате экспериментов показана возможность применения разработанной нечеткой системы ААУ для управления мобильными роботами.
Резюме по главе 4.
В результате разработки модели нечеткой системы ААУ и проведения с ней экспериментов показано:
1. в задаче балансировки перевернутым физическим маятником показано преимущество разработанного подхода перед существующими системами, построенными на основе обучения с подкреплением, в скорости обучения. Система ААУ обучалась на 9% быстрее лучшего из известных подходов при балансировке маятником из фиксированного положения и на' 115% быстрее при балансировке маятником из произвольного начального положения при равных значениях качества управления;
2. в задаче стабилизации углового движения космического аппарата показано преимущество разработанной нечеткой системы ААУ перед существующими на текущий момент системами ААУ в скорости обучения: нечеткая система ААУ обучалась в среднем в 8 раз быстрее при удовлетворении равным критериям качества управления. Также на этом примере показана способность разработанной системы к переобучению (адаптации);
3. на задаче управления мобильным роботом с целевой функцией избежания столкновений с препятствиями показана принципиальная возможность применения разработанной системы управления для решения более широкого класса задач.
Также в ходе экспериментов были исследованы зависимости значений различных характеристик нечеткой системы ААУ: ее скорости обучения, качества управления и эффективности БЗ от ее параметров, таких как, период генерации правил и максимальный размер кластера в процессе кластеризации. Найденные зависимости изображены в виде графиков на рисунках 4.6-4.8.
Заключение
В данной диссертационной работе представлен подход к построению систем автономного адаптивного управления на основе теории нечетких множеств. Основные результаты работы:
1) разработано обобщенное описание системы ААУ на основе теории нечетких множеств;
2) разработаны методы синтеза подсистем системы ААУ на основе нечеткой логики, а именно:
• представление (кодирование) алгоритма работы системы управления в виде входных и выходных нечетких множеств и нечетких правил управления,
• метод автоматического разбиения множеств значений входных и выходных переменных системы на нечеткие множества, отражающие пространственные закономерности во входных и выходных данных системы,
• метод автоматической генерации нечетких правил управления с использованием автоматической кластеризации методом вычетов, при помощи которых описываются функциональные взаимосвязи между входами и выходами системы;
• метод коррекции степеней адекватности правил управления, позволяющий менять влияние каждого правила на процесс управления, адаптируя алгоритм управления к изменениям свойств объекта управления и среды;
3) на основе разработанных методов создана модель прикладной системы управления в виде модуля для системы Designer4GN на языке С#, которая была отлажена на задачах балансирования перевернутым маятником, стабилизации углового движения космического аппарата и управления мобильным роботом;
4) проведены несколько серий компьютерных экспериментов с разработанной системой управления и моделями объектов управления:
• на примере системы балансирования перевернутым маятником система ААУ на основе нечеткой логики показала высокую скорость обучения, которая на 9%-115% выше по сравнению с системами, построенными на основе обучения с подкреплением, при равных критериях качества,
• на примере системы стабилизация углового движения космического аппарата разработанная система продемонстрировала существенное сокращение (примерно в 8 раз) скорости обучения, по сравнению с существующими системами ААУ,
• на примере системы управления мобильным роботом была продемонстрирована возможность применения разработанной системы для эффективного управления объектами этого типа.
Библиография Караваев, Максим Владимирович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Aycard Olivier, Jean-Paul Haton. A new approach to design fuzzy controllers for mobile robots navigation // Proceedings of IEEE/CIRA, pp. 68-73,1997.
2. Burgard Wolfram, Dieter Fox, Daniel Henning, Timo Schmidt. Estimating the Absolute Position of a Mobile Robot Using Position Probability Grids // AAAI/IAAI, Vol. 2, pp. 896-901,1996.
3. Gasos Jorge, Alessandro Saffiotti.Using fuzzy sets to represent uncertain spatial knowledge in autonomous robots // Spatial Cognition and Computation. Vol. 1, Issue 3, ISSN 1387-5868, pp. 205-226,1999.
4. Javier de Lope, Dario Maravall, Jose G. Zato.Topological. Modeling with Fuzzy Petri Nets for Autonomous Mobile Robot // IEA/AIE, Volume 2, pp. 290-299,1998.
5. John E. Hopcroft, Rajeev Motwani, Jeffrey D. Ullman. Introduction to Automata Theory, Languages, and Computations 2nd ed. Addison-Wesley, 2001.
6. Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani. Neuro-fuzzy and soft computing. Prentice-Hall, 1997.
7. Karakasidis Т. E., D. N. Georgiou. Partitioning elements of Periodic Table via fuzzy clastering technique // Soft Computing. 2004. V. 8. pp. 231-236. Springer-Verlag, 2003.
8. Kosho Bart. Fuzzy Systems as Universal Approximators // Proceedings of the First IEEE Conference on Fuzzy Systems ZZ-92, pages 1153-62, San Diego, March 1992.
9. Krause P., A. Krone, T. Slawinski. Fuzzy system identification by generating and evolutionary optimizing fuzzy rule bases consisting of relevant fuzzy rules // Reihe Computational Intelligence 87, University of Dortmund, 2001.
10. Layden Mark, Daniel Toal and Colin Flanagan. A Fuzzy Logic Based Navigation System for a Mobile Robot//Automatisierungssymposium, Wismar, 1999.
11. Meyer, J.-A. Artificial life and the animat approach to artificial intelligence // In Boden, M., editor, Artificial Intelligence, 1996, pages 325-354. Academic Press.
12. Meyer, J.-A., Guillot, A., Pirim, P., and Berthoz, A. Psikharpax: An autonomous and adaptive artificial rat // In Proceedings of ISR2004. CD ROM ISR, 2004, Paris.
13. Moriarty D.E., R. Miikulainen. Efficient reinforcement learning through symbiotic evolution // Machine Learning 22,11-32,1996.
14. Nawa Norberto Eiji, Takeshi Furuhashi, Tomonori Hashiyama, Yoshiki Uchikawa. A Study on the Discovery of Relevant Fuzzy Rules Using Pseudo-Bacterial Genetic Algorithm // IEEE Transactions on Industrial Electronics. 1999. V. 46. No 6.
15. Nguyen Eric M., Nadipuram R. Prasad. Model identification of a servo-tracking system using fuzzy clustering, International Journal of Uncertainly, Fuzziness and Knowledge-Based Systems, Vol. 7, No. 4 (1999), pp. 337-346.
16. Nguyen H.T., Kreinovich V. Applications of continuous mathematics to computer science, Kluwer, Dordrecht, 1997.
17. Novak V., I. Perfilieva, H.T. Nguyen, V. Kreinovich. Research on advanced soft computing and its applications // Soft Computing. 2004. V. 8. pp. 239-246. Springer-Verlag, 2003.
18. Roelof K. Brouwer. A fuzzy recurrent artificial neural network (FRANN) for pattern classification // International Journal of Uncertainty, Fuzziness, and Knowledge-Based Systems, Vol.8, No 5 (2000) 523-538.
19. Samelson Sandra Lee, Ron Sigal. Rapid Robot Training. Technical Report #98-100. Department of Mathematics and Computer Science of State University of New York at New Paltz, 1998.
20. Tunstel Edward, Tanya Lippincott, Mo Jamshidi. Behavior Hierarchy for Autonomous Mobile Robots: Fuzzy-behavior modulation and evolution // International Journal of Intelligent Automation and Soft Computing, 3(1), pp. 37-49,1997.
21. Zadeh L.A. Fuzzy sets // Information and Control. 1965. V. 8.
22. Бодянский E.B., Запорожец O.B. Адаптивный нейрорегулятор для нелинейного динамического объекта // Известия академии наук. Теория и системы управления №2,2002, -с. 92-96.
23. Бонгард М.М., И.С. Лосев, М.С. Смирнов. Проект модели организации поведения -«Животное». Моделирование обучения и поведения. М.: Наука, 1975.
24. Бураков М.В. Механизм адаптации нечеткого регулятора // Известия академии наук. Теория и системы управления №1,1998, с. 84-87.
25. Бураков М.В. Синтез нейронного регулятора // Известия академии наук. Теория и системы управления №3,1999,-с. 140-145.
26. Варшавский В.И., Д.А. Поспелов. Оркестр играет без дирижера. М.: Наука, 1984.
27. Жданов А.А. Метод автономного адаптивного управления // Известия Академии Наук. Теория и системы управления, 1999, № 5, с. 127-134.
28. Жданов А.А. Методе автономного адаптивного управления, его свойства и приложения // Перспективные информационные технологии и интеллектуальные системы, 2004. http ://pitis.tsure.ru/files 15/01 .pdf
29. Жданов А.А. Формальная модель нейрона и нейросети в методологии автономного адаптивного управления // Сборник "Вопросы кибернетики". Научный совет по комплексной проблеме "Кибернетика" РАН. Выпуск 3. М., 1997, с. 258-274.
30. Жданов А.А., Земских JI.B., Беляев Б.Б. Система стабилизации углового движения космического аппарата на основе нейроноподобной системы автономного адаптивного управления // Космические Исследования, 2004, т. 42, N3, М.: 2004. С. 1-15.
31. Жданов А.А., Земских JI.B., Беляев Б.Б. Система стабилизации углового движения космического аппарата на основе нейроноподобной системы автономного адаптивного управления // Космические Исследования, М. 2004.
32. Жданов А.А., М.В. Крыжановский, Н.Б. Преображенский. Бионическая интеллектуальная автономная адаптивная система управления мобильным роботом // Мехатроника, 2004, №1, с. 21-30 и №2, с. 17-22.
33. Заде J1. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976.
34. Захаров В.Н. Современная информационная технология в системах управления // Известия академии наук. Теория и системы управления №1,2000, с. 70-78.
35. Круглов В.В., В.В. Борисов. Искусственные нейронные сети. Теория и практика. 2-е изд., стереотип. - М.: Горячая линия - Телеком, 2002.
36. Лорьер Ж.-Л. Системы искусственного интеллекта. М.: «Мир», 1991.
37. Лосев И.С., В.В. Максимов. О задаче обобщения начальных ситуаций. Моделирование обучения и поведения. М.: Наука, 1975.
38. Лохин В.М., В.Н. Захаров. Интеллектуальные системы управления: понятия, определения, принципы построения. Интеллектуальные системы автоматического управления / Под ред. И.М. Макарова, В.М. Лохина. М.: ФИЗМАТЛИТ, 2001.
39. Лукас В.А. Теория автоматического управления. М.: «Недра», 1990.-416 с.
40. Макаров И.М., В.М. Лохин. Интеллектуальные системы автоматического управления. М.: ФИЗМАТЛИТ, 2001. 576 с.
41. Петров Б.Н., Рутковский В.Ю., Земляков С.Д. Адаптивное координатно-параметрическое управление. М.: Наука.1980.
42. Рапопорт А.Н. Автоматные модели поисковой оптимизации и управления. Монография. -Киров: Изд-во ВятГУ. -1999,132 с.
43. Смирнов В.М., Яковлев В.Н. Физиология центральной нервной системы: Учеб. пособие для студ. Высш. Учеб. Заведений. М.: Издательский центр «Академия», 2002. - 352 с.
44. Судаков К.В. Физиология, основы и функциональные системы: Курс лекций. М.: Медицина, 2000. - 784с.
45. Цетлин М.Л. Исследования по теории автоматов и моделированию биологических систем. М.: Наука, 1969.
46. Шеннон К. Работы по теории информации и кибернетике. М.: Издательство иностранной литературы, 1963.
-
Похожие работы
- Исследование и разработка математического и алгоритмического обеспечения систем управления энергетическими комплексами с нетрадиционными возобновляемыми источниками энергии на базе нечеткой логики
- Применение нечетких лингвистических регуляторов для управления сложными динамическими объектами
- Разработка системы управления мобильных роботов с использованием нечетких моделей
- Разработка моделей и методов нечеткого логического вывода для управления производственными объектами в условиях априорной неопределенности
- Разработка и исследование методов синтеза адаптивных регуляторов на основе нейро-нечетких сетевых структур
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность