автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Применение генетических алгоритмов в системах Автономного Адаптивного Управления
Автореферат диссертации по теме "Применение генетических алгоритмов в системах Автономного Адаптивного Управления"
Институт Системного Программирования Российской Академии Наук
На правах рукописи
Земских Леонид Вячеславович
Применение генетических алгоритмов в системах Автономного Адаптивного Управления
Специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва-2004
Работа выполнена в Институте Системного Программирования Российской Академии Наук.
Научный руководитель:
доктор физико-математических наук, Жданов Александр Аркадьевич
Официальные оппоненты:
доктор физико-математических наук Зникевич Станислав Леонидович
кандидат физико-математических наук Гайсарян Сергей Суренович
Ведущая организация:
Институт Оптико-Нейронных Технологий Российской Академии Наук
Защита диссертации состоится «/В» СЫ-ОКЛ 2004 года в часов на заседании
диссертационного совета Д 002.087.01 в Институте Системного Программирования Российской Академии Наук по адресу: 109004, Москва, ул. Большая Коммунистическая, д.25.
С диссертацией можно ознакомиться в библиотеке Института Системного Программирования РАН.
Авторефератразослан « 2004 г.
Ученый секретарь Диссертационного совета
СП. Прохоров
Общая характеристика работы
Актуальность темы
Автоматические и автоматизированные устройства получают все большее распространение во всех сферах человеческой деятельности — от бытовой техники до сложных систем управления производственными процессами. Традиционно системы управления для автоматических и автоматизированных устройств конструировались на основе математических моделей объектов управления. Однако в последние годы все более широкое распространение получают системы управления, основанные на работе со знаниями, которые позволяют избежать разработки точных математических моделей объектов управления. К системам такого рода относятся экспертные системы, искусственные нейронные сети, системы с подкрепляющим обучением, системы на основе нечеткой логики, и т.п. К этой области относится также метод автономного адаптивного управления (ЛАУ), развиваемый в отделе имитационных систем Института Системного Программирования РАН.
Методология ААУ позволяет создавать адаптивные системы управления для приложений, в которых создание точных математических моделей объекта управления затруднено или невозможно. Используя входящие в состав системы ААУ подсистемы (блоки датчиков и исполнительных органов, систему формирования и распознавания образов, базу знаний, систему моделирования эмоций, блок принятия решений), система ААУ накапливает эмпирически найденные знания о свойствах объекта управления и находит способ управления последним. Подсистемы организованы в структуру, общую для всех систем ААУ. Подсистемы могут быть реализованы на основе различных подходов, в том числе и на основе сетей нейроноподобных элементов. В настоящее время проблемы, связанные с нейросетевым вариантом реализации систем ААУ, являются актуальными для дальнейшего развития метода. В частности, при проектировании прикладных систем ААУ на основе сетей нейроноподобных элементов возникают задачи .подбора параметров нейроноподобных элементов, проектирования топологий их сетей и задача оптимизации полученных конструкций.
Одной из основных проблем, связанных с методологией ААУ, являлось отсутствие четких рекомендаций по синтезу и оптимизации параметров систем управления, разрабатываемых для конкретных прикладных задач. Наличие методики синтеза и оптимизации систем ААУ позволит получать более эффективные системы управления.
Настоящая диссертационная работа посвящена разработке методов синтеза систем автономного адаптивного управления (ААУ) на основе сетей нейроноподобных элементов с помощью применения генетических алгоритмов (ГА).
Аналитическое решение задачи подбора оптимальных параметров систем ААУ в настоящее время не получено, поэтому предлагаемое решение задачи путем применения генетических алгоритмов - активно развивающегося в настоящее время метода оптимизации -является актуальным.
Предложенные в работе методы синтеза могут быть использованы при построении систем ААУ для широкого класса практических приложений.
Цель работы
Целью диссертационной работы является разработка методов синтеза и оптимизации систем ААУ на основе применения генетических алгоритмов.
Для достижения поставленной цели необходимо было решить следующие задачи:
1. формализовать задачу оптимизации с помощью ГА систем ААУ в целом и их отдельных
функциональных подсистем; рос НАЦИОНАЛЬНАЯ
БИБЛИОТЕКА
3 С.Пс»пв»г 1лЬ
РОС НАЦИОНАЛЬНАЯ БИБЛИОТЕКА
2. разработать процедуру автоматической оптимизации блоков датчиков и исполнителей системы ААУ;
3. разработать процедуру автоматической оптимизации топологии сетей нейроноподобяых элементов, на базе которых формируются подсистемы системы ААУ;
4. показать эффективность предложенных подходов и алгоритмов на примерах прототипов прикладных систем ААУ.
Научная новизна
Научная новизна диссертационной работы состоит в том, что для нового вида систем автономного адаптивного управления, имеющих такие практически ценные свойства, как самообучаемость, управление и обучение в одном процессе, многокритериальность управления, независимость от наличия математической модели объекта управления, впервые предложен и обоснован способ автоматического построения и оптимизации их основных функциональных подсистем вместо применявшегося ранее эвристического неавтоматизированного способа построения таких систем. А именно:
- введено формальное описание подсистем управляющей системы (блоки датчиков и актуаторов), сформулирована в общем виде задача оптимизации их параметров и предложены способы построения генетических алгоритмов для ее решения;
- на основании введенного формального описания разработан генетический алгоритм решения задачи подбора параметров блока датчиков и актуаторов для примера прикладной системы адаптивного управления автономного мобильного робота;
- предложен способ формального описания строения сети нейроноподобных элементов подсистемы формирования и распознавания образов системы ААУ;
- на основе предложенного формального описания разработана новая процедура динамического формирования сети нейроноподобных элементов подсистемы формирования и распознавания образов, а также сформулирована в общем виде задача оптимизации параметров данной процедуры динамического формирования нейроноподобной сети;
- для систем ААУ впервые разработан генетический алгоритм решения задачи оптимизации параметров процедуры динамического формирования сети нейроноподобных элементов подсистемы формирования и распознавания образов, общая схема которого не зависит от специфики прикладной задачи. Способ практического решения такой задачи был рассмотрен на примере автономного мобильного робота.
Практическая ценность
Практическая ценность результатов работы состоит в том, что разработанная методика может существенно облегчить процесс создания прикладных систем на основе метода ААУ. Результаты данной работы планируется применять в разрабатываемой в ИСП РАН системе автоматического проектирования прикладных систем ААУ, а также в прикладных системах, которые будут разрабатываться на основе методологии ААУ.
Апробация работы и публикации
По материалам диссертации опубликованы работы [1-5].
Основные положения работы докладывались на следующих конференциях и семинарах:
• The 5th World Multiconference on Systemics, Cybernetics and Informatics (SCI 2001) and the 7th International Conference on Information Systems Analysis and Synthesis (ISAS 2001),
• XXV академических чтениях по космонавтике,
• IEEEAIS'03CAD-2003,
• семинаре «Экобионика» МГТУ им. Н.Э. Баумана. Структура и объем диссертации
Работа состоит из введения, четырех глав, заключения, и списка литературы. Общий объем диссертации составляет 122 страницы. Список литературы содержит 35 наименований.
Краткое содержание работы
Во введении представлен обзор работ по современным подходам к построению адаптивных систем управления, обзор работ по эволюционной оптимизации в области создания систем искусственного интеллекта, изложены основные положения методологии автономного адаптивного управления (ААУ), приведены основные положения, относящиеся к теории генетических алгоритмов (ГА), а также описаны проблемные области методологии ААУ и обосновано применения ГА, как метода решения задач в этих областях.
Системы ААУ относятся к классу нейроноподобных систем управления и состоят из нескольких функциональных подсистем: блока датчиков, системы формирования и распознавания образов, базы знаний и системы ее формирования, системы качественного оценивания, системы принятия решения и блока исполнительных органов (актуаторов). Все подсистемы могут быть реализованы на основе сетей специальных нейроноподобных элементов. Сегодня одной из основных проблем в рамках методологии ААУ является отсутствие формализованной методики синтеза систем управления для прикладных задач. При синтезе прикладных систем ААУ используются эвристические соображения, анализ априорной информации и/или метод проб и ошибок. Синтез системы ААУ представляет собой задачу большой размерности, решить которую аналитически на данном этапе не удается, поэтому задачу синтеза необходимо решать методом направленного поиска. Одним из наиболее перспективных направлений, реализующим метод подбора параметров, являются генетические алгоритмы.
Предложить критерий эффективности для оптимизации каждой отдельной подсистемы системы ААУ трудно, поскольку все подсистемы влияют друг на друга. Конечным критерием качества каждой подсистемы должна являться оценка качества работы всей системы в целом. Меньше всего степепей свободы имеют связанные с техническими устройствами блоки датчиков и исполнителей, поэтому в целом объект управления можно разделить на две части -блок датчиков и исполнителей, и собственно систему управления, и оптимизировать их отдельно, используя при этом общесистемный критерий качества. Задачу синтеза систем ААУ предлагается рассматривать как задачу, состоящую из двух подзадач:
- задачи подбора оптимальных параметров блока датчиков и блока исполнительных органов (привода или актуаторов) в комплексе, и
- задачи подбора оптимальных параметров подсистем, входящих в состав непосредственно системы управления (подсистем формирования и распознавания образов, базы знаний, системы принятия решений).
В 1-й главе рассмотрена постановка в общем виде задачи подбора оптимальных параметров блока датчиков и блока актуаторов, предложены рекомендации по построению ГА для ее решения и рассмотрен пример такого решения для модели автономного мобильного робота. Глава состоит из трех разделов.
В первом разделе приводится формальное описание понятий, используемых для описания системы датчиков и актуаторов (исполнительных органов), а также некоторые другие, необходимые для постановки задачи оптимизации.
Блок датчиков и блок актуаторов рассматриваются как интерфейсная система, осуществляющая отображение наблюдаемых датчиками явлений в двоичные векторы, являющиеся входными для системы управления, а также осуществляющая некоторые воздействия на среду со стороны объекта управления посредством актуаторов. К такой системе выдвигаются требования по наблюдаемости и управляемости. При построении прикладных систем, во многих случаях типы и состав датчиков и актуаторов заранее известен, однако значения некоторых их параметров нуждаются в определении. В этом разделе предлагается формальное описание блока датчиков и актуаторов, вводится функция оценки сочетания параметров, определяющих датчики и актуаторы, и приводится общий вид постановки задачи оптимизации. Приведем основные понятия и определения данного раздела.
Пусть состояние системы «среда + объект управления» характеризуется элементом множества наблюдения X. Элементы х этого множества поступают на входы датчиков и вызывают формирование ими двоичных векторов tj(x). Такой вектор является входным вектором для системы управления. После его обработки, система управления может выдать одну из предопределенных команд из множества 0, после совершения которой, датчики получат на свои входы новый элемент их множества X, и сформируют новый входной вектор г],. В зависимости от конфигурации датчиков и актуаторов, датчики могут формировать различные векторы г) для одних и тех же х, а результат выполнения команды зависит от конфигурации актуаторов, так как они определяют взаимодействие объекта управления и среды. Эксперт может оценить последствия того или иного действия 0t е® при формировании
датчиками определенного входного вектора Эти требования можно выразить в виде таблицы штрафов, в которой столбцы соответствует множеству событий-результатов, а строки действиям вк б 0 . Для одного и того же х значением штрафной функции будем считать
Д = •гдс <Р> - штраф, полученный при совершении действия вк , т.е. для одного и того же
х поочередно совершаются все действия из &, а полученные штрафы суммируются.
Пусть Y есть множество всех возможных сочетаний параметров, однозначно определяющих датчики и акгуаторы, тогда каждый элемент этого множества соответствует некоторой реализации такой системы. Оценкой системы, определяемой элементом yeY,
будем считать , при Так как зависит от у неявным
образом, то также неявно зависит от
При такой формализации, можно говорить о постановке задачи оптимизации в форме:
(D
Постановка задачи (1) подразумевает замену интеграла на суммы в случае, когда некоторые компоненты х дискретны. Так как определение аналитического вида интеграла в (4) затруднительно, а процесс вычисления значения обладает большой вычислительной
емкостью, то предлагается вычислять его значение вероятностным способом, используя интегрирования по методу Монте-Карло с использованием псевдослучайных сеток Соболя.
Во втором разделе приводятся рекомендации по проектированию генетического алгоритма решения задачи (1). Фенотипом считается система, определяемая набором параметров У^У- Генотипом считается закодированное представление у, а
приспособленностью считается значение интеграла в (1). В разделе также приведены рекомендации по построению генетических операторов.
В третьем разделе предложенная в работе постановка задачи в виде (1) продемонстрирована на примере постановки и решения задачи оптимизации блока датчиков и блока актуаторов программной модели автономного мобильного робота, имеющего целевую функцию - выработка стереотипов поведения при обходе стандартных случайно расставленных препятствий. Мобильный робот имеет конструкцию, представленную на рис. 1, которая определяется тремя параметрами: скоростью движения V, радиусом поворота р, и углом раскрытия центрального датчика. В работе сформулированы ограничения на значения этих параметров, задающие множество У Робот имеет «=7 датчиков и может совершать т=6 действий. В модели все расстояния измеряются в условных масштабных единицах, система функционирует в потактовом режиме. Продолжительность каждого такта принята за Д/ и не изменяется. Радиус корпуса г =10 фиксирован.
Для решения поставленной, задачи на основе предложенных рекомендаций был разработан ГА. Фенотипом является объект, реализующий конструкцию и функционал движения робота. Генотип состоял из трех хромосом, соответствовавших закодированному представлению свободных параметров р, V и Ц. Значением приспособленности является значение интеграла в (1).
Точки в пространстве Г были представлены как 3-компонентные векторы. Оператор скрещивания (кроссинговер) определен как двуместный оператор С(у1,уз)'.
у = ССу,,>2) = у, + (.У2 |1 где с - случайная переменная, равномерно
распределенная на отрезке [0,1]. Оператор С(у1,у2) применялся к одним и тем же значениям и до тех пор, пока не удовлетворялось условие попадания точки в множество У.
Рис. 1. Схема устройства автономного мобильного робота. Т1-Т4- тактильные датчики, - секторы обзора визуальных датчиков Оператор мутации реализован как одноместный оператор М(у):
где с - случайная переменная, равномерно
У> €СЛи С > Руущ
распределенная на отрезке [0,1], Р^ - вероятность мутации, а у1^Ы{у1,ст(), где а, вычисляются как:
у = Щу) =
Отбор индивидов для воспроизводства производился по принципу рулетки с автоматическим перенесением индивида с лучшей приспособленностью в следующее поколение (элитизм)
Для решения задачи оптимизации использовалась популяция из 100 индивидов. Значение функции приспособленности каждого индивида вычислялось по 5-Ю4 точек интегрирования. Последний параметр генетического алгоритма - вероятность мутации Р„у„, -был определен как Ря)т'=0,05. Критерием останова алгоритма являлось число итераций N=500. В ходе численных экспериментов разработанный по предложенной схеме генетический алгоритм продемонстрировал свойства сходимости и устойчивости. В результате применения разработанной методики оптимизации были получены оптимальные значения параметров датчиков и актуаторов для случая с ограничением скорости т>0=35 и радиусом корпуса робота 1=10 (Рис. 3). Значения получены в единицах размерности модели.
Рис. 3. Оптимальные параметры датчиков и актуаторов, найденные в результате решения задачи оптимизации датчиков и актуаторов па примере мобильного робота.
Во 2-й главе представлен формализм для описания топологии сетей нейроноподобных элементов подсистемы формирования и распознавания образов системы ААУ, а также представлена процедура динамического формирования такой сети в рамках введенного формализма.
В первом разделе представлены основания к созданию процедуры динамического формирования сетей нейроноподобных элементов в системах ААУ.
Во втором разделе описаны вопросы размерности задач распознавания и управления в рамках методологии ААУ.
В третьем разделе представлено формальное описание состава, строения и работы подсистемы формирования и распознавания образов (ФРО). Приведем основные определения и положения данного раздела.
Подсистема ФРО строится на основе нейроноподобных элементов, разработанных в рамках методологии ААУ. Сети таких нейроноподобных элементов отличаются от традиционных искусственных нейронных сетей. В частности, в методологии ААУ принято, что нейроноподобные элементы имеют два режима функционирования (обучение и распознавание), а связи между ними не обладают весом. В этом разделе предлагается формальное описание способа организации нейроноподобных элементов в сети, и демонстрируются свойства таких сетей.
Все датчики в системе снабжены двумя полюсами, на один из которых подается сигнал в случае срабатывания датчика, а на другой - в противном случае. Все нейроноподобные
• К=34,90
• р= 22,57
• ¿2 = 0,7052
Р -
• Ц- Х?=0,7434
• Лг= 44,90
• Лг^Г 41,52
элементы в сети обладают одинаковым набором и значениями параметров. В обученном режиме (режиме распознавания) выходной сигнал нейроноподобного элемента равен единице только в случае, если он получил единичные сигналы по всем входящим связям. В противном случае выходной сигнал равен 0.
Определение 1. Структурой связей i нейроноподобного элемента к датчикам будем называть такую организацию связей от полюсов датчиков к нейроноподобному элементу, при которой, при наличии на датчиках выходного вектора все связи берут начало на полюсах, выдающих единичный сигнал, и оканчиваются на входе нейроноподобного элемента.
Определение 2. Будем говорить, что нейроноподобный элемент находится в слое К (К>1) и имеет тип i, если его структура связей с датчиками имеет номер i, и, кроме того, нейроноподобный элемент имеет дополнительную (и только одну) входящую связь от нейроноподобного элемента, находящегося в слое К-1. Нейроноподобный элемент слоя 1 типа i имеет только N0 входящих связей от полюсов датчиков, структура которых имеет номер i.
Приведенные определения задают правила построения сети системы ФРО. Сети нейроноподобных элементов построенные способом, приведенным в определениях 1 и 2, обладают рядом свойств, описанных в этом разделе.
Каждый нейроноподобный элемент в сети ФРО соответствует уникальной последовательности входных векторов. Конкретный вид такой последовательности определяется способом соединения нейроноподобных элементов от слоя к слою. Срабатывание элемента в слое К означает распознавание последовательности из К входных векторов. При этом в этот же момент времени в каждом слое от 1-ю до К-го активен в точности один нейроноподобный элемент.
Утверждение 1. Описанный в Определении 2 способ соединения нейроноподобных элементов достаточен для построения системы распознавания, способной распознать любой наперед заданный конечный набор конечных последовательностей, существующих в потоке входных векторов.
Утверждение 2. Для любой сети нейроноподобных элементов, не содержащей циклов, построенной в рамках методологии ААУ, можно построить аналогичную по функциональности сеть с топологией, организуемой согласно Определению 2.
Пусть оператор L определен на множестве конечных последовательностей входных векторов длины больше, чем 1. Оператор L ставит в соответствие последовательности rj последовательность , получаемую из удалением ее последнего члена.
Определение 3. Расширением над множеством Д несовпадающих последовательностей входных векторов будем называть множество Л', содержащее в себе все элементы из А, а также для каждой последовательности г} е Д длиной больше 1, все последовательности, получаемые из rj последовательным применением оператора L: Lrj,l}rj,...,l!'1if, где / — длина последовательности , при этом, если соответствуют
одному и тому же элементу в
В работе показано, что сеть нейроноподобных элементов, сформированная согласно определениям 1 и 2 для распознавания конечного набора Д конечных последовательностей в точности распознает множество А'
Под состоянием входов системы будем понимать наличие на ее входах определенного вектора ij„
Определение 4. Графом переходов состояний входов системы будем называть ориентированный граф //,, узлами которого являются состояния входов системы, а ребрами -разрешенные переходы между состояниями, допускающие переходы состояний в себя (петли).
Граф Ц задается матрицей смежности G, элементами которой являются 0 и 1. Наличие 1 в строке 1 и столбце} означает, что допускается переход из состояния г\1 в состояние ц^, а наличие 0 запрещает такой переход. Граф Д фиксируется на этапе синтеза системы и не изменяется в процессе ее функционирования. Он отражает представления исследователя о допустимых сменах одних входных векторов другими.
В четвертом разделе приводится алгоритм динамического формирования сети нейроноподобных элементов, который состоит в следующем.
Пусть в начале функционирования системы ААУ задана некоторая матрица смежности G. В начале функционирования, сеть нейроноподобных элементов системы ФРО состоит только из элементов первого слоя. В последствии в сеть добавляются элементы в слои с более высокими номерами. Пусть в некоторый момент времени t от датчиков поступил входной сигнал . Он обрабатывается сетью, после чего выявляется множество сработавших нейроноподобных элементов. По принципам построения сети, все сработавшие нейроноподобные элементы будут иметь тип 1. Для каждого из сработавших элементов определяется наличие исходящих связей. Для всех элементов, не имеющих исходящих связей, формируются новые, расположенные в следующем за ними слое. Пусть сработавший элемент без исходящих связей находится в слое К и имеет тип 1. В слое К+1 размещается столько новых нейроноподобных элементов, сколько единиц находится в 1-й строке матрицы смежности О. Тип подключения к датчикам для каждого нового элемента определяется номером столбца соответствующей ему единицы в ¡-й строке матрицы G. Дополнительная входящая связь организуется от рассматриваемого элемента в слое К. При таком алгоритме матрица G определяет правила динамического формирования сети. Приведем основные определения и утверждения, демонстрирующие свойства сети системы ФРО, получаемой по данному алгоритму формирования.
Пусть оператор определен на всех последовательностях , длина которых
больше 1, и ставит в соответствие последовательности ^еД последовательность, получаемую из удалением первого ее элемента.
Определение 5. Расширением с предысториеймножества Л будем называть множество Д*, получаемое из Л по следующим правилам. Каждой последовательности г}е Д поставим в соответствие набор последовательностей, получаемый последовательным применением оператора Ь , аименно Ьт}, 1}г},...,1}~>г}. Сформируем множество Д0 присоединением к Д всех таких наборов. Множество Д* есть расширение множества Д0, т.е. Д* = Д^.
Утверждение 3. Для некоторого множества Д последовательностей входных векторов, сеть нейроноподобных элементов, создаваемая в результате работы алгоритма динамического формирования, имеющего в качестве правил формирования сети матрицу О, получаемую по Д, способна распознавать все элементы множества расширения с предысторией
В пятом разделе представлен способ реализации блока база знаний (БЗ) и принятия решений на основе вероятностного подхода. Каждому нейроноподобному элементу существующему, или размещаемому в системе ФРО в системе БЗ соответствует вектор-столбец размерности т (по числу возможных действий). В совокупности такие столбцы образуют
матрицу Г, для которой требуется выполнение свойства У/ =1. Элементы матрицы Г являются вероятностями выбора действия номер 1 при распознавании системой образа номер
Если в некоторый момент времени / в системе распознано д образов, то, согласно свойствам системы ФРО, все они будут соответствовать нейроноподобным элементам, лежащим в слоях с 1-го по д-й. по одному в слое. Для принятия решения используется столбец матрицы, соответствующий нейроноподобному элементу д-го слоя.
Процесс обучения в такой БЗ реализован по следующим правилам. Пусть в момент времени было распознано д образов, и оценка состояния системы была 8(1-1), было принято решение совершить действие в,, ив момент времени t система имеет оценку состояния
Для коррекции вероятностей выбора действий для опорного столбца матрицы Г рассчитывается
максимально возможная оценка
величина их изменения
состояния системы, ^щя - минимальная, и а - коэффициент изменения вероятности (0<а<1). Новые значения вероятностей опорного столбца матрицы Г определяются по формуле
Р'1" -где Д/> есть вектор размерности т, все компоненты которого равны 0 за
исключением ¡0-й, которая равна Д^ = Ду^Р,1*.
Предложенный во 2-й главе формализм описания архитектуры сети нейроноподобных элементов системы формирования и распознавания образов, построенная на его основе процедура динамического формирования таких сетей, а также механизм формирования базы знаний и принятия решений позволяют поставить в общем виде задачу оптимизации параметров подсистем управляющей системы ААУ.
В 3-й главе в общем виде представлена схема постановки задачи оптимизации для подбора правил формирования сети нейроноподобных элементов системы формирования и распознавания образов, рекомендации по построению генетического алгоритма ее решения, а также постановка и решение такой задачи на примере автономного мобильного робота. Глава состоит из двух разделов.
Первый раздел посвящен постановке задачи оптимизации по подбору правил формирования сети нейроноподобных элементов по алгоритму, предложенному во второй главе. Постановка такой задачи подразумевает, что для объекта управления, для которого осуществляется подбор указанных правил, решена задача оптимизации параметров блока датчиков и актуаторов.
В разделе предложен критерий оценки систем управления, использующих в качестве правил формирования сети нейроноподобных элементов системы ФРО матрицы смежности О. Такие оценки строятся в результате наблюдений серии экспериментов по функционированию системы с одой и той же матрицей О. Приведем основные определения и понятия этого раздела.
Определение 6. Средней оценкой за последние МСредн тактов будем называть число
1
м.
- оценка состояния системы в момент времени /.
среди
Определение
7. Оценкой эффективности по одному эксперименту системы ААУ будем 1 Г--'
называть число
Тамт М
обладает матрицей переходов О.
при условии, что и система ААУ
Определение 8. Оценкой £(С) эффективности системы ААУ в среднем будем называть математическое ожидание оценки ^(б) эффективности по одному эксперименту:
Величина £,(0) также обладает дисперсией <Т2(0) = 0£г((Г).
При проведении серии из N экспериментов выборочными оценками для ¿¡{(т) И ^(р), будут являться соответственно
(3)
Определение 9. Для двух систем ААУ, начальные конфигурации которых совпадают во всем, кроме матриц смежности 01 и Ц будем говорить, что система ААУ с матрицей 01 лучше, чем система ААУ с матрицей есл и % ((5,) > £ ), и что системы эквивалентны в случае
если
Для подбора матрицы G была сформулирована следующая постановка задачи оптимизации:
(4)
где
уО
- множество всех матриц О. При наличии некоторой априорной информации о свойствах среды и/или объекта управления, эксперт может наложить ограничения на вид матрицы смежности G, выделяя тем самым во множестве подмножество допустимых матриц
смежности.
Представленная в работе постановка задачи оптимизации решается с помощью генетических алгоритмов. Приведем основные рекомендации по построению такого ГА.
В качестве фенотипа рассматривался объект управления, оснащенный системой ААУ, имеющей в качестве правил динамического формирования сети нейроноподобных элементов матрицу G из множества . Генотипом является матрица смежности G (определяющая правила формирования сети), значением приспособленности индивида является выборочная оценка £((/). Общая схема выполнения ГА совпадает со схемой, приведенной во 2-й главе. Способ формирования родительских пар остается неизменным. Генетические операторы для предлагаемого способа построения ГА имеют следующие особенности.
Оператор скрещивания (кроссинговер) С(ад):Г„0хУ„с.
двухместных
оператор
> У„ , определенный на множестве матриц для двух матриц G1 и G2 и
представляющий собой разновидность равномерного кроссинговера.
д=ф„с}),
g^,ecяug¡|=gl
г), еслиg\ ф g¡¡ исг|
g¡,eaшgl*g¡uc<^
гДе Я()> - элементы матриц С, О1 и С2 соответственно, а с - равномерно распределенная
на отрезке [0,1] случайная переменная, значение которой определяется для каждого сочетания индексов г и
Оператор мутации является одноместным оператором, определенным на множестве матриц Уц0 (в случае отсутствия ограничения на вид матриц О, совпадает с Формально [ способом: , при этом
он определяется следующим <
Л/(с)=
в,если^>Риут б, если с, <
(6)
где с1 - случайная переменная, равномерно распределенная на отрезке [0,1]. Матрица
Так же как и для оператора кроссинговера, конкретная реализация оператора мутации может зависеть от специфики прикладной задачи. В качестве простейшего оператора рассмотрим следующий." В случае, если в (6) С1<Рмут, то элементы матрицы С? определяются следующим способом:
(7)
где С2 - случайная переменная, равномерно распределенная на отрезке [0, 1], - элементы матрицы О, а Р^« 1 - вероятность изменения элементов матрицы. Изменение значения элемента допускается, если новое значение матрицы не выводит ее из множества
Для того, чтобы определить критерий останова генетического алгоритма, необходимо ввести следующие определения.
Определение 10. Расстоянием между матрицами О1 и О2 будем считать расстояние по Хеммингу />с(<7,,(72), равное количеству несовпадающих по значениям элементов матриц 01 и
Определение 11. Если размер популяции равен -Млз, а матрица, имеющая наибольшее значение функции приспособленности, имеет номер /о, то алгоритм считается завершенным, если V/ £ И Л , где А - целое положительное число.
Во втором разделе главы рассмотрен пример постановки и решения задачи оптимизации параметров процедуры динамического формирования сети нейроноподобных элементов управляющей системы автономного мобильного робота. Автономный мобильный робот имеет устройство, описанное в 1-й главе, и конфигурацию блока датчиков и актуаторов, полученную в результате решения поставленной в той же главе задачи оптимизации.
Так как в данном примере имеется всего 7 датчиков, то система распознавания способна распознавать всего 27= 128 входных сигналов. Таким образом, для рассмотренного примера матрица смежности О графа И1 перехода состояний входов системы имела размерность 128x128. В рассмотренном примере использовались эвристические соображения относительно одних входных векторов другими. Предложенные соображения позволили определить подмножество поиска
Для решения задачи оптимизации на основе предложенной схемы для данного примера был разработан проблемно-ориентированный генетический алгоритм. Для измерения значения приспособленности, соответствующего индивиду с генотипом, соответствующим матрице О, проводилась серия экспериментов, в которой использовался прямоугольный лабиринт, размером 640x505 (единиц масштаба), содержащий 12 препятствий размером 35x35 (единиц масштаба). Препятствия располагались регулярно на расстоянии не менее 100 (единиц масштаба) друг от друга, образовывая ряды. Для снятия характеристики были
установлены следующие параметры единичного эксперимента: Т„ф«,=10000 тактов, Такт ~2000 тактов, размер окна усреднения Мсрсд,,—600 тактов. В системе ФРО разрешалось разместить 1000 нейроноподобных элементов, а для каждого элемента был установлен статистический порог М=\0. Характеристика £((?) вычислялась по серии из JV=10 экспериментов. Перед началом каждого эксперимента все параметры системы ААУ робота приводятся в исходное состояние, а сам робот случайным образом размещается в лабиринте. Генотип представлял собой матрицу смежности С, с расширенным алфавитом символов. Для элемента (правила) матрицы О', символы алфавита имели следующий смысл. '0' - запрещает переход из состояния г в состояние у, 'Г - разрешает переход из состояния I в состояние у и означает, что такой переход был разрешен, но не использован в сети, '2' - разрешает переход из состояния / в состояние./ и обозначает, что такой переход был использован и нейроноподобный элемент типа ] обучился, '3' — запрещает переход из состояния / в состояние/ и означает, что такое правило было опробовано, однако нейроноподобный элемент типа ] не обучился. Для функционирования робота использовалась матрица О, элементами которой являлись '0' и 'Г, получаемая из О', заменой символов *2' и '3' на 'Г и '0* соответственно. После каждого эксперимента сформированная сеть нейроноподобных элементов анализировалась на предмет использования правил перехода Соответствующая информация вносилась в генотип, путем замены соответствующих символов в генотипе по специальным правилам кодирования.
Генетические операторы были построены следующим способом. Для двух матриц б,' и О'2 оператор кроссинговера С^рб^) определяется следующим способом. Примем за основу схему построения оператора кроссинговера (5), но с некоторыми изменениями. Зафиксируем значение с0 равномерно распределенной на отрезке [0,1] случайной переменной с. Тогда элементы ^ матрицы потомка б будут определяться согласно следующим правилам. Если В противном случае рассматривается значение равномерно распределенной на отрезке [0,1] случайной переменной с, в соответствии с которым значения ¡¡^ определяются по Табл.2.
Табл 2. Правила преобразования генов при кроссинговере.
■ г'1 т. , 1 » - " •»
0 0 1 или 2 С<Со
1 или 2 0 С>Со
1 1 0 С<Со
0 1 С>С0
2 3 любое
3 2
2 2 0 С<Со
0 2 С>Со
— -XV-..: ' ' \ 1 С"*
2 1 любое
1 2
3 0 или 1 3 любое
3 0 или 1
Оператор мутации для матрицы индивида с геномом G' построен следующим способом. За основу принято определение оператора мутации выражаемое соотношениями (6) и (7) В схему замены элементов (7) внесены изменения, представленные в виде правил, указанных в Табл 6
Табл 6 Правила изменения генов в операторе мутации
Iе ~ " ' ; '"¿ас-
Любое
1 ОилиЗ
0 1 или 2
Для создания стартовой популяции была использована следующая стратегия. В позициях матриц смежности G, соответствующих допустимым переходам, с вероятностью Preн размещались символы '1', иначе позиция содержала символ '0'. В работе показано, что математическое ожидание единичных элементов в матрице, которая потенциально может
содержать К единиц есть Ря„ К. Для рассмотренного примера К = 1357 и
Для вычислений на персональном компьютере была использована популяция, состоящая из N¡,„0=20 индивидов, приспособленность каждого из которых вычисляется по серии из N=10 экспериментов. Каждый эксперимент занимал 1,5x104 тактов работы системы. Критерием сходимости алгоритма была принята локализация множества матриц G индивидов в шаре радиуса А=5 в смысле расстояния по Хеммингу {Определения 10 и 11). По результатам применения алгоритма сделан вывод о том, что предложенная методика оптимизации и проектирования генетических алгоритмов работоспособна и приводит к созданию более удачных (согласно введенным критериям) систем Предложенный ГА обладает сходимостью и способностью локализовывать популяцию в районе экстремума.
В 4-й главе представлены результаты исследований возможности применения генетических алгоритмов для оптимизации подсистемы «База Знаний» (БЗ) систем ААУ. Рассмотрены как методы оптимизации структуры базы знаний, так и возможности по применению генетических алгоритмов в процессе управления. Предложенные методы были опробованы на примерах системы ААУ «Пилот», предназначенной для адаптивного управления угловым движением комического аппарата, и системы ААУ автономного мобильного робота.
В системе ААУ «Пилот» блок базы знаний представляет собой двумерную таблицу, столбцы которой соответствуют заранее зафиксированным образам, распознаваемым системой формирования и распознавания образов (ФРО), а строки соответствуют действиям, которые могут выполнить актуаторы В клетках таблицы фиксируются статистически достоверные сведения о том, какую оценку состояния получает система при условии распознавания конкретного образа и совершения конкретного действия В процессе управления используются только те команды, которые приводят к лучшей из возможных оценок. Большая часть
650 '1357'
эмпирически найденной таблицы оказывается неиспользуемой. Требовалось построить процедуру распределения ресурсов базы знаний таким способом, чтобы база знаний реализовывалась как можно меньшим числом элементов. Для решения этой проблемы были предложены два подхода, основанные на применении генетических алгоритмов.
Первый подход состоял в соотнесении с каждым образом отдельного генетического алгоритма, каждый шаг которого активировался при распознавании системой ФРО соответствующего образа. Оптимизация производилась в процессе функционирования системы. Индивидами являлись точки на отрезке [0, 41]. При попадании точки в интервал (/ —1,|], / = 1,41, считается, что она соответствует команде номер 1. Значением приспособленности считалось значение оценки результата совершения соответствующей команды. В результате эволюции всех генетических алгоритмов получалась конфигурация базы знаний, в которой образом соответствовало множество команд, выполнение которых при распознавании соответствующего образа приводило к переходу системы в состояние с хорошей оценкой.
Второй подход состоял в построении генетического алгоритма над множеством систем управления, генотипом которых являлись фиксированные законы управления. При таком законе управления исполняемые команды были заранее определены — по одной на каждый возможный образ в системе. Оценка приспособленности принималась как средняя оценка состояния системы за некоторый фиксированный период функционирования. Решением задачи оптимизации считалось объединение всех законов управления, оценки приспособленности которых незначительно отличались от лучшей.
Интересным следствием применения первого подхода к оптимизации структуры базы знаний явилась возможность применения такого подхода в процессе управления. В этом случае способность генетического алгоритма находить команды, приводящие к переходу системы в состояние с хорошей оценкой, а также свойство генерации индивидов в результате мутаций, в совокупности соответствуют целевым функциям систем ААУ — выживание и накопление знаний.
Во всех рассмотренных примерах, в генетических алгоритмах процедура отбора в пары для воспроизводства была реализована по 2-туровому алгоритму отбора с запрещением саморепродукции. Результаты, касающиеся оптимизации структуры базы знаний, вместе с результатами оптимизации блока датчиков, исполнителей и распознающей системы, изложенными в главах 1-3, составляют оптимизацию всей системы ААУ в целом.
Основные результаты работы
В целом в диссертационной работе представлен найденный, обоснованный и разработанный подход к построению и оптимизации прикладных систем автономного адаптивного управления с помощью генетических алгоритмов, что решает проблему синтеза таких систем в условиях недостаточной априорной информации. Система, состоящая из управляющей системы, объекта управления и среды, оптимизируется по основным подсистемам с использованием общесистемных качественных критериев. Именно, получены следующие основные результаты
1. Введен формализм описания блока датчиков и актуаторов систем ААУ, предложена процедура количественного оценивания согласованности их параметров; сформулирована в общем виде задача оптимизации таких параметров, предложены рекомендации по построению генетических алгоритмов для ее решения;
2. На основании введенного формализма и постановки задачи оптимизации был разработан генетический алгоритм подбора параметров блока датчиков и актуаторов на примере
практического приложения - системы автономного адаптивного управления мобильного робота;
3. Введен формализм описания строения сети нейроноподобных элементов подсистемы формирования и распознавания образов;
4. На основе предложенного формализма разработана процедура динамического формирования, сети нейроноподобных элементов подсистемы формирования и распознавания образов, а также сформулирована в общем виде задача оптимизации ее параметров;
5. Был разработан генетический алгоритм решения задачи оптимизации параметров процедуры динамического формирования сети нейроноподобных элементов подсистемы формирования и распознавания образов, общая схема которого не зависит от специфики прикладной задачи. Практическое решение такой задачи было рассмотрено на практическом примере.
Публикации
1. Zhdanov A.A., L.V. Zemskikh, The Evolutionary Growth of Neural Networks for the Autonomous Adaptive Control System. // The 5th World Multiconference on Systemics, Cybernetics and Informatics (SCI 2001) and the 7th International Conference on Information Systems Analysis and Synthesis (ISAS 2001), Orlando, USA, July 22-25,2001. Pp. 404-409, 2001.
2. Жданов А.А. Земских. Л.В., Беляев Б.Б. Применение генетических алгоритмов для оптимизации нейросетевой базы знаний адаптивной системы стабилизации углового движения космического аппарата. Сб. тезисов докладов XXV академических чтений по космонавтике, Москва, 24-26 января 2001 г. Сс. 128-129, «Война и мир», Москва.
3. Жданов А.А., Винокуров А.Н., Рядовиков А.В., Арсеньев СВ., Земских Л.В., Устюжанин А.Е. Отчет по НИР (проект РФФИ 97-01-00137) «Разработка положений теории автономного адаптивного управления нелинейными объектами и создание прототипов систем» № госрегистрации 01.2000 01823
4. Жданов А.А., Устюжанин А.Е. Коновалов М.К., Земских Л.В., Караваев М.В., Магамедов Б.М. Отчет по НИР (проект РФФИ 00-01-00372) «Исследование возможностей применения новых компьютерных методов для построения подсистем автономных адаптивных управляющих систем» № госрегистрации 012000 04683
5. Земских Л.В. «Возможности оптимизации системы автономного адаптивного управления с помощью генетических алгоритмов», Препринт ИСП РАН, М., 2004
Напечатано с готового оригинал-макета
Издательство ООО "МАКС Пресс" Лицензия ИД N 00510 от 01.12.99 г. Подписано к печати 11.05.2004 г. Формат 60x90 1/16. Усл.печл. 1,25 Тираж 100 экз. Заказ 217. Тел. 939-3890,939-3891,928-1042. Тел./факс 939-3891. 119992, ГСП-2, Москва, Ленинские горы, МГУ им. М.В. Ломоносова, 2-й учебный корпус, 627 к.
р-9845
Оглавление автор диссертации — кандидата физико-математических наук Земских, Леонид Вячеславович
ВВЕДЕНИЕ.
§1. Проблема создания систем автономного управления.
§2. Методология Автономного Адаптивного Управления (ААУ) и проблема синтеза прикладных систем ААУ.
2.1 Основные понятия и алгоритм работы.
2.2 Описание элементной базы систем ААУ (модели нейронов, синапсов и сетей).
§3. Основные положения теории генетических алгоритмов, методы эволюционной оптимизации.
3.1 Введение в тематику генетических алгоритмов.
3.2 Структура простейшего генетического алгоритма, терминология.
3.3 Проблемы кодировки.
§4. Цели и задачи диссертационной работы.
ГЛАВА 1. ЗАДАЧА ОПТИМИЗАЦИИ ПАРАМЕТРОВ БЛОКА ДАТЧИКОВ И БЛОКА АКТУАТОРОВ СИСТЕМЫ АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ.
§1 Описание понятий, постановка задачи в общем виде.
§2 Принципы построения генетического алгоритма решения задачи.
§3 Пример постановки и решения задачи оптимизации блока датчиков и блока актуаторов автономного мобильного робота.
ГЛАВА 2. ПРОЦЕДУРА ДИНАМИЧЕСКОГО ФОРМИРОВАНИЯ СЕТИ ФОРМАЛЬНЫХ НЕЙРОНОПОДОБНЫХ ЭЛЕМЕНТОВ ДЛЯ АППАРАТА ФОРМИРОВАНИЯ И РАСПОЗНАВАНИЯ ОБРАЗОВ И БАЗЫ ЗНАНИЙ СИСТЕМ АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ.
§1 Предпосылки к созданию процедуры динамического формирования сетей нейроноподобных элементов
§2 Размерность задач распознавания и управления.
§3 Формальное описание состава, строения и работы системы формирования и распознавания образов.
§4 Алгоритм динамического формирования топологии сети нейроноподобных элементов системы ФРО.
§5 Блок База Знаний и блок Принятие Решений.
ГЛАВА 3. ГЕНЕТИЧЕСКИЙ АЛГОРИТМ ПОДБОРА ЗНАЧЕНИЙ ПАРАМЕТРОВ ПРОЦЕДУРЫ ДИНАМИЧЕСКОГО ФОРМИРОВАНИЯ СЕТИ НЕЙРОНОПОДОБНЫХ ЭЛЕМЕНТОВ СИСТЕМЫ ФРО.
§1. Постановка задачи оптимизации нейроноподобной системы управления в системе ААУ.
§2 Решение задачи оптимизации системы управления на примере автономного мобильного робота.
ГЛАВА 4. АЛЬТЕРНАТИВНЫЕ И ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ В СИСТЕМАХ АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Земских, Леонид Вячеславович
§1. Проблема создания систем автономного управления.
Современные технологии приводят к быстрому росту числа автоматических приборов и механизмов, что ведет к появлению и нарастанию дефицита внимания человека, как оператора этих устройств. Отсюда возникает объективная необходимость в повышении автономности систем управления этими приборами.
Большинство автоматических систем управления, разрабатывавшихся и действовавших в XX веке, было построено на основе теории управления, опирающейся на математические модели объектов управления, представленные в линейных и нелинейных дифференциальных уравнениях, эволюционных уравнениях в частных производных, конечно-разностных уравнениях, вероятностных [1]. Такие модели, описывающие сложные объекты, системы и процессы, позволили конструировать системы управления различных классов для разнообразных автоматических приборов, механизмов и процессов. Тем не менее, сегодня системы управления, создаваемые на основе традиционных математических моделей, построенных с использованием классических разделов математики, не справляются с решением всех требующихся сегодня задач управления, либо их разработка становится неприемлемо сложной и дорогой. Причина этого состоит, по-видимому, в следующем [2]. Классические разделы математики рассматривают моделируемый объект как точку, положение которой в признаковом пространстве известно абсолютно, и далее оперируют с этой точкой посредством аналитически выраженных функциональных зависимостей. Однако на практике при использовании реальных измерительных и управляющих систем точное положение объекта-точки в признаковом пространстве, как правило, неизвестно, а имеется только некоторая информация об этой точке, указывающая, например, только некоторую область в признаковом пространстве, где с некоторой определенной вероятностью находится объект. С другой стороны, классические аналитические описания поведения объекта в признаковом пространстве, его функциональные связи с другими параметрами, становятся чрезмерно сложными при попытках учесть более реалистические свойства объектов. Учет нелинейных свойств объектов, влияния и взаимодействия многих объектов в сложных системах, помех и вероятностного характера некоторых компонент процессов, резко усложняет математические модели объектов и процессов, а во многих случаях делает их построение практически невозможным. Это обстоятельство стимулировало развитие новых разделов математики, таких как численные методы, теория алгоритмов, теория рекурсивных функций, теория информации, нечеткая логика, теория автоматов и другие. На основе этих относительно новых разделов математики и параллельно с традиционным подходом к построению управляющих систем на основе математического моделирования объектов и систем, развивался подход к построению управляющих систем на основе работы со «знаниями». Примерами являются экспертные системы, системы нечеткой логики, генетические алгоритмы, искусственные нейронные сети. В этих системах, объект управления представлен некоторой информацией о нем, некоторыми множествами его возможных состояний, с помощью классов и образов. Его функциональные свойства описываются в виде семантических связей различимых состояний, отношениями, определенными на множествах этих состояний, образов, причинно-следственными переходами между состояниями, вероятностями таких переходов, методами ситуационного управления и т.п. способами.
С то же время, повышение автономности автоматических объектов делает необходимым развитие адаптивных методов управления. Под адаптивным управлением везде ниже мы будем понимать способность системы управления автоматически приспосабливать свое управление к недетерминировано изменяющимся внешним и внутренним условиям - к свойствам объекта управления. Классическая теория управления предлагает соответствующие методы построения эволюционных систем [1,3]. Однако при этом остается проблема сложности представления объектов управления в терминах классического математического моделирования. В связи с этим особый интерес вызывают способы построения адаптивных систем управления на основе подходов, работающих со «знаниями».
Обращает на себя внимание также тот факт, что в природе существуют системы управления, которые тоже не используют математические модели объектов, во всяком случае в явном виде. Это нервные системы организмов. Исследователей давно привлекает способность живых организмов эффективно решать различные задачи управления, при этом имеющие ярко выраженные свойства адаптивности. По мере развития технологий исследований и моделирования постоянно предпринимаются попытки построения моделей нервной системы и ее элементов. Это приводит к появлению как широких концептуальных теорий, примерами которых являются теория функциональных систем П.К. Анохина [4], теории эволюционного развития, теории нервных систем, концептуальные модели нейронов, так и прикладных систем, пригодных к использованию в широких практических областях задач. К последним относятся системы, образовавшие направление, которое сегодня принято объединять термином «системы искусственного интеллекта» (ИИ) или «artificial intelligence systems» (AI). Сюда относят экспертные системы, системы нечеткой логики, искусственные нейронные сети, системы с подкрепляющим обучением, генетические алгоритмы. Все эти методы объединяет, во-первых, то, что они решают те задачи, которые ранее были прерогативой только человеческого мозга: это задачи распознавания образов, накопления и использования знаний, вывода новых знаний, принятия решений, перевод текстов с одного языка на другие, игры и другие задачи, а во-вторых, то, что они берут свое начало из попыток смоделировать конечный результат решения названных задач, демонстрируемый человеком.
Указанные методы ИИ подразделяются на два общих направления: программно-прагматическое и имитационное (бионическое). Первое из них моделирует рассматриваемый процесс, добиваясь только получения сходного или лучшего конечного результата (подобного тому, который получает человек, решая аналогичную задачу), а второе имеет целью добиться не только сходства конечного результата, но и сходства самого метода его получения. К 1-му направлению можно отнести экспертные системы, распознающие системы, многие варианты нейронных сетей. Ко 2-му варианту можно отнести некоторые варианты нейронных сетей (например, модульные нейронные сети [5], нейронные сети на основе спайковых нейронов [6]), системы с подкрепляющим обучением [7], модели функциональных систем, системы искусственной жизни [8], аниматы [9] и некоторые другие.
В настоящей работе нас будет интересовать именно это 2-е направление. Это направление делится на поднаправления. Так, одна часть исследований тесно связана с биологами, которые изучают мозг описательным способом, с помощью таких инструментов, как скальпель и микроскоп, они изучают и описывают анатомию (морфологию, гистологию, цитологию), а также физиологию нервной системы. Здесь достичь успеха мешает большая сложность исследуемых объектов. Мозг человека состоит из 10й нейронов и 1014 нервных волокон, разобраться в которых с помощью микроскопа и скальпеля в настоящее время не представляется возможным. Кроме того, в мозге происходит и множество иных процессов. Выделить в такой сложной системе то, что является в ней главным, биологам чрезвычайно трудно. Попытки математиков строить математические модели по тем описаниям, которые им предоставляют биологи, наталкиваются на то, что биологам по указанным причинам обычно трудно выделить, какие из наблюдаемых ими явлений в работе мозга являются главными с точки зрения адаптивного управления. Поэтому математики чаще склоняются к построению феноменологических моделей поведения живых организмов, не привязываясь к биологическим деталям; примером могут служить работы [10] группы Альбуса и Мейстела (National Institute of Standards and Technology) по адаптивному иерархическому управлению. Однако нам представляется, что попытки уловить и смоделировать не только феноменологию, но и существо способа получения результата биологическими нервными системами, позволили бы выйти на способы построения принципиально новых адаптивных систем управления, обладающих практически очень полезными свойствами, а именно: адаптивностью, универсальностью, многокритериальностью и многопараметричностью.
Настоящая работа посвящена развитию одного из таких подходов, а именно метода «автономного адаптивного управления» (ААУ) [11-15], который исходит из того, что логику, структуру, функции и, возможно, устройство нервной системы в целом, можно понять, если отталкиваться от условий, в которых находится нервная система любого организма.
Заключение диссертация на тему "Применение генетических алгоритмов в системах Автономного Адаптивного Управления"
Заключение
В целом в диссертационной работе представлен предложенный, обоснованный и разработанный подход к построению и оптимизации прикладных систем автономного адаптивного управления с помощью генетических алгоритмов, что решает проблему синтеза таких систем в условиях недостаточной априорной информации. Основные результаты:
1. введен формализм описания блока датчиков и актуаторов систем ААУ, предложена процедура количественного оценивания согласованности их параметров; сформулирована в общем виде задача оптимизации таких параметров, предложены рекомендации по построению генетических алгоритмов для ее решения;
2. на основании введенного формализма и постановки задачи оптимизации был разработан генетический алгоритм подбора параметров блока датчиков и актуаторов на примере приложения - системы программной модели автономного адаптивного управления мобильного робота;
3. введен формализм описания строения сети нейроноподобных элементов подсистемы формирования и распознавания образов;
4. на основе предложенного формализма разработана процедура динамического формирования сети нейроноподобных элементов подсистемы формирования и распознавания образов, а также сформулирована в общем виде задача оптимизации ее параметров;
5. был разработан генетический алгоритм решения задачи оптимизации параметров процедуры динамического формирования сети нейроноподобных элементов подсистемы формирования и распознавания образов, общая схема которого не зависит от специфики прикладной задачи. Практическое решение такой задачи было рассмотрено на примере программной модели автономного мобильного робота
Библиография Земских, Леонид Вячеславович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Афанасьев В.Н., Колмоновский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: «Высшая школа», 1998
2. Чечкин А.В. Математическая информатика. М.: «Наука» Главная редакция физико-математической литературы, 1991 -416с.
3. Цыпкин ЯЗ. Адаптация и обучение в автоматических системах // М.: Наука, 1968.
4. Анохин П.К. Принципиальные вопросы общей теории функциональных систем. // Принципы системной организации функций М.: Наука 1973
5. Bale Т. A., Modular Connectionist Architectures and the Learning of Quantification Skill, 1998
6. Головко B.A. Нейронные сети: обучение, организация и применение. Кн.4: Учеб. Пособие для вузов / Общая ред. А.И. Галушкина. М.: ИПРЖР, 2001. - 256 е.: ил. (Нейрокомпьютеры и их применение)
7. Reinforcement Learning: An Introduction Richard S. Sutton and Andrew G. Barto MIT Press, Cambridge, MA, 1998
8. Artificial Life An Overview Christopher G. Langton (Ed.) MIT Press, 1995
9. From Animal to Animats. Proceedings of the First International Conference on Simulation of Adaptive Behavior / Eds J.-A. Meyer, S,W, Wilson. Cambridge at al: MIT Press, 1990
10. Albus, J.S., Meystel, A.M. "A Reference Model Architecture for Design and Implementation of Intelligent Control in Large and Complex Systems," International Journal of Intelligent Control and Systems, Vol. l.No. l,pgs. 15-30, 1996.
11. Жданов А.А. Об одном имитационном подходе к адаптивному управлению. // сб. Вопросы Кибернетики. Выпуск 2 М., 1996 с. 171-206.
12. Жданов А.А. Формальная модель нейрона и нейросети в методологии автономного адаптивного управления. // сб. Вопросы Кибернетики. Выпуск 3 М., 1997. С.258-274
13. Жданов А.А, Гуриев М.А, Норкин Н.А. Некоторые практические приложения метода автономного адаптивного управления. // сб. Искусственный интеллект в технических системах (под ред. Акад. Лупичева), изд. Гос. ИФТП, Вып. №19 М., 1998 г. с. 72-99
14. Жданов А.А., Арсеньев С.В., Половников В.А. Об одной методологии автономного адаптивного управления. Труды Института системного программирования РАН. 1999.
15. Том 1. М.: Биоинформсервис, 2000,- С. 66-83 (англ. Том. Zhdanov A.A., Arsenjev S.V., Polovnikov V.A., On autonomous adaptive control methodology. // Proceedings of the Russian Academy of Sciences Institute for System Programming. N 1, 1999, pp.5 5-70)
16. Уорвик К. "Наступление Машин" М. Международная академическая издательская компания "Наука/Интерпериодика", 1999
17. Turing Alan M. 1950, Computing Machinery and Intelligence, Mind 59 (236) pp. 433-480. Reprinted in Ince, D.C. (editor). 1992. Mechanical Intelligence: Collected Works of A. Turing Amsterdam: North Holland. Pages 133-160/
18. David E. Goldberg. Genetic Algorithms in Search, Optimization and Machine Learning. Addison-Wiseley, 1989
19. Brindle A, (1981) Genetic Algorithms for function optimization. Doctoral dissertation. University of Alberta. Edmonton, Canada.
20. Goldberg D.E., Deb K. A comparative analysis of selection schemes used in genetic algorithms. In Rawlins, G.J.E. (Ed.), Foundations of Genetic Algorithms, (pp.63-93), San Mateo, CA: Morgan Kaufmann, 1991
21. De Jong K. Analysis of the Behavior of a Class of Genetic Adaptive Systems. Ph.D. Dissertation, University of Michigan, Ann Arbor, 1975
22. Cavicchio D.J. Adaptive search using simulated evolution. Unpublished Doctoral Dissertation, University of Michigan, Ann Arbor, 1970
23. Syswerda G., Uniform crossover in genetic algorithms. In Proceedings of the Third International Conference on Genetic Algorithms and their Applications. 2-9, J.D. Schaeffer, ed. Morgan Kaufmann, 1989
24. Holland J.HAdaptation in Natural and Artificial Systems, Univ. of Michigan Press, Ann Arbor, MI: 1975
25. D.H. Wolpert, W.G. Macready, "No free lunch theorems for optimization," IEEE Transactionson Evolutionary Computation, vol. l,no. l,pp.67-82. 1997
26. K. Miettinen, P. Neittaanmaki, M.M. Makela, J. Periaux Evolutionary Algorithms in Engineering and Computer Science Chichester ; Weinheim ; New York ; Brisbane ; Singapore ; Toronto : John Wiley & Sons, Ltd., 1999
27. А.А. Жданов, М.В. Крыжановский, Н.Б. Преображенский. Бионическая интеллектуальная автономная адаптивная система управления мобильным роботом // Мехатроника, 2004. №1, с. 21-30 (часть 1) и №2 (часть 2), с. 17-22.
28. Тихонов А.Н., Арсенин В.Я. // Методы решения некорректных задач. М.: Наука, 1986. -288 с
29. Mynsky, М., Papert, S. Perceptrons: An introduction to computational Geometry, The MIT Press, 1969
30. Lipmann, R. An introguction to computing with natural nets. II IEEE Acoustic, Speech and Signal Processing Magazine, 1987, no. 2, L. 21-22
31. Скурихин A.H. Нейронные сети: Определенияб концепцииб применение. М. ЦНИИ Управления, экономики и информатики, 1991
32. Жданов А.А. Земских JI.B. Беляев Б.Б. Система стабилизации углового движения космического аппарата на основе нейоноподобной системы автономного адаптивного управления. Космические Исследования, М. 2004 (принята редакцией в 2002).
-
Похожие работы
- Исследование и разработка системы управления автономным электрогидравлическим приводом
- Разработка и исследование методов синтеза адаптивных регуляторов на основе нейро-нечетких сетевых структур
- Разработка алгоритмов синтеза адаптивной цифровой системы управления многомерными объектами в условиях нестационарности
- Разработка и исследование методов планирования кристалла СБИС на основе эволюционной адаптации
- Модели, алгоритмы и программное обеспечение систем управления мехатронно-модульными роботами с адаптивной кинематической структурой
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность