автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Модель нейронной сети с преднастройкой для решения задач формирования сенсомоторной координации робота-манипулятора
Автореферат диссертации по теме "Модель нейронной сети с преднастройкой для решения задач формирования сенсомоторной координации робота-манипулятора"
На правах рукописи
ШЕПЕЛЕВ ИГОРЬ ЕВГЕНЬЕВИЧ
МОДЕЛЬ НЕЙРОННОЙ СЕТИ С ПРЕДНАСТРОЙКОЙ ДЛЯ РЕШЕНИЯ ЗАДАЧ ФОРМИРОВАНИЯ СЕНСОМОТОРНОЙ КООРДИНАЦИИ РОБОТА-МАНИПУЛЯТОРА
05.13.18 - Математическое моделирование, численные методы и комплексы программ
Автореферат диссертации на соискание ученой степени кандидата технических наук
Ростов-на-Дону 2004
Работа выполнена в НИИ нейрокибернетики им. А.Б. Когана Ростовского государственного университета
Научный руководитель: доктор биологических наук, профессор
Владимирский Борис Михайлович
Официальные оппоненты: доктор технических наук, профессор
Божич Владимир Иванович
кандидат технических наук, доцент Дорогов Александр Юрьевич
Ведущая организация: Институт прикладной физики РАН
(г. Нижний Новгород)
Защита состоится июй% 2004 г. в и _часов на заседании
диссертационного совета К.212.208.04 по физико-математическим и техническим наукам при Ростовском госуниверситете по адресу: 344090, г. Ростов-на-Дону, пр. Стачки, 200/1, корпус 2, к, 206.
С диссертацией можно ознакомиться в научной библиотеке РГУ по адресу: г.Ростов-на-Дону, ул. Пушкинская, 148.
Автореферат разослан" / " <. с с и и 2004 г. Ученый секретарь диссертационного совета,
кандидат физико-математических наук — Муратова Г.В.
AlS&k
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Создание роботов, позволяющих существенно сократить затраты ручного труда в различных сферах человеческой деятельности, а также способных автономно функционировать в экстремальных условиях (под водой, в космосе), является наиболее важной проблемой на сегодняшнем этапе развития робототехники. Среды, с которыми приходиться взаимодействовать роботу в таких условиях, характеризуются большой неопределенностью, поэтому, „для автономного функционирования ему необходимо очувствление, оберпечивающее обратную связь от среды, и адаптивность поведения.
Сенсорная информация, доставляемая системой очувствления адаптивной управляющей структуре, используется для дополнения априорных сведений о внешней среде с целью формирования правильных выходных управляющих воздействий, направленных на достижение и поддержание некоторого оптимального поведения,- системы. В результате становится возможным организация адекватного функционирования робота в изменяющейся окружающей среде {Куафе Ф., 1985; Козлов Ю.М., 1990]. , .
Построение функционального преобразования, устанавливающего связь . между входными - сенсорными и выходными - моторными переменными системы управления составляет задачу формирования сенсомоторной координации робота.
Синтез управления поведением робототехнических систем, активно взаимодействующих со сложным окружением, основывается на применений принципа обратной связи. Однако задачи управления по принципу обратной связи, рассматриваемые в теории автоматического управления, существенно отличаются от задачи управления роботрм. Основная проблематика теории автоматического управления связана с изучением временного аспекта процессов в системах с обратной связью, а их функциональные возможности ограничиваются решением задачи отслеживания заданных значений регулируемых величин [Иващенко H.H., 1973]. В робототехнических же системах большее значение приобретает пространственный аспект описания среды, в связи с чем значительно усложняются сами задачи организации процессов управления. В частности, в таких системах цель поведения задается в пространстве одних переменных, а закон управления ищется в пространстве других переменных. Кроме того, сама цель управления может задаваться в неявной форме из-за недостатка априорной информации. Это и определяет основную специфику задачи формирования сенсомоторной координации.
В силу изменчивости окружающей среды характерным для решения поведенческих задач становятся непрерывные цепи изменяющихся целей поведения, что требует от системы управления обеспечения динамической смены функций, необходимых для осуществления процессов управления на разных этапах поведения робота, с использованием одной и той же структуры.
В условиях не полностью известной среды модели сенсоров, робота в целом и его окружения будут содержать множество неизвестных параметров-В
со
з
этом случае реализация системы управления на основе программных алгоритмов не представляется возможной. Поэтому при создании роботов существенное значение приобретают структуры и алгоритмы, которые обеспечивают адаптивные свойства системы управления. Вся необходимая информация, которая недоступна в форме априорных знаний, должна быть приобретена управляющей системой робота в процессе активного взаимодействия со средой, т.е. такая система с необходимостью должна быть обучающейся.
Важное место среди обучающихся структур занимают искусственные нейронные сети [Haykin S., 1994; Bishop С.М., 1995]. Однако накопленный к настоящему времени опыт решения задач, связанных с организацией поведения роботов, использующих информацию об окружении, показывает, что проблема координированного управления многозвенными роботами-манипуляторами не имеет удовлетворительного решения в рамках существующих нейросетевых парадигм. Такая ситуация заставляет исследователей искать другие пути, но предлагаемые при этом структуры не позволяют решать сколько-нибудь приближенные к реальности задачи. Это относится, например, к создаваемым системам управления для наиболее продвинутых гуманоидных роботов. Используемые в них различные нечеткие (fuzzy) алгоритмы основаны на простых, интуитивно понятных правилах обучения, но сценарии поведения жестко ограничиваются этим набором правил [Bezdek J., 1993].
С другой стороны, не вызывает сомнения адекватность именно нейросетевых реализаций задачам сенсомоторной координации, так как мозг человека и животных успешно их решает, но эффективного решения пока не было предложено. Таким образом, построение адаптивных структур на основе нейроподобных элементов остается наиболее актуальным аспектом при реализации компонентов системы управления роботом.
Целью настоящей диссертационной работы является разработка и исследование адаптивной модели нейронной сети с преднастройкой для решения задач сенсомоторной координации роботов-манипуляторов.
Для достижения поставленной цели в диссертации решаются следующие основные задачи:
- разработка архитектуры модели нейронной сети с преднастройкой, обладающей свойством локальной адаптивности;
- разработка процедуры преднастройки, как механизма адаптации в модели нейронной сети;
- исследование функциональной универсальности нейронной сети с преднастройкой при различных способах инициализации ее параметров;
- проведение имитационного программного моделирования нейронной сети с преднастройкой с целью тестирования разработанной модели на ряде задач;
- применение разработанной модели к задаче реализации* функции константности восприятия в системе управления программной модели двухзвенного робота-манипулятора.
Методы исследований. Для решения поставленных задач в работе использованы методы вычислительной математики, теории вероятностей и математической статистики,, а также методы прикладного программирования.
Объект исследования. Объектом исследования являются: методы построения нейросегевых структур, обладающих заданными свойствами; способы аппроксимации функций в базисе нейронных сетей; алгоритмы адаптации нейросети к изменяющимся условиям функционирования.
Научная новизна.
- Научная новизна заключается в предложенной оригинальной нейросетевой парадигме, использующей в качестве адаптивной процедуры преднастройку нейронной сети на требуемое функциональное преобразование. В отличие от известных нейросегевых структур, вместо обучения в качестве механизма адаптации разработанная модель нейронной сети реализует процедуру преднастройки на основе «включения» и «выключения» вставочных нейронов сети посредством их комбинаторного вытормаживания, чем обеспечивается функциональная универсальность такой сети.
- Новое архитектурное решение структуры из нейроподобных элементов позволяет осуществлять аппроксимацию кусочно-непрерывными функциями без итеративных процедур последовательного приближения сразу на всей области определения, оставаясь в рамках фиксированной структуры, и достигать высокой точности аппроксимации с помощью нейросети небольших размеров.
- Разработанный алгоритм преднастройки реализует в нейросети поисковые принципы функционирования, основанные на вдее пробных локальных преобразований.
Основные научные результаты:
- разработана элементарная нейронная структура,, на основе которой строится архитектура модели нейронной сети с преднастройкой, реализующей кусочно-линейную аппроксимацию;
- разработана процедура преднастройки, как механизма адаптации в модели нейронной сети, па основе «включения» и «выключения» вставочных нейронов сети посредством их комбинаторного вытормаживания;
- исследованы алгоритмы инициализации параметров нейросети с преднастройкой для получения функционально универсальных структур; получены результаты имитационного моделирования разработанной нейронной сети с преднастройкой, доказывающие эффективность предложенной нейросетевой структуры и ее преимущество перед существующими аналогами.
Теоретическая и практическая ценность:
- разработанная нейронная структура, позволяющая решать задачи синтеза координированного управления движениями многозвенных роботов-манипуляторов за счет объединения в едином процессе как поиска элементарных поведенческих актов, так и воспроизведения ранее освоенных сценариев поведения;
- разработанная архитектура нейронной сети с преднастройкой, которая может служить основой при построении структур, реализующих функции целенаправленного зрительного восприятия в системах технического зрения роботов;
- предложенная реализация механизма преднастройки в нейронных структурах, которая может быть использована для воспроизведения управления селективным вниманием, предсказания последствий действий и других важных функций для систем с активным поведением во внешней среде.
Апробация работы. Основные результаты работы докладывались и обсуждались на XIII Международной конференции по нейрокибернетике (г.Ростов-на-Дону, 2002 г.), на II и V Всероссийских научно-технических конференциях «Нейроинформатика» (г.Москва, 2000 г., 2003 г.), на VIII Всероссийской конференции «Нейрокомпьютеры и их применения» (г.Москва, 2002 г.), на семинаре Лаборатории вычислительного эксперимента (ЮГИНФО РГУ, г.Ростов-на-Дону, 2003г.), а также на семинарах кафедры биофизики и биокибернетики физического факультета РГУ и НИИ НК РГУ.
Основные положения, выносимые на защиту:
- новый подход к задаче формирования сенсомоторной координации роботов-манипуляторов;
- архитектура нейронной сети, обладающей свойством локальной адаптивности при распределенном представлении аппроксимируемых в нейросети функций;
- алгоритм преднастройки на требуемое функциональное преобразование как механизм адаптации нейросети к изменяющимся условиям функционирования на основе "включения" и "выключения" вставочных нейронов сети посредством их комбинаторного вытормаживания;
- алгоритмы инициализации параметров модели нейронной сети с преднастройкой для получения функционально универсальных структур;
- способ формирования константности восприятия в системе управления роботом-манипулятором.
Публикации. По теме диссертации опубликовано 8 работ, из них 1 - в российском рецензируемом журнале, 7 - в тезисах и материалах конференций.
Структура диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы, приложения и изложена на 134 страницах, содержит 30 рисунков и 3 таблицы; список литературы включает 124 наименования.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Проведенный аналитический обзор литературы показал, что класс обучающихся нейронных сетей персептронного типа, являющийся в настоящее время основным в теории нейронных сетей и нейрокомпьютеров, ограничен в применении для решения задачи формирования сенсомоторной координации многозвенных роботов-манипуляторов.
Предлагаемый нами подход является, в некотором смысле, развитием идей У. Мак-Каллока [МсСиПосЬ "№.8., 1958] о полифункциональных нейронных сетях логических функций, когда путем изменения порогов элементов можно динамически преднастроить сеть на реализацию любой из них. В данной работе рассматриваются полифункциональные нейронные сети, в которых те или иные функциональные преобразования реализуются преднастройкой некоторых управляемых параметров.
Если синтезировать нейронную сеть с очень широким диапазоном функциональных преобразований, то решение поставленной задачи будет заключаться в поиске преднастраивающего воздействия на управляемые параметры этой сети для получения конкретной требуемой функции. В данном случае,,, в, процессе адаптации, реализуемой посредством процедуры преднастройки, не происходит потеря функциональной универсальности нейросети в отличие от традиционных нейронных сетей, в которых обучение приводит к реализации единственной функции.
Предлагаемый ,,подход кк, решению задач с адаптацией сети путем динамической преднастройки является наиболее предпочтительным при построении систем управления роботами-манипуляторами. При функционировании в условиях изменчивой среды он исключает постоянное переобучение нейросети на разные поведенческие сценарии осуществлением динамической смены функций. Задание цели поведения на сенсорных переменных вводится в такой нейросети определением преднастраивающего воздействия, как функции этих сенсорных переменных.
, Так как в процессе поведения робота происходит замыкание обратной связи через окружение, то само перемещение робота в пространстве приводит к изменению сенсорных воздействий. Одновременно к изменению сенсорных воздействий могут приводить и воздействия внешней среды. В таких условиях вероятно возникновение ситуаций, когда сенсорная информация не может интерпретироваться системой однозначно, а значит, и управление роботом не может быть однозначно организовано.
Для снятия этой неоднозначности в интерпретации сенсорных сигналов в работе используется поисковая стратегия, как основной способ организации управления подобными системами с обратной связью. В процессе активного
взаимодействия робота с внешней средой система управления обучается распознавать, какая часть сенсорного сигнала связана, например, с изменением позы манипулятора в поле тяготения, а какая с действием внешних факторов. В психологии эта способность отстраиваться от изменений сигналов датчиков, связанных с движением самой системы (человека или животного), носит название константности восприятия. В современной робототехнике отсутствие такой способности у управляющей системы накладывает множество ограничений на среду функционирования робота.
В условиях управления по принципу обратной связи входные сенсорные переменные системы управления зависят от выходных управляющих сигналов опосредовано через исполнительные органы и внешнюю среду. При этом требование активного поведения системы во внешней среде приводит к существенной зависимости сенсорной информации и критерия управления, задаваемого на сенсорных переменных, как от состояния среды, так и от состояния управляемой системы. ,
Следовательно, текущая идентификация среды, а значит, и эффективное управление поведением системы в этой среде, невозможна без идентификации самой управляемой системы. Тем самым, подчеркивается четкое разделение в системах с активным поведением, функционирующих по принципу обратной связи через среду, на управляющую систему (собственно, система управления), управляемую систему (объект управления) и внешнюю среду.
Во введении обоснована актуальность темы диссертации, сформулированы цели и задачи исследования, приведены основные положения работы, выносимые на защиту.
В первой главе проведен классификационный анализ нейросетевых парадигм и возможностей их применения для задач формирования сенсомоторной координации робота-манипулятора. Отмечается, что задача построения функции, отражающей зависимость между сенсорными и моторными переменными в робототехнической системе, имеет свою специфику, что накладывает ряд требований на нейросетевую структуру, используемую для аппроксимации требуемой функциональной зависимости. Данные требования касаются аппроксимационных свойств нейронных сетей, таких как способ аппроксимации и представления функций, а также механизмов, реализуемых ими для построения заданного отображения. По этим характеристикам нейросетевые алгоритмы условно разделяются на три группы: обучающиеся нейронные сети с глобальной адаптацией; обучающиеся нейронные сети с локальной адаптацией; преднастраивающиеся нейронные сети с локальной адаптацией (рис. 1).
Первые две группы представляют существующие и уже довольно устоявшиеся нейросетевые парадигмы -- это обучающиеся нейронные сети с глобальной и локальной адаптацией.
В первых двух разделах главы описываются основные ограничения их применимости к рассматриваемой задаче. Среди общих недостатков выделяется необходимость наличия во многих нейросетях обучающей выборки в виде
Обучающиеся нейронные сети с глобальной адаптацией
Обучающиеся нейронные сети с локальной адаптацией
Преднастраивающаяся
нейронная сеть с локальной адаптацией
Способ аппроксимации функций о нейросети
Глобальный Локальный Локальный
Способ представления функций в нейросети
Распределенный Локальный Распределенный
д
Конкретная функция
Механизмы адаптации
Алгоритмы обучения Алгоритмы обучения Алгоритм преднастройкн
д
д
Конкретная функция
Функциональная универсальность
Рис. 1.
входных и правильных выходных данных для построения требуемого отображения. Это характерно, например, для многослойных нейронных сетей с градиентными методами обучения, в частности, с алгоритмом обратного распространения ошибки [Rumelhart D.E. et al, 1986]. Однако при функционировании в реальной плохо организованной и изменяющейся среде такая информация редко бывает доступна.
Для других известных конструкций нейронных сетей, способных работать в отсутствии строгих предписаний по решению задач, таких как нейросети с подкреплением [Sutton R., Bario А., 1998] и нейросети, обучаемые генетическими алгоритмами, основным препятствием для функционирования в реальных средах является используемая в них глобальная аппроксимация.
Непрерывно изменяющиеся цели поведения робота в условиях изменяющейся внешней среды сопровождаются постоянным переобучением системы управления на новые поведенческие сценарии, что связано с большими временными и вычислительными затратами в таких нейросетях.
С другой стороны, существующие локально адаптивные нейронные сети, например, нейросети Кохонена [Kohonen Т., 1988] и сети, реализующие принцип адаптивного резонанса [Carpenter G.A., Grossberg S., et al, 1992], демонстрирующие быстрое обучение, характеризуются структурно локальным представлением реализуемых функций. Это приводит к необходимости иметь нейросети больших размеров, зависящих к тому же от сложности аппроксимируемой функции.
Предлагаемая в настоящей работе модель относится к третьей выделяемой группе нейронных сетей. Новизна предлагаемой нейросетевой парадигмы, заключается в том, что она обладает рядом аппроксимационных свойств, не имеющихся одновременно ни у одной их существующих нейронных сетей, и реализует альтернативный обучению механизм адаптации - преднастройку.
В третьем разделе показано, что нейросеть с указанными свойствами является наиболее подходящей для решения задач сенсомоторной координации робота-манипулятора. Среди ключевых моментов выделяются следующие: (¡) локальные аппроксимирующие свойства нейросети позволяют осуществлять процедуры перенастройки на частично измененную исходную функциональную зависимость только на требуемых участках; (и) распределенный характер представления реализуемых функций способствует достижению высокой точности аппроксимации сложных зависимостей при небольших размерах нейросети; (Ш) другой, чем в существующих нейросетевых парадигмах, механизм построения необходимого функционального преобразования позволяет добиться независимости структуры нейросети и ее параметров от вида конкретной аппроксимируемой функции.
Обоснована важность получения функционально универсальной нейроструктуры для решения рассматриваемых задач, подчеркнуто, что поисковые принципы работы систем в неорганизованной среде являются необходимым условием их успешного функционирования, и что локально адаптивные свойства разработанной нейросети позволяют осуществить эффективную реализацию поискового поведения.
В конце первой главы обсуждается задача обеспечения константности восприятия робота-манипулятора. Актуальность ее решения для организации адекватного поведения робота в изменяющейся среде обусловлена неоднозначностью сенсорной информации, доставляемой посредством обратной связи от внешней среды, в частности, при силовом очувствлении робота-манипулятора,
Вторая глава посвящена описанию архитектуры и параметров разработанной модели нейронной сети с преднастройкой. Основная идея состоит том, что построение требуемого отображения происходит без изменения топологии и весов связей нейросети, выбранных в процессе ее реализации. Поэтому струю-ура и параметры нейросети выбираются так, чтобы гарантировать необходимую широту производимых этой нейросетыо функциональных преобразований.
В первой части главы рассматриваются принципы построения архитектуры нейронной сети. Для реализации кусочно-непрерывной аппроксимации предложена ячейка нейронной сети, составленная из скрытого нейрона сети и вставочных нейронов. Различные веса тормозных связей со вставочных нейронов позволяют получать произвольные выходные функции из выбранного класса. В данном случае этот класс ограничен линейными функциями, что было определено при выборе кусочно-линейной акгивационной функции нейронов сети.
Активационная функция нейронов сети с кусочно-линейным поведением позволяет переводить вставочные нейроны в состояние с нулевой активностью посредством сильного внешнего вытормаживающего сигнала — «выключать» их. Введение комбинаторики «включенных» и «выключенных» вставочных нейронов при увеличении количества вставочных нейронов с некоторым образом определенными величинами тормозных воздействий приводит к распределенному представлению выходных функций в структуре нейросети.
Множество комбинаций вытормаживания вставочных нейронов позволяет реализовать множество различных кусочно-линейных функций. При этом разные комбинации «выключения» вставочных нейронов на различных участках области определения приводят к тому, что суммирование по коэффициентам весов тормозных связей активных вставочных нейронов, выполняемое скрытым нейроном сети, будет давать параметры прямой, являющейся аппроксимацией исходной функции для некоторого участка (рис. 2).
Как видно из рисунка, вставочные нейроны условно группируются для аппроксимации коэффициентов крутизны (1) и величины смещения (2) аппроксимирующей линейной функции. Это позволяет реализовать в нейронной сети кусочно-линейную аппроксимацию произвольных функциональных зависимостей. Для данной сети, которую мы будем называть нейросетыо адаптивной фильтрации, предполагается, что веса тормозных связей выбраны так, что всегда можно найти комбинацию активных вставочных нейронов, суммирование по весам тормозных связей которых дает необходимые параметры для получения аппроксимирующей кусочно-линейной функции, удовлетворяющей заданному условию точности аппроксимации на текущем участке исходной функциональной зависимости.
Для каждого следующего участка аппроксимации ищется своя комбинация вставочных нейронов; при этом нейроны, не задействованные в данной комбинации полностью вытормаживаются. Процедура вытормаживания вставочных нейронов нейросети адаптивной фильтрации называется преднастройкой. Следовательно, можно говорить о преднастройке нейросети на каждом локальном участке на требуемое функциональное преобразование.
Таким образом, предполагается существование второй нейронной сети -нейросети преднастройки (состояний), которая реализует поиск вытормаживающей комбинации р на вставочные нейроны нейросети адаптивной фильтрации и ее запоминание для данного участка аппроксимации. Фактически, нейросеть преднастройки реализует функцию р=Р(х), где вход л: может в общем случае и не совпадать с входным сигналом нейросети адаптивной фильтрации, что является важным для решения задач сенсомоторной координации, требующих взаимодействия сенсорных потоков разной модальности. '
i> у
а)
Ь)
¡^о
с)
Рис.2. Кусочно-линейная аппроксимация в нейронной сети реализуется нахождением комбинаций включенных и выключенных вставочных нейронов для разных подобластей. Серым цветом обозначены выключенные нейроны.
В данной работе конкретная реализация нейросети преднастройки не рассматривается. Каждый выход сети состояний заканчивается на отдельном вставочном нейроне первой сети и при своей активности полностью тормозит связанный с ним вставочный нейрон. Комбинаторное вытормаживающее воздействие на вставочные нейроны может быть представлено вектором-столбцом Р(х) ~ (pi,p3,...p„)T'. Тогда матрица весовых коэффициентов нейронной сети адаптивной фильтрации W' = W'(P,W) определяется текущим выходом
сети преднастройки р=Р(х) и весовой матрицей Ш, составленной из весов тормозных связей между скрытым слоем и слоем вставочных нейронов сети. Таким образом, преднастраивающая функция сети состояний осуществляется реализацией набора матриц весовых коэффициентов Ш'.
Система уравнений, описывающих нейросеть адаптивной фильтрации представлена в следующем виде:
£пт
- 2>Г>Т
Г- о
""Г =2>£Ч ¡ = 1,..,и„„,
>0
у = 0(к)
где иы - мембранный потенциал нейрона скрытого слоя;
и'"' и /"' - мембранный потенциал и активность вставочных нейронов; пш = п'1ш + - общее количество вставочных нейронов.
Нейронная сеть способна работать с функциями нескольких переменных посредством увеличения количества вставочных нейронов. Для выделенной группы нейронов определяются возбуждающие связи с соответствующего входа сети для получения необходимого коэффициента крутизны. Следует заметить, что аппроксимация величины смещения, реализуемой в нейросети линейной функции, осуществляется весами тормозных связей фоновоактивных вставочных нейронов.
Повышение размерности задачи требует введения соответствующего количества дополнительных эквивалентных нейронных сетей, работающих в параллельном режиме, что согласуется с известными принципами параллельности вычислений в нейронных сетях.
Во второй части главы исследуется функциональная универсальность полученной нейронной структуры при различных способах инициализации ее параметров. В частности, рассматриваются три варианта инициализации весов тормозных связей нейронной сети адаптивной фильтрации.
Применение в модели расчетного алгоритма позволяет наиболее эффективно использовать комбинаторику вытормаживания для реализации множества выходных функций. Следствием являются минимальные размеры нейронной сети, но и повышенное время поиска необходимой вытормаживающей комбинации, так как в общей группе реализуемых коэффициентов аппроксимирующей функции удовлетворять требуемой точности аппроксимации будет только один.
Задание одинаковых весов тормозных связей является другим крайним вариантом, приводящим к противоположным следствиям: большие размеры нейросети и излишняя избыточность за счет реализации множества одинаковых значений коэффициентов аппроксимирующей функции.
Инициализация случайными равномерно распределенными значениями является наиболее простой и не требующей дополнительных вычислительных
процедур. Кроме того, получаемая небольшая избыточность в реализуемых функциях обеспечивает надежность при поиске необходимой вытормаживаюшей комбинации.
Вычислительные эксперименты показывают, что нейронная сеть небольших размеров демонстрирует достаточно высокую точность аппроксимации. Так, например, 256 градаций значений коэффициента аппроксимирующей функции при инициализации случайными значениями получается при 12-13 вставочных нейронах, тогда как для расчетных значений - это 8 вставочных нейронов, а для одинаковых значений - 256.
Простота и эффективность реализации нейронной сети на случайных весах связей позволила выбрать этот вариант в качестве рабочего и использовать его далее в проводимых исследованиях.
В третьей главе проводится сравнение разработанной модели нейронной сети с преднастройкой с двумя из наиболее известных и мощных нейросетевых парадигм - многослойным персептроном с алгоритмом обратного распространения ошибки (BP) и нейросетью Fuzzy ARTMAP - на примере решения ими задачи аппроксимации тестовой функции.
В первом разделе описываются алгоритмы работы тестируемых нейронных сетей. Основное внимание уделено рассмотрению процедуры преднастройки в разработанной сети, которая заключается в поиске вытормаживающих комбинаций вставочных нейронов для построения необходимой функциональной зависимости. Общее предположение состояло в том, что никакая априорная информация для реализации алгоритмизированного поиска недоступна. В таких случаях обращаются к методам перебора, как наиболее универсальным методам поиска решений. Среди рассмотренных эволюционного, последовательного и случайного методов выбран последний метод перебора, как наиболее эффективный при поиске комбинаций вытормаживания вставочных нейронов.
Проведены исследования зависимости точности аппроксимации в нейросети с преднастройкой со случайным поиском вытормаживающих комбинаций от количества вставочных нейронов. В качестве тестовых выбран ряд функций X*) > представляющих собой синусоиды с различными фазовыми сдвигами:
у = 0.5sin(2ra; - я72) + 0.5, у = 0.5sin(2/re) + 0.5, у - 0.5sin(27K+л!2)+0.5, у = 0.5sin(27£t + 7r) + 0.5,
где 0 < х < 1.
Построение аппроксимации у(х) данных функций позволяет протестировать нейронную сеть в широком диапазоне реализуемых коэффициентов крутизны и смещений аппроксимирующих функций. В результате тестирования получена зависимость точности аппроксимации от количества итераций для нахождения требуемого вектора преднастройки при разном числе вставочных нейронов (рис. 3.).
£
-+—12 всгавочньк -а— 14 вставочных -о—16 вставочных ■л— 18 встаэочнбя -V— 20 вставочных -о— 22 вставочных — 24 Еотавоч^ь»
Число итераций преднастройки
нейронов (6+6) нейронов (7+7) нейронов(8+8) нейронов (9+9) нейронов (10+10) нейрона (11+11) няйрона (19+12)
Рис. 3. Зависимость точности аппроксимации от числа итераций (поисковых шагов) для нахождения очередного вектора преднастройки. Запись (п+п) означает, что для приближения каждого параметра аппроксимирующей функции выбраны по п вставочных нейронов.
Показано, что время поиска нужной комбинации намного меньше общего количества возможных их вариантов и, кроме того, с увеличением количества вставочных нейронов число итераций преднастройки для поиска очередной вытормаживающей комбинации имеет тенденцию уменьшаться за счет большей избыточности в реализуемых функциях.
Показано, что в силу функциональной универсальности нейронной сети с преднастройкой, полученные результаты могут быть использованы для определения размеров нейронной сети в задачах отображения произвольных функциональных зависимостей.
Выбранный алгоритм преднастройки выступает в качестве адаптивной процедуры построения функциональной зависимости в сети. Комбинация вытормаживания р вставочных нейронов для получения аппроксимирующей функции ур некоторого участка исходной зависимости у ищется случайным образом. Как только находится комбинация, которая удовлетворяет условию точности аппроксимации е, она запоминается. Для каждого следующего участка аппроксимации П ищется своя вытормаживающая комбинация рр:
РреС1р: \у-ур\<е ^ =
р
Однако пока текущая аппроксимирующая функция удовлетворяет условию точности аппроксимации, смена вектора преднастройки не происходит.
В этом заключается один из ключевых моментов аппроксимации в модели. Так как дискретизацию области определения нельзя провести заранее из-за недоступности данных в рассматриваемых задачах, то нейронная сеть состояний реализует таковую непосредственно в процессе построения аппроксимации и каждый участок кодирует распределением активности своих выходных нейронов.
При исследовании разработанной нейросетевой модели функционирование этой сети эмулировалось случайным поиском вытормаживающей комбинации р и табличным запоминанием тех последовательностей, из которых формируется кусочно-линейная аппроксимация всей требуемой функции.
В качестве аппроксимируемой функции для сравнительного тестирования нейронных сетей была выбрана следующая функция:
у(х) = 0.5 + 0.5cos(;zx)sin(2/r(x+0.25)), демонстрирующая достаточно сложное поведение в первом квадранте (0<х<1).
Известно, что скорость обучения многослойного персептрона для каждой конкретной функции во многом зависит от его размеров (количества скрытых нейронов), а также от параметров алгоритма обучения. Поэтому в ходе предварительного тестирования были определены размеры нейросети, параметры алгоритма обратного распространения, такие как коэффициент скорости обучения и сглаживания, настраивающие нейросеть на максимальное быстродействие. Кроме того, для ускорения обучения использовался настраиваемый порог нейронов скрытого и выходного слоев. Было также учтено, что нейросеть Fuzzy ARTMAP наращивает свою структуру в процессе проведения аппроксимации, а единственный, регулируемый этот процесс параметр настроен на одноитерационное обучение.
Во втором разделе главы демонстрируются и обсуждаются результаты тестирования. Для проведения сравнительных вычислительных экспериментов были получены программные реализации моделей тестируемых нейронных сетей на базе концепций объектно-ориентированного программирования. Для моделирования использована среда разработки DELPHI. В целях эксперимента варьировался размер обучающей выборки и требуемая точность аппроксимации на обучающем множестве.
Нейросетевые алгоритмы BP и Fuzzy ARTMAP для построения аппроксимирующей функции реализуют противоположные принципы -глобальной и локальной аппроксимации соответственно. Нейронная сеть с преднастройкой осуществляет локальную аппроксимацию, но в отличие от существующих локально адаптивных нейронных сетей, использует распределенное представление реализуемых функций, что традиционно является прерогативой глобально аппроксимирующих нейронных сетей. Таким образом, разбиение области определения аппроксимируемой функции на дискретные участки наряду с итеративными поисковыми операциями на каждом локальном шаге будут присущи нейронной сети с преднастройкой.
Отсюда следует, что тестирование преследовало две цели. Сравнение с алгоритмом обратного распространения позволило продемонстрировать
эффективность алгоритма функционирования нейронной сети с преднастройкой по количеству итерационных шагов, затрачиваемых обеими нейросетями для построения полной аппроксимации требуемой функции. Сравнение с нейросетью Fuzzy ARTMAP демонстрирует преимущество предлагаемой модели в размерности нейросети, необходимой для решения поставленной задачи, а также в дискретизации области определения.
В частности, результаты сравнительных экспериментов показали, что нейросеть с преднастройкой оказывается гораздо быстрее многослойной сети с алгоритмом обратного распространения ошибки (на 2-4 порядка в зависимости от размера выборки и требуемой точности аппроксимации) (Таблица 1.). Обращается внимание на принципиальное различие в организации итерационного процесса построения аппроксимации в тестируемых нейросетях.
Таблица 1. Число итераций построения аппроксимации тестовой функции для нейросети с преднастройкой рМР) и обратного распространения ошибки (ВР).
Размер обучающего множества Точность аппроксимации,%
90 95 98 99
NNP 10 200 500 1200 1800
100 300 900 4100 12400
1000 400 1100 5800 20600
BP 10 478800 526200 573300 766400
100 467000 593000 879000 1212000
1000 2280000 2590000 3630000 5940000
Если в нейросети обратного распространения ошибки он включает повторные представления всего обучающего множества и приводит к последовательному приближению сразу на всей области определения, то в предлагаемой модели итерационный процесс направлен на поиск локально аппроксимирующих функций и полное решение выстраивается по мере поступления данных за один проход.
Показано, что превосходство по скорости случайного перебора в поиске решения над градиентным методом достигается за счет (i) перехода регулируемых параметров нейросети из пространства весов связей, фактически, в пространство порогов нейронов и возникающего при этом сокращения как количества параметров, так и множества принимаемых ими значений сп бесконечного до 2""", а также за счет (ii) локального способа аппроксимации, не требующего многократных возвращений к раннее предъявляемым примерам для обеспечения сходимости процесса.
Показано, что за счет распределенного представления реализуемых функций в нейросети с преднастройкой необходимое количество нейронов для построения заданного отображения может быть в несколько раз меньше, чем того требует нейросеть Fuzzy ARTMAP. Особенно это проявляется для случаев, требующих высокой точности аппроксимации и больших размеров обучающей выборки (Таблица 2.). При этом построение необходимого приближения в
нейросеги ¥итгу АКТМАР происходит посредством наращивания числа нейронов, тогда как в разработанной модели все функциональные преобразования реализуются на фиксированных размерах нейросети.
Таблица 2. Количество нейронов для построения аппроксимации тестовой
функции в нейросети с преднастройкой и Риггу АКТМАР.
Размер обучающего множества Точность аппроксимации, %
90 95 98 99
ШР 10 16 16 16 16
100
1000
Риггу АКТМАР 10 6 8 8 10
100 9 20 41 56
1000 10 21 54 100
Результаты моделирования подтвердили предположение о том, что разработанная модель нейронной сети является состоятельной для решения задач отображения произвольных функциональных зависимостёй.
Обсужден вопрос обобщающих свойств нейронной сети. Отмечено, что для сети с преднастройкой характерны, как и для всех сетей с локальной аппроксимацией, слабые обобщающие свойства, если обучающих примеров недостаточно много. Однако эффективность решения рассматриваемых в данной работе задач не сводится только к формированию обучающей выборки. Оценка правильности функционирования нейронной сети производится некоторым критерием в каждый момент времени. Например, если данный критерий задан на сенсорных переменных, то обратная связь обеспечивает поток этих данных непрерывно. Следовательно, в общем случае, можно говорить, что для нейросети с преднастройкой, реализованной для решения такого рода задач, проблема обобщающих свойств не является принципиальной.
В четвертой главе описывается применение модели нейронной сети с преднастройкой для реализации функции константности восприятия в системе управления робота-манипулятора. Суть проблемы и ее решение демонстрируются на программной модели двухзвенного плоского манипулятора, оснащенного двухкомпонентным датчиком силы в запястье схвата.
Для рассматриваемого квазистатического случая при перемещении груза в схвате показания датчика в запястье манипулятора зависят от позы манипулятора в поле сил тяготения и обусловлены весом схвата и груза. Кроме того, на объект манипулирования могут действовать внешние возмущающие силы, моделирующие соприкосновения и столкновения с предметами окружающей среды. При произвольных движениях манипулятора сигналы с датчика, обусловленные действием силы тяготения, изменяются достаточно сильным образом. Выявить на этом фоне влияние внешних возмущающих
воздействий, которые могут быть значительно меньшими, сложно. Несмотря на то, что показания силовых датчиков зависят от совокупности причин, для организации адекватного ситуации поведения манипулятор должен реагировать
Рис. 4. Неопределенность ситуации в случае действия внешней силы, а) и с) объект в схвате находится под действием только силы тяжести; определенной конфигурации манипулятора (0|, 62) соответствует определенное разложение вектора силы тяжести схвата с нагрузкой на компоненты (Рь Р2) датчика силы. Ь) объект в схвате находится под действием силы тяжести и внешней силы, при этом сенсорный сигнал такой, что соответствует конфигурации случая с), а реальный вектор состояния соответствует а). В данной ситуации без правильной идентификации управляемой системы подходящее управляющее воздействие и = 1/(0, Г), обеспечивающее решение поставленной задачи, не может быть найдено.
Для решения этой задачи предлагается ввести в систему управления дополнительное звено, которое позволяет при движении робота прогнозировать Г1' показания силового датчика /*", отражающие влияние только силы тяготения. В этом звене должно использоваться разложение вектора сил тяготения на две компоненты от значений суставных углов манипулятора в:
Рр = /(£?); 0<=<${2,ГР еЖ2. В качестве адаптивной структуры, настраивающейся на отображение этой зависимости, использована модель нейронной сети с преднастройкой.
Если с объектом в схвате ничего не происходит, то управление манипулятором не должно корректироваться по информации об изменяющихся силах. Если же на объект действует внешнее возмущение, то тогда рассогласование А/7 текущих сигналов с силового датчика и прогнозируемых значений должно использоваться далее для формирования корректирующих программную траекторию управляющих воздействий.
На первом этапе ставилась задача научить нейросеть учитывать показания сенсора во время движения робота в отсутствие возмущающих воздействий:
/:\рр - ^ -» 0. При этом
основным условием являлась аппроксимация требуемой
функциональной зависимости за один проход манипулятором по планируемой траектории. Это максимально приближает задачу к реальным условиям.
Для построения требуемой функциональной зависимости использованы два модуля нейронной сети адаптивной фильтрации, по одной на прогнозирование каждой
компоненты выходного вектора силового датчика. Входами нейронных сетей служат значения суставных углов манипулятора. Таким образом, архитектура каждой нейронной сети была представлена двумя входными нейронами и одним выходным нейроном. Количество вставочных нейронов было выбрано равным 24 по 8 нейронов на каждый Рис- 5- Выделение внешних силовых коэффициент аппроксимирующей возмущений.. Показания силового функции. Точность аппроксимации дат™ка отражены на верхних Двух в экспериментах составляла около Пуфиках. Периоды действия 95% возмущений отмечены сплошной
После построения линией- Выделенные амплитуды
аппроксимации моделировалась силовых возмущений показаны на двух ситуация воздействия на схват нижних графиках, манипулятора случайных внешних силовых воздействий. Показано, что при использовании нейронной сети с преднастройкой для прогнозирования показаний силового датчика в отсутствие внешних сил, задача выявления внешнего возмущающего силового воздействия на фоне сильно изменяющихся сигналов с датчика становиться разрешимой (рис. 5). Повышение точности выполняемых роботом задач, например, перемещения объекта манипулирования в заданную точку пространства, в условиях возмущающего воздействия внешней среды является следствием реализации функции константности восприятия в системе управления робота-манипулятора.
В заключении обобщаются полученные результаты и рассматриваются перспективы применения разработанной нейросетевой структуры.
В качестве основного результата диссертационной работы отмечается создание искусственной нейронной сети нового типа, ориентированной на
решение задач организации активного поведения робота-манипулятора в неорганизованной и изменяющейся внешней среде.
Проведенное сравнительное тестирование с известными нейронными сетями показывает, что разработанная модель решает задачи построения функциональных зависимостей во многом более эффективно, а именно: не требует пакетных способов обучения, не требует наращиваемости структуры, позволяет осуществлять преобразования локально.
Отмечено, что возможность получения функционально универсальной структуры возникает за счет разделения функций между двумя модулями нейронной сети. В нейронной сети адаптивной фильтрации реализуются все функциональные преобразования, а в нейронной сети состояний запоминаются соответствующие преднастраивающие воздействия.
Оисуждаеюя, какими возможностями должна обладать нейронная сеть состояний для полной реализации возложенных на нее функций. В качестве перспективных направлений использования нейронной сети с преднастройкой выделяются задачи поискового управления роботом-манипулятором, воспроизведения управления селективным вниманием, организация активного зрительного восприятия и других функций, присущих биологическим системам.
Приложения содержат листинг программы, моделирующей нейронную сеть с преднастройкой, примеры экранных форм программной среды, разработанной для проведения вычислительных экспериментов, акты о внедрении.
Результаты исследований представлены на сайте НИИ нейрокибернетики по адресу Ьйр://уто^кппс.ш/с1пттг/с15ппр.11Ц)11.
ВЫВОДЫ
1. Разработана и исследована новая архитектура локально-адаптивной нейронной сети, позволяющая осуществлять аппроксимацию функциональных зависимостей кусочно-непрерывными функциями без наращивания структуры нейросети и без использования итерационной процедуры приближения на всей области определения функции.
2. Разработан и исследован алгоритм преднастройки модели нейронной сети, основанный на комбинаторном вытормаживании вставочных нейронов и позволяющий осуществлять локальные адаптивные процедуры уточнения или видоизменения выходной функции на отдельных участках без переобучения всей нейронной сети.
3. Исследованы алгоритмы определения параметров модели нейросети с преднастройкой, обеспечивающие функциональную универсальность и возможность автоматической настройки нейросети на требуемое функциональное преобразование без изменения ранее заданных параметров.
4. Показано, что при реализации функции константности восприятия в системе управления программной моделью двухзвенного робота-
манипулятора, использование модели нейронной сети с преднастройкой расширяет возможности системы и увеличивает точность сенсомоторной координации.
РЕЗУЛЬТАТЫ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ В СЛЕДУЮЩИХ РАБОТАХ:
1. Шепелев И.Е. Функциональная полнота и универсальность нейронных сетей в приложении к задачам управления роботом. // Труды XIII Международной конференции по нейрокибернетике. - Ростов-на-Дону, 2002. — т.2. — с.173-176.
2. Самарин А.И., Шепелев И.Е. Нейронные сети с преднастройкой в задачах сенсомоторной координации робота. // Труды XIII Международной конференции по нейрокибернетике. - Ростов-на-Дону, 2002. - т.2. - с. 127132.
3. Гаврилей Ю.К., Самарин А.И., Шепелев И.Е., Шевченко М.А. Нейросетевые подходы к реализации алгоритмов активного зрения. // Труды VIII Всероссийской конференции Нейрокомпьютеры и их применение. -Москва, 2002. - с.88-91.
4. Гаврилей Ю.К., Самарин А.И., Шепелев И.Е. Преднастройка нейронных сетей в задачах зрительного анализа. // Тез. док. 2-ой Всероссийской научно-технической конференции Нейроинформатика-2000. - М:МИФИ,
' 2000. — с.161-166.
5. Шепелев И.Е. Модель нейронной сети с преднастройкой для задач управления нелинейными динамическими системами. // Тез. док. 5-ой Всероссийской научно-технической конференции Нейроинформатика-2003. -М.:МИФИ, 2003.-С.143-150.
6. Шепелев И.Е. Модель нейронной сети для задач сенсомоторной координации. // Труды аспирантов " 'и соискателей Ростовского государственного университета. Том VII. 200Гг. - с.71-73.
7. Шепелев И.Е. Функциональная полнота и универсальность нейронных сетей в приложении к задачам управления роботом. // Труды аспирантов и соискателей Ростовского государственного университета. Том VIII. 2002г. -C.64-6S.
8. Шепелев И.Е. Модель нейронной сети с преднастройкой для задач управления нелинейными динамическими системами. // Изв. вузов. Сев.-Кав. регион. Естеств. науки. Приложение. 2003. №4. с. 24-34.
Издательство ООО «ЦВВР», Лицензия ЛР № 65-36 от 05.08.99 г. Сдано в набор 30.04.04 г. Подписано в печать 30.04.04 г. Формат 60*84 1/16 Заказ № 486. Бумага офсетная. Гарнитура «1 аймс». Оперативная печать. Тираж 100 экз. Печ. лист. 1,0. Усл.печ л. 1,0 Типография; Издательско-полиграфический комплекс « Биос» РГУ 344091, г. Ростов-на-Дону, ул. Зорге, 28/2, корп. 5 «В», тел. 929-516, 659-532 Лицензия на полиграфическую деятельность X« 65-125 от 09.02 98 г
РНБ Русский фонд
2007-4 17884
П МАЙ 2004
Оглавление автор диссертации — кандидата технических наук Шепелев, Игорь Евгеньевич
СОДЕРЖАНИЕ.-.
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ ВОЗМОЖНОСТЕЙ НЕЙРОСЕТЕВЫХ ПАРАДИГМ ДЛЯ РЕШЕНИЯ ЗАДАЧ СЕНСОМОТОРНОЙ КООРДИНАЦИИ РОБОТА-МАНИПУЛЯТОРА
1.1. Обучающиеся нейронныечгети с глобальной адаптацией.
1.1.1. Аппроксимационные свойства многослойных нейронных сетей.
1.1.2. Алгоритмы обучения многослойных нейронных сетей.
1.1.3. Проблема глобальной аппроксимации.
1.2. Обучающиеся нейронные сети с локальной адаптацией.
1.2.1. Кусочная аппроксимация многослойными сетями.
1.2.2. Кусочно-линейная аппроксимация локально адаптивными нейронными сетями.
1.2.3. Проблема локального представления функций.
1.3. Преднастраивающиеся нейронные сети с локальной адаптацией.
1.3.1. Бионические предпосылки использования преднастройки.
1.3.2. Функциональная универсальность нейронной сети с преднастройкой.
1.3.3. Поисковые принципы функционирования.
1.4. Проблема константности восприятия сенсорных сигналов.
1.4.1 Реализация функции константности восприятия как оптимизационная задача
1.5. Выводы.
ГЛАВА 2. РАЗРАБОТКА И ИССЛЕДОВАНИЕ МОДЕЛИ НЕЙРОННОЙ СЕТИ С ПРЕДНАСТРОЙКОЙ.
2.1. Архитектура и параметры нейронной сети с преднастройкой.
2.1.1. Модель нейрона.
2.1.2. Элементарная ячейка нейронной сети.
2.1.3. Нейронная сеть с пш вставочными нейронами.
2.2. Аппроксимационные свойства нейронной сети с преднастройкой.
2.3. Исследование зависимости точности аппроксимации от количества вставочных нейронов.
2.4. Выводы.
ГЛАВА 3. СРАВНИТЕЛЬНОЕ ТЕСТИРОВАНИЕ НЕЙРОННЫХ СЕТЕЙ.
3.1. Архитектуры нейронных сетей и алгоритмы их функционирования.
3.1.1. Нейронная сеть с преднастройкой.
3.1.2. Нейронная сеть с обратным распространением ошибки.
3.1.3. Нейронная сеть адаптивной резонансной теории.
3.2. Результаты вычислительных экспериментов.
3.2.1. Сравнение нейронных сетей с преднастройкой и обратным распространением ошибки.
3.2.2. Сравнение нейронных сетей с преднастройкой и адаптивной резонансной теории .Н
3.3. Выводы.
ГЛАВА 4. ПРИМЕНЕНИЕ МОДЕЛИ НЕЙРОННОЙ СЕТИ С ПРЕДНАСТРОЙКОЙ ДЛЯ РЕАЛИЗАЦИИ ФУНКЦИИ КОНСТАНТНОСТИ ВОСПРИЯТИЯ В СИСТЕМЕ УПРАВЛЕНИЯ РОБОТА-МАНИПУЛЯТОРА.
4.1. Модель робота-манипулятора.
4.2. Модель нейросети константности.•.
4.3. Результаты моделирования.
4.3.1. Перемещение объекта в схвате по заданной траектории.
4.3.2. Взаимодействие схвата с внешним объектом.
4.4. Выводы.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Шепелев, Игорь Евгеньевич
Актуальность темы. Наиболее востребованным на сегодняшнем этапе развития робототехники является создание роботов, позволяющих существенно сократить затраты ручною труда в различных сферах человеческой деятельности, а также способных автономно функционировать в экстремальных условиях (под водой, в космосе). Среды, с которыми приходиться взаимодействовать роботу в таких задачах, характеризуются низкой степенью организации. Роботу, способному автономно функционировать в неопределенной или изменяющейся обстановке, необходимо очувствление, обеспечивающее обратную связь от среды, и адаптивность поведения. Сенсорная информация, доставляемая системой очувствления адаптивной управляющей структуре, используется для восполнения априорных сведений о внешней среде с целью формирования правильных выходных управляющих воздействий, направленных на достижение и поддержание некоторого оптимального поведения системы. В результате становится возможным организация адекватного функционирования робота в динамической окружающей среде [1,2].
Построение функционального преобразования, устанавливающего связь между входными - сенсорными и выходными - моторными переменными системы управления, составляет задачу формирования сенсомоторной координации робота. При этом синтез управления поведением робототехническими системами, активно взаимодействующих со сложным окружением, основывается на применении принципа обратной связи. Однако задачи управления по принципу обратной связи, рассматриваемые в теории автоматического управления, существенно отличаются от задачи управления роботом.
Основная проблематика теории автоматического управления связана с изучением временного аспекта процессов в системах с обратной связью, а их функциональные возможности ограничиваются решением задачи отслеживания заданных значений регулируемых величин [3]. В робототехнических же системах большее значение приобретает пространственный аспект описания среды, в связи с чем значительно усложняются сами задачи организации процессов управления. Это и определяет основную специфику задачи формирования сенсомоторной координации. В частности, в таких системах цель поведения задается в пространстве одних переменных, а закон управления ищется в пространстве других переменных. Кроме того, сама цель управления может задаваться в неявной форме из-за недостатка априорной информации. В силу изменчивости окружающей среды характерным для решения поведенческих задач становятся непрерывные цепи изменяющихся целей поведения, что требует от системы управления реализации в одной и той же структуре динамической смены функций, необходимых для осуществления процессов управления на разных этапах поведения робота.
В таких условиях функциональные возможности и эффективность роботов в значительной степени будут зависеть от используемых принципов обработки сенсорной информации и методов управления. Когда среда не полностью известна, модели сенсоров, робота и его окружения будут содержать множество неизвестных параметров. В этом случае реализация системы управления на основе программных алгоритмов не представляется возможной. Поэтому при создании роботов существенное значение приобретают структуры и алгоритмы, которые обеспечивают адаптивные свойства системы управления. Вся необходимая информация, которая не доступна в форме априорных знаний, должна быть приобретена управляющей системой робота в процессе его активного взаимодействия со средой. Обучающиеся системы могут обеспечить высокую степень адаптивности, когда априорной информации недостаточно.
Среди обучающихся структур прочное место занимают искусственные нейронные сети. Однако накопленный к настоящему времени опыт решения задач, связанных с организацией поведения робота с использованием информации об окружении, свидетельствует о том, что проблема координированного управления многозвенными роботами-манипуляторами не имеет удовлетворительного решения в рамках развиваемых нейросетевых парадигм.
Как будет показано в данной работе, возможности существующих нейросетевых алгоритмов не удовлетворяют специфике задачи формирования сенсомоторной координации. Этот факт заставляет исследователей искать другие, более простые в реализации, структуры, но эти структуры не позволяют решать более сложные задачи. Указанный недостаток относится и к создаваемым в настоящее время наиболее перспективным и продвинутым разработкам гуманоидных роботов. Используемые в них алгоритмы нечеткой (fuzzy) логики основаны на простых, интуитивно понятных правилах обучения, но сценарии поведения жестко ограничиваются этим набором правил.
С другой стороны, не вызывает сомнения адекватность именно нейросетевых реализаций задачам сенсомоторной координации, так как мозг человека и животных успешно их решает, но эффективного решения пока не было предложено. Таким образом, построение адаптивных структур на основе нейроподобных элементов остается наиболее актуальным аспектом при реализации компонентов системы управления роботом.
Целью настоящей диссертационной работы является разработка и исследование адаптивной модели нейронной сети с преднастройкой для решения задач сенсомоторной координации роботов-манипуляторов.
Для достижения поставленной цели в диссертации решаются следующие основные задачи:
- разработка архитектуры модели нейронной сети с преднастройкой, обладающей свойством локальной адаптивности;
- разработка процедуры преднастройки, как механизма адаптации в модели нейронной сети;
- исследование функциональной универсальности нейронной сети с преднастройкой при различных способах инициализации ее параметров;
- проведение имитационного программного моделирования нейронной сети с преднастройкой с целью тестирования разработанной модели на ряде задач;
- применение разработанной модели к задаче реализации функции константности восприятия в системе управления программной модели двухзвенного робота-манипулятора.
Методы исследований. Для решения поставленных задач в работе использованы методы вычислительной математики, теории вероятностей и математической статистики, а также методы прикладного программирования.
Объект исследования. Объектом исследования являются: методы построения нейросетевых структур, обладающих заданными свойствами; способы аппроксимации функций в базисе нейронных сетей; алгоритмы адаптации нейросети к изменяющимся условиям функционирования.
Научная новизна.
Научная новизна заключается:
- в предложенной оригинальной нейросетевой парадигме, использующей в качестве адаптивной процедуры преднастройку нейронной сети на требуемое функциональное преобразование. В отличие от известных нейросетевых структур, вместо обучения в качестве механизма адаптации разработанная модель нейронной сети реализует процедуру преднастройки на основе «включения» и «выключения» вставочных нейронов сети посредством их комбинаторного вытормаживания, чем обеспечивается функциональная универсальность такой сети.
- в новой структуре из нейроподобных элементов позволяющей осуществлять аппроксимацию кусочно-непрерывными функциями без итеративных процедур последовательного приближения сразу на всей области определения, оставаясь в рамках фиксированной структуры, и достигать высокой точности аппроксимации с помощью нейросети небольших размеров. в разработанном алгоритме преднастройки, реализующем в нейросети поисковые принципы функционирования, основанные на идее пробных локальных преобразований.
Основные научные результаты: разработана элементарная нейронная структура, на основе которой строится архитектура модели нейронной сети с преднастройкой, реализующей кусочно-г. инейную аппроксимацию; разработана процедура преднастройки, как механизма адаптации в модели нейронной сети, на основе «включения» и «выключения» вставочных нейронов сети посредством их комбинаторного вытормаживания; исследованы алгоритмы инициализации параметров нейросети с преднастройкой для получения функционально универсальных структур; получены результаты имитационного моделирования разработанной нейронной сети с преднастройкой, доказывающие эффективность предложенной нейросетевой структуры и ее преимущество перед существующими аналогами.
Основные положения, выносимые на защиту: новый подход к задаче формирования сенсомоторной координации роботов-манипуляторов; архитектура нейронной сети, обладающей свойством локальной адаптивности при распределенном представлении аппроксимируемых в нейросети функций; алгоритм преднастройки на требуемое функциональное преобразование как механизм адаптации нейросети к изменяющимся условиям функционирования на основе "включения" и "выключения" вставочных нейронов сети посредством их комбинаторного вытормаживания; алгоритмы инициализации параметров модели нейронной сети с преднастройкой для получения функционально универсальных структур; способ формирования константности восприятия в системе управления роботом-манипулятором.
Теоретическая и практическая ценность:
- разработанная нейронная структура позволяет решать задачи синтеза координированного управления движениями многозвенных роботов-манипуляторов за счет объединения в едином процессе как поиска элементарных поведенческих актов, так и воспроизведения ранее освоенных сценариев поведения;
- разработанная архитектура нейронной сети с преднастройкой, которая может служить основой при построении схем, реализующих функции целенаправленного зрительного восприятия в системах технического зрения роботов;
- предложенная реализация механизма преднастройки в нейронных структурах может быть использована для воспроизведения управления селективным вниманием, предсказания последствий действий и других важных функций для систем с активным поведением во внешней среде.
Апробация работы. Основные результаты работы докладывались и обсуждались на XIII Международной конференции по нейрокибернетике (г.Ростов-на-Дону, 2002 г.), на II и V Всероссийских научно-технических конференциях «Нейроинформатика» (г.Москва. 2000 г., 2003 г.), на VIII Всероссийской конференции «Нейрокомпьютеры и их применения» (г.Москва, 2002 г.), на семинаре Лаборатории вычислительного эксперимента (ЮГИНФО РГУ, г Ростов-на-Дону, 2003г.), а также на семинарах кафедры биофизики и биокибернетики физического факультета РГУ и НИИ НК РГУ.
Публикации. По теме диссертации опубликовано 8 работ, из них 1 - в российском рецензируемом журнале, 7 - в тезисах и материалах конференций.
Структура диссертации. Работа состоит из введения, четырех глав, заключения, списка литературы, приложения и изложена на 134 страницах, содержит 30 рисунков и 3 таблицы; список литературы включает 124 наименования.
Заключение диссертация на тему "Модель нейронной сети с преднастройкой для решения задач формирования сенсомоторной координации робота-манипулятора"
ВЫВОДЫ
1. Разработана и исследована новая архитектура локально-адаптивной нейронной сети, позволяющая осуществлять аппроксимацию функциональных зависимостей кусочно-непрерывными функциями без наращивания структуры нейросети и без использования итерационной процедуры приближения на всей области определения функции.
2. Разработан и исследован алгоритм преднастройки модели нейронной сети, основанный на комбинаторном вытормаживании вставочных нейронов и позволяющий осуществлять локальные адаптивные процедуры уточнения или видоизменения выходной функции на отдельных участках без переобучения всей нейронной сети.
3. Исследованы алгоритмы определения параметров модели нейросети с преднастройкой, обеспечивающие функциональную универсальность и возможность автоматической настройки нейросети на требуемое функциональное преобразование без изменения ранее заданных параметров.
4. Показано, что при реализации функции константности восприятия в системе управления программной моделью двухзвенного робота-манипулятора, использование модели нейронной сети с преднастройкой расширяет возможности системы и увеличивает точность сенсомоторной координации.
ЗАКЛЮЧЕНИЕ
Основным результатом диссертационной работы является разработка и анализ искусственной нейронной сети нового типа, ориентированной на решение задач организации активного поведения робота-манипулятора в неорганизованной и изменяющейся внешней среде.
Модель нейронной сети с преднастройкой, с одной стороны, эффективно сочетает свойства локальной адаптивности и структурно распределенного представления аппроксимирующих функций, каждое из которых присуще существующим нейронным сетям только по отдельности. С другой стороны, для построения требуемой функциональной зависимости реализуется принципиально иной механизм адаптации, нежели в известных нейронных сетях, - преднастройка.
Проведенное сравнительное тестирование с многослойной нейронной сетью обратного распространения ошибки и нейросетью адаптивной резонансной теории показало, что следствием указанных характеристик разработанной модели является ее способность решать задачи построения функциональных зависимостей во многом более эффективно. А именно: нейронная сеть с преднастройкой не требует пакетных способов обучения, не требует наращиваемости структуры, позволяет осуществлять преобразования локально, при этом достигается высокая точность приближения при небольших фиксированных размерах нейроструктуры.
Из важных свойств нейросети с преднастройкой выделяется ее возможность работать в условиях, вне зависимости от того, задается ли целевая функция на входных или выходных переменных. Это обеспечивается разработанным алгоритмом преднастройки, в основе которого лежит случайный поиск вытормаживающих комбинаций вставочных нейронов нейросети. Эффективность случайного поиска решений в нейросети с преднастройкой по сравнению с известными нейросетевыми реализациями обусловлена переходом из высокоразмерного пространства настраиваемых весовых коэффициентов с непрерывными значениями в пространство меньшей размерности регулируемых порогов вставочных нейронов с бинарными значениями.
Конкретные значения весовых коэффициентов тормозных связей вставочных нейронов нейросети с преднастройкой оказывают прямое влияние на ее размеры для достижения требуемой точности аппроксимации. Исследование функциональной универсальности разработанной нейроструктуры позволило выбрать способ инициализации весовых коэффициентов тормозных связей вставочных нейронов нейросети случайными значениями.
Эта процедура представляется простой и не требующей каких-либо дополнительных вычислительных алгоритмов. Кроме того, при этом достигается баланс между малыми размерами сети и надежностью при поиске вытормажимающих комбинаций.
Возможность получения функционально универсальной структуры состоялась благодаря разделению функций между двумя модулями нейронной сети. В нейронной сети адаптг вной фильтрации, подробно рассматриваемой в данной работе, на единожды определенных ее размерах и параметрах реализуются все функциональные преобразования, а в нейронной сети состояний запоминаются соответствующие преднастраивающие воздействия. Нейросеть состояний является обучающейся и осуществляет поисковый процесс вытормаживающих комбинаций на вставочные нейроны нейросети адаптивной фильтрации, имеющих смысл преднастройки данной сети на локальные функциональные преобразования. Если говорить о повышении эффективности поиска, осуществляемого сетью преднастройки, то, скорее всего, следует его связывать с какими-то ассоциативными процессами в этой нейросети и соответствующими механизмами обучения.
Исследование применения нейронной сети с преднастройкой для реализации функции константности восприятия в системе управления программной модели двухзвенного робота-манипулятора показало, что такая функция позволяет организовать активное поведение робота в неорганизованной и динамически изменяющейся внешней среде. Это в свою очередь существенно расширяет круг задач, решаемых робототехнической системой, и повышает точность выполнения заданных манипуляционных операций.
В качестве перспективных направлений использования нейронной сети с преднастройкой выделяются реализация адаптивного управления робота-манипулятора с воспроизведением селективного внимания. Необходимость воспроизведения селективного внимания диктуется тем, что в изменяющихся и неорганизованных средах робот должен функционировать в многоцелевом режиме, когда для реализации одной цели значения каких-то входных переменных могут быть незначимы, а для реализации другой цели реакция на изменение этих переменных должна быть вполне определенной. Рассмотренные механизмы преднастройки нейронных сетей в полной мере относятся и к задачам активного зрительного восприятия, когда в зависимости от текущей цели поведения робота не только переключается внимание, но и меняется алгоритм интерпретации текущих зрительных сигналов. При этом основная идея использования нейросети с преднастройкой в таких задачах, как и в рассмотренных задачах силового восприятия, состоит в том, чтобы избежать разделения между восприятием и генерацией поведения и соединить их в едином нейронном процессе. Важным является то, что тогда зрительные сцены характеризуются непосредственно в категориях поведения, т.е. суммой действий, которые, например, описьиают возможные способы доступа к частично закрытым объектам.
Результаты исследований представлены на сайте НИИ нейрокибернетики по адресу http://www.kгinc.ru/dnшmr/d5nnp.htшl.
Библиография Шепелев, Игорь Евгеньевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Куафе Ф. Взаимодействие робота с внешней средой: Пер. с франц. М.: Мир, 1985. -285 с.
2. Козлов Ю.М. Адаптация и обучение в робототехнике. М.: Наука. Гл. ред. физ.-мат. лит.,1990.-248 с.
3. Иващенко Н.Н. Автоматическое регулирование. Теория и элементы систем. М.:Машиностроение, 1973. 606 с.
4. McCulloch W.S. Agathe tyche of nervous nets the lucky reckoners. // Proc. Symposium on Mechanization of Thought Processes, N.P.L., Teddington, 1958.
5. Antsaklis P.J. Defining intelligent control. // IEEE Control Systems, Report of the Task Force on Intelligent Control, 1994.
6. Bezdek J. Fuzzy models what are they, and why? // IEEE Transactions on Fuzzy Systems,1993, 1(1), pp. 1-6.
7. Goldberg D. Genetic Algorithms in Machine Learning, Optimization,and Search. Addison-Wesley, 1988.
8. Haykin S. Neural Networks. MacMillan, New York, 1994.
9. Eccles J.C., Ito M., Szentagothai J. The cerebellum as a neuronal machine. New York,1. Springer, 1967.
10. Marr D. A theory of cerebellar cortex. // J. Physiol., 1969. v.202. - pp. 437-470.
11. Albus J.S. A theory of cerebellar function. // Math. Bioschi., 1971. v. 10. - pp. 25-61.
12. Bishop C.M. Neural Networks for Pattern Recognition. Oxford University Press, 1995.
13. Ripley B.D. Pattern Recognition and Neural Networks. Cambridge University Press, 1996.
14. Коган А.Б. Некоторые проблемы искусственного интеллекта робота. // В сб. Робототехника. Выпуск 2.1979. с. 11-18.
15. Мкртчян С.О. Нейроны и нейронные сети. Москва. Энергия, 1971, 231 с.
16. Галушкин А.И. Теория нейронных сетей. М.:ИПРЖР. Сер. «Нейрокомпьютеры и их применение». Кн. 1. 2000.
17. Мак-Каллок У.С., Питтс В. Логическое исчисление идей, относящихся к нервной активности. // В кн. Автоматы. М.: ИЛ. 1956. с.362 384.
18. Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996.-276 с.
19. Stone M.N. The Generalized Weierstrass Approximation Theorem. // Math. Mag., 1948. v.21. -pp. 167-183.
20. Hornik К., Stinchcombe М., White Н. Multilayer feedforward networks are universal approximators. // Neural Networks, 1989. vol. 2. - pp. 359-366.
21. Cybenko G. Approximation by superpositions of a sigmoidal function. // Mathematics of Control, Signal and Systems, 1989. vol. 2. - pp. 303-314.
22. Park J., and Sandberg I.W. Universal approximation using radial basis function networks. // Neural Computation, 1991. v.3. - pp. 246-257.
23. Leshno M., Lin V., Pinkus A., and Schocken S. Multilayer feedforward networks with a nonpolynomial activation function can approximate any function. // Neural Networks, 1993. -v.6. — pp. 861-867.
24. Горбань А.Н. Обучение нейронных сетей. М.: СП ParaGraph, 1990. 160 с.
25. Parker D.B. Learning-logic. Invention Report. 1982.
26. Rumelhart D.E., Hinton G.E., and Williams R.J. Learning internal representations by error propagation. In Parallel distributed processing, London: MIT Press, 1986. vol. 1. - 550 p.
27. Werbos P.G. Beyond regression: New tools for prediction and analysis in the behavioral sciences. Ph.D. Thesis, Dept. of Applied Mathematics, Harvard University, Cambridge, Mass, 1974.
28. Lisboa P.J.G. A review of evidence of health benefit from artificial neural networks in medical intervention. // Neural Networks, 2002. v.15. - pp. 11-39.
29. Robert R. Trippi. Neural Networks in Finance and Investing. Probus Publishing Company,1993.
30. Tagliaferri R., Longo G., D'Argenio B. and Incoronato A. Introduction: Neural networks for analysis of complex scientific data: astronomy and geosciences. // Neural Networks, 2003. v.16.
31. Miller W.T., Sutton R.S., Werbos P.J. Neural Networks for Control. MIT Press, 1996.
32. Omid O., Elliot D.L. Neural Systems for Control. Academic Press, 1997.
33. Lewis F. L., Yesildirek A., Liu K. Multilayer neural-net robot controller with guaranteed tracking performance. // IEEE Trans. Neural Networks, 1996. vol. 7. - pp. 388-399.
34. Liguni Y., Sakai H., Tokumaru H. A nonlinear regulator design in the presence of system uncertainties using multilayer neural networks. // IEEE Trans, on Neural Networks, 1995. -vol. 2. no. 2. - pp. 410-417.
35. Ozaki Т., Suzuki Т., Furuhashi Т., Okuma S., Uchikawa Y. Trajectory control of robotic manipulator using neural networks. // IEEE Trans, on Industrial Electronics, 1991. vol. 38. -no. 3. - pp. 195-202.
36. Fu J., N. Sinha K. An iterative learning scheme for motion control of robots using neural networks: a case study. // Journal of Intel. & Robotic Systems, 8, 1993, pp. 375-398.
37. Heiss M. Error-minimizing dead zone for basis function networks. // IEEE Trans. On Neural Networks, 1996. vol. 7. - no.6. - pp. 1503-1506.
38. Arimoto S., Kawamura S., Miyazaki F., Bettering operation of robots by learning. // J. Robot
39. System, 1984. v.l. - pp.123-140.
40. Bondi P., Casaline G., Gambardella L., On the iterative learning control theory for robotic manipulators. // IEEE J Robot & Automation, 1988. vol. 4. - no. 1. - pp. 14-22.
41. Kuc T. Y., K. Nam, J. S. Lee, A iterative learning control of robot manipulators. // IEEE Trans, on Robotics and Automation, 1991. vol. 7. - no. 6. - pp. 835-841.
42. Тимофеев A.B. Управление роботами: Учебное пособие. Л.: Изд-во Ленингр. ун-та,1986.-240 с.
43. Окамото К. Алгоритм управления многозвенным манипулятором. // В сб. Интегральные роботы. Выпуск 2. М.:Мир, 1975. с. 305-322.
44. Pieper D.L. Kinematics of manipulator under computer control, Stanford A.I. Rep., Memo No. AI-72, 1968.
45. Самарин А.И. Нейросетевые модели в задачах управления поведением робота. // В кн.: Лекции по нейроинформатике. 3-я Всероссийская научно-техническая конференция "Нейроинформатика 2001". М.: МИФИ. 2001. - с. 60-102.
46. Sutton R., A. Barto. Reinforcement Learning: An Introduction. Cambridge: MIT Press, 1998. -432 p.
47. Торндайк Э., Уотсон Д.Б. Бихевиоризм. М.:Аст, 1998. 704 с.
48. Растригин Л.А. Системы экстремального управления. М., Наука, 1974. 632 с.
49. Barto A.G., Sutton R.S., Anderson C.W. Neuronlike adaptive elements that can solve difficult learning control problems. // IEEE Transactions on Systems, Man and Cybernetics, 1983. -v.13. pp. 834-846.
50. Williams, R.J. Simple statistical gradient-following algorithms for connectionist reinforcement learning. // Machine Learning, 1992, 8, pp. 229-256.
51. Wassermann P.D. Combined backpropagation Cauchi machine. // Neural Networks. Abstacts of the First INNS Meeting, 1988. v.l. - pp. 556-559.
52. Yang S. X., Mengb M. An efficient neural network approach to dynamic robot motion planning. // Neural Networks, 2000. v.l3. - no. 2. - pp. 143-148.
53. Martin P., Millan J., Learning reaching strategies through reinforcement for sensor-based manipulator. // Neural Neworks, 1998. v.l 1. - pp. 359-376.
54. Gullapalli V. Direct associative reinforcement learning methods for dynamic systems control. // Neurocomputing, 1995. v.9. - pp. 271-292.
55. Simons J., Brussil H.V., Schutter J.D. and Erhaert J. A self-learning automation with variable resolution for high precision assembly by industrial robots. // IEEE Trans. Automatic Control, 1982.-v. 27.-pp. 1109-1113.
56. Gullapalli V., Grupen R. and Barto A, Learning reactive admittance control. // In Proceedings IE^E Int. Conf. on Robotics and Automation. 1992. pp. 1475-1480.
57. Bosman S. Locally weighted approximations: yet another type of neural network. PhD Thesis. Intelligent Autonomous group, Department of Computer Science, University of Amsterdam. 1996.
58. Fiesler E. Minimal and high order neural network topologies. // In Proceedings of the Fifth Workshop on Neural Nerworks, 1993. v.2204. - pp. 173-178.
59. Moody J., Antsaklis P.J. The dependence identification neural network construction algorithm. //IEEE Transactions on Neural Networks, 1996.-v. 7.-no. l.-pp. 3-15.
60. Wynne-Jones M. Node splitting: a constructive algorithm for feed-forward neural networks. // Neural Computing And Applications, 1993. v.l. - no. 17.
61. Новиков A.B. Решение задачи классификации на нейронной сети переменной структуры. // Труды VIII Всероссийской конференции «Нейрокомпьютеры и их применение», 2002. -с. 1153-1161.
62. Ка nin E.D. A simple procedure for pruning backpropagation trained neural networks. // IEEE Transactions on Neural Networks, 1990. v. 1. - no.2. - pp. 239-242.
63. Reed R. Pruning algorithms a survey. // IEEE Transactions on Neural Networks, 1993. - v.4. -no.5. - pp. 740-747.
64. Ивахненко А.Г. Теория самоорганизации основа прямого моделирования сложных систем по экспериментальным данным. // В сб. Проблемы адаптивного управления, 1974. -с. 192-211.
65. Holland J. Adaptation in Natural and Artificial Systems. University of Michigan Press, 1975.
66. Jones A.J. Genetic algorithms and their applications to the design of neural networks. Neural computing and applications, 1993. v. 1. - no. 1. - pp. 32-45.
67. Radcliffe N.J. Genetic set recombination and its application to neural network topology optimization. // Neural computing and applications, 1993. v.l. - no. 1. - pp. 67-90.
68. Montana D. and Davis L., Training feedforward neural networks using genetic algorithms. // In Proc. of Eleventh International Joint Conference on Artificial Intelligence, San Mateo, CA, US A, 1989. pp. 762-767.
69. Божич В.И., Лебедев О.Б., Шницер Ю.Л. Разработка генетического алгоритма обучения нейронных сетей. // Перспективные информационные технологии и интеллектуальные системы. 2001. -№1. с. 21-24.
70. Wicker D., Rizki М. М., Tamburino L. A. E-Net: Evolutionary neural network synthesis. // Neurocomputing, 2002. v.42. - pp. 171-196.
71. Hu J., Wellman M.P. Multiagent Reinforcement Learning: Theoretical Framework and an Algorithm. // In Proceedings of the Fifteenth International Conference on Machine Learning (ICML-98), Madison, WI, USA, 1998. pp. 242-250.
72. McFarland D.J., Boesser T. Intelligent behaviour in animals and robots. Cambridge, MA: MIT Press/Bradford Books, 1993.
73. Сегерлинд Л. Применение метода конечных элементов. Пер. М: Мир, 1979. 392 с.
74. Дорогов А.Ю. Быстрые нейронные сети. СПб.: Изд-во С.-Петерб. ун-та, 2002. - 80 с.
75. Wu J., Huang С.Н. Back-Propagation Neural Networks for Identication and Control of a Direct Drive Robot. // J.of Intelligent and Robotic Systems, 1996. vol. 16. - no.l. - pp. 45-64.
76. Zalzala Ali, Morris Alan A neural network approach to adaptive robot control. International Journal of Neural Networks, 1991. v.2. - по. 1. - pp. 17-33.
77. Nanayakkara Thrishantha, Watanabe Keigo, Kiguchi Kazuo, Izumi Kiyotaka. Controlling
78. Multi-Link manipulators by Fuzzy Selection of Dynamic Models. // In Proc. of IEEE International Conference on Industrial Electronics, Control and Instrumentation, 2000. pp. 638-643.
79. Kawato M., Y. Uno, M. Isobe, and R. Suzuki, Hierarchical neural network model for voluntary movement with application to robotics. // IEEE Control System Magazine, 1988. vol. 8. - no. 2.-pp. 8-15.
80. Nauayakkara Т., Watanabe K., Izumi K. Evolving in Dynamic Environments Through Adaptive Chaotic Mutation. // In Procs.of Fourth International Symposium on Artificial Life and Robotics, 1999. v.2. - pp. 520-523.
81. Miller III, W.T. Real-time application of neural networks for sensor-based control of robots with vision. // IEEE Transactions on Systems, Man, and Cybernetics, 1989. v. 19. - no. 4. -pp. 825-831.
82. Kohonen, T. Self-Organization and Associative Memory. Berlin: Springer, 1988.
83. Martinetz T., Ritter H., and Shulten K. Three-dimensional neural net for learning visiomotor coordination of a robot arm. // IEEE Transactions on Neural Networks, 1990. v.l. - no.l. -pp. 131-136.
84. Albus J. A new approch to manipulator control: the Celeberal Model Articulation Controller (CMAC). // Trans.of the ASME. Journal of Dynamic System, Measurement and Controls. 1975.-v.97.-pp. 220-227.
85. Cembrano G., Wells G., and Ruggeri A. Dynamic control of a robot arm using CMAC neural networks. // Contol Eng. Practice, 1997. v.5. - no.4. - pp. 485-492.
86. Miller W.T., Glanz F.H., and Kraft L.G. Application of a general learning algorithm to the control of robotic manipulators. // Journal of Robotics Research, 1987. v.6. -no.2. - pp. 8498.
87. Ananthraman S. and Garg D.P., Training backpropagation and CMAC neural networks for control of a SCARA robot. In Engineering Applications of Artificial Intelligence. Pergamon Press.
88. Carpenter G.A., Grossberg S. A Massively Parallel Architecture for a Self-Organizing Neural Pattern Recognition Machine. // Computer Vision, Graphics, and Image Processing, 1987. v. 37.-pp. 54-115.
89. Srinivasa N., Sbarma, R. A self-organizing invertible map for active vision applications. // In Proceedings of the World Congress on Neural Networks, 1996. pp. 121-124.
90. Hesselroth Т., Sarkar К., van der Smagt P., and Shulten K. Neural network control of pneumatic robot arm. // IEEE Transactions on Systems, Man, and Cybernatics, 1994. v.24. - no.l. pp.28-38.
91. Katayama M. and Kawato M., A parallel-hierarchical neural network model for motor control of musculo-skeletal system, ATR Auditory and Visual Perception Research Laboratories, TR-A-0145, 1992.
92. Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968. 399 с.
93. Ивашкин B.C., Онуфриева B.B. Перцептивная преднастройка и зрительные персеверации. // В сб.: Фундаментальные и прикладные психологические исследования. Владимир, 1998. Вып. 1. - 81 с.
94. Фейгенберг И.М., Иванников В.А. Вероятностное прогнозирование и преднастройка к действиям. М.:Изд-во МГУ, 1978. - 112 с.
95. Трифонов Е.В. Психофизиология человека. Толковый русско-английский словарь. Санкт-Петербург, Россия, 2001.
96. Анохин П.К. Принципиальные вопросы общей теории функциональных систем. В кн.: Принципы системной организации функций. М.: Наука. 1973. - с. 5-61.
97. Чароян О.Г. Карпенко Л.Д. Адаптация и торможение в свете информационной деятельности нервной системы. // В сб. статей Проблемы адаптивного управления. Ростов-на-Дону, 1974.-е. 49-59.
98. Eccles, J.C. The Inhibitory Pathways of the Central Nervous System, 1969, Liverpool University Press.
99. Юб.Мас Key D.M. Possible information-processing functions of inhibitory neural neuronal mechanisms. Perg. Press., p.529, 1968.
100. Hartline H.K. Receptor mechanisms and the integration of sensory information in the eye. // Rev. of Mod. Physics, 1959. v.31. - p.515.
101. Kawato M., Wolpert D.M. Multiple paired forward and inverse models for motor control. Neural Networks, 1998. vol. 11. - pp. 1317-1329.
102. Самарин А.И. Бионическая модель системы "глаз-рука" зрительно-двигательной координации робота. // В Докл. Межд. Конференции по Бионике, Бионика-78, M.-JL, 1978. т. 1. - с. 147-149.
103. Ю.Фицнер JI.H. Биологические поисковые системы. М.:Наука, 1977,138 с.
104. Ш.Самарин А.И. Формирование сенсомоторных отношений при активном взаимодействии автономной системы с внешней средой. // В сб. научных трудов Всероссийской научно-технической конференции «Нейроинформатика 99». М.: МИФИ. 1999. - 4.2. - с. 172 — 180.
105. Angelaki D.E., Mchenry M.Q., Dickman J.D., Newlands S.D., and Hess B.J.M. Computation of inertial motion: neural strategies to resolve ambiguous otolith information. // J Neurosci, 1999. -v.l 9. -pp.316-327.
106. Snyder L. This way up: illusions and internal models in the vestibular system. Nat Neurosci. 1999. v.2. -pp.396-398.
107. Merfeld D.M., Zupan L., and Peterka R.J. Humans use internal models to estimate gravity and linear acceleration. // Nature, 1999. v.398. - pp.615-618.
108. Розен P. Принципы оптимальности в биологии. М.: Мир, 1969. 216 с.
109. Нб.Зенкевич О., Морган К. Конечные элементы и аппроксимация. Пер. с. англ. М.: Мир,1986.-318с.
110. Петросян В.Г., Петросян Т.В. Методы перебора в решении физических задач. // Информатика и образование, 1996. с. 73-83.
111. Goldberg D. Genetic Algorithms in Machine Learning, Optimization, and Search. Addison-Wesley, 1988.
112. Розенблатт Ф. Принципы нейродинамики: перцептроны и теория механизмов мозга: Пер. с англ. М.: Мир, 1965.-480 с.
113. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. М.:Мир. 1992. - 184 с.
114. Hansen L., Pathria R., Salamon P. Stochastic dynamics of supervised learning. // Journal of Physics A, 1993. v.26. - pp. 63-71.
115. Zadeh L. Fuzzy Sets. Information and Control, 1988. - v.8. - pp. 338-353.
116. Carpenter G.A., Grossberg S., and Reynolds J.H. ARTMAP: Supervised real-time learning and classification of nonstationary data by a self-organizing neural networks. // Neural Networks, 1991.-vol. 4.-pp. 565-588.
117. Фу К., Гонсалес P., Ли К. Робототехника. Пер. с англ. М.:Мир, 1989. - 624 с.
-
Похожие работы
- Геометрическое моделирование и оптимизация процессов управления адаптивным промышленным роботом
- Математические методы и алгоритмы управления кинематически избыточными манипуляторами на основе нейронных сетей
- Методы построения интеллектуальных систем планирования и управления перемещением робота-манипулятора в неизвестной среде
- Математические модели и эффективные методы решения задач кинематики, динамики и управления роботами
- Разработка технических систем управления с использованием биологических принципов обработки информации
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность