автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.15, диссертация на тему:Разработка и исследование экстраполирующих сетей нейропроцессорных систем управления мобильных роботов
Автореферат диссертации по теме "Разработка и исследование экстраполирующих сетей нейропроцессорных систем управления мобильных роботов"
На правах рукописи
Писаренко Сергей Николаевич
РАЗРАБОТКА И ИССЛЕДОВАНИЕ ЭКСТРАПОЛИРУЮЩИХ СЕТЕЙ НЕЙРОПРОЦЕССОРНЫХ СИСТЕМ УПРАВЛЕНИЯ МОБИЛЬНЫХ РОБОТОВ
Специальности: 05.13.15 - Вычислительные машины и системы 05.13.01 - Системный анализ, управление и обработка информации
Автореферат диссертации на соискание ученой степени кандидата технических наук
Таганрог - 2004
Работа выполнена на кафедре вычислительной техники Таганрогского государственного радиотехнического университета
Научный руководитель доктор технических наук, профессор Чер нухин Юрий Викторович
Официальные оппоненты:
доктор технических наук, профессор Ромм Яков Евсеевич; доктор технических наук, профессор Гайдук Анатолий Романович.
Ведущая организация НИИ Нейрокибернетики им. Б.А. Когана, г. Ростов-на-Дону.
Защита состоится 29 апреля 2004 г. в 14-20 на заседании диссертационного совета Д 212.259.02 при Таганрогском государственном радиотехническом университете по адресу: 347928, г. Таганрог, пер. Некрасовский, 44, ауд. Д-406.
С диссертацией можно ознакомиться в библиотеке университета.
Автореферат разослан 24 марта 2004 г.
Ученый секретарь диссертационного совета
Д 212.259.02
Общая характеристика работы
Актуальность темы. Несмотря на бурное развитие средств вычислительной техники классической фон-неймановской архитектуры, остается ряд областей, где их возможностей недостаточно. Одной из таких областей является техника адаптивных мобильных роботов (МР), предназначенных для функционирования в условиях априорной неопределенности динамически изменяющейся внешней среды. Сферы применения таких МР обширны и разнообразны: автоматизированное производство, транспорт, домашнее хозяйство, медицина, космос, оборона, подводные исследования, спасательные и ремонтно-восстановительные работы в экстремальных условиях и т.п. Во многих из них присутствие человека нежелательно или вообще невозможно. Поэтому для успешного решения поставленных задач, подобно высокоразвитым живым существам, адаптивные МР должны обладать таким важным качеством, как приспосабливаемость к неформализованной изменяющейся рабочей среде.
Несмотря на то, что исследования по разработке адаптивных МР активно ведутся во всех промышленно развитых странах мира, их успехи пока не велики. Такое положение связано с тем, что реализация требуемых качеств адаптивных МР предполагает решение ряда проблем, имеющих фундаментальный характер. В первую очередь, это проблемы адекватного восприятия и распознавания внешней среды, целенаправленного планирования поведения и эффективного исполнения спланированных действий. И если последняя проблема достаточно успешно решается методами теории автоматического управления с использованием ЭВМ традиционной архитектуры с последовательным принципом обработки информации, то решение первых двух проблем на тех же вычислительных средствах связано со значительными трудностями. Причиной этого является не только необходимость обработки больших объемов информации от распределенных в пространстве и параллельно функционирующих датчиков в реальном масштабе времени, но и применение новых мозгоподобных способов обработки информации, на которые эти ЭВМ не ориентированы. Это обстоятельство приводит к необходимости синтеза специализированных многопроцессорных вычислительных систем нейросетево-го типа на основе бионических подходов к управлению МР. Некоторые представления о бионических механизмах управления разработаны П. К. Анохиным в виде функциональной системы. Подобные механизмы использовались ранее при разработке однородных управляющих структур адаптивных роботов. В них восприятие внешней среды МР и обработка информации реализуется в виде целостных образов, состоящих из множества элементов, описывающих состояние участков среды (плана среды), то есть так, как это происходит в живых системах. Для эффективной работы с такой информацией нейросети в системе управления МР также должны быть организованы в виде параллельных вычислительных структур - ней-ропроцессорных сетей. Анализ показывает, что в большинстве случаев математические операции, выполняемые такими нейропроцессорными сетями крайне просты и могут быть сведены к элементарным логическим операциям. На основе этих представлений были изготовлены макетные образцы МР, но из-за недостаточной микросхемотехнической базы они использовали лишь простейшие нейропроцес-сорные сети, которые не учитывали динамику быстрых перемещений препятствий
и цели в среде. В то же время теоретическое исследование вопросов применения в нейропроцессорных системах управления МР нейроподобных сетей для экстраполяции ситуаций в среде, показали, что они могут существенно улучшить качество планируемых траекторий и повысить безопасность МР. Однако в этих исследованиях рассматривались лишь простейшие экстраполирующие сети и не затрагивались проблемы, связанные с исследованием методов организации экстраполирующих сетей, оптимизацией числа шагов экстраполяции с целью повышения ее точности, а также вопросы программного моделирования и исследования систем управления МР с экстраполяцией. Именно эти вопросы решаются в рамках данной диссертационной работы, что делает ее актуальной и своевременной.
Настоящая работа является дальнейшим развитием результатов исследований, проводимых на кафедре вычислительной техники ТРТУ под руководством профессора Чернухина Ю.В.
Объектом исследования служат комплексные экстраполирующие сети логического типа (алгоритмы функционирования, структура, функциональные возможности), а также алгоритмические и структурные аспекты организации нсйро-процессорных систем управления МР с их использованием.
Целью работы является разработка и исследование нейросетевых алгоритмов экстраполяции ситуаций в динамически изменяющейся внешней среде и реализующих их структур, встраиваемых в нейропроцессорные системы планирования перемещений МР, а также разработка способов учета кинематических и динамических характеристик шасси МР при отработке спланированных траекторий.
Методы исследований. Для достижения поставленной цели применялись элементы теории дискретной техники, численных методов, теории множеств, адаптивного управления и языков программирования.
Научная новизна. Осуществлен анализ известных методов планирования и управления мобильными роботами в динамически изменяющейся среде их функционирования; синтезированы алгоритмы и реализующие их структуры комплексной экстраполирующей сети; синтезирована процедура оптимизации числа шагов экстраполяции для разработанной сети; разработана и экспериментально исследована на программной модели нейропроцессорная система планирования перемещений МР с оптимизацией числа шагов экстраполяции ситуаций в среде; разработан и экспериментально исследован на программной модели и на действующем макете МР «Скиф» механизм взаимодействия нейропроцессорного уровня планирования и синергетического регуляторного уровня исполнения.
Основные положения, выносимые на защиту. На защиту выносятся следующие положения и результаты:
- алгоритм функционирования и структура комплексной экстраполирующей
сети;
- процедура оптимизации числа шагов экстраполяции;
- алгоритм и реализующая его структура подсистемы адаптивной экстраполяции процессов в среде функционирования МР;
- алгоритм и реализующая его структура системы управления МР с адаптивной экстраполяцией процессов во внешней среде;
- механизм взаимодействия стратегического уровня нейропроцессорного планирования траекторий движения МР с адаптивной экстраполяцией процессов в
среде его функционирования и тактического уровня их исполнения на базе лози-ционно-траекторного регулятора.
Практическая ценность работы. Разработанные в диссертации экстраполирующие сети и механизм взаимодействия нейропроцессорного планировщика и позиционно-траекторного регулятора ориентированы на" применение в действующих системах управления мобильных роботов с целью повышения их эффективности в процессе эксплуатации. Полученные в работе результаты использовались в госбюджетной НИР №12293 по гранту Минобразования РФ «Синтез нейросете-вых структур и исследование алгоритмической базы систем динамического планирования поведения интеллектуальных мобильных роботов», в НИР №12163 «Разработка теоретических основ и методов пейрокомпыотерного конструирования многокритериальных систем управления промышленными роботами», при выполнении проекта РФФИ №99-01-00071 «Синергетические методы синтеза и пейрокомпыотерная реализация систем планирования и управления интеллектуальных роботов», в учебном процессе кафедры вычислительной техники Таганрогского государственного радиотехнического университета, а также при разработке системы управления действующего макета мобильного робота «Скиф» ТРТУ.
Апробация работы. Основные результаты работы докладывались на:
- Международной конференции «Идентификация систем и задачи управления» (М„ ИПУ РАН, 2000 г.);
- Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления», (ТРТУ, 2000 г.);
- XII научно-технической конференции «Экстремальная робототехника» (СПбГТУ, 2001 г.);
- Всероссийской научной конференции с международным участием молодых ученых и аспирантов «Новые информационные технологии. Разработка и аспекты применения» (Таганрог, ТРТУ, 2001 г.);
- Международной научно-технической конференции «СуперЭВМ и многопроцессорные вычислительные системы» (Таганрог, ТРТУ, НИИ МВС, 2002 г.);
- 5-ой научной школе-конференции «Мобильные роботы и мехатронные системы» (Москва, МГУ, 2002 г.);
- Международной конференции по нейрокибернетике (Ростов-на-Дону, РГУ, НИИНейрокибернетики им. Б.А. Когана, 2002 г.)
- научных семинарах кафедры ВТ в 2002-2003 г.г.
Публикации. По теме диссертации опубликовано 15 печатных работ, в которых отражены основные результаты диссертации и зарегистрированы два отчета по НИР.
Структура и объем работы. Материал основной части диссертационной работы изложен на 156 страницах машинописного текста. Диссертация состоит из введения, четырех разделов, заключения и списка литературы из 70 наименований, содержит 72 рисунка, 5 таблиц и 3 приложения на 36 страницах.
Содержание работы
Во введении обосноваиа актуальность темы диссертационной работы, сформулированы цели исследования и приведены основные результаты работы.
В первой главе анализируется общая задача управления МР в динамически изменяющейся внешней среде, как задача оптимального планирования и эффективного исполнения спланированных траекторий движения к подвижному целевому объекту среди мешающих стационарных и произвольно перемещающихся препятствий. Приведена обобщенная структура системы управления МР (см. рисунок 1), решающего данную задачу.
Сенсорная подсистема (СП) воспринимает участки внешней среды и формирует исходные данные для подсистемы формирования ее модели (ПФМВС). Подсистема планирования (ПП) на базе модели внешней среды реализует выработку стратегических маршрутов движения к целевому объекту с учетом динамических свойств среды, а рогуля-торная подсистема (РП) - их отработку с учетом кинематических и динамических особенностей собственной эффекторной подсистемы (ЭП) МР.
Проанализированы возможности известных традиционных методов планирования перемещений МР в динамически изменяющейся среде, построенных на основе классической теории искусственного интеллекта и реализуемых на последовательных ЭВМ классической архитектуры. Определено, что они не удовлетворяют выбранным критериям оптимальности (в смысле длины траектории движения МР к целевому объекту) и безопасности (в смысле отсутствия столкновений с подвижными препятствиями) в условиях произвольного перемещения целевого объекта и препятствий.
В связи с этим, как наиболее перспективный, использован бионический метод управления МР на основе нейропроцессорных сетей. Суть его состоит в том, что в процессе взаимодействия МР с неформализованной внешней средой, в его нейронроцессорной планирующей подсистеме (НПС) периодически, перед началом каждого элементарного действия зффекторных устройств, воспроизводится план М; среды, формируемый при помощи СП и ПФМВС (см. рисунок 2).
Этот план отображает имеющее место в момент восприятия взаимное расположение цели, препятствий, самого робота и свободных для движения участков среды с учетом трудности их преодоления. Затем этот план отображается в состояниях нейропроцессоров физически реализованной бортовой планирующей нейросети и на ней отыскивается градиент функционала, определяемого множеством возможных траекторий достижения цели. После этого нейропроцессорной системой принятия решений формируется, а эффекторными устройствами робота отрабатывается вектор и, элементарного перемещения в среде, направленный вдоль вектора антиградиента функционала, найденного на плане среды в нейро-
Рисунок 1 - Обобщенная структура системы управления МР
процессорной планирующей подсистеме. Данные действия повторяются автоматически на каждом шаге дискретного времени Ъ (время ^ изменяется квантами ,
= 4- ) до достижения роботом цели.
Экспериментальные исследования приведенного нейропроцессорного метода планирования показали его высокую эффективность. В частности, он гарантирует, что если в среде существует оптимальный путь к цели, то он будет найден. Причем, если такая нейросеть реализована аппаратно, то время поиска сравнимо с тактовой частотой работы устройства. Однако эти исследования проводились лишь в стационарной и квазистационарной среде и не учитывали особенностей произвольного перемещения препятствий и цели. В свою очередь, учет этих особенностей приводит к необходимости оперативного упреждения положений подвижных препятствий и цели. Для этого в состояниях элементов НПС должен отображаться экстраполированный план проходимости среды М?. При этом планируемый вектор элементарного перемещения и? будет направлен в упрежденную точку траектории движения преследуемой цели с учетом упрежденного положения подвижных препятствий. Поскольку НПС такими свойствами не обладает, то необходимы дополнительные структуры, реализующие операцию экстраполяции ситуации в среде. Чтобы обеспечить выдачу в НПС упрежденного плана среды в реальном масштабе времени они также должны быть нейросетевыми.
Использование для этой цели известных алгоритмов и структур нейропро-цессорных экстраполирующих сетей адаптивных МР связано с рядом трудностей. В частности, возникают проблемы экстраполяции объектов, занимающих произвольное число смежных элементов плана среды и движущихся с различными скоростями. Неясно так же, как реализовать различные методы (линейной, квадратичной) экстраполяции дискретных траекторий перемещения объектов среды на ее плане и как оптимизировать глубину экстраполяции в функции от скорости перемещения робота и препятствий. Кроме того, отсутствуют механизмы эффективной отработки ЗП МР спланированных с учетом упрежденных положений цели и препятствий траекторий. Теоретическому решению указанных проблем и посвящена глава II данной диссертационной работы.
Во второй главе разработана комплексная экстраполирующая сеть (КЭС). Она синтезирована с учетом современных физиологических представлений о механизмах переработки зрительной информации у животных и состоит из 4-х слоев осуществляющих различные этапы обработки плана среды (см. рисунок 3).
Текущий бинарный план проходимости среды М,
Бинарный план положения объектов в среде М(по
Слой экстраполяции скорости перемещения
у
План разрешений экстраполяции М,рэ
Слой экстраполяции направления перемещения
Экстраполированный бинарный план проходимости среды Ммэ
Первый (сжимающий) слой позволяет нижележащим слоям корректно воспринимать сложные объекты, занимающие на плане среды несколько его смежных элементов. Он формирует бинарный план положения объектов среды М?10, выделяя для каждого сложного объекта его характерный элемент (дискретный аналог характерной точки) на исходном плане среды М,. Второй слой формирует план разрешений экстраполяции М^3, прогнозируя задержки перемещения выделенных первым слоем характерных элементов по плану среды и тем самым, прогнозируя линейную скорость перемещения самих объектов. Третий слой, прогнозирует будущие изменения положений характерных элементов на основе известных положений предыдущих, вырабатывая план направлений экстраполяции М['э. Такое разделение на экстраполяцию по скорости и направлению, упрощает структуру от-
Рисунок 3 - Структура комплексной экстраполирующей сети
дельных слоев КЭС. Наконец, четвертый слой формирует экстраполированный на один шаг план среды М?, реализуя сдвиг всех элементов объектов на исходном плане М| в направлении М|1Э их прогнозируемых перемещений с учетом задержек М,1'3.
Далее разрабатываются алгоритмы функционирования и структура каждого из слоев КЭС, а также общий алгоритм ее работы. При синтезе ячеек второго и третьего слоев рассмотрен случай линейной экстраполяции времени и направлений перемещений. При синтезе сети экстраполяции направлений показаны различия в связях ячеек для прямоугольной и радиальной организации плана среды.
Очевидно, что экстраполяция ситуаций в среде на один шаг вперед недостаточна для эффективного планирования и необходима многошаговая экстраполяция. Ее реализация с помощью КЭС проста в случае линейной экстраполяции и заключается в том, что на вход сжимающего слоя поступает не воспринятый с по-
мощью ПМФВС план среды М,, а экстраполированный на один шаг вперед план
среды М?, с выхода сдвигающего слоя. Вновь сформированный на выходах КЭС в результате такой замены план будет описывать ситуацию в среде на 1+2 шаге. Аналогично можно получить план среды на ¡+3,1+4, ..л+к шаге. Прн-этом возникает вопрос оценки максимального количества шагов к экстраполяции.
Естественным образом такая оценка может быть произведена путем сравнения экстраполированного плана среды с реальным планом, полученным от ПФМВС. Реализация этой идеи представлена на рисунке 4. В БЗ (блоке задержки)
записан сформированный на (М^-О шаге и упрежденный на Ц4 шагов вперед план
среды М?. На текущем, ¡-м шаге происходит сравнение БС (блоком сравнения) М? с реальным планом среды М? от ПФМВС. Величина г{ рассогласования этих планов используется в БО (блоке оценки) для определения нового значения Ц. Далее КЭС реализует операцию экстраполяции на Ц шагов вперед. При этом БВ (блок выбора) подает на вход КЭС либо полученный от ПФМВС текущий реальный план М! среды при я=0, либо
экстраполированный на один шаг вперед план М?ч+1 с выходов КЭС. Причем последняя операция повторяется к]-1 раз до получения упрежденного на Ц- шагов плана М?к) среды, который записывается в блок задержки (БЗ). Для реализации
операции сравнении планов, разработан метод сравнения планов положений и синтезирована логическая сеть, выполняющая такое сравнение. Она формирует
[о, если М"° = М"оэ; бинарныи сигнал ошибки ei = ^ ^поэ Интервал между коррекцией
числа шагов экстраполяции для приведенной процедуры составляет Ц шагов. Поскольку среда априори неформализована и динамически изменяется то при достаточно большом числе этих шагов, возможен случай, когда ситуация в ней в течение этого интервала существенно трансформируется. При этом экстраполяция на Ц шагов перестанет быть достоверной и МР будет планировать свое движение, учитывая ложную ситуацию в среде. Чтобы избежать такой ситуации, необходимо оценивать возможности экстраполяции не только на к, шагов, но и на один шаг. Иначе говоря, необходима двухуровневая оценка результатов экстраполяции: долгосрочная, связанная с возможностью предсказывать траектории движения объектов в целом и краткосрочная, связанная с возможностью вообще производить экстраполяцию ситуации в среде.
Рисунок 4 - К процедуре оптимизации числа шагов экстраполяции
При этом используется следующий алгоритм работы БО для определения кг Если е, = 1 для краткосрочной экстраполяции, то = 0, то есть прогнозирование ситуации в среде по каким-либо причинам невозможно. В противном случае, если
" к г
е, = 1 для долгосрочной экстраполяции, то kj = , иначе = кн + 1. На основе этого алгоритма синтезируется учитывающий особенности КЭС более детальный алгоритм и реализующая его структура подсистемы адаптивной экстраполяции ситуации в среде (ПАЭС).
Для случая связанной с корпусом MP системы формирования плана среды (например, той, что проиллюстрирована рисунком 2) возможно появление ошибок экстраполяции, являющихся следствием собственного перемещения MP. При этом одни и те же элементы планов, поступающих на БС, будут описывать различные участки среды. Для решения этой проблемы план среды привязывается не к роботу, а к какой-либо характерной точке самой среды. Однако, поскольку рабочая область MP может значительно превышать размеры области восприятия, точку привязки необходимо периодически смещать по мере перемещения самого MP. Если ПМФВС работает в радиальной системе координат, связанной с MP, то перед экстраполяцией воспринятый ею план должен быть преобразован к прямоугольному. Аналогично, после экстраполяции результирующий план М?° среды в прямоугольной системе координат может быть преобразован к радиальному для планирования на нем перемещения нейропроцессорной сетью.
Далее синтезируется алгоритм планирования перемещений MP с адаптивной экстраполяцией положения подвижной цели и перемещающихся препятствий (см. рисунок 5).В этом алгоритме оператор Locate определяет ориентацию ак и собственное положение Xpi MP в текущей глобальной системе координат 0,Х]Х2. Оператор Percept на основании воспринятой СП зоны внешней среды формирует план { Мщ, МП| } ее проходимости также в текущей прямоугольной системе координат 0|Х|Х2. При этом он осуществляет периодическую смену ее базовой точки О,. Если СП работает в радиальной системе координат, то Percept дополнительно реализует ее преобразование к прямоугольной. При этом используются данные об ориентации и положении MP в 0,XjX2. Оператор AExtrT реализует алгоритм экстраполяции с оптимизацией глубины для плана цели, a AExtrB - для плана препятствий. Кцтах и Кцтах ограничивают максимальное число шагов экстраполяции. Величину Кцтах целесообразно задавать пропорционально числу тактов Pj функционирования НПС с момента поступления на нее плана проходимости среды до момента принятия решения, то есть до момента формирования направления U,, поскольку Р, пропорционально длине кратчайшей траектории достижения цели. Величину Кпшах предлагается оценивать в зависимости от расстояния Yn, от MP до ближайшего препятствия и перемещения ДХР(,.|) MP на предыдущем шаге:
1. i=0;
2. { aPl, XPl }= Locate;
3. {МЦ,,МП, }= Percept(Xu,,XnJ;
4. Myf = АЕхЦ-т(Мц,, KUmox);
5.M*>=AExtrB(Mn,,KnmJ;
6. {Mg.MS }= RadialMn°, aPj, XP,),
7. U, = PathPlan , );
8. ДХР, =pP,U,At; 9- XP(H]) = XP, + AXPl;
10. Если XP(i+1) = Хц,, то перейти к п. 12,
иначе к п. 11;
11. i=i+l, перейти к п. 2;
12. Останов MP.
Рисунок 5 - Алгоритм планирования перемещений с адаптивной экстраполяцией
возможностями ЭП. При достижении целевого объекта происходит останов MP, в противном случае описанные действия повторяются.
Важным является вопрос выбора временного шага At работы системы управления MP, реализующей рассмотренный алгоритм планирования. Пусть V0 - характерная средняя скорость движения объектов среды (цели и препятствий). При этом возможны три случая соотношения скоростей рр и V0: pP»V0, рР « V0, рр » V0 . В первом случае экстраполяция перемещения объекта не даст сколь либо значительного эффекта, так как такой объект будет практически стационарным по отношению к динамическим возможностям MP. Во втором случае экстраполяция также бесполезна, поскольку динамических возможностей MP недостаточно для реакции на изменения положений такого объекта. Следовательно, экстраполяция целесообразна только лишь для подвижных объектов, скорость которых определяется третьим условием. Для этого случая в работе получена оценка At, связывающая скорость движения робота рр, геометрические размеры участка среды, соответствующего одному элементу ее плана и быстродействие КЭС,
Стремление к улучшению качества не только планирования, но и отработки спланированных в НПС траекторий, приводит к выводу о целесообразности использования в нейропроцессорной системе управления с экстраполяцией траек-торного регулятора. В качестве последнего используется позиционно-траекторный
Оператор Radial преобразует план проходимости (Мц", Mf°), сформированный
в системе координат 0,х|х2 к радиальному плану
} с учетом ориентации aPl и положения Хр, МР в системе 0¡xix2.
Оператор PathPlan, как описано выше, определяет на экстраполированном радиальном плане проходимости среды {М*>,М& } в НПС единичный вектор U¡ оптимального направления перемещения МР к цели. ЭП отрабатывает шаг перемещения ДХК = p,U,At. В простейшем случае можно положить рР, = рР - const, где рР - рабочая скорость линейного перемещения МР, определяемая
регулятор, синтезированный в соответствии с синергетическими подходами в теории управления. Суть данного подхода заключается в трансформации желаемых фазовых траекторий в притягивающие многообразия в фазовом пространстве МР. То есть, при начальных отклонениях МР от целевого положения или внешних возмущениях определенного класса, робот, в силу используемых алгоритмов управления, гарантированно притягивается в заданное состояние, обеспечивая выполнение поставленной перед ним задачи. Такой регулятор обеспечивает асимптотическую устойчивость в целом планируемых траекторий и наличие свойств робастности замкнутой системы, то есть малой чувствительности к изменению параметров объекта управления.
Динамическая и кинематическая модель МР на базе транспортной тележки как объекта неголономной природы описывается следующими уравнениями:
¿ = Р(г)+В(г)-и,
у = М(у,г,г) = (М|,М2,...МП)Т, где 2 - п-вектор наблюдаемых и управляемых внутренних координат; Б(г) -вектор-функция нелинейных компонентов, определяющая особенности динамики робота; В(г) - невырожденная (п х п)-матрица коэффициентов управления, определяющая степень многосвязности системы; и - п-вектор управлений; у - ш-вектор-столбец наблюдаемых внешних координат (т>п, т<6); М - вектор-функция внешних скоростей или кинематическая модель МР; г - конструктивные параметры тележки робота; Т - символ транспонирования соответствующей матрицы.
Например, для автомобильной компоновки шасси МР, одно уравнение описывает динамику ведущих колес, другое - рулевых (п=2). Два уравнения определяют координаты робота (уР1, уР2) и угол его ориентации а в системе внешних координат (ш=3).
Траектории движения МР по горизонтальной плоской поверхности в пространстве внешних координат Оу)у2 удобно описывать кривыми второго порядка:
2Т =у -И, -у+N2 -у + Из =0,
(1)
где Ы, =
Ь. 2
Мг=а4
N3 =|а,
6 >
У =
Различные наборы коэффициентов ар ]=1,2...б, позволяют сформировать траектории движения робота, описываемые эллипсами, параболами, гиперболами или прямыми.
Движение вдоль квадратичных форм от внешних координат (1) организуется посредством позиционно-траекторного регулятора вида:
и(г, у) = -[к,1Ш}"1 [к, (ЯР+ЬМ) + кгМ + к3],
к, =СА
О, 2ут
к2 = А
+ С
+ СА
2утМ, 0
, О, =2^,+14,, (2)
_ _ дМ _ дМ
дл. — -г . Ъ — ~ .
дгт ду
где С и А - положительно определенные п х п матрицы задаваемых постоянных коэффициентов; - желаемая контурная скорости движения МР.
Алгоритм (2) гарантирует выход робота на заданную фазовую траекторию. Его настройка осуществляется изменением параметров матриц С и А. Учет алгоритмом (2) динамических эффектов, возникающих при движении робота, позволяет повысить точность отработки планируемых фазовых траекторий.
Исходный принцип взаимодействия планирующей нейросети и регулятора на основе алгоритма (2) состоит в следующем. На выходах ПФМВС появляется план проходимости среды {Мц,,Мп, }. Он поступает в НПС, которая вырабатывает единичный вектор и, направления перемещения робота, соответствующий кратчайшей траектории движения к цели так, как это было описано выше и фиксирует его в многостабильном триггере. Вместе с этим на вход регулятора поступает та часть плана МП!, которая содержит информацию о состоянии внешней среды непосредственно по курсу движения робота и эта часть плана проверяется на наличие препятствий. Если их нет, то робот под управлением регулятора движется по прямой, направление которой определяет выход многостабияьного триггера нейросети, то есть и,. Иными словами, траекторией движения робота в этом случае служит частный случай кривой (1).
Если препятствия есть, то формируется аппроксимирующий их контур эллипс (см. рисунок 6а), вычисляются описывающие его коэффициенты ^ и регулятор начинает выработку управляющих воздействий (3) для движения по рассчитанному контуру. В процессе движения по контуру обхода препятствия НПС продолжает вырабатывать единичный вектор и, направления движения к цели. Данное направление постоянно сравнивается с тем направлением, которое выработано регулятором и при обнаружении факта совпадения осуществляется переключение на описанный выше режим прямолинейной траектории. Таким образом, робот движется по траектории, состоящей из криволинейных и прямолинейных локальных траекторий (см. рисунок 66).
Экспериментальные исследования на программных и программно-аппаратных моделях подтвердили целесообразность идеи совмещения стратегического уровня планирования действий мобильного робота с тшсгическим уровнем их исполнения при помощи регулятора. Однако использование при этом рассмотренного метода взаимодействия НСП и регулятора, как в статической среде так и в динамически изменяющееся связано с рядом трудностей. Суть трудностей в статической среде заключается в неоптимальности эллиптического контура для препятствий невыпуклой формы или вытянутых вдоль произвольной осн. В динамически изменяющейся среде, при обходе подвижного препятствия возникает необходимость в периодической смене контура его обхода в соответствии с перемещением препятствия. В ситуации с подвижной целью возникает неопределенность выбора направления обхода препятствия, закрывающего прямой путь к цели. Указанные обстоятельства приводят к выводу о необходимости разработки нового способа формирования траекторий для регулятора, свободного от рассмотренных недостатков. Для эффективной работы в динамической среде этот способ должен учитывать возможность изменения вектора и, и, соответственно, траектории для регулятора на каждом такте функционирования системы управления МР.
Идея предлагаемого механизма взаимодействия НПС и регулятора заключается в том, что траектория для отработки в регуляторе формируется только лишь на основе положений МР и значений вектора и( и не использует какую-либо дополнительную информацию о плане среды. Это делает реализацию тактического уровня полностью независимым от структуры вышележащих систем стратегического планирования, которые, могут включать, в частности, рассмотренные подсистемы экстраполяции ситуации в среде. Пусть и: - спланированное НПС на текущем 1-м шаге направление перемещения МР, ур! - текущее положение МР в среде, ур(И) - его положение на предыдущем шаге, ур(1+2) - его будущее положение на ¡+2 шаге, ур(|+2) = ур! + 2уки,Л1, где у^ - заданная контурная скорость движения МР. Сформируем эллиптическую траекторию, проходящую через эти три
У 1р(|+2) У 2р(|+2) 1 точки. В случае, если П= у,р1 у2р! 1
У1Р(|-1) Угро-1) 1
прямой) сформируем прямолинейную траекторию, также проходящую через эти точки. Выбор в качестве будущей точки именно ур(1+2), а не ур(,+1) преследует две
цели: избежать резкого поворота МР при подходе к ур(1+1) (что может привести к
срыву траектории), а также та идея, что в большинстве случаев направление и, на следующем шаге слабо отличается от предыдущего. Синтезированный с учетом рассмотренного принципа взаимодействия НПС и регулятора алгоритм функционирования МР может быть представлен в следующем виде:
1. Восприятие участка внешней среды и формирование его плана.
2. Определение собственного положения ур1 МР.
= 0 (все три точки лежат на одной
3. Стратегическое планирование НСП единичного вектора направления оптимального перемещения МР к цели (с экстраполяцией положений препятствий и цели и т.п.).
4. Планирование скорости движения МР (в простейшем случае ук - сопв1).
5. Если О = 0, то к п. 6 иначе к п. 7.
6. Формирование набора коэффициентов {N¡,,N^,N¡3} для прямой. Перейти к п. 8.
7. Формирование набора коэффициентов { Мп, N,2, Ы|3 } для эллипса.
8. Отработка регулятором набора параметров {N,,,N^,N¡3, А,С} в течение элементарного временного интервала Дг с перемещением МР из ур! в точку Ур(!+1) •
9. Если ур(Ы) = уЦ|, то перейти к п. 11, иначе к п. 10.
10. ¡=¡+1, перейти к п. 1.
11. Останов МР.
В третьей главе описана программная моделирующая среда МЯ-Бил, разработанная для проведения экспериментальных исследований и изучения функционирования алгоритмов управления МР. За счет применения объектно-ориентированного подхода создан удобный базовый набор классов, описывающих элементы МР (СП, ЭП, НПС, ПАЭС и т.д.) и среду его функционирования (подвижные и стационарные препятствия, целевые объекты). Используя наследование, на основе такого набора можно легко создавать новые модели МР и проблемной среды в соответствии с поставленными задачами.
Среда обладает дружественным интерфейсом пользователя, реализованным с помощью технологии «документ-вид». В качестве примера на рисунке 7 приведен общий вид экрана среды в режиме моделирования.
С ее помощью экспериментально исследовался синтезированный алгоритм планирования перемещений МР с адаптивной экстраполяцией процессов во внешней среде. Результаты этих исследований позволяют говорить о работоспособности разработанного алгоритма. При этом применение ПАЭС позволяет НПС в большинстве случаев (более 85% смоделированных проблемных ситуаций) планировать более короткие и более безопасные траектории движения к подвижной цели среди мешаю-
Рисунок 7 - Основное окно программной моделирующей среды
щих стационарных и перемещающихся препятствий, по сравнению с НПС без применения экстраполяции их перемещений. Результаты экспериментального исследования разработанного механизма взаимодействия НПС и позиционно-траекторного регулятора синергетического типа в иерархической системе управления, проведенные также с помощью Мг.Зйп подтверждают его работоспособность и эффективность в условиях динамически изменяющейся внешней среды. Результаты наиболее характерных экспериментов описаны в диссертационной работе.
В таблице 1 представлены оценки быстродействия аппаратной реализации КЭС и ее программной модели.
В таблице 2 представлены оценки скорости движения объектов, при которых их перемещение может быть корректно экстраполировано на 10 шагов вперед (оценки получены в предположении, что размеры участка, соответствующего одному элементу плана среды, равны ОД х 0,1 м).
Таблица 1 - Оценка быстродействия КЭС
Размерность плана среды Программная модель, с Аппаратная реализация, с
32x32 0,00065 0,000013
64x64 0,0025 0,000026
128x128 0,011 0,000051
256x256 0,052 0,0001
Таблица 2 — Оценка скоростей перемещения объектов
Размерность плана среды Программная модель, м/с Аппаратная реализация, м/с
32x32 15 770
64x64 4 384
128x128 0,91 196
256x256 0,2 100
В четвертой главе отражено применение полученных в диссертационной работе результатов в действующем макете мобильного робота «Скиф» ТРТУ и программной моделирующей среде ИоЬоРаШ, ориентированной на использованием в учебном процессе.
Приведены характеристики и рассмотрена программно-аппаратная организация МР «Скиф» (см. рисунок 8). При его разработке использован иерархический способ построения систем управления, развиваемый в главе 2 данной диссертационной работы и классы среды М11,8пт1. Описан один из разработанных алгоритмов решения задач с маяками, заключающийся в выходе МР на маяк. Экспериментальные исследования, этих алгоритмов, а так же разработанного в данной работе механизма взаимодействия НПС и регулятора, показали их работоспособность.
Для практического изучения алгоритмических и аппаратных основ построения систем управления МР необходимо использование либо аппаратных, либо адекватных программных средств. В то же время действующие макеты МР достаточно дороги, а их программные модели либо узко специализированы, либо рассчитаны на высокий уровень подготовки пользователя, что не позволяет применять их в образовательных целях. Таким образом, возникают задачи разработки достаточно простых средств моделирования и изучения систем управления МР. С
этой целыо на основе программной моделирующей среды МЯ-Эил разработана ориентированная на использование в учебном процессе программная среда, позволяющая моделировать процесс функционирования бортовой системы управления МР, построенного, в частности, на основе нейропроцессорного метода планирования.
Одной из основных особенностей предлагаемой программной среды (симуля-тора) ЯоЬоРа(Ь, является дружественный интерфейс пользователя (см. рисунок 9).
Симулятор позволяет настраивать конфигурацию элементов рабочего пространства МР (препятствий и цели) на заданный вариант их расположения, задавать траектории перемещающихся препятствий, определять кинематические ограничения МР и параметры его системы восприятия. МР управляется программной моделью микропроцессора, совместимого с ¡8086, программирование которого осуществляется на языке ассемблера. Для ввода программ в симулятор встроен текстовый редактор. Симулятор предоставляет широкие возможности визуального наблюдения за процессом функционирования системы управления МР.
В заключении формулируются основные результаты, полученные в ходе выполнения диссертационной работы.
Основные результаты диссертационной работы
Рисунок 8 - Внешний вид МР «Скиф»
Охно
отображении состояния
микропроцессора и Оно трехмерного
Окно пгодп унраолекнп выполненном отображения
программы прмрзммы с рады АМР
Рисунок 9 - Общий вид окрана РоЬоРаШ
1. Проведен анализ существующих систем планирования перемещений МР в условиях динамически изменяющейся внешней среды его функционирования.
Рассмотрены трудности, связанные с использованием ранее предложенных алгоритмов и структур экстраполирующих сетей.
2. Синтезирована комплексная экстраполирующая сеть на основе четырех-слойной нейросети лошического типа. Разработаны алгоритмы функционирования и структура каждого из слоев сети, а также общий алгоритм ее работы.
3. Разработана процедура оптимизации числа шагов экстраполяции, основанная на сравнении сформированного подсистемой формирования модели внешней среды плана и полученного в комплексной экстраполирующей сети. На ее основе синтезирован алгоритм и реализующая его структура подсистемы адаптивной экстраполяции ситуации в среде.
4. Синтезирован алгоритм и реализующая его структура системы управления MP на базе нейропроцессорного подхода к планированию перемещений и разработанного алгоритма адаптивной экстраполяции ситуаций во внешней среде.
5. Синтезирован механизм взаимодействия нейропроцессорного планировщика с адаптивной экстраполяцией процессов во внешней среде и позиционно-траекггорного регулятора, обеспечивающий эффективное исполнение спланированных траекторий с учетом кинематических и динамических характеристик MP.
6. Разработана программная моделирующих среда MR-Sim, ориентированная на разработку, исследование и изучение систем управления MP в условиях динамически изменяющейся внешней среды.
7. С использованием среды MR.Sim экспериментально исследованы разработанные алгоритмы. Качественные оценки результатов этих исследований позволили сделать вывод об их работоспособности и высокой эффективности в условиях динамически изменяющейся внешней среды. Выполненные оценки быстродействия комплексной экстраполирующей сети для случаев программной и аппаратной реализации показали увеличение возможностей последней по экстраполяции подвижных объектов более чем в 100 раз, что позволяет говорить о возможности функционирования аппаратов реализованных нейропроцессорных систем планирования с разработанными экстраполирующими сетями не только в реальном масштабе времени, но и с существенным его опережением.
8. Результаты работы использованы при разработке действующего макета мобильного робота, в учебном процессе и при выполнении трех НИР.
Публикации по теме диссертации
1. Y.V. Chernukhin S.N. Pisarenko. Extrapolation Structures in Neural Network-Based Control Systems for Intelligent Mobile Robots. Optical Memory and Neural Networks, Vol. 11, No. 2,2002, pp. 105-115.
2. Чернухин Ю.В., Писаренко C.H. Нейросетевая экстраполяция в системах управления интеллектуальных мобильных роботов //Сборник докладов Юбилейной Международной конференции по нейрокибернетике. - Ростов-на-Дону: йзд-во ООО «ЦВВР», 2002. - т.2. - С. 147-151.
3. Чернухин Ю.В., Писаренко С.Н. Нейросетевая и нейропроцессорная организация экстраполирующих структур мобильных роботов //Материалы Между-
народной научно-технической конференции. - Таганрог: Изд-во ТРТУ, 2002. -С. 258-261.
4. Чернухин Ю. В., Писаренко С.Н. Экстраполирующие структуры нейро-сетевого типа в системах управления интеллектуальных мобильных роботов //Сборник трудов II международной конференции «Идентификация систем и задачи управления» SICPRO'03. - М.: Изд-во ИПУ РАН им. В.А. Трапезникова, 2003. -С. 1809-1820.
5. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев O.E. «Устройство управления адаптивным мобильным роботом». Патент РФ. RU 2187832 С2. Бюл. № 23,2002.
6. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев O.E. Алгоритм организации взаимодействия нейросетевого и синергетического регуляторов в системах управления мобильных роботов //Тезисы докладов 4-ой Всероссийской конференции с международным участием молодых ученых и аспирантов «Новые информационные технологии. Разработка и аспекты применения». - Таганрог: Изд-во ТРТУ, 2001. -С. 104-107.
7. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев O.E., Сергеев A.B. Способ организации взаимодействия нейросетевого и синергетического регуляторов в системах управления мобильных роботов //Известия ТРТУ. Тематический выпуск: Материалы Всероссийской научно-технической конференции с международным участием «Компьютерные технологии в инженерной и управленческой деятельности». - Таганрог: Изд-во ТРТУ, 2002. - №2(25). - С. 146-148.
8. Чернухин Ю.В., Пшихопов В.Х., Трубачев O.E., Писаренко С.Н. Иерархическое нейросетевое управление адаптивными мобильными роботами в программной среде //Сборник трудов первой международная конференция по меха-тронике и робототехнике «МиР'2000». - СПб.: НПО Омега БФ Омега, 2000. - Т.2. - С. 375-379.
9. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев O.E. Моделирование нейросетевых систем управления интеллектуальных мобильных роботов //Сборник трудов международной конференции «Идентификация систем и задачи управления» SICPRO'2000. - М.: ИПУ РАН, 2000,- С. 1108-1114.
10. Чернухин Ю.В., Пшихопов В.Х., Трубачев O.E., Писаренко С.Н. Программная среда для моделирования поведения адаптивных мобильных роботов с двухуровневой системой управления. -М.: Мехатроника, 2000. -№6. - С. 26-30.
И. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев O.E. Программно-аппаратный комплекс моделирования нейросетевых систем управления интеллектуальных мобильных роботов //Материалы XII научно-технической конференции «Экстремальная робототехника» /Под научной редакцией проф, Е.И. Юревича. - СПб.: Изд-во СПбГТУ, 2002. С. 16-22.
12. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев O.E. Программно-аппаратный комплекс моделирования нейросетевых систем управления интеллектуальных мобильных роботов. - М.: Мехатроника, 2002. - №1. - С. 27-29.
13. Чернухин Ю.В., Гузик В.Ф., Трубачев O.E., Писаренко С.Н. Программная среда для моделирования поведения мобильных роботов с элементами искус-
ственного интеллекта //Материалы Международной научно-практической конференции. - Новочеркасск: Изд-во ЮРГГУ (НПИ) «Набла», 2001. - 4.3. - С. 43-47.
14. Чернухин ЮЛ., Писаренко С.Н., Трубачев O.E. Изучение нейросетевой системы управления адаптивного мобильного робота //Практические работы по курсу «Системы искусственного интеллекта и нейрокомпьютеры». - Таганрог: Изд-воТРТУ,2001. -С. 42-74.
15. Чернухин Ю.В., Трубачев O.E., Писаренко С.Н. Алгоритм моделирования процессов во внешней среде адаптивного мобильного робота //Сборник трудов Всероссийской научно-технической конференции с международным участием «Компьютерные технологии в инженерной и управленческой деятельности». -Таганрог: ТРТУ, 2000. - С. 100.
16. Чернухин Ю.В., Писаренко С.Н., Трубачев O.E. Синтез нейросетевых структур и исследование алгоритмической базы систем динамического планирования поведения интеллектуальных мобильных роботов. Заключительный отчет о НИР/ ТРТУ. Руководитель Ю.В. Чернухин. ГР №01200107244; Инв. № 02200303181. - Таганрог: ТРТУ, 2003.
17. Пшихопов В.Х., Чернухин Ю.В., Иванов Ю.И. и др. Разработка теоретических основ и методов нейрокомпьютерного конструирования многокритериальных систем управления промышленными роботами. Заключительный отчет о НИР/ ТРТУ. .Руководитель В.Х. Пшихопов. ГР № 01200112477. - Таганрог: ТРТУ, 2003. ' •
В работах, опубликованных в соавторстве, личный вклад автора состоит в следующем: в [1, 2, 3, 4, 16] - разработаны алгоритмы функционирования и структура экстраполирующей сети, многошаговый алгоритм экстраполяции процессов во внешней среде; в [5, 6, 7, 8,9, 10,11, 12, 15, 16] - разработан алгоритм взаимодействия планирующей нейропроцессорной сети и позиционно-траекторного регулятора, его программная и программно-аппаратная реализация; в [13,14,16] - программная реализация нейросетевой системы управления робота.
РНБ Русский фонд
Тип.ТРТУ Заказ тир./фэ
Оглавление автор диссертации — кандидата технических наук Писаренко, Сергей Николаевич
ВВЕДЕНИЕ.
1 МЕТОДЬ1 ПЛАНИРОВАНИЯ ПЕРЕМЕЩЕНИЙ МОБИЛЬНОГО РОБОТА В ДИНАМИЧЕСКИ ИЗМЕНЯЮЩЕЙСЯ ВНЕШНЕЙ СРЕДЕ.
1.1 Задача управления мобильным роботом в динамически изменяющейся внешней среде.
1.2 Традиционные методы планирования.
1.3 Нейропроцессорный метод планирования.
1.4 Экстраполяция ситуаций в среде.
1.5 Выводы.
2 РАЗРАБОТКА АЛГОРИТМОВ И СТРУКТУР ЭКСТРАПОЛИРУЮЩИХ СЕТЕЙ ДЛЯ НЕЙРОПРОЦЕССОРНЫХ СИСТЕМ ПЛАНИРОВАНИЯ ТРАЕКТОРИЙ МОБИЛЬНЫХ РОБОТОВ.
2.1 Синтез алгоритмов и реализующих их структур комплексной экстраполирующей сети.
2.1.1 Общая структура сети.
1.2 Синтез сжимающей сети.
1.3. Синтез сети для экстраполяции скоростей перемещения.
1.4 Синтез сети для экстраполяции направлений перемещения.
1.5 Синтез сдвигающей сети.
1.6 Общий алгоритм функционирования комплексной экстраполирующей сети.
2.2 Синтез алгоритмов и реализующих их структур нейропроцессорных систем планирования с экстраполяцией.
2.2.1 Процедура оптимизации глубины экстраполяции.
2.2.2 Синтез алгоритмов сравнения планов среды и оценки числа шагов экстраполяции.
2.2.3 Синтез подсистемы адаптивной экстраполяции ситуации в среде
2.2.4 Синтез алгоритма и реализующих его структур планирования перемещений мобильного робота с оптимизацией глубины экстраполяции
2.3 Синтез механизма взаимодействия нейропроцессорной планирующей подсистемы и исполнительной подсистемы на базе синергетического траекторного регулятора.В
2.3.1. Алгоритмы траекторного управления мобильным роботом.
2.3.2 Взаимодействие нейропроцессорного планировщика и регулятора в статической внешней среде.
2.3.3 Взаимодействие нейропроцессорного планировщика и регулятора в быстроизменяющейся внешней среде.
2:4 Выводы.
3 ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ РАЗРАБОТАННЫХ ЭКСТРАПОЛИРУЮЩИХ СЕТЕЙ НА ПРОГРАММНЫХ МОДЕЛЯХ.
3.1 Программная моделирующая среда.
3.2 Результаты экспериментальных исследований алгоритма планирования перемещений MP с оптимизацией числа шагов экстраполяции
3.2 Результаты экспериментальных исследований механизма взаимодействия подсистемы нейропроцессорного стратегического планирования и регулятора синергетического типа.
3.3 Сравнение быстродействия программной модели КЭС и аппаратной ее реализации.
3.4 Выводы.
4. ИСПОЛЬЗОВАНИЕ ПОЛУЧЕННЫХ В РАБОТЕ РЕЗУЛЬТАТОВ ДЛЯ РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ.
4.1 Действующий макет мобильного робота «Скиф» ТРТУ.
4.1.1 Характеристики шасси мобильного робота «Скиф».
4.1.2 Программно-аппаратная организация мобильного робота «Скиф».
4.2 Программная среда RoboPath для моделирования систем управления мобильных роботов, ориентированная на использование в учебном процессе
4.2.1 Общие сведения о программной среде и предпосылки ее создания.
4.2.2 Элементы интерфейса среды и принципы его работы.
4.2.3 Программирование системы управления робота.
4.3 Выводы.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Писаренко, Сергей Николаевич
Актуальность темы. Несмотря на бурное развитие средств вычислительной техники классической Фон-неймановской архитектуры, остается ряд областей, где их возможностей недостаточно. Одной из них является робототехника мобильных роботов (MP), предназначенных для использования в условиях априорной неопределенности динамически изменяющейся внешней среды. Сферы применения подобных MP обширны и разнообразны: автоматизированное производство, транспорт, домашнее хозяйство, медицина, космос, оборона, подводные исследования, спасательные и ремонтно-восстановительные работы в экстремальных условиях и т.п. [1-7] Во многих из них присутствие человека нежелательно или вообще невозможно. Поэтому для успешного решения поставленных задач, подобно высокоразвитым живым существам, MP должны обладать такими важными качествами как адаптивность и приспосабливаемое^ к неформализованной изменяющейся рабочей среде.
Усилия по созданию таких роботов и их бортовых систем управления предпринимаются во многих странах мира. В первую очередь это относится к ведущим робототехническим центрам и фирмам Японии, США, Великобритании, Франции, Германии. Однако, несмотря на эти усилия, имеющиеся практические результаты все еще далеки от желаемых. Это связано с тем, что реализация требуемых качеств MP предполагает решение как минимум трех фундаментальных проблем научно-прикладного характера: адекватного восприятия внешней среды, корректного представления знаний о среде, планирования и эффективного исполнения эффекторными подсистемами робота целенаправленных действий в реальном времени.
И если последняя задача достаточно успешно решается методами теории автоматического управления с использованием ЭВМ традиционной архитектуры с последовательным принципом обработки информации, то решение первых двух задач на тех же вычислительных средствах связано со значительными трудностями. Причиной этого является не только необходимость обработки больших объемов-информации от распределенных в пространстве и параллельно функционирующих датчиков в реальном масштабе времени, но и применение новых мозгоподобных способов обработки информации, на которые эти ЭВМ не ориентированы. Это обстоятельство приводит к необходимости синтеза специализированных многопроцессорных вычислительных систем нейросетевого типа на основе бионических подходов к управлению MP [7-10]. Естественным прообразом бионических управляющих систем служат нейронные сети мозга. Некоторые концептуальные представления о нейрональных механизмах управления в живых организмах сформулированы П.К. Анохиным в виде функциональной системы [11]. Подобные механизмы использовались ранее при разработке однородных управляющих структур адаптивных роботов [8]. В< них восприятие внешней среды MP и обработка информации реализуется в виде целостных образов, состоящих из множества элементов, описывающих состояние участков среды (плана среды), то есть так, как это происходит в живых системах. Для эффективной работы с такой информацией нейросети в системе управления MP также должны быть организованы в виде параллельных вычислительных структур - нейропроцессорных сетей. Анализ показывает, что в большинстве случаев математические операции, выполняемые такими нейропроцессорными сетями крайне просты и могут быть сведены к элементарным логическим операциям [7-10]. На основе этих представлений были изготовлены макетные образцы MP, но из-за недостаточной микросхемотехнической базы они использовали лишь простейшие нейропроцессорные сети, которые не учитывали динамику быстрых перемещений препятствий и цели в среде. В то же время исследование вопросов применения в нейропроцессорной системе управления MP нейроподобных сетей для экстраполяции ситуаций в среде [7,8], показали, что они могут существенно улучшить качество планируемых траекторий и повысить безопасность MP. Однако в этих исследованиях рассматривались лишь простейшие экстраполирующие сети и не затрагивались проблемы, связанные с исследованием методов организации экстраполирующих сетей, оптимизацией числа шагов экстраполяции с целью повышения ее точности, а также вопросы программного моделирования и исследования систем управления MP с экстраполяцией. Именно эти вопросы решаются в рамках данной диссертационной работы, что делает ее актуальной и своевременной.
Настоящая работа является дальнейшим развитием результатов исследований, проводимых на кафедре вычислительной техники ТРТУ под руководством профессора Чернухина Ю.В.
Объектом исследования служат комплексные нейроподобные экстраполирующие сети (алгоритмы функционирования, структура, функциональные возможности), а также алгоритмические и структурные аспекты организации нейропроцессорных систем управления MP" с их использованием.
Целью работы является разработка и исследование нейросетевых алгоритмов экстраполяции ситуаций в динамически изменяющейся внешней среде и реализующих их структур, встраиваемых в нейропроцессорные системы планирования перемещений MP, а также разработка способов учета кинематических и динамических характеристик шасси MP при отработке спланированных траекторий.
Методы исследований. Для достижения поставленной цели применялись элементы теории дискретной техники, численных методов, теории множеств, адаптивного управления и языков программирования.
Научная новизна. Осуществлен анализ известных методов планирования'и управления мобильными роботами в. динамически из*меняющейся среде их функционирования; синтезированы алгоритмы и реализующие их структуры комплексной нейроподобной экстраполирующей сети; синтезирована процедура оптимизации числа шагов экстраполяции для: разработанной сети; разработана и экспериментально исследована на программной модели нейропроцессорная система планирования перемещений MP с оптимизацией числа шагов экстраполяции ситуаций в среде; разработан и экспериментально исследован на программной модели и на действующем макете MP «СКИФ» механизм взаимодействия нейропроцессорного уровня планирования и синергетического регуляторного уровня исполнения.
Основные положения, выносимые на защиту. На защиту выносятся следующие положения и результаты: алгоритм функционирования и структура комплексной экстраполирующей сети;
- процедура оптимизации числа шагов экстраполяции;
- алгоритм и реализующая его структура подсистемы адаптивной экстраполяции процессов в среде функционирования MP;
- алгоритм и реализующая его структура системы управления MP с адаптивной экстраполяцией процессов во внешней среде;
- механизм взаимодействия стратегического уровня нейропроцессорного планирования траекторий движения MP с- адаптивной экстраполяцией процессов в среде его функционирования и тактического уровня их исполнения на базе синергетического контурного регулятора.
Практическая ценность работы. Разработанные в диссертации экстраполирующие сети и механизм взаимодействия нейропроцессорного планировщика и контурного регулятора ориентированы на применение в действующих системах управления мобильных роботов с целью повышения их эффективности в процессе эксплуатации. Полученные в работе результаты использовались в госбюджетной НИР №12293 по гранту Минобразования РФ «Синтез нейросетевых структур и исследование алгоритмической базы систем динамического планирования поведения интеллектуальных мобильных роботов», в НИР №12163 «Разработка теоретических основ и методов нейрокомпьютерного конструирования многокритериальных систем управления промышленными роботами», при выполнении проекта РФФИ №9901-00071 «Синергетические методы синтеза и нейрокомпьютерная реализация систем планирования и управления интеллектуальных роботов», в учебном процессе кафедры вычислительной техники Таганрогского государственного радиотехнического университета, а также при разработке системы управления действующего макета мобильного робота «Скиф» ТРТУ, что подтверждено соответствующими актами.
Апробация работы. Основные результаты работы докладывались на:
- международной конференции «Идентификация систем и задачи управления» (М., ИЛУ РАН, 2000 г.);
- Всероссийской научной конференции студентов и аспирантов «Техническая кибернетика, радиоэлектроника и системы управления», (ТРТУ, 2000 г.);
- XII научно-технической • конференции «Экстремальная робототехника» (СПбГТУ, 2001 г.);
- Всероссийской научной конференции с международным участием молодых ученых и аспирантов «Новые информационные технологии. Разработка и аспекты применения» (Таганрог, ТРТУ, 2001 г.);
- Международной научно-технической конференции «СуперЭВМ и многопроцессорные вычислительные системы» (Таганрог, ТРТУ, НИИ МВС, 2002 г.);
- 5-я научная школа-конференция «Мобильные роботы и мехатронные системы» (Москва, МГУ, 2002 г.);
- Международной конференции по нейрокибернетике (Ростов-на-Дону, РГУ, НИИ Нейрокибернетики им. Б.А. Когана, 2002 г.)
- научных семинарах кафедры ВТ в 2002-2003 г.г.
Публикации. По теме диссертации опубликовано 16 печатных работ, в которых отражены основные результаты диссертации.
Структура и объем работы. Материал основной части диссертационной работы изложен на 156 страницах машинописного текста. Диссертация состоит из введения, четырех разделов, заключения и списка литературы из 70 наименований, содержит 72 рисунка, 5 таблиц и 3 приложения на 36 страницах.
Заключение диссертация на тему "Разработка и исследование экстраполирующих сетей нейропроцессорных систем управления мобильных роботов"
4.3 Выводы
1. Приведены характеристики и рассмотрена программно-аппаратная организация действующего макета MP «Скиф» ТРТУ. При его разработке использованы принципы построения иерархических систем управления, развиваемые в данной работе и классы среды MR.Sim. Описан один из разработанных алгоритмов решения задач с маяками, заключающийся в выходе MP на маяк. Экспериментальные исследования'этих алгоритмов, а так же разработанного в данной работе механизма: взаимодействия НПС и регулятора, показали их работоспособность.
2. Описана разработанная на основе MR.Sim программная моделирующая среда, ориентированная на использование в учебном процессе. Особенностью ее является удобный интерфейс пользователя, позволяющий наблюдать как за самой средой в трехмерном виде, так и за внутренними состояниями системы управления MP. На ее основе на кафедре ВТ ТРТУ поставлена лабораторная работа «Изучение нейросетевой системы управления адаптивного мобильного робота».
ЗАКЛЮЧЕНИЕ
Основные научные результаты работы можно представить следующим образом.
1. Проведен анализ существующих систем планирования перемещений MP в условиях динамически изменяющейся среды его функционирования. Результаты его показывают, что в условиях такой среды рациональным является применение синтезированных на базе бионического подхода нейропроцессорных методов планирования перемещений MP с использованием экстраполяции ситуации в среде. Рассмотрены трудности, связанные с использованием ранее предложенных алгоритмов и структур экстраполирующих сетей.
2. Синтезирована комплексная экстраполирующая сеть на основе четырехслойной нейросети автоматного типа. Разработаны алгоритмы функционирования и структура каждого из слоев сети, а также общий алгоритм ее работы.
3. Разработана процедура оценки числа шагов экстраполяции, основанная на сравнении сформированного в ПФМВС плана среды и полученного в комплексной экстраполирующей сети. На ее основе синтезирован алгоритм и реализующая его структура подсистемы адаптивной экстраполяции ситуации в среде.
4. На базе нейропроцессорного подхода к планированию перемещений MP и разработанного алгоритма адаптивной экстраполяции ситуации в среде синтезирован алгоритм планирования перемещений MP в динамически изменяющейся среде.
5. Синтезирован механизм взаимодействия нейропроцессорного планировщика с адаптивной экстраполяцией ситуации в среде и синергетического регулятора, обеспечивающий эффективное исполнение спланированных траекторий с учетом кинематических и динамических характеристик MP.
6. Разработана программная моделирующих среда MR.Sim, ориентированная на разработку, исследование и изучение систем управления MP в условиях динамически изменяющейся внешней среды.
7. С использованием среды MR.Sim экспериментально исследованы разработанные алгоритмы. Качественные оценки результатов этих исследований позволили сделать вывод об их работоспособности и высокой эффективности в условиях динамически изменяющейся внешней среды. Выполненные оценки быстродействия КЭС для случаев программной и аппаратной реализации показали увеличение возможностей последней по экстраполяции подвижных объектов более чем в 100 раз, что позволяет говорить о возможности функционирования аппаратно реализованных нейропроцессорных систем планирования с разработанными КЭС не только в реальном масштабе времени, но и с существенным его опережением.
Практическое использование результатов работы:
1. При разработке системы управления действующего макета мобильного робота «Скиф» ТРТУ.
2. В учебном процессе кафедры вычислительной техники Таганрогского государственного радиотехнического университета.
3. НИР №12293 «Синтез нейросетевых структур и исследование алгоритмической базы систем динамического планирования поведения интеллектуальных мобильных роботов».
4. НИР №12163 «Разработка теоретических основ и методов нейрокомпъютерного конструирования многокритериальных систем управления промышленными роботами».
5. При выполнении проекта РФФИ №99-01-00071 «Синергетические методы синтеза и нейрокомпьютерная реализация систем планирования и управления интеллектуальных роботов».
Библиография Писаренко, Сергей Николаевич, диссертация по теме Вычислительные машины и системы
1. Юревич Е.И. Робототехника. - СПб.: Изд-во СПбГТУ, 2001.-300 с.
2. Бурдаков С.Ф., Мирошник И.В., Стельмаков Р.Э. Системы управления движением колесных роботов. — СПб.: Наука, 2001. — 227 с.
3. Фу К., Гонсалес Р., Ли К. Робототехника: Пер.с англ. / Под ред. В.Г. Градецкого. М.: Мир, 1989. - 624 с.
4. Бурдаков С. Ф., Первозванский А.А., Смольников Б.А. и др. Проблемы создания мобильных роботов с элементами искусственного интеллекта //Сборник трудов 8-ой научно-технической конференции «Экстремальная робототехника». СПб.: Изд-во СПбГТУ, 1997. С. 5-14.
5. Jean-Paul Laumond (Ed.). Robot Motion Planning and Control, 1998, 343 p.
6. Козлов Ю.М. Адаптация и обучение в робототехнике. М.: Наука, 1990. -248 с.
7. Чернухин Ю.В. Нейропроцессорные сети. — Таганрог: ТРТУ, 1999. — 439с.
8. Каляев А.В., Чернухин Ю.В., Носков В.П., Каляев И.А. Однородные управляющие структуры адаптивных роботов. Под ред. А.В. Каляева и Ю.В. Чернухина. М.: Наука, Гл. ред. физ.-мат. лит., 1990. - 152 с.
9. Чернухин Ю.В. Микропроцессорное и нейрокомпьютерное управление адаптивными мобильными роботами. Таганрог: ТРТИ, 1993. - 91 с.
10. Чернухин Ю.В. Искусственный интеллект и нейрокомпьютеры. Таганрог: Изд-во ТРТУ, 1999. 439 с.
11. И. Анохин П.К. Принципиальные вопросы общей теории функциональных систем // Принципы системной организации функций. М.: Наука, 1973, с. 5-61.
12. Robert Kindel, David Hsu, Jean-Claude Latombem, Stephen Rock. Kinodynamic Motion Planning Amidst Moving Obstacles. IEEE International Conference on Robotics and Automation, 2000.
13. David Hsu. Randomized Single-Querymotion Planning in Expansive Spaces. A Dissertation for the Degree Of Doctor of Philosophy, Stanford University, 2000.
14. V.J. Lumelsky. Decentralized Motion Planning for Multiple Mobile Robots: The Cocktail Party Model. Autonomous Robots, Vol. 4, 1997, pp. 121-135.
15. Kao-Shing Hwang, Hung-Jen Chao. Speed Planning for a Maneuvering Motion. Journal of Intelligent and Robotic Systems, 2002, Vol. 33, Issue 1, pp. 25-44.
16. Paolo Fiorini, Zvi Shiller. Motion Planning in Dynamic Environments using Velocity Obstacles. International Journal of Robotics Research, 1998, Vol. 17, No. 7, pp: 760-772.
17. Ron Kimmel, Nahum Kiryatiy, Alfred M. Brucksteinz. Multi-Valued Distance Maps for Motion Planning on Surfaces with Moving Obstacles. IEEE Transactions on Robotics and Automation, Vol. 14, 1998, pp. 427-438.
18. Jun Miura, Hiroshi Uozumi; Yoshiaki Shirai. Mobile Robot Motion Planning Considering the Motion Uncertainty of Moving Obstacles. Proc. IEEE International Conference on System, Man and Cybernetics, Tokyo, Japan, 1999, pp. IV-692-698.
19. Russell A. Paielli, Heinz Erzberger. Conflict Probability Estimation Generalized to Non-Level Flight. Air Traffic Control Quarterly, Vol. 7, No. 3, 1999, pp. 195-222.
20. Dirk Schulz, Wolfram Burgard. Probabilistic state estimation of dynamic objects with a moving mobile robot. Robotics and Autonomous Systems 34, 2001, pp. 107-115.
21. Ashraf A. Kassim, B.V.K. Vijaya Kumar. Path planners based on the wave expansion neural network. Robotics and Autonomous Systems 26, 1999, pp. 1-22.
22. Simon X. Yang, Max Meng. An efficient neural network approach to dynamic robot motion planning. Neural Networks Vol. 13, 2000, pp. 143—148.
23. R. Glasius, A. Komoda, S. Gielen. Neural network dynamics for path planning and obstacle avoidance. Neural Networks Vol. 8, No. 1, 1995, pp. 125-133.
24. П. Линдсей, Д. Норман. Переработка информации у человека /Под ред. Лурия А.Р. М.: Мир, 1974. - 551 с.
25. А. Р. Лурия. Эволюционное введение в общую психологию. М.: Изд-во МГУ, 1975.
26. Уоссермен Ф. Нейрокомпьютерная техника: теория и практика: Пер. с англ. М.: Мир, 1992. - 240 с.
27. Галушкин А.И. Теория нейронных сетей. М.: ИПРЖР, 2000 г.
28. Галушкин А.И. Нейрокомпьютеры. М.: ИПРЖР, 2000 г.
29. Чернухин Ю.В. Нейропроцессоры. Таганрог: ТРТУ, 1994. - 175 с.
30. Чернухин Ю.В. Нейропроцессорные ансамбли. Таганрог: ТРТУ, 1995. -149 с.
31. Agnes Guillot, Jean-Arcady Meyer. The Animat Contribution to Cognitive Systems Research. http://citeseer.nj.nec.com/guillotOianimat.html.
32. Webb. B. Can robots make good models of biological behaviour? Behavioral And Brain Sciences, №24(6), 2001.
33. Khurana В., Nijhawan R. Extrapolation or attention-shift? Nature, 378, 1995, pp. 565-566.
34. Nijhawan R. Motion extrapolation in catching. Nature, 370, 1994, 256-257.
35. Y.V. Chernukhin S.N. Pisarenko. Extrapolation Structures in Neural Network-Based Control Systems for Intelligent Mobile Robots. Optical Memory and Neural Networks, Vol. 1 1, No. 2,2002, pp. 105-115.
36. Чернухин Ю.В., Писаренко C.H; Нейросетевая экстраполяция в системах управления интеллектуальных мобильных роботов //Сборник докладов Юбилейной Международной конференции по нейрокибернетике. — Ростов-на-Дону: Изд-во ООО «ЦВВР», 2002. -т.2. С. 147-151.
37. Чернухин Ю.В., Писаренко С.Н. Нейросетевая и нейропроцессорная организация экстраполирующих структур мобильных роботов //Материалы Международной научно-технической конференции. Таганрог: Изд—во ТРТУ, 2002.-С. 258-261.
38. Бахвалов Н.С. Численные методы. М.: Изд-во «Наука», 1973. - 632 с.
39. С.П. Пулькин, Л:Н. Никольская, А.С. Дьячков. Вычислительная математика. М.: Изд-во «Просвещение», 1980. - 176 с.
40. Tom Duckett, Ulrich Nehmzow. Mobile robot self-localisation using occupancy histograms and a mixture of Gaussian location hypotheses. Robotics and Autonomous Systems, №34, 2001, pp. 117-129.
41. Giovanni Adorni, Stefano Cagnoni, Stefan Enderle et al. Vision-based localization for mobile robots. Robotics and Autonomous Systems, №36, 2001, pp. 103-119.
42. B.X. Пшихопов. Аналитический синтез синергетических регуляторов для позиционно-траекторных систем управления мобильными роботами //Материалы 11-ой научно-технической конференции «Экстремальная робототехника». СПб.: Изд-во СПбГТУ, 2000.
43. А.А. Колесников. Синергетическая теория управления. М. - Таганрог: 1994.-344 с.
44. Девянин Е.А. О движении колесных роботов // Доклады научной школы-конференции «Мобильные роботы и мехатронные системы». — М.: Из-во МГУ, 1998.
45. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1978. - 833 с.
46. Бронштейн И.Н. Справочник по математике. — М.: Наука, 1967. — 608 с.
47. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев О.Е. «Устройство управления адаптивным мобильным роботом». Патент РФ. RU 2187832 С2. Бюл. № 23, 2002.
48. Домрачев В.Г., Матвеевский В.Р., Смирнов Ю.С. Схемотехника цифровых преобразователей перемещений: Справочное пособие. — М.: Энергоатомиздат, 1987. — 392 с.
49. Чернухин Ю.В., Пшихопов В.Х., Трубачев О.Е., Писаренко С.Н. Программная среда для моделирования поведения адаптивных мобильных роботов с двухуровневой системой управления. — М.: Мехатроника, 2000. — №6. -С. 26-30.
50. Чернухин Ю.В., Пшихопов В.Х., Писаренко С.Н., Трубачев О.Е. Программно-аппаратный комплекс моделирования нейросетевых систем управления интеллектуальных мобильных роботов. М.!: Мехатроника, 2002. — №1. - С. 27-29.
51. Г. Буч. Объектно-ориентированное проектирование с примерами применения /Пер. с англ. СПб.: Питер, 2000. - 622 с.
52. Дэвид Дж. Круглински, Скотт Уингоу, Джордж Шеферд. Программирование на Microsoft Visual С++ 6.0 /Пер. с англ. СПб;: Питер,2001.-864 с.
53. Л. Скэнлон. Персональные ЭВМ-PC и XT. Программирование на языке ассемблера. М., Радио и связь, 1989 - 336 с.
54. Чернухин Ю.В., Писаренко С.Н., Трубачев О.Е. Изучение нейросетевой системы управления адаптивного мобильного робота //Практические работы по курсу «Системы искусственного интеллекта и нейрокомпьютеры». — Таганрог: ТРТУ, 2001. -С. 42-74.
55. Вол охов М.А. Методы предсказания траектории автономного подвижного робота //Сборник трудов первой международная конференция по мехатронике и робототехнике «МиР'2000». СПб.: НПО Омега БФ Омега, 2000.-Т.2.-С. 315-320.
56. Ивахненко А.Г., Лапа В.Г. Предсказание случайных процессов. — Киев: Наукова думка, 1971.
57. П.В. Китчин, А. Пью. Обработка бинарных изображений //Техническое зрение роботов /Под редакцией А. Пью. М.: Машиностроение, 1987. — 320 с.
58. Дж. Г. Николе, А.Р. Мартин, Б. Дж. Валлас, П.А. Фукс. От нейрона к мозгу /Пер. с англ. М.:Едиториал, 2003. - 672 с.
-
Похожие работы
- Разработка и исследование методов построения отказоустойчивых нейропроцессорных систем
- Синтез систем управления гибкими производственными системами на основе имитационных экстраполирующих моделей
- Алгоритмы теоретико-множественного анализа сложных вычислительных систем на базе нейропроцессоров
- Разработка и исследование нейросетевых алгоритмов решения задач навигации интеллектуальными мобильными агентами в нестационарных средах
- Разработка системы управления мобильных роботов с использованием нечетких моделей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность