автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка методов формирования целенаправленного поведения аниматов на основе конечных автоматов

кандидата технических наук
Никифорова, Анна Михайловна
город
Таганрог
год
2005
специальность ВАК РФ
05.13.17
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка методов формирования целенаправленного поведения аниматов на основе конечных автоматов»

Автореферат диссертации по теме "Разработка методов формирования целенаправленного поведения аниматов на основе конечных автоматов"

На правах рукописи Никифорова Анна Михайловна

РАЗРАБОТКА МЕТОДОВ ФОРМИРОВАНИЯ ЦЕЛЕНАПРАВЛЕННОГО ПОВЕДЕНИЯ АНИМАТОВ НА ОСНОВЕ КОНЕЧНЫХ АВТОМАТОВ

Специальность: 05.13.17 - Теоретические основы информатики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Таганрог 2005

Работа выполнена в Таганрогском Государственном Радиотехническом университете.

Научный руководитель: заслуженный деятель науки РФ,

доктор технических наук, профессор Курейчик Виктор Михайлович

Официальные оппоненты: доктор технических наук, профессор

Ковалёв Сергей Михайлович

кандидат технических наук, доцент Родзин Сергей Иванович

Ведущая организация: НИИ Нейрокибернетики

им. А.Б.Когана Ростовского Государственного Университета (г. Ростов-на-Дону)

Защита состоится сентября 2005 г. в 14 часов на

заседании диссертационного совета Д.212.259.02 Таганрогского Государственного Радиотехнического университета по адресу (347928, Таганрог, Ростовская область, ГСП-17А, пер. Некрасовский, 44).

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан "¿3 " июля 2005 г.

Ученый секретарь диссертационного совета Д 212.259.02

Бабенко Л.К.

ШЪ^б

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Исследования в области искусственного интеллекта являются актуальными во многих областях науки и техники. В начале 80-х годов появилось новое направление, называемое «Искусственная Жизнь», в задачи которого входят создание и изучение «более общих форм жизни», общих принципов организации биологической жизни. В 90-х годах сформировалось еще одно направление, тесно связанное с «Искусственной Жизнью», - «Адаптивное Поведение», в задачи которого входят исследование принципов совместного функционирования животных в условиях изменяющейся среды. Основной метод работы в данном направлении -проведение компьютерного моделирования процесса развития сообществ искусственных существ, способных приспосабливаться к окружающей среде. Изучаемые создания - автономные роботы, наделенные некоторыми чертами I поведения животных, называемые «аниматами». Для исследований в области

"Адаптивного Поведения" характерен специализированный метод конструирования архитектуры, обеспечивающей "интеллектуальное" поведение аниматов. Исследователь разрабатывает данные архитектуры, по аналогии с теми структурами, которые обеспечивают адаптивное поведение у реальных животных, например, моделируя потребности живого организма и механизм их удовлетворения. Исследователь конструирует внешний мир для эволюционной системы, задавая физические законы и параметры, исходя из конкретных задач. Существа способны поддерживать свою жизнь, размножаться, гибнуть, взаимодействовать друг с другом. Механизм размножения искусственных существ позаимствован у биологических «аналогов», родители передают ребенку свою наследственную информацию, которая определяет схему поведения животного, его параметры и т.д.

Область применения моделей искусственной жизни разнообразна: изучение случаев сложного и разнообразного поведения отдельных индивидуумов; решение трудно формализуемых задач; исследование когнитивной эволюции животных; а также задача «управления роем». В настоящее время происходит развитие именно тех технологий, для которых теория аниматов может быть использована в полной мере: нанотехнологий в роботостроении и интеллектуализации виртуальных пространств. Например, программные агенты помогают модераторам отслеживать содержимое виртуальных страниц, отвечают на вопросы пользователей, являются партнерами человека в стратегических играх, следят за обновлениями новостей, отвечают за безопасность систем, осуществляют тематический поиск в сети. Эти системы широко используются сегодня и имеют перспективы развития. Согласно описаниям этих проектов можно прогнозировать дальнейшее развитие теории аниматов, как одного из возможных путей управления роем нанороботов, а также интеллектуализации

компьютерных игр и виртуальных сред, что указывает на актуальность работ в таких областях, как «Искусственная Жизнь» и «Адаптивное Поведение»

Целью диссертационной работы является повышение эффективности существующих моделей сообществ аниматов, за счет разработки новой модели анимата, вычислительная сложность которой не превышает 0(п1о%2(п)), где п - размер информационного поля анимата, и затраты на модернизацию и адаптацию к конкретной задаче не превышают полиномиальных оценок.

Для достижения поставленной цели решены следующие задачи:

1 Анализ разработанных моделей аниматов, и моделей организации сообществ аниматов, анализ затруднений, возникающих при реализации моделей и трудозатрат на реализацию и модернизацию существующих моделей.

2. Построение общей рабочей модели анимата, а также модели сообщества аниматов, оценка качества полученной модели, сравнение с аналогами.

3. Абстрактный синтез автомата, принимающего решение о конкретном действии в данной ситуации, разработка универсального входного алфавита, классификация ситуаций состояния внешней и внутренней среды.

4. Построение алгоритма обучения анимата в условиях активной внешней среды.

Методы исследований базируются на элементах теории множеств, алгоритмов, эволюционного моделирования.

Научная новизна диссертационной работы заключается в:

1. Построении модели анимата на основе конечных автоматов, что позволяет сократить затраты на моделирование.

2. Включении механизма фильтров восприятия в процесс сбора информации о состоянии внешней и внутренней среды, позволившее сократить объем входного алфавита.

3. Разработке модифицированного входного алфавита для анимата, описывающего группы состояний внешнего и внутреннего мира, на основе аппарата регулярных выражений, что дает возможность формирования универсального входного алфавита для всех типов аниматов в рамках данной работы.

4. Разработке метода обучения аниматов на основе успешности выполняемых действий, что позволило формировать схемы поведения, направленные на коллективное решение задач.

Практическую ценность работы представляют:

1. Модель анимата на основе разработанного вероятностного автомата.

2. Алгоритм фильтрации информации о ситуациях внутреннего и внешнего мира анимата.

3. Принцип построения входного алфавита на основе группировки схожих ситуаций.

4. Полученные экспериментально оптимальные схемы поведения «животных» в результате эволюционных изменений в сообществе аниматов.

Реализация результатов работы.

Основные теоретические и практические результаты диссертационной работы использованы в госбюджетной научно-исследовательской работе ТРТУ «Разработка теории и принципов построения интеллектуальных систем автоматизированного проектирования на основе эволюционной адаптации, нейросетевых моделей и методов принятия решений». Результаты работы использовались при выполнении работ по гранту № 12386 (02-01-01275) Российского Фонда Фундаментальных Исследований. Материалы диссертации использованы в учебном процессе на кафедре САПР ТРТУ при чтении лекций по курсам «Методы оптимизации», «Эволюционное моделирование и генетические алгоритмы».

Основные положения. выносимые на защиту:

1. Метод реализации модели и общая структура анимата на базе конечных автоматов.

2. Принципы формирования универсального входного алфавита автоматов с использованием регулярных выражений.

3. Алгоритм фильтрации информации о состоянии внешней среды.

Апробация работы и публикации. Основные научные и практические

результаты работы докладывались, обсуждались и были одобрены на Международных научно-технических конференциях «Интеллектуальные САПР» (пос. Дивноморское 2004 г.), на Всероссийских научных конференциях студентов и аспирантов «Радиоэлектроника, микроэлектроника, системы связи и управления» (г. Таганрог 2002 - 2004 гг.), внутривузовских конференциях ТРТУ (2002-2005 гг.).

Результаты диссертации отражены в 7 печатных работах.

Структура и объём диссертационной работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложения. Работа содержит 150 стр., включая 38 рис., 13 таб., список литературы из 115 наименований, 4 стр. приложений и актов об использовании результатов работы.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сформулированы цели, приведены сведения о полученных научных и

практических результатах, реализации и внедрении результатов работы, апробации, дано общее описание выполненной работы.

В первой главе проанализированы существующие разработки в области «Искусственная Жизнь» и «Адаптивное Поведение» в рамках анализа проблем внедрения моделей, простоты реализации, внутреннего устройства модели, вычислительной сложности используемых алгоритмов. Особое внимание уделялось механизмам взаимодействия искусственных существ друг с другом и принятия решений о рекомендуемом оптимальном действии в каждой конкретной ситуации внешнего и внутреннего мира анимата

Исследованы модели:

1. «Мозг Анимата», К.В. Анохин, М.С. Бурцев и другие - выявлена схема управления аниматом на основе функциональных систем, обнаружены проблемы, связанные со сложностью практической реализации модели по причине большого числа вызовов подсистем, частой переформулировкой задач, высокими вычислительными затратами в рамках работы отдельной функциональной системы.

2. Проект «Животное», М.М. Бонгард, И.С. Лосев, М.С. Смирнов -выявлены гибкая структура анализа входных ситуаций на основе описания фактов, механизм переключения внимания, позволяющий выстраивать иерархии целей животного, отмечены проблемы практической реализации связанные с неопределенностью количества блоков, принимающих решения, а также сложностью реализации вычислений.

3. «ПолиМир», Л. Яггер - проанализирована схема взаимодействия аниматов друг с другом, механизмы формирования целенаправленного поведения.

4. Модель «Кузнечик», В.Г. Редько, и производные от нее - выявлена централизованная модель управления аниматом, четкое разграничение мира анимата на внутренний и внешний, что позволило значительно упростить модель управления.

Сравнительный анализ вышеперечисленных, а также и других моделей, позволил обнаружить тенденцию к использованию механизмов нейронных сетей в организации адаптивного поведения анимата. Выяснен факт недостаточного применения многих моделей в виду их вычислительной сложности. На основе проведенного анализа построена типичная модель анимата, а также типичная модель сообщества аниматов. Выявлен факт малой коммуникации существ одного вида, отсутствие кооперации животных На основе проведенной работы сделаны выводы, выработаны рекомендации и изложены новые требования к разрабатываемой модели анимата и модели сообщества аниматов.

Во второй главе приводится описание анимата, его структуры, структуры мира, в котором эволюционирует сообщество, а также вопросы реализации блока принятия решений о рекомендуемом действии в каждой конкретной ситуации внутреннего и внешнего мира анимата.

Мир анимата представлен как двумерное поле, противоположные края которого сомкнуты, образуя замкнутый двумерный мир без границ, в виде тора. Анимат «видит» окружающий мир на / клеток вокруг, где параметр / характеризует «остроту зрения» особи. В границах одного поля могут существовать несколько видов аниматов, каждый вид образует сообщество, которое изменяется под действием окружающей среды. Аниматы могут скрещиваться и производить потомство в рамках только своего вида. Каждый анимат имеет некоторый ограниченный запас ресурса, пополняемый только за счет питания. Каждое действие анимата приводит к определённым затратам питания. Полный расход жизненного ресурса особи приводит к её гибели.

Поведение анимата задается при помощи набора мотиваций, среди которых базовыми являются мотивация к утолению голода (МЕ) и мотивация к размножению (Мк), заданные в виде соответствующих функций на оси энегретического ресурса:

МЕ = тах(^°-%), Мк - тт(—,1).

Я. Л]

В дополнение к базовым мотивациям в работе используется разработанная функция социальной мотивации, побуждающая аниматов анализировать ситуацию вокруг «слабых» особей своего вида:

М, = тт((1 + - 0.65 • Л,)), 1) ■

0.8 • Л)

В приведенных формулах мотиваций /? - текущий запас энергетического ресурса, и - константы, обозначающие некоторый граничный запас ресурса для голода и размножения соответственно. Взаимодействия внутри вида могут иметь либо социальный характер, объединения особей одного вида с целью ведения эффективной защиты, либо являться действием скрещивания.

Действие скрещивание приводит к появлению нового анимата -«потомка». Родители передают потомку не только начальный запас энергии, но и генетическую информацию - параметры блока, принимающего решение о следующем действии. В процессе эволюции эти параметры подвергаются изменению, за счёт чего и происходит адаптация поведения аниматов. В случае появления потомка, геном «новорожденного» составляется на основе геномов родителей при помощи рекомбинации и мутации. Возможна ситуация нехватки энергетического ресурса у одного или обоих родителей,

тогда появление нового агента не происходит, но ресурс родителей уменьшается, как и при появлении потомка, что может привести к гибели одного или обоих скрещивающихся.

Рассматриваются следующие способы реализации блока, принимающего решения - нейросеть (НС), модель нечёткого управления, экспертная система и конечный автомат. Для каждого метода построена модель управления, и произведен анализ ее вычислительной сложности и затрат на ее модификацию.

Метод: нейросеть.

Вычислительная сложность: 0(п)=пт, где п - количество нейронов в слое, т - количество слоев.

Расширяемость: затруднена процессом дообучения.

Дополнительные замечания: 1) нет гарантии, что процесс переобучения сойдется, 2) подвергается адаптации.

Метод: нечёткое управление.

Вычислительная сложность: 0(п) = 1од2п, где и - размер базы знаний.

Расширяемость: требует полной модификации базы правил, увеличивает объем базы знаний.

Дополнительные замечания: не предназначена для адаптации поведения.

Метод: экспертные системы.

Вычислительная сложность: О(п) = где п - размер базы

знаний.

Расширяемость: требует модификации базы правил, объем базы растет экспоненциально.

Дополнительные замечания: больше пригодна для консультаций и поддержки человека-оператора. Подвергается адаптации.

Метод: конечный автомат.

Вычислительная сложность: О(п) = п, где п - количество состояний автомата, соответствующее количеству действий для данной модели.

Расширяемость: требует локального изменения таблицы переходов.

Дополнительные замечания: Подвергается адаптации.

На основе проведенного анализа принято решение об использовании конечных автоматов для построения блока, принимающего решение о рекомендуемом действии в ситуациях внутреннего и внешнего мира.

Изменять стратегию поведения анимата возможно при помощи прямых воздействий на таблицу смены состояний и выходов автомата. В рассмотренных ранее моделях блок адаптации поведения строил прогнозы доходов от выполнения действия и оценивал расхождение прогноза и реальных доходов от этого действия. При расхождениях, превышающих заданный порог, включался механизм переобучения НС, принимающих решения. В рассматриваемых моделях оценка дохода производится относительно изменений энергетического ресурса анимата, т.е. считается, что падение ресурса - результат «невыгодных» действий. Подобные рассуждения могут привести к тому, что особи перестанут размножаться, так как размножение - максимально энергоемкое действие для анимата. Поэтому оценка действия анимата проводится относительно нового критерия - общей успешности выполняемого действия, его результативности. Определим понятие успешности некоторого действия - если действие привело к желаемому результату, оно успешно, по аналогии с успешными прогнозами. Для действия «есть» - успешным результатом будет являться тот факт, что содержимое клетки было съедено (оказалось съедобным), для действия «двигаться» - наличие пространства для движения, для действия «скрещиваться» - факт появления новорожденного организма, действие «отдых» успешно всегда.

Популяции агентов эволюционирует на своем поле с течением времени. Скрещиваясь аниматы производят потомка, наследующего параметры поведения от обоих родителей. В процессе индивидуального развития анимат изменяет свое поведение в поисках оптимальных стратегий, изменяет запас энергетического ресурса, что в определенных ситуациях может привести и к гибели агента. Таким образом состав популяции постоянно обновляется, более длительное существование могут себе обеспечить особи, наиболее приспособленные к условиям окружающей среды. Длительность их существования обеспечивает рост количества собственных потомков, что означает передачу информации о наиболее выгодных поведенческих стратегиях большему количеству новых особей. Это приводит к повышению качества жизни популяции в целом.

Третья глава описывает стадии построения управляющего автомата, реализующего блок принятия решения для анимата. Абстрактный синтез автомата включает в себя этапы формирования входного алфавита, выходного алфавита и таблицы переходов и выходов. Входной (описывающий состояния внешней среды) и выходной алфавиты должны удовлетворять ряду условий: универсальности - не зависеть ни от размерности внешнего мира, ни от количества видов живых существ в мире, оптимальности — количество символов минимально, нет двух различных символов, описывающих одинаковые ситуации, полноты - множество символов входного алфавита должно покрывать все возможные ситуации внешней среды.

Анимат может «видеть» мир вокруг себя на I клеток вокруг, параметр / характеризует «остроту зрения» анимата, тогда количество видимых клеток

вычисляется по формуле п — (2 • / +1)2 . Каждая клетка пространства может быть занята другим аниматом, травой или оставаться пустой, при этом необходимо учесть не только тот факт, что клетка занята, но еще и кем она занята - {анимат первого вида, анимат второго вида}. Необходимо учесть работу механизма оценки состояния соседа, его готовность к нападению или скрещиванию, которая напрямую зависит от количества энергетического <

ресурса соседа Все перечисленные детали приводят к росту объемов информации о внешнем мире, что в свою очередь приводит к росту объема входного алфавита. С целью сокращения объемов входной информации ,

воспользуемся механизмом фильтров восприятия -отсекающими ненужную и обобщающими слишком детализированную информацию. Фильтры убирают избыточную информацию о мире, преобразуя реальную картину мира в *

субъективную, индивидуальную для каждого анимата. Иными словами фильтры восприятия подменяют картину окружающего мира картиной мира с точки зрения каждого конкретного «наблюдателя». Алгоритм работы фильтров описывается следующим образом - соседи теперь воспринимаются только как «свои» или «чужие». В этом случае, даже при добавлении новых аниматов в систему, механизм обработки информации о внешнем мире не изменится, и не приведёт к увеличению количества состояний каждой клетки мира Фильтры восприятия могут решить также проблему оценки состояния соседей. Все соседи делятся на «слабых» и «сильных», причем состояние слабый/сильный определяется относительно уровня энергетического ресурса «наблюдателя» В случае применения фильтров восприятия, независимо от количества сосуществующих в мире видов аниматов, каждая клетка может иметь 5 значений, которые уже содержат информацию и о виде анимата и о его ресурсе: пусто (Л), свой слабый (с-), свой сильный (с+), чужой слабый (ч-), чужой сильный (ч+).

В целях дальнейшего сокращения размера входного алфавита следует рассматривать не каждую конкретную ситуацию в каждой из клеток, а группы похожих ситуаций в видимом пространстве, группу образуют ситуации, в которых поведение анимата одинаково. Для формирования групп воспользуемся механизмом регулярных выражений, который позволяет описывать различные цепочки входных символов при помощи спец-символов, масок сочетаний. Например, спец-символ * означает любой символ в любом количестве, ? - хотя бы один любой символ, (9« - означает повтор ситуации в скобках от одного до п раз. Дополнительно используются символы <£<£ и ||, означающие комбинацию условий по и и по или соответственно.

Маска *(ч?)п*(с?)п* - описывает ситуацию наличия в поле зрения анимата как особей своего вида, так и чужих, поскольку в потребностях

заложена забота о слабых своего вида, то наиболее важной ситуацией является *(ч+)п*(с-)п* - есть чужие сильные и свои слабые. Кроме ситуаций внешнего мира необходимо учесть мотивации анимата, поскольку потребностей в модели 3 (пищевая - п, половая - р, социальная - з), то для описания внутреннего мира необходимо 3 слова.

Все ситуации внешнего мира могут быть описаны алфавитом из 6 символов {ч, с, +, - , Л, Е}, где Е - признак окончания строки. Эти символы составляют 6 случаев состояния внешней среды. Ситуации внутреннего мира могут быть описаны при помощи той же технологии, для этого используются следующие символы: {п, р, з}. В дальнейшем в работе используются два алфавита, внешний {ч, с, +, - , Л, Е}, и внутренний {п, р, з, +}, что позволит анализировать ситуации внутреннего и внешнего мира независимо друг от друга Это приводит к гибкой системе управления аниматом.

Выходной алфавит составляют сигналы о рекомендуемых действиях анимата. Поскольку набор действий состоит из множества {«отдыхать», «есть», «двигаться», «скрещиваться»}, то и выходной алфавит состоит из того же набора. Действие «двигаться» разделено на два - «двигаться от увиденного», «двигаться к увиденному». Автомат, управляющий поведением анимата, будет выдавать один из указанных сигналов, являющихся кодом рекомендуемого в данной ситуации действия.

Синтез автомата, способного распознать ситуации внешней среды, проведен на основе составленных регулярных выражений, описывающих эти ситуации Построим граф составленных регулярных выражений, полученный граф изображен на рис.1 Дуги данного графа помечены символами входного алфавита. Построим на основе данного графа таблицу смены состояний, а на ее основании построим граф автомата, распознающего ситуации внешней среды, граф изображен на. рис. 2

Управляющий автомат имеет два входа - ситуации внешнего мира, предварительно распознанные синтезированным ранее автоматом, а также ситуации внутреннего мира, свидетельствующие о наличии той или иной мотивации. Управляющий автомат на основе входных сигналов генерирует выходной сигнал с кодом действия, рекомендованного к выполнению в данной ситуации Структура управляющего автомата представляет собой комбинационную схему, с таблицей выходов в виде функции распределения вероятностей выходных сигналов для каждой комбинации символов внутреннего и внешнего алфавита.

В работе рассмотрены варианты реализации управляющего автомата в виде доверчивого и недоверчивого автомата, а также автомата с комбинированной структурой.

►Ш-

+0-

43-

43-

кз-

4ЕЗ

43-

-кз-

с

43-

-4Ю

КЗ-

<2

чз-

кю

■м-

43-

Чг

чз-

43-

я—4ю

Е

43

»0 ' >Е)

Рис 1. Граф регулярных выражений, описывающих ситуации внешней среды, символы ч, с, +,-, Е- составляют входной алфавит, 5- стартовое

состояние.

т—Им"!

^ Е

Рис. 2 Граф переходов и выходов автомата, распознающего ситуации внешнего мира, символы ч, с, +,-, Е-составляют входной алфавит, 5-стартовое состояние, - состояния графа, ¥- строка выходных сигналов, А - конечное состояние.

Разработанная модель описывается при помощи следующей шестерки:

<М,А,Я0,Я,а,/3 >,

где М- множество функций мотиваций анимата, А - управляющий автомат,

Яв - вектор параметров для функций мотиваций, Я - вектор значений начальных запасов ресурса, а - пороговое значение функции мотивации, превышение которого говорит о наличии соответствующей мотивации, р -коэффициент энергетических затрат существа одного вида на борьбу с существом другого вида.

Обозначив особей двух видов как а и Ь, опишем ситуацию взаимодействия двух этих существ следующей системой неравенств:

0<а<1, 0</?<1, Яа>0, ДА>0,Д0>0, МЕ(Яа)<а, Лв

МЕ(Яа+(1-Р)Яь)>а.

Система описывает следующую ситуацию успешного существования особи вида а, питающейся особями вида Ь: ощутив голод (значение функции мотивации МЕ пороговое значение а) особь а нападает на особь вида Ь, при этом, запас ресурса а превышает затраты на борьбу с Ь. Получив пишу, особь а пополняет запас своего ресурса настолько, что не ощущает голода. Значение параметра а имеет такие ограничения на значения, исходя из рассуждения, что значения функций мотиваций не превышают 1 и не могут быть меньше О, исходя из формул функций мотиваций. Значения параметра р - коэффициент потери энергии на борьбу не может превышать 1 и не может быть меньше О, как показатель затрат на борьбу. Упрощая и решая данную систему неравенств, получим соотношение параметров модели, при котором обеспечивается корректное функционирование модели:

0<а<\, 0 < < 1, Ка >0, Яь >0,Л0 >0,

(а + т-Ю До-К

0-Я

(1-/?)

/? < 0 К <г а

К ^-->кь <т

1 + а Р

Рассмотрим процесс изменения вероятностей в процессе обучения. Таблица распределения вероятностей имеет вид:

H(t) = {PtJ,k }Ц'ЦЦ,'' ^ Pi, J,к —

А» 1

где Xi,X2 входные алфавиты, a D - множество возможных действий анимата.

Каждая строка Рх/^2,к~ представляет собой распределение вероятностей выполнения одного из набора действий в ситуации xi,x2. По результатам выполнения выбранного по данному распределению действия (if), соответствующая вероятность Pxi^2,u изменяется согласно изложенному выше алгоритму обучения: если действие d было успешным, то выбор данного действия поощряется:

H(t + \)\P^id =1.2-PXi^d,PXl,X2,k = JjW д =

1= 1

Если действие в данной ситуации было неуспешным, то производится разобучение, вероятность выбора данного действия в данной ситуации уменьшается :

tf(/ + l)|Pw =0.8-PW,PW = ,* = М4

/=1

Рассмотрим процесс обучения анимата. Обозначим успешное действие символом А, и вероятность его выбора символом а, все остальные действия как Bi, вероятность их выбора bh соответственно. Среда и законы мира, в которых эволюционируют аниматы, не меняются в процессе одного сеанса моделирования, тогда в каждой конкретной ситуации успешные однажды действия будут успешны и в дальнейшем.

Рассмотрим законы изменения вероятности а:

1.2-а, 1.2 -а,

' "1 + 0.2-а,'

у=1

при этом, из формул следует, что значение а не превышает 1.

Рассмотрим ряд а, (а,,а2,...ап):

Vi 1-2 -а, 1 1.2

1 + 0.2 -а, а, 1 + 0.2 • а,

,1 + 0.2 -а, > 1, т.к. 0 < а, <1.

Отношение каждого последующего члена ряда к предыдущему гарантированно находится в интервале от 1 до 1 2, что говорит о том, что ряд а монотонно не убывает Очевидно, что ряд а является расходящимся, по признаку Даламбера. Рассмотрим теперь ряд состоящий из разностей последующих членов ряда а, ряд Да:

В результате получены следующие утверждения:

1. Ряд а является монотонно неубывающим.

2. Э| >0 - по условиям моделирования.

3. Последовательные парные разности членов ряда а, образуют новый ряд, изменяющийся по закону Да,.

0.2-а, -(1-а,) Да, =-.

1 + 0.2 • а,

4. Исходя из закона изменения разностей можно утверждать, что, начиная с некоторого числа отношение Да, к Да,+] будет меньше 1, т.к. с ростом а,-функция Да, убывает.

5. Таким образом, опираясь на признак Даламбера о сходимости рядов, справедливо заключение, что ряд последовательных разностей ряда а,- сходится.

На основании утверждения о сходимости ряда разностей для ряда я, можно заключить, что процесс обучения анимата сойдется к следующему распределению- вероятности всех действий, кроме закрепляемого, будут стремится к 0, вероятность выбора закрепляемого действия будет стремиться к 1. В результате проведенных исследований сделаем вывод о том, что процесс адаптации параметров управляющего автомата сойдется, и распределения вероятностей выходных сигналов образуют выраженную стратегию поведения анимата в условиях внешней среды.

В четвёртой главе поставлены цели вычислительных экспериментов, разработан план эксперимента, приведены результаты экспериментальных исследований.

Эксперименты разделены на 4 главные части: сравнительное исследование эффективности полученной модели, оценка качества реализованной модели, оценка механизмов обучения аниматов (без обучения, стандартная модель на основе оценок затрат энергетического ресурса, на основе успешности выполняемого действия) Произведена оценка эффективности алгоритма, подтверждена ожидаемая линейная вычислительная сложность модели. Проведен анализ влияния социальных мотиваций на развитие популяции, сделаны рекомендации по пр1тмененжо социальных мотиваций. Произведен анализ изменения стратегий поведения аниматов в зависимости от применяемых алгоритмов обучения. Предложены

рекомендации по методам обучения в зависимости от решаемых задач. Произведен сравнительный анализ полученных стратегий поведения в данной диссертационной работе и базовой моделью «Кузнечик».

Для проведения экспериментальных исследований разработана программа моделирования эволюции аниматов. Программа написана на языке С# для операционных систем семейства 2000, ХР при наличии платформы Microsoft.Net версии 1.02. Эксперименты проводились на 1ВМ®-совместимом компьютере с процессором Celeron 2 4 МГц, оперативной памятью 256МБ. В процессе моделирования ведется лог событий в мире, записи хранятся в разработанной БД, СУБД Access. Каждая запись содержит информацию о номере итерации, координате клетки, типе существа в ней, запасе его ресурса, величинах мотиваций, параметрах управляющего автомата и др.

Проводилось сравнение с существующими моделями: «Кузнечик» и его модификации Результаты работы разработанного приложения адекватны результатам известных популярных алгоритмов моделирования эволюции искусственных существ, таких как ПолиМир, модели Экли и Литмана

Проведенные исследования показали, что разработанная структура модели, а также разработанный управляющий автомат позволили уменьшить затраты на моделирование на 40% по сравнению с моделью «Кузнечик». Проведенный анализ полученных результатов показал, что временная сложность алгоритма моделирования (включающая алгоритм фильтрации информации, принятия решения и проведения адаптации) является линейной по отношению к размеру хромосомы анимата.

В заключении приводятся основные результаты, полученные в диссертационной работе.

В приложении приводятся акты об использовании результатов диссертационной работы, а также подробные таблицы результатов проведенных экспериментов.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Представлен анализ существующих на данный момент разработок в направлениях «Адаптивное Поведение» и «Искусственная Жизнь». Рассмотрены достоинства и недостатки существующих систем, выявлены основные проблемы реализации таких систем. Сделаны выводы о необходимости разработки новой модели, обладающей более высоким быстродействием.

2. Проанализированы методы организации модели управления аниматом, выявлены перспективные подходы, в частности, метод организации модели на базе конечного автомата. Предварительная оценка затрат на поддержку и модернизацию такой модели показали ее оптимальность.

3. Разработана архитектура новой модели - на базе вероятностного конечного автомата, позволившая сократить временные затраты на моделирование.

4. Произведен абстрактный синтез автомата для реализации модели управления аниматом. Разработан механизм фильтров восприятия аниматом ситуаций внешней и внутренней среды, что позволило отсеять лишнюю информацию, и как следствие, оптимизировать входной алфавит автомата. Использование фильтров также позволило сделать входной алфавит автомата универсальным для всех видов искусственных существ.

5. Разработаны алгоритмы адаптации поведения анимата. Произведены теоретические оценки сложности полученной модели давшие в результате линейную оценку сложности.

6. Разработаны программные модули, реализующие вышеуказанные алгоритмы: фильтрация информации о внешнем мире, распознавание ситуации внешнего мира на базе распознающего автомата, принятие решения об оптимальном действии в конкретной ситуации внутреннего и внешнего мира, при помощи вероятностного автомата.

7. Полученные экспериментальные данные (динамика изменения популяции, выработанные стратегии поведения) были сравнены с результатами аналогичных исследований в данной области. Результаты сравнения говорят в пользу качества разработанной модели, ее работоспособности и возможностей применения. Получены экспериментальные подтверждения оцененной ранее вычислительной сложности алгоритма, произведено сравнение полученной модели с базовой моделью «Кузнечик». Разработанные алгоритмы позволили получить 40%-ный выигрыш во времени моделирования.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

1. Никифорова A.M. Анализ методов и технологий построения MAC в области организации сообществ аниматов // Перспективные информационные технологии и интеллектуальные системы. №1, 2004, С.237 -246.

2. Никифорова A.M. Моделирование поведения анимата // Известия ТРТУ. Тематический выпуск Интеллектуальные САПР. Материалы Международной научно-технической конференции Интеллектуальные САПР - Таганрог: ТРТУ, 2004, С. 25 -28.

3 Никифорова A.M. Направление исследований аниматов для решения задач САПР// Материалы V Всероссийской научной конференции молодых

ученых и аспирантов. Новые информационные технологии. Разработка и аспекты применения. Тезисы докладов. - Таганрог: ТРТУ, 2002, С. 145 - 147.

4. Никифорова A.M. Построение модели анимата: оптимизация входного алфавита // Материалы VII всероссийской научной конференции с международным участием. Новые информационные технологии. Разработка и аспекты применения. Тезисы докладов. - Таганрог: ТРТУ, 2004, С. 396 -

5. Никифорова A.M. Разработка модели взаимодействия аниматов// Материалы VI Всероссийской научной конференции молодых ученых и аспирантов. Новые информационные технологии. Разработка и аспекты применения. Тезисы докладов. - Таганрог: ТРТУ, 2003, С. 371 - 375.

6.Никифорова А М., Янушко В.В Синтез конечного автомата в рамках построения модели управления аниматом // Материалы VII всероссийская научная конференция студентов и аспирантов. Техническая кибернетика, радиоэлектроника и системы управления. Тезисы докладов. - Таганрог: ТРТУ, 2004, С. 102- 103.

7. Никифорова A.M. Применение моделей искусственной жизни для решения некоторых прикладных задач // Перспективные информационные технологии и интеллектуальные системы. №2, 2005, С 31 - 33.

Личный вклад автора в работах, опубликованных в соавторстве: [6J -разработка алгоритма фильтрации информации о внешнем мире анимата, оптимизация входного алфавита.

399.

Соискатель

A.M. Никифорова

Заказ № Тираж 100 экз

Издательство Таганрогского государственного радиотехнического университета

ГСП 17А, Таганрог, 28, Некрасовский, 44

Типография Таганрогского государственного радиотехнического университета

ГСП 17А, Таганрог, 28, Энгельса, 1

»133 15

РНБ Русский фонд

2006-4 10742

Оглавление автор диссертации — кандидата технических наук Никифорова, Анна Михайловна

Введение

1. Анализ существующих разработок в области исследования 13 эволюции сообществ искусственных существ

1.1. Анализ модели «Мозг анимата»

1.2. Анализ модели организации поведения — «животное» 18 1.3 Анализ модели «ПолиМир» Л.Ягера

1.4. Анализ модели взаимодействия обучения и эволюции Д. Экли 23 и М. Литтмана

1.5. Анализ проекта «Кузнечик» - модели эволюционного 26 возникновения целенаправленного поведения

1.6. Анализ модификаций модели «Кузнечик» - исследование 29 развития иерархии целей

1.7. Обобщение результатов

1.8. Выводы

2. Разработка модели анимата на базе модели «Кузнечик»

2.1. Построение модели мира анимата

2.2. Разработка модели анимата

2.3. Разработка структуры блока принятия решения 45 2.3.1 Построение управляющего блока с использованием нейросетей

2.3.2 Построение управляющего блока на базе систем нечеткого 51 управления

2.3.3. Построение управляющего блока как экспертной системы

2.3.4. Построение управляющего блока как конечного автомата

2.3.5. Вывод

2.4. Разработка структуры блока адаптации поведения

2.5. Построение схемы эволюции популяции

2.6. Выводы

3. Синтез автомата, разработка алгоритмов обучения анимата.

3.1. Общие сведения об автомате

3.2. Синтез оптимального вероятностного автомата

3.2.1. Разработка входного и выходного алфавита

3.2.2. Синтез таблиц переходов и выходов

3.3. Модель анимата на базе доверчивых и недоверчивых автоматов

3.4. Разработка алгоритма адаптации поведения

3.5. Исследования модели 92 3.5. Выводы

4. Моделирование и оценка результатов экспериментов

4.1. Проведение моделирования

4.2. Определение критериев оценки качества результатов

4.3. Построение плана эксперимента и определение его параметров

4.4. Анализ полученных результатов

4.5. Применение разработанной модели 127 4.5. Выводы

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Никифорова, Анна Михайловна

Исследования в области искусственного интеллекта активно и являются актуальными во многих отраслях науки и техники. В начале 80-х годов в исследованиях появляется новое направление, называемое «Искусственная Жизнь», в задачи которого входят создание и изучение «более общих форм жизни» [1-3]. Исследователи ставили своей целью понимание общих принципов организации биологической жизни. Результаты, полученные в данной области, планировалось применить в таких областях как разработка мобильных роботов, медицина, социология, биология и других [4-8]. Направление базировалось на моделях, разработанных в 60-х годах M.JI. Цетлиным и М.М. Бонгардом, которые разработали ряд моделей, способных приспосабливаться к окружающей среде [9-11]. Модели не были реализованы технологически из-за своей громоздкости и вычислительной сложности.

В 90-х годах складывается еще одно направление, тесно связанное с «Искусственной Жизнью», называемое «Адаптивное Поведение», в задачи которого входит исследование принципов совместного функционирования животных в условиях изменяющейся среды [12, 13]. Исследователи, работающие в данном направлении стремятся проанализировать эволюционное развитие познавательных способностей животных и человека и получить модель зарождения и развития человеческого интеллекта [14, 15].

Основной метод работы в данном направлении - проведение компьютерного моделирования развития сообществ искусственных существ, способных приспосабливаться к окружающей среде. Эти создания -автономные роботы, наделенные некоторыми чертами поведения животных, их назвали «аниматами», от слов «animal» и «robot» [16-18]. Для исследований в области "Адаптивное Поведение" характерен специализированный метод конструирования архитектуры, обеспечивающей "интеллектуальное" поведение аниматов - исследователь сам разрабатывает данные архитектуры, по аналогии с теми структурами, которые обеспечивают адаптивное поведение у реальных животных, например, моделируя потребности живого организма и механизм их удовлетворения [4, 19].

Исследователь также конструирует внешний мир для эволюционной системы, задавая физические законы и параметры, исходя из конкретных задач. Существа способны поддерживать свою жизнь, размножаться, гибнуть, взаимодействовать друг с другом. Механизм размножения искусственных существ позаимствован у биологических «аналогов»: родители передают ребенку свою генную информацию, которая определяет схему поведения животного, его параметры и т.д. При передаче информации возможны случайные мутации [20-22].

Сообщества аниматов относят к классу многоагентных компьютерных систем. Ключевое отличие моделей аниматов от других многоагентных систем является наличие эволюционных изменений в популяции, ее развитие за счет появление новых аниматов (аниматов-потомков), несущих измененную генную информацию, подверженную также случайным мутациям. В общем случае, метод компьютерного моделирования искусственной жизни является стохастическим и его можно рассматривать как подмножество методов Монте-Карло [23].

Область применения моделей искусственной жизни разнообразна: -случаи сложного и разнообразного поведения отдельных индивидуумов, например, в зависимости от локального окружения, приводящие к трудностям в получении системы уравнений, описывающих динамику популяции;

-решение трудно формализуемых задач; -исследование когнитивной эволюции животных; -задачи «управления роем» [12, [24-26].

Этот круг задач и определяет основное отличие «Адаптивного Поведения» и «Искусственной Жизни» от остальных исследований в области искусственного интеллекта: «создание аниматов ориентировано в конечном итоге на решение ими нечетко сформулированных задач в плохо предсказуемой среде — т.е. таких, с которыми приходится иметь дело живым организмам. Аниматы создаются не для игры в шахматы, а для таких задач, как исследование поверхности планет в условиях, когда время и ресурсы робота ограничены, а местность не изучена» [27].

Сегодня можно также наблюдать бурное развитие именно тех технологий, для которых теория аниматов может быть использована в полной мере: нанотехнологий в роботостроении и рост вычислительных мощностей компьютерной техники [28].

Развитие индустрии компьютерных технологий привело сегодня к росту развития виртуальных пространств, заселенных виртуальными существами: программные агенты помогают модераторам отслеживать контент, отвечают на вопросы пользователей, являются партнерами человека в стратегических играх, следят за обновлениями новостей, отвечают за безопасность систем, осущетвляют тематический поиск в сети. Примеры таких виртуальных агентов можно увидеть на сайтах Ananova, Microsoft, Codeprogect, CodeGuru и других. Эти системы широко используются сегодня и имеют огромные перспективы развития. Рекламируя свою новую разработку в среде IT, компания Microsoft также обратилась к аниматам - в 2003-2004 году был проведен конкурс на лучшее искусственное животное в нити проектов MicrosoftResearch.

Теория аниматов нашла свое применение и в кино - для создания массовых батальных сцен создатели одного из самых кассовых фильмов «Властелин Колец» использовали компьютерную графику в сумме с моделированием поведения аниматов. Было написано специальное программное обеспечение для моделирования сражений существ двух видов, на основе которого были отрисованы сцены массовых сражений [24, 29].

Развитие технологий роботостроения в сторону уменьшения размеров привело к созданию многих проектов, которые также используют теорию аниматов для управления. Например, в 2002 году в Intelligent Autonomous

Systems Laboratory Британского Университета был создан робот-садовник, небольшой мобильный робот для «ручной» очистки сада от слизняков. Робот получил название SlugBot, был опробован на реальных задачах и одобрен пользователями. С точки зрения «Адаптивного Поведения» SlugBot - не анимат в чистом виде, т.к. в сообществе роботов пока не реализованы механизмы самовоспроизведения, но, тем не менее, сообщество таких роботов может быть наделено «стадностью», они адаптивны, и это одна из первых весьма удачных разработок в данной области науки [30]. Беспилотные автобусы, построенные к проведению выставки EXPO 2005 компанией Toyota, также можно отнести к категории таких удачных моделей: автобусы имеют цель движения, собираются в стаи и разъединяются для выполнения собственных локальных задач [31].

Современные проекты с использованием нанороботов также пока не включают этап самовоспроизводства, но в будущем вполне могут это сделать согласно проекту «Roboblood», предлагающему заменить кровяные тельца человека сообществом нанороботов в ближайшем будущем [32].

Согласно описаниям этих настоящих и будущих проектов можно прогнозировать стремительное развитие теории аниматов, как одного из возможных путей управления роем нанороботов, а также интеллектуализации компьютерных игр и виртуальных сред, что указывает на актуальность работ в области построение моделей в областях «Искусственная Жизнь» и «Адаптивное Поведение».

Целью данной диссертационной работы является повышение эффективности существующих моделей сообществ аниматов, за счет разработки новой модели анимата, вычислительная сложность которой не превышает оценок nlog2(n), и затраты на модернизацию и адаптацию к конкретной задаче не превышают полиномиальных оценок. Рабочей гипотезой является предположение о том, что достичь поставленной цели можно, используя математический аппарат вероятностных автоматов.

Для достижения поставленной цели в работе решались следующие основные задачи:

• анализ разработанных на данный момент моделей аниматов, а также моделей организации сообществ аниматов, анализ затруднений, возникающих при реализации тех или иных моделей, анализ трудозатрат на реализацию и модернизацию существующих моделей;

• построение общей рабочей модели анимата, а также модели сообщества аниматов, оценка качества полученной модели, сравнение с аналогами;

• абстрактный синтез автомата, принимающего решение о конкретном действии в данной ситуации, разработка универсального входного алфавита, классификация ситуаций состояния внешней и внутренней среды анимата с использованием фильтров восприятия;

• построение алгоритма обучения анимата в условиях активной внешней среды.

Научная новизна данной работы заключается в следующем:

-разработана модель анимата на основе математического аппарата вероятностных автоматов;

-количество состояний внешней и внутренней среды сокращено за счет включения механизма фильтров восприятия в процесс сбора информации о состоянии среды;

-разработан универсальный входной алфавит для анимата, описывающий группы состояний внешнего и внутреннего мира, на основе аппарата регулярных выражений;

-разработан метод обучения аниматов на основе успешности выполняемых действий. Практическую ценность представляют:

-предложенная модель анимата на основе разработанного вероятностного автомата;

-разработанный алгоритм фильтрации информации о ситуациях внутреннего и внешнего мира анимата;

-принцип построения входного алфавита на основе группировки схожих ситуаций;

-полученные экспериментально оптимальные схемы поведения «животных» в результате эволюционных изменений в сообществе аниматов.

Основные научные и практические результаты работы докладывались, обсуждались и были одобрены на Международных научно-технических конференциях «Интеллектуальные САПР» (пос. Дивноморское 2004 г.), на Всероссийскх научных конференциях студентов и аспирантов «Радиоэлектроника, микроэлектроника, системы связи и управления» (г. Таганрог 2002 - 2004 гг.), внутривузовских конференциях ТРТУ (2004 г.). Результаты диссертации отражены в 8 печатных работах. Основные результаты данной работы были использованы в г/б НИР № 12353 "Разработка теории и принципов построения интеллектуальных систем автоматизированного проектирования на основе эволюционной адаптации, нейросетевых моделей и методов принятия решений". Кроме того, материалы диссертации использованы в учебном процессе на кафедре САПР ТРТУ. Использование результатов диссертационной работы подтверждено соответствующими актами.

Диссертационная работа состоит из введения, четырех глав, заключения, приложений, списка использованной литературы из 114 источников и содержит 143 страницы основного текста, 46 рисунков и 17 таблиц. Общий объем работы 150 страниц.

Заключение диссертация на тему "Разработка методов формирования целенаправленного поведения аниматов на основе конечных автоматов"

4.6. Выводы

В результате практической работы была реализована программа на языке С#, объемом 71 Kb исходного кода и 32 Kb исполняемого кода. Программа работает под Microsoft .Net FrameWork 1.0, требует не менее 128 Kb ОЗУ. В процессе работы программа сохраняет информацию о модели в базу данных формата mdb.

Анализ результатов экспериментов № 1 - 4 позволяет сделать ряд выводов.

1. Разработанная в данной работе модель обладает более высоким быстродействием, чем модели, основанные на нейросетевых алгоритмах, преобладающие на данный момент в научно-исследовательском направлении «Искусственная Жизнь». Полученная программа позволила получить 40%-ное понижение временных затрат на моделирование.

2. Модель реализована качественно, экспериментальное быстродействие отличается от расчетного в рамках допустимых отклонений.

3. Полученная модель искусственной жизни функционирует успешно, животные развиваются, размеры популяции растут до некоторых пределов, определяемых размерами поля и количеством пищи. Полученные в результате моделирования эволюции стратегии поведения соответствуют ожидаемым — стратегии поведения обеспечивают как выживаемость отдельного существа, так и популяции в целом. Результаты моделирования в целом, соответствуют результатам других исследователей направления «Искусственная Жизнь».

4. В результате экспериментов выявлено позитивное влияние социальных мотиваций на процесс эволюции популяции

Обобщая все вышесказанное, можно заключить, что реализованная в рамках данной работы модель полностью соответствует поставленной задаче: модель анимата имеет линейную сложность (большинство существующих моделей имеет квадратичную), модель позволяет получить стратегии поведения в условиях изменяющейся среды, выработанные аниматами стратегии поведения близки к оптимальным стратегиям, полученным другими исследователями направления.

Результаты экспериментов говорят также о том, что гипотеза о упрощении вычислительной сложности модели при применении математического аппарата вероятностных автоматов в построении блока принимающего решения подтверждается не только теоретически, но и экспериментально.

Заключение

В рамках данной диссертационной работы были получены следующие результаты:

1. Проведен анализ существующих на данный момент разработок в направлениях «Адаптивное Поведение» и «Искусственная Жизнь». Рассмотрены достоинства и недостатки существующих систем, выявлены основные проблемы реализации таких систем. Основной причиной затруднений в реализации является их вычислительная сложность, на этом основании были сделаны выводы о необходимости разработки новой модели, обладающей более высоким быстродействием.

2. Проанализированы возможные методы организации модели управления аниматом, выявлены наиболее перспективные методы, в частности, метод организации модели на базе конечного автомата. Предварительная оценка затрат на поддержку и модернизацию такой модели показали ее оптимальность.

3. Произведен абстрактный синтез автомата для реализации модели управления аниматом. Разработан механизм фильтров восприятия аниматом ситуаций внешней и внутренней среды, что позволило отсеять лишнюю информацию, и как следствие, оптимизировать входной алфавит автомата. Использование фильтров также позволило сделать входной алфавит автомата универсальным для всех видов искусственных существ. Разработан алгоритм разбора ситуаций внешнего мира, позволяющий значительно сократить временные затраты по принятию решения о рекомендуемом действии анимата.

4. В целях проведения компьютерного моделирования были разработаны программные модули, реализующие вышеуказанные алгоритмы. Разработан план эксперимента, проведено моделирование согласно ранее разработанному плану. Полученные экспериментальные данные (динамика изменения популяции, выработанные стратегии поведения) были сравнены с результатами аналогичных исследований в данной области. Результаты сравнения говорят о 40%-ном повышении эффективности модели оп сравнению с моделью «Кузнечик».

5. На базе материалов данной диссертационной работы были опубликованы статьи и тезисы докладов в журналах и сборниках конференций.

В результате проведенных теоретических и экспериментальных исследований была разработана модель анимата, обладающая более высоким быстродействием, чем существующие в данный момент аналоги. Временные затраты на моделирование поведения особи понижены на порядок по сравнению с моделью «Кузнечик» и ее модификациями. Экспериментальные оценки позволяют говорить о 40%-ном понижении временных затрат на работу модели.

Результаты серии проведенных экспериментов позволяют также утверждать, что результаты моделирования (выработанные аниматами эффективные стратегии поведения, качественные показатели модели) соответствуют результатам полученным в области «Искусственная Жизнь» и «Адаптивное Поведение» за последние 10 лет.

Библиография Никифорова, Анна Михайловна, диссертация по теме Теоретические основы информатики

1. Возможности вычислительных машин и человеческий разум - М.: Радио и связь, 1982.

2. Редько В.Г. Эволюционный подход к исследованию естественных и созданию искусственных "биокомпьютеров"// Нейрокомпьютер, №12, 1994. С. 38-49.

3. Тарасов В.Б. Агенты, многоагентные системы, виртуальные сообщества: стратегическое направление в информатике и искусственном // Новости искусственного интеллекта, №2, 1998. С.5-63.

4. Янчук А.В. Моделирование автономных агентов — задачи навигации и захвата -Новости искусственного интеллекта №2, 2002. С.10-16

5. Шамис А.Л. От поведения к мышлению (устойчивое неравновесие и моделирование мышления) // Новости искусственного интеллекта №3,2003. С. 11-15.

6. Red'ko V.G. Towards the evolutionary biocybernetics // Proceedings of The Second International Symposium on Neuroinformatics and Neurocomputers, Rostov-on-Don, 1995. pp. 422 448.

7. Лангтон К. Что такое искусственная жизнь? //статья доступна по адресу http://www.biota.org/papers/cgalife.html

8. Цетлин М.Л. Исследования по теории автоматов и моделированию биологических систем. М: Наука, 1959.

9. Бонгард М.М., Лосев И.С., Смирнов М.С. Проект модели организации поведения Животное Моделирование обучения иповедения М: Наука, 1975.

10. Варшавский В. И. Коллективное поведение автоматов. М: Наука, 1973.

11. Тарасов В.Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. -М: Эдиториал УРСС, 2002.

12. Barkow J.H., Cosmidies L., Tooby J. The Adaptive Mind. NY: Oxford Univ. Press, 1992.

13. Редько В.Г. Моделирование когнитивной эволюции- естественный путь к искусственному интеллекту. — Новости искусственного интеллекта, № 2-3, 2001. С. 52-56.

14. Тарасов В.Б. Искусственная жизнь и нечеткие эволюционные многоагентные системы основные теоретические подходы к построению интеллектуальных организаций // Известия РАН: Теория и системы управления, №5, 1998. С. 12-23.

15. Редько В.Г. Проблема происхождения интеллекта и эволюционная биокибернетика // Журнал высшей нервной деятельности Т.48. Вып.2, 1998. С.358-369.

16. Meyer J.-A., Wilson S. W. (Eds) From animals to animats. Proceedings of the First International Conference on Simulation of Adaptive Behavior. The MIT Press: Cambridge, Massachusetts, London, England. 1990.

17. МакЛеннан Б. Искусственная жизнь и синтетическая теория поведения, //статья доступна по адресу: http://cs.utk.edu/~mclennan/

18. Axtell R. Why agents? On the varied motivations for agent computing in the social sciences // Center for Social and Economic Dynamics, Working1. Paper N17, 2000.

19. Kauffman S.A. Origins of Order: Self-Organization and Selection in Evolution. Oxford: Oxford University Press, 1993.

20. Редько В.Г. Эволюционная кибернетика М.: Наука. 2001.

21. Burtsev M.S. Tracking the Trajectories of evolution // Artificial Life V.10, 2004, p.397-411.

22. The Complexity and Artificial Life Research Concept for Self-Organizing Systems. Сайт доступен по адресу: http://www.calreso.org

23. Проект «Расширенная рыбья реальность» //статья доступна по адресу http://www.ylem.org/artists/krinaldo/works/augmented/

24. Membrana "Проект роя космических кораблей" //статья доступна по адресу: http://www.membrana.ru/articles/global/2004/05/19/204600.html

25. Непомнящих В.А. Поведение "аниматов" как модель поведения животных // статья доступна по адресу: http://www.ethology.ru/library/?id= 142.

26. Осипов Г.С. Искусственный интеллект: состояние исследований и несколько слов о будущем // Новости искусственного интеллекта, №1, 2001. С.З 13.

27. Artificial Development. // Сайт доступен по адресу: http://www.ad.com.

28. SlugBots- роботы-садовники // статья доступна по адресу: http://www.membrana.ru/articles/inventions/2001/12/14/030000.html.

29. Интеллектуальная многорежимная транзитная система, проект компании Toyota // статья доступна по адресу: http://www.toyota.co.jp/en/expo2005/imtsfchv/imtsfchv01 .html

30. Феникс К., Фрайтас Р. Проект Roboblood //статья доступна по адресу: http://www.transhumanist.com/volumel 1/vasculoid.html

31. Жданов А.А. О методе автономного адаптивного управления // Материалы научной сессии МИФИ-2004. VI всероссийская НТК «Нейроинформатика-2004»: Лекции по нейроинформатике. Часть 2. -М:МИФИ, 2004. С. 15-57.

32. Ackley D., Littman M. Interactions between learning and evolution. // Langton C.G., Taylor C., Farmer J. D. and Rasmussen S. (Eds.) Artificial Life II. Reading, MA: Addison-Wesley, 1992. pp.487-509.

33. Donnart J.Y. and Meyer J.A. Learning Reactive and Planning Rules in a Motivationally Autonomous Animat. // IEEE Transactions on Systems, Man, and Cybernetics Part B: Cybernetics, 26(3), 1996: 381 - 395.

34. Yaeger L. Computational Genetics, Physiology, Learning, Vision, and Behavior or PolyWord: Life in a New Context. // Langton, C. G. (ed). Artificial Life III. Addison-Wesley, 1994. pp. 263-298.

35. Анохин П.К. Очерки по физиологии функциональных систем. — М: Медицина, 1975.

36. Анохин П.К. Системные механизмы высшей нервной деятельности. — М: Наука, 1979.

37. Ахо А.В, Хопкрофт Дж.Э., Ульман Дж.Д. Построение и анализ вычислительных алгоритмов. М: Мир, 1979.

38. Назаров А.В., Лоскутов А.И. Нейросетевые алгоритмы прогнозирования и оптимизации систем. СПб.: Наука и техника, 2003.

39. Тихомиров O.K. Психология мышления. М: МГУ, 1984.

40. Ягер Л. Описание модели PlyWorld // статья доступна по адресу: http://www.beanblossom.in.us/larryy/PolyWorld.html

41. Balkenius С. The roots of motivations. // In J.-A. Mayer, H. L. Roitblat and S. W. Wilson (eds.), From Animals to Animats II, Cambridge, MA: MIT Press, 1993.

42. Burtsev M.S. Measuring the Dynamics of Artificial Evolution // Lecture

43. Notes in Computer Science, 2801/2003. Advances in Artificial Life, p.580-587, 2003.

44. Никифорова A.M. Анализ методов и технологий построения MAC в области организации сообществ аниматов // Перспективные информационные технологии и интеллектуальные системы. №1, 2004, С.237 -246.

45. Бурцев М.С., Гусарев Р.В., Редько В.Г. Исследование механизмов целенаправленного адаптивного поведения. Известия академии наук, 2002, № 6, С.55-62

46. Таха Х.А. Введение в исследование операций. — М: Издательский дом Вильяме, 2001.

47. Турчин В.Ф Феномен науки. Кибернетический подход к эволюции. — М: Наука, 1993.

48. Емельянов В.В., Курейчик В.М., Курейчик В.В. Теория и практика эволюционного моделирования. — М: Физматлит, 2003.

49. Adler M.R., Davis А.В., Weihmayer R., Worrest R.W. Conflict resolution strategies for nonhierarchical distributed agents. // Distributed Artificial Intelligence. Vol.112. San Francisco: Morgan Kaufman, 1989.

50. Кузин Е.С. Информационно-сложные задачи и технологии их решения Новости искусственного интеллекта № 2, 2003, С. 25-29.55