автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование и разработка методов планирования поведения интеллектуальных агентов в обучающих системах

кандидата технических наук
Лазырин, Максим Борисович
город
Тверь
год
2006
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка методов планирования поведения интеллектуальных агентов в обучающих системах»

Автореферат диссертации по теме "Исследование и разработка методов планирования поведения интеллектуальных агентов в обучающих системах"

На правахлукописи Лазырин Максим Борисович V

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ ПЛАНИРОВАНИЯ ПОВЕДЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ В ОБУЧАЮЩИХ

СИСТЕМАХ

Специальность 05,13.01 - Системный анализ, управление и обработка информации (в промышленности)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Тверь, 2006

ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ ПЛАНИРОВАНИЯ ПОВЕДЕНИЯ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ В ОБУЧАЮЩИХ

СИСТЕМАХ

Специальность 05.13.01 — Системный анализ, управление и обработка информации (в промышленности)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Тверь, 2006

Работа выполнена в Тверском государственном техническом университете

Научный руководитель:

кандидат технических наук, Виноградов Генпадий Павлович

доцент

Официальные оппоненты:

доктор технических наук, профессор Семенов Николай Александрович

кандидат технических паук, доцент Тарасов Валерий Борисович

Ведущая организация: Федеральное государственное унитарное

предприятие «Центр эргономических исследований и разработок»

Защита состоится «2/» г^х-а-ЗЬ*. 2006 г. в /С.оО на заседании диссертационного совета Д* 212.562.04 в Тверском государственном техническом университете по адресу: 170026, г. Тверь, наб. Аф. Никитина, 22 (ауд. Ц-212).

С диссертацией можно ознакомиться в библиотеке Тверского государственного технического университета.

Автореферат разослан А^Д-Д^-Ф 2006 г.

Ученый секретарь

диссертационного совета В.Н. Мпхно

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследований.

Современные системы управления сложными производственными процессами, реализованные с использованием информационных технологий, вызвали бурный рост компьютерных средств подготовки квалифицированных специалистов в этих областях. В настоящее время широкое распространение получили обучающие системы, базирующиеся на использовании вычислительных и телекоммуникационных технологий. Обычно такие системы строятся на основе использования вычислительно-моделирующих комплексов (ВМК), реализованных, как правило, в виде распределенных систем обработки данных и предназначенных для имитации поведения среды обучения.

Уровень подготовки специалистов на таких обучающих системах в значительной степени зависит от применяемого математического аппарата, методов и принципов принятия решений и их функциональных возможностей. Сложные технические системы, в которых люди являются составной частью, обладают свойствами активности, которые характеризуются свободой выбора и стратегий взаимодействии, и характеризуются наличием свойства разумного поведения. Это означает, что такие же свойства должны быть реализованы в имитаторе обстановки и средств взаимодействия, предоставляемых обучаемому.

Одним из возможных способов реализации таких - ВМК является применение моделей, алгоритмов, процедур взаимодействия и т.д., полученных в теории многоагентных систем (MAC). Использование агентно-ориентировакного подхода для построения программного обеспечения ВМК позволяет более подробно исследовать и разрабатывать интеллектуальные среды обучения. Таким образом, теорию MAC можно использовать в качестве основы для построения сложных интеллектуальных информационных систем по созданию тренажеров, отвечающих современным требованиям. Основным понятием в теории MAC является понятие интеллектуального агента, под которым понимается некоторая программная сущность, обладающая не только способностью преобразовывать информацию, но и поведением, позволяющим организовать ее взаимодействие с внешней средой. Такой подход к представлению взаимодействующих объектов позволяет рассматривать, их как объекты, обладающие некоторым интеллектом, наличие которого предоставляет возможность упростить процессы разработки и отладки достаточно сложных систем. Такие объекты принято называть интеллектуальными агентами. Интеллектуализадия компонентов распределенных систем позволяет расширить функциональные возможности и унифицировать способы взаимодействия между ними.

Заметный вклад в разработку интеллектуальных объектов, позволяющих моделировать такое сложное поведение объектов, внесли работы таких ученых, как: Д.А. Поспелов, ЭЗ.. Попов, ВЛС. Финн, В.Н. Ваган, А.П. Еремеев, О.П. Кузнецов, Г.С. Осипов, И.Б. Фоминых, В.Ф. Хорошевский и др.

Основпые подходы к моделированию многоагеитных систем с интеллектуальным поведением на основе различных математических аппаратов достаточно подробно отражены в работах В.И. Городецкого, Д.А. Поспелова, В.И. Варшавского, В.Б. Тарасова, О.В. Карасева, В.Ф. Хорошевского, М. Вудрнджа (M.Wooldridge), Н. Дженнингса (N. Jennings.), П.Мюллсра (Р. Müller) и других ученых- Однако практическое использование существующих методов для построения обучающих систем на основе ВМК требует проведения дополнительных исследований.

Большую роль при разработке интеллектуальных агентов играет использование методов планирования их поведения. Применение методов планирования позволяет реализовать алгоритмы, способные адаптироваться к среде функционирования и поведению других объектов.

Работы в области плакирования поведения или построения последовательности действии для достижения заданной цели ведутся в течение нескольких десятков лет силами многих отечественных и зарубежных ученых. Значительный вклад в разработку подходов и методов плаштрования внесли Р. Файкс (R. Fikes), Н. Нильсон (N. Nilsson), А. Ньюэлл, С. Сафра (S. Safra), П. Дойл {P. Doyle), Р. Альтерман (R. Alterman), С. Ханке (S. Hanks), А.Н. Аверкин, АЛ. Эряих, ЕЛ. Ефимов. К основным недостатком существующих методов можно отнести ограничение их использования в системах реального времени. Решению данной проблемы посвящены работы Ф. Бахуса (F. Bacchus), Дж. Хоффмана (J. Hoffmann), П. Дозрти {P. Doherty), М. Гинзберга (М. Ginsberg), А.Н. Кожушкина. Однако в данных работах не уделяется должного внимания возможности использования механизмов разработки планов, приспосабливающихся к внешней обстановке, и стратегий их выбора в условиях качественной информации.

Таким образом, актуальность темы данной работы обусловлена необходимостью расширения функциональных возможностей интеллектуальных объектов и методов их разработки.

Объектом настоящего исследования являются методы моделирования и анализа поведения многоагеитных систем автоматизированной обработки информации и их компонентов.

Предметом исследования является интеллектуальный программный агент автоматизированных систем обработки информации.

Целью диссертационной работы является совершенствование и расширение функциональных возможностей компонентов автоматизированных систем обработки информации в обучающих системах путем их интеллектуализации на основе использования методов планирования поведения интеллектуальных агентов.

Для достижения поставлетпюй цели в диссертационной работе решаются следующие основные задачи:

- анализ существующих методов планирования поведения интеллектуальных агентов и подходов по созданию многоагеитных систем;

— разработка моделей интеллектуального агента и вычислительно-моделирующего комплекса обучающей системы в целом;

— разработка методов планирования поведения интеллектуальных агентов;

— разработка методики оценки эффективности использования интеллектуальной АСОИ в обучающей системе;

— разработка и исследование программного обеспечения, реализующего предложенные методы планирования поведения интеллектуальных агентов.

Методы исследования. Для решения поставленных задач использованы понятия и методы теории множеств, теории нечетких множеств, теории вероятностей, математической логики, нечеткого вывода, формальной семантики языков, системного анализа, методы искусственного интеллекта и системного программирования, а также современные методологии построения программных комплексов и систем.

Достоверность научных положений. Достоверность научных результатов подтверждена теоретическими выкладками, данными компьютерного моделирования поведения интеллектуальных агентов в АСОИ тренажерной системы.

Научная новизна исследования состоит в следующем: ], Разработаны новые методы планирования поведения интеллектуальных агентов с использованием аппарата нечеткой логики, механизмов самонастройки и адаптации.

2. Предложен новый подход к моделированию объектов с изменяемым поведением в обучающих системах.

3. Предложен подход к моделированию сложных систем, включающих объекты с изменяемым поведением.

4. Создана методика оценки эффективности интеллектуальной АСОИ в обучающих системах.

Практическая значимость.

Практическая значимость работы определяется возможностью использования разработанных в ней подходов, методов, а также полученных результатов для:

— создания интеллектуальной среды в обучающих системах, в частности в тренажерных комплексах;

— решения задач1 интеллектуального поведения промышленных роботов;

— создания программных интеллектуальных агентов в вычислительных сетях;

— планирования структур технологических процессов при анализе и построении операционных цепей за счет использования интеллектуальных программных ассистентов.

Реализация результатов работы. Разработанные в диссертационной работе подходы, модели и методы планирования поведения интеллектуальных

агентов реализованы в ОКР «Охта», выполненной ЗАО НИИ «Цептрпрограммсистем», г.Твери в 2006 г. Результаты работы использованы в ОКР «Инструментальные средства поддержки разработки прикладных многоагентиых систем», выполняемой ЗАО НИИ «Центрпрограммсистем», г.Твери.

Апробация работы. Основные теоретические положения и практические результаты работы докладывались и обсуждались на научно-технической конференции «Тренажеростроение: современное = состояние, перспективы развития», ЗАО НИИ «Центрпрограммсистем», г. Тверь, 2005 г., 16-ой Международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании», г. Пенза, 2005.

Положения, выносимые на защиту.

На защиту выносятся:

1. Методы планирования поведения интеллектуальных агентов на основе аппарата нечеткой логики, механизмов адаптации и самонастройки.

2. Модель подсистемы планирования поведения интеллектуального агента, ее основные принципы и алгоритмы функционирования.

3. Модель интеллектуального агента на основе трехуровневой архитектуры и основные принципы ее функционирования.

4. Основные принципы построения архитектуры вычислительно-моделирующего комплекса обучающей системы с использованием многоагентного подхода.

Публикации. Основные результаты, полученные при выполнении диссертационной работы, опубликованы в 6 печатных работах.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы (76 наименований) и приложений. Диссертация содержит 149 страниц машинописного текста.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, ее научная новизна и практическая значимость, сформулированы цель и задачи диссертационной работы. Представлены положения, выносимые на защиту, апробация работы и структура диссертации.

В первой главе проведен анализ тенденций развития обучающих систем, которые связаны, прежде всего, с использованием достижений в областях математического моделирования, искусственного интеллекта, MAC и т.д., а также с теми возможностями, которые предоставляются распределенными вычислительными системами.

Показана необходимость проведения этапа предварительной подготовки специалистов для работы на дорогостоящих, сложных и опасных объектах, комплексах, образцах вооружения и техники с помощью обучающих систем. Пля оттого пеойхолимп. чтобы обучающие системы соответствовали утювто

сложности и уровшо интеллектуальности, достигаемому за счет наличия высококвалифицированного обслуживающего персонала, операторов и т.д. у таких реальных объектов. Проведенный анализ существующих классификаций обучающих систем показал, что в используемых подходах не делается акцента на уровне интеллектуальности обучающих систем.

В результате проведенного исследования в работе выделены компьютерные тренажеры как перспективное направление развития обучающих систем н рассмотрены существующие принципы построения таких комплексов. В диссертации проведен анализ возможностей компьютерных тренажеров, использующих ВМК для имитации среды обучения. Раскрыта важность вычислительно-моделирующих комплексов, определяющих качество таких систем в целом. В работе обоснованы и сформулированы основные требования к современным ВМК обучающих систем, наиболее важными из которых являются:

использование принципов распределенного моделирования;

— включение в среду моделирования объектов с изменяемым поведением;

— учет ограничений на выделенные вычислительные и сетевые ресурсы;

— наличие способности быстрой адаптации к новым типам имитируемых объектов.

Результаты проведенного в диссертации анализа распространенных в настоящее время подходов к построению ВМК, а также методик, используемых при их разработке, позволили сделать выводы, о том, что применяемые приемы и решения не в полной мере обеспечивают выполнение перечисленных требований. В работе отмечено, что наиболее трудновыполнимым является требование по обеспечению изменяемости поведения объектов в интеллектуальной среде обучения.

На основе проведенных исследований для построения ВМК компьютерных тренажеров в диссертационной работе предложено использование теории многоэтапных систем. Этот достаточно простой с математической точки зрения аппарат позволяет обеспечить выполнение перечисленных требований. В рамках теории MAC решение задачи моделирования интеллектуального поведения объектов предполагает использование разных способов и применение различных методик их реализации. В качестве одного из таких способов в работе предложено использование методов планирования поведения.

, В этом случае задача повышения эффективности обучающей системы, за счет создания интеллектуальной среды па базе модифицированных методов планирования поведения интеллектуальных агентов может быть представлена следующим образом:

Z = 4>(F',P',C)-+ шах, (1)

где: Z = {z,IzI,...,z„} — показатели эффективности использования интеллектуальной АСОИ в обучающей системе, п — количество показателей;

F'ei7, P' eP, при условии Ci.CDm,CD - заданная производительность интеллектуальной АСОИ в обучающей системе;

F = {У,,/},—,/*} - методы планирования поведения интеллектуальных агентов, k — количество методов планирования;

" возможные

параметры элементов конфигурации, т1 — количество параметров i-ro метода планирования поведения, / = {1,2,..., к];

С = {е1гс2.....Cj) - показатели производительности интеллектуальной АСОИ в

обучающей системе.

Из выражения 1 видно, что решение задачи повышения эффективности обучающей системы в целом возможно за счет совершенствования методов планирования поведения интеллектуальных агентов и расширения их функциональных возможностей.

Таким образом, основной задачей в данной работе, требующей своего решения, является задача дальнейшего совершенствования и расширения функциональных возможностей компонентов автоматизированных систем обработки информации в обучающих системах путем их интеллектуализации на основе использования методов планирования поведения интеллектуальных агентов.

Во второй главе обоснованы требования к свойствам интеллектуальных агентов и методам планирования их поведения в условиях изменяющейся среды, нечеткости ее описания и действий агентов. Дня этого проведен аналитический обзор работ по многоагентным системам. В диссертации рассмотрены основные составляющие данного направления, к которым, по мнению исследователей данной области, относятся: теория агентов, методы кооперации агентов, архитектура агентов и многоагенгных систем, методы, языки и средства коммуникации агентов, методы и программные средства поддержки мобильности агентов и т.д.

Проанализировано текущее состояние исследований в области MAC и выделен рад актуальных задач требующих решения, к которым относят: разработку моделей самообучающихся агентов, исследования вопросов коллективного обучения, использование нечеткого вывода в моделях общения и поведения агентов, разработку параллельных языков программирования для реализации MAC и тл.

Проанализированы возможные практические подходы по применению многоагенгных систем и существующие архитектуры систем и агентов, в частности, отмечены многоуровневые архитектуры агентов, как наиболее перспективные, и архитектуры на основе планирования, позволяющие реализовать модель планирования поведения. Среди рассмотренных архитектур в диссертации отмечена архитектура InteRRaP, являющаяся основой для разработки структуры интеллектуального агента в рамках предложенного подхода по созданию ВМК обучающей системы.

В результате проведенных исследований и обоснования основных требований к свойствам интеллектуальных агентов, в работе предложено использовать следующее определение для описания интеллектуального агента ВМК обучающей системы: интеллектуальный агент ВМК обучающей системы — это программная сущность, выполняющая функции целенаправленного изменения поведения объекта в среде моделирования, и оказывающая на нее соответствующее воздействие. Данная сущность способна интерпретировать и исполнять команды и обладает свойствами автономности, коллективного поведения, реактивности, знаниями и целями, а также способна подстраиваться под изменяющиеся параметры среды.

Результаты проведенного исследования и анализ требований к свойствам агентов показали, что существующий методический аппарат планирования поведения предоставляемый теорией MAC не вполне удовлетворяет жестким временным н ресурсным ограничениям, накладываемым спецификой ВМК, функционирующих в режиме реального времени.

Для разрешения сложившейся ситуации в диссертационной работе проведен аналитический обзор методов планирования, в результате которого выделены основные типы задач данного направления: планирование в пространстве состояний (SS-проблема) и планирование в пространстве задач (PR-проблема). Проанализированы основные способы их решения, а также рассмотрены наиболее известные примеры реализации планировщиков, определивших развитие данной области. Кроме того, приведены распространенные классификации методов планирования и отдельно выделены перспективные направления исследований проблематики планирования, к которым относятся: планирование во времени и с ограничением ресурсов, информационное и оптимальное планирование, динамическое, адаптивное и планирование в условиях неопределенности, а также распределенное планирование.

Для оценки эффективности способа реализации методов планирования используются показатели оптимальности, которые, согласно работам С.В. Добрецова, можно разбить на две группы: универсальные характеристики, отражающие наиболее общие свойства систем планирования, и специфические показатели, использующие характерные особенности, присущие только системам определенного класса. Среди универсальных характеристик следует особо выделить быстродействие и ресурсоемкостъ, как наиболее важные и существенные характеристики с точки зрения выполнения требований, предъявляемых к методам планирования. В отличие.от расчетных параметров, определение этих двух характеристик осуществляется в результате проведения экспериментальных исследований.

Для оценки возможности улучшения существующих подходов к планированию поведения интеллектуальных агентов проведен аналитический обзор работ, посвящеппых исследованию и разработке высокопроизводительных методов построения планов. Среди них особо выделяется метод, описанный в работе АЛ. Кожушкина, который выгодно отличается от аналогичных подходов, предложенных М. Гинзбергом

(M. Ginsberg). Однако отмеченные методы не предполагают использования в своем составе механизмов обучения и слабо учитывают необходимость использования механизмов настройки.

На основании проведенного анализа был сделал вывод о том, что для дальнейшего развития интеллектуальной среды в ВМК обучающих систем в рамках предложенного подхода необходима разработка повых,' более совершенных способов построения MAC и ее интеллектуальных агентов. Решение этой задачи возможно путем создания новых методов планирования поведения интеллектуальных агентов, способных приспосабливаться к изменению поведения их внешнего окружения.

В третьей главе в рамках предложенного агентно-ориентированного подхода была разработана архитектура мпогоагеитиой моделирующей системы (многоагентного ВМК), представленная на рис. I,

Интерфейс взаимодействия

£

«««

Рис. 1. Структура ВМК на базе MAC

На рис. 1 использованы следующие обозначения: Модель УО, -управляемый объект, где i = {1,...,JV), N — количество управляемых объектов; Модель ИОу — интеллектуальный объект, моделирование поведения которого

выполняется ВМК, где -/ = {1).,.,ДГ}; К — количество интеллектуальных объектов; АРМ* - автоматизированное рабочее место, к ~ {!,...,Л/}, М — количество рабочих мест; £ — количество моделей устройств; Ь — количество моделей среды.

Для приведенной структуры предложено использовать следующее ее формальное описание:

Утк=(}Г,Е,0,Я,С,Х1), (2)

где: № = {уе,,м>:,- множество моделей устройств; Е - {е,,е2,...1е£} -множество моделей сред; О = .,о'к}} - множество

неоднородных объектов, где о^ — управляемая оператором модель объекта, / = {1,2,...,«}; о,- интеллектуальная модель объекта, ] = {1,2,...,*}; Л — множество отношений между элементами системы; С — множество внешних воздействий (управляющих воздействий оператора); Л - множество состояний системы.

В свою очередь, управляемая оператором модель объекта системы представлена как о" = {РЪцАс,}, где РИ, - модель физического представления объекта; Ас1 — модель управляемого поведения. Интеллектуальная модель объекта представлена следующим образом: о'} = где РЪ} — модель

физического представления объекта; 1А} — модель интеллектуального

поведения объекта или интеллектуальный агент ВМК.

Ключевым элементом предлагаемой архитектуры является интеллектуальный агент, предназначенный для обеспечения моделирования поведения объектов в обучающей системе.

В рамках агентно-ориентированного подхода по реализации ВМК обучающей системы и предложенной структуры интеллектуального агента в работе разработана математическая модель интеллектуального поведения, которую можно представить в виде кортежа:

Мва=^Л1Рл,СА,5,А,Р,Щ, (3)

где: ЯА - модель реактивного поведения; РА - модель планирования поведения; С4 — модель коллективного поведения; £ — множество состояний модели; А - множество элементарных действий; Р — множество отношений со средой функционирования; Ш — множество отношений между элементами модели.

Для описания реактивного поведения, планирования поведения и коллективного поведения в диссертационной работе используются следующие определения:

— реактивное поведение — фиксированная последовательность элементарных действий при идентификации определенной ситуации;

— планирование поведения — построение множества упорядоченных последовательностей элементарных действий и способ их выбора в зависимости от состояния внешнего окружения;

- коллективное поведение — совокупность последовательностей действий

группы объектов системы, направленных на решеиие общей задачи.

Реализация моделей реактивного поведения Ял и коллективного поведения СА выполняется при помощи существующего методического аппарата, используемого в настоящее время при разработке программного обеспечения ВМК. Однако он не учитывает существование модели планирования Рл, В связи с этим, в диссертационной работе были разработаны три модели планирования, представляющие модификации методов, отмеченных во второй главе. Модификации исходных методов производились, за счет применения элементов нечеткой логики, применения разработанных автором механизмов самонастройки и адаптации.

Разработанные модели планирования поведения могут быть представлены в виде следующих формальных записей:

1. Рл ={А,ж,РНог1 >1м! — нечеткая адаптивная модель планирования;

2. Рл = (А,тг,Рпог* ,¡1* - нечеткая модель планирования с самонастройкой;

3. Р1, = (А,я,Рпог/- нечеткая адаптивная модель планирования с самонастройкой,

где: А — алфавит планирующей модели; я — множество элементарных планов; Рпог' - множество нечетких отношений частичного порядка; 1т! - нечеткое отношение прерываемости; Р/— множество правил; Ай — функция адаптации; 51 — функция самонастройки; ^ — планирующая функция.

Предложенные модели базируются на разработанных в диссертационной работе методах планирования, в основе которых лежит понятие множества элементарных планов я = {р1,ргг„.,р„}. Под элементарным планом р,, где 1 = {1,...,и} понимается некоторое действие агента о^еЛс, где / = {!,...,£}; Ас — множество действий, которые способен выполнять агент, или некоторая последовательность таких действий {а^}.

Таким образом, на множестве я возможно существование подмножества л'ал, содержащего такие элементарные планы, которые представлены последовательностями других элементарных планов я'—{р1',р2',~.,рт'}, где

Множество нечетких отношений Ргюг1 определяется для множества

Цс! ге{1.....где: я^ - число уровней иерархии, таким образом, что

каждому 2)(е£>, соответствует множество Рпог/{/1Р(р),//(р')}сРгюгг, где: — элементарные планы; /¡Р(р) — функция предпочтительности выполнения элементарного плана р, для /-го уровня, которая представляет собой отображение: /':#х

яхУхЛ^ —>У, где II — состояние модели;

-13Г = - множество критериев истинности, Г=[0,1] - множество значений показателя предпочтительности выполнения элементарного плана.

Нечеткое отношение прерываемости //rf/ определено на множестве жхя таким образом, что выполняется условие

Intf{f'<j>),fr(рЪлреЦ^р'еЦ^ i е{1,...,и^}, где f'(p)- функция предпочтительности выполнения элементарного плана р, которая представляет собой отображение /' :./УхтгхР,хД/—

Функция адаптации представляет собой отображение Ad'.HxR/ —► R/.

Функция самонастройки представлена отображением St: Н х V V.

Тогда функция. планирования представлена как

/' :#хCdH xVxRf xY^Р, где CdH с.ж - множество условий планов; Р = {ря} — план поведения, представляющий собой последовательность элементарных планов.

Множество условий планов состоит из подмножества применимых Арр" и подмножества исполняемых элементарных планов Con", что может быть записано как Cd" = {Аррн ,Сопи}. Подмножества Арр" и Сопн представлены множествами пар вида где bt — переменная,

характеризующая предпочтительность начала (продолжения) í-го элементарного плана; v'( €[0,1] — значение показателя настраиваемого параметра, определяющего минимальное необходимое значение переменной Ь, для определения условий начала (продолжения) плана. Для определения значения переменных v'ef'cC подмножеств Арр" н Conн используется аппарат нечеткой логики. Для этого с помощью метода центра масс рассчитываются четкие значений показателей предпочтительности начала (продолжения) выполнения плана па основе полученных с помощью правил Rf, нечетких значений:

¡У^еШФ,

Y

где у, — выходная переменпая лингвистической модели; H6 (yt) = max(//_, (y¡)), где PjiO',) = sup[/iií.(^)r (*,>>,)]; мАх) ~ функция принадлежности

нечеткого множества А' — характеризующего состояние модели; Вк с К- N нечетких множеств, определенных комбинацией нечеткого множества Л1 и отношения Л, е ; х ~ входная переменная лингвистической модели; (х,у,) - функция принадлежности нечеткого правила Rt.

Реализация бинарных отношений с помощью методов нечеткой логики в диссертационной работе выполнена путем выражения этих отношений через настраиваемые параметры F'cf и использования функций принадлежности,

характеризующих желательность начала выполнения элементарных планов. Для этого используется множество Де/ = \^Рг'юг{ иЪп* = {ге/,,,..,«/^,},

¡е/

элементы которого представлены как:

[1, если условие выполняется; ^ О, если не выполняется,

{УР+У?

где р,р' - элементарные планы; УР,УР- ~ четкие значения показателей предпочтительности начала выполнения планов, полученные с помощью метода центра масс; у/еГсР' -настраиваемый критерий истинности.

Адаптация методов плакирования обеспечивается при помощи механизма синтеза новых нечетких правил на основе существующих, на базе текущих значений параметров модели поведения обстановки. Операция синтеза выполняется за счет изменения функций принадлежности нечетких правил планирования. Это обеспечивается путем придания нечеткому правилу двух разных функций принадлежности для различных состояний модели, т.е. для параметра х, представляющего состояние модели, задается два граничных состояния (л, и хг). Функции принадлежности для правила плакирования в этих состояниях определены как ^ и ¡иг. Оценка текущего состояния модели х* осуществляется путем определения степени близости со его значения к состояниям х, и . Если со равно в случае состояния и 1 в случае состояния хг, то функция принадлежности для состояния х * определяется как: ц* = //¡(1 - а>) + (¿¡а>, или в графическом виде, как представлено на рис.2.

<ы = О

1-6)

т=1

Рис. 2. Адаптация нечеткого правила планирования.

Самонастройка предлагаемых методов планирования поведения реализована с помощью механизма корректировки поправок Д V к параметрам V моделей планирования в соответствии с заданным состоянием л*. Это достигается при помощи оценки изменения состояния системы в ответ на предыдущую настройку и внесение корректировок в поправки АУ на основе нечетких правил самонастройки Л^сй^,

Нечеткие правила самонастройки можно представить в следующем виде: 1. Если > 0, Л?/ > 0, то Ау, следует сильно увеличить;

2. Если я/ & О, Л» <, О, то Ду( следует немного уменьшить;

3. Если 50, Лг/£ 0, то ¿V следует немного увеличить;

4. Если £ 0, ^ 2 0, то Ау, следует сильно уменьшить,

где: st - отклонение состояния модели лот эталонного значения **; Д$1 — приращение отклонения за заданный период /„,; Avf е V/ — поправка для У -го параметра системы, < = {1,...,«}, п - количество параметров.

Настройка параметров модели осуществляется попеременно, чтобы избежать их взаимного влияния на контролируемые характеристики системы. Отклонение состояния системы определяется следующим образом:

= .....(б)

где - значение функции принадлежности, характеризующей меру

отклонения 1-го контролируемого параметра системы 1 = от

эталонного значения Р', Ь — количество контролируемых параметров.

Настройка прерывается, если значение отклонения удовлетворяет неравенству зт^в, где в - постоянная критерия прерывания настройки.

Для предложенных моделей и методов планирования поведения интеллектуального агента была разработана структура подсистемы планирования, которая представлена на рис. 3.

Система моделирования поведения интеллектуального агента

?"ГПоИсистлиа воспоитrtiw

Исполнитвльнаяпадсистеи» ; ж

; Лайсиамша поЩатоят и принятия вешаний

' ввит.

ШьМ

Подсистема

■ пов*д*ния

БОИ

БФНД БПП

■ ..■ ..., ,

БРНД . т> Б4>ЧД

t ■

БОС ¿¿t База знаний

■г- S&f > ' A ■ ,"t,-'i-'т. т..-.; БА ' ШЖ

-' - ч»:— - J '■ БС

..;:> л

Подсистема

мзввшшаиег&

tutssàsuna

■ - " ' '• <

•¡йжвтжтаяся i

!

COR * ni«twpMii»n; ВРНД— Сох p исгр»д»гш <ил

' мчяиц дмиья; БФНД-» формирования нужгошвшныж;, t,,-л: ••."Cv ^ЕОС^бнощщипв« créfwwiuC^^CtawtiiftatFtmpw;, . , т. ".; ' SC* вгиж с»мои>стройищ ВПП - Слое постро« ИИ ftlWIMÏ . •• * •• fiitrMfl- Аппифтттпинртшцшя '¡■'цщц'цнцпг : •

w ¡к/з ILT ааьжл'^дцгил i ЕДЦдЦьдацДЗДЕ___

Рис* 3, Структура подсистемы планирования поведения.

На рисунке представлены основные элементы предложенной структуры, их взаимодействие, а также место подсистемы в системе моделирования поведения агента.

Для оценки эффективности использования интеллектуальных АСОИ в обучающих системах, в диссертационной работе предлагается использовать показатели эффективности функционирования ВМК, обеспечивающие моделирование интеллектуальной среды обучения. В работе приведено обоснование следующих показателей эффективности функционирования ВМК:

— среднего статистического значения успешности реализации ожидаемого поведения объектов;

— среднестатистического значения производительности многоагентной системы по подготовке одного поведенческого решения.

Для определения среднестатистического значения успешности реализации ожидаемого поведения объектов предлагается использовать показатель 7.:

(7)

где: и — количество интеллектуальных агентов; к, — количество подзадач 1-го агента; - частный показатель успешности реализации у-ой подзадачи 1-ым агентом, который определяется как:

где: lg— число случаев благоприятных событию реализации j -ой подзадачи; rrty— общее число случаев.

Для определения среднестатистического значения производительности многоагентной системы по подготовке одного поведенческого решения предлагается использовать величину С:

С = (9)

где U — среднестатистическое время подготовки решения интеллектуальным агентом, которое записывается как:

^сю)

где г¥- время подготовки v-ro решения интеллектуальным агентом, v = {l,...,m}; т— общее количество подготовленных решений в MAC; t = t,—10, где Г„ — время начала выполнения задачи подготовки решения; t,— время завершения задачи подготовки решения.

В четвертой главе приводится описание практической реализации разработанных в работе подходов, моделей, структур и методов планирования поведения интеллектуальных агентов в тактическом тренажере «Охта», а также результаты вычислительного эксперимента по исследованию эффективности предложенных методов. На рисунках 4, 5, б представлены результаты

вычислительного эксперимента, показывающие зависимости показателей 2 и С от параметров методов планирования._

Рис. 4. Влияние количества элементарных планов интеллектуальных агентов на показатели эффективности функционирования многоагептной тренажерной

системы.

Рис. 5. Влияние количества параметров самонастройки интеллектуальных агентов на показатели эффективности функционирования многоагентной тренажерной системы.

С применением эвристической процедуры выбора были определены параметры для различных модификаций методов планирования с учетом требований по производительности СкС0. Полученные экспериментальные данные приведены на рисунках 7, 8, из которых видно, что применение моделей поведения с использованием методов планирования позволило увеличить показатель успешности реализации ожидаемого поведения

мМ' ь > (К- 1-; 1 Е К нов юссв1

^—*

1 !

г I шв

-

г

а ) а »«а«?!»» шнччм !■» а—ицщм 1м

Рис, 6. Влияние количества адаптируемых правил интеллектуальных агентов на показатели эффективности функционирования многоагентной тренажерной

системы.

относительно исходной системы моделирования, но привело к некоторому снижению производительности (С) системы моделирования относительно модели, не использующей методов планирования.

2Ш • 18% -1ОТ4 ■ 14% ■ Ш'о 1044 •

т ш ть •

1%'

-ШМЩМ

У Н- ¡1.

прирост показателя успешности реализации ожидаемого доведения объектов % О нечеткая «дшпквная модель плакирования с сччжнетройкой ■ не моднфнцнровбннм модель планирования 0 нечеткая нодап> плакировимя с самснастройгой _В нечеткая адшшввая модель планирования_

Рис.7. Прирост показателя успешности реализации ожидаемого поведения объектов для разработанных моделей относительно исходной системы

моделирования.

Как видно из диаграмм, приведенных на рисунках 7,8, использование предложенных в диссертационной работе методов обеспечило значительное улучшение показателей успешности реализации ожидаемого поведения моделируемых объектов при некотором снижении производительности в пределах допустимых значений.

46,25%

сннженвс показателя производит ельностн системы моделировании, И

□ нечетка* »дативная модель шинирования с самонастройкой ■ не модифицированная модель планировании Я иппки иодель планирояани» е самонастройкой 51 нечеткая адаптивны модель гигаинронанна

Рис.8. Снижение показателя производительности системы для разработанных моделей относительно исходной системы.

Максимальное значение показателя успешности реализации ожидаемого поведения моделируемых , объектов было достигнуто при использовании нечеткого адаптивного метода планирования с самонастройкой. Однако, как показали исследования производительности ВМК, этот метод оказался достаточно ресурсоемким, но производительность вычислительной системы в целом оказались в рамках допустимых пределов.

В случае использования предложенных методов для м ногоагентного ВМК с большим количеством интеллектуальных объектов рекомендуется использовать нечеткий адаптивный метод планирования поведения.

В заключении приведены основные результаты, получешше в диссертационной работе.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Обосновано применение теории мяогоагентных систем при построении программного обеспечения ВМК обучающих систем.

2. Разработаны метода планирования поведения интеллектуальных агентов в многоагентпой среде обучающей системы.

3. Разработана модель многоэтапного вычислительно-моделирующего комплекса и модель интеллектуального агента.

4. Разработана методика оценки эффективности использования интеллектуальных АСОИ в обучающих системах.

5. Разработано программное обеспечение, реализующее предложенные подходы, модели и методы планирования поведения интеллектуальных агентов.

СЗШСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Рогозин Г.И., Виноградов Г.П., Лазырин М.Б., Арсланов Ф.Х. Автоматизация построения операционных цепей // Перспективы развития Волжского региона: Материалы Всероссийской заочной конференции. Вып.б - Тверь: ООО «Буковица», 2004, - С.58-61.

2. Рогозин Г.И., Виноградов Г.П., Лазырин МБ., Арсланов Ф.Х. Операционные цепи с компенсирующимися погрешностями составляющих звеньев // Перспективы развития Волжского региона: Материалы Всероссийской заочной конференции. Вып.б — Тверь: ООО «Буковица», 2004.-С.б 1-65.

3. Лазырин М.Б. Использование технологии многоагентных систем при разработке тактических тренажеров // Сборник материалов Всероссийской конференции «Тренажеростроение: современное состояние, перспективы развития», — Тверь: ЗАО НИИ «Центрпрограммсистем», 2005. - С.53-57.

4. Лазырин М.Б., Крестьянивов В .Б. Использование много агентной технологии на этапе проектирования обучающих систем // Сборник статей 16 международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании», — Пенза, 2005, С.431-433.

5. Крестъянинов В.Б., Кадушкин А А., Лазырин М.Б. Выбор метода настройки многослойной нейронной сети сигмоидального типа // Сборник статей 16 международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании», —Пенза, 2005, С.433-436.

6. Вимо1радов ГЛ., Лазырин М.Б. Планирование поведения агентов на основе приобретенных знаний И Международный журнал «Проблемы теории и практики управления». Международное научно-практическое приложение «Программные продукты и системы». - 2006,- >&3 — С.45-46.

Подписано в печать 16.11.06 Фнз..печ,л. 1,25 Тираж 100 экз. Заказ №233

Типография ТГТУ 170026, г. Тверь, наб. А. Никитина, 22

Оглавление автор диссертации — кандидата технических наук Лазырин, Максим Борисович

ВВЕДЕНИЕ.

ГЛАВА 1 АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ К РАЗРАБОТКЕ ОБУЧАЮЩИХ СИСТЕМ.

1.1 ис1юльзова! 1ие ж1ф0рмлци01ii1ых технологий для подготовки специалистов.

1.1.1 Основные направления подготовки с использованием информационных технологий.

1.1.2 Компьютерные системы обучения./ /

1.1.3 Дистанционное обучение.

1.1.4 Компьютерные тренажеры различного назначения.

1.1.5 Компьютерные системы обучения и интеллектуальной тренажерной подготовки.

1.2 Использование тренажеров при подготовке ciiei(иалистов.

1.2.1 Современное понятие тренажера.

1.2.2 Классификация тренажеров.

1.2.3 Компьютерные тренажеры.

1.2.4 Структура компьютерного тренажера.

1.3 Анализ сложившейся практики построения вычислительно-моделирующих комплексов.

1.3.1 Основные подходы к построению вычислительно-моделирующих комплексов.

1.3.2 Основные недостатки существующих подходов.

1.3.3 Обоснование агентно-ориентированного подхода к построению вычислительно-моделирующих комплексов.

1.4 Математическая постановка задачи исследования.

Выводы.

ГЛАВА 2 ПЛАНИРОВАНИЕ ПОВЕДЕНИЯ ОБЪЕКТОВ НА ОСНОВЕ АГЕНТНО-ОРИЕНТИРОВАННОГО ПОДХОДА.

2.1 Основные положения теории многоагентных систем.

2.1.1 Возникновение и общие понятия области исследования.

2.1.2 Перспективные направления развития.

2.1.3 Теория агентов и коллективное интеллектуальное поведение.

2.1.4 Архитектура агентов и многоагентных систем.

2.1.5 Планирование как средство реатзации целеустремленного поведения.

2.1.6 Основные требования к интеллектуальным элементам многоагентных вычислительно-моделирующих комплексов обучающих систем.

2.2 Анализ существующих подходов к планированию поведения.

2.2.1 Определение задачи планирования.

2.2.2 Основные системы, определившие пути развития направления.

2.2.3 Классификация систем планирования.

2.2.4 Типы задач планирования.

2.2.5 Методы решения задач iпанирования.

2.2.5.1 Методы решения SS-проблем.

2.2.5.2 Методы решения PR-проблем.

2.2.5.3 Методы, основанные на логическом выводе.

2.2.6 Перспективные направления исследований.

2.3 Применение ме тодов планирования в моделях поведения ин теллектуальных агентов обучающих систем.

2.3.1 Аначиз показателей оптимачыюсти методов планирования.

2.3.2 Основные требования к методам планирования.

2.3.3 Выбор базового подхода для разработки методов планирования.

Выводы.

ГЛАВА 3 МОДЕЛИ И МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОЙ СРЕДЫ ОБУЧАЮЩЕЙ СИСТЕМЫ.

3.1 Модель многоагептного вычислительно-моделирующего комплекса обучающей системы

3.2 Модель интеллектуального агента.

3.3 Методы планирования поведения интеллектуального агента.

3.3.1 Формальное описание исходного метода.

3.3.2 Использование аппарата нечеткой логики.S

3.3.2.1 Формирование множества условий планов с использованием аппарата нечеткой логики.

3.3.2.2 Реатзация бинарных отношений с использованием аппарата нечеткой логики.

3.3.3 Механизм адаптации методов планирования.

3.3.4 Механизм самонастройки методов шинирования.

3.4 модкли планирования поведения интеллектуального агента.

3.5 Подсистема планирования поведения интеллектуального агента.

3.6 Алгоритм работы планирующей подсистемы.

3.7 Показатели эффективности многоагентпого вычисли гнлыю-моделирующего комплекса 114 Выводы.

ГЛАВА 4 ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ И ИССЛЕДОВАНИЕ РАЗРАБОТАННЫХ МЕТОДОВ.

4.1 Использование разработанных подходов, моделей и методов в тактическом тренажере

4.2 Применение разработанных методов в системе моделирования поведения.

4.3 Исследование разработанных моделей.

4.3.1 Подготовка и проведение вычислительного эксперимента.

4.3.2 Исходные данные.

4.3.3 Исследование влияния количества элементарных планов на показатели эффективности системы.

4.3.4 Исследование влияния количества параметров самонастройки на показатели эффективности системы.

4.3.5 Исследование влияния количества адаптируемых правил на показатели эффективности системы.

4.4 Оценка эффективности разработанных методов.

Выводы.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Лазырин, Максим Борисович

Современные системы управления сложными производственными процессами, реализованные с использованием информационных технологий, вызвали бурный рост компьютерных средств подготовки квалифицированных специалистов в этих областях. В настоящее время широкое распространение получили обучающие системы, базирующиеся на использовании вычислительных и телекоммуникационных технологий. Обычно такие системы строятся на основе использования вычислительно-моделирующих комплексов (ВМК), реализованных, как правило, в виде распределенных систем обработки данных и предназначенных для имитации поведения среды обучения.

Уровень подготовки специалистов на таких обучающих системах в значительной степени зависит от применяемого математического аппарата, методов и принципов принятия решений и их функциональных возможностей. Сложные технические системы, в которых люди являются составной частью, обладают свойствами активности, которые характеризуются свободой выбора и стратегий взаимодействия, а также наличием свойства разумного поведения. Это означает, что такие же свойства должны быть реализованы в имитаторе обстановки и средств взаимодействия, предоставляемых обучаемому.

Одним из возможных способов реализации таких ВМК является применение моделей, алгоритмов, процедур взаимодействия и т.д., полученных в теории многоагентных систем (MAC). Использование агентно-ориентированного подхода для построения программного обеспечения ВМК позволяет более подробно исследовать и разрабатывать интеллектуальные среды обучения. Таким образом, теорию MAC можно использовать в качестве основы для построения сложных интеллектуальных информационных систем по созданию тренажеров, отвечающих современным требованиям. Основным понятием в теории MAC является понятие интеллектуального агента, под которым понимается некоторая программная сущность, обладающая не только способностью преобразовывать информацию, но и поведением, позволяющим организовать ее взаимодействие с внешней средой. Такой подход к представлению взаимодействующих объектов позволяет рассматривать их как объекты, обладающие некоторым интеллектом, наличие которого предоставляет возможность упростить процессы разработки и отладки достаточно сложных систем. Такие объекты принято называть интеллектуальными агентами. Интеллектуализация компонентов распределенных систем позволяет расширить функциональные возможности и унифицировать способы взаимодействия между ними.

Заметный вклад в разработку интеллектуальных объектов, позволяющих моделировать такое сложное поведение объектов, внесли такие ученые, как Д. А. Поспелов, Э. В. Попов, В. К. Финн, В. Н. Вагин, А. П. Еремеев, О. П. Кузнецов, Г. С. Осипов, И. Б. Фоминых, В. Ф. Хорошевский и др.

Основные подходы к моделированию многоагентных систем с интеллектуальным поведением на основе различных математических аппаратов достаточно подробно отражены в работах В. И. Городецкого, Д. А. Поспелова, В. И. Варшавского, В. Б. Тарасова, О. В. Карасева, В. Ф. Хорошевского, М. Вудриджа (M.Wooldridge), Н. Дженнипгса (N. Jennings.), П. Мюллера (P. Muller) и других ученых. Однако практическое использование существующих методов для построения обучающих систем на основе ВМК требует проведения дополнительных исследований.

Большую роль при разработке интеллектуальных агентов играет использование методов планирования их поведения. Применение методов планирования позволяет реализовать алгоритмы, способные адаптироваться к среде функционирования и поведению других объектов.

Работы в области планирования поведения или построения последовательности действий для достижения заданной цели ведутся в течение нескольких десятков лет силами многих отечественных и зарубежных ученых. Значительный вклад в разработку подходов и методов планирования внесли Р. Файкс (R. Fikes), Н. Нильсон (N. Nilsson), А. Ныоэлл, С. Сафра (S. Safra), П. Дойл (P. Doyle), Р. Альтерман (R. Alterman), С. Ханке (S. Hanks), А. Н. Аверкин, А. И. Эрлих, Е. И. Ефимов. К основным недостаткам существующих методов можно отнести ограничение их использования в системах реального времени. Решению данной проблемы посвящены работы Ф. Бахуса (F. Bacchus), Дж. Хоффмана (J. Hoffmann), П. Доэрти (P. Doherty), М. Гинзберга (М. Ginsberg), А. Н. Кожушкина. Однако в данных работах не уделяется должного внимания возможности использования механизмов разработки планов, приспосабливающихся к внешней обстановке, и стратегий их выбора в условиях качественной информации.

Таким образом, актуальность темы данной работы обусловлена необходимостью расширения функциональных возможностей интеллектуальных объектов и методов их разработки.

Объектом настоящего исследования являются методы моделирования и анализа поведения многоагентных систем автоматизированной обработки информации и их компонентов.

Предметом исследования является интеллектуальный программный агент автоматизированных систем обработки информации.

Целыо диссертационной работы является совершенствование и расширение функциональных возможностей компонентов автоматизированных систем обработки информации в обучающих системах путем их интеллектуализации на основе использования методов планирования поведения интеллектуальных агентов.

Для достижения поставленной цели в диссертационной работе решаются следующие основные задачи:

- анализ существующих методов планирования поведения интеллектуальных агентов и подходов по созданию многоагентпых систем;

- разработка моделей интеллектуального агента и вычислительно-моделирующего комплекса обучающей системы в целом;

- разработка методов планирования поведения интеллектуальных агентов;

- разработка методики оценки эффективности использования интеллектуальной АСОИ в обучающей системе;

- разработка и исследование программного обеспечения, реализующего предложенные методы планирования поведения интеллектуальных агентов.

Методы исследования. Для решения поставленных задач использованы понятия и методы теории множеств, теории нечетких множеств, теории вероятностей, математической логики, нечеткого вывода, формальной семантики языков, системного анализа, методы искусственного интеллекта и системного программирования, а также современные методологии построения программных комплексов и систем.

Достоверность научных положений. Достоверность научных результатов подтверждена теоретическими выкладками, данными компьютерного моделирования поведения интеллектуальных агентов в АСОИ тренажерной системы.

Научная новизна исследования состоит в следующем:

1. Разработаны новые методы планирования поведения интеллектуальных агентов с использованием аппарата нечеткой логики, механизмов самонастройки и адаптации.

2. Предложен новый подход к моделированию объектов с изменяемым поведением в обучающих системах.

3. Предложен подход к моделированию сложных систем, включающих объекты с изменяемым поведением.

4. Создана методика оценки эффективности интеллектуальной АСОИ в обучающих системах.

Практическая значимость.

Практическая значимость работы определяется возможностью использования разработанных в ней подходов, методов, а также полученных результатов для:

- создания интеллектуальной среды в обучающих системах, в частности в тренажерных комплексах;

- решения задач интеллектуального поведения промышленных роботов;

- создания программных интеллектуальных агентов в вычислительных сетях;

- планирования структур технологических процессов при анализе и построении операционных цепей за счет использования интеллектуальных программных ассистентов.

Реализация результатов работы. Разработанные в диссертационной работе подходы, модели и методы планирования поведения интеллектуальных агентов реализованы в ОКР «Охта», выполненной ЗАО НИИ «Центрпрограммсистем», г.Твери в 2006 г. Результаты работы использованы в ОКР «Инструментальные средства поддержки разработки прикладных многоагентных систем», выполняемой ЗАО НИИ «Центрпрограммсистем», г.Твери.

Апробация работы. Основные теоретические положения и практические результаты работы докладывались и обсуждались на научно-технической конференции «Тренажеростроение: современное состояние, перспективы развития», ЗАО НИИ «Центрпрограммсистем», г. Тверь, 2005 г., 16-й Международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании», г. Пенза, 2005.

Положения, выносимые на защиту.

На защиту выносятся:

1. Методы планирования поведения интеллектуальных агентов на основе аппарата нечеткой логики, механизмов адаптации и самонастройки.

2. Модель подсистемы планирования поведения интеллектуального агента, ее основные принципы и алгоритмы функционирования.

3. Модель интеллектуального агента на основе трехуровневой архитектуры и основные принципы ее функционирования.

4. Основные принципы построения архитектуры вычислительно-моделирующего комплекса обучающей системы с использованием многоагентного подхода.

Публикации. Основные результаты, полученные при выполнении диссертационной работы, опубликованы в 6 печатных работах.

Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы (77 наименований) и приложений. Диссертация содержит 149 страниц машинописного текста.

Заключение диссертация на тему "Исследование и разработка методов планирования поведения интеллектуальных агентов в обучающих системах"

Результаты работы позволяют сделать вывод о том, что научная задача совершенствования и расширения функциональных возможностей компонентов автоматизированных систем обработки информации в обучающих системах путем их интеллектуализации на основе использования методов планирования поведения интеллектуальных агентов была выполнена, что подтверждается экспериментальными данными.

Заключение

В результате проведенных теоретических и экспериментальных исследований в диссертационной работе получены следующие результаты:

1. Проведено исследование предметной области, обоснованы актуальность, цель и задачи работы (гл.1).

Выполненное исследование существующих подходов к разработке обучающих систем показало, что основные тенденции их развития связаны прежде всего с использованием достижений в области математического моделирования, искусственного интеллекта, многоагентных систем и т.д., а также с теми возможностями, которые предоставляются распределенными вычислительными системами.

Показана необходимость проведения этапа предварительной подготовки специалистов для работы на дорогостоящих, сложных и опасных объектах, комплексах, образцах вооружения и техники с помощью обучающих систем. Для этого необходимо, чтобы обучающие системы соответствовали уровню сложности и интеллектуальности, достигаемому за счет наличия высококвалифицированного обслуживающего персонала, операторов и т.д. у таких реальных объектов. Проведенный анализ существующих классификаций обучающих систем показал, что в используемых подходах не делается акцента на уровне интеллектуальности обучающих систем.

В результате проведенного исследования выделены компьютерные тренажеры как перспективное направление развития обучающих систем и рассмотрены существующие принципы построения таких комплексов. Проведен анализ возможностей компьютерных тренажеров, использующих ВМК для имитации среды обучения, дано обоснование и сформулированы основные требования к современным ВМК обучающих систем, наиболее важными из которых являются:

- использование принципов распределенного моделирования;

- включение в среду моделирования объектов с изменяемым поведением;

- учет ограничений на выделенные вычислительные и сетевые ресурсы;

- наличие способности быстрой адаптации к новым типам имитируемых объектов.

Результаты проведенного анализа распространенных в настоящее время подходов к построению ВМК, а также методик, используемых при их разработке, позволили сделать выводы о том, что применяемые приемы и решения не в полной мере обеспечивают выполнение перечисленных требований.

2. Обосновано применение теории многоагентных систем при построении программного обеспечения ВМК обучающих систем (гл.1).

На основе проведенных исследований обосновано использование теории многоагентных систем при построении вычислительно-моделирующих комплексов обучающих систем на примере компьютерных тренажеров. В рамках теории MAC решение задачи моделирования интеллектуального поведения объектов предполагает использование разных способов и применение различных методик их реализации. В качестве одного из таких способов в работе используются методы планирования поведения интеллектуальных агентов.

На основе предложенных подходов по совершенствованию и расширению функциональных возможностей обучающих систем, а также по результатам проведенного анализа сформулирована научная постановка задачи исследования.

3. Обоснованы требования к свойствам интеллектуальных агентов и методам планирования их поведения в условиях изменяющейся среды, нечеткости ее описания и действий агентов (гл.2).

Для этого проведен аналитический обзор работ по многоагентным системам. В диссертации рассмотрены основные составляющие данного направления, к которым относятся: теория агентов, методы кооперации агентов, архитектура агентов и многоагентных систем, методы, языки и средства коммуникации агентов, методы и программные средства поддержки мобильности агентов и т.д.

Проанализированы возможные практические подходы по применению многоагентных систем и существующие архитектуры систем и агентов, в частности, отмечены многоуровневые архитектуры агентов как наиболее перспективные и архитектуры на основе планирования, позволяющие реализовать модель планирования поведения. Среди рассмотренных архитектур отмечена архитектура InteRRaP, ставшая основой для разработки структуры интеллектуального агента в рамках предложенного подхода по созданию ВМК обучающей системы.

На основании проведенных исследований обоснованы основные требования к свойствам интеллектуальных агентов для их использования в составе вычислительно-моделирующих комплексов обучающих систем.

Для обоснования требований к методам планирования проведен аналитический обзор, в результате которого выделены основные показатели оптимальности, которые разбиты на две группы: универсальные характеристики, отражающие наиболее общие свойства систем планирования, и специфические показатели, использующие характерные особенности, присущие только системам определенного класса. Среди универсальных характеристик выделены быстродействие и ресурсоемкость как наиболее важные и существенные характеристики с точки зрения выполнения требований, предъявляемых к интеллектуальным агентам, функционирующим в составе ВМК обучающей системы. Отмечено, что в отличие от расчетных параметров определение этих двух характеристик осуществляется в результате проведения экспериментальных исследований.

Для оценки возможности улучшения существующих подходов к планированию поведения интеллектуальных агентов проведен аналитический обзор работ, посвященных исследованию и разработке высокопроизводительных методов построения планов. Среди них особо выделен метод, описанный в работе А. Н. Кожушкииа. Проведенное исследование отмеченного метода позволило выявить основные его недостатки, связанные с тем, что он не предполагает использования в своем составе механизмов обучения и слабо учитывает необходимость использования механизмов настройки.

4. Разработаны методы планирования поведения интеллектуальных агентов в многоагентной среде обучающей системы (гл.З).

Выполнена разработка формального описания метода планирования, предложенного А. Н. Кожушкиным. Для приведенного метода выработаны способы модификации с использованием аппарата нечеткого вывода, реализация которых позволила создать механизм формирования множества нечетких бинарных условий начала и продолжения выполнения элементарных планов. Разработанный механизм основан на использовании нечетких правил и настраиваемых параметров. Для предложенного подхода приведен пример, иллюстрирующий его работу.

С использованием полученных результатов выполнена разработка механизмов адаптации и самонастройки. Адаптация метода планирования осуществляется за счет изменения параметров нечетких правил, путем приписывания одному правилу различных функций принадлежности, актуальность которых определяется по текущим условиям и состоянию агента. Предложенный механизм проиллюстрирован примером.

Реализация механизма самонастройки выполнена с использованием нечетких правил, а также на базе знаний о результатах предыдущих операций самонастройки. Настройка параметров системы реализована за счет изменения поправок к характеристикам системы. В качестве способа приведения нечетких результатов к четким значениям предложен метода центра масс.

Обобщение полученных результатов позволило выделить три модификации описанного метода планирования: a) нечеткий метод планирования с самонастройкой; b) нечеткий адаптивный метод планирования; c) нечеткий адаптивный метод планирования с самонастройкой.

Для созданных методов разработаны математические модели.

Для предложенных математических моделей разработана обобщенная структура подсистемы планирования поведения интеллектуальных агентов. Описание работы структуры выполнено в виде обобщенного алгоритма ее функционирования.

5. Разработаны модель многоагентного вычислительно-моделирующего комплекса и модель интеллектуального агента (гл.З).

Основной особенностью разработанной модели многоагентного вычислительно-моделирующего комплекса обучающей системы является использование в качестве моделей поведения «умных» объектов - интеллектуальных агентов, обеспечивающих изменяемое поведение и возможность решения задач подготовки и принятия решений по своим дальнейшим действиям с помощью разных моделей поведения, к которым относятся: a) модель реактивного поведения; b) модель коллективного поведения; c) модель локального планирования поведения.

В рамках предложенной модели ВМК выполнена разработка модели интеллектуального агента в виде формального описания и структуры на базе элементов InteRRaP архитектуры. Особенностью созданной структуры является то, что взаимодействие агента с внешним миром, в том числе с другими агентами, осуществляется через модель физического представления объекта.

Основным отличием разработанного подхода от заложенных в InteRRaP архитектуру принципов является то, что предложенная структура обеспечивает идентификацию ситуации в подсистеме подготовки и принятия решений, которая выполняет передачу управления на соответствующий уровень иерархии системы поведения интеллектуального агента. Кроме того, подсистема подготовки и принятия решений отслеживает поступающие с уровней поведения предложения и в случае возникновения противоречивых ситуаций обеспечивает их разрешение. Таким образом, предложенный подход, базируясь на элементной базе архитектуры InteRRaP, реализует взаимодействие уровней через посредника в виде подсистемы подготовки и принятия решений.

6. Разработана методика оценки эффективности использования интеллектуальных АСОИ в обучающих системах (гл.З).

Для разработки методики оценки эффективности использования интеллектуальных АСОИ обучающих систем проведено обоснование показателей эффективности функционирования ВМК. Расчет показателей выполняется с использованием методов, выработанных в результате анализа подходов к моделированию поведения объектов в ВМК обучающих систем.

7. Разработано программное обеспечение, реализующее предложенные подходы, модели и методы планирования поведения интеллектуальных агентов (гл.4).

Созданные модели, методы и структуры использовались в программном обеспечении ТТ «Охта» при реализации интеллектуальных агентов, предназначенных для выполнения моделирования ударных самолетов и командных пунктов наведения.

8. Проведено исследование свойств методов при помощи доработанных программных средств из состава тренажерной системы (гл.4).

Для проведения вычислительного эксперимента произведены:

- доработка имитатора обстановки ТТ «Охта» путем добавления в него средств сбора статистики и автоматизации проведения эксперимента; определение перечня исходных данных экспериментальных исследований;

- задание интервалов изменения исходных параметров на основе практического опыта по реализации моделирующей системы ТТ «Охта».

В результате проведенного вычислительного эксперимента получены статистические данные по изменению показателей эффективности ВМК в зависимости от используемых методов и их параметров.

С применением эвристической процедуры выбора определены параметры для различных модификаций методов планирования с учетом требований по производительности. На основе полученных значений проведены настройка имитатора обстановки тактического тренажера и эксперименты, статистический анализ результатов которых позволил оценить практическую эффективность разработанных методов. Практическое повышение показателя успешности реализации ожидаемого поведения объектов на основе разработанного нечеткого адаптивного метода планирования с самонастройкой относительно исходной моделирующей системы составило 17,34 %, при этом снижение производительности многоагентного вычислительно-моделирующего комплекса - 46,25 %. Следует отметить, что такое снижение производительности при используемых аппаратных средствах в рассматриваемом тактическом тренажере никак не отразилось на его функциональности, т.к. существующий запас по заложенным параметрам технических ресурсов намного превосходит возросшие потребности.

Библиография Лазырин, Максим Борисович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Багрецов С.А., Попов Г.М. Методические рекомендации по оценке дидактической эффективности обучающих систем. Л.: МО СССР, 1988.

2. Балашевич В.А. Математические методы в управлении производством. Минск: «Вышейшая школа»., 1976. - 336 с.

3. Башмаков А.И., Башмаков И. А. Разработка компьютерных учебников и обучающих систем.- М., изд. Филин, 2003.

4. Беллмап Р., Заде Л. Принятие решений в расплывчатых условиях.- В кн.: Вопросы анализа и процедуры принятия решений,- М.:Мир, 1976.-С. 172-215.

5. Бонгард М.М., Лосев И.С., Смирнов М.С. Проект модели организации поведения «Животное» // Сб. «Моделирование обучения и поведения», М.: «Наука», 1975.

6. Борисов А.В., Тарасов В.Б. Моделирование мнений агентов в многоагентных системах на основе четырехзначных семантик // Программные продукты и системы. 2006. - №2. - С.47-50.

7. Борисов А.Н., Алексеев А.В., Крумберг О.А. и др. Модели принятия решений на основе лингвистической переменной. Рига: Зинатне, 1982.-256 с.

8. Брусиловский П.Л. Интеллектуальные обучающие системы // Информатика. Информационные технологии. Средства и системы, 1990.

9. В.И.Варшавский, Д.А.Поспелов. Оркестр играет без дирижера. М: Наука., 1984.

10. Вентцель Е.С. Теория вероятностей: Учебник для студ. вузов/ Елена Сергеевна Вентцель 9-е изд., стер. - М.: Издательский центр «Академия» 2005. - 576 с.

11. Газе-Рапорт М.Г. Поспелов Д.А., От амебы до робота: модели поведения. М.: Наука. Гл. ред. Физ.-мат. лит., 1987. 288 с.

12. Городецкий В.И. Информационные технологии и многоагентные системы // Проблемы информатизации. 1998. Вып. 1. с. 3 14.

13. Городецкий В.И., Грушипский М.С., Хабалов А.В. Многоагентные системы (обзор) // Новости искусственного интеллекта, №2, 1998.

14. Городецкий В.И., Карасев О.В., Конюший В.Г., Самойлов В.В., Хабалов А.В. Среда разработки многоагентных приложений MASDK // Информационные технологии и вычислительные системы №1, 2003 г.,-С.26-41.

15. ГОСТ 26387-84 Система «человек-машина». Термины и определения. М.: Изд-во стандартов, 1986. - 7 с.

16. Добрецов С.В., Птицина JI.K. Анализ критериев оптимальности алгоритмов планирования действий интеллектуальных агентов. iu4.bmstu.ru

17. Добрецов С.В., Шестаков С.М. Планирование действий в искусственном интеллекте // ВАТТ СПбГТУ, №2 1998 С.32-46.

18. Заде JI. Понятие лингвистической переменной и ее применение к принятию приближенных решений. М.: Мир, 1976.-165 с.

19. Заде JI.A. Основы нового подхода к анализу сложных систем и процессов принятия решений.- В кн.: Математика сегодня. М.: Знание, 1974, с. 5-49.

20. Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика. М.: Горячая Линия - Телеком, 2004143 е.: ил.

21. Искусственный интеллект.-В 3-х кн. Кн.2 Модели и методы: Справочник / Под ред. Д.А.Поспелова М.: Радио и связь, 1990.

22. Калинин 10. П., Деев В. В., Куляница А. Л. «Основы концепции создания и применения систем тренинга и моделирования в ВС РФ». Материалы конференции по вопросам выполнения НИР «Кофейник». М, 3 ЦНИИ МО РФ. 1996, с.48-53.

23. Кельтон В., JToy А. Имитационное моделирование. Классика CS. 3-е изд. СПб.: Питер; Киев: Издательская группа BHV, 2004. - 847 е.: ил.

24. Клышинский Э.С. Одна модель построения агента // Труды Международной конференции Интеллектуальное управление: новые интеллектуальные технологии в задачах управления (ICIT'99) Переславль-Залесский, 6-9 декабря 1999 г., 1999. www.raai.org.

25. Концепция федеральной целевой программы развития образования на 2006-2010 годы / Высшее образование, № 6, 2001.

26. Копанев А. А. Информационное и техническое обеспечение тренажерных комплексов СПб., 1998.-138 с. : ил.

27. Круглов В.В., Дли М.И., Голунов Р.Ю., Нечеткая логика и искусственные нейронные сети. Учеб. Пособие. М.: Издательство Физико-математической литературы, 2001.-224 с.

28. Ларионов A.M., Майоров С.А., Новиков Г.И. Вычислительные комплексы, системы и сети. Л.: ЭНЕРГОАТОМИЗДАТ, 1987 - 178 е., ил.

29. Лорьер Ж.-Л. Системы искусственного интеллекта: Пер. с франц.-М.: Мир, 1991.-568 е., ил.

30. Магид С.И., Кузнецов М.И., Архипова Е.Н. Использование современных информационных технологий при разработке тренажеров для тепловых электрических станций. // Энергосбережение и водоподготовка. 2004. №2. С.26-30.

31. Международная конференция «Морские обучающие тренажеры», 25-27 мая 1999 г.:Тез. докл.- СПб.:ГМА им. адм. С. О. Макарова, 1999.-81 с.:схем.

32. Международная научно-техническая конференция «Теория и практика имитационного моделирования и создания тренажеров»: Сб. материалов. Пенза, 2000.-151 с.:ил.

33. Минский М.: 1979. Фреймы для представления знаний. М.:Энергия.

34. Моделирование и управление в распределенных вычислительных сетях // Сборник научных трудов Киев: Наук. Думка, 1989.

35. Поспелов Д.А. Многоагентные системы настоящее и будущее // Информационные технологии и вычислительные системы. - 1998. - № 1. -С.14-21.

36. Прикладные нечеткие системы: Пер. с япон./ К. Асаи, Д. Ватада, С. Иван и др.; под редакцией Т. Терано, К. Асаи, М. Сугэно. М.:Мир, 1993368 с, ил.

37. Птицына JI.K., Шестаков С.М. Проектирование интеллектуальных агентов для гетерогенных сетей // Материалы межвузовской научной конференции "Пятьдесят лет развития кибернетики", СПбГТУ, 1999г.-СПб, 1999.-С.81-82.

38. Пупков К.А., Коньков В.Г. Интеллектуальные системы. М.: Издательство МГТУ им. Н.Э. Баумана, 2003. - 348 е., ил.

39. Рутковская Д., Пилиньский М., Рутковский JI. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия - Телеком, 2004 е.: ил.

40. Скрэгг Г., 1983. Семантические сети как модели памяти // Новое в зарубежной лингвистике. Вып. 12. М.: Радуга. С. 228-271.

41. Современный толковый словарь. Изд. «Большая Советская Энциклопедия», 1997 г. OCR Палек, 1998 г.

42. Стефанюк B.JI. Локальная организация интеллектуальных систем. М.: ФИЗМАТЛИТ, 2004. - 328 с.

43. Тарасов В.Б. Современные направления искусственного интеллекта // Кибернетика ожидания и результаты. Политехнические чтения. Вып.2-М: Знание, 2002.-С. 105-111.

44. Тарасов В.Б. Агенты и многоагеитпые системы: основные истоки, подходы, принципы и направления // Компьютерная хроника. 1998. - №12. -С.103-122.

45. Тарасов В.Б. Агенты, многоагентные системы, виртуальные сообщества: стратегическое направление в информатике и искусственном интеллекте // Новости искусственного интеллекта, № 2, 1998, с.5-63.

46. Тарасов В.Б. Эволюционная семиотика и нечеткие многоагентные системы основные теоретические подходы к построению интеллектуальных организаций // Информационные технологии и вычислительные системы. - 1998. - №1. - С.54-68.

47. Таха X. Введение в исследование операций: В 2-х книгах. Кн. 2. Пер. с англ. -М.: Мир, 1985.-495 е., ил.

48. Автоматизированные системы управления, электронное обучение и тренажеростроение / Тез.докл Тверь, 2005. - 133 с.

49. Теория активных систем / Труды международной научно-практической конференции (16-18 ноября 2005 г., Москва, Россия). Общая редакция Бурков В.Н., Новиков Д.А. М.: ИПУ РАН, 2005. - 231 с.

50. Тимофеев А.В. Мультиагентные системы планирования поведения транспортных роботов в среде с препятствиями. // Экстремальная робототехника. X научно-техническая конференция. Санкт-Петербург, 1999.

51. Тренажерные системы / В.Е. Шукшунов, IO.A. Бакулов, В.Н. Григоренко и др. -М.: Машиностроение, 1981. 256 с.

52. Феррари Д. Оценка производительности вычислительных систем: Пер. с англ. М.: Мир, 1981.

53. Филатова Н.Н., Вавилова Н.И., Ахремчик O.JI. Мультимедиа тренажерные комплексы для технического образования. // Educational Technology & Society 6(3), pp. 164-186, 2003.

54. Фин B.K. Об интеллектуальном анализе данных // Новости Искусственного интеллекта, № 3, 2004.

55. Чекинов Г.П., Чекинов С.Г. Применение технологии многоагентных систем для интеллектуальной поддержки принятия решения (ИППР) // Сетевой электронный научный журнал "Системотехника".,№ 1, 2003.

56. Шапорев С.Д. Математическая логика. Курс лекций и практических занятий. СПб.: БХВ-Петербург, 2005.-416 е.: ил.

57. Шенк Р., Хантер JI., Познать механизмы мышления // Реальность и прогнозы искусственного интеллекта. М.: Мир, 1987.

58. Шукшунов В.Е., Циблиев В.В., Потоцкий С.И. и др. Тренажерные комплексы и тренажеры. Технологии разработки и опыт эксплуатации. М.: Машиностроение, 2005. - 384 с.

59. A. Kozhushkin. PS1 Team: Planning Method and Main Principles of the Agents Architecture. Team Descriptions (Simulation League), pp. 110-115. Linkoeping University Electronic Press 1999.

60. Bacchus, F., and Kabanza, F. 2000. Using temporal logics to express search control knowledge for planning. Artificial Intelligence 116:123-191.

61. Barish G., Knoblock C.A. Speculative Execution for Information Gathering Plans // Proc. of the 6-th Intern. Conf. on AI Planning and Scheduling (AIPS-2002). Toulouse, France, 2002.

62. Doherty, P., and Kvarnstrom, J. 1999. Talplanner: An empirical investigation of a temporal logic-based forward chaining planner. In Proceedings of TIME '99, IEEE Computer Society, 47-54.

63. Doyle P.,Planning. AI Qual Summary. Stanford University, 1997.

64. Fahiem Bacchus. Planning with Resource and Concurrency A Forward Chaining Approach, 2001. www.cs.totonto.edu.

65. Hoffmann, J. 2000. Fast-forward. www.informatik.uni-freiburg.de

66. M. Ginsberg, H. Holbrook. What defaults can do that hierarchies can't -Fundamental Informaticae (21), pp. 149-159, 1994.

67. M. Ginsberg. Approximate Planning — Artificial Intelligence Journal, (76)1-2, pp. 89-123, 1995.

68. M. Ginsberg. Modality and Interrupts — Journal of Automated Reasoning, (14)1, pp. 43-91, 1995.

69. M.P.Georgeff and A.S.Rao. BDI Agents: From Theory to Practice. In Procedings First International Conference on Multi-Agent Systems (ed. V. Lesser). AAAI Press/The MIT Press, pp. 312-319, 1995.

70. R.E.Fikes and N.Nilsson. STRIPS: A new Approach to the Application of Theorem Proving to Problem Solving. Artificial Intelligence, 5(2), pp. 189-208, 1971.

71. RoboCup-97: Robot Soccer World Cup I. Springer 1998. -www.springerlink.com

72. RoboCup-98: Robot Soccer World Cup II. Springer 1999. -www.springerlink.com

73. Safra S., Tennenholtz M., On Planning while Learning. Journal of Artificial Intelligence Research 9(2), pp. 111-129, 1994.