автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Инструментальная поддержка распределенного обучения и принятия решений в открытых сетях агентов

кандидата технических наук
Серебряков, Сергей Валерьевич
город
Санкт-Петербург
год
2008
специальность ВАК РФ
05.13.11
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Инструментальная поддержка распределенного обучения и принятия решений в открытых сетях агентов»

Автореферат диссертации по теме "Инструментальная поддержка распределенного обучения и принятия решений в открытых сетях агентов"

На правах рукописи

Серебряков Сергей Валерьевич

ИНСТРУМЕНТАЛЬНАЯ ПОДДЕРЖКА РАСПРЕДЕЛЁННОГО ОБУЧЕНИЯ И ПРИНЯТИЯ РЕШЕНИЙ В ОТКРЫТЫХ СЕТЯХ АГЕНТОВ

Р^ ОД

ге АВГ2008

Специальность

051311 — Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 2008

□□3445544

003445544

Работа выполнена в Учреждение Российской академии наук Санкт-Петербургский институт информатики и автоматизации РАН (СПИИРАН)

Научный руководитель доктор технических наук,

профессор Городецкий Владимир Иванович

Официальные оппоненты доктор технических наук,

профессор Скобелев Петр Олегович доктор технических наук,

профессор Шкодырев Вячеслав Петрович

Ведущая организация Санкт-Петербургский Государственный Электротехнический Университет «ЛЭТИ»

Защита состоится «16» сентября 2008 г в 11 часов на заседании диссертационного совета Д 002.199.01 при Санкт-Петербургском институте информатики и автоматизации РАН по адресу 199178, Санкт-Петербург, В.0,14 линия, 39

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского института информатики и автоматизации РАН

Автореферат разослан «£5> ию^Я 2008 г.

Ученый секретарь диссертационного совета П п

кандидат технических наук Уу/^м/^^ Ронжин Андрей Леонидович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации.

Направления развития современных информационных технологий в настоящее время во многом определяются требованиями практики и, прежде всего приложениями, которые ориентированы на распределенное принятие решений К ним относятся системы мониторинга, анализа и предсказания развития глобальных природных процессов, экологической и технической безопасности, управления снижением вредных и опасных последствий стихийных бедствий и техногенных катастроф. Приложения в области мобильных телекоммуникаций и мобильных вычислений формируют еще один класс актуальных приложений, связанных с задачами распределенного принятия решений Подобные же задачи возникают в военных приложениях, например, при создании средств оперативного анализа обстановки на тактических театрах военных действий на основе сенсорных сетей, при создании средств оперативной обработки информации, получаемой от распределенной системы наблюдения, развернутой на множестве беспилотных летательных аппаратов, и во многих других.

Системы распределенного принятия решений в названных классах приложений включают в себя пространственно распределенные сенсорные сети, средства хранения и обработки данных, сети передачи данных, средства визуализации и т п Общими чертами таких приложений, которые в первую очередь определяют требования к адекватным информационным технологиям, являются следующие

1 Сетевая организация с очень большим числом узлов

2 Большое число источников, генерирующие огромные потоки данных, которые технически невозможно хранить в каком-либо централизованном хранилище и обрабатывать в централизованной архитектуре

3 Динамический состав узлов сети и ее топологии, поскольку, например, мобильные устройства могут включаться и выключаться, сенсоры сети могут выходить из строя и прекращать работу из-за истощения источников энергии, беспилотные летательные аппараты распределенной системы наблюдения могут прекращать свое существование и т д

4 Конфиденциальность данных источников (коммерческие данные, секретные данные, и тд), что исключает возможность их централизованной обработки

5 Необходимость координации поведения компонент системы, поскольку они существуют в общей внешней среде, используют общие ограниченные ресурсы, кооперируются при совместном решении задач и т д

6 Гетерогенность программной среды, в которой в различных узлах сети могут использоваться разные операционные системы, (Linux, Symbian, Windows и тп) и различные коммуникационные протоколы (TCP/IP, UDP, SMTP и др) поверх проводных и беспроводных коммуникационных каналов f

Л

Пока не создана информационная технология, которая была бы в (»стоянии в полной мере справиться с разработкой приложений, обладающих перечисленными выше особенностями Анализ существующих информационных технологий позволяет сделать вывод о том, что наибольшими перслектшами в этом направлении потенциально обладают технологии, интегрирующие идеи распределенного принятия решений (они смещают основной объем вычислений на уровень источников данных), концепцию многоагентных систем (она очень удобна для концептуализации и декомпозиции сложных распределенных проблем), архитектуры, ориентированной на сервис (в ней агенты могут взаимодействовать при минимуме начальной информации о топологии сети, об агентах, присутствующих в ней, и о доступных сервисах) и вычислений на основе парных (Peer-to-Peer, Р2Р) взаимодействий (она не требует централизованного сервера для поддержки взаимодействия агентов и поддерживает открытость архитектуры) Интеграция названных технологий с целью создания новой информационной технологии, предназначенной для практической реализации приложений рассматриваемого типа принято в работе в качестве основного направления исследований

Целью исследования является разработка методов, алгоритмов, программных инструментальных средств и программной инфраструктуры, которые совместно формируют прототип информационной технологии для эффективной реализации открытых Р2Р сетей агентов распределенного принятия решений по данным распределенных гетерогенных источников

Для достижения этой цели в диссертационной работе поставлены и решены следующие задачи

1 Разработка интерактивной инструментальной программной среды для поддержки технологии обучения объединению решений распределенных решателей при иерархической архитектуре их взаимодействия

2 Разработка Р2Р агентской платформы, поддерживающей совместную работу гетерогенных автономных агентов, объединенных в открытую сеть

3 Разработка принципов, алгоритмов, протоколов и программной поддержки распределенного Р2Р машинного обучения объединению решений автономных агентов в «горизонтальной» архитектуре, когда отсутствуют специально выделенные решатели, ответственные за объединение решений

Методы исследования. В диссертационной работе использовались методы теории многоагентных систем, методы вычислений на основе протоколов парных взаимодействий, методы обучения и объединения решений распределенных решателей (классификаторов), нейросетевые методы, методы теории графов, теории вероятностей и математической статистики, методы программирования и компьютерного моделирования

Научная новизна исследования. 1 Разработаны новые методы, алгоритмы и инструментальные средства интерактивной технологии распределенного обучения и принятия решений в

открытых сетях агентов в иерархической и в «горизонтальной» (Р2Р) архитектурах объединения решений

2 Впервые разработана программная инфраструктура, называемая «Р2Р агентской платформой», которая поддерживает прозрачное взаимодействие гетерогенных программных агентов открытой сети при совместном решении задач принятия решений по данным данных распределенных источников.

3 Разработана виртуальная Р2Р коммуникационная среда (эмулятор) для экспериментального исследования готовых Р2Р агентских приложений, позволяющая тестировать, верифицировать, и оценивать свойства программной реализации распределенного агентского приложения в виртуально распределенной Р2Р коммуникационной среде

4 Разработан генератор сети с заданной топологией, те специальное программное инструментальное средство автоматической генерации гонфигурационных файлов для экземпляров агентских платформ и Р2Р провайдеров узлов сети с целью создания Р2Р сетей агентов требуемой топологии

Все предложенные в работе решения, которые совместно формируют прототип новой информационной технологии разработки открытых Р2Р сетей агентов, предназначенных для решения задач распределенного принятия решений, проверены экспериментально путем создания программных прототипов ряда приложений.

Обоснованность и достоверность научных положений, представленных в диссертационной работе, обеспечивается тщательным анализом состояния исследований по теме работы, подтверждается согласованностью теоретических результатов с результатами компьютерного моделирования, а также апробацией основных теоретических положений в печатных трудах и докладах на научных конференциях и семинарах

Практическая значимость исследования Практическая значимость диссертационной работы заключается в том, что ее результаты могут использоваться при создании реальных открытых сетей агентов и многоагентных систем в широком круге практически важных приложений, предназначенных для распределенного принятия решений по данным распределенных гетерогенных источников Положения, выносимые на защиту.

1 Р2Р агентская платформа, поддерживающая совместную работу гетерогенных агентов и распределенный поиск сервисов в открытой сети

2 Инструментальные средства технологии распределенного обучения и принятия решений в сетях агентов в иерархической и полностью распределенной (Р2Р) архитектурах объединения решений

3 Прототип новой информационной технологии разработки открытых сетей агентов

Реализация результатов работы. Результаты

диссертационной работы использованы в ряде научно-исследовательских проектов, а именно,

- в проекте «Разработка инструментальной среды для создания прикладных многоагентных систем» Федеральной целевой программы «Исследования и разработки по приоритетным направлениям развитая научно-технического комплекса России на 2007-2012 годы», государственный контракт No 02 514114045, в рамках которой разработана Р2Р агентская платформа,

- в проекте «Nomadic Agents», выполненном по контракту с исследовательским центром «Nokia Research Center», в рамках которого решена задача создания кросс-ллатформенной версии Р2Р агентской платформы, выполнен анализ путей практической реализации сервисов мобильных агентов на основе Р2Р агентской платформы, и разработана виртуальная коммуникационная Р2Р среда для тестирования, верификации и оценки качества разработанных агентских приложений

Результаты работы использованы также в проектах ЦНИИ РТК и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» Материалы исследований использованы в курсе лекции по кафедре «Системный Анализ и Управление» Санкт-Петербургского Государственного Политехнического Университета

Апробация результатов работы. Основные результаты работы были представлены на следующих научных конференциях и семинарах

1 Международная конференция «Гибридные информационные технологии» (ICHIT-2006), Южная Корея, 2006

2 Международная конференция «Автономные агенты и многоагентные системы» (AAMAS 2007), США, 2007

3 2-й международный семинар «Автономные интеллектуальные системы Агенты и Извлечение Знаний» (AIS-ADM 2007), Россия, Санкт-Петербург, 2007

4 4-я международная конференция «Математические методы, модели и архитектуры для защиты компьютерных сетей» (MMM-ACNS-2007), Россия, Санкт-Петербург, 2007

5 Международная научно-техническая конференция «Интеллектуальные системы (AIS'07)» и «Интеллектуальные САПР (CAD-2007)», Россия, Дивноморское, 2007

6 2-й международный семинар «Интеграция технологий агентов и технологий извлечения знаний изданных» (ADMI-2007), США 2007.

Результаты работы обсуждались также на семинарах СПИИРАН и компании Nokia

Публикации. По материалам диссертационной работы

опубликовано 8 статей, в том числе одна статья в издании, указанном в перечне ВАК на соискание ученой степени доктора и кандидата наук, «Известия РАН Теория и системы управления»

Структура и объем диссертационной работы. Диссертационная работа объемом 160 машинописных листов содержит введение, четыре главы, заключение, список литературы из 122 наименований, приложение А, 4 таблицы и 40 рисунков

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована важность и актуальность темы диссертации, сформулированы цель диссертационной работы и решаемые задачи, определены научная новизна и практическая значимость работы

В первой главе приведен обзор состояния исследований в ряде нозых направлений в области информационных технологий (ИТ), достижения в которых, с точки зрения автора данной работы, могут быть положены в основу при создании новой ИТ, удовлетворяющей требованиям, сформулированным во введении К таким направлениям отнесены распределенное принятие решений, многоагентные системы, в частости, агентские платформы (программные инфраструктуры), обеспечивающие совместную работу агентов, вычисления на основе парных взаимодействий (Р2Р-вычиспения) и архитектуры, ориентированные на сервис В этой главе анализируются методы распределенного обучения и принятия решений, построенные на основе иерархической модели принятия решений, а также локальные Р2Р методы извлечения знаний из данных, когда иерархия между ними отсутствует В первой группе анализируются методы, основанные на правиле Байеса и его упрощениях, методы, основанные на оценке компетентности распределенных классификаторов и методы, основанные на принципе стекового обобщения Рассматриваются также нейросетевые варианты реализации иерархических методов обучения Во второй группе методов рассматриваются общие принципы построения Р2Р локальных алгоритмов извлечения знаний, а также базовые алгоритмы, разработанные к настоящему времени, в частности, точный алгоритм распределенного голосования и приближенный алгоритм кластеризации по методу /с-средних. Эти алгоритмы являются типовыми, тк. базовые протоколы их реализации используются во всех известных к настоящему времени алгоритмах Р2Р извлечения знаний

При обзоре и анализе инфраструктур, поддерживающих совместное функционирование агентов, описывается абстрактная 'архитектура платформы агентов, предложенная FIPA Эта архитектура и соответствующая ее реализация, называемая FIPA OS, являются де-факто стандартами в

агентских приложениях. Проводится обзор существующих реализаций агентских платформ, в той или иной степени совместимых со спецификациями FIPA Аналогичный анализ проводится для решений, поддерживающих Р2Р взаимодействие, где, в частное™, анализируются возможности таких популярных инфраструктур, как инфраструктура JXTA и Microsoft Windows Peer-to-peer Networking

Во второй главе описывается программное инструментальное средство для обучения алгоритмов иерархического объединения решений, разработанное автором Дается общее описание поведения агента объединения решений на метауровне, а также модификации поведения, соответствующие нескольким конкретным методам Описывается разработанный программный продукт поддержки принятия решений, включающий в себя компоненты, реализующие типовые методы обучения иерархическому объединению решений, а также конкретные процедуры, реализующие их Разработанная инструментальная среда является компонентной В ней каждая компонента реализует некоторый алгоритм, и может быть связана с одной или несколькими другими компонентами Такое связывание может выполняться либо «вручную», используя язык программирования С++, либо через специализированное ядро, которое поддерживает автоматическое связывание компонент Разработанный инструментарий позволяет строить различные схемы обучения, принятия решений и обмена данными в иерархической архитектуре Описываются варианты и сценарии практического использования компонент инструментария в пользовательском и агентском режимах Отметим, что в пользовательском режиме разработчик приложения оперирует компонентами, используя графический интерфейс, а в агентском режиме он оперирует программными классами при создании агентов

Третья глава содержит описание разработанной Р2Р агентской платформы, которая реализует программную среду (инфраструктуру) для совместного функционирования агентов, а также ее окружения В основу положена функциональная абстрактная архитектура, предложенная рабочей фуппой FIPA Дается описание абстрактной архитектуры FIPA, а также обязательных и опциональных функциональностей ее компонент

В соответствии с архитектурой FIPA, программные компоненты разработанной платформы и ее окружения построены по трехуровневой схеме (рис 1) На нижнем ее уровне находится Р2Р провайдер, те узел Р2Р сети, который предоставляет потребителям (клиентам) коммуникационный сервис В разработанной реализации Р2Р провайдер предоставляет своим клиентам механизм отправки сообщений другим клиентам Р2Р провайдера, расположенным в том же или в другом узлах сети, а также реализует механизм управления списком контактов своих соседей Список контактов

узла содержит имена соседних Р2Р провайдеров и их адреса, те список узлов Р2Р сети, с которыми он имеет прямые коммуникационные каналы

Рис 1 Трехуровневая архитектура разработанной Р2Р агентской платформы и ее окружения

Средний уровень реализует собственно Р2Р агентскую платформу, которая предоставляет сервисы белых и желтых страниц агентам, зарегистрированным на ней, а также обеспечивает (через Р2Р провайдера) обмен сообщениями между агентами В разработанной реализации, агентская платформа поддерживает распределенный поиск агентов, присутствующих в Р2Р сети, и доступных сервисов, при этом поиск реализуется как распределенная процедура, которая использует протокол, известный под названием gossiping, разработанный для Р2Р маршрутизации сообщений.

На верхнем уровне располагаются прикладные агенты, функционирующие в среде агентской платформы

Таким образом, сеть Р2Р провайдеров образует «оверлейную» коммуникационную сеть, установленную поверх TCP/IP сета. Аналогично, множество экземпляров Р2Р агентской платформы образует «оверлейную» сеть, установленную поверх Р2Р се™ провайдеров. В этой сета множество экземпляров Р2Р агентской платформы играет роль распределенной базы метазнаний, в которой каждый экземпляр платформы содержит знания о прикладных агентах, которые на ней установлены, и о предоставляемых ими сервисах. В частности, таблица данных сервиса желтых страниц содержат информацию о сервисах, предоставляемых агентами, зарегистрированными на экземпляре платформы, представленную в стандартной форме в терминах общей онтологии сети агентов, а также об именах агентов, которые соответствующие сервисы предоставляют Экземпляр агентской платформы может содержать информацию о других экземплярах платформы Таблица

данных сервиса белых страниц содержат информацию об адресах агентов, предоставляющих сервисы, указанные в таблице сервисов желтых страниц

Аналогично оверлейной сети экземпляров агентской платформы, множество агентов, установленных на экземплярах агентской платформы, образует «оверлейную сеть» третьего уровня, которая установлена поверх сети экземпляров агентской платформы Топология этой, третьей, «оверлейной» сети определяется списком контактов каждого агента.

Важно отметить, что в общем случае в начальном состоянии таблицы данных сервисов желтых и белых страниц могут быть вообще пустыми, а их заполнение может выполняться уже в процессе функционирования сети, когда агенты объявляют о своих сервисах, запрашивают тот или иной

Сенсор

_| Сенсор !

| Сеноор

у

¡нЛ7

Агент ,

V

Оверлейная сеть прикладных агентов, поддерживаемая Р2Р ппатгЬопмпй агрнтпв

Оверлейная сеть

Р2Р платформа агентов Другие потребители Р2Р сервиса агентской ^ППЯП+ППМК!^ Оверлейная сеть Р2Р проваЭДгров(Р2Р сеть) »."* у Р2Р платформа агентов Другие потребител иР2Р сеоеиса

Р2Р провайдер Р2Р провайдер

TCP/IP транспорт (Транспортный уровень)

Распределенные «желтые» и «белые» страницы

Сервисы Р2Р проваадера

Рис 2 Оверлейные сети, построенные над TCP/IP, обеспечивающие "прозрачность" взаимодействия прикладных агентов

сервис или получают ответы на свои запросы о сервисах. Таким образом, содержание желтых и белых страниц может постоянно обновляться в процессе работы сети. Рис 2 демонстрирует взаимодействие трех перечисленных оверлейных сетей.

Сервис Р2Р агентской платформы «Белые страницы» реализуег

- Регистрацию агентов на белых страницах,

- Регистрацию агентов на белых страницах с присвоением имени,

- Отмену регистрации агентов на белых страницах,

- Определение состояния агента (активен / неактивен),

- Поиск агентов (их адресов)

В соответствии с современным пониманием, любая

функциональность, которую агент может предоставить в распоряжение других агентов, интерпретируется как сервис, предоставляемый агентом другим агентам системы Разработанный формат описания сервисов базируется на стандарте FIPA, в соответствии с которым сервис характеризуется именем, типом и набором свойств Имя сервиса является уникальным именем в агентской среде и служит его однозначным идентификатором Типом сервиса является некоторое концептуальное описание сервиса, задающее его назначение Свойства сервиса описывают его на более детальном уровне, различая однотипные сервисы, которые представляются в терминах экземпляров понятий из онтологии агента.

Совместно с платформой могут использоваться также два других разработанных автором инструментария Один из них - это генератор сетей заданной топологии, который позволяет автоматически генерировать конфигурационные файлы для экземпляров агентских платформ и Р2Р провайдеров Второй инструментарий представляет собой эмулятор виртуальной Р2Р коммуникационной среды, который позволяет, совместно с разработанной Р2Р агентской платформой, запускать готовые Р2Р агентские приложения в интересах тестирования прикладных агентских систем, функционирующих в сетях с переменной топологией.

Четвертая глава посвящена описанию разработанного Р2Р алгоритма обучения объединению решений распределенных классификаторов и

Удалить данные

Перефор Пост Интерпрет

мироватъ -*- роить ировать

соседей правила данные

Рис 3 Сценарий Р2Р обучения.

алгоритма принятия решений в Р2Р сетях агентов при отсутствии специальных агентов, ответственных за объединение решений В главе представлены также результаты экспериментальной проверки работоспособности основных решений, предложенных в работе, для чего используются несколько программных прототипов агентских приложений рассматриваемого в работе класса. В этих приложениях совместно используются все компоненты разработанной технологии открытых сетей

агентов, а именно, Р2Р агентская платформа, обеспечивающая

взаимодействие агентов сети, разработанные алгоритмы распределенного Р2Р обучения и принятия решений, виртуальная симуляционная Р2Р среда, а также разработанный генератор топологии сети, описанный в приложении А

В постановке задачи, принятой в работе, предполагается, что каждый агент-классификатор (АК) получает данные от своего локального источника и обучен обнаружению объектов только одного («своего») класса Например, в задаче распределенного обнаружения вторжений в компьютерную сеть каждый АК обучен обнаружению атак одного конкретного класса, и при этом он «молчит» (его выход интерпретируется как «0»), если «объект своего класса» не обнаруживается по локальным данным, и генерирует сигнал «тревога» («Alert»), если такой объект обнаружен. В последнем случае АК запрашивает информацию («сервис классификации») у других агентов из своего списка контактов (виртуальных «соседей» в оверлейной сети прикладных агентов) об их решениях Это множество агентов-соседей называется далее его коалицией. АК, инициировавший процесс сбора решений агентов коалиции, формирует из них бинарный вектор и совместно со своим решением, использует в качестве входа своего алгоритма объединения решений. В соответствии с этим сценарием качество решения АК зависит от трех факторов (1) качества решений, принимаемых отдельными агентами по данным локальных источников; (2) от состава коалиции; (3) от качества алгоритма объединения решений коалиции Принципиально новой задачей в этом процессе Р2Р обучения и принятия решений является задача формирования коалиции, поэтому далее описывается только разработанный протокол (распределенный алгоритм), формирования коалиции, реализованный как процесс Р2Р обучения (рис. 3)

Шаг 1. На нулевой итерации, когда АК может иметь пустой список контактов, начальная коалиция (список его соседей в оверлейной сети прикладных агентов, представленных в его списке контактов) задается экспертом или генерируется случайным образом (Сформировать соседей, строки 1-2) В разработанном программном прототипе Р2Р системы обнаружения вторжений в компьютерную сеть этот шаг агента реализуется случайным механизмом. Он выполняет поиск агентов, которые находятся на расстоянии не более чем Н переходов от него в оверлейной сети Р2Р провайдеров, и случайным образом выбирает К из них, где К- размер списка контактов (списка виртуальных соседей) На нулевой итерации они не принимают участия в формировании решения агента, поскольку их «компетентность» неизвестна и является предметом оценки на этой итерации Иначе говоря, на нулевой итерации, агент только подготавливает список потенциальных членов коалиции, выбор из которых будет сделан после сбора обучающих данных и итерации обучения Перед началом функционирования агент также «обнуляет» список правил объединения решений (Сброс правил,

строка 3)

1 ВЫЧИСЛИТЬ Агенты = {Агент| Расстояние(Агент) < Н)

2 ВЫЧИСЛИТЬ Соседи = {Сосед | Соседе Агенты},0 <| Соседи |<| Агенты |

3 УСТАНОВИТЬ РешениеИтС1ГО10е = Решение^

4 ПО КА| ОбучДан |< ЗаданныйРазмер ИЛИ | ВремяСбораДанных |< ЗаданноеВремя

5 £> = Решениед„ит

6 ВЫЧИСЛИТЬ Решения ={0\й = РешениеСо„дУСоседе Соседи}

7 ВЫЧИСЛИТЬ Решение = РешениеИтаГО1К

8 ДОБАВИТЬ <Д Решения,Решение,ИШ1> в ОбучДан

9 ИНТЕРПРЕТИРОВАТЬ ОбучДан -Истинная метка,« = ],| ОбучДан|,] - Индекс метки

10 УСТАНОВИТЬ Решение и„ге1ое = Обучиться(ОбучДанные)

11 ВЫЧИСЛИТЬ Коалиция ={Агенг|Агенг участвует в формировании итогового решения}

12 ВЫЧИСЛИТЬ Агенты = {Агент] Агенте СоседиСосслУ Соседе Соседи}

13 ВЫЧИСЛИТЬ ДопАгенты {Агент\ Агенте Агенты,Агента. Коалиция), О <| ДопАгенты |<| Агенты |

14 ВЫЧИСЛИТЬ Соседи - Коалиция и ДопАгенты

15 УДАЛИТЬ данные из ОбучДан

16 ПЕРЕЙТИ к пункту 4

Рис 4 Псевдокод алгоритма (сценария) Р2Р обучения

Шаг 2 Агент, предварительно обученный принятию решений по данным локального источника, начинает нормальное функционирование с целью обнаружение объектов «своего» класса (Детектировать объект, строка 5) Если такой объект обнаружен, агент запрашивает те решения, которые сформировали его виртуальные соседи из его списка контактов (Опросить соседей, строка 6), и записывает эти решения в свою базу данных Далее содержимое базы данных используется им для формирования коалиции и оценки компетентности ее членов на основании механизма обучения Свое решение также записывается в базу обучающих данных в одной строке (записи) с решениями агентов-соседей (Запомнить решения, строка 8) Процесс накопления данных заканчивается по некоторому условию (Данные собраны, строка 4), которое задается пользователем Оно может задаваться указанием интервала времени работы системы между последовательными шагами обучения, заданием объема накопленных данных и др

Шаг 3 Когда это условие выполняется, накопленные данные интерпретируются экспертом, который каждой записи базы данных агента ставит в соответствие значение «1», если эта строка данных представляет

объект «его» класса, или ставит ей в соответствие «О», если эта тревога была ложной (Интерпретировать данные, строка 9)

Шаг 4 Интерпретированные данные используются для обучения, которое включает в себя две процедуры Одна из них выбирает агентов, чьи решения «сильно связаны» с истинной интерпретацией обучающих данных (алгоритмически оценка связи может выполняться различными методами, один из ее вариантов представлен далее), а вторая выполняет генерацию правил объединения решений, используя некоторый стандартный алгоритм обучения (Построить правила, строка Щ Эти процедуры могут выполняться в разном порядке В реализованном программном прототипе Р2Р системы обнаружения вторжений сначала строятся правила объединения решений с использованием данных всех виртуальных соседей, а потом, по итогам тестирование этих правил, производится выбор М «наилучших» из них, которые включаются в состав коалиции (строка 11)

Шаг 5 После того, как коалиция сформирована, производится обновление содержания списка контактов АК. В него, в соответствии с некоторым алгоритмом, добавляются имена выбранных наиболее компетентных агентов, которые на следующей итерации накопления данных обучения уже участвуют в процессе отбора на следующей итерации, и такое же число имен наименее компетентных агентов удаляется из списка Дополнительно, в соответствии с некоторым алгоритмом, в список добавляются имена новых кандидатов на включение в коалицию (Переформировать соседей, строки 12-14)

Шаг 6 База интерпретированных метаданных очищается (Удалить данные, 'строка 15) и вновь запускается процедура сбора метаданных применительно к новому списку «соседей» агента Если текущая коалиция агента не пуста, то агент принимает решение на основе объединения своего решения и решений агентов коалиции (Принять решение) в соответствии с оценками компетентности, полученными им в результате обучения

Шаг 7 После окончания очередной итерации процедуры обучения (шаги 2-6) выполняется новая итерация, начиная с Шага 2 алгоритма

Описанный сценарий обучения допускает множество вариантов конкретной реализации его отдельных шагов, поскольку для различных приложений наилучший вариант может быть своим Поскольку пока алгоритм формирования коалиции агентов исследован на ограниченном множестве приложений, то говорить о предпочтительности того или иного варианте еще преждевременно Можно заметить, что проблема формирования коалиции может также интерпретироваться как проблема выбора «наиболее информативного» состава признаков на метауровне

Опишем разработанный алгоритм принятия объединенного решения каждым агентом (см Шаг 2 описанного алгоритма), который реализован в программном прототипе Р2Р системы обнаружения вторжений в компьютерную сеть Для каждого агента Д «своей» коалиции агент А ,

обученный детектировать событие класса к (здесь-атаку класса к), вычисляет оценку компетентности по следующей формуле

гдePA^v[Hx{k)l А^^'Г]—условная вероятность обнаружения агентом коалиции At события своего класса при условии, что агент А детектировал событие класса к, когда событие класса к действительно имело место, а PA^.v,[HQ(k)/А1 -»"0"] — условная вероятность ситала «0» на выходе агента А, при условии, что событие класса к не имело место, но агент А обнаруживает это событие Таким образом, значение Сотрл_у„г(А1,к), оценка компетентности агента Д , выражает некоторую меру связи между событиями класса к и реакцией агента Д в ситуациях когда агент А, обученный обнаруживать событие класса к, обнаружил такое событие

Можно показать, что, использование такой оценки компетентности приводит к снижению вероятности ложного срабатывания («false positives») агента А В процессе принятия итогового решения, используя одно из распространенных правил объединения решений, а именно правило суммы, итоговое решение формируется по такому алгоритму

есчи Wk > Wnotk, то объект класса к обнаружен, иначе объект класса к не обнаружен где I -

I m

индексы соседей, которые голосовали за событие «1 », a m — «против», Wk -итоговый вес в пользу события «1

», a W„ot t — итоговый вес в пользу «0»

В главе 4 описаны также программные прототипы приложений, которые разработаны с использованием полученных результатов, в частности,

(1) Р2Р система обнаружения и распознавания наземных объектов по данным распределенной системы наблюдения, компоненты которой (камеры, регистрирующие инфракрасные изображения) установлены на беспилотных летательных аппаратах Полагается, что компоненты системы наблюдения используют беспроводную связь для обмена информацией в процессах Р2Р распределенного обнаружения и распознавания наземных объектов

(2) Интеллектуальная сенсорная сеть, решающая задачу мониторинга обширной области Тихого океана с целью раннего обнаружения и предсказания развитая течения El Nino Такая сеть реально работает с 1980-х годов Ее сенсоры установлены в экваториальной зоне от берегов Австралии

до берегов Центральной Америки на пространственно распределенных буях Интерпретированные данные, собранные этой сетью в период 19851998 гт, опубликованы в Интернет В работе они использованы для моделирования процессов распределенной обработки данных сенсоров с помощью распределенной сети Р2Р агентов Полагается, что агенты могут обмениваться информацией и локальными решениями с соседями для вычисления осредненных характеристик среды, что в итоге позволяет повысить точность и сократить нагрузку на каналы связи и вычислительную сложность процессов обнаружения и предсказания развития течения El Nino

(3) Система обнаружения вторжений и неправомерной деятельности пользователей в компьютерной сети, состоящей из гетерогенных устройств Эта система функционирует на основе парных взаимодействий агентов, установленных на различных экземплярах Р2Р агентской платформы Агенты используют локальную информацию, а также решения других агентов для решения своих задач Особенность системы состоит в том, что в ней еще решается задача обучения (см выше), которая позволяет каждому агенту динамически формировать свою коалицию агентов, информация от которых наиболее полезна для повышения качества собственного решения

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В диссертационной работе решается задача разработки методов, алгоритмов, программных инструментальных средств и промежуточного программного обеспечения, которые совместно формируют прототип новой информационной технологии, поддерживающей эффективную реализацию открытых Р2Р'сетей агентов для распределенного принятия решений

Основные результаты работы заключаются в следующем 1. Разработан, реализован программно и исследован экспериментально итеративный Р2Р алгоритм обучения объединению решений и принятия решений в Р2Р сетях агентов, которые взаимодействуют для обмена сервисами Следует отметить, что настоящее время исследования в области Р2Р обработки данных в сетях с динамической топологией находятся в стадии начального исследования, а известные алгоритмы способны решать лишь простые задачи вычисления некоторых математических примитивов (сумма максимум, минимум, и тп) или задачи приближенной кластеризации Алгоритм, предложенный в работе, решает новую задачу в открытых Р2Р сетях Представленный алгоритм задает множество конкретных реализаций, в которых могут изменяться его компоненты и атрибуты Например, могут использоваться различные алгоритмы обучения базовых классификаторов, алгоритмы обучения и объединения решений и ряд других Такая модульность обеспечивается разработанной инфраструктурой поддержки процессов обучения и принятия решений, частично предложенной в работе

2 Разработана инструментальная программная среда для поддержки распределенного обучения и принятия решений в иерархической архитектуре На основании анализа различных схем обучения в них выделены повторяющиеся компоне1-гты (интерфейсы к источникам данных, фильтры данных, алгоритмы обучения и принятия решений и др) Разработанная инструментальная среда является компонентной Каждая компонента реализует некоторую функцию и логику взаимодействия, и может быть связана с одной или несколькими другими компонентами Такое связывание позволяет организовывать различные схемы работы и обмена данными Создание схем может выполняться либо вручную с использованием языка программирования С++, либо автоматически через специализированное ядро

3 Разработана и реализована Р2Р Агентская Платформа, которая является средой функционирования агентов, предоставляющей им определенные сервисы Архитектура и программная реализация платформы соответствует спецификациям FIPA. На нижнем уровне экземпляры платформ используют разработанный автором Р2Р провайдер узла сети, обеспечивающий коммуникационный сервис экземплярам агентских платформ Отделение уровня оверлейной сети экземпляров Р2Р агентской платформы от уровня коммуникационного сервиса обеспечивает полную независимость платформы от нижележащей коммуникационной инфраструктуры, и позволяет совместное использование различных коммуникационных протоколов и каналов связи Платформа поддерживает такие сервисы, как управление жизненным циклом агентов, управление описанием агентских сервисов, коммуникации агентов, сервисы белых и желтых страниц. Отметим, что разработанная Р2Р агентская платформа является первой в мире реализацией, совместимой со спецификациями FIPA, поддерживающей Р2Р коммуникации между своими экземплярами и реализующей динамически пополняемую единую распределенную базу агентов и их сервисов

4 Разработана виртуальная эмуляционная Р2Р коммуникационная среда для экспериментального исследования готовых Р2Р агентских приложений, позволяющая тестировать, верифицировать, и оценивать свойства программной реализации распределенного агентского приложения в виртуально распределенной Р2Р коммуникационной среде

5 Разработан генератор топологии сети, те специальное программное инструментальное средство автоматической генерации конфигурационных файлов для экземпляров агентских платформ и Р2Р провайдеров узлов сети с цепью создания Р2Р сетей агентов требуемой топологии

Все предложенные в работе решения и разработанная информационная технология для открытых Р2Р сетей агентов, проверены экспериментально

Практическая значимость диссертационной работы состоит в том, что ее результаты могут использоваться для построения реальных прикладных

многоапентных систем, решающих задачи распределенной обработки распределенных гетерогенных данных в гетерогенной операционной и коммуникационной средах Такие задачи возникают в динамических телекоммуникационных сетях, в сетях распределенных интеллектуальных сенсоров и в приложениях многих других типов

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в ведущих рецензируемых научных журналах и изданиях из списка ВАК

Серебряков, С.В. Инструментальные средства для открытых сетей агентов / В И Городецкий, О В Карсаев, В В Самойлов // Известия РАН Теория и Системы Управления -Москва Наука, 2008 -Вып З.-С 106-124 Другие публикации

Серебряков, С.В. Многоагентное автоматическое распознавание наземных объектов / В И Городецкий, В В Самойлов, С В Серебряков и др // Труды конференций AIS'06 (Интеллектуальные системы), CAD-2006 (Интеллектуальные САПР) - М Физматлит, 2006 - С. 298

Serebryakov, S.V Agent-based Service-Onented Intelligent P2P Networks for Distributed Classification / V Gorodetskiy, О Karsaev, V Samoilov et al II Proc Int Conf «Hybnd Information Technologies» - Washington IEEE Press, 2006 - Vol 2 -P. 224-233.

Serebryakov, S.V. P2P Agent Platform Implementation and Testing /

V Gorodetskiy, О Karsaev, V Samoilov et al // Proc AAMAS Sixth Int Workshop Agents Peer-to-Peer Computing - Berlin Spnnger,2007 -P 21-32

Serebryakov, S.V. Multi-Agent Peer-to-Peer Intrusion Detection /

V Gorodetskiy, О Karsaev, V Samoilov et al // Proc Mathematical Methods, Models Architectures Computer Network Security - Berlin Springer, 2007 -P 260-271

SieriebnakowS.W. Metody i algorytmy rozpoznawania zespolowego / Wl Gorodeckij, S W Sienebnakow /IRozwoj Informatycznych systemow wieloagentowych w srodowiskach spoleczno-gospodarczych / Redakcja naukowa S Stanek, H Sroka, M Paprzycki, M Ganzha - Warszawa Wydawnictow PLACET, 2008 -P 255-289

Серебряков, C.B. Методы и алгоритмы коллективного распознавания обзор / В И Городецкий, С В Серебряков // Труды СПИИРАН / РАН С-Петербург Институт информатики и автоматизации / Под общ Ред Р М Юсупова — Спб Наука, 2006 — Вып 3 -Т 1 -С 139

Serebryakov, S.V. Automated Р2Р Learning in Agent-based Classification Networks / V Gorodetskiy, О Karsaev, V Samoilov et al // Proc Workshop Agents and Data Mining Interactions -Washington IEEE Press, 2007 -P 503-508

Подписано в печать 22 07 2008 г Формат 60 х 84 1/16 Объем 2 п л.

Тираж 100 экз Заказ № 22/7

Отпечатано в издательстве «Геликон Плюс» 199053, Санкт-Петербург, В О 1-ая линия, д 28 Тел (812)327-46-13,328-20-40

Оглавление автор диссертации — кандидата технических наук Серебряков, Сергей Валерьевич

Содержание.

Введение.

Глава 1. Обоснование актуальности работы и постановка задач исследования.

1.1 Введение.

1.2 Методы распределённого обучения и принятия решений.

1.2.1 Иерархические методы.

1.2.2 Методы объединения решений на основе парных взаимодействий.

1.3 Агентские технологии.

1.3.1 Абстрактная архитектура платформы агентов, разработанная БЕРА.

1.3.2 Обзор существующих агентских платформ.

1.4 Технологии парного взаимодействия и их приложения.

1.5 Выводы: Формулировка цели и задач исследований.

Глава 2. Инструментальная поддержка процессов обучения агентов распределенному принятию решений в иерархической структуре.

2.1 Архитектура системы.

2.2 Компоненты программной инфраструктуры для поддержки локального и распределённого вариантов обучения и принятия решений и их использование в процессе разработки приложений.

2.3 Базовые модели программной реализации иерархических систем объединения решений.

2.4 Пользовательский режим.

2.5 Выводы.

Глава 3. Р2Р агентская платформа.

3.1 Введение и мотивация.

3.2 Функциональная архитектура Р2Р агентской платформы, предложенная

3.3 Общее описание разработанной реализации Р2Р АП.

3.4 Уровень Р2Р коммуникационного сервиса.

3.5 Функциональность агентской платформы.

3.5.1 Сервис «Белые страницы».

3.5.2 Сервис «Жёлтые страницы».

3.5.3 Коммуникации агентов.

3.6 Виртуальная среда эмуляции динамических Р2Р сетей.

3.7 Выводы.

Глава 4. Р2Р машинное обучение и экспериментальные разработки многоагентных Р2Р систем принятия решений.

4.1 Итеративный Р2Р метод машинного обучения.

4.1.1 Особенности процедур принятия решений в Р2Р сетях классификаторов.

4.1.2 Алгоритм формирования коалиции на основе механизма Р2Р обучения.

4.2 Р2Р система обнаружения вторжений в компьютерную сеть.

4.3 Система обнаружения наземных объектов распределенной аппаратурой наблюдения.

4.4 Р2Р сенсорная сеть для прогнозирования появления океанского течения EINino.

4.5 Выводы.

Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Серебряков, Сергей Валерьевич

Актуальные направления развития современных информационных технологий в настоящее время во многом определяются требованиями практики и, прежде всего, прикладными проблемами, которые принято называть критическими. Среди них особое место занимают проблемы распределенного принятия решений. К таким проблемам относятся, например, мониторинг, анализ и предсказание развития глобальных природных процессов, среди которых особо выделяются проблемы экологической безопасности, проблемы анализа, прогноза и управления снижением вредных и опасных последствий стихийных бедствий (землетрясений, ураганов, цунами, пожаров и др.) и техногенных катастроф. Системы поддержки принятия решений в таких приложениях используют пространственно распределенные сенсорные сети [108], сети передачи данных, средства хранения и обработки данных, средства визуализации данных и результатов их обработки и т.п. Такие системы предъявляют специфические, причем, обычно очень жесткие, требования к информационным технологиям, которые могли бы справиться с их практической (программной, аппаратной) реализацией.

Аналогичные требования диктуются актуальными современными приложениями из ряда других предметных областей. Например, задачи управления в области мобильных телекоммуникаций, управления мобильными вычислениями, в частности, задачи управления сетевым трафиком в мобильных сетях [63,67], предъявляют во многом сходные требования к информационным технологиям. В этих приложениях данные, используемые для управления, также генерируются огромным количеством источников, причем эти данные являются гетерогенными и существенно зависят от времени. Для них характерно, что сами источники данных могут появляться в сети и исчезать из нее в любой момент времени. Аналогичная ситуация имеет место в области компьютерной безопасности [55,57]. Здесь также необходимо проводить мониторинг, анализ и принятие решений на основе множества распределенных источников данных, генерирующих огромный объем данных высокой динамики. Много подобных задач возникает в области военных приложений, например, при разработке систем оперативного анализа обстановки на тактических театрах военных действий на основе обработки данных, получаемых с помощью территориально распределенных сенсорных сетей [13], в задачах оперативной обработки информации, получаемой с помощью распределенной системы наблюдения, развернутой на множестве беспилотных летательных аппаратов [1] и многих других.

Для перечисленных и других аналогичных приложений общими характерными чертами, которые оказывают первостепенное влияние на требования к современным информационным технологиям и на тенденции их развития, являются следующие:

1. Сетевая архитектура объектов- приложения и, соответственно, программных компонент результирующей системы, которая характеризуется огромным количеством узлов и динамичностью связей между ними.

2. Большое число источников данных, которые генерируют огромные потоки данных. Эти данные зачастую технически невозможно собирать и хранить централизованно с целью последующего использования в задачах анализа и принятия решений. Если для программной реализации таких приложений принять архитектуру с использованием централизованной обработки, то дополнительно к большому объему памяти хранилища данных, необходимо будет еще обеспечить каналы связи огромной пропускной способности и вычислительные средства практически нереальной производительности.

3. Динамичный состав узлов сети. Действительно, мобильные устройства могут включаться и выключаться, узлы сенсорной сети могут выходить из строя и прекращать работу из-за истощения источников энергии. Беспилотные летательные аппараты, формирующие распределенную систему наблюдения, могут прекращать свое существование в любой момент времени вследствие противодействия. В компьютерной сети могут включаться в работу и

5 ' выключаться различные приложения, могут включаться и выключаться мобильные вычислительные устройства и т.п. По этим причинам в большинстве случаев сети с архитектурой типа «клиент-сервер» могут оказатьсягнепригодными в рамках рассматриваемого класса приложений. . 4. Конфиденциальность, данных, отдельных источников. Данные могут носить коммерческий характер, попадать под понятие военной- или, государственной тайны и т.п., когда централизованная! обработка исключается организационными причинами:

5. Автономность задач, решаемых программными сущностями, установленными в различных узлах сети, что, тем не менее, сопровождается необходимостью координации их поведения или в интересах кооперации, или в связи с необходимостью использования общих ограниченных ресурсов; или по каким-либо еще другим причинам. На практике это часто требует формирования временных сообществ (коалиций) узлов сети и/или установленных на них программных сущностей, объединяемых необходимостью кооперации или координации. Ввиду большого количества узлов сети и динамичности ее состава и топологии задача формирования; необходимых коалиций должна решаться, как правило, в режиме реального времени.

6. Гетерогенность операционной среды, в которой функционируют программы, установленные в различных узлах сети. Например, в мобильной вычислительной (коммуникационной) среде различные узлы могут работать под управлением различных операционных систем,, например, под управлением MS Windows^ Linux, Symbian и т.п. Это требует поддержки. межплатформенного взаимодействия (interoperability) программ, установленных в узлах сети.

В настоящее время не существует информационной технологии, которая была бы в состоянии полностью справиться с разработкой систем, для которых характерны перечисленные выше свойства, однако ведутся интенсивные исследования в этом направлении. Анализ потенциальных возможностей современных информационных технологий, способных справиться с разработкой распределенных систем принятия решений описанного выше типа, показывает, что наибольшими перспективами в этом отношении обладают технологии, которые могут быть построены интеграцией возможностей следующих технологий и архитектур:

- Технология распределенного машинного обучения и принятия решений. За счет распределенного характера эта технология дает возможность сместить основной объем вычислений по обработке данных, обучению и принятию решений на уровень источников данных, а интегральное (объединенное) решение при этом может быть построено объединением локальных решений с использованием метаправил, построенных на основе процедур метаобучения. При этом могут использоваться как иерархические модели и архитектуры объединения решений, когда для этой цели выделяется специально выделенный решатель, так и модели «горизонтальной» архитектуры, когда для объединения решений отдельный решатель не выделяется. В последнем случае эта процедура может выполняться каждым из локальных решателей, который, когда это ему необходимо, должен обращаться к другим локальным решателям, запрашивая необходимую информацию. Технология распределенного принятия решений позволяет существенно снизить загрузку коммуникационных каналов и повысить вычислительную эффективность системы в целом за счет декомпозиции процедур обработки данных [56];

- Технология многоагентных систем, которая оказывается чрезвычайно удачной для концептуализации проблем рассмотренного выше типа, поскольку эти проблемы допускают естественную декомпозицию. Использование технологии многоагентных систем должно позволить упростить концептуализацию крупномасштабных приложений, обеспечить модульность программного продукта, а также упростить программную реализацию за счет новых возможностей, которые предоставляет разработчикам парадигма агентно-ориентированного программирования [56];

- Архитектура, ориентированная на сервис. Использование понятия «сервиса», в частности, «веб-сервиса» открывает возможность решения одной из ключевых проблем современных открытых систем, а именно, проблемы семантического поиска программных сущностей, данных и функциональностей при динамическом составе узлов сети. Имеющиеся теоретические и технологические достижения в этой области в состоянии обеспечить существенный прорыв в формализации семантики сервисов и поддержку процедур распределенного семантического поиска сервисов. В свою очередь, эти новые возможности могут сформировать теоретический и алгоритмический базис для построения открытых систем. В таких системах активные программные сущности сети (агенты) смогут кооперироваться при минимуме начальной информации о топологии сети, об агентах, присутствующих в ней, и о сервисах, которые агенты в состоянии предоставлять друг другу, получая необходимую информацию путем запросов [114];

- Вычисления на основе парных взаимодействий (Реег4о-Реег, Р2Р-взаимодействий), которые могут использоваться как на транспортном уровне, так и на уровне программных сущностей (например, агентов). Значительные достижения в этой области открывают многообещающие перспективы для реализации вычислений, в частности, для принятия решений в системах, построенных на основе сетей мобильных устройств с динамическим составом узлов и топологией связей между ними [108].

В настоящее время интерес исследователей к интеграции этих направлений постоянно растет. Например, в работе [77] рассматривается задача композиции веб-сервисов на основе агентской технологии, когда множество агентов образует оверлейную сеть, устанавливаемую поверх Р2Р сети, отвечающей за коммуникации и поиск сервисов и агентов. Такая интеграция предоставляет агентам возможность «прозрачного» взаимодействия друг с другом, абстрагируясь от нижележащей коммуникационной инфраструктуры. Однако этот подход дает решение, которое не может быть использовано без изменений для различных приложений, что ведет к нарушению одного из основных требований к организации прозрачного взаимодействия агентов, а именно, требования независимости от приложений. Последнее существенно необходимо для обеспечения повторного использования инфраструктуры, поддерживающей взаимодействие агентов. Однако решение, предложенное в этой работе, подсказывает возможный вариант интеграции технологии агентов, Р2Р парадигмы вычислений и архитектуры, ориентированной на сервис, что приводит к более совершенной информационной технологии и новым возможностям.

Проведенный анализ существующих информационных технологий показывает, что в настоящее время в данной области пока еще отсутствуют эффективные решения, которые могли бы сформировать информационную технологию, способную эффективно справиться с разработкой приложений, основные черты которых описаны выше, а примеры приведены ранее. Необходимость такой информационной технологии и актуальность исследований, направленных на ее создание, подтверждаются как практическими потребностями современной индустрии программного продукта, так и тем большим вниманием, которое уделяется в настоящее время этой проблеме со стороны мирового сообщества исследователей в области информационных технологий.

Основной целью данной работы является разработка базовых решений, направленных на такую интеграцию перечисленных выше направлений в области информационных технологий, которая позволила бы построить технологию открытых сетей агентов для разработки и программной реализации систем распределенного принятия решений в крупномасштабных приложениях сетевой архитектуры, в которых состав узлов сети и ее топология могут динамически изменяться. Для достижения сформулированной цели в работе ставятся и решаются перечисленные ниже конкретные задачи:

- Разработка методической и инструментальной поддержки процессов создания систем распределенного обучения и распределенного принятия решений в открытых сетях агентов, функционирующих как в иерархической, так и в Р2Р архитектурах объединения решений в условиях динамичности топологии сети и состава ее узлов. Решение этой задачи должно сформировать методические основы, алгоритмический базис и средства разработки систем распределенного принятия решений в условиях, когда состав решателей и структура их связей могут изменяться;

- Разработка программной инфраструктуры, называемой далее Р2Р агентской платформой (Р2РАП), поддерживающей «прозрачное» семантическое взаимодействие распределенных интеллектуальных агентов, установленных в узлах сети, предназначенных для принятия решений на основе множества распределенных источников данных. Р2Р агентская платформа имеет целью обеспечить полное разделение сети прикладных агентов (агентов принятия решений на основе распределенных источников данных) и сети провайдеров Р2Р коммуникационного сервиса. Термин «полное разделение сети прикладных агентов и сети провайдеров Р2Р коммуникационного сервиса» означает, что прикладные агенты могут не содержать знаний о том, как реализуются их семантические запросы на поиск сервисов в сети, а провайдеры коммуникационного сервиса могут не знать, запросы каких именно агентов они пересылают. Кроме того, эта платформа должна обеспечить взаимодействие гетерогенных прикладных агентов («интероперабельность» гетерогенных агентов), работающих, возможно, под управлением различных операционных систем.

- Экспериментальная проверка основных решений, полученных в работе, на основе программного прототипирования приложений, решающих задачи распределенной классификации и распознавания в сетях со множеством распределенных источников данных, в которых состав узлов и топология их связей могут изменяться.

В первой главе приводится детальный обзор состояния исследований в ряде разделов современной информационной технологии, которые с точки зрения автора данной работы являются наиболее перспективными для построении информационной технологии, пригодной для практического решения задач, сформулированных в работе. К таким разделам отнесены (1) исследования в области распределённого принятия решений и обучения распределенному принятию решений, в частности, обучения и принятия решений в Р2Р сетях; (2) исследования в области агентских платформ (инфраструктур) для поддержки совместного функционирования разнородных агентов и (3) исследования в области инфраструктур, предназначенных для поддержки парного (Р2Р) взаимодействия агентов. В данной главе даются обзоры современного состояния исследований в указанных разделах информационных технологий.

В частности, в • ней анализируются известные методы распределённого принятия решений, построенные на основе иерархических моделей, а также методы, использующие принцип парных (Р2Р) взаимодействий распределенных решателей, когда какая-либо иерархия в процессе распределенной выработки решений отсутствует. Среди методов первой группы анализируются методы, основанные на правиле Байеса и его упрощениях, методы, основанные на оценке компетентности распределенных классификаторов и методы, основанные на принципе стекового обобщения. Во второй группе методов рассматриваются общие принципы построения алгоритмов извлечения знаний из распределенных данных с использованием парных взаимодействий решателей (но не методов машинного обучения принятию решений в Р2Р сетях, поскольку, исследования в этом направлении, насколько известно автору, практически отсутствуют). Рассматриваются также некоторые конкретные Р2Р алгоритмы извлечения знаний из распределенных данных, а именно, точный алгоритм распределенного голосования и приближённый алгоритм кластеризации по методу Är-средних. Эти алгоритмы являются типовыми для Р2Р методов извлечения знаний, поскольку использованные в них базовые принципы применимы и для ряда других задач извлечения знаний в Р2Р сетях.

При анализе инфраструктур, поддерживающих совместную работу агентов (как в иерархической, так в Р2Р архитектурах), описывается абстрактная архитектура платформы агентов, предложенная FIPA1 [45]. Эта архитектура и соответствующая ей программная реализация, называемая FIPA OS, являются* де-факто стандартами в агентских приложениях. Дается также обзор существующих реализаций агентских платформ, в той или иной степени соответствующих спецификациям FIPA.

Приводится краткий анализ решений, предложенных в области, организации Р2Р взаимодействий в компьютерных сетях. Дается краткое описание и анализ возможностей инфраструктур JXTA и Microsoft Windows P2PN.

На. основании приведенного анализа обосновываются и формулируются основная цель исследований данной работы, а также основные конкретные задачи, решаемые в ней для достижения поставленной цели.

Во второй главе детально описывается инструментальная среда, предназначенная для быстрого создания программ обучения алгоритмов объединения решений в иерархических моделях. Рассматривается архитектура созданной инструментальной системы, дается описание её компонент, а также описание вариантов практического использования системы в пользовательском (графическом) и агентском (автоматическом) режимах. Дается описание типового сценария обучения объединению решений, а также описываются его

1 FIPA — Foundation for Interaction of Physical Agents — общественная организация, созданная специалистами для разработки научно обоснованных предложений по стандартизации языков, моделей, интерфейсов и т.п в области многоагентных систем. В настоящее вермя многие документы FIPA рассматриваются индустриальными компаниями в качестве стандарта. модификации применительно к различным методам объединения решений в символьном и в нейросетевом вариантах решения задач обучения и принятия решений.

Третья глава содержит описание разработанной Р2Р агентской платформы, которая формирует программную среду (инфраструктуру) для совместного функционирования прикладных агентов. В ее основу положена функциональная архитектура, предложенная рабочей группой FIPA NA WG (Nomadic Agents Working Group). Дается описание общей архитектуры разработанной Р2Р агентской платформы, её трёхуровневой модели, а также описание разработанных компонент, сервисов и интерфейсов. Описывается также разработанная реализация коммуникационного сервиса, названного провайдером пира, который поддерживает Р2Р технологию обмена сообщениями между агентами. Поскольку в настоящее время этот уровень не стандартизирован, далее в данной работе используется провайдер пира, разработанный автором. Описывается также функциональность среднего уровня, которая по существу и является той компонентой инфраструктуры, поддерживающей Р2Р взаимодействие прикладных агентов, которая называется Р2Р агентской платформой. Рассматриваются такие её составляющие, как сервисы белых и жёлтых страниц, реализующие функции управления обменом сообщений между агентами, а также функции распределенного поиска агентов и сервисов. Описывается виртуальная эмуляционная Р2Р среда, представляющая собой специализированный программный продукт, предназначенный для тестирования, верификации, отладки и анализа поведения реальной агентской распределённой системы ' в виртуальной Р2Р среде, топология которой может изменяться во времени.

Четвёртая глава анализирует принципы построения и особенности алгоритмической реализации процедур Р2Р машинного обучения, а также представляет схему разработанного алгоритма обучения принятию решений и самого алгоритма принятия решений в Р2Р сети агентов (в «горизонтальной» архитектуре объединения решений). Следует отметить, что разработанный алгоритм машинного обучения принятию решений в Р2Р сетях является первым алгоритмом такого назначения (ранее разработанные алгоритмы касались только процедур извлечения некоторых потенциально полезных знаний из данных, хранящихся в Р2Р сетях, когда вопрос о дальнейшем использовании полученных знаний не рассматривается). В главе приводятся также результаты комплексных экспериментальных исследований основных результатов работы, основанных на симуляции функционирования программных прототипов конкретных приложений Р2Р систем распределенного принятия решений, построенных с использованием Р2Р агентской платформы, алгоритмов и инструментальных средств поддержки технологии иерархического и Р2Р обучения и принятия решений, предложенных в данной работе (см. главы 2, 3). В частности, разработаны программные прототипы для следующих приложений:

1. Р2Р система обнаружения и распознавания наземных объектов по данным распределенной системы наблюдения, компоненты которой (камеры, регистрирующие инфракрасные изображения) установлены на беспилотных летательных аппаратах, которые используют беспроводную связь для обмена информацией в процессах распределенного обнаружения и распознавания наземных объектов заданных классов.

2. Интеллектуальная сенсорная сеть, решающая задачу мониторинга обширной области Тихого океана с целью раннего обнаружения и предсказания развития течения El Nino. Данная сеть реально работает с начала 1980-х годов. Сенсоры этой сети установлены в экваториальной зоне от берегов Австралии до берегов Центральной Америки на пространственно распределенных буях. Интерпретированные данные, собранные этой сетью в период 1985-1998 г.г., доступны через сеть Интернет. Они использованы в качестве входа для моделирования процессов обработки данных, собираемых сетью, с помощью распределенной Р2Р сети автономных агентов, которые имеют возможность обмениваться информацией (результатами обработки данных локальных источников) для вычисления осредненных характеристик среды, что позволяет резко сократить нагрузку на каналы связи и вычислительную ело лен ость решения задачи в целом.

3. Система обнаружения вторжений и неправомерной деятельности пользователей в компьютерной сети, состоящей из гетерогенных устройств. Эта система функционирует на основе парных взаимодействий агентов, установленных на различных экземплярах Р2Р агентской платформы. Агенты используют локальную информацию, а также решения других агентов для решения вышеназванной задачи. С точки зрения методологии решения, данная задача аналогична двум предыдущим. Однако особенность ее состоит в том, что дополнительно решается задача обучения, которая позволяет каждому агенту формировать коалицию агентов, информация от которых наиболее полезна для принятия собственного решения. Иначе говоря, в рамках этого приложения каждый агент, используя разработанный распределенный Р2Р алгоритм машинного обучения, может формировать список своих контактов, включая в него, по мере обучения, агентов, которые способны поставлять ему наиболее полезную информацию, и исключать из него менее полезных или вообще бесполезных агентов. Заметим, что данная задача является задачей само-конфигурирования сети прикладных агентов (формирования каждым узлом сети прикладных агентов списка своих виртуальных соседей) с помощью Р2Р алгоритмов машинного обучения.

Отметим, что для первых двух приложений использовались реальные данные, а для последней задачи данные были сгенерированы искусственно.

В заключении по работе приводятся основные выводы, а также оценивается их применимость для разработки реальных приложений тех классов, которые описаны в начале данной главы.

Заключение диссертация на тему "Инструментальная поддержка распределенного обучения и принятия решений в открытых сетях агентов"

Основные результаты работы заключаются в следующем:

1. Проведён обзор методов распределённого обучения и принятия решений. На основании анализа известных результатов сделан вывод о том, что в настоящее время хорошо развиты методы принятия решений, основанные на иерархическом принципе. Однако современные технологии распределенного принятия решений в открытых сетях агентов диктуют необходимость разработки Р2Р методов принятия решений, когда на множестве решателей системы отсутствует иерархия. Это направление получило развитие совсем недавно, а имеющиеся в этой области результаты носят частный характер. Они пока не в состоянии справиться с новыми задачами распределенного принятия решений, которые выдвигаются современными приложениями, например, с задачами принятия решений на основе территориально распределенных беспроводных сенсорных сетей, принятия решений в мобильных сетях и в ряде других важных приложений. Материалы обзора опубликованы в работах [5,6], а также представлены в параграфе 1.2.

2. Проведён обзор существующих агентских платформ. Большинство разработанных агентских платформ соответствует стандартам FIPA [48] и реализовано на языке программирования JAVA. Большинство из платформ поддерживает распределённое функционирование, однако взаимодействие между экземплярами платформ осуществляется в статическом режиме, т.е. отсутствует возможность динамического появления новых экземпляров платформ в сети. Существенный недостаток имеющихся разработок в области межплатформенных коммуникаций состоит в том, что в них уровень платформы не отделяется от уровня коммуникаций, что исключает возможность стандартизации платформы и ее повторное использование в различных приложениях. Материалы обзора опубликованы в работе [12], а также представлены в параграфе 1.3.

3. Разработана инструментальная программная среда для поддержки процессов распределенного обучения и принятия решений в иерархической архитектуре. На основании проведенного анализа различных схем и систем обучения выделены повторяющиеся компоненты, к которым относятся, например, интерфейсы к источникам данных, фильтры данных, алгоритмы принятия решений и алгоритмы их обучения и другие, которые используются в разработанном инструментарии в качестве компонент. Разработанная инструментальная среда является компонентной. Каждая компонента реализует некоторую логику вычислений и взаимодействия, и может быть связана с одной или несколькими другими компонентами. Такое связывание позволяет организовывать различные схемы функционирования и обмена данными. Создание таких схем может выполняться либо вручную с использованием языка программирования С++, либо через специализированное ядро, которое позволяет связывать компоненты в автоматическом режиме. Разработанная среда и её компоненты значительно ускоряют процессы создания конкретных систем обработки и анализа данных. Эта технология использовалась при реализации агентских приложений, рассмотренных в главе 4 данной работы, а также материалы главы докладывались на конференции АОМ1 2007 и опубликованы в трудах данной конференции.

4. Разработан и программно реализован провайдер пира. Под провайдером пира понимается специализированное программное обеспечение, способное формировать Р2Р оверлейную сеть коммуникаций поверх узлов существующей коммуникационной сети. Разработанный провайдер пира реализует коммуникационные функции посредством создания коммуникационных каналов между экземплярами провайдеров пиров поверх протокола TCP/IP. Фактически, разработанный провайдер пира является облегчённой версией аналогичного провайдера, разработанного в инфраструктуре JXTA [70]. Необходимость в разработке облегчённой версии провайдера пира обусловлена тем, что на сегодняшний момент существуют различные технологии организации программной Р2Р сети (JXTA, WP2PN [66] и ряд других), и не существует единого стандарта. Автор данной работы попытался обобщить общие свойства существующих программных продуктов, и создать прообраз «стандартного» интерфейса провайдера пира. Вообще говоря, основная функция провайдера пира состоит в том, что он обеспечивает коммуникационный сервис между распределенными экземплярами разработанной агентской платформы. Более подробная информация представлена в главе 3, а также опубликована в работах [11,60].

5. Разработана и реализована Р2Р Агентская Платформа. Агентская Платформа является средой функционирования агентов, которая предоставляет им определённые сервисы. Архитектура и программная реализация разработанной платформы полностью соответствует спецификациям FIPA. На нижнем уровне экземпляры платформ используют разработанный автором провайдер пира (см. предыдущий абзац), обеспечивающий коммуникационный сервис экземплярам агентских платформ. Отделение уровня оверлейной сети экземпляров Р2Р агентской платформы от уровня коммуникационного сервиса обеспечивает полную независимость платформы от нижележащей сетевой инфраструктуры, будь то или проводная связь по протоколу TCP/IP или UDP, или беспроводная связь WiFi или что-то другое, что уже существует или будет предложено. Разработанная платформа поддерживает такие сервисы, как управление жизненным циклом агентов, управление описанием агентских сервисов и коммуникации между агентами. Отметим, что разработанная Р2Р агентская платформа является первой в мире разработкой, которая полностью соответствует спецификациями FIPA, которая поддерживает Р2Р коммуникации между своими экземплярами, а также реализует динамически пополняемую единую распределённую базу агентов и их сервисов. Данный результат детально опубликован в [10,11,54,60,61], а также описан в главе 3.

6. Разработан, реализован программно и исследован экспериментально итеративный Р2Р алгоритм обучения объединению решений и принятия решений в открытых сервисных сетях агентов, которые взаимодействуют на основе парных взаимодействий. Следует отметить, что на сегодняшний день исследования в области Р2Р анализа и обработки данных в открытых Р2Р сетях агентов с динамической топологией находятся в стадии начального исследования, а известные здесь алгоритмы, в основном, имеют целью вычисление некоторых математических примитивов, таких как максимум - и минимум, сумма и т.п. Известен также Р2Р алгоритм распределённой кластеризации по методу /с-ближайших соседей. Алгоритм, предложенный в работе, обобщает различные известные алгоритмы обучения объединению решений и принятия решений на случай открытых Р2Р сетей. Фактически этот алгоритм задает множество различных реализаций алгоритма, к которых могут изменяться его составляющие и атрибуты. К ним относятся конкретные алгоритмы обучения базовых классификаторов, алгоритмы объединения решений и ряд других. Они задаются разработчиком. Такая модульность обеспечивается не только структурой самого алгоритма, но также и используемой инфраструктурой поддержки обучения и принятия решений, предложенной в работе и описанной в главе 2. Описание данного алгоритма представлено в главе 4, а также в публикациях [10,59].

7. Разработана виртуальная эмуляционная Р2Р коммуникационная среда для экспериментального исследования готовых Р2Р агентских приложений, позволяющая тестировать, верифицировать, и оценивать свойства программной реализации распределённого агентского приложения в виртуально распределённой Р2Р коммуникационной среде.

8. Разработан генератор топологии сети, т.е. специальное программное инструментальное средство автоматической генерации конфигурационных файлов для экземпляров агентских платформ и Р2Р провайдеров узлов сети с целью создания Р2Р сетей агентов требуемой топологии.

Разработанные инструментальные средства и алгоритмы в данной диссертационной опираются, в основном, на работы [39,47,48]. Практическая значимость диссертационной работы заключается в том, что её результаты могут быть использованы для построения реальных многоагентных систем, предназначенных для распределённой обработки распределённых гетерогенных данных. Такие задачи возникают в распределённых динамических телекоммуникационных сетях, сетях распределённых интеллектуальных сенсоров и во многих других классах приложений. Для некоторых из таких классов приложений разработаны программные прототипы, описанные в главе 4. Апробация полученных результатов проводилась на 6 научно-технических конференциях. Основные результаты, полученные автором, опубликованы в 8 научных работах.

Заключение

В данной работе решается задача разработки методов, алгоритмов, программных инструментальных средств и промежуточного программного обеспечения (программной инфраструктуры), которые при их совместном использовании формируют прототип информационной технологии, поддерживающей эффективную реализацию открытых Р2Р сетей агентов для распределенного принятия решений.

Библиография Серебряков, Сергей Валерьевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Беспилотные авиационные системы Электронный ресурс. / Электрон, дан. [Б. м. : б. и.], 2007. - Режим доступа: http://www.avia.ru/author/03.shtml, свободный. - Загл. с экрана.

2. Бешелев, С. Д. Экспертные оценки / С. Д. Бешелев , Ф. Г. Гурвич. -М. : Наука, 1973.

3. Воробьев, Н. Н. Вопросы математизации принятия решений на основе экспертных оценок / Н. Н. Воробьев. // Материалы IV симпозиума по кибернетике. Б. м. : б. и., 1972. -Ч. 3. - С. 47-51.

4. Глушков, В. М. О прогнозировании на основе экспертных оценок / В. М. Глушков // Кибернетика. Б. м. : б. и., 1969. - № 2. - С. 2-4.

5. Городецкий, В. И. Многоагентные системы (обзор) / В. И. Городецкий, М. С. Грушинский, А. В. Хабалов // Новости искусственного интеллекта. Б. м. : б. и., 1998. - № 2.

6. Городецкий, В. И. Многоагентные системы: основные свойства и модели координации поведения / В. И. Городецкий. // Информационные технологии и вычислительные системы.

7. Б. м. : б. и., 1998 , -№> 1. С. 22-34.

8. Городецкий, В. И. Многоагентные системы: современное состояние и перспективы применения / В. И. Городецкий // "Новости искусственного интеллекта". Б. м. : б. и., 1996. -№ 1. - С. 49-55.

9. Городецкий, В. И. Открытые сети агентов / В.И.Городецкий, О. В. Карсаев, В. В. Самойлов и др. // Известия РАН. Теория и Системы Управления. Принято к публикации в 2008 году.

10. Городецкий, В. И. Открытые сети агентов / В.И.Городецкий, О. В. Карсаев, В. В. Самойлов и др. // Труды СПИИРАН / РАН С.Петербург. Институт информатики и автоматизации / Под общ. Ред. Р.М. Юсупова. -Спб: Наука, 2007. Вып. 3. - Т. 1. - С. 22-23.

11. Городецкий, В. И. Отчёт о патентных исследованиях по теме РАЗРАБОТКА ИНСТРУМЕНТАЛЬНОЙ СРЕДЫ ДЛЯ СОЗДАНИЯ ПРИКЛАДНЫХ МНОГОАГЕНТНЫХ СИСТЕМ / В. И. Городецкий, Л. А. Станкевич, В. Г. Конюший и др.. [Б. м. : б. и.], 2007.

12. Интернет будущего: беспроводные сенсорные сети Электронный ресурс. / Электрон, дан. [Б. м. : б. и.], 2007. - Режим доступа: http://www.noviyegrani.com/archivesshow.php?ID=145&ISSUE=2, свободный. - Загл. с экрана.

13. Комарцова, Л. Г. Нейрокомпьютеры: Учеб. Пособие для вузов / Л. Г. Комарцова, А. В. Максимов. М.:Изд-во МГТУ им. Н.Э. Баумана, 2002.-С. 320.

14. Кришнан, Н. ХХТА решения для Р2Р Электронный ресурс. / Н. Кришнан. Электрон, дан. [Б. м. : б. и.], 2007. - Режим доступа: <ww.javable.eom/javaworld/1001/01/#%3F%3F%3F%3F%3F%3F%3F %ЗР%ЗР+ДХТА, свободный. - Загл. с экрана.

15. Ли, Г. Почему ХХТА Электронный ресурс. / Г. Ли. Электрон, дан. -[Б. м.: б. и.], 2007. Режим доступа:www.javable.com/columns/P2P/solutions/03/, свободный. Загл. с экрана.

16. Льюс, Р. Игры и решения / Р. Льюс, X. Райфа. М. : ИЛ, 1961.

17. Математические методы в социальных науках / под ред. Лазарфельда П. и Генри Н. М. : Наука, 1973.

18. Миркин, Б. Г. Проблема группового выбора / Б. Г. Миркин. М. : Наука, 1974.

19. Растригин, Л. А. Коллектив алгоритмов / Л. А. Растригин, Р. X. Эренштейн // Материалы Международной объединенной конференции по искусственному интеллекту. Москва, СССР, 1975. -Т. З.-С. 138-144.

20. Растригин, Л. А. Коллектив алгоритмов для обобщения алгоритмов решения задач / Л. А. Растригин, Р. X. Эренштейн // Известия АН СССР Техническая кибернетика. Б. м. : б. и., 1978. - № 2. - С. 116126.

21. Растригин, Л. А. Метод коллективного распознавания / Л. А. Растригин, Р. X. Эренштейн. М. : Энергоиздат, 1981.

22. Растригин, Л. А. Обучение коллектива решающих правил / Л. А. Растригин, Р. X. Эренштейн // Адаптивные системы. Рига: Зинатне, 1974. № 4. - С. 8-20.

23. Растригин, Л. А. Принятие решений коллективом решающих правил в задачах распознавания образов / Л. А. Растригин, Р. X. Эренштейн // Известия АН СССР Автоматика и телемеханика. Б. м. : б. и., 1975. -№9.-С. 134-144.

24. Самойлов. Про онтологшо распределённого обучения. Дивноморск 2005.

25. Тарасов, В. Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика / В. Б. Тарасов.

26. M.:EflHTopHaji YPCC, 2002. -C. 352.

27. Abu-Draz, S. Peer to Peer Multi-Agent System for Online Trading / S. Abu-Draz, E. Shakshuki // Lecture Notes in Artificial Intelligence. S. 1. : s. n., 2003. - Vol. 2671. - P. 611-613.

28. Ali, K. Error reduction through learning multiple descriptions / K. Ali, M. Pazzani // Machine Learning. S. 1. : s. n., 1996. - № 24(3). - P. 173202.

29. Androutsellis-Theotokis, S. A Survey of Peer-to-Peer Content Distribution Technologies / S. Androutsellis-Theotokis, D. Spinellis // ACM Computing Surveys. S. 1. : s. n., 2004. - Vol. 36. - No. 4. - P. 335-371.

30. Bay, S. D. Characterizing model error and differences / S. D. Bay,iL

31. M.J. Pazzani // Proc. of 17 International Conferenceon on machine learning (ICML-2000). E. m. : 6. h., 2000. - P. 49-56.

32. Blin, J. Application of Pattern Recognition to some Problems in Economics / J. Blin, K. Fu, A. Wliinston // Techniques of Optimization. S. 1. : s. n., 1972.-№.416.-P. 1-18. ,

33. Breiman, L. Bagging predictors / L. Breiman // Machine Learning. S. 1. : s. n., 1996. - № 24 (2). - P. 123-140.

34. Breiman, L. Stacked regression / L. Breiman // Machine Learning. S. 1. : s. n., 1996. - № 24(1). - P. 49-64.

35. Clark, P. The CN2 Induction Algorithm / P. Clark, T. Niblett // Machine Learning Journal. S. 1. : s. n., 1989. - № 3. - P. 261-283.

36. Condorcet, N. C. Essaisur l'application de l'analyse a la probabilite desdecisions rendues a la pluralité des voix / N. C. Condorcet. Paris: Imprimerie Royale, 1785.

37. Cost, S. A weighted nearest neighbor algorithm for learning with symbolic features / S. Cost, S. Salzberg // Machine Learning. S. 1. : s. n., 1993. -№ 10(1).-P. 57-78.

38. Data Mining Tools Review Specification Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.cs.ualberta.ca/~zaiane/courses/cmput695-04/work/HW2-695-F04.html, free. - Title from screen.

39. Datta, S. Distributed Data Mining in Peer-to-Peer Networks / S. Datta, K. Bhaduri, C. Giannella et al. // IEEE Internet Computing special issue on Distributed Data Mining. [S. 1. : s. n.], 2006.

40. Dietterich, T. Ensemble Methods in Machine Learning / T. Dietterich // Handbook of Brain Theory and Neural Networks (2nd Edition). S. 1. : s. n., 2001.

41. Eiter, T. Comparing environments for developing software agents /

42. T. Eiter, V. Mascardi // AI communications. S. 1. : s. n., 2002. - Vol. 15. -P. 169-198.

43. FIPA Agent Communication Language Specification Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.fipa.org/specs/fipa00061/, free. - Title from screen.

44. FIPA Agent Discovery Service Specification Electronic resource. -Electronic data. [S. 1. : s. n.], 2007. - Access mode: http://www.fipa.org/specs/fipa00095/, free. - Title from screen.

45. FIPA Agent Message Transport Specifications Electronic resource., -Electronic data. [S. 1. : s. n.], 2007. - Access mode: http://www.fipa.org/specs/fipa00024, free. - Title from screen.

46. FIPA Agent Platform Electronic resource. Electronic data. - [S. 1. : s.n., 2007. Access mode: www.fipa.org/specs/fipa00001/, free. - Title from screen.

47. FIPA P2P NA WG6. Functional Architecture Specification Draft 0.12 Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.fipa.org/subgroups/P2PNA-WG-docs/P2PNA-Spec-DraftO. 12.doc, free. - Title from screen.

48. FEPA P2P Nomadic Agents Working Group (P2PNA WG6) Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.fipa.org/subgroups/P2PNA-WG.html, free. - Title from screen.

49. Foundations for Intelligent Physical Agents Electronic resource. -Electronic data. [S. 1. : s. n.], 2007. - Access mode: www.fipa.org, free. -Title from screen.

50. Freund, Y. Experiments with a new boosting algorithm / Y. Freund, R. Shapire // Proc. of the 13th International Conference on Machine Learning. S. 1. : s. n., 1996.

51. Gamma, E. Design Patters: Elements of Reusable Object-Oriented Software /E. Gamma, R. Helm, J. Johnson. S. 1. : s. n., 1995.

52. Gama, J. Cascade generalization / J. Gama, P. Brazdil // Machine Learning. S. 1.: s. n., 2000.-№41(3).-P. 315-342.

53. Gnutella at wild pages Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://ru.wikipedia.org/wiki/Gnutella, free. -Title from screen.

54. Gnutella web page Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.gnutella.com/, free. - Title from screen.

55. Gorodetsky, V. Distributed Learning of Information Fusion: A Multi-agent Approach / V. Gorodetsky, O. Karsaeyv, V. Samoilov // Proceedings of the International Conference "Fusion 03". Cairns, Australia, 2003.

56. Gorodetsky, V. I. Multi-Agent Peer-to-Peer Intrusion Detection / V. I. Gorodetsky, O. V. Karsaev, V. V. Samoilov et al. // Communication in Computer and Information Systems. Springer, 2007. pp. - Vol. 1. -P. 260-271.

57. Gorodetskiy, V. P2P Agent Platform: Implementation and Testing / V. Gorodetskiy, O. Karsaev, V. Samoilov et al. // The AAMAS Sixth International Workshop on Agents and Peer-ro-Peer Computing (AP2PC 2007). Honolulu, Hawaii, USA, 2007. P. 21-32.

58. Grasshopper web page Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.grasshopper.de, free. - Title from screen.

59. Haidegger. General Architecture for End-to-End Management in Heterogeneous Telecommunication Networks and an Application to a Voice-over-IP Scenario (ASTC2003) / Haidegger // Applied Telecommunication Symposium. S. 1. : s. n., 2003.

60. Heterogeneous agents Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://en.wikipedia.org/wiki/Heterogeneousagents, free. - Title from screen.

61. Icq web page Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.icq.com/, free. - Title from screen.

62. Introduction to windows peer-to-peer networking Electronic resource., -Electronic data. [S. 1. : s. n.], 2007. - Access mode: www.microsoft.com/technet/network/P2P/P2Pintro.mspx, free. - Title from screen.

63. ITU-T Recommendation M.3010: Principles for a Telecommunications management Networks. S. 1. : s. n.,1996.

64. JADE web page Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://jade.cselt.it, free. - Title from screen.

65. Java Agent Service Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.jcp.org/en/jsr/detail?id=87, free. - Title from screen.

66. JXTA Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. -Access mode: www.jxta.org, free. - Title from screen.

67. Kanal, L. Interactive Pattern Analysis and Classification. Survey and Commentary / L. Kanal // Proceedings of IEEE. S. 1. : s. n., 1972. - № 10.-P. 1200-1215.

68. Kazaa web page Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.kazaa.com/us/index.htm, free. - Title from screen.

69. Kittler J. On combining classifiers / J. Kittler, M. Hatef, P. W. Duin et al. // IEEE Transactions on pattern Analysis and Machine Intelligence. [S. 1. : s. n.], 1998. -№ 20(3). - P. 226-239.

70. Kuncheva, L. Decision Templates for Multiple Classifier Fusion / L. Kuncheva, J. Bezdec, P. W Duin // Pattern Recognition. S. 1. : s. n., 2001. - № 34(2). - P 299-314.

71. Kuncheva, L. Switching between Selection and Fusion in Combining Classifiers: An Experiment// IEEE Transactions On Systems Man And Cybernetics, Part B-cybernetics. S. 1. : s. n., 2002. - Vol. 32. - No. 2. -P. 146-156.

72. Kuncheva, L. Measures of diversity in Classifier Ensembles / L. Kuncheva, C. Whitaker // Machine Learning. S. 1. : s. n., 2003. -No. 51.-P. 181-207.

73. Kungas, P. Semantic Web Service Composition through a P2P-Based Multi-Agent Environment / P. Kungas, M. Matskin // Lecture Notes in Artificial Intelligence. S. 1. : s. n., 2006. - Vol. 4118. - P. 106-119.

74. Logan, B. Classifying Agent Systems / B. Logan // In Proc. of the AAAI-98

75. Workshop on Software Tools for Developing Agents. Wisconsin, USA, 1998.

76. Merz, C. UCI Repository on Machine Learning Databases Electronic resource. / C. Merz, P. Murphy. Electronic data. - [S. 1. : s. n.], 2006. -Access mode: http://www.ics.uci.edu/mlearn/MLR repository.html, free. -Title from the screen.

77. Merz, C. Using correspondence analysis to combining classifiers / C. Merz //Machine learning. S. 1.: s. n., 1999. -№ 36. - P. 33-58.

78. Murthy, S. OC1: Randomized Induction of oblique decision trees / S.Murthy, S.Kassif, S. Salzberg // In Proc. of AAAI-93. S. 1. : s. n., 1993.-P. 322-327.

79. Napster at wiki pages Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://ru.wikipedia.org/wiki/Napster, free. - Title from screen.

80. Napster web page Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://free.napster.com/, free. - Title from screen.

81. Nguyen, G. Agent Platform Evaluation and Comparison / G. Nguyen, T. Dang, L. Hluchy et al. Electronic data. - S. 1. : s. n., 2007. - Access mode: http://pellucid.ui.sav.sk/TR-2002-06.pdf, free. - Title from screen.

82. OGDF— Open Graph Drawing Framework Electronic resource., -Electronic data. [S. 1. : s. n.], 2007. - Access mode:http://www.ogdf.net/ogdf.php, free. Title from screen.

83. OMNET++ Discrete Event Simulation System Electronic resource. -Electronic data. [S. 1. : s. n.], 2007. - Access mode: http://www.omnetpp.org/, free. - Title from screen.

84. Ortega, J. Arbitrating Among Competing Classifiers Using Learned Referees / J. Ortega, M. Coppel, S. Argamon // Knowledge and Information Systems. S. 1.: s. n., 2001. - № 3. - P 470-490.

85. P2PSim : a simulator for peer-to-peer protocols Electronic resource., -Electronic data. [S. 1. : s. n.], 2007. - Access mode: http://pdos.csail.mit.edu/P2Psim/, free. - Title from screen.

86. Peer-to-Peer Agent Platform Guide Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://space.iias.spb.su/ap/index.php?menu=tutorials., free. - Title from screen.

87. Peer-to-Peer Research Group Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.irtf.org/charter?gtype=rg&group=P2Prg., free. - Title from screen.

88. Peer-to-Peer Simulator Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://fada.sourceforge.net/P2Psim/, free. - Title from screen.

89. PeerSim: A Peer-to-Peer Simulator Electronic resource. Electronic data.

90. S. 1. : s. n., 2007. - Access mode: http://peersim.sourceforge.net/, free.1. Title from screen.

91. Polyanalist Data Mining Tool Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.megaputer.com/polyanalyst.php., free. - Title from screen.

92. Prodomidis, A. Meta-learning in distributed data mining systems: Issues and approaches / A. Prodomidis, P. Chan, S. Stolfo // Advances in Distributed Data Mining. S. 1. : s. n., 2000.

93. Purvis, M. Multi-Agent Interaction Technology for Peer-to-Peer Computing Environment / M. Purvis, M. Nowostawski, S. Cranefield et al.// Lecture Notes in Artificial Intelligence. [S. 1. : s. n.], 2004. -Vol. 2872.-P. 150-161.

94. Quinlan, R. C4.5 Programs for Machine Learning / R. Quinlan. Morgan Kaufmann, 1993.

95. Rumelhart, D. E. Learning internal representation by error propagation / D. E. Rumelhart, G. E. Hinton, R.J.Williams // Parallel Distributed Processing: Exploration of the microstmcture of cognitions. S. 1. : s. n., 1986.-№1.-P. 318-362.

96. SAGE Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. -Access mode: http://sage.niit.edu.pk/, free. - Title from screen.

97. Schoepke, S. H. A Business View Regarding the Selection Of Agent Development Toolkits / S. H. Schoepke. In Proc. of the AAAI-98 Workshop on Software Tools for Developing Agents. Wisconsin, USA, 1998.

98. Seewald, A. An evaluation of grading classifiers / A. Seewald, J. Fuernkranz. // In Proceedings of 4th International Conference Intelligent data Analysis. S. 1. : s. n., 2001. - P 115-124.

99. Stolfo, S. A comparative evaluation of voting and meta-learning on partitioned data / S. Stolfo, P. Chan // In Proceedings of Twelfth 4th1.ternational Conference on Machine Learning. S. 1. : s. n., 1995. -P 90-98.

100. Tanagra Data Mining Tool Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://eric.univ-lyon2.fr/~ricco/tanagra/en/tanagra.html, free. - Title from screen.

101. Pacific Marine Environmental Laboratory Electronic resource., -Electronic data. [S. 1. : s. n.], 2007. - Access mode: http://www.pmel.noaa.gov/tao/, free. - Title from screen.

102. Tate, A. The "Helpful Environment": Geographically Dispersed Intelligent Agents That

103. Collaborate / A. Tate // IEEE Intelligent Systems. S. 1. : s. n., 2006. -P. 57-61.

104. Ting, K. Issues in stacked generalization / K. Ting, I. Witten // Journal of Artificial Intelligence Research. S. 1. : s. n., 1999. -№ 10. -P 271-289.

105. Ting, K. The characterization of predictive accuracy and decision combination / K. Ting // In Proceedings of 13th International Conference on Machine Learning. S. 1. : s. n., 1996. - P 498-506.

106. Todorovski, L. Combining classifiers with meta decision trees / L. Todorovski, S. Dzeroski // Machine Learning Journal. S. 1. : s. n., 2003. -№ 50(3). -P. 223-249.

107. Todorovski, L. Combining classifiers with meta decision trees / L. Todorovski, S. Dzeroski // Proceedings of 4th European Conference on Principles of Data Mining and Knowledge Discovery (PKDD-2000). S. 1. :s. n., 2000,-P 54-64.

108. Tryllian web page Electronic resource. Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.tryllian.com/, free. - Title from screen.

109. ValleeM. A Multi-Agent System for Dynamic Service Composition in Ambient Intelligence Environments // F. Ramparany, L. Vercouter L.

110. Electronic data. S. 1. : s. n., 2007. - Access mode: http ://www.pervasi ve. ifï. lmu. de/adjunct-pro ceedings/do ctoral-colloquium/pl75-l82.pdf. - Title from screen.

111. Wang, M. An Agent-Based Collaborative Framework for Mobile Peer-to-Peer Applications / M. Wang, H. Wolf, M. Purvis // Lecture Notes in Artificial Intelligence. S. 1. : s. n., 2006. - Vol. 4118. - P. 132-144.

112. Weiss, G (eds). Multi-agent Systems A Modem Approach to Distributed Artificial Intelligence / G. Weiss (eds). - S. 1. : s. n., 1999.

113. WEKA Data Mining Tool Electronic resource., Electronic data. - [S. 1. : s. n.], 2007. - Access mode: http://www.cs.wailcato.ac.nz/ml/weka/, free. -Title from screen.

114. Witten, H. Data Mining: Practical Machine Learning Tools and Techniques (second edition) / H. Witten, E. Frank. S. 1. : s. n., 2005. - P. 525.

115. Wolpert, D. Stacked generalization / D. Wolpert // Neural Network. S. 1. : s. n., 1992. - № 5(2). - P 241-260.

116. Wooldridge, M. Agent Theories, Architectures, and Languages: A Survey / M. Wooldridge, N. R. Jennings // Intelligent Agents (ECAI-94) Workshop on Agent Theories, Architecture and Languages. S. 1. : s. n., 1994. -P. 339.

117. Yu, B. Incentive Mechanism for Agent-Based Peer-to-Peer Systems / B. Yu, M. P. Singh // Lecture Notes in Artificial Intelligence. S. 1. : s. n., 2004. - Vol. 2872. - P. 77-88.