автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка и реализация многоагентной системы логистики знаний для информационной поддержки принятия решений

кандидата технических наук
Пашкин, Михаил Павлович
город
Санкт-Петербург
год
2005
специальность ВАК РФ
05.13.11
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и реализация многоагентной системы логистики знаний для информационной поддержки принятия решений»

Автореферат диссертации по теме "Разработка и реализация многоагентной системы логистики знаний для информационной поддержки принятия решений"

ПАШКИН

Михаил Павлович

РАЗРАБОТКА И РЕАЛИЗАЦИЯ МНОГОАГЕНТНОЙ СИСТЕМЫ ЛОГИСТИКИ ЗНАНИЙ ДЛЯ ИНФОРМАЦИОННОЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Специальность 05.13.11 — Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 2005

Работа выполнена в Санкт-Петербургском институте информатики и автоматизации РАН.

Научные руководители: доктор технических наук, профессор

Смирнов Александр Викторович

Официальные оппоненты: заслуженный деятель науки РФ,

доктор технических наук, профессор

Тимофеев Адиль Васильевич

кандидат технических наук, доцент

Неклюдов Сергей Юрьевич

Ведущая организация:

Санкт-Петербургский государственный электротехнический университет

Защита состоится «05» июля 2005 г. в 16 часов на заседании диссертационного совета Д.002.199.01 при Санкт-Петербургском институте информатики и автоматизации РАН по адресу: 199178, Санкт-Петербург, В.О., 14 линия, 39.

С диссертацией можно ознакомиться в библиотеке Санкт-Петербургского института информатики и автоматизации РАН

Автореферат разослан «02» июня 2005 г. Ученый секретарь

диссертационного совета Д.002Л 99.01

Ронжин Андрей Леонидович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации. Бурное развитие информационных

технологий привело к накоплению практически во всех прикладных областях (бизнесе, производстве, образовании и т.д.) большого количества разрозненных и разнородных информационных ресурсов (электронных документов, баз данных и знаний, электронных библиотек и т.п.), которые должны способствовать решению возникающих задач. С появлением сетевых технологий и Интернет стал возможен обмен знаниями, находящимися в данных ресурсах, с целью их повторного и совместного использования. Возникла открытая информационная среда, в которой распределенные разнородные источники знаний одинаково доступны всем заинтересованным лицам при помощи картограмм, отражающих их характеристики (расположение, формат, аннотацию и др.). Однако, помимо позитивных факторов, данный процесс привел к ряду проблем для лиц, принимающих решения. Появилось большое количество источников с устаревшими и недостоверными знаниями, возникло дублирование содержимого различных источников и увеличился объем избыточных знаний. Это приводит к затруднению поиска необходимых знаний и замедлению процесса принятия решения. В связи с этим наметился качественный сдвиг систем информационной поддержки принятия решений с уровня, где связи между источниками и потребителями знаний являются статическими, к уровню, где эти связи являются динамическими. Подобные системы должны быть 0) гибкими относительно быстро меняющегося окружения, (й) способными обеспечивать персонифицированную поддержку пользователей с различными уровнями компетенции и требований к получаемым знаниям, (ш) масштабируемыми относительно типов информационных ресурсов и их содержимого и (гё) способными взаимодействовать с другими электронными приложениями. Для создания подобных систем широкое распространение получила технология многоагентных систем.

В ходе исследований, выполненных в СПИИРАН в области построения систем интеграции знаний, была предложена методология - «логистика знаний». Она ориентирована на управление знаниями с целью извлечения, интеграции и транспортировки адекватных знаний из распределенных источников в правильном контексте соответствующим пользователям в заданное время для принятия решений в прикладных проблемных областях. В системе логистики знаний для описания знаний проблемной области используются онтологии, широко применяемые в системах искусственного интеллекта для описания объектов и явлений мира в формализованном виде, пригодном для компьютерного использования. Онтология - это средство описания семантики проблемной области при помощи словаря и подробной спецификации существующих в ней отношений, обеспечивающих интерпретацию словаря.

Большинство существующих систем информационной поддержки принятия решений в основном используют методологии интеллектуального

анализа текстов и данных и ориентированы на работу с хорошо структурированными данными. Как правило, в них отсутствуют или слабо представлены модели интересов пользователей. Очевидно, что их использования для обеспечения персонифицированной информационной поддержки принятия решений недостаточно. Представляется весьма актуальной разработка архитектуры, моделей и сценариев работы системы логистики знаний, ориентированной на работу со слабосвязанными разнородными распределенными источниками знаний, предназначенной для решения указанных выше задач, базирующейся на современных технологиях, использование которой способно повысить качество принимаемых решений.

Цель работы и задачи исследования. Основной целью диссертационной работы является разработка архитектуры, моделей информационных компонент и сценариев работы многоагентной системы логистики знаний для обеспечения персонифицированной информационной поддержки лиц, принимающих решения, в открытой информационной среде.

Для достижения поставленной цели в диссертационной работе должны быть решены следующие задачи:

• проанализированы существующие системы, оперирующие в открытой информационной среде и ориентированные на управление знаниями, для спецификации требований к системе логистики знаний;

• разработана архитектура и концептуальные модели основанных на онтологиях информационных компонент системы логистики знаний, обеспечивающих ее гибкость, масштабируемость и настраиваемость на пользователей, и произведена их интеграция в единую систему;

• определены пользователи системы, разработаны сценарии их работы, основанные на предложенной архитектуре с учетом сформулированных требований;

• реализована многоагентная система логистики знаний для апробации предложенных решений.

Методы исследования. Для проведения исследований в диссертационной работе использовались методы проектирования распределенных приложений, построенных на многоагентной технологии; методы искусственного интеллекта, стандарты открытых информационных систем. При разработке программного обеспечения использовались: унифицированный язык моделирования (UML), технология объектно-ориентированного программирования и язык структурированных запросов (SQL) к реляционным базам данных.

На защиту выносятся следующие результаты:

1. Многоагентная архитектура, обеспечивающая выполнение сценариев работы и поддержку информационных компонент системы логистики

знаний для персонифицированной поддержки принятия решений в открытой информационной среде.

2. Набор количественных и качественных показателей для вычисления рейтингов источников знаний.

3. Основанная на онтологиях модель картограммы знаний для описания характеристик и содержимого используемых источников знаний.

4. Алгоритм индексирования источников знаний, основанный на нечетком сравнении текстов с учетом семантики проблемной области.

5. Основанная на онтологиях модель интересов пользователя, построенная на анализе истории запросов.

Научная новизна:

1. Разработана архитектура, реализующая интегрированный сценарий функционирования компьютерной системы логистики знаний, основанная на использовании технологии многоагентных систем и предварительно разработанной онтологии проблемной области.

2. Разработан набор показателей для оценки источников знаний, используемый при определении релевантности результатов работы системы относительно запроса пользователя.

3. Разработана основанная на онтологиях формальная модель картограммы знаний, используемая для быстрого поиска источников знаний в открытой информационной среде.

4. Разработан алгоритм индексирования источников знаний относительно содержимого онтологии, использующий не только сходство между словарем онтологии и содержимым источников, но и связи между понятиями словаря, что повышает качество результатов работы системы, позволяя находить источники знаний, не содержащие понятия, распознанные в запросе пользователя.

5. Разработана основанная на онтологиях концептуальная модель профиля пользователя, позволяющая учитывать требования к получаемым результатам со стороны пользователей на основе их интересов и предпочтений.

Практическая ценность работы. Архитектура, сценарии и модели, разработанные в данной работе, направлены на улучшение результатов работы лиц, принимающих решение, за счет уменьшения пространства поиска знаний в открытой информационной среде, повышения скорости получения, качества и достоверности предоставляемых знаний.

Предложенная в ходе работы над диссертацией архитектура многоагентной системы логистики знаний позволяет настраивать систему на работу в конкретной проблемной области, описываемой при помощи онтологии, и делает ее гибкой и масштабируемой относительно типов и содержимого источников знаний.

Созданное математическое и программное обеспечение многоагентной системы логистики знаний «Интеграция» может быть использовано в различных прикладных проблемных областях как основа для организации быстрого, ориентированного на предпочтения пользователя доступа к имеющимся источникам знаний.

Реализация результатов работы. Исследования, отраженные в диссертации, были поддержаны грантами РФФИ (проекты № 02-01-00284 и № 03-01-06484 «Методологические и математические основы построения компьютерных систем быстрой интеграции знаний из распределенных источников»), 2002-2004 гг., грантом Президиума РАН (проект № 2.44 «Многоагентный подход к построению компьютерной среды для быстрой интеграции знаний из распределенных источников»), 2001-2003 гг., грантом ОИТВС РАН (проект № 1.9 «Разработка теоретических основ и многоагентной технологии управления контекстом в распределенной информационной среде»), 2003-2004 гг.

Часть результатов была использована при работе в рамках проекта МНТЦ №1993Р «Математические основы обнаружения знаний в данных и автономные интеллектуальные архитектуры» задачи 2 «Быстрое слияние знаний в масштабируемой инфосфере», 2000-2003 гг.

Разработанное программное обеспечение было использовано для методической и информационной поддержки экспертизы заявок на разработки при составлении сводного плана НИ ОКР в 1997-2000 гг. в рамках созданной в Отделе научно-технической политики Комитета экономики и промышленной политики Администрации Санкт-Петербурга интегрированной информационной технологии сопровождения заявки на стадии формирования сводного плана НИОКР, 1997-2000 гг.

Часть результатов была использована при выполнении контракта «Интеллектуальный доступ к каталогам и документам» на создание системы поддержки клиентов, реализованной для немецкой промышленной компании, 2003-2004 гг.

Апробация результатов работы. Основные положения и результаты диссертационной работы представлялись на национальной конференции по искусственному интеллекту КИИ'02 (Коломна, 2002), международных конференциях «Проблемы управления и моделирования в сложных системах» (Самара, 2003, 2004), «Интеллектуальные системы» (Дивноморское, 2001-2004), «Онтологии, базы данных и применение семантики 0БВА8Е'03» (Катания, Италия, 2003), «Региональная информатика РИ'04» (Санкт-Петербург, 2004), «Практические аспекты управления знаниями РАКМ'04» (Вена, Австрия, 2004).

Публикации. Основные результаты по материалам диссертационной работы опубликованы в 14 печатных работах.

Структура и объем работы. Диссертация объемом 151 машинописная

страница, содержит введение, четыре главы и заключение, список литературы (138 наименований), 24 таблицы, 61 рисунок.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована важность и актуальность темы диссертационной работы, сформулированы ее цели и решаемые задачи, определена научная новизна и указана практическая ценность, кратко изложены основные результаты и приведено содержание по главам.

В первой главе диссертации дано краткое описание выполненных ранее исследований в области методологии логистики знаний.

В разработанной в СПИИРАН методологии, проблемы логистики знаний рассматриваются как проблемы конфигурирования в конкретной проблемной области сети слабосвязанных распределенных источников знаний, конечных пользователей и средств управления (обработки) информации и знаний.

Приведены классификации задач систем управления знаниями (создание, приобретение, уточнение, распространение, внедрение и использование знаний). Анализ известных систем (KRAFT, InfoSleuth, OBSERVER и др.), относящихся к этим областям, позволил выявить в них общие черты (использование онтологии для описания проблемных областей, профилей для накопления данных о пользователе и построения модели его интересов, технологии многоагентных систем для разработки масштабируемых распределенных приложений, картограмм знаний для организации доступа к информационным ресурсам). Анализ известных систем, занимающихся извлечением и интеграцией знаний, показал, что современные системы логистики знаний должны обладать следующими свойствами: гибкостью, масштабируемостью, обучаемостью, целостностью, открытостью, быстродействием, настраиваемостью на пользователя и т.д.

На основе анализа систем профилирования пользователей (SPUD, KOL, SAGE и др.) выделены их компоненты (персональные и системные данные, выявленные знания об интересах и предпочтениях пользователей).

Предложены классификации источников знаний по типам содержимого (базы данных и знаний, документы, эксперты и др.), по способам пополнения (активные и пассивные) и организации доступа (подключаемые и индексируемые), и определены основные задачи, которые должны быть решены при организации доступа к различным типам источников знаний (разработка запросов к базам данных, процедур обработки текстов и т.д.).

Изучение современных информационных систем показало, что для обеспечения открытости и совместимости системы логистики знаний с современными системами управления знаниями целесообразно использовать стандарты инициативной группы Semantic Web для описания онтологии (язык веб-онтологий OWL и расширенный онтологическими функциями язык разметки агентов DAML+OIL) и обмена данными (расширяемый язык разметки XML).

Для обеспечения масштабируемости системы логистики знаний предложено использовать многоагентную архитектуру, которая позволяет легко надстраивать и расширять систему, поэтапно наращивая ее мощность. Она обладает следующими достоинствами: агенты оперируют знаниями, используя словарь конкретной онтологии; сложные задачи могут быть решены командой агентов; существуют спецификации стандартизированных форматов обмена сообщениями; появление новых членов сообщества агентов или изменение функций некоторых агентов не требует перезагрузки всей информационной системы и т.д.

Предложено использовать набор проблемно-ориентированных агентов, динамическую структуру сообщества, кооперативное поведение при совместной работе. В виду того, что в системе логистики знаний онтологии проблемных областей предварительно построены, а источники знаний найдены и описаны, в миграции агентов между компьютерами нет необходимости. Поэтому, концептуальная модель FIPA (Foundation of Physical Intelligent Agents) выбрана в качестве технологической инфраструктуры определений свойств и функций агентов.

Показана необходимость интеграции принципов, рекомендаций и понятий из различных методологий проектирования сообщества агентов (ADELPHE, GAIA, PASSI, Prometheus, Tropos, Message). Такие свойства агентов системы логистики знаний, как благожелательность, правдивость, и рациональность обусловили целесообразность проектирования сообщества ее агентов с использованием методологии «ADELPHE», рекомендации которой ориентированы на разработку адаптивных систем, работающих с непредсказуемыми ситуациями. Ввиду того, что только методология «PASSI» поддерживает понятие онтологии, предложено использовать ее рекомендации по учету ролей агентов и описанию онтологии проблемных областей.

Во второй главе приводятся формальные модели информационных компонент системы логистики знаний и определяется состав сообщества агентов.

Согласно предложенной методологии проектирования сообщества агентов, выделен набор сущностей информационной среды и определены отношения между ними. К сущностям относятся: пользователи, запросы пользователей, источники знаний, агенты и информационные компоненты системы. Выделены 6 типов пользователей (потребители знаний, инженеры по знаниям, инженеры по онтологиям, эксперты, администратор и специалисты по программному обеспечению) и разработаны основные сценарии их работы. Сценарии представлены в виде UML диаграмм состояния и вариантов использования. Запросы пользователей разделены на две группы: структурированные (вводимые с помощью шаблонов - специальных интерфейсных форм) и неструктурированные (вводимые в виде теста на естественном языке).

В сценариях работы системы предложено выделять две стадии: подготовки и эксплуатации. На стадии подготовки производится построение онтологии, описание источников знаний, создание шаблонов агентов. На

стадии эксплуатации производится поддержка работы лиц, принимающих решения: обработка запросов пользователей, интеграция и визуализация знаний в соответствии с предпочтениями пользователей.

На основе разработанных ИМЬ диаграмм сценариев работы системы логистики знаний определены задачи, которые должны быть решены на различных стадиях работы системы. На их основе были определены роли, описывающие предоставляемые сервисы и выполняемые задачи агентами системы. После проведения группировки ролей по зависимости друг от друга и ориентации на работу с различными сущностями системы логистики знаний и принимая во внимание рекомендации ИРА, предложены десять типов агентов (рис. 1).

Рис. 1. Сообщество агентов системы логистики знаний

Часть агентов являются технологическими: (1) интерфейсные агенты, обеспечивающие взаимодействие с источниками знаний и существующие пока соответствующий им источник доступен, (и) маршрутизатор, обеспечивающий службу «желтых страниц» для членов сообщества агентов, (т) посредники, создаваемые на время выполнения задания для контроля его выполнения, (IV) агенты пользователя, создаваемые после прохождения пользователем процедуры аутентификации для взаимодействия с ним, (V) агенты помощники экспертов, создаваемые после прохождения экспертом процедуры аутентификации для взаимодействия с ним, и (VI) агент мониторинга, проверяющий состояние источников знаний и обеспечивающий взаимодействие с внешними приложениями открытой информационной среды. Остальные агенты являются проблемно-ориентированными: (1) транслирующий агент, обрабатывающий тексты - содержимое документов и запросов в свободной форме, (и) агенты интеграции знаний, разрабатываемые для выполнения операций по интеграции знаний, (ш) агент конфигуратор, выполняющий

построение эффективной конфигурации сети источников знаний под запрос пользователя, (iv) агент управления онтологиями, выполняющий операции над онтологиями. Проблемно-ориентированные агенты, маршрутизатор и агент мониторинга постоянно присутствуют в системе.

Согласно используемому в методологии логистики знаний формализму объектно-ориентированных сетей ограничений, онтология А описывается как A=(0,Q,D,C), где О-множество классов объектов (далее, «классы»); Q — множество атрибутов классов (далее, «атрибуты»); D - множество доменов -областей допустимых значений атрибутов (далее, «домены»); С - множество ограничений. называются элементами онтологии.

Онтология А определяет структуру конкретной объектно-ориентированной сети ограничений CNei(A,I)=(0,Q,D,C,I), где /-информационное наполнение сети, содержащее набор экземпляров классов. Предложенная нотация тесно коррелирует с языком описания онтологии OWL.

Поскольку онтология описывает знания проблемной области, ее элементы были использованы для построения информационных компонент -профиля пользователя и картограммы знаний.

На основе анализа систем профилирования и опираясь на выбранный формализм представления онтологии разработана структура профиля пользователя, использующегося, в частности, для быстрой обработки запроса пользователя за счет анализа истории запросов и выявленных предпочтений пользователя. Профиль пользователя предложено описывать кортежем

-идентификатор пользователя; PD-персональные данные: фамилия, имя, адрес электронной почты, демографические данные, контактная информация и т.д.; SD- системные данные: имя учетной записи, пароль, тип пользователя по отношению к системе, предпочтения в работе и настройки системы (язык интерфейса, выбранные установки, используемое программное обеспечение и т.д.), права доступа к компонентам системы; KD— выявленные и собранные данные: история контактов, введенные запросы и дополнительные параметры, индивидуальный для каждой группы пользователей; UO- представляет основанную на онтологиях модель интересов пользователя: A(UID)=(0(UID),Q(UID),D(UID),C(UID)). При этом, 0(U1D)cz0kj0', Q(UID)aQu& D(UID)cIXjD', C{UID)c.C<aC?, где (У,классы, атрибуты, домены и ограничения, отсутствующие в онтологии проблемной области, для добавления которых словарь онтологии может быть расширен синонимами.

Запросы пользователей состоят из двух частей: (i) структурная составляющая запроса (содержащая понятия проблемной области, обнаруженные в запросе), и (ii) параметрическая составляющая запроса (содержащая заданные пользователем дополнительные ограничения). Структурной составляющей запроса соответствует срез онтологии, построенный как с учетом сходства между словарем онтологии и текстом запроса и связей между понятиями словаря. Содержимое этого среза используется как основа для построения модели интересов пользователя.

Использование предложенной структуры обладает такими достоинствами, как незначительная зависимость среза онтологии от языка, на котором пользователь ввел запрос, и точное распознавание запроса при помощи синонимов, используемых пользователем, в словаре понятий проблемной области.

В соответствии с разработанной классификацией, источники знаний делятся на (^ индексируемые, содержимое которых может быть извлечено и приведено к текстовому виду, обработано, сравнено с понятиями проблемной области и предоставлено по запросу пользователя (структурированные документы); и (и) подключаемые, содержимое которых может быть извлечено при помощи специально разработанных программных средств (базы данных, знаний и др.). Для описания источников знаний и организации быстрого доступа к ним предложено использовать картограмму знаний, описываемую как множество элементов КМар = {кМарЕ!,}^4', где

является кортежем:

где: /4 - ссылка на метод обработки содержимого источников знаний; т&Ы количество источников знаний, которые должны быть обработаны для получения значения атрибута щ, принадлежащего классу о,; 0у - область возможных значений атрибута, которые могут быть получены из источников знаний {кяЮрУ ^, и 1&>я€]£;1] - степень сходства между именем класса и

содержимым индексируемого документа (значение задастся

администратором системы). Разработан алгоритм формирования картограммы знаний, основанный на излечении содержимого источника, предварительной обработке текстов и нечетком сравнении строк.

Запрос пользователя может содержать слова и символы, которым не удастся поставить в соответствие элементы онтологии. В этом случае использования предложенной модели картограммы знаний недостаточно. Предложена процедура предварительной обработки запросов, согласно которой запросы разбиваются на группы подзапросов по образцам, каждая группа обрабатывается в соответствии с заданной экспертами стратегией, а для визуализации результатов разрабатываются программные процедуры. Количество образцов и сценарии их обработки привязаны к реальной проблемной области.

Третья глава описывает разработанную информационную модель агента и архитектуру сообщества агентов. Подробно описаны функции, сообщения и сценарии работы технологических агентов: пользователя, интерфейсного, маршрутизатора, посредника, помощника эксперта и мониторинга. На рис. 2 представлена UML диаграмма классов, содержащая свойства и функции агентов системы логистики знаний. В светлых прямоугольниках описаны свойства и функции технологических агентов, в затененных - проблемно-ориентированных агентов.

Рис. 2. Агенты системы «Интеграция»: основные функции и свойства

Ниже приведен общий сценарий обработки запроса пользователя

сообществом агентов:

1. Потребитель знания (лицо, принимающее решение) при помощи агента пользователя вводит в систему запрос R на получение знания. Агент посредник получает запрос от агента пользователя.

2. Запрос, введенный в свободной форме, передается транслирующему агенту для обработки. Транслирующий агент производит предварительную обработку запроса: удаляет незначимые слова, проверяет синтаксические ошибки, формирует канонические формы слов, готовит вспомогательную XML структуру, содержащую информацию о словах запроса

3. Агент управления онтологиями распознает понятия, содержащиеся в запросе. Для этого он выполняет сравнение имен классов и атрибутов, содержащихся в онтологии и их синонимов, хранящихся в модели интересов пользователя со словами запроса. Используя алгоритм нечеткого сравнения строк, он вычисляет близость найденных классов и атрибутов к тексту запроса.

fontoSeorch R-^iio.ßim^^Simj}), где о,е О, qfi Q, &'от,е]0;1], 57>^€]0;1]

Принимая во внимание (i) связи между классами и атрибутами, (ii) пороговое значение близости, задаваемое администратором системы, и (iii) правила построения срезов онтологии, этот агент формирует минимальный набор элементов онтологии, представляющий структурную составляющую запроса пользователя. В результате, получается следующая сеть ограничений:

CNet{A{R), I(R))=(0(R),Q(R),D(R),C(R)J(R)), где 0(R)cz0, ß(i?)c0,

- параметрическая составляющая запроса, Далее (п. 6) эта структура заполняется конкретными экземплярами классов со значениями атрибутов с учетом доменов и ограничений, полученных из источников знаний и заданных пользователем

(параметрическая составляющая запроса).

4. В соответствии с разработанными образцами, агент конфигуратор выполняет декомпозицию запроса пользователя на подзапросы и конфигурирует сеть источников знаний, определяющую, из каких источников будут извлекаться данные и знания, или какие электронные документы будут предоставляться пользователю в качестве результатов работы.

5. Агент посредник передает подзапросы интерфейсным агентам, которые переводят подзапросы в нотацию источников знаний, обращаются к источникам, получают ответы, переводят их в нотацию системы логистики знаний и передают их посреднику. Интерфейсные агенты осуществляют контроль ошибок, сбоев и временных ограничений обработки. Результатом работы интерфейсных агентов являются наборы экземпляров классов Ц^ЗЯщ), полученные из источника знаний 8р на подзапрос 8Ят.

6. Получив ответы от всех интерфейсных агентов, агент посредник посылает сообщение агенту интеграции знаний, который, производит обработку результатов: - набор программных методов обработки результатов (например, решения оптимизационных задач), указанный в картограмме знаний.

7. Агент посредник получает и сохраняет промежуточные результаты процесса интеграции знаний и передает окончательный результат агенту пользователя, который возвращает результат пользователю и делает необходимые изменения в профиле пользователя. Результатом является: список индексируемых источников знаний (например, документов) и визуализированное представление информации из подключаемых источников (например, список изделий, производимых компанией).

В системах персонифицированной информационной поддержки принятия решений важным является оценка релевантности результатов относительно запроса пользователя. В настоящей работе данную величину предложено оценивать как произведение (Лзначения близости имени найденного элемента онтологии к тексту запроса пользователя, (и) значения близости имени этого элемента к содержимому источнику знаний (для индексируемых источников знаний), (ш) рейтинга источника знаний, и (1у) количества образцов подзапросов, которым соответствует результат.

Для вычисления рейтинга источников знаний используется набор п параметров (дата создания и последнего обновления, количество запросов, для которых источник был найден, заданный экспертами вес и т.д.). При подсчете рейтинга источника сначала производится нормализация значения параметров:

где ¿¡ц - значение 1-ого параметра для к-ого источника знаний. Для всех источников знаний строится матрица нормализованных значений параметров

где р - количество источников знаний, п — количество параметров. Для каждого источника его рейтинг предложено вычислять по формуле:

Rating, =!>,/«.

j-i

Был проведен анализ совместимости нотаций представления онтологии при помощи объектно-ориентированных сетей ограничений в системе логистики знаний и средствами языков консорциума Semantic Web - OWL и DAML+OIL. Результаты показали возможность импорта и экспорта большинства элементов указанных онтологии, что позволяет их повторно использовать для построения новых онтологии.

В четвертой главе приводятся данные по реализации разработанной архитектуры, моделей и сценариев работы в многоагентной системе логистики знаний и промышленных приложениях.

Использованные стандарты информационного ядра системы логистики знаний и их взаимосвязь с выбранной нотацией представления знаний приведены на рис. 3. Доступ к данным осуществляется средствами ODBC или ADO, как типовых механизмов работы с базами данных в операционной системе MS Windows. Онтологии представляются пользователю в виде интерактивных HTML страниц, отображаемых Интернет проводником. Для обеспечения совместимости системы логистики знаний с внешними системами разработаны средства импорта из языков DAML+OIL и OWL. В качестве средства разработки и моделирования взаимодействия агентов использовалась система MAS DK (СПИИРАН).

Рис. 3. Стандарты информационного ядра системы «Интеграция»

Полное тестирование системы было выполнено на примере конфигурирования мобильного госпиталя (проект МНТЦ № 1993Р). Эксперименты позволили выявить узкие места в разработанных сценариях и провести их модификацию для повышения быстроты работы системы логистики знаний и проверить правильность планирования сообществом агентов своих действии. На рис. 4 представлен график загрузки агентов в виде диаграммы Ганта, построенный по результатам обработки одного из запросов пользователя с помощью разработанной системы.

Рис. 4. График работы сообщества агентов

Разработанный подход был частично использован для реализации системы интеллектуального доступа к корпоративным документам и каталогам, основанной на использовании онтологии компании для распознавания многоязыковых запросов пользователей и индексирования источников знаний (разнородные базы данных, программные системы и корпоративные документы). Разработанная система создавалась как часть корпоративной информационной системы управления связей с клиентами глобальной промышленной компании, имеющей более 300 000 клиентов в 176 странах, более 50 национальных компаний и 250 офисов по всему миру.

Созданная онтология (представляющая собой часть онтологии компании) содержит 242 класса, 355 атрибутов и 4 уровня глубины таксономии. На этапе промышленного тестирования в качестве источников знаний выбраны (i) корпоративные документы в форматах Microsoft Word, Excel и PowerPoint, Adobe Acrobat, текстовом, Rich Text Format, HTML и XML общим объемом 350 Мб и (ii) электронные каталоги из более чем 25000 наименований продуктов и 2000 комплексных технических решений и проектов. Были выделены пять образцов запросов (шифр изделия, наименование, выполняемая операция, соответствие классам онтологии,

значение текстовых характеристик) и разработаны стратегии их обработки.

Сравнительный анализ результатов работы созданного приложения с известными системами доступа к информации (Google desktop search и Greenstone digital library software) на одном и том же наборе документов (табл. 1) показал следующие преимущества разработанного приложения: (i) возможность обработки подключаемых источников знаний (электронных каталогов), (ii) сортировка полученных результатов в соответствии с вычисленной релевантностью относительно введенного запроса, (iii) учет параметрической составляющей и (iv) возможность находить документы, релевантные запросу, но не содержащие слова, введенные пользователем. При учете модели интересов пользователя и использовании порогового значения релевантности для значимых результатов, количество получаемых результатов может быть значительно уменьшено.

Таблица 1. Результаты, найденные различными системами

Тип запроса (пример) Система

Google desktop search Greenstone digital library Разработанная система

Найденные решения и их релевантность (%)*

10093, 11145 0 0 ПК-2 (100%)

НМРЬ 9 9 ПК-47 (100%)

ИП-28 (100%)

ТП-3 (2-100%, 1-50%)

Док. - 56 (1-100%, 55 <= 33%)

Поступательный привод 3 4 ПК-3152 (245-100%, 2907<=35%;

ТП - 70 (13-100%, 57-50%)

Док. - 78 (45-100%, 33<=50%)

Переместить груз 5 кг на 100 мм по горизонтали 1 5 ИП - 62 (20%)

ТП - 49 (7-22%, 42-11%)

Док. - 62 (5-100%, 57-10%)

Управляющий клапан 31 35 ПК - 300 (4-100%, 296<=50%)

ТП-51 (2-100%, 49-50%)

Док. - 75 (15-100%, 60<=25%)

* ПК - продукт каталога, ИП - инженерный проект, ТП - технический проект

ЗАКЛЮЧЕНИЕ

Совокупность сформулированных и обоснованных в диссертационной работе положений, а также ее практические результаты представляют собой решение актуальной научно-технической задачи по созданию системы персонифицированной проблемно-ориентированной информационной

поддержки лиц, принимающих решения в открытой информационной среде.

При этом были получены следующие результаты:

1. На основе технологии многоагентных систем разработаны архитектура, сценарии работы, алгоритмы и модели системы логистики знаний, предназначенной для обеспечения персонифицированной информационной поддержки принятия решений. Проблемно-ориентированные агенты, динамическая структура их сообщества и распределение агентов по различным компьютерам позволяют обеспечивать масштабируемость системы относительно типов и содержимого источников знаний за счет поэтапного наращивания ее мощности.

2. Разработаны количественные и качественные показатели для вычисления рейтингов источников знаний, использование которых при оценке релевантности результатов работы системы по отношению к запросу пользователя помогает повысить эффективность поиска приемлемых решений.

3. Разработана основанная на онтологиях формальная модель и алгоритм построения картограммы знаний, хранящей характеристики источников знаний, их соответствие онтологии и образцы для распознавания запроса пользователя. Ее использование позволяет организовать доступ к слабосвязанным распределенным разнородным источникам знаний и обеспечивает гибкость системы логистики знаний относительно проблемной области и содержимого источника знаний, а также быстрый поиск источников, содержащих необходимые знания.

4. Совместимость выбранной нотации объектно-ориентированных сетей ограничений для представления онтологии со стандартами представления онтологии языками консорциума Semantic Web обеспечивает открытость системы за счет совместного и повторного использования доступных онтологии.

5. Разработана основанная на онтологиях концептуальная модель профиля пользователя, обеспечивающая персонифицированную информационную поддержку за счет выявления предпочтений и интересов пользователя на основе аккумулированной информации.

6. На основе разработанных сценариев работы, алгоритмов и моделей под руководством и при участии автора были созданы промышленные приложения для оценки качества научно-технических проектов и интеллектуального доступа к корпоративному репозиторию. Эффективность используемых решений подтверждается сравнением получаемых результатов с результатами работы других известных систем.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Пашкин М.П. Организация картограммы знаний в системе логистики знаний «Интеграция». Труды СПИИРАН(под ред. P.M. Юсупова), СПб.: Наука, 2004. Вып. 2. Т. 1. С. 303—310.

2. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Подход к конфигурированию сети источников знаний для логистики знаний. Известия ТРТУ. Таганрог: ТРТУ, 2003. № 3 (31). С. 28—32.

3. Смирнов А.В., Левашова Т.В., Пашкин М.П., Шилов Н.Г. Многоагентный подход к построению систем интеграции знаний. Известия вузов. Приборостроение. 2003. Т.46, № 5. С. 13—19.

4. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Управление онтологиями. Известия РАН. Теория и системы управления, 2003. -Часть 1 - № 4. С. 132—146. - Часть 2. - № 5. С. 89—101.

5. Пашкин М.П. Ранжирование альтернативных источников знаний на основе технологии групповой поддержки принятия решений. Труды СПИИРАН (под ред. P.M. Юсупова), СПб.: СПИИРАН, 2002. Вып. 1. Т. 3. С. 22—30.

6. Смирнов А.В., Левашова Т.В. Пашкин МП., Шилов Н.Г. Онтолого-ориентированный многоагентный подход к построению систем интеграции знаний из распределенных источников. Информационные технологии и вычислительные системы, 2002. № 1. С. 62—82.

7. Пашкин М.П. Многоагентная архитектура для систем интеграции знаний из распределенных источников. Телекоммуникации, математика и информатика — исследования и инновации. Межвузовский сборник научных трудов, СПб., 2002. Вып. 6. С. 106—108.

8. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Онтологии в системах искусственного интеллекта: способы построения и организации. Новости искусственного интеллекта, 2002. № 1. Часть 1. С. 3—13. № 2. Часть 2. С. 3—9.

9. Пашкин М.П. Некоторые особенности организации обработки данных в распределенных вычислительных системах. Информационные технологии и интеллектуальные методы, СПб.: СПИИРАН; 1996. С. 125—127.

10. Smirnov A., PashkinM., ChilovN., LevashovaT. Agents-based Knowledge Logistics. In R. Khosla, N. Ichalkaranje, L.C. Jain (eds.) Design ofIntelligent Multi-Agent Systems, Springer, 2005, pp. 63—101.

11. Smirnov A., PashkinM, ChilovN., LevashovaT. Knowledge logistics in information grid environment. International Journal on Future Generation Computer Systems, 2004, 20 (1). pp. 61—79.

12. Smirnov A., Pashkin M., Chilov R, Levashova T. Agent-based support of mass customization for corporate knowledge management. Engineering Applications of Artificial Intelligence, June 2003. Volume 16, Issue 4. pp. 349—364.

13. Smirnov A., PashkinM., ChilovN., LevashovaT. KSNet-approach to knowledge fusion from distributed sources. Computing and Informatics, 2003. V. 22. pp. 105—142.

14. Smirnov A., PashkinM., ChilovN., LevashovaT. Haritatos F. Knowledge source network configuration approach to knowledge logistics. International Journal of General Systems. Taylor & Francis Group, 2003.32 (3). pp. 251—269.

t I

Оригинал - макет М П. Пашкина. Бумага офсетная. Печать офсетная. Объем 1 печ. л. Тираж 100 экз. Заказ № 47

Изаательско-полиграфическая фирма «Анатолия», ООО

(199178, Санкт-Петербург, 14 линия, д. 39)

Оглавление автор диссертации — кандидата технических наук Пашкин, Михаил Павлович

Введение.

Положения, выносимые на защиту.

1 Проблемы построения систем логистики знаний.

1.1 Подход «СИЗ» к логистике знаний.

1.2 Научные направления «Управление Знаниями» и «Извлечение информации».

1.3 Требования, технологии и стандарты современных систем персонифицированной информационной поддержки принятия решений.

1.4 Многоагентная технология построения распределенных программных систем.

Выводы по главе 1.

2 Архитектура и модели информационных компонент системы логистики знаний.

2.1 Методология разработки многоагентной системы логистики знаний.

2.2 Разработка модели окружения системы логистики знаний.

2.3 Разработка модели профиля пользователя.

2.4 Разработка модели картограммы знаний.

Выводы по главе 2.

3 Модели и сценарии работы технологических агентов системы логистики знаний.

3.1 Проектирование сообщества агентов системы логистики знаний.

3.2 Разработка технологических агентов системы логистики знаний.

3.3 Поддержка сообществом агентов сценариев работы системы.

3.4 Алгоритм вычисления рейтингов источников знаний.

Выводы по главе 3.

4 Программная реализация многоагентной системы логистики знаний и ее применение.

4.1 Многоагентная система «Интеграция».

4.2 Применение системы групповой поддержки принятия решений для оценки источников знаний.

4.3 Компьютерная система интеллектуального доступа к каталогам и документам.

Выводы по главе 4.

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Пашкин, Михаил Павлович

Актуальность темы диссертации. Бурное развитие информационных технологий привело к накоплению практически во всех прикладных областях (бизнесе, производстве, образовании и т.д.) большого количества разрозненных и разнородных информационных ресурсов (электронных документов, баз данных и знаний, электронных библиотек и т.п.), которые должны способствовать решению возникающих задач. С появлением сетевых технологий и Интернет стал возможен обмен знаниями, находящимися в данных ресурсах, с целью их повторного и совместного использования. Возникла открытая информационная среда, в которой распределенные разнородные источники знаний одинаково доступны всем заинтересованным лицам при помощи картограмм, отражающим их характеристики (расположение, формат, аннотацию и др.). Однако, помимо позитивных факторов, данный процесс привел к ряду проблем для лиц, принимающих решения. Появилось большое количество источников с устаревшими и недостоверными знаниями, возникло дублирование содержимого различных источников и увеличился объем избыточных знаний. Это приводит к затруднению поиска необходимых знаний и замедлению процесса принятия решения. В связи с этим наметился качественный сдвиг систем информационной поддержки принятия решений с уровня, где связи между источниками и потребителями знаний являются статическими, к уровню, где эти связи являются динамическими [101]. Подобные системы должны быть (i) гибкими относительно быстро меняющегося окружения, (И) способными обеспечивать персонифицированную поддержку пользователей с различными уровнями компетенции и требований к получаемым знаниям, (iii) масштабируемыми относительно типов информационных ресурсов и их содержимого и (iv) способными взаимодействовать с другими электронными приложениями. Для создания подобных систем широкое распространение получила технология многоагентных систем.

В основе персонифицированной информационной поддержки пользователей лежат идеи таких прикладных научных направлений, как широкая приспособляемость к требованиям заказчиков (mass customization) [52, 114], адаптивная гипермедия - расширенный по сравнению с гипертекстом метод организации мультимедийной информации, охватывающий разные среды (adaptive hypermedia) [58, 71], управление взаимоотношениями с клиентами (customer relationship management) и обслуживанием клиентов (customer service management) [47, 111, 98, 23, 64] и другие. Для реализации таких систем используются технологии обнаружения в имеющемся массиве данных ранее неизвестной, но полезной и доступной информации (data mining) [7, 79, 73, 110], кластеризации и машинного обучения, основанные на профилировании [122, 38, 39] и другие.

В ходе исследований, выполненных в СПИИРАН в области построения систем интеграции знаний, была предложена методология — «логистика знаний» [18, 33]. Она ориентирована на управление знаниями с целью извлечения, интеграции и транспортировки адекватных знаний из распределенных источников в правильном контексте соответствующим пользователям в заданное время для принятия решений в прикладных проблемных областях. В системе логистики знаний для описания знаний проблемной области используются онтологии, широко применяемые в системах искусственного интеллекта для описания объектов и явлений мира в формализованном виде, пригодном для компьютерного использования. Онтология - это средство описания семантики проблемной области при помощи словаря и подробной спецификации существующих в ней отношений и ограничений, обеспечивающих интерпретацию словаря.

Традиционно используемые системы информационной поддержки принятия решений в основном используют методологии интеллектуального анализа текстов и данных [79, 73, 110] и ориентированы на работу с хорошо структурированными данными. Как правило, в них отсутствуют или слабо представлены модели интересов пользователей. Очевидно, что их использования для обеспечения персонифицированной информационной поддержки принятия решений недостаточно. Представляется весьма актуальной разработка архитектуры, моделей и сценариев работы системы логистики знаний, ориентированной на работу со слабосвязанными разнородными распределенными источниками знаний, предназначенной для решения указанных выше задач, базирующейся на современных технологиях, использование которой способно повысить качество принимаемых решений.

Цель работы и задачи исследования. Основной целью диссертационной работы является разработка архитектуры, моделей информационных компонент и сценариев работы многоагентной системы логистики знаний для обеспечения персонифицированной информационной поддержки лиц, принимающих решения, в открытой информационной среде.

Для достижения поставленной цели в диссертационной работе должны быть решены следующие задачи:

• проанализированы существующие системы, оперирующие в открытой информационной среде и ориентированные на управление знаниями, для спецификации требований к системе логистики знаний;

• разработана архитектура и концептуальные модели основанных на онтоло-гиях информационных компонент системы логистики знаний, обеспечивающих ее гибкость, масштабируемость и настраиваемость на пользователей, и произведена их интеграция в единую систему;

• определены пользователи системы, разработаны сценарии их работы, основанные на предложенной архитектуре с учетом сформулированных требований;

• реализована многоагентная система логистики знаний для апробации предложенных решений.

Методы исследования. Для проведения исследований в диссертационной работе использовались методы проектирования распределенных приложений, построенных на многоагентной технологии; методы искусственного интеллекта, стандарты открытых информационных систем. При разработке программного обеспечения использовались: унифицированный язык моделирования (UML), технология объектно-ориентированного программирования и язык структурированных запросов (SQL) к реляционным базам данных.

Научная новизна.

1. Разработана архитектура, реализующая интегрированный сценарий функционирования компьютерной системы логистики знаний, основанная на использовании технологии многоагентных систем и предварительно разработанной онтологии проблемной области.

2. Разработан набор показателей для оценки источников знаний, используемой при определении релевантности результатов работы системы относительно запроса пользователя.

3. Разработана основанная на онтологиях формальная модель картограммы знаний, используемая для быстрого поиска источников знаний в открытой информационной среде.

4. Разработан алгоритм индексирования источников знаний относительно содержимого онтологии, использующий не только сходство между словарем онтологии и содержимым источников, но и связи между элементами онто-логиями, что повышает качество результатов работы системы, позволяя находить источники знаний, не содержащие понятия, распознанные в запросе пользователя.

5. Разработана основанная на онтологиях концептуальная модель профиля пользователя, позволяющая учитывать требования к получаемым результатам со стороны пользователей на основе их интересов и предпочтений.

Обоснованность и достоверность научных положений и выводов обеспечена за счет анализа состояния исследований в данной области и практической реализацией и внедрением системы интеллектуальной персонифицированной поддержки ЛПР.

Практическая ценность работы. Архитектура, сценарии и модели, разработанные в данной работе, направлены на улучшение результатов работы лиц, принимающих решение за счет уменьшения пространства поиска знаний в открытой информационной среде, повышения скорости получения, качества и достоверности предоставляемых знаний.

Предложенная в ходе работы над диссертацией архитектура многоагентной системы логистики знаний позволяет настраивать систему на работу в конкретной проблемной области, описываемой при помощи онтологий, и делает ее гибкой и масштабируемой относительно типов и содержимого источников знаний.

Созданная многоагентная система логистики знаний «Интеграция» может быть использована в различных прикладных проблемных областях как основа для организации быстрого, ориентированного на предпочтения пользователя доступа к имеющимся источникам знаний.

Реализация результатов работы. Исследования, отраженные в диссертации, были поддержаны грантами РФФИ (проекты № 02-01-00284 и № 03-01-06484 «Методологические и математические основы построения компьютерных систем быстрой интеграции знаний из распределенных источников»), 2002-2004 гг., грантом Президиума РАН (проект № 2.44 «Многоагентный подход к построению компьютерной среды для быстрой интеграции знаний из распределенных источников»), 2001-2003 гг., грантом ОИТВС РАН (проект № 1.9 «Разработка теоретических основ и многоагентной технологии управления контекстом в распределенной информационной среде»), 2003-2004 гг.

Часть результатов была использована при работе в рамках проекта МНТЦ №1993Р «Математические основы обнаружения знаний в данных и автономные интеллектуальные архитектуры» задачи 2 «Быстрое слияние знаний в масштабируемой инфосфере», 2000-2003 гг.

Разработанное программное обеспечение было использовано для методической и информационной поддержки экспертизы заявок на разработки при составлении сводного плана НИОКР в 1997-2000 гг. в рамках созданной в Отделе научно-технической политики Комитета экономики и промышленной политики Администрации Санкт-Петербурга интегрированной информационной технологии сопровождения заявки на стадии формирования сводного плана НИОКР, 1997-2000 гг.

Часть результатов была использована при выполнении контракта «Интеллектуальный доступ к каталогам и документам» на создание системы поддержки клиентов, реализованной для немецкой промышленной компании, 2003-2004 гг.

Публикации. Основные результаты по материалам диссертационной работы опубликованы в 14 печатных работах.

Апробация результатов работы. Основные положения и результаты диссертационной работы представлялись на национальной конференции по искусственному интеллекту КИИ'02 (Коломна, 2002), международных конференциях «Проблемы управления и моделирования в сложных системах» (Самара, 2003, 2004), «Интеллектуальные системы» (Дивноморское, 2001-2004), «Онтологии, базы данных и применение семантики ODBASE'03» (Катания, Италия, 2003), «Региональная информатика РИ'04» (Санкт-Петербург, 2004), «Практические аспекты управления знаниями РАКМ'04» (Вена, Австрия, 2004).

Структура и объем работы. Диссертация объемом 151 машинописная страница, содержит введение, четыре главы и заключение, список литературы (138 наименований), 24 таблицы, 61 рисунок.

Заключение диссертация на тему "Разработка и реализация многоагентной системы логистики знаний для информационной поддержки принятия решений"

Выводы по главе 4

Разработанные в диссертации подходы позволили осуществить несколько успешных приложений:

1. По проекту МНТЦ №1993Р, задача 2 создана многоагентная система ЛЗ.

2. В рамках проекта «Интеллектуальный доступ к каталогу и документам», была создана реальная картограмма знаний, интерфейсные модули для доступа к источникам знаний и профили пользователей.

3. Внедрение программной среда «MultiExpert» в комитете экономики и промышленной политики Администрации Санкт-Петербурга для методической и информационной поддержки экспертизы заявок на разработки при составлении сводного плана НИОКР.

Заключение

Совокупность сформулированных и обоснованных в диссертационной работе положений, а также ее практические результаты представляют собой решение актуальной научно-технической задачи по созданию системы персонифицированной проблемно-ориентированной информационной поддержки лиц, принимающих решения в открытой информационной среде. При этом были получены следующие результаты:

1. На основе технологии многоагентных систем разработаны архитектура, сценарии работы, алгоритмы и модели системы логистики знаний, предназначенной для обеспечения персонифицированной информационной поддержки принятия решений. Проблемно-ориентированные агенты, динамическая структура их сообщества и распределение агентов по различным компьютерам позволяют обеспечивать масштабируемость системы относительно типов и содержимого источников знаний за счет поэтапного наращивания ее мощности.

2. Разработаны количественные и качественные показатели для вычисления рейтингов источников знаний, использование которых при оценке релевантности результатов работы системы по отношению к запросу пользователя помогает повысить эффективность поиска приемлемых решений.

3. Разработана основанная на онтологиях формальная модель и алгоритм построения картограммы знаний, хранящей характеристики источников знаний, их соответствие онтологии и образцы для выполнения анализа запроса пользователя. Ее использование позволяет организовать доступ к слабосвязанным распределенным разнородным источникам знаний и обеспечивает гибкость системы логистики знаний относительно проблемной области и содержимого источника знаний, а также быстрый поиск источников, содержащих необходимые знания.

4. Совместимость выбранной нотации объектно-ориентированных сетей ограничений для представления онтологий со стандартами представления онтологий языками консорциума Semantic Web обеспечивает открытость системы за счет совместного и повторного использования доступных онтологий.

5. Разработана основанная на онтологиях концептуальная модель профиля пользователя, обеспечивающая персонифицированную информационную поддержку за счет выявления предпочтений и интересов пользователя на основе аккумулированной информации.

6. На основе разработанных сценариев работы, алгоритмов и моделей под руководством и при участии автора были созданы промышленные приложения для оценки качества научно-технических проектов и интеллектуального доступа к корпоративному репозиторию. Эффективность используемых решений подтверждается сравнением получаемых результатов с результатами работы других известных систем.

Библиография Пашкин, Михаил Павлович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Алгоритм нечеткого сравнения строк. URL: http://pcmagazine.ru/ archive/ 9809/099828.asp, 2005.

2. Баранов Ф.Н., Домарацкий А.Н., Ласточкин Н.К., Морозов В.П. Процесс разработки программных изделий. М: Наука, Физматлит, 2000. 176 С.

3. Волков И., Галахов И.: Архитектура современной информационно-аналитической системы. Директор информационной службы. 2002. №3. С. 15-24.

4. Гаврилова Т.А. Использование онтологий в системах управления знаниями. Труды Международного конгресса «Искусственный интеллект в XXI веке». Россия, Дивноморское, 2001. С. 21—32.

5. Гаврилова Т.А. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем. Новости искусственного интеллекта, № 2,2003. С. 24-30.

6. Городецкий В.И., Карсаев О.В., Котенко И.В., Хабалов А.В.: MAS DK: инструментарий для разработки многоагентных систем и примеры приложений. Труды Международного конгресса «Искусственный интеллект в XXI веке». Россия, Дивноморское, 2001. С. 249—262.

7. Городецкий В., Самойлов В., Малов А. Технология обработки данных для извлечения знаний: Обзор состояния исследований. Новости искусственного интеллекта, № 3-4, 2002.

8. Городецкий В., Карсаев О., Самойлов В. Многоагентная технология принятия решений в задачах объединения данных. Труды СПИИРАН, №1, 2003.

9. Зильбербург Л.И., Молочник В.И., Яблочников Е.И. Реинжиниринг и автоматизация технологической подготовки производства в машиностроении II СПб: "Компьютербург", 2003. С. 152.

10. Истомин Е.П., Неклюдов С.Ю. Программирование на алгоритмических языках высокого уровня: Учебник. СПб.: Изд-во Михайлова В.А., 2003. -719 С.

11. Келеберда И.Н., Лесная Н.С., Репка В.Б.: Использование мультиагентного онтологического подхода к созданию распределенных систем дистанционного обучения. Образовательные технологии и общество, 7(2) 2004, ISSN 1436-4522, С. 190-205.

12. Кнут Д. Искусство программирования для ЭВМ. М.: Мир, 1976. Т.1. 735 С.

13. Котенко И.В. Многоагентные технологии анализа уязвимостей и обнаружения вторжений в компьютерных сетях // Конфидент, № 2, С.72-76; № 3, С.78-82. 2004.

14. Ларичев О.И. Наука и искусство принятия решений. М.: Наука, 1979.200 С.

15. Ларичев О.И., Мечитов А.И., Мошкович Е.М., Фуремс Е.М. Выявление экспертных знаний. М.: Наука, 1989. 129 С.

16. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. М.: Наука, 1996. 208 С.

17. Лескин А.А., Мальцев В.Н. Системы поддержки управленческих и проектных решений. Л: Машиностроение. Ленинградское отделение, 1990,167 С.

18. Ли И.В., Ронжин А.Л., Карпов А.А.: Онтология проблемы интегрального понимания речи. // Труды СПИИРАН / Под ред. P.M. Юсупова, СПб.: Наука, 2004. Вып. 2. Т. 1. С. 194-204.

19. Методы автоматического распознавания речи: в 2-х кн. / Под ред. У. Ли. — М.: Мир, 1983. С. 716.

20. Овсянников Е.К., Мозгирев Б.Т.: К вопросу о выборе математических моделей для систем поддержки принятия решений. // Труды СПИИРАН /

21. Под ред. P.M. Юсупова, СПб.: Наука, 2004. Вып. 2. Т. 1. С. 36-46.

22. Павлов А.В.: CRM и владение ключевой стратегической информацией. Открытые системы, 2003. № 7-8.

23. Попов Э.В.: Экспертные системы реального времени. Открытые системы, 2(10), 1995.

24. Попов Э. В., Фоминых И.Б., Кисель Е.Б., ШапотМ.Д.: Статистические и динамические экспертные системы. М: Финансы и статистика, 1996. С. 320.

25. Попов Э. В.: Корпоративные управления знаниями // Новости искусственного интеллекта, 2001. Июль. С. 1А—25.

26. Справочник по искусственному интеллекту / Под ред. Д.А.Поспелова. М.: Радио и связь, 1990. Кн. 2. С. 304.

27. Рахманова И.О. Методы и модели интеллектуальной поддержки группового принятия решений в сложных организационно-технических системах // Информационные технологии и интеллектуальные методы. СПб.: СПИИРАН, 1996. С. 6-21.

28. Саати Т. Принятие решений. Метод анализа иерархий. М.: Радио и связь, 1993.350 С.

29. Скороходько Э. Ф.: Семантические сети и автоматическая обработка текста.-Киев, 1983.- 112 С.

30. Смирнов А.В., Левашова Т.В., Пашкин М.П., Шилов Н.Г.: Онтолого— ориентированный многоагентный подход к построению систем интеграции знаний из распределенных источников. Информационные технологии и вычислительные системы, 2002. № 1. С. 62—82.

31. Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В.: Онтологии в системах искусственного интеллекта: способы построения и организации. Новости искусственного интеллекта, 2002. № 1. Часть 1. 3—13. № 2. Часть 2. С. 3—9.

32. Тарасов В.Б. Эволюционная семиотика и нечеткие многоагентные системы основные теоретические подходы к построению интеллектуальных организаций // Информационные технологии и вычислительные системы, 1998. № 1.С. 54-68.

33. Тимофеев А.В. Архитектура и принципы построения мульти-агентных телекоммуникационных систем нового поколения // Труды 11-ой Всероссийской научно-методической конференции "Телематика-2004". Санкт-Петербург, 7-10 июня 2004 г. Том 1. С. 172-174.

34. Тимофеев А.В. Адаптивное и интеллектуальное управление в мульти-агентных инфокоммуникационных сетях // Сборник докладов 2-ой Всероссийской научной конференции «Управление и информационные технологии». Пятигорск, 21-24 сентября 2004 г. С. 115-118.

35. Черняк Д.: Библиотека знаний Сус // Открытые системы, 2002. № 11. С. 18-21.

36. Abbattista F., Degemmis М., Fanizzi N., Licchelli О., Lops P., Semeraro G., Zambetta F.: User Profiles for Content-Based Filtering in e-Commerce, In Proceedings AI Workshop su Apprendimento Automatico: Metodi e Applicazioni. Sienna, Italy. 2002.

37. Adomavicius G., Tuzhilin A.: Using Data Mining Methods to Build Customer Profiles. IEEE Computer, Vol. 34(2). February 2001, pp. 74-82.

38. Проекты, посвященные многоагентным системам. Europe's Network of Excellence for Agent-based Computing. URL: http://www.agentlink.org/resources/ agentproiects-db.html, 2005.

39. Aguirre J. L., Brena R., Cantu F.J.: Multiagent-Based Knowledge Networks. Expert Systems with Applications, 2001. V. 20. pp. 65—75.

40. Проект Advanced Knowledge Technologies (АКТ). URL: http://www.aktors.org/akt/. 2005.

41. Ambroszkiewich S., Nowak Т., Mikulowski D., Rozwadowski L.: A concept of Agent Language in Agentspace. Proceedings of the Second International Workshop of Central and Eastern Europe on Multi-Agent Systems (CEEMAS'2001), Krakow, Poland, 2001.

42. Anken C.S.: Information Understanding // Introduction for 5th Anniversary Information Workshop. The Information Institute. Air Force Research Laboratory (AFRL) Information Directorate. Rome, NY, USA, 2002.

43. Рабочие документы унифицированного языка моделирования поведения агентов. URL: http://www.auml.org/auml/documents/main.shtml, 2005.

44. Barclay R.O., Murray Р.С.: What is knowledge management? URL: http://www.media-access.c0m/classif1cati0n.html#classifying, 2005.

45. Baumeister, H.: Customer relationship management for SMEs. In Proceedings of the 2nd Annual Conference eBusiness and eWork e2002. Prague, Czech Republic, October 16-18, (2002).

46. Becerra-Fernandez I.: The Role of Artificial Intelligence Technologies in the implementation of People-Finder Knowledge Management Systems. Knowledge-Based Systems. Elsevier Science B.V., V. 13, 2000. pp. 315—320.

47. BlytheJ., KimJ., Ramachandran S., GilY.: An integrated environment for knowledge acquisition, in: Proc. of the Int. Conf. on Intelligent User Interfaces (Santa Fe, New Mexico, January 2001) pp. 13-20.

48. BrezillonP.: Context in Problem Solving: a Survey // The Knowledge Engineering Review, 1999. Vol. 14. № 1. pp. 1—34.

49. Brustoloni J.C.: Autonomous Agents: Characterization and Requirements. Technical Report CMU-CS-91-204, School of Computer Science, Carnegie Mellon University, November 1991.

50. Caddy, I.: Moving from Mass Production to Mass Customization: the Impact on Integrated Supply Chains. In: proceedings of the Workshop on Mass Customization Management (MCM 2000), University of Wollongong, Australia. (2000) (Electronic Proceedings).

51. Chen H.: Knowledge Management Systems: A Text Mining Perspective, in Knowledge Computing Corporation. URL: http://dlist.sir.arizona.edu/ archive/ 00000483/01 /chenKMSi.pdf, 2001.

52. Chidlovskii В., Glance N.S., Grasso M.A.: Collaborative Re-Ranking of Search Results. Proceedings of the AAAI-2000 Workshop on AI for Web Search. Austin, Texas, 2000.

53. Chirita P.A., Olemedilla D., Nedjl W.: PROS: A Personalized Ranking Platform for

54. Web Search. W.Nejdl and P.De Bra (Eds.): AH 2004, LNCS 3137, pp 34-43,2004

55. Hotho A., Maedche A., Staab S.: Ontology-based text clustering. In Proceedings of the IJCAI-001 Workshop "Text Learning: Beyond Supervision", August, Seattle, USA, 2001.

56. COGITO: E-Commerce with Guiding Agents Based on Personalised Interaction Tools. URL: http://www.ipsi.fraunhofer.de/delite/projects/cogito/index.html, 2005.

57. Корпоративный сайт компании Cycorp. URL: http://www.cyc.com/, 2005.

58. Reference description of the ontology markup language, eds. by van Har-melen F., Horrocks I. URL: http://www.daml.org/2001/03/reference, 2005.

59. DAML Ontology language. URL: http://www.daml.org/2000/10/daml-ont.html, 2005.

60. Davenport Т.Н.: Knowledge Management Case Study: Knowledge Management at Hewlett-Packard. URL: http://www.bus.utexas.edu/kman/hpcase.htm, 2005.

61. Davenport Т.Н.: Knowledge Management Case Study: Knowledge Management at Microsoft. URL: http://www.bus.utexas.edu/kman/microsoft.htm, 2005.

62. Day G.S., Hubbard K.: Customer Relationships go Digital. Business Strategy Review, Vol. 14, March 2003, pp. 17-26.

63. Корпоративный сайт компании Empolis. URL: www.empolis.co.uk, 2005.

64. Foundation for Intelligent Physical Agents (FIPA) Documentation. URL: http://www.fipa.org/specs/fipa00006/, 2005.

65. Средство разработки многоагентных систем FIPA-OS toolkit. URL: http://www.emorphia.com/research/about.htm, 2005.

66. Franklin S.: Is it an Agent, or just a Program?: A Taxonomy for Autonomous Agents. Proceedings of the Third International workshop on Agent Theories, Architectures, and Languages. Springer-Verlag, 1996.

67. Freyne J., Smyth В.: An Experiment in Social Search. W.Nejdl and P.De Bra (Eds.): AH 2004, LNCS 3137, pp 95-103, 2004

68. Garlatti S., Iksal S.: A Semantic Web Approach for Adaptive Hypermedia. In Proc. Workshop on Adaptive Hypermedia and Adaptive Web-Based Systems. 2003: Technische Universteit Eindhoven, pp. 5-14.

69. Google поисковая система. URL: www.google.com, 2005.

70. Google Desktop Search. URL: http://desktop.google.com/, 2005.

71. Gray P.M.D., Hui K., Preece A.D.: Finding and Moving Constraints in Cyberspace. AAAI-99 Spring Symposium on Intelligent Agents in Cyberspace. Stanford University, California, USA. AAAI Press, 1999. pp. 121—127.

72. Greenstone digital library software. URL: http://www.greenstone.org/cgi-bin/library, 2005.

73. Guarino N.: Formal Ontology and Information Systems. Proceedings of FOIS'98. Trento, Italy. Amsterdam: IOS Press, 1998. pp. 3—15.

74. Han J., Kamber M.: Data Mining: Concepts and Techniques. San Francisco: Morgan Kaufmann Publishers (2001).

75. Hendler J., McGuinness D.L.: The DARPA Agent Markup Language. IEEE Intelligent System, 2000. V. 15 (6).

76. Hidalgo J.: Text Mining and Internet Content Filtering. URL: http://www.esi.uem.es/~jmgomez/tutorials/ecmlpkdd02, 2002.

77. Корпоративный сайт компании InfoLoom. URL: www.infoloom.com, 2005.

78. Средство разработки многоагентных систем Zeus. URL: http://more.btexact.com/proiects/agents/zeus/, 2005.

79. Jacobs N., Shea R.: The Role of Java in InfoSleuth: Agent-Based Exploitation of Heterogeneous Information Resources. Technical Report, Microelectronics and Computer Technology Corporation, 1996.

80. Средство разработки многоагентных систем Java Agent DEvelopment Framework (JADE). URL: http://jade.tilab.com/, 2005.

81. Домашняя страница Кестрелевского института. URL: www.kestrel.edu, 2005.

82. KostoffD., LosiewiczP., OardD.: Since and Technology Text Mining Basic Concepts. Technical Report A688514. AFRL, Rome NY (2003), 28. URL: http://www.stormingmedia.us/68/6885/A688514.html. 2005.

83. Домашняя страница проекта LOOM. URL: http://www.isi.edu/isd/LOOM/ LOOM-HOME.html, 2005.

84. LosiewiczP., OardD., KostoffR.: Text Data Mining to Support Science and technology management // Journal of Intelligent Information Systems, Vol.15, № 2 Sept/Oct (2000) pp. 99-119.

85. Lotus Discovery Server, URL: http://www-306.ibm.com/software/lotus/ support/discovery/support.html, 2005.

86. Maedche A., Staab S.: Discovering conceptual relations from text. In Proceedings of ECAI-2000. IOS Press, Amsterdam, 2000.

87. Группа поддержки стандартов взаимодействия систем мобильных агентов. URL: http://sun 195 .iit.unict.it/MAP/masif.html. 2005.

88. Средство разработки многоагентных систем Massive Multiagent Kit. URL: http://www.gsigma-grucon.ufsc.br/massyve/mkit.htm. 2005.

89. MenaE., KashyapV., ShethA., Illarramendi A.: OBSERVER: An Approach for Query Processing in Global Information Systems Based on Interoperation across Preexisting Ontologies. Distributed and Parallel Databases, 2000. V. 8(2). pp. 223-271.

90. Microsoft ActiveX Data Objects. URL: http://msdn.microsoft.com/library/ default.asp?url=/library/en-us/ado270/htm/dasdkadooverview.asp, 2005.

91. Moench E., Ullrich M., Schnurr H.-P., Angele J. SemanticMiner Ontology-Based Knowledge Retrieval. In: Special Issue of selected papers of the WM2003 in the Journal of Universal Computer Science (J.UCS), Vol. 9, No. 7, pp. 682-696, 2003.

92. Microsoft SharePoint Portal. URL: http://office.microsoft.com/, 2005.

93. Nodine M. H., Unruh A.: Facilitating Open Communicating in Agent Systems: the InfoSleuth Infrastructure. Technical Report MCC-INSL-056-97, Microelectronics and Computer Technology Corporation, Austin, Texas, 1997. 78759.

94. Ontology Inference Layer. URL: http://www.ontoknowledge.org/oil/, 2005.

95. Olin J.G., Greis N.P., Kasarda J.D.: Knowledge Management Across Multi-tier Enterprises: the Problem of Intelligent Software in the Auto Industry // European Management Journal, 1999. 17(4). pp. 335—347.

96. Ontoprise: Semantics for the WEB. URL: http://www.ontoprise.de/products/ ontoedit en, 2005.

97. Онтология «Производительность». URL: http://www.kestrel.edu/DAML/ 2000/12/CAPACITY.daml. 2005.

98. Корпоративный сайт компании Ontopia. URL: www.ontopia.net, 2005.

99. OWL Web Ontology Language. URL: http://www.w3.org/TR/2004/ REC-owl-ref-20040210/, 2005.

100. Parrott L., LacroixR., WadeK.M.: Design considerations for the implementation of multi-agent systems in the dairy industry. Computers and Electronics in Agriculture, 38(2) pp. 79-98,2003.

101. Peter W.H. van der Putten, Joost N. K., Gupta A.: Why the Information Explosion Can Be Bad for Data Mining, and How Data Fusion Provides a Way Out. Second SIAM International Conference on Data Mining, Arlington, April 11-13,2002.

102. Protege-2000 Project. USA, Stanford Medical Informatics at the Stanford University School of Medicine. URL: http://protege.stanford.edu/, 2005.

103. Resource Description Framework. URL: http://www.w3.org/RDF/. 2005.

104. RDF Vocabulary Description Language. URL: http://www.w3.org/TR/rdf-schema/, 2005.

105. Методология создания программного обеспечения Rational Unified Process. URL: http://www-306.ibm.com/software/awdtools/rup/, 2005.

106. Schwartz D.G., Te'eni D.: Trying Knowledge to Action with kMail. IEEE Intelligent System Applications. V. 15, 2000, pp. 33—39.

107. SearchServer/KnowledgeServer. URL: http://www.hummingbird.com/products/ searchserver/index.html, 2005.

108. Домашняя страница консорциума Semantic Web. URL: http://www.semanticweb.org/, 2005.

109. Smirnov A., PashkinM., ChilovN., LevashovaT.: Constraint-Based Contract Net Protocol. Proceedings of the Fifth International Conference on Enterprise Information Systems (ICEIS 2003). April 23—26, 2003. Angers, France. V. 2. pp. 549— 556.

110. Smith R.: The contract net protocol: High-level communication and control in a distributed problem solver. IEEE Transactions on Computers. 1980, V. 29, 12. pp. 1104—1113.

111. Hans Holger Rath: Technical Issues on Topic Maps. URL: http://www.step.de/tom-hhr-paper.pdf, 2005.

112. Проект TRELLIS. URL: http://www.isi.edu/expect/proiects/trellis/index.htmL 2005.

113. Tristram С.: Common Knowledge. CIO Web Business Magazine, September, 1998. URL: http://www.cio.com/archive/webbusiness/090198 booz.html, 2005.

114. Tsui E., Garner B. J., Staab S.: The Role of Artificial Intelligence in Knowledge Management. Knowledge-Based Systems, 2000. V. 13. pp. 235—239.

115. Wexelblat A., Maes P.: Footprints: History-Rich Web Browsing. In: Proceedings of Third International Conference on Computer-Assisted Informational Retrieval. (1997) Montreal, Quebec, Canada

116. K. Wiig. Comprehensive knowledge management. Working Paper KRI #19994, Revision 2. URL: http://www.krii.com/downloads/comprehensive km.pdf, 2005.

117. K. Wiig.: Knowledge Management Has Many Facets. Short Note from Knowledge Research Institute, Inc. URL: http://www.krii.com/downloads/ Four KM Facets.pdf, 2005.

118. Wooldridge M.J., Jennings N.R.: Agent Theories, Architecture, and Languages: A survey. In: Intelligent Agents: Proceedings of the Workshop on Agents Theories, Architecture, and languages (ECAI-94), Springer-Verlag, 1995. pp. 1—39.

119. WordNet — словарь лексики английского языка. Princeton University. Princeton, NJ. http://cogsci.princeton.edu/~wn/. 2005.

120. Индексирование телепрограмм. URL: http://video.google.com/, 2005.