Когнитивные агенты и системы распределенной обработки информации и управления объектами в динамически изменяющихся условиях

Цзя Лу

автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.16, диссертация на тему:Когнитивные агенты и системы распределенной обработки информации и управления объектами в динамически изменяющихся условиях

кандидата технических наук: Цзя Лу
город: Санкт-Петербург
год: 2011
специальность ВАК РФ: 05.11.16
цена: 450 рублей

Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Когнитивные агенты и системы распределенной обработки информации и управления объектами в динамически изменяющихся условиях»

Автореферат диссертации по теме "Когнитивные агенты и системы распределенной обработки информации и управления объектами в динамически изменяющихся условиях"

ЦЗЯЛУ

Когнитивные агенты и системы распределенной обработки информации и управления объектами в динамически изменяющихся условиях

Специальность:

05.11.16- «Информационно-измерительные и управляющие системы (машиностроение)»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

1 7 ФЕВ 2011

Санкт-Петербург — 2011

4854346

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования "Санкт-Петербургский государственный политехнический университет".

Научный руководитель:

Доетор технических наук, профессор Шкодырев Вячеслав Петрович

Официальные оппоненты:

Доктор технических наук, профессор Дорогое Александр Юрьевич

Кандидат технических наук Серебряков Сергей Валерьевич

Ведущая организация:

Санкт-Петербургский институт информатики и автоматизации РАН

Зашита состоится 24 февраля 2011 г. в 16 час. на заседании диссертационного совета Д212.229.10 при ГОУ ВПО "Санкт-Петербургский государственный политехнический университет" по адресу: 195251, Санкт-Петербург, ул. Политехническая, дом 21, а. 9-121.

С диссертацией можно ознакомиться в фундаментальной библиотеке ГОУ ВПО "Санкт-Петербургский государственный политехнический университет".

Автореферат разослан «' 1» января 2011г.

Ученый секретарь диссертационного совета

Кудряшов Э.А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации.

Диссертация посвящена проблеме повышения эффективности информационно-измерительных и управляющих систем (ИИУС) комплексов технологических установок в изменяющихся условиях функционирования. Современные ИИУС технологических комплексов в промышленности и сфере услуг состоят из многих параллельно работающих подсистем. Полностью централизованный принцип координации подсистем в таких распределенных ИИУС признан непрактичным не только вследствие недостатков централизованного сбора информации, ее обработки и принятия решений, но также из-за недостаточной гибкости при координации компонент обработки информации и управления с учетом динамически изменяющихся условий. Полностью децентрализованная схема распределенных ИИУС также не обеспечивает оптимальное функционирование, поскольку при координации локально распределенных подсистем управления могут возникать серьезные проблемы из-за некорректной децентрализации.

Один из путей решения проблемы - использование многоагентного подхода при построении ИИУС, который позволяет успешно справляться с проблемой сложности и распределенности подсистем обработки информации и управления комплексами установок. Каждый агент такой системы способен автономно решать выделенные ему задачи в рамках отдельной установки. Агенты могут работать во взаимодействии, что позволяет системе в целом решать задачи, которые лежат за пределами возможностей индивидуального агента.

Когнитивные агенты, способные к автоматическому накоплению и использованию знаний в процессе работы, представляют следующий шаг в развитии распределенных ИИУС. Такие агенты обладают адаптивными способностями, что обеспечивает эффективную работу установок и комплексов в динамически изменяющихся условиях.

Цель диссертационной работы - разработка и исследование когнитивных агентов и систем, которые обеспечивают локальную автономность, гибкую координацию и адаптивность при распределенной обработке информации и управлении комплексом.

Для реализации этой цели в диссертационной работе были поставлены и решены следующие задачи:

1. Разработка модели и алгоритмов обработки информации и формирования поведения когнитивного агента при управлении технологическими процессами установки, а также архитектуры когнитивного агента, соответствующей этой модели.

2. Разработка модели коллективной работы когнитивных агентов с ресурсными ограничениями и организационной структуры многоагентной когнитивной системы,

способной обеспечить гибкое согласованное управление комплексом установок, каждая из которых управляется своим агентом.

3. Разработка и исследование многоагентных когнитивных систем обработки информации и управления комплексом фильтрации и распределения воды по потребителям и комплексом бойлер-турбинных установок тепловой электростанции с целью подтверждения эффективности предложенных вариантов когнитивных агентов и систем.

Методы исследования. При выполнении работы использовалась теория автоматического управления, теория многоагентных систем, когнитивные методы обработки информации, теория иммунных систем, методы обучения с подкреплением, генетические алгоритмы.

Научная новнзна исследования.

1. Разработан иммунно-генетический алгоритм, обеспечивающий адаптивность при регулировании технологических процессов, и обучаемая иммунологическая сеть, позволяющая выбирать нужные компоненты поведения в соответствии с текущей ситуацией. Новизна состоит в комбинировании иммунного и генетического алгоритмов, что обеспечивает уверенное нахождение глобального оптимума целевой функции за счет большего, чем при простом генетическом алгоритме разнообразия решений. Иммунологическая сеть является новым, обучаемым с помощью иммунно-гентического алгоритма, средством управления одновременно несколькими процессами.

2. Разработана модель формирования поведения когнитивного агента при координированном управлении технологическими процессами установки. Новизна состоит в том, что модель имеет два настраиваемых с помощью иммунно-генетического алгоритма уровня. На нижнем уровне используются адаптивные ПИД-регуляторы, а на верхнем - обучаемая иммунологическая сеть. Когнитивный агент, построенный по такой модели, может эффективно решать задачи управления установкой в условиях динамически изменяющегося окружения.

3. Разработана модель коллективной работы агентов и основанная на ней новая организационная структура когнитивной многоагентной системы управления распределенными установками комплексов. Новизна состоит во введении в модель ресурсных ограничений и использовании алгоритма обучения с подкреплением для определения оптимальной политики управления когнитивными агентами. Новая организационная структура системы, построенная на этой модели, поддерживает принципы иерархичности, открытости и гибкой координации.

Практическая значимость. На основе предложенных моделей, алгоритмов и результатов исследования могут быть разработаны программные средства

распределенного управления реальными бойлер-турбинными установками тепловой электростанции, а также установками комплекса фильтрации и распределения воды.

Реализация результатов работы. Разработанные модели формирования поведения когнитивных агентов и их коллективной работы, а также архитектура агента и организационная структура когнитивной многоагентной системы использованы в курсе «Когнитивные многоагентные системы обработки информации и управления» в СПбГПУ. Обсуждается возможность использования результатов диссертационного исследования при проектировании новых средств распределенной обработки информации и управления. Основные положения, выносимые на защиту:

1. Иммунно-генетический алгоритм, обеспечивающий адаптивность регулирования технологических процессов, и иммуннологическая сеть, позволяющая выбирать нужные компоненты поведения при управлении объектом в изменяющихся ситуациях.

2. Модель формирования поведения когнитивного агента с двумя уровнями и его архитектура, обеспечивающая координированное управление процессами установки.

3. Модель коллективной работы агентов при ресурсных ограничениях и организация когнитивной многоагентной системы управления распределенными установками на основе принципов иерархичности, открытости и адаптивности.

4. Два варианта прикладных когнитивных многоагентных систем управления распределенными установками, построенные с применением разработанных моделей и алгоритмов, архитектуры агентов и организации многоагентной системы.

Апробация результатов работы. Результаты исследований, полученные в диссертации, докладывались и обсуждались на научных семинарах и конференциях:

• 12-й Международной студенческой олимпиаде по автоматическому управлению, Санкт-Петербург, 2008 г.;

• Научно-техническом семинаре «Distributed Intelligent System and Technology Workshop», Санкт-Петербург, 2008 г.;

• Научно-техническом семинаре «Distributed Intelligent System and Technology Workshop», Санкт-Петербург, 2009 г.;

• 13-й Международной студенческой олимпиаде по автоматическому управлению, Санкт-Петербург, 2010 г.

Публикации. По теме данной работы опубликовано 7 печатных работ, в числе которых одна статья - в научном издании, входящем в Перечень ВАК (Научно-технические ведомости СПбГПУ, №4(82), 2009 г.).

Структура и объем диссертационной работы. Работа объемом 145 стр. содержит введение, пять глав, заключение и список литературы из 114 наименований.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, сформулированы цель диссертационной работы и решаемые задачи, определены научная новизна и практическая ценность работы.

В первой главе конкретизирована цель диссертации, проведен обзор состояния исследований в области автоматизации управления объектами, выделены основные направления исследований и формализована постановка задач, решаемых в диссертации.

Анализ тенденций развития средств управления комплексами установок, например, для очистки и распределения воды, генерации пара в бойлерах тепловых электростанций и пр., показал, что управление должно быть децентрализованным, локально автономным, с гибкой координацией и адаптацией, поскольку эти установки должны работать в условиях динамически измененяемой среды. С целью достижения этих качеств предлагается применять агентно-ориентированный и когнитивный подходы.

В рамках диссертации предлагаются новые модели и архитектурные решения для когнитивных агентов и многоагентных систем обработки информации и управления. Согласно цели диссертации и предлагаемым подходам, сформулированы следующие постановки главных теоретических задач, которые предполагается решить в диссертации.

Задача формирования поведения когнитивного агента. Когнитивный агент рассматривается как автономная адаптивная система с сетевой структурой, управляющая несколькими связанными процессами одной установки. Когнитивность означает способность агента формировать поведение, позволяющее ему рационально реагировать даже на непредвиденную ситуацию, определяемую текущими значениями параметров процессов. Предлагаемая реализация такого поведения основана на искусственных иммунологических сетях. Поведение агента определяется при активации сети, узлы которой представляют собой компоненты поведения, а связи между узлами -настраиваемые веса, определяющие степень активизации при обращении к данному компоненту соседнего активированного компонента поведения.

Исходно известны:

- регулируемые параметры процессов

- компоненты поведения (узлы сети) {В1,В2,...,ВМ};

- структурные связи меду узлами сети [с/,]мгм

Требуется:

- оптимизировать переходный процесс при регулировании каждого из параметров по критерию качества переходного процесса 7 = ^°[й>,|е(?)| +ау:2(У)](Л+ <у3/п , где е(!) -

ошибка; .х(<)- переходный процесс по регулируемому параметру, /„- время переходного процесса, (о1, со2 и а>3 - весовые коэффициенты;

- оптимизировать взаимодействие между компонентами поведений {В\,Вг,...,Вм} по критерию вероятности активации наилучшего компонента поведения в текущей ситуации путем нахождения наилучших параметров связей между узлами [с,;/]*^ •

Задача управления коллективной работой агентов. Коллектив когнитивных агентов представляет собой многоагентную систему (рис. 1).

Рис. 1. Структура и параметры многоагентной системы

Многоагентная система, состоящая из взаимосвязанных агентов {Ag|,Ag2,...,Agn} , и среда, включающая множество управляемых объектов {С0ьС02,...,С0„}, определяются следующим образом.

Пусть 5 = {.у,,.?,,...,^} - множество состояний среды. В сложных средах количество состояний может быть большое, но конечное. Множество состояний может быть структурировано путем введения макро-состояний, содержащих элементарные состояния.

Обозначим А = {АпЛ2,...,Аа} - множество действий группы а, где А, = {а|(,а2(,...,а„(} - множество действий г'-го агента в различных состояниях.

Введем £ = П,-4„ - множество возможных сообщений при переговорах между агентами и - множество сообщений ¡-го агента и 7*(л) - ограничения на использование ресурсов в состоянии л.

Обозначим В = П В, - множество внутренних ментальных состояний группы агентов (убеждений). Компонентами этого множества В1 = {/>'} являются множества убеждений го агента, а Ь\ - убеждение агента в момент времени I, полученное из серии наблюдений и коммуникационных сообщений агента до момента г.

Используем функцию Я : х А х X -> для оценки действий на множестве всех состояний и возможных действий и коммуникаций в группе.

Будем считать, что поведение системы характеризуется «политикой» ж : 5 А , которая рассматривается как некоторое отображение состояний в действия для всех агентов, входящих в группу.

Исходно известны:

- множество действий агентов в группе а, т.е. А = {А1, Аг.....Аа};

- множество возможных сообщений при переговорах между агентами

- множество ограничений на использование ресурсов Т(.ч).

Требуется организовать управления коллективной работой группы агентов в условиях ограниченных ресурсов (например, времени на принятие решений), т.е. определить наилучшую политику агентов к.

Расширенное определение политики агента включает политику действий жи : В1 —> А и координации жа : В, —> . Можно определить объединенные политики ж л и жг, как комбинированные политики всех агентов в группе а. Также можно определить политику в целом ж,, как пару < жИ ,жа>, и комбинированную политику в целом ж, как пару < жЛ, яъ >. Тогда можно ввести понятие оптимальной политики

ж' = ах&та\Iжл,ж,.)

Ы 1=0

где время поиска < г, при т, е Т(.<;) и Е{) - ожидаемая оценка действий во времени .

Во второй главе рассмотрен новый иммунно-генетический алгоритм и иммунологическая сеть, которые используются как средства для реализации адаптивного поведения когнитивного агента в динамически изменяющихся условиях.

Иммуппо-гепетический алгоритм (ИГА) является итерационным алгоритмом случайного поиска решения оптимизационной проблемы с эвристиками, обеспечивающими сокращение числа итераций за счет направленного перебора и нахождение глобального экстремума за счет разнообразия компонентов решения.

ИГА сочетает иммунный алгоритм (ИА) генетический алгоритм (ГА). ИА построен на основе клонально-селекционной теории Банета, формализующей выбор В-клеток, порождающих антитела в ответ на вторгающийся антиген, и клонирование этих клеток для повышения плотности антител при иммунном ответе. В ИА антиген - входной параметр, а антитело - компонент решения (или поведения). В зависимости от величины входного параметра ИА регулирует плотность вероятности применения компонент решения и их разнообразие. ГА использует специальные эвристики кроссовера, мутации и

селекции для управления процессом случайного поиска оптимального решения. В классическом ГЛ трудно поддерживать разнообразие популяции индивидуумов, обеспечивающее уменьшение числа попыток найти наилучшую часть пространства поиска. ИА, наоборот, использует разнообразие, которое позволяет популяции адаптироваться к изменениям среды. Объединение ИА с ГА позволяет использовать локальную информацию, которая вводится в параллельный глобальный процесс поиска оптимального решения задачи, и помогает избежать повторов или бесполезных шагов при поиске, так как кроссовер и мутация являются «слепыми» действиями.

Можно выделить семь шагов алгоритма (рис.2): (1) ввод входного значения и различных ограничений при оптимизации; (2) создание исходного множества компонентов решения; (3) вычисление значения целевой функции и фитнес функции; (4) обновление памяти решений; (5) использование нечеткого правила для коррекции множества компонентов решения; (6) выполнение операций кроссовера и мутации для получения следующего компонента решения; (7) останов процесса.

В ИГА компонент решения производит соответствующий входному параметру результат решения, обозначенный как х,,, который входит в фитнес функцию решения (функцию соответствия, определяющую качество решения), обозначенную как/(.х¡).

Рис. 2. Схема иммунно-генетического алгоритма Вычислительная процедура ИГА определяется следующим образом. Инициализация и кодирование исходного множества компонентов решения. Задается размер множества, т.е. количество компонент решения N. Каждый компонент решения х.

содержит одинаковое количество параметров решения, т.е. х, = {е/;,...с/,,}- Конкретный набор значений этих параметров рассматривается как код компонента решения. При формировании исходного множества код каждого из компонентов решений выбирается случайно с учетом заданных диапазонов параметров решения.

Вычисление значений целевой функции. Целевая функция ./(х) определяется в соответствии с конкретной задачей и содержит параметры ее решения.

Конструирование фитнес функции. Фитнес функция вычисляется в соответствии с выражением

= Г' J{x) + А

где У(л:) - целевая функция; А - положительная константа, которая используется, чтобы избежать переполнения при близком к нулю значении числителя.

Обновление памяти решений. Память решений организована как стек размерностью N. В нее добавляются компоненты решений с большим значением фитнесса. Поскольку память ограничена размерностью Ы, вновь полученные компоненты решений могут заменить существующие по правилу

Если ./(хЛЧ|) > Jnm(х,), то хд;)| =х,и уничтожить хм.

Коррекция множества компонентов решения. Предположим, что N компонент решения входят в несвободное множество X. Соответствие решений вычисляется через дистанцию компонентов решения во множестве X.

Вектор дистанции между значениями фитнес функции вычисляется как

Ж) = ¿1 Ж)-/(*,)!•

м

Для вычисления соответствия можно использовать выражение

1

0(х,) =

Вероятность выбора компонента решения, основанная на векторе дистанции, может быть вычислена как

Чем больше компонентов решения, которые похожи на компонент г, тем меньше вероятность, с которой компонент г выбирается в ансамбле X, т.е.

р(х;)< В Рс(х:)меньше; р(х1 )> В —> Рс)больше. (В - константа, если /?(*, ) = В является средним значением) ю

Такой выбор решений, не похожих на компонент обеспечивает большее разнообразие множества компонентов решений.

Получение новых компонентов решений. На основе родительских компонентов решений генерируются новые коды компонентов решения с использованием операторов кроссовера и мутации. Кроссовер реализует перекрестное замещение групп параметров компонентов решений относительно выбранной точки кроссовера, а Гауссовская мутация используется, чтобы уменьшить неопределенность, возникающую при кроссовере. Эти операции производятся на базе двух уравнений:

X, = пГ, + (1 - г)х1 XI = (1 - г)х, + ГХ1

где х>,х/ - родительские группы параметров; х],х\ - рожденных от родителей группы

параметров; г - случайное число (между 0 и 1). Операция мутации выполняется на основе Гауссовской мутации, которая описывается уравнением:

х =х + а^/(х)С( 0,1) где а е [-1,1]; 6(0,1) - гауссовский оператор.

Проверка на останов по критерию сходшюсти. Сходимость процесса поиска определяется по стабильности генерируемых компонент решения, которая наступает, когда процесс достигает глобального оптимума, т. е. х, (/) = .г, (/ +1).

Обучаемая иммунологическая сеть (ИЛС) обеспечивает выбор подходящего поведения когнитивного агента в текущей ситуации. Это поведение определяется при активации сети, узлы которой представляют собой компоненты поведения, а связи между узлами - настраиваемые веса, определяющие степень активизации при обращении к данному компоненту соседнего активированного компонента поведения.

Динамика ИЛС, содержащей N связанных компонентов поведения, может быть описана, используя параметр активации г-го компонента поведения, который обозначен как а,, и соответствует модели, определяемой системой уравнений: с!а (7) " "

—^ = Да,(0)~1>- /(а,(0) + м,У =

ш м /=|

/(а, (0) --!-,

1 + ехр(0.5-а,.(/))

где N - количество компонент поведения, т ('(, т ^ и /и, - степени стимуляции и

подавления активации между компонентами у и (', компонентом г и детектированным входным параметром соответственно. Первый второй термы в правой части первого уравнения определяют стимуляцию и подавление от других компонентов поведения

п

соответственно. Третий терм представляет стимуляцию от входного параметра, а четвертый терм - фактор диссипации. Второе уравнение определяет функцию преобразования параметра активации, обеспечивающую устойчивость процесса селекции поведения.

Выбор наилучших компонентов поведения выполняется в соответствии с величиной активации компонент в сети. Настройка ИЛС может быть произведена с использованием ИГА, который находит наилучший по целевой функции компонент поведения, составленный из степеней стимуляции и подавления т'р,т"(,,т1, г, у = 1,...,N .

В третьей главе представлен когнитивный агент, который автономно обрабатывает информацию и управляет отдельной установкой комплекса. Агент имеет двухуровневую архитектуру: нижний уровень реализован на агентах-контроллерах, регулирующих отдельные технологические процессы, а верхний координирующий уровень - на сети, активизирующей соответствующий агент-контроллер. Когнитивный агент может управлять установкой в соответствии со своим назначением или общей целью комплекса.

Разработана модель формирования поведения когнитивного агента, управляющего установкой. Предлагаемая модель является двухуровневой. Верхний уровень построен на базе иммунологических сетей (ИЛС), а нижний - на базе ПИД-регуляторов.

На нижнем уровне модели использован адаптивный ПИД-регулятор с автоматической настройкой параметров через ИГА. Это позволяет значительно повысить эффективность регулирования технологических процессов при больших внешних возмущениях. Процедура настройки ПИД-регулятора с использованием ИГА требует соответствующего представления и кодирования компонентов решения. Компонент решения для случая ПИД-регулятора формируется группой параметров из трех реальных чисел, соответствующих трем коэффициентам (Кр, К, и А'/), которые ищутся, чтобы настроить регулятор на требуемый переходный процесс.

Определим набор множества компонентов решения размерностью N . Для этого используется генератор случайных чисел, с помощью которого формируется N групп коэффициентов Кр, К/ и Кц (всего 3N значений). Коэффициенты Кр, К, и /О генерируются в форме матрицы ЗхА':

К =

К,.\ К,! К,,г К,г К^

В этой матрице каждая строка соответствует группе параметров (компоненту решения), а матрица в целом представляет начальный набор групп параметров.

Целевая функция для этого случая имеет вид У = ^[й^е(Г)| + й>2дг2(/)}Л + йу„ , где е(1) - ошибка; х(Г) - переходный процесс по регулируемому параметру, 1и - время переходного процесса, ц, а>2 и сог - весовые коэффициенты

На верхнем уровне модели использована адаптивная ИЛС, настраиваемая с использованием ИГЛ. Компонентами поведения ИЛС являются ПИД-регуляторы, Каждый из которых регулирует отдельный процесс. ИЛС обеспечивает выбор процесса, состояние которого должно быть изменено в текущей ситуации.

На рис. 3 приведена ИЛС для формирования поведения мобильного робота, который должен двигаться в помещении не мешая человеку и идти на зарядку аккумулятора, если уровень энергии низкий. Здесь выделены 3 входных параметра и 4 компонента поведения, которые связаны в сеть, которая может настраиваться путем установки параметров стимуляции или подавления активности отдельных компонентов поведения.

Компонент 1 Компонент 2

Бюа Поворот |

справа направо

Человек Маневр 1

спереди уклонения

Энергия Искан,

Ш1Ш1Я oaiy

Энергии Работать 2

высока« дальше

Компонент Я Параметр !

Параметр 2

Компонент 4 Параметр 3

ha u спрайт

Человек спереди

Энергия высокая или шпкая

Рис. 3. ИЛС для формирования поведения мобильного робота При использовании ИГА находится наилучший в данной ситуации компонент поведения, определяемый набором степеней стимуляции и подавления m*JI,m'jl,mi,i,j = \,...,N . Процедура настройки этой группы параметров похожа на

описанную процедуру для настройки ПИД-регулятора, но с целевой функцией, определяющей качество выбранного поведения, т.е.

J(m.) = arg тах(/й, + т~ - т~).

I»)

Четвертая глава описывает процесс разработки многоагентной системы, модель коллективной работы агентов, а также подходящую методологию агентно-ориентированного проектирования и инструментальной среды проектирования и основополагающих принципов организации многоагентной системы.

Модель коллективной работы агентов, учитывающая ограничения реального времени на процесс принятия ими решений, описывается следующими множествами: GA0=(S, А, S, Р, Q, О, В, R, 7).

Входящие в модель множества имеют следующие описания.

- множество состояний среды и s,=f,'x.../„' состояние среды, являющееся факторизацией некоторых свойств среды fj (например, местности, расположения агентов и пр.). А = П,6„{Л! " кумулятивное действие группы, где = {a'j}"j_, - множество действий /-го агента. 2 = П,ч„£, - множество всевозможных сообщений между агентами и Г, - множество сообщений /'-го агента. Получаемая агентом информация используется ими для обновления данных о среде, составляющих убеждения агента. Функция Р: »S х А х —> 9if0 () определяет вероятностные характеристики среды.

Ее компоненты P(sl,a,sj) = Рг(6'"' = sJ /5" = sj,Л' = а)являются вероятностями того, что состояние среды станет sj , если в этом состоянии .5, группа агентов произведет групповое действие a. Q = П,6„ П, - множество наблюдений группой, где Q, = (о'} - множество

наблюдений, доступных г'-му агенту, которое может включать различную информацию о среде (показания сенсоров, реальное поведение других агентов и пр.). Набор функций О^: 5 х А -» О определяет вероятностное отображение множества состояний в множество наблюдений. Эти функции определяют вероятности того, что групповое наблюдение будет сое Ci, если состояние среды s и предыдущее групповое действие было а. В = Пй, - множество внутренних ментальных состояний группы, которые могут быть названы убеждениями (Beliefs - В). Компонентами этого множества В1 = {/>,'} являются множества убеждений ¿-го агента, а Ь\ - убеждение агента в момент времени t, полученное из серии наблюдений и коммуникационных сообщений агента до момента t. Используя множество наблюдений, можно представить множество убеждений г'-го агента, сформированное г'-м агентом за интервал времени до момента t, как В] =С1" х2", где П* и Е* есть множества всех возможных комбинаций, полученных за этот интервал наблюдений и сообщений. R:Sx АхЕ->9? - функция оценки действий на множестве всех состояний, возможных действий и коммуникаций в группе (поощрение или возврат). Г:5x9? ->9?[0,| -

ограничения на время принятия решений агентами в виде вероятностиPr(^ =r/5" =s,) того, что в состоянии sj е S для выбора для выбора действия дано г единиц времени.

Показано, что для нахождения оптимальной политики агента может быть построено соответствующее оптимальное уравнение Беллмана для оценки состояний. Интуитивно, оптимальное уравнение Беллмана выражает тот факт, что оценка состояния (убеждения) агента при оптимальной политике должна быть равна ожидаемому возврату для наилучшего действия при этом убеждении, т.е.

F'(B) = maxQ"' (В,А,£) = тах£\ = В, А, = Л,Х, = Е} = шахЕ{гм +гУ'(В„1)\В1 = В,А, = =1}

= та x£PBf[RAJ +уУ\В')]

iitilS)

Соответственно, для оценки действий агента при его текущих убеждениях может быть получена из уравнения

Q'(B,A,Z.) = E{rM + /max £)"(«,>,, Л', S')|B( = в,А,■ = А,1, =2}

= Z +/max Q'

в■ АХ

Для проектирования когнитивной многоагентной системы (MAC) выбрана среда MASDK (Multi-Agent System Development Kit) и P2P (Peer-To-Peer) агентская платформа. Низкоуровневые агенты-контроллеры разрабатываются и моделируются в среде Matlab/Simulink. Показано, что среда MASDK эффективна для разработки архитектуры MAC, сценариев коллективного поведения и протоколов координации агентов. Для разработки и отладки коммуникаций в многоагентной системе используется Р2Р агентская платформа, позволяющая организовать работу агентов MAC в компьютерной сети.

В питой главе рассмотрено применение разработанных моделей и методологии для проектирования и моделирования MAC промышленными объектами. Представлены результаты разработки и моделирования двух прикладных когнитивных MAC управления комплексом установок фильтрации распределения воды и комплексом бойлер-турбинных установок тепловой электростанции. Когнитивные агенты этих систем построены на моделях и алгоритмах, описанных в предыдущих главах.

Нижнеуровневые агенты-контроллеры каждого из когнитивных агентов регулируют уровни воды в резервуарах или давление пара в магистрали. Они адаптивно настраиваются с использованием ИГА, который находит для ПИД-регуляторов сочетание пропорциональной, интегральной и дифференциальной составляющих для оптимального регулирования процессами. Эксперимент по моделированию регулирования уровня воды в резервуаре при единичных возмущениях дал возможность сравнения классического

метода Зейглер-Никольса, нечетко-логического варианта и ИГА. Графики процесса регулирования, представленные на рис. 4, иллюстрируют все три варианта одновременно. Эксперимент показал, что адаптивное управление уровнем воды с настройкой через ИГА является наиболее эффективным.

Рис. 4. Управление уровнем воды на базе ИГА.

Наиболее сложным вариантом является когнитивная MAC управления бойлер-турбинным комплексом тепловой электростанции. Бойлер-турбинный комплекс должен обеспечивать требуемую электрическую нагрузку энергетического комплекса за счет поддержания в заданных пределах давления пара в магистрали и уровня воды в котле каждого бойлера. В зависимости от потребления энергии требуется изменять количество топлива, подаваемого в топку каждого бойлера.

Эксперимент по применению ИЛС для управления давлением пара в магистрали показал эффективность такого подхода. На каждый интервал входного параметра, детектированный в текущий момент времени, заготавливается компонент поведения контроллера. В системе регулирования давления пара входные параметры названы как boiler transpired steam (генерируемый бойлером пар) и turbine cost steam (получаемый турбиной пар). Каждый компонент поведения должен быть пригодным для компенсации определенного интервального значения входного параметра. Причем предполагается, что ИЛС выбирает компонент поведения, используя подход «снизу-вверх» при взаимодействии между компонентами. Рис. 5 отражает такое представление сети компонентов поведения для нашего случая. Для каждого компонента определены пары «предусловие-действие». Структура предусловий соответствует входным параметрам (1,2, 3, 4), определенным ранее. Использованы 4 типа компонентов поведения, определяющих действия контроллера:

1. fuel_combusted_ratio_decrease (уменьшение_подачи_топлива_в_камеру_сгорания);

2. fuel_combusted_ratio_increase (увеличение_подачи_топлива_в_камеру_сгорания);

3. turbine_valve_augment (открытие_клапана_турбины);

4. turbine_valve_abate (закрытие_клапана_турбины).

I |арамегр I

Уменьшение генерируемого бой л ерам пара

Парамеф j

Уменьшение подачи пара на ту рбину

Параметр 2

Уйслнчсине rcnepirpyeworo бошг ером пара

11а;тмсг|)4

Увеличение.по дачи .пара натур бину

Компонент 2

Компонент 3

Комнонсит 4

Рис. 5. Иммунологическая сеть управления давлением пара Если активируется компонент 2, это значит, что обнаружен параметр 1 (Boiler_transpired_steam_decrease) и следует в ответ активизировать поведение (Fuel_combusted_ratio_increase). После его активизации, если давление пара в магистрали не достигло требуемого баланса, необходимо активизировать компонент 4, которое реагирует на параметр 4 (Turbine_cost_steam_increase), что приведет к активации поведения (Turbine_valve_abate). В ответ на появление параметра 2 {Boiler Jranspired_steamjncrease), срабатывает компонент 2 и активизируется поведение (FueI_combusted_ratio_increase). Если количество пара, генерируемого бойлером, больше количества пара, расходуемого турбиной, срабатывает компонент 3 и активизируется поведение (Turbinevalveaugment).

На рис. 6 показан экран пользовательского интерфейса с результатами симуляции Р2Р системы для данного случая. Измерения количества пара, поступающего от бойлеров к турбинам, представлены на верхней части экрана. На нижней части экрана показаны текущие управления давлением пара в сегментах 1 и 2 главной магистрали.

Дру

: РЩ 5 ■ ■ •■ ■ - ......- ■ ■• • ■ у' ::;; ;: ; ;;: Г;; :■

'líZ'll^- : ]

ШЩШШ

its

................. : ; ^: .'i

! ! ! ;

/ давзешн." napa

/'s

V';)pa¡l;í£:l!ín! давлением паря н сс|л:глгг-лс I

Унряпвения •ззвденвсад

ГКАРЙ &

сстенгае 2

Рис 6. Экран пользовательского интерфейса с результатами симуляции

Моделирование канала регулирования давления пара в главной магистрали показало более высокую эффективность агентов-контроллеров на ИГА по сравнению с традиционными контроллерами. Показано, что традиционный контроллер обеспечил время переходного процесса около 16 сек. с перерегулированием 45.72%. Для контроллера на ИГА время переходного процесса составило 7 сек., а перерегулирование 4.77%, что значительно лучше, чем у традиционного контроллера. Результаты моделирования коллективной работы системы с использованием разработанных правил интеллектуального управления показали достаточную эффективность координации бойлер-агентов в построенной по принципе MIMO нелинейной бойлер-турбинной системе управления давлением в главной паровой магистрали. Показано также, что предлагаемый вариант MAC управления способен обеспечить адаптивность даже к большим изменениям параметров.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В ходе выполнения диссертационной работы получены следующие результаты.

1. Разработан иммунно-генетический алгоритм, который объединяет достоинства иммунного и генетического алгоритмов и позволяет повысить эффективность поиска оптимальных решений. Разработана иммунологическая сеть, позволяющая рационально выбирать компоненты поведения, соответствующие входной ситуации.

2. Разработана модель формирования поведения когнитивного агента с двумя уровнями, который способен управлять технологической установкой и основанная на ней

архитектура агента. Нижний уровень включает адаптивные ПИД-регуляторы отдельных технологических процессов, а верхний уровень построен на адаптивной ИЛС, обеспечивающей координацию работы ПИД-регуляторов нижнего уровня.

3. Предложена модель коллективной работы агентов, которая является обобщением моделей MTDP (Multi-agent Team Decision Process) и COM-MTDP-RT (Communicative Multi-agent Team Decision Process in Real Time). Модель учитывает ограничения реального времени на процесс принятия решений агентов, что особенно важно для распределенного управления технологическими установками. На базе этой модели разработана организационная структура многоагентной когнитивной системы.

4. Предложена комплексная среда для разработки и моделирования когнитивиых агентов и многоагентных систем. Высокоуровневая часть агентов разрабатывается и моделируется с использованием среды MASDK и Р2Р платформы, а низкоуровневая часть агента разрабатывается и моделируется в среде Matlab/Simulink.

5. Разработаны и моделированы две прикладных системы управления комплексами фильтрации воды и бойлер-турбинными установками. Показано, что традиционный контроллер давления пара в бойлер турбинной установке обеспечил время переходного процесса около 16 сек. с перерегулированием 45.72%. Для контроллера на иммунно-генетическом алгоритме время переходного процесса составило 7 сек., а перерегулирование 4.77%, что значительно лучше, чем у традиционного контроллера.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Цзя Лу. Имунная сеть с генетическим алгоритмом настройки для ПИД-управлеиия / Л.А. Станкевич // Научно-техннческне ведомости СПбГПУ. - СПб: Наука, 2009. - 4(82). - С. 27-36.

Jia Lu. Boiler-turbine Main Steam System Based-on Multi-agent Control System / V.P. Shkodyrev, L.A. Stankevich // Distributed Intelligent System and Technology Workshop. - St. Petersburg, 2008.-P. 169-176.

Jia Lu. Multi-Agent Control of Water Distribution System / V.P. Shkodyrev, L.A. Stankevich // 12th International Student Olympiad on Automatic Control. - St. Petersburg, 2008. -P. 78-83.

Jia Lu. MuJti-agent System for Control of Multiple Industrial Unit / V.P. Shkodyrev, L.A. Stankevich // 12th International Student Olympiad on Automatic Control. St. Petersburg, 2008. -P. 108-111.

Jia Lu. Immune Genetic Algorithm Based on PID Controller for Level Control System / V.P. Shkodyrev, L.A. Stankevich // Program of the Distributed Intelligent Systems and Technologies workshop. - St. Petersburg, 2009.

Цзя Лу. Многоагентная система интеллектуального управления процессом генерации пара бойлерной установкой турбины / В.П. Шкодырев, Л.А. Станкевич // Труды СПбГПУ / Международное сотрудничество в образовании и науке. - СПб: Наука, 2009.- С. 18-31.

Jia Lu. Multi-Agent Intelligent Control System for Power Plants // 13th International Student Olympiad on Automatic Control St. Petersburg. - St. Petersburg, 2010. -P. 94-98.

Лицензия ЛР № 020593 от 07.08.97

Подписано в печать 17.01.2011. Формат 60x84/16. Печать цифровая. Усл. печ. л. 1,0. Уч.-изд. л. 1,0. Тираж 100. Заказ 7012Ь.

Отпечатано с готового оригинал-макета, предоставленного автором, в Цифровом типографском центре Издательства Политехнического университета. 195251, Санкт-Петербург, Политехническая ул., 29. Тел.: (812) 550-40-14 Тел./факс: (812) 297-57-76

Оглавление автор диссертации — кандидата технических наук Цзя Лу

СОДЕРЖАНИЕ.

ВВЕДЕНИЕ.

ГЛАВА 1. ПОСТАНОВКА ЗАДАЧ И ПОДХОДЫ К ИССЛЕДОВАНИЮ И РЕШЕНИЮ.

1.1. Общая постановка задач.

1.2. Управление комплексами технологических установок.

1.2.1. Агентно-ориентированный подход.

1.2.2. Пример распределенной ИИУС на основе агентов.

1.3. Интеллектуальные агенты и многоагентные системы.

1.3.1. Интеллектуальные агенты.

1.3.2. Интеллектуальные многоагентные системы.

1.4. Когнитивные агенты и системы.

1.4.1. Когнитивные агенты на биологически инспирированных принципах.

1.4.2. Когнитивные агенты на психологически инспирированных принципах.

1.4.3. Когнитивные многоагентные системы.

1.5. Формализованные постановки теоретических задач.

1.6. Выводы по главе.

ГЛАВА 2. МЕТОДЫ И СРЕДСТВА ОБРАБОТКИ ИНФОРМАЦИИ НА ИММУННЫХ ПРИНЦИПАХ.

2.1. Концепции и свойства систем на иммунных принципах.

2.2. Модели систем на иммунных принципах.

2.2.1. Динамические модели и их реализации.

2.2.2. Многоагентная сетевая модель с саморганизацией.

2.2.3. Многоагентная модель на клонально-селекционной теории.

2.3. Разработка искусственных иммунных систем.

2.3.1. Сенсорные сети.

2.3.2. Автономные распределенные системы.

2.3.3. Поведенческие системы.

2.4. Разработка иммунно-генетического алгоритма и иммунологической сети

2.4.1. Иммунный алгоритм.

2.4.2. Иммунно-генетический алгоритм.

2.4.3. Иммунологическая сеть.

2.5. Выводы по главе.

ГЛАВА 3. РАЗРАБОТКА КОГНИТИВНОГО АГЕНТА.

3.1. Когнитивный агент для обработки информации и управления.

3.2. ПИД-контроллер для регулирования технологических процессов.

3.2.1. Традиционные ПИД-контроллеры.

3.2.2. Адаптивные и нечеткие ПИД-контроллеры.

3.3. Модель формирования поведения когнитивного агента.

3.4. Выводы по главе.

ГЛАВА 4. РАЗРАБОТКА КОГНИТИВНОЙ МНОГОАГЕНТНОЙ СИСТЕМЫ

4.1. Модель коллективной работы когнитивных агентов.

4.2. Агентно-ориентированные методологии проектирования.

4.2.1 Обзор методологий проектирования систем на агентах.

4.2.2. Сравнительная оценка агентно-ориентированных методологий.

4.3. Выбор средств разработки и моделирования MAC.

4.4. Среда проектирования MASDK (Multi-agent System Development Kit).

4.5. Методология разработки систем в MASDK.

4.6. Р2Р Агентская Платформа.

4.6.1. Краткое описание Р2Р Агентской Платформы.

4.6.2. Подвижные агенты и проект Р2Р Агентской Плафтормы.

4.6.3. Р2Р Агентская Платформа и провайдер Р2Р.

4.7. Реализация MAC с когнитивной архитектурой.

4.8. Выводы по главе.

ГЛАВА 5. РАЗРАБОТКА ПРИКЛАДНЫХ КОГНИТИВНЫХ РАСПРЕДЕЛЕННЫХ ИИУС.

5.1. Когнитивная многоагентная система управления станциями фильтрации воды.

5.1.1. Поведение агентов системы.

5.1.2. Разработка когнитивной MAC управления резервуаром в среде MASDK.

5.1.3. Иммунологическая сеть для селекции поведения.

5.1.4. Реализация поведения агентов на Р2Р Агентской платформе.

5.1.5. Моделирование поведения агентов-контроллеров.

5.2. Когнитивная многоагентная система управления бойлер-турбинными установками.

5.2.1. Бойлер-турбинный комплекс тепловой электростанции.

5.2.2. Система управления давлением в главной паровой магистрали.

5.2.3. Конструирование когнитивной MAC управления паровой магистралью.

5.2.4. Разработка когнитивной MAC управления бойлер-турбинным комплексом в среде MAS DK.

5.2.5. Иммунологическая сеть, определяющая поведение агента.

5.2.6. Реализация поведения агентов на Р2Р Агентской Платформе.

5.2.7. Моделирование поведения агентов.

5.3. Выводы по главе.

Введение 2011 год, диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам, Цзя Лу

Актуальность темы диссертации.

Диссертация посвящена проблеме повышения эффективности информационно-измерительных и управляющих систем (ИИУС) комплексов технологических установок в изменяющихся условиях функционирования. Современные ИИУС технологических комплексов в промышленности и сфере услуг состоят из многих параллельно работающих подсистем. Полностью централизованный принцип координации подсистем в таких распределенных ИИУС признан непрактичным не только вследствие недостатков централизованного сбора информации, ее обработки и принятия решений, но также из-за недостаточной гибкости при координации компонент обработки информации и управления с учетом динамически изменяющихся условий. Полностью децентрализованная схема распределенных ИИУС также не обеспечивает оптимальное функционирование, поскольку при координации локально распределенных подсистем могут возникать серьезные проблемы из-за некорректной децентрализации.

Один из путей решения проблемы - использование многоагентного подхода при построении ИИУС, который позволяет успешно справляться с проблемой сложности и распределенности подсистем обработки информации и управления комплексами установок. Каждый агент такой системы способен автономно решать выделенные ему задачи в рамках отдельной установки. Агенты могут работать во взаимодействии, что позволяет системе в целом решать задачи, которые лежат за пределами возможностей индивидуального агента.

Когнитивные агенты, способные к автоматическому накоплению и использованию знаний в процессе работы, представляют следующий шаг в развитии распределенных ИИУС. Такие агенты обладают адаптивными способностями, что обеспечивает эффективную работу установок и комплексов в динамически изменяющихся условиях.

Цель диссертационной работы - разработка и исследование когнитивных агентов и систем, которые обеспечивают локальную автономность, гибкую координацию и адаптивность при распределенной обработке информации и управлении комплексами.

Для реализации этой цели в диссертационной работе были поставлены и решены следующие задачи:

1. Разработка модели и алгоритмов обработки информации и формирования поведения когнитивного агента при управлении технологическими процессами установки, а также архитектуры когнитивного агента, соответствующей этой модели.

2. Разработка модели коллективной работы когнитивных агентов с ресурсными ограничениями и организационной структуры многоагентной когнитивной системы, способной обеспечить гибкое согласованное управление комплексом установок, каждая из которых управляется своим агентом.

3. Разработка и исследование многоагентных когнитивных систем обработки информации и управления комплексом фильтрации и распределения воды по потребителям и комплексом бойлер-турбинных установок тепловой электростанции с целью подтверждения эффективности предложенных вариантов когнитивных агентов и систем.

Методы исследования. При выполнении работы использовалась теория автоматического управления, теория многоагентных систем, когнитивные методы обработки информации, теория иммунных систем, методы обучения с подкреплением, генетические алгоритмы.

Научная новизна исследования.

1. Разработан иммунно-генетический алгоритм, обеспечивающий адаптивность при регулировании технологических процессов, и обучаемая иммунологическая сеть, позволяющая выбирать нужные компоненты поведения в соответствии с текущей ситуацией. Новизна состоит в комбинировании иммунного и генетического алгоритмов, что обеспечивает уверенное нахождение глобального оптимума целевой функции за счет большего, чем при простом генетическом алгоритме разнообразия решений. Иммунологическая сеть является новым, обучаемым с помощью иммунно-гентического алгоритма, средством управления одновременно несколькими процессами.

2. Разработана модель формирования поведения когнитивного агента при координированном управлении технологическими процессами установки. Новизна состоит в том, что модель имеет два настраиваемых с помощью иммунно-генетического алгоритма уровня. На нижнем уровне используются адаптивные ПИД-регуляторы, а на верхнем - обучаемая иммунологическая сеть. Когнитивный агент, построенный по такой модели, может эффективно решать задачи управления установкой в условиях динамически изменяющегося окружения.

3. Разработана модель коллективной работы агентов и основанная на ней новая организационная структура когнитивной многоагентной системы управления распределенными установками комплексов. Новизна состоит во введении в модель ресурсных ограничений и использовании алгоритма обучения с подкреплением для определения оптимальной политики управления когнитивными агентами. Новая организационная структура системы, построенная на этой модели, поддерживает принципы иерархичности, открытости и гибкой координации.

Практическая значимость. На основе предложенных моделей, алгоритмов и результатов исследования могут быть разработаны программные средства распределенного управления реальными бойлер-турбинными установками тепловой электростанции, а также установками комплекса фильтрации и распределения воды.

Реализация результатов работы. Разработанные модели формирования поведения когнитивных агентов и их коллективной работы, а также архитектура агента и организационная структура когнитивной многоагентной системы использованы в курсе «Когнитивные многоагентные системы обработки информации и управления» в СПбГПУ. Обсуждается возможность использования результатов диссертационного исследования при проектировании новых средств распределенной обработки информации и управления.

Основные положения, выносимые на защиту: