автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Методика проектирования Web-ориентированных гибридных экспертных систем на примере рентгенофлуоресцентного анализа

кандидата технических наук
Федоров, Вячеслав Викторович
город
Иркутск
год
2012
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Методика проектирования Web-ориентированных гибридных экспертных систем на примере рентгенофлуоресцентного анализа»

Автореферат диссертации по теме "Методика проектирования Web-ориентированных гибридных экспертных систем на примере рентгенофлуоресцентного анализа"

На правах рукописи

Федоров Вячеслав Викторович

МЕТОДИКА ПРОЕКТИРОВАНИЯ УУЕВ-ОРИЕНТИРОВАННЫХ ГИБРИДНЫХ ЭКСПЕРТНЫХ СИСТЕМ НА ПРИМЕРЕ РЕНТГЕНОФЛУОРЕСЦЕНТНОГО АНАЛИЗА

Специальность 05.13.01 Системный анализ, управление и обработка информации (промышленность)

005011613

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

1 С 033 20:2

Иркутск-2012

005011613

Работа выполнена в ФГБОУ ВПО «ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ»

Научный руководитель:

доктор технических наук, профессор Молчанова Елена Ивановна

Официальные оппоненты:

доктор технических наук, профессор Аршинский Леонид Вадимович

кандидат технических наук Копайгородский Алексей Николаевич

Ведущая организация:

ФГБОУ ВПО Иркутский государственный университет, г. Иркутск

Защита состоится 1 марта 2012 г., в 15 часов на заседании диссертационного совета Д 218.004.01 в ФГБОУ ВПО «Иркутский государственный университет путей сообщения» по адресу: 664074, Иркутск, ул. Чернышевского, 15, ауд. А-803

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Иркутский государственный университет путей сообщения»

Автореферат разослан 24 января 2012 г.

Отзывы в двух экземплярах, заверенных печатью организации, прошу выслать в адрес Совета.

Ученый секретарь диссертациошюго совета,

профессор

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность. Экспертные системы (ЭС) традиционно применяются для решения сложных задач. В них используются слабо формализованные знания специалистов-практиков и логическая обработка информации превалирует над вычислительной. Обширный круг предметных областей, в которых перспективно использовать ЭС, можно расширить за счет областей знаний, где применяются хорошо формализованные задачи. Здесь мнение эксперта может быть решающим при выборе того или иного алгоритма вычислений. Эта возможность реализуется с помощью гибридных ЭС. Широкое распространение Интернет позволяет в реальном времени получать консультации экспертов находящихся на значительном удалении от потребителя знаний. \¥еЬ-ориентированные гибридные ЭС представляют программный комплекс, агрегирующий стандартные пакеты прикладных программ (ППП), средства манипулирования знаниями и \УеЪ-оболочку. Построение таких систем являет собой задачу на порядок более сложную, чем разработка автономной ЭС. В связи с чем, возникает необходимость разработки технологии проектирования ШеЬ-ориентированных гибридных ЭС. В виду того, что основой ЭС является база знаний (БЗ) проблемной области, исследование выполняется на примере построения \УеЬ-ориентированной ЭС для целей рентгенофлуоресцентного анализа (РФА) химического состава вещества.

РФА обладает развитой теорией, и для решения своих задач традиционно привлекает аппарат математического моделирования, математическую статистику, теорию планирования эксперимента, системы управления базами данных. Создано множество пакетов прикладных программ (ППП) и специализированных программных комплексов, реализующих отдельные аналитические задачи. Как правило, в настоящее время зарубежные производители программного обеспечения для аналитических комплексов поставляют потребителям отдельные вычислительные блоки с закрытыми алгоритмами реализации. Постановка каждой новой аналитической задачи требует вложения немалых дополнительных средств. Более эффективным является предоставление потребителю универсального программного обеспечения, пригодного для решения широкого круга задач. Однако, опыт внедрения такого программного обеспечения (ПО) показал, что даже при открытом описании вычислительных алгоритмов, их реализация на практике требует высокой квалификации аналитика и не всегда обеспечивает желаемый результат. Корректное применение разработанных программ является задачей высокопрофессиональной и требует привлечения экспертных знаний и повышение уровня квалификации работников.

Следовательно, создание таких \УеЬ-ориентированных гибридных ЭС, в которых знания экспертов применяются при выборе алгоритма вычислений в хорошо формализованных областях знаний, является актуальной задачей. Поэтому в Иркутском го-

сударственном университете путей сообщения существует научное направление, в рамках которого создается ЭС, позволяющая выполнить разработку градуировочной функции конкретной методики анализа (в аналитическом виде), основываясь на знаниях экспертов в области РФА. ЭС разрабатывается как \УеЪ-приложение, что позволит осуществлять повышение квалификации инженерных кадров без отрыва от производства и интерактивно решать сложные методические задачи, связанные с построением математических моделей предметной области, а так же привлекать к решению задач сторонних экспертов.

Целью настоящих исследований является разработка технологии построения WeЪ-opиeнтиpoвaнныx гибридных экспертных систем.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Основываясь на системном подходе разработать методику проектирования ^УеЬ-ориентированных гибридных ЭС, предназначенных для использования в Интернет.

2. Разработать модель управления знаниями в гибридных ЭС и методику их конвертации в унифицированную реляционную логическую модель базы данных.

3. Выполнить проектирование и разработку оболочки дня создания гибридных экспертных систем в Интернет.

4. Разработать быстрый прототип ЭС для построения градуировочной функции в РФА.

Объектом исследования являются \УеЬ-ориентированные гибридные ЭС.

Предметом исследования служат модели управления и структурирования знаний, данных и технологии программирования ^^еЬ-ориентированных гибридных ЭС.

Методами исследования являются методы системного анализа, методы классификации, теории множеств, методологические основы теории представления структур данных и знаний, онтологический подход к представлению знаний, объектный подход (анализ, проектирование, программирование), методы проектирования и реализации ЭС и '^/еЬ-приложений, гибридный подход к созданию ЭС.

Научную новизну работы составляют и на защиту выносятся следующие положения:

.1. Методика моделирования процесса управления знаниями и данными гибридных ЭС, предназначенных для использования в Интернет, основанная на системном подходе к моделированию основных этапов жизненного цикла ЭС и реализации принципа множественности, позволяющего интегрировать в единую среду разработки множество информационных, физических и математических моделей для описания отдельных элементов и системы в целом.

2. Методический подход к разработке унифицированного представления знаний в Web-орнентированиых гибридных ЭС, включающий модель представления знаний в виде фреймовых субиерархий и методику их конвертации в унифицированную реляционную логическую модель базы данных, адекватную онтологии произвольной предметной области.

3. Подход к проектированию программного обеспечения ЭС, основанный на двухуровневой структуре управления данными и знаниями, и результат его применения в виде двух управляющих компонентов,

4. Обобщенная гибридная модель знаний ЭС для построения градуировочной функции в рентгенофлуоресцентном анализе.

Практическая значимость работы. Оболочка ЭС реализована в виде универсального программного средства, позволяющего разрабатывать гибридные экспертные системы в различных предметных областях. При этом вся работа экспертов и пользователей ЭС выполняется в режиме реального времени через Интернет, что позволит большому числу пользователей одновременно работать с системой. Такие экспертные системы могут найти применение не только в решении практических задач, но и в профессиональном образовании. Web-ориентированная экспертная система для обучения основам использования математических моделей возбуждения интенсивности рентгеновской флуоресценции, разработанная в рамках диссертации, может быть использована специалистами при разработке методик анализа с использованием рентгеновских спектрометров. А таких спектрометров отечественного производства (ЗАО «Научприбор») на предприятиях металлургии, цементной и стекольной промышленности, в машиностроении и в научных учреждениях более 500. Также, используются аналитические комплексы импортного производства.

Апробация работы. Результаты работы докладывались и обсуждались на: V и VI Всероссийской конференции по рентгеноспекгральному анализу (Иркутск, 2006, Краснодар, 2008); VIII Школы-семинара молодых ученых «Математическое моделирование и информационные технологии: управление, искусственный интеллект, прикладное программное обеспечение и технологии программирования» (Энхалук, 2006); XII Международной конференции «Информационные и математические технологии в научных исследованиях (Иркутск, 2007); III научно-практической интернет-конференции «Проблемы и перспективы формирования образовательного пространства в условиях становления информационного общества» (Иркутск, 2010); II межвузовской научно-практической конференции «Транспортная инфраструктура сибирского региона» (Иркутск, 2011).

Публикации. Основное содержание работы опубликовано в 13 статьях, из них 3 в изданиях рекомендованных ВАК, получено 2 свидетельства о регистрации.

Личный вклад. Результаты, составляющие новизну и выносимые на защиту, получены лично автором.

Объем и структура работы. Диссертация состоит из введения, грех глав, списка литературы из 125 наименований и приложений на 131 стр. (основной текст 104 стр.), включает 7 таблиц и 46 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

В первой главе представлен аналитический обзор литературных источников по направлению ЭС. Выделена группа гибридных ЭС, представляющих программный комплекс, агрегирующий стандартные пакеты прикладных программ (например, математическую статистику, линейное программирование или системы управления базами данных) и средства манипулирования знаниями. Подробно рассмотрены модели представления знаний в ЭС и их классификация.

Методологическую основу проектирования ПО, в том числе ЭС, составляет системный подход. Этот подход применен к проектированию ЭС на основе моделирования основных этапов жизненного цикла экспертной системы и реализации принципа множественности, позволяющего использовать множество информационных, физических и математических моделей для описания отдельных элементов и системы в целом. При проведении исследований сопоставлены этапы жизненного цикла (ЖЦ) ЭС, этапы процесса принятия решения по проектированию ЭС и необходимые для этих этапов модели (рис. 1).

Это позволило предложить методику моделирования управления знаниями и данными гибридных ЭС, предназначенных для использования в Интернет, основанную на построении и последовательном преобразовании ряда согласованных моделей на всех этапах ЖЦ (рис.2).

При подробном рассмотрении компонентов системы и необходимых для их проектирования моделей в применении к задаче построения градуировочпой функции в РФА с позиций развернутого определения системного подхода, можно выделить следующие аспекты.

Целью (выходом) разрабатываемой ЭС является получение оптимальной для данной методической задачи модели градуировочпой функции и экспертного заключения об ее оптимальности на основе моделей тестируемого материала, требований к точности РФА и условий регистрации спектра флуоресценции.

Подпели системы: оценка возможности использования полного фундаментального выражения для интенсивности флуоресценции, выбор алгоритма матричной коррекции и учета фона, оценка параметров градуировочной функции, оценка адекватности полученной модели, генерация объяснений, предоставляемых пользователю и оценка их релевантности.

Жл шснш.ш ЦИКЛ -жспсрпшй системы

I. Планирование

Этапы приютна решения

I. Формулировки Проблемной «П}ЛЦН(|

2. Определение «елей

3. Определение к-ри гирис» I иж(ни« цели

Необходимые информационные

модели

1. Модель треЛшшннм к ЗС

Определение знаний

2а, Выявление и иыбор источника» 1Н8МНЙ

4.¡¡острое»«« метелей для обисношшия решения

26. Лиалнт результатов нрноЯрмеанн и «¿влечение знаний

5. Поиск оптимального допустимого варианта решения_

6. Согласование решения

1. Концептуальная модель приметной области

3,

Проектирова кис БЗ

За. Определен ке

35. Подготовка подробную проекта

7. Подготовка решения к рсалитанин

8. Утверждение решения

3. Модели проекм ЭО Логическая модель 63.

Фушшнональиые и динамические мадели программною обеспечения

4. Разработка и «ыядкя иш

9. Управление ходом реалтацян решения

4. Модель требований к приложением

5а. Формальная [¡роверь'и

5а. Лналш результатов испытаний

<1. Оценка

1Й.Иронеркя

эффективности решения

5, Модель критериев оценки алекнатноетн моделей ЭС

Рис. 1. Системный подход к проектированию ЭС Ресурсами (входом), требующимися для функционирования системы, т.е. для решения системой той или иной проблемы являются: концептуальная модель тести-

руемого материала, физическая модель условий возбуждения и регистрации спектра флуоресценции, математическая модель интенсивности аналитической линии, возбужденной в толстом гомогенном образце узким полихроматическим пучком первичного спектра и ее аппроксимации, статистические модели уравнений связи и требований к точности результатов РФА.

Рис. 2. Обобщенная модель управления гибридной ЭС На основании рассмотрения рис. 2 с позиций системно-комплексного аспекта. можно выделить следующие компоненты гибридной ЭС: подсистемы, управляющие знаниями и подсистемы хранилища знаний.

Подсистемы, управляющие знаниями: подсистема Решатель; подсистема интеллектуального интерфейса с пользователем; подсистема \УеЬ-интерфейса; подсистема интерфейса с БЗ и базой данных (БД); подсистема интерфейса с ППП. Подсистемы хранилища знаний: БЗ; БД; файлы данных ППП. Выделенные подсистемы будут использованы при проектировании архитектуры оболочки \\'еЬ-ориентированной гибридной ЭС.

С.истемио-структурпый аспект, заключающийся в выяснении внутренних связей и зависимостей, отображен на рисунке 2 в виде сплошных направленных стрелок.

Системно-интеграционный аспект. состоит во взаимодействии компонентов системы, для преобразования ресурсов в цели в одном цикле работы ЭС.

Системно-коммуникационный аспект ЭС, то есть, её связи с окружающей средой, отражен на рис.2 в виде пунктирных направленных стрелок.

Системно-функциональный аспект, выявляет, что основная функция выделенных подсистем состоит в последовательном преобразовании знаний и данных из модели используемой в каждой из подсистем в модель, используемую подсистемой следующего уровня.

Системно-исторический аспект, позволяет выяснить условия во времени возникновения исследуемой системы, пройдеш/ые ею этапы, современное состояние, а также возможные перспективы развития.

На первом этапе применения методики сформулирована обобщенная модель требований к гибридной ЭС. При формирования множества значений концептов учтены наиболее распространенные или пригодные для решаемой задачи варианты. Модель представляет восьмерку вида:

Requirejvlodel=< Mm, Рр, Md, In, Pt, Ar,Grap,Oc> (1)

>

где Mm = {0 - невозможно; 1 - возможно} - Возможность подключения математических моделей из специализированных ППП.

Рр = {1 - процедурное; 2 - объектное; 3 - логическое} - Парадигма программирования.

Md = {1 - продукционная; 2 - прецедентная; 3 - фреймовая, 4 - логическая, 5 -сетевая} - Модель представления знаний.

In = {1 - реляционные БД; 2 - ППП; 3 - программные среды} - Механизмы интеграции.

Pt = {1 - Windows; 2 - Unix} - Платформа.

Аг = {1 - локальная; 2 - клиент-серверная; 3 - трехуровневая} - Архитектура.

Grap = {1 - присутствует; 0 - отсутствует} - Графический интерфейс.

Ос = {0 - закрытый, 1 - открытый} - Открытость кода.

Модель обладает свойством расширяемости/масштабируемости за счет описания с помощью фреймов других, добавляемых структур знаний (например, семантические/ассоциативные сети), платформ, парадигм программирования и архитектур.

В ходе анализа характеристик существующих программных средств создания ЭС показано, что наиболее полно удовлетворяет требованиям модели (1) среда CLIPS, но не обладает графическим интерфейсом. Этот недостаток можно компенсировать при разработке оболочки. Вместе с тем среда CLIPS предоставляет пользова-

телю мощный механизм логического вывода, сопряженный с объектно-ориентированным языком программирования, что позволяет выбрать ее в качестве подсистемы решателя при разработке проектируемой системы.

Следующий этап проектирования ЭС, согласно предлагаемой методике (рис.2), требует построения концептуальной модели предметной области. Эта модель должна поддерживать возможность ее преобразования в модели проекта ЭС на следующих этапах разработки.

Во второй главе рассматривается предложенный автором методический подход к разработке унифицированного внешнего представления знаний Web-ориентированных гибридных ЭС. Подмоделью предметной области понимается некоторая система, имитирующая структуру или функционирование исследуемой предметной области и отвечающая основному требованию - быть адекватной этой области. Далее подробно рассматривается онтологическое моделирование БЗ предметной области. Онтология - набор определений фрагмента декларативных знаний на формальном языке, которые ориентированы на совместное многократное использование различными пользователями в своих приложениях1:

Of = {С1, R\ D', DV, Df, А', Р1, R1дй R'dv}, (2)

где С1 = {сI,..., с,,} - конечное множество концептов. Под концептом будем понимать конструкцию, состоящую из объектов одного класса.

R1 ={г,..., rm }, R Q С X С, R = Rc u RT и RA - конечное множество бинарных отношений Г;(сх, Су) между концептами,

Rc£C'xC',RcCRl - бинарное отношение наследования, являющееся отношением частичного порядка множества концептов С;- конечное множество ассоциативных отношений; В' = {di, ..., dj - конечное множество доменов;

DV = {dvj, ... , dvj - конечное множество конкретных значений стандартного типа, включенных в некоторый домен;

DT1 = D' □ {srting, boolen, integer, symbol, lexeme, float, number, instance-name, instance, byte, word, text...} - множество типов данных, включающих множество доменов;

, , ГC'xDT

A ={a,,...,aw },А £ ■! , - конечное множество атрибутов, т.е. би-

[R'xDT'

парных отношений а;(сх, tdy) или ai(r„ tdy);

1 Сидорова Е.А. Методы и программные средства для анализа документов на основе модели предметной области: Автореф. дис... канд. физ.-мат. наук: 05.13.11.-Новосибирск, 2006. - 19 с,

Р1 ~ {pi, ..., pj - конечное множество конкретных свойств атрибута;

R'ар £А' хР'- бинарное отношение инцендентности между множествами атрибутов А и свойств атрибутов Р;

Rldv Q D1 XDV! - бинарное отношение инцендеитности между множествами доменов D и доменных значений DV.

Здесь верхний индекс I указывает на предметную область.

В работах научных школ Института систем информатики имени А.П. Ершова СО РАН (Новосибирск), Институт систем энергетики им. JI.A. Мелентьева СО РАН (Иркутск), Институт динамики систем и теории управления СО РАН (Иркутск), Российский государственный гуманитарный университет (Москва), Московский инженерно-физический институт (Москва) онтология используется в качестве схемы хранилища данных, а это означает, что при создании базы знаний для различных предметных областей приходится создавать различные базы данных (свою БД для каждой предметной области). Такой подход является не очень удобным, т.к. при разработке ЭС в новой предметной области потребуется каждый раз проектировать новую схему БД и разрабатывать соответствующий программный код, кроме того, каждая из соз-датгных БД нуждается в администрировании.

Вместе с тем, при разработке ПО в настоящее время необходимо учитывать требование повторного использования компонентов.

Одной из ведущих научных школ Московским инженерно-физическим институтом, поддерживается тенденция универсализации разрабатываемого программного кода за счет отказа от подхода проектирования «от прикладной задачи» при реализации средств вывода.2 Автором диссертации предложен подход проектирования БЗ гибридных ЭС, основанный на разработке модели унифицированного представления знаний. Знания в разрабатываемой оболочке хранятся в реляционной БД. Чтобы результирующая схема отношений БД была универсальной, она должна соответствовать иерархии объектов, адекватной онтологии произвольной предметной области. Исходя из того, что в качестве подсистемы Решатель проектируемой ЭС выбрана среда CLIPS, универсальная иерархия концептов построена из онтологии элементов языка CLIPS.

Представим онтологию элементов языка CLIPS в виде иерархии (рис. 3).

В работе предложено каждый из элементов (концептов) CLIPS (2 уровень) представить в виде фрейма.

2 Рыбина Г.В., Демидов Д.В. Методы построения средств вывода для интегрированных экспертных систем И Интеллектуальные системы и технологии. Научная сессия МИФИ, 2006. Т. 3. С. 1-5.

CUPS проект

I О | уровень

JL

Модуль

Модуль

Класс

Переменная Правило

Факт

Функция

уровень

2

уровень

Имя Роль — Активность - Слоты -

^Обработчик " сообщений

— Имя

Значение

Имя ' Предпосы ши - Следствие

Имя С/юты

— Имя

— Тип

Обязательные параметры

Действия

Имя Тип Грани

- Ограничения

— Имя

Входные значения

Результат |

уровень

Имя Тип

I 4

. уроаень

(3)

Рис. 3. Онтология элементов CLIPS Таким образом, онтологию CLIPS можно определить как:

О" = {Р", М", Cl", Со", R", F", Fn"}, где верхний индекс II — указывает на отологию языка CLIPS; P"=(ph ..., рк} - конечное множество проектов; определение проектов; М" ={m1,...,mi} - конечное множество модулей, составляющих проект;

конечное множество

классов, составляющих модуль, где (K=l,...,j) - слот; Sk - имя слота; Vk - значение слота; DmK-процедура (обработчик сообщений), Roic-роль, Ак - активность;

Со" = {со1,...,сох},со = /SK,VK} - конечное множество постоянных, составляющих модуль, где (К=1,...,х) - слот; Sk - имя; VK - значение слота;

Rn = {rr..,rt},r = {NrK,PrK,SlK} - конечное множество правил, составляющих модуль, где (K=l,...,t) - слот; №к - имя; Рг« - предпосылки; S1K- следствия;

F" -{ f,..., fh}, f ={SK)VK) PK} - конечное множество фактов, составляющих модуль, где (К=1.....Ь) - слот; SK - имя слота; VK - значение слота; Рк- процедура;

Fn" ={ fnr..,fn„},fn - {SK,VzK,RezK} - конечное множество функций, составляющих модуль, где (К=1,...,п) - слот; SK - имя слота; VzK - входные значения; RezK- результат.

Между концептами могут существовать три типа отношений: агрегация; ассоциация; наследование.

Отношения агрегации и наследования между концептами заложены в иерархии элементов языка CLIPS, представленных выше в виде фреймов. Кроме того, эти же отношения могут быть использованы при построении правил и обработчиков сообщений. С этой целью в диссертации предложен фрейм построитель выражений (рис. 4). Данный фрейм содержит в себе все доступные функции (встроенные, родовые, пользовательские), факты, классы и позволяет использовать их при построении выражений в правилах, обработчиках сообщений, родовых функций, функций пользователя.

Далее для получения унифицированной модели предметной области рассматривается возможность интеграции онтологий. Под интеграцией понимаем процесс поиска связей между онтологиями. Функция преобразования одной онтологии О1 = {С1, R1, D1, DV1, DT1, А1, Р1, Rap1, Rdv\ Г1, CI1}, к другой О11 = {Рц, М11, C1D, Со", Ru, Fu, Fn11} называется отображештем онтологии Fui:0' —>-Оп . Полное отображение предполагает, что интерпретации, верные для онтологии О11 верны и для онтологии О1 (рис. 5).

Чтобы определить схему реляционной БД для хранения БЗ, выполним декомпозицию элементов языка CLIPS, для чего используем реляционную операцию проекция.

Проекция происходит следующим образом: каждый концепт языка CLIPS уровней 0,1 (рис. 3) выделен в самостоятельную сущность, элементы уровня 2 будут выделены в сущность с атрибутами уровня 3. Так же, в сущности будут выделены те элементы, уровня 3, которые имеют распространения на уровень 4.

Результатом будет онтология реляционных отношений БД. Таким образом, выполнено последовательное отображение онтологий. FI 11:01 —+011 , FH Ш:ОН —»0111.

Поскольку разрабатываемая ЭС предназначена для обучения или поддержки принятия решений пользователем посредством Web, при логическом проектировании БД в диссертации предложено реализовать двухуровневое управление данными. Первый уровень представлен подсистемой: «Редактор базы знаний». Редактор используется экспертом и инженером по знаниям для формирования БЗ в виде шаблонов элементов языка CLIPS. Второй уровень представлен подсистемой «Обозреватель базы знаний». С помощью этой подсистемы шаблоны БЗ активируется данными, вводимыми пользователем, являющимися специфичными для конкретной задачи.

Логические ]

Процедурные

Математические ]

Родовые

С

Строковые

Инещниг

I

Составных «спички

Объектео-ориентированиые

Ввода/вывода

Рис. 4. Фрейм построитель После разработки логической модели данных в диссертационной работе выполнено моделирование физической структуры систем хранения выявленных объектов данных.

Уровень предметной области

Уровень концептов

Уровень реляционных отношений

Рис. 5. Отображение онтологии 14

Рис. 6. Диаграмма сущность-связь Третья глава посвящена проектированию и разработке программной оболочки для создания гибридных экспертных систем и ее апробации на примере РФА. На основе предложенной логической модели автора создана база данных, содержащая компоненты базы знаний в виде фреймовых иерархий, представляющих шаблоны конст-

рукций языка CLIPS для отображения онтологической модели предметной области. Предложен механизм взаимодействия сервера баз данных с машиной выводов CLIPS. Разработана трехуровневая архитектура оболочки для создания ЭС.

Создана пробная версия программной оболочки в виде Web-приложсния. На рис.7 представлена архитектура разрабатываемой оболочки. На рисунке разным типом линий выделены компоненты, относящиеся, к серверу приложений, серверу БД, тонкому клиенту.

г 1 I Web-cepBcp j*-» \Veb-6pay:iep

Web-inrrqxpeRc (HTTP)

Условные обозначения:

- клиент;

--сервер приложений;

- сервер БД,

Г

Редаюор баш: знаний

|фбозре®этеда j I ■ базы тадпш''

Интерфейс пользователя (FHP)

База Ваза

знанкй данных

Интерфейс БЗ и БД (PHP f SQL)

N

Файлы данных

ч

Интерфейс хранилища знаний (РНР)

Решатель I CLIPS

; Пакеты • 1! прикладных ■ /программ

Интерфейс с ШШ (XML)

Рис. 7. Архитектура разрабатываемого программного обеспечения.

Оболочка предоставляет возможность создания и редактирования БЗ гибридных экспертных систем в режиме реального времени. БЗ в естественнонаучной области может быть представлена совокупностью динамических знаний в виде отношений между концептами и статических - в виде шаблонов концептов предметной области. Шаблоны концептов и отношений между ними заполняет группа разработчиков (инженеры по знаниям, эксперты и др.). При проектировании отношений могут быть использованы математические и физические модели. Часть значений атрибутов концептов вводят пользователи с учетом специфики решаемой задачи. Оригинальность предлагаемого подхода состоит также и в том, что БЗ редактируется

не только экспертами, но и потребителями знаний, адаптирующих ее к своей предметной области.

Каждый фрейм, соответствующий элементу языка CLIPS, в окне построителя представлен комбинированным списком. Значения строк списка формируются из данных таблиц БД. При разработке построителя использовался язык программирования Java Scripts, благодаря чему при выборе из списка любой функции, факта, правила, слота выбранный объект автоматически передается в формируемое выражение. Это позволяет реализовать механизм агрегирования структур данных и знаний, хранящихся в БД. Интерфейс построителя представлен на рис. 8.

V.lt "{1-ii'V I ,jr.t«'rtel -iyj-.br«» •

ОИнп Ггйвс* ъ*й Илйрлкное Ctsb*t От«*4

О""- - ß л Ш $

-••¿i -УЮ /ixahMt,'rtps_i«0'f ялрСя

) Ш -й

Обьекяш

llmMi

:4'.>ba.;tfa.<tfe,e litt;; -л: a V. и и

Х^аддл

ДАсвт»

ÖmWiJÄSÜ

Геа?усши/.

Пвмощ* Bittx <'(>

■ icoa (spla) t*

(skill

Фушоит

CALI.-NEXT-HANDLER CLASS

OASS-AEbTPACTF

CLASS-EXISTP

OASS-REACTTVEP

CLASS-SLOT

CLASS-SUSCXASSES

OASS-SUPefiCiASSfc Ь

¡DEFCtASS-MODULE

|DERNSTANCES-MOGU.E

DELETE-INSTANCE

¡DVNAMiC-GET

'DV^AMiQfOr

¡GET-CLAS5-UST

GET-DE F1N3~ANCE4JST

ge

■ (tee) is ilV:)

Эйедл'вЫЕ^ла Редосме

Bratow-acmw«

Ki.K'W iK/teccw V

Дкщеэ»« 3c~-0E™=S5AGE-HWDLEfi-i..S-INiT-SLCfTS iNSrANCE-ACOHESS INSTAKCE-ADDRESSP INSTANCE-EM 5TP INSTANCE-NAME !NS-ANCE-MAk'EP INSTANCE?

*£SSAG£+W®l£R-ExlSTF NEXT HAN3LERP OVEftRIDE-l-.EVT-^ac.jLEF..

SLOT-OAD'NAJTi-5LCT-0-FAJ..T-VALVIC.

Рис. 8. Окно построителя Оболочка опробована при разработке быстрого прототипа ЭС ПО для построения градуировочной функции в рентгенофлуоресцентном анализе.

Выполнен анализ процесса принятия решения по выбору уравнения связи и построение его модели. Концептуальная структура модели БЗ следующая:

БЗ={МТ, Rm Eq, RBq}, (4) где МТ - фреймовые модели описания анализируемого материала; RMT - отношения наследования в описании анализируемого материала; Eq - гибридные модели описания градуировочной функции; Rgq - причинно-следственные отношения в описании градуировочной функции.

«Анализируемый материал» МТ можно описать фреймовой моделью, отражающей иерархию сущностей - химическое вещество. При формировании

иерархии, суперклассом можно считать фрейм «Вещество», не содержащее слотов:

где ВЩ- суперкласс; ХЭ - фрейм «Химический элемент»; 8т - слот символ; Т

- слот порядковый номер; А - слот атомный вес; 0 - мультислот края поглощения; к -индекс края поглощения; £ - мультислот линии спектра; Я - индекс линии спектра; Тт - слот тип материала, Рг - слот наименование продукта, Е1 - мультислот элемент; Ст - соединение; Рк - доля элемента в окисле; Миг - минимальное содержание элемента; Мах - максимальное содержание элемента, 1 - индекс элемента; Вз - основа; 5»

- сумма содержаний; Р1г - фазовый состав; —> отношения наследования.

Фрейм ХЭ включает набор слотов и мультислотов, содержащих информацию необходимую для проведения РФА. Экземпляров фрейма ХЭ должно быть столько, сколько элементов в периодической системе.

Фрейм МТ выборочно наследует символы элементов от фрейма ХЭ и имеет дополнительные слоты, определяющие долю и соединение элемента в составе вещества, а также пределы его содержания.

Далее по аналогии можно построить следующие уровни фреймовой иерархии. Приведем их в сокращенном виде, не вводя обозначений слотов рис. 9.

Рис. 9. Уровни фреймовой иерархии. Условные обозначения: ГР - фрейм «Градуировочный образец»; ТЧ-фрейм «Точность анализа»; ОЭ -

Фрейм ГР наследует все шесть слотов от фрейма МТ и имеет дополнительные слоты: имя образца, тип образца, марка и мультислоты: содержание элемента, точность аттестации и интенсивность флуоресценции элемента. Унаследованные слоты Min и Мах мультислота «Элемент» во фрейме ГР играют роль ограничений. Экземпляров этого фрейма создается столько, сколько образцов будет использовано при построении градуировочной функции. Для реализации механизма множественного наследования разработан специальный алгоритм.

Фрейм ТЧ наследует мультислот «Элемент» от фрейма МТ, но позволяет разбить диапазон его содержаний на поддиапазоны и задать для каждого из них соответствующие характеристики погрешности.

Фрейм ОЭ наследует от фрейма ГР символ элемента и все его атрибуты, включая ограничения, а от фрейма ТЧ - допустимую погрешность (по диапазонам). Дополнительно необходимо ввести слот - аналитическая линия (A¡). Значения этого сло-

ВЩ -* X3{Sm, Z, A, Q\Qh L\LJ->

MT{Tm, Pr, El(Sm\Smхэ, Cm, Pk, Min, Max)h Bs, Su, Ph}

(5)

МТ—ГР ОЭ,

фрейм «Определяемый элемент».

та формируются, исходя из атомного номера Z. Если Х<53, то выбирается Ка-линия, иначе -

Данная модель отражает обобщенные отношения наследования, заполнение которых позволяет создать БЗ (конкретизировать фреймовую модель). Благодаря определению данной структуры в каждый момент времени анализируется только определенный фрагмент БЗ, содержащий наиболее релевантные обрабатываемой ситуации знания. Тем самым снижается объем анализируемых знаний и повышается скорость работы метода.

Фрейм ОЭ включает мультислот «Градуировочная функция», содержащий числовые параметры и алгоритмы в виде присоединенных процедур, вызывающих внешние функции, необходимые для расчета содержания данного элемента в анализируемой пробе. Активизация присоединенных процедур происходит при срабатывании правил, составляющих БЗ. Мультислот «Градуировочная функция» можно представить таблицей 1. Здесь] - индекс матричного элемента, ааи£- числовые параметры.

Таблица 1

Мультислот «Градуировочная функция» (Ед)

№ Компонент градуировоч-ной функции Значения в виде аналитического выражения и числовых параметров

1. Тип переменных (Тр) h Q

2. Вид уравнения связи (Уш) C^ao+I.iL^ajIj+L^ctijij) j

3. Зависимость <Хц=КС*) (Ее) const щ - const V

4. Зависимость С,*=/(7;) (Т7^ Полином Полином

При формировании фреймовой модели отношения агрегации и наследования между классами реализуются средствами языка CLIPS, а ассоциации - с помощью продукционных правил.

На основе анализа этих данных, будут сгенерированы новые знания в виде гра-дуировочной функции Eq (уравнения связи), Процесс инициируется при выполнении интеллектуального анализа атрибутов фреймовой иерархии сущностей через присоединенные процедуры, запуск которых происходит при срабатывании правил. Присоединенные процедуры, обращаются к внешним функциям, хранящимся на сервере приложений. Внешние функции выполняют вычисления с помощью математической модели процесса возбуждения спектров флуоресценции и ее аппроксимаций.

Результирующая градуировочная функция в виде отдельных блоков хранится в соответствующем мультислоте фрейма (числовые параметры) и присоединенных процедурах (алгоритмы вычислений). В качестве внешних функций могут быть использованы ППП, написанные ранее для различных платформ, подключение осуществляется с помощью специально разработанного интерфейса.

Развивая подход, использованный в работах О. А. Николайчук3, применительно к решаемой задаче: интеграцию продукционных, фреймовых и аналитических (математических) моделей можно представить, например, рисунком 10. Здесь символ ^ обозначает аналитическую функцию; О.Б - Объект. Слот; р - параметр.

Г

База знаний

Вели Р; и ... iy-^ro Ivs

I

L

а)

Интерфейс ---Г -

Ж:

1\ I j K:t

гаш

'<

!

S

i i !

!«m söiiS

foK0s.Sr"Ps и... 08,$5:-PäTi> Г8.|

r" —' —■——--i—- —' —- ——i « — ■ -j

I

L

Интерфейс

б)

Рис. 10. Интеграция продукционных и аналитических (математических) моделей (а), фреймовых и аналитических (математических) моделей (б).

С целью заполнения слотов, представленных в табл.1, выполняется последовательность правил, в соответствии с иерархическим авторским алгоритмом построения модели матричной коррекции.

Заключение

В ходе диссертационных исследований предложена технология построения \УеЬ-ориентированных гибридных ЭС. Данная технология использована для создания пробной версии программной оболочки. Выполнена апробация оболочки на примере разработки ЭС для построения градуировочной функции в рентгенофлуоресцентном анализе.

В процессе реализации цели получены следующие результаты: 1. Разработана методика проектирования \УеЬ-ориентированных гибридных ЭС, основанная на системном подходе к моделированию этапов ЖЦ ЭС и последовательном преобразовании ряда согласованных моделей на всех этапах жизненного цикла.

' Николайчук O.A. Моделирование знаний для исследования динамики технического состояния уникальных объектов // Проблемы управления. - 2009. - № 4. - С. 58-65.

2. Разработана модель представления знаний в гибридных ЭС в виде онтологии элементов языка CLIPS, а так же методика их конвертации в реляционную модель данных. Спроектирована унифицированная логическая структура базы данных, в которой будут храниться данные и знания в процессе заполнения БЗ.

3. Разработан методический подход к проектированию ПО Web-ориентированных ЭС, основанный на двухуровневой структуре•управления данными и знаниями. Первый уровень представлен подсистемой: «Редактор базы знаний». Редактор используется экспертом и инженером по знаниям для формирования БЗ в виде шаблонов концептов предметной области и отношений между ними, основанных па онтологии элементов языка CLIPS. Второй уровень представлен подсистемой «Обозреватель базы знаний». С помощью этой подсистемы шаблоны БЗ активируется данными, вводимыми пользователем, являющимися специфичными для конкретной задачи.

4. Предложена обобщенная гибридная модель знаний интеллектуальной системы для построения градуировочной функции в рентгенофлуоресцентном анализе.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Свидетельства о государственной регистрации:

1. Федоров В.В., Молчанова Е.И. Оболочка управления экспертной системой на базе CLIPS // Свидетельство о государственной регистрации программы для ЭВМ №2010613396.

2. Федоров В.В., Молчанова Е.И. SMCLIPS // Свидетельство о государственной регистрации базы данных №2010620140

В изданиях, рекомендованных ВАК:

3. Федоров В.В., Молчанова Е.И. Редактор базы знаний для создания экспертных систем в среде CLIPS // Современные технологии. Системный анализ. Моделирование. №3(19) - Иркутск: ИрГУПС, 2008. С. 76-81.

4. Молчанова Е.И, Федоров В.В., Щербаков И.В. Подход к проектированию web-ориентированных гибридных экспертных систем // Системы управления и информационные технологии. №3(45) - Воронеж: ВГТУ, 2011. С. 80-86.

5. Молчанова Е.И, Федоров В.В., Щербаков И.В. Методический подход к созданию гибридных экспертных систем как web-приложений // Современные технологии. Системный анализ. Моделирование. №3(31) -Иркутск: ИрГУПС, 2011. С. 139-146.

В других изданиях:

6. Федоров В.В., Молчанова Е.И. Создание экспертной системы для инженера-методиста по рентгенофлуоресцентному анализу на базе CLIPS // Материалы VIII Школы-семинара молодых ученых «Математическое моделирование и информацион-

иые технологии: управление, искусственный интеллект, прикладное программное обеспечение и технологии программирования» - Иркутск СО РАН, 2006. С.184-191.

7. Федоров В.В., Молчанова Е.И. Разработка интеллектуального редактора базы знаний для создания экспертных систем в среде CLIPS // Труды XII Международной конференции «Информационные и математические технологии в научных исследованиях. Часть Ш.- Иркутск: ИСЭМ СО РАН, 2007. С.82-88.

8. Федоров В.В., Молчанова Е.И. Проектирование базы данных для подсистем редактирования и просмотра базы знаний // Информационные технологии и проблемы математического моделирования сложных систем. - Иркутск: ИИТМ ИрГУПС, 2008. Вып. 6. С. 65-74.

9. Молчанова Е.И., Федоров В.В, Войнич П.В. Проектирование экспертной системы для построения градуировочной функции в рентгенофлуоресцентном анализе // Информационные технологии и проблемы математического моделирования сложных систем. - Иркутск: ИИТМ ИрГУПС, 2009. Вып. 7. С. 23-32.

10. Молчанова Е.И., Федоров В.В, Войнич П.В. Алгоритмы построения модели матричной коррекции Н Информационные технологии и проблемы математического моделирования сложных систем. - Иркутск: ИИТМ ИрГУПС, 2009. Вып. 7. С. 115126.

11. Федоров В.В., Молчанова Е.И. Применение концепт-карт для проектирования визуальных интерфейсов системы CLIPS // Материалы третьей научно-практической интернет-конференции «Проблемы и перспективы формирования образовательного пространства в условиях становления информационного общества». - Иркутск: ИрГУПС, 2010. С. 143-153.

12. Федоров В.В, Молчанова Е.И., Щербаков И.В. Проектирование и разработка интеллектуальной оболочки для создания экспертных систем как web-приложений И Материалы второй межвузовской научно-практической конференции «Транспортная инфраструктура сибирского региона». - Иркутск: ИрГУПС, 2011. С. 341-346.

13. Молчанова Е.И., Федоров В.В. Моделирование знаний гибридной интеллектуальной системы для построения градуировочной функции в рентгенофлуоресцентном анализе Н Информационные технологии моделирования и управления. №5(70) - Воронеж: ВГТУ, 2011. С. 550-557.

Подписано в печать: 11.01.2012 г. Формат 60 х 90 1/16. Бумага офсетная. Печать трафаретная. Усл. печ. л. 1,28 Тираж 120 экз. Заказ № 8

Отпечатано: Федеральное государственное унитарное геологическое предприятие «Урангеологоразведка». Юридический адрес: 115148, г. Москва, ул. Б. Ордынка, дом 49, стр.3. ИНН 7706042118 Справки и информация: БФ «Сосновгеология» «Глазковская типография». Адрес: 664039, г. Иркутск, ул. Гоголя, 53; тел.: 38-78-40, тел./факс: 598-498

Текст работы Федоров, Вячеслав Викторович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

61 12-5/1882

Федеральное агентство железнодорожного транспорта Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Иркутский государственный университет путей сообщения»

МЕТОДИКА ПРОЕКТИРОВАНИЯ \¥ЕВ-ОРИЕНТИРОВАННЫХ ГИБРИДНЫХ ЭКСПЕРТНЫХ СИСТЕМ НА ПРИМЕРЕ РЕНТГЕНОФЛУОРЕСЦЕНТНОГО АНАЛИЗА

05.13.01 - Системный анализ, управление и обработка информации

(промышленность)

Диссертация на соискание ученой степени кандидата технических наук

[равах рукописи

Федоров Вячеслав Викторович

Научный руководитель: д.т.н., профессор Молчанова Елена Ивановна

Иркутск 2012 г.

Список сокращений

БД — база данных. БЗ — база знаний.

ГСО - государственный стандартный образец.

ЖЦ - жизненный цикл.

ИИ — искусственный интеллект.

ИС — информационные системы.

ИИС - интеллектуальные информационные системы.

ПК - персональный компьютер.

ПО - программное обеспечение.

ПрО -проблемная область.

ППП - пакет прикладных программ.

МНК - метод наименьших квадратов.

РФ А - рентгенофлуоресцентный анализ.

СПК - специализированный программный комплекс.

С1111Р - система поддержки принятия решения.

СУБД - система управления базами данных.

СУЭС - система управления экспертными системами.

ЭС — экспертная система.

ЯПЗ - языки представления знаний.

АКО — А-КМ-ОГ = это.

Глоссарий

Экспертная система - компьютерная программа, способная частично заменить специалиста-эксперта в разрешении проблемной ситуации.

Интеллектуальные информационные системы - системы, ядром которых является БЗ или модель предметной области, описанная на языке сверхвысокого уровня, приближенном к естественному.

Инструментальное ПО - ПО, предназначенное для использования в ходе проектирования, разработки и сопровождения программ, в отличии от прикладного и системного ПО.

Пользователь — специалист предметной области, для которого предназначена система. Обычно его квалификация недостаточно высока и поэтому он нуждается в помощи и поддержке своей деятельности со стороны ЭС.

Инженер по знаниям — специалист в области ИИ, выступающий в роли промежуточного буфера между экспертом и базой знаний. Синонимы: когни-толог, инженер-интерпретатор, аналитик.

Интерфейс пользователя — комплекс программ, реализующих диалог пользователя с ЭС как на стадии ввода информации, так и при получении результатов.

База знаний — ядро ЭС, совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и пользователю (обычно на некотором языке, приближенном к естественному).

Предметная область - множество сущностей, описывающих область экспертизы, то есть множество объектов, значений и их характеристик и связывающих их отношений.

Решатель — программа, моделирующая ход рассуждений эксперта на основании знаний, имеющихся в БЗ. Синонимы: дедуктивная машина, машина вывода, блок логического вывода.

Подсистема объяснений — программа, позволяющая пользователю получить ответы на вопросы: "Как была получена та или иная рекомендация?"

3

и "Почему система приняла такое решение?" Ответ на вопрос "как" — это трассировка всего процесса получения решения с указанием использованных фрагментов БЗ, т. е. всех шагов цепи умозаключений. Ответ на вопрос "почему" — ссылка на умозаключение, непосредственно предшествовавшее полученному решению, т. е. отход на один шаг назад. Развитые подсистемы объяснений поддерживают и другие типы вопросов.

Интеллектуальный редактор БЗ — программа, представляющая инженеру по знаниям возможность создавать БЗ в диалоговом режиме. Включает в себя систему вложенных меню, шаблонов языка представления знаний, подсказок ("help" — режим) и других сервисных средств, облегчающих работу с базой.

ПрО включает предметную область и решаемых в предметной области задач. Иначе говоря, проблемная область включает сущности (структуры данных) и решаемые над ними задачи, представляемые в виде исполняемых утверждений (в виде правил, процедур, формул и т.п.). В связи с этим проблемная область определяется характеристиками соответствующей предметной области и характеристиками типов решаемых в ней задач.

РФА - количественный, полуколичественный, качественный анализ вещества по спектру рентгеновской флуоресценции атомов элементов пробы. Преимущества метода: селективность, точность, возможность автоматизации. РФА широко используется в качестве датчика в автоматизированных системах управления технологическими процессами.

Концептуальная модель — это определённое множество понятий и связей между ними, являющихся смысловой структурой рассматриваемой предметной области.

Хранилище данных представляет собой банк данных определенной структуры, содержащий информацию о производственном процессе. Главное назначение хранилища - о беспечивать быстрое выполнение произвольных аналитических запросов.

Концепция "быстрого прототипа". Суть этой концепции состоит в том, что разработчики не пытаются сразу построить конечный продукт. На начальном этапе они создают прототип (прототипы) ЭИС. Прототипы должны удовлетворять двум противоречивым требованиям: с одной стороны, они должны решать типичные задачи конкретного приложения, а с другой - время и трудоемкость их разработки должны быть весьма незначительны, чтобы можно было максимально запараллелить процесс накопления и отладки знаний (осуществляемый экспертом) с процессом выбора (разработки) программных средств (осуществляемым инженером по знаниям).

Интеграция онтологий - процесс поиска связей между онтологиями.

Оглавление

Введение...................................................................................................................9

Глава 1. Экспертные системы. Системный подход к проектированию..........16

1.1. Назначение экспертных систем.................................................................16

1.2. Классификация экспертных систем..........................................................20

1.3. Модели представления знаний..................................................................23

1.4. Системный подход к проектированию экспертных систем...................33

1.4.1. Системный подход..................................................................................33

1.4.2. Обоснование применения системного подхода к проектированию экспертных систем.............................................................................................35

1.4.3. Разработка методики проектирования гибридных экспертных систем, предназначенных для использования в сети Интернет.................................36

1.5. Программные средства и среды разработки экспертных систем..........42

1.6. Обзор существующих экспертных систем в естественнонаучной области знаний......................................................................................................48

1.7. Выводы.........................................................................................................49

Глава 2. Методика проектирования \УеЬ-ориентированных гибридных ЭС . 51

2.1. Структурная модель предметной области...............................................51

2.2. Онтологическое моделирование базы знаний предметной области.....53

2.3. Интеграция онтологий...............................................................................70

2.4. Логическое проектирование базы данных...............................................73

2.4.1. Проектирование двухуровневого управления данными.....................73

2.4.2. Уровни логической модели....................................................................73

2.5. Выводы.........................................................................................................76

Глава 3. Проектирование и разработка программной оболочки для создания гибридных экспертных систем............................................................................79

3.1. Обзор архитектур прикладных систем.....................................................79

3.2. Архитектура разрабатываемого программного обеспечения................80

3.3. Разработка схемы взаимодействия сервера баз данных с машиной выводов CLIPS.......................................................................................................82

3.4. Функции интеллектуального редактора базы знаний.............................85

3.5. Функции подсистемы «Обозреватель базы знаний»...............................88

3.6. Разработка механизма взаимодействия интерпретатора CLIPS с внешними функциями, написанными на других языках высокого уровня.... 88

3.7. Апробация программной оболочки при разработке экспертной системы для построения градуировочной функции в рентгенофлуоресцентном анализе

90

3.7.1. Выбор модели представления знаний...................................................90

3.7.2. Анализ процесса принятия решения по выбору уравнения связи и построение его модели......................................................................................91

3.7.3. Продукционная модель процесса выбора алгоритма матричной коррекции.........................................................................................................102

3.7.4. Разработка алгоритма построения иерархической модели матричной коррекции. Экспериментальные предпосылки.............................................102

3.7.5. Продукционная модель принятия решения по построению калибровочной функции. Результаты и обсуждение...................................111

3.8. Выводы.......................................................................................................117

Заключение..........................................................................................................118

Список литературы.............................................................................................120

Введение

Актуальность работы.

Экспертные системы (ЭС) традиционно применяются для решения сложных задач. В них используются слабо формализованные знания специалистов-практиков и логическая обработка информации превалирует над вычислительной. Обширный круг предметных областей, в которых перспективно использовать ЭС, можно расширить за счет областей знаний, где применяются хорошо формализованные задачи. Здесь мнение эксперта может быть решающим при выборе того или иного алгоритма вычислений. Эта возможность реализуется с помощью гибридных ЭС. Широкое распространение Интернет позволяет в реальном времени получать консультации экспертов находящихся на значительном удалении от потребителя знаний. ^еЬ-ориентированные гибридные ЭС представляют программный комплекс, агрегирующий стандартные пакеты прикладных программ (ППП), средства манипулирования знаниями и \УеЬ-оболочку. Построение таких систем являет собой задачу на порядок более сложную, чем разработка автономной ЭС. В связи с чем, возникает необходимость разработки технологии проектирования Д\/ГеЬ-ориентированных гибридных ЭС. В виду того, что основой ЭС является база знаний (БЗ) проблемной области, исследование выполняется на примере построения \¥еЬ-ориентированной ЭС для целей рентгенофлуорес-центного анализа (РФА) химического состава вещества.

РФА обладает развитой теорией, и для решения своих задач традиционно привлекает аппарат математического моделирования, математическую статистику, теорию планирования эксперимента, системы управления базами данных. Создано множество пакетов прикладных программ (ППП) и специализированных программных комплексов, реализующих отдельные аналитические задачи. Как правило, в настоящее время зарубежные производители программного обеспечения для аналитических комплексов поставляют потребителям отдельные вычислительные блоки с закрытыми алгоритмами

9

реализации. Постановка каждой новой аналитической задачи требует вложения немалых дополнительных средств. Более эффективным является предоставление потребителю универсального программного обеспечения, пригодного для решения широкого круга задач. Однако, опыт внедрения такого программного обеспечения (ПО) показал, что даже при открытом описании вычислительных алгоритмов, их реализация на практике требует высокой квалификации аналитика и не всегда обеспечивает желаемый результат. Корректное применение разработанных программ является задачей высокопрофессиональной и требует привлечения экспертных знаний и повышение уровня квалификации работников.

Следовательно, создание таких \\^еЬ-ориентированных гибридных ЭС, в которых знания экспертов применяются при выборе алгоритма вычислений в хорошо формализованных областях знаний, является актуальной задачей. Поэтому в Иркутском государственном университете путей сообщения существует научное направление, в рамках которого создается ЭС, позволяющая выполнить разработку градуировочной функции конкретной методики анализа (в аналитическом виде), основываясь на знаниях экспертов в области РФА. ЭС разрабатывается как \УеЬ-приложение, что позволит осуществлять повышение квалификации инженерных кадров без отрыва от производства и интерактивно решать сложные методические задачи, связанные с построением математических моделей предметной области, а так же привлекать к решению задач сторонних экспертов.

Целью настоящих исследований является разработка технологии построения \¥еЬ-ориентированных гибридных экспертных систем.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Основываясь на системном подходе разработать методику проектирования \\^еЬ-ориентированных гибридных ЭС, предназначенных для использования в Интернет.

2. Разработать модель управления знаниями в гибридных ЭС и методику их конвертации в унифицированную реляционную логическую модель базы данных.

3. Выполнить проектирование и разработку оболочки для создания гибридных экспертных систем в Интернет.

4. Разработать быстрый прототип ЭС для построения градуировочной функции в РФА.

Объектом исследования являются \УеЬ-ориентированные гибридные

ЭС.

Предметом исследования служат модели управления и структурирования знаний, данных и технологии программирования ^¥еЬ-ориентированных гибридных ЭС.

Методами исследования являются методы системного анализа, методы классификации, теории множеств, методологические основы теории представления структур данных и знаний, онтологический подход к представлению знаний, объектный подход (анализ, проектирование, программирование), методы проектирования и реализации ЭС и \¥еЬ-приложений, гибридный подход к созданию ЭС.

Научную новизну работы составляют и на защиту выносятся следующие положения:

1. Методика моделирования процесса управления знаниями и данными гибридных ЭС, предназначенных для использования в Интернет, основанная на системном подходе к моделированию основных этапов жизненного цикла ЭС и реализации принципа множественности, позволяющего интегрировать в единую среду разработки множество информационных, физических и математических моделей для описания отдельных элементов и системы в целом.

2. Методический подход к разработке унифицированного представления знаний в Web-opиeнтиpoвaнныx гибридных ЭС, включающий модель представления знаний в виде фреймовых субиерархий и методику их конвер-

тации в унифицированную реляционную логическую модель базы данных, адекватную онтологии произвольной предметной области.

3. Подход к проектированию программного обеспечения ЭС, основанный на двухуровневой структуре управления данными и знаниями, и результат его применения в виде двух управляющих компонентов.

4. Обобщенная гибридная модель знаний ЭС для построения градуиро-вочной функции в рентгенофлуоресцентном анализе.

Практическая значимость работы. Оболочка ЭС реализована в виде универсального программного средства, позволяющего разрабатывать гибридные экспертные системы в различных предметных областях. При этом вся работа экспертов и пользователей ЭС выполняется в режиме реального времени через Интернет, что позволит большому числу пользователей одновременно работать с системой. Такие экспертные системы могут найти применение не только в решении практических задач, но и в профессиональном образовании. Web-ориентированная экспертная система для обучения основам использования математических моделей возбуждения интенсивности рентгеновской флуоресценции, разработанная в рамках диссертации, может быть использована специалистами при разработке методик анализа с использованием рентгеновских спектрометров. А таких спектрометров отечественного производства (ЗАО «Научприбор») на предприятиях металлургии, цементной и стекольной промышленности, в машиностроении и в научных учреждениях более 500. Также, используются аналитические комплексы импортного производства.

Апробация работы. Результаты работы докладывались и обсуждались на: V и VI Всероссийской конференции по рентгеноспектральному анализу (Иркутск, 2006, Краснодар, 2008); VIII Школы-семинара молодых ученых «Математическое моделирование и информационные технологии: управление, искусственный интеллект, прикладное программное обеспечение и технологии программирования» (Энхалук, 2006); XII Международной конфе-

ренции «Информационные и математические технологии в научных исследованиях (Иркутск, 2007); III научно-практической интернет-конференции «Проблемы и перспективы формирования образовательного пространства в условиях становления информационного общества» (Иркутск, 2010); II межвузовской научно-практической конференции «Транспортная инфраструктура сибирского региона» (Иркутск, 2011).

Публикации. Основное содержание работы оп