автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Научно-практические основы проектирования диагностической экспертной системы

кандидата технических наук
Пугачев, Евгений Константинович
город
Москва
год
1999
специальность ВАК РФ
05.13.06
Диссертация по информатике, вычислительной технике и управлению на тему «Научно-практические основы проектирования диагностической экспертной системы»

Текст работы Пугачев, Евгений Константинович, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)

ю

Московский государственный технический университет

имени Н.Э. Баумана

На правах рукописи

ПУГАЧЕВ ЕВГЕНИЙ КОНСТАНТИНОВИЧ

Научно-практические основы проектирования диагностической экспертной системы

Специальность 05.13.06 - Автоматизированные системы управления

ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук

Научный руководитель -доктор технических наук профессор

Соломатин Николай Михайлович

Москва 1999

ОГЛАВЛЕНИЕ

Введение..............4

Глава 1. Исследование процесса семантического информирования 16 1.1. Анализ и синтез основных аспектов семантического

информирования.........16

1.1.1. Формы представления семантической информации 23

1.1.2. Виды семантической информации .... 24

1.1.3. Основные преобразования семантической информации в процессе информирования . . 25

1.1.4. Анализ методов сжатия семантической информации.............27

1.2. Анализ модели семантического интерфейса ... 30

1.2.1. Дополнительные определения и понятия . . 30

1.2.2. Формализация условий семантического интерфейса 30

1.3. Синтез модели семантического интерфейса ... 37 Выводы по главе 1..........38

Глава 2. Исследование моделей представления знаний ... 40

2.1. Анализ моделей представления знаний .... 40

2.1.1. Модель семантических объектов .... 40

2.1.2. Продукционная модель......49

2.1.3. Фреймовая модель.......52

2.1.4. Модель семантических сетей ..... 56

2.2. Разработка обобщенного алгоритма синтеза

моделей знаний........59

2.3. Методика синтеза моделей.......61

Выводы по главе 2..........66

Глава 3. Исследование механизма логического вывода . . .67

3.1. Конкретизация способа представления знаний . . 67

3.1.1. Представление знаний конструктивной части СЭВМ с помощью фреймов......71

3.1.2. Представление знаний функциональной части СЭВМ...........77

3.2. Механизм логического вывода в продукционных системах ...........84

3.2.1. Формализация механизма логического вывода . 84

3.2.2. Процесс разрешения конфликтов . . . . 91

3.3. Механизм логического вывода применительно

к фреймам . .........94

3.3.1. Способы означивания фрейма.....94

3.3.2. Способы управления выводом во фреймовых системах..........100

3.4. Механизм логического вывода в семантических сетях 104

3.4.1. Способ сопоставления.......104

3.4.2. Перекрестный поиск........105

Выводы по главе 3..........107

Глава 4. Экспериментальные исследования и практические

реализации ...........109

4.1. Разработка и реализация алгоритма ядра диагностической экспертной системы . . . .109

4.1.1. Структура прикладной единицы базы

знаний...........109

4.1.2. Алгоритм функционирования механизма логического вывода.......114

4.2. Разработка и реализация модуля объяснений . .122 4.2.1. Обоснование целесообразности разработки

модуля объяснений........123

4.2.2. Реализация функций разработанного модуля

объяснения.........128

4.3. Разработка и реализация модуля накопления знаний 135

4.3.1. Обоснование целесообразности разработанного модуля накопления знаний......135

4.3.2. Основные функции разработанного

модуля накопления знаний.....138

4.4. Обоснование выбора инструментального средства проектирования ЭС.........141

4.4.1. Конкретизация требований к выбору инструментального средства.....143

4.4.2. Реализация основных конструкций разработанной экспертной системы.......147

Выводы по главе 4..........150

Заключение по диссертационной работе......151

Библиографический список литературы.......154

Приложения.............159

Введение

Существует класс задач, решение которых невозможно традиционными формальными методами. Этот класс задач определен как интеллектуальные задачи. К ним относятся: задачи интерпретации, диагностики, контроля, прогнозирования, планирования, проектирования и т.д. Выдвинутая концепция методов и средств искусственного интеллекта (ИИ) - есть парадигма решения такого ряда задач. При этом экспертные системы (ЭС) представляются как теория и практика одного из направлений исследований ИИ.

Начало первого этапа развития работ в области искусственного интеллекта приходится на конец 60-х годов [1]. Новая отрасль индустрии -производство интеллектуальных систем сформировалась в 80-е годы. Можно выделить следующие основные черты интеллектуальных систем: наличие человека, который взаимодействует с ней; возможность накапливать и получать новые знания; способность осуществлять рассуждения, характерные для человека.

Многие положения по искусственному интеллекту , которые изначально считались незыблемыми, оказались несостоятельными. Например, считалось, что все знания о той или иной проблемной области можно описать в рамках некой формальной теории и воспользоваться принципами доказательных рассуждений. Однако, принцип монотонности выводов в логических исчислениях для реальных проблемных областей оказался неверен. Связано это с тем, что во многих областях человеческой деятельности объекты, с которыми оперируют специалисты, не могут быть сведены к чисто синтаксическим объектам, характерным для математики.

Не решен окончательно вопрос о том, какова должна быть формальная модель представления знаний в интеллектуальной системе. Например, созданные пустые ЭС, в которых изначально были заложены известные способы (фреймы, продукции или семантические сети)

представления знаний и механизм рассуждения оказались неэффективными. Исследования показали, что жесткая фиксация модели представления знаний и способа получения решения в каждой проблемной области должна быть своя.

В настоящее время находят применение новые методы и технологии при создании интеллектуальных систем. Можно выделить когнитивную графику или виртуальную реальность, гипертекстовые и мультимедиа технологии. Главное назначение когнитивной графики состоит в том, чтобы служить средством, способствующим процессу порождения нового знания, пока, в голове человека [2]. Гипертекстовая технология может быть использована как инструментальное средство для создания интеллектуальной системы [3]. Мультимедиа технология позволяет вывести процесс общения человека с интеллектуальной системой на качественно новый уровень. К новому направлению ИИ можно отнести и интеллектуальные средства извлечения знаний [4].

К новым методам, которые используются при решении трудно-формализуемых задач или при получении грубого результата для принятия решения в реальном времени, можно отнести генетические алгоритмы (ГА) классифицирующие системы (КС), генетическое программирование (ГП), эволюционное программирование и эволюционные стратегии[5].

Генетические алгоритмы получили наибольшее распространение. В теории ГА используется понятие схемы, которая представляет собой троичные цепочки с символами «1», «2» и «*», где «*» - маска, вместо которой может быть подставлена «1» или «2». Генетический алгоритм ищет оптимальное решение в пространстве возможных решений. Генетические алгоритмы исследовались в литературе с различных сторон. В частности, полезен подход, изложенный в работе [6]. Здесь схемы рассматриваются как предикаты, что позволяет автору более глубоко исследовать свойства ГА.

Существует много модификаций ГА. Наличие нескольких способов решения ставит задачу сравнения их эффективности. Чаще всего это делается прямым экспериментом на реальной или модельной задаче, в теоретических оценках ГА интерпретируются как марковский процесс [7].

На основе генетических алгоритмов созданы КС [8,9], которые можно использовать как обучаемые системы управления. Классифицирующая система состоит из трех вложенных друг в друга систем: классификатора, системы обучения и ГА. Классификатор вложен в обучающую систему, которая формирует оценку правил. Порождение новых правил осуществляет генетический алгоритм. Основу классификатора составляет список правил вида «Если ..., ТО ...», где каждое правило снабжается числовой оценкой.

Генетическое программирование - это способ создания компьютерных программ для задач, алгоритм решения которых неизвестен заранее. Примером могут служить программы, написанные на языке Лисп. В работе [10] дан пример использования ГП для синтеза сложного автомата, приведены достаточно подробные сведения по машинному эксперименту со структурой идентификацией динамических систем. В 1997 году была проведена первая конференция по генетическому программированию.

В эволюционном программировании вместо цепочек ГА используется совокупность автоматов, каждый из которых пытается исходя из текущей информации предсказать состояние , соответствующее лучшему значению цены.

Метод «эволюционные стратегии» был разработан как стохастический метод нахождения глобального минимума функций многих переменных.

Многие исследовательские коллективы занимаются вопросами использования эволюционных вычислений и прежде всего генетические алгоритмы для нейронных сетей.

Одним из современных научных направлений искусственного интеллекта является нейрокомпьютинг. Задачей данного направления является разработка вычислительных систем шестого поколения -нейрокомпьютеров [11-13]. Нейрокомпьютеры состоят из большого числа параллельно работающих простых вычислительных элементов (нейронов). Элементы связаны между собой , образуя нейронную сеть. Они выполняют единообразные вычислительные действия и не требуют внешнего управления.

В настоящее время разработка нейрокомпьютеров ведется в большинстве промышленно развитых странах. Такие компьютеры позволяют за счет большого числа параллельно работающих вычислительных элементов решать целый ряд «интеллектуальных» задач с высокой эффективностью. Это задачи распознавания образов, адаптивного управления, прогнозирования, диагностики и т.д. Место программирования занимает обучение, которое состоит в том, чтобы корректировать веса связей. В результате корректировки каждое входное воздействие приводит к формированию соответствующего выходного сигнала. При переходе от программирования к обучению повышается эффективность решения «интеллектуальных» задач.

Отличительным свойством является то, что в нейронной сети нет локальных областей, в которых запоминается конкретная информация. Вся информация запоминается во всей сети. Толчком к развитию данного направления послужили биологические исследования. По данным нейробиологии нервная система человека и животных состоит из отдельных клеток - нейронов. Каждый нейрон связан с другими нейронами и выполняет сравнительно простые действия. Совокупная работа всех нейронов обуславливает сложную работу мозга.

По мнению большинства экспертов массовое распространение технологий нейронных сетей начнется в конце 90-х годов. В настоящее время наиболее массовым направлением является моделирование нейронных сетей на обычных компьютерах.

Разработки в области нейрокомпьютинга ведутся по следующим направлениям : разработка нейроалгоритмов и программные реализации нейросетей (создание специализированного программного обеспечения для моделирования нейронных сетей; разработка специализированных процессорных плат для имитации нейросетей).

Основными достоинствами нейрокомпьютеров от вычислительных устройств предыдущих поколений являются: огромное быстродействие, способность к обучению, высокая помехо- и отказоустойчивость, возможность использования новых физических принципов при аппаратной реализации.

Достоинства использования искусственных нейросетей очевидны, однако их практическое применение в экспертных системах сдерживается трудностью проектирования [14]. Каждая новая задача требует большой исследовательской работы. При построении диагностических экспертных систем эти проблемы стоят особенно остро из-за разнообразия проявления неисправностей (симптомов). Причины, по которым проектирование и обучение нейросетей пока еще остается не конструкторской, а исследовательской и экспериментальной задачей, следующие: не накоплен достаточный опыт, где применение нейросетей дало положительный результат; анализ работы нейросетей является нетривиальной задачей, поэтому требуется инструмент, облегчающий ее решение.

В существующих программных разработках находят все большее применение комбинированные методы и технологии искусственного интеллекта. Например, к принципиально новым подходам в разработке интеллектуальных поисковых систем можно отнести технологию, которая приведена в работе [15]. Указанная технология объединяет в себе метод адаптивного распознавания образов (АРО) и семантические сети. Она позволяет работать с информацией любого типа - текстом, графикой, видео и др. Метод АРО опирается на теорию нейронных сетей и позволяет осуществлять бинарную индексацию. Система, созданная на основе метода АРО функционирует как самоорганизующийся организм.

Применение технологии семантических сетей обеспечивает возможность использования естественного языка запросов и позволяет вести интеллектуальный поиск на основе баз знаний. Традиционные подходы к организации поиска информации можно разделить на три группы : методы индексного ( или двоичного) поиска, статистические методы и методы, основанные на базах знаний. Подход на основе семантических сетей реально объединяет статистический поиск и поиск на основе баз знаний. При этом используются смысловые значения слов для определения и классификации отношений, которые статистический поиск не отслеживает.

Системы, основанные на знаниях, предпочтительнее тех, которые базируются на двоичном поиске [15].

Другим примером использования комбинированного метода может служить интеллектуальная управляющая система, которая приведена в работе [16]. В данной статье рассматриваются принципы построения основных задающих блоков интеллектуальных управляющих систем. Показано, что накопление информации об управляемом объекте и внешнем окружении и использование ее для выработки подходящего решения возможны лишь при структурном объединении блока нейроподобных структур и блока размытой (нечеткой) логики . Согласованное функционирование этих блоков реализуется с помощью блока генетического алгоритмирования. Автор вышеуказанной работы делает вывод, что основным достижением при использовании нейроподобных структур является способность согласовывать плохо моделируемые нелинейные динамические системы.

Однако применение при этом классической для методов ИИ системы экспертных оценок можно считать непрактичным (за исключением очень простых приложений). Причина в том, что такой подход требует нереализуемо массивного набора правил типа «Если ..., тогда ...». Положение облегчает использование теории нечеткой логики. В этом

случае могут быть получены предметно-ориентированные экспертные системы и число правил обычно существенно снижается.

Среди программных продуктов, которые относятся к интеллектуальным системам и были удачно применены на практике можно выделить программу Deep Blue [17]. Данной системе удалось «передумать» не просто человека, а лучшего человека-эксперта в конкретной предметной области.

Причина успеха шахматной системы в использовании методов искусственного интеллекта. В основе данной системы для принятия решения традиционно используется оценочная функция, учитывающая статическую и динамическую силу фигур. Программа выбирает тот ход, для которого значение оценочной функции максимально. Важными задачами при этом являются построение вида оценочной функции и правильный подбор ее коэффициентов. Приоритет в исследованиях был отдан поиску на основе традиционных методов оптимизации (подбор коэффициентов), конкретно на методе минимаксного поиска в дереве вариантов, где роль веса узла выполняет значение оценочной функции. Данный метод в чистом виде имеет много недостатков, поэтому используют его разновидности.

«Альфа-бета-поиск» является разновидностью метода при помощи подбора коэффициентов. Он позволяет сократить перебор за счет отсечения ветвей тех решений, на которые найдено «опровержение». Дальнейшим развитием «альфа-бета-поиска» является «метод главного вырианта», при котором окно поиска резко сужается. Можно выделить адаптивное отсечение - эффективную надстройку над альфа-бета процедурой, основанную на динамическом мастабировании окон поиска.

Существует множество эвристических методов. К ним относится «убийственная эвристика» и эвристика пропуска хода. Суть первой в том, чтобы сначала поискать один-два парадоксальных решения, а затем переходить в обычный режим. Вторая допускает делать подряд два хода и,

и

если положение не улучшается, то данный вариант отсекается. Также эффективно используется метод циклического углубления.

Выбор однозначно оптимального решения остается до сих пор трудной задачей. Здесь большая роль отводится формальным методам принятия решений, многие из которых являются методами ИИ.

Секретом успешного применения Deep Blue является архитектура апп