Логические алгоритмы формирования объяснений в причинно-следственных отношениях объектов предметной области

Бурлаченко, Татьяна Борисовна

Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Логические алгоритмы формирования объяснений в причинно-следственных отношениях объектов предметной области

кандидата технических наук: Бурлаченко, Татьяна Борисовна
город: Москва
год: 2008
специальность ВАК РФ: 05.13.11

Автореферат по информатике, вычислительной технике и управлению на тему «Логические алгоритмы формирования объяснений в причинно-следственных отношениях объектов предметной области»

Автореферат диссертации по теме "Логические алгоритмы формирования объяснений в причинно-следственных отношениях объектов предметной области"

□03455000

На правах рукописи

Бурлаченко Татьяна Борисовна

ЛОГИЧЕСКИЕ АЛГОРИТМЫ ФОРМИРОВАНИЯ ОБЪЯСНЕНИЙ В ПРИЧИННО-СЛЕДСТВЕННЫХ ОТНОШЕНИЯХ ОБЪЕКТОВ ПРЕДМЕТНОЙ ОБЛАСТИ

Специальность 05.13.11 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»

АВТОРЕФЕРАТ на соискание учёной степени кандидата технических наук

5 ДЕК »

Москва 2008

003455000

Диссертация выполнена на кафедре "Автоматизированные системы обработки информации и управления" (ИТ-7)

Защита диссертации состоится 23 декабря 2008 года в 14 часов на заседании Диссертационного Совета Д 212.133.01 Московского государственного института электроники и математики (технического университета) по адресу: 109028, Москва, Б. Трехсвятительский пер., д. 1-3/12, стр. 8, МИЭМ.

С диссертацией можно ознакомиться в библиотеке Московского государственного института электроники и математики (технического университета).

Автореферат разослан « » ноября 2008 г.

Московский Государственный Университет Приборостроения и Информатики (МГУПИ)

Научный руководитель: кандидат физико-математических наук,

доцент

Татьяна Юрьевна Морозова

Официальные оппоненты: доктор технических наук,

старший научный сотрудник Эдуард Дзеронович Аведьян

доктор технических наук, доцент

Сергей Николаевич Никольский

Ведущая организация: ООО «КБ «ЭлектронСистема»

Учёный секретарь Диссертационного Совета к.т.н., доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы

Актуальность задачи разработки логических алгоритмов формирования объяснений в причинно-следственных отношениях объектов предметной области не вызывает сомнения, т.к. данная тематика соответствием утвержденному Президентом Российской Федерации приоритетным направлениям развития науки, техники и критических технологий Российской Федерации, и в частности развития информационно-телекоммуникационных систем и разработки интеллектуальных систем управления (нормативные документы от 21.05.2006г. №№ Пр-842 и Пр-843).

В настоящее время компьютерные технологии используются практически во всех областях человеческой деятельности. С их помощью строятся модели предметных областей для решения задач, таких как управление, поддержка принятия решений и т.д. При этом выделяют класс трудно формализуемых предметных областей, которые используются, в частности, для решения задач при наличии неполной информации. Алгоритмов решения подобных задач очень мало. В связи с этим актуальной является разработка логических алгоритмов решения задач с неполной информацией.

Для решения поставленной задачи в данной работе рассматривалась проблема технической диагностики объектов. Хорошо известно, что одной из главных проблем предупреждения технических аварий, равно как и колоссальных потерь от природных катастроф, является отсутствие необходимого уровня обеспечения методами и средствами измерений, испытаний, диагностики и сертификации продукции.

Техническая диагностика представляет теорию, методы и средства обнаружения и поиска дефектов объектов технической природы. Ее основное назначение состоит в повышении надежности объектов на этапе их производства, эксплуатации и хранения. Причины неисправного и неработоспособного технического состояния объекта могут быть детализированы путем указания соответствующих дефектов, нарушающих исправность, работоспособность или правильность функционирования и относящихся к одной или нескольким составным частям объекта, либо к объекту в целом.

Обнаружение и поиск дефектов являются процессами диагностирования технического состояния любого объекта, которое осуществляется аппаратными или программными средствами. При разработке систем диагностирования должны решаться задачи изучения объекта, его возможных дефектов и признаков проявления, выбора или неисправных модификаций.

Для того, чтобы работа данной системы была оптимальной с точки зрения применения и обслуживания, необходимо сделать ее максимально независимой от человека. В этом случае встает вопрос о создании автоматизированной системы. Для достижения данной цели использовалась система с искусственным интеллектом. Она помогла решить технические вопросы на человеческом языке на основе машинного обучения и автоматического доказательства теорем.

Предполагалось, что она подобно человеку будет способна к обучению -решению задач, с которыми она ранее не встречалась. В связи с этим, можно предположить, что в качестве системы технической диагностики объекта возможно использование автоматизированной системы обучения, т.к. она полностью соответствует предъявляемым к системе диагностирования требованиям.

Применяя в качестве программного средства диагностирования логические подходы, часть знаний должна использоваться для рассуждений, обеспечивающих объяснения выведенных заключений. Но при обучении системы возможны ситуации, связанные с неполной информацией. Например, когда знаний обучаемого (в качестве обучаемого рассматривается информационная система) недостаточно для того, чтобы построить объяснение и/или доказательство некоторого наблюдаемого факта. В терминах технической диагностики можно сказать, что система не сможет построить объяснение и/или доказательство некоторого наблюдаемого факта - определить дефекты, ставших причиной неработоспособного состояния объекта. В этом случае решением задачи становится выявление и установление причинно-следственных связей. К данному классу задач применение алгоритмов вывода по аналогии, индуктивных и дедуктивных логических выводов невозможно, т.к. для своей работы они требуют наличия всей информации об объекте. В настоящей диссертации для объяснения наблюдаемых (или установленных) фактов в условиях неопределенности использовался абдуктивный вывод.

В работах Вагина В.Н., Головиной Е.Ю., Ашинянца P.A., A.Goel, J.Ramanujam сформулированы определение и теоретические основы абдуктивного вывода: поставлена задача абдуктивного вывода, определены пути ее решения. Но нет практической реализации данной теории. Фактически не исследовано применение абдуктивного вывода к задачам технической диагностики в условиях неполной информации.

В связи с этим актуальной является задача разработки новых методик и алгоритмов решения задач при наличии неполной информации об объекте с целью построения модели принятия обоснованного решения, результат работы которых — это выявление причинно-следственных отношений объектов, возникающих в процессе работы (действия) данного объекта.

Цели и задачи исследования

Целью работы является разработка логических алгоритмов формирования объяснений в причинно-следственных отношениях объектов предметной области. Обоснованность алгоритмов подтверждается установлением причин, вызвавших следствие, на основании которого выработано решение.

В соответствии с этим в диссертационной работе поставлены и решены следующие основные задачи:

1. Проведен обзор существующих методов логического вывода.

2. Обосновано применение формального концептуального анализа и абдуктивного вывода к решению задач формирования объяснений в причинно-следственных отношениях объектов.

3. Описана теоретическая база абдуктивного вывода.

4. На основе рассмотренных характеристик систем искусственного интеллекта доказана возможность и целесообразность использования нейронных сетей в качестве аппарата реализации алгоритма абдуктивного вывода.

5. Разработаны модели и алгоритмы решения задачи абдукции с помощью нейронных сетей.

6. Поставлена и решена задача оптимизации абдуктивного вывода.

7. Решена конкретная практическая задача на основании абдуктивного метода с использованием нейронной сети Хопфилда.

Научная новизна исследования состоит в следующем:

1. Применение нейронных сетей для решения задачи абдукции является новым и более эффективным средством реализации, в связи с чем, можно говорить о важности и новизне данных исследований в методах автоматизации обучения.

2. На основе имеющихся данных предложена методика выявления причинно-следственных связей и алгоритмы принятия обоснованного решения.

3. Поставлена и решена задача оптимизации абдуктивного вывода, выделяющая оптимальное решения из ряда возможных.

4. Использование нейронных сетей для реализации алгоритма абдуктивного вывода дает возможность получать обоснованные объясняющие тексты в обучающих системах или предполагаемые решения в сложившейся ситуации (советы) в системах принятия решений.

5. В целях реализации поставленной задачи предложена и доказана возможность использования нейронной сети Хопфилда, с помощью которой решается задача оптимизации абдукции.

Методы исследования

Для решения поставленных задач в работе использованы методы математической логики, теории множеств, искусственного интеллекта, логического программирования, машинного обучения, нейронных сетей.

Теоретическая и практическая ценность полученных результатов

Теоретическая значимость диссертационной работы состоит в разработке подхода к абдуктивной модели автоматизированного обучения. Практическая ценность работы заключается в возможности реализации полученных алгоритмов в виде интеллеюуальных систем самообучения.

Все результаты доведены до удобных аналитических формул и алгоритмов. Предложенная в диссертации программа создана для решения задач установления причинно-следственных связей, определяющих отношения объектов предметной области, формирования и вывода оптимальных причинных

гипотез и поясняющих текстов, что используется в системах, требующих построения объяснений в реальном времени.

Полученные результаты являются инструментом для принятия решений в системах автоматизированного обучения.

Получен акт о внедрении отдельных результатов работы.

Апробация работы

Основные положения и результаты диссертационной работы докладывались и обсуждались на кафедре «АСОИУ» Московского государственного университета приборостроения и информатики, Научно-техническом семинаре (конференция) «Современный менеджмент, модели совершенства, управления общественными процессами» (Дивноморск, 2006), Международной научно-технической конференции «Информационные технологии в науке, технике и образовании» (Сусс-Хургада-Москва, 2006), Международной научно-практической конференции «Современные направления теоретических и прикладных исследований» (Одесса, 2007), Международной научно-практической конференции «Современные направления теоретических и прикладных исследований '2008» (Одесса, 2008)

Публикации

По теме диссертации опубликовано 8 научных работ, в том числе 2 в журналах, входящих в перечень ВАК Минобрнауки, оформлено свидетельство о регистрации программ для ЭВМ.

Объём и структура диссертации

Диссертационная работа изложена на 143 страницах машинописного текста, состоит из введения, четырех глав, заключения, библиографического указателя, включающего 123 источников, иллюстрирована 20 рисунками и 2 таблицами.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается выбор темы исследований, ее актуальность. Определяются основные цели и задачи диссертационной работы. Приводятся основные положения, выносимые на защиту. Описывается структура работы. Формулируется научная и практическая ценность диссертации, приводятся ее основные результаты.

В первой главе описана задача технической диагностики объектов. Показана возможность использования автоматизированной системы обучения в качестве системы диагностирования. Приведен обзор и сравнение существующих стратегий и методов в области автоматизированного обучения систем. В результате данного анализа показано, что в теории автоматизированного обучения недостаточно освещен вопрос решения задач, связанных с неполной информацией. Подобные задачи имеют место, когда знаний обучаемого, в качестве которого рассматривается информационная система, недостаточно для

того, чтобы построить объяснение и/или доказательство некоторого наблюдаемого факта. В связи с этим поставлена задача поиска алгоритмов формирования объяснений в причинно-следственных отношениях объектов.

Показано, что к задачам с подобной логикой неприменимы индуктивные, дедуктивные методы, алгоритмы по аналогии, т.к. они для своей работы требуют наличия полной информации о рассматриваемой предметной области или объекте.

Доказано, что данный вид задач можно решать лишь при использовании формального концептуального анализа или абдуктивного вывода, т.к. они позволяют структурировать и формировать логические правила для выявления причинно-следственных связей в задачах при наличии неполной информации. В конце первой главы сформулирована постановка задачи исследования. Вторая глава посвящена формальному концептуальному анализу и абдуктивному выводу, которые позволяют решать задачи выявления причинно-следственных связей объектов при наличии неполной информации. Два понятия, сформулированные в целях исследования второй главы, рассмотрены применительно к поставленной задаче.

I. Формальный концептуальный анализ (ФКА) относится к методу построения модели предметной области на основе интеллектуального анализа данных. Он применяется к структурированию и формированию логических правил для установления причинно-следственных связей.

Особенность этого метода состоит в его ориентации на задачи, для которых использование традиционных статистических методов вызывает большие затруднения. Целью технологии анализа данных является производство нового знания, выявления отношения в данных. ФКА позволяет получить из неструктурированной информации структурированную.

На основе приведенных в работе теоретических описаний ФКА выведен алгоритм его работы:

1. Запись имеющихся данных в виде таблицы, в которой строки представляют собой множество объектов С, а столбцы - множество атрибутов М.

2. Установление известных взаимосвязей между объектами и атрибутами (бинарныеотношения ).

3. Определение отношений между объектами и атрибутами.

4. Построение концептуальной решетки на основании установленных концептов, образованных из множества объектов и множества атрибутов. Данная решетка позволяет исследовать и интерпретировать отношения

между концептами, объектами и их атрибутами.

Работа созданного алгоритма продемонстрирована на конкретном примере, с помощью которого доказано, что концептуальная решетка служит для наглядного представления связей между объектами и атрибутами.

Анализ работы алгоритма позволяет утверждать, что ФКА делает связи между понятиями явными и тем самым помогает из неструктурированной информации получить структурированную. Во второй главе сделан вывод: ФКА служит для выявления причинно-следственных отношений объектов при наличии

неполной информации, причем для расшифровки концептуальной решетки, получаемой в результате работы алгоритма, не требуется дополнительных знаний, т.к. она является довольно простотой и наглядной.

Наравне с положительными сторонами ФКА были выявлены и недостатки данного подхода:

1. Большое количество признаков влечет за собой большой размер таблицы, что замедляет работу алгоритма и загромождает визуальную картину.

2. Результирующая таблица не может содержать полной информации о каждом объекте.

3. Информация в таблице может быть противоречивой, причем противоречия обнаруживаются при непосредственном рассмотрении формального контекста.

4. Возможные противоречия данных можно разрешить только с помощью специалиста (т.е. человека), что не предусмотрено при постановке задачи в настоящей работе.

В связи с вышеперечисленными недостатками ФКА сделан вывод: данный метод не является оптимальным для реализации алгоритма формирования объяснений в причинно-следственных отношениях объектов.

II. Вторым методом, который рассмотрен в данной главе, является абдуктивный вывод.

В данной работе выведено следующее определение абдукции: Абдукция - это процесс вывода высказывания, которое объясняет заданный набор данных, или процесс вывода причины из следствия или построения объяснений для наблюдаемых данных.

Приведено сравнение с классическим определением абдукции, выявлены его положительные и отрицательные стороны.

Следуя Ч. Пирсу, под абдукцией следует понимать методы анализа рассуждений, в которых требуется найти подходящую гипотезу для того, чтобы построить корректную логическую связь между исходными посылками и предполагаемым следствием из этих посылок.

С помощью диаграмм Хассе решено несколько простых абдуктивных задач, на основе которых показано, что абдукцией не является простая энтимема, т.е. рассуждение с пропущенной посылкой. Абдуктивный вывод используется в более сложных случаях.

Для определения Ч. Пирса разработан алгоритм абдуктивного вывода. Его работа заключается следующем: при исходных посылках Р и предполагаемом следствии <2 определяются недостающие звенья цепи так как случай

разрыва в этой цепи означает, что суждение не является следствием

исходных посылок. Список пар, полученных в результате работы алгоритма, является полным списком этих недостающих звеньев, т.е. гипотез.

Применение данного алгоритма к конкретной практической задаче выявило значительный недостаток данного метода решения. Для работы алгоритма необходимо строить структуру рассматриваемого объекта. Это значительно усложняет процесс решения при большом количестве признаков и свойств

объекта, т.к. эта диаграмма становится слишком громоздкой и, как следствие, сложной для обработки.

Отказавшись от использования диаграмм Хассе в абдуктивном выводе, в диссертации принято решение продолжить поиск оптимального алгоритма формирования объяснений причинно-следственных связей объектов.

В качестве абдуктивного правила вывода принята следующая форма записи

<2, Р причина 2 - ,

которая звучит следующим образом: если истинно 0 и Р является причиной Q, то истинно Р.

База знаний при абдуктивном выводе представляется следующим образом: 1 .Р^>() правило (главная посылка).

2. Р причина (второстепенная посылка).

3. <2 цель, следствие (вывод).

На основе приведенных определений и теоретических основ выведен общий алгоритм принципа абдукции.

1 шаг Из множества правил находится правило, содержащее целевое

утверждение.

2 шаг Из найденного правила на шаге 1 формируется пара <£)„ Лр>. Левая часть

содержит множество подцелей (дизъюнкты выбранного правила без дизъюнкта, характеризующего целевое утверждение). Правая часть содержит множество абдуцентов, изначально равное нулю.

3 шаг Из списка существующих правил производится поиск утверждения,

которое исключает одну из подцелей, образуя резольвенту после выполнения процедуры унификации.

4 шаг Если для некоторой подцели в множестве предпосылок (правил, фактов)

находятся два дизъюнкта, содержащих две контрарные пары для данной подцели, для каждой пары образуются после унификации соответствующие резольвенты, которые включаются в оставшееся множество подцелей, объединенных оператором ИЛИ. Таким образом, формируется новое подмножество подцелей.

5 шаг Если среди элементов множества подцелей найдутся дизъюнкты, не

имеющие контрарных пар в множестве предпосылок, эти дизъюнкты переносятся в множество абдуцентов.

6 шаг Цикл из шагов 3-5 повторяется до тех пор, пока множество подцелей не

станет пустым, и окончательно сформируется множество абдуцентов.

7 шаг Осуществляется проверка. Полученное множество абдуцентов

добавляется в базу знаний в качестве второстепенных посылок. Тогда целевое утверждение становится доказуемым с помощью дедукции. Проверка работы алгоритма на конкретном примере позволила определить наиболее подходящее средство реализации данного метода вывода.

Основываясь на том, что часть исследований в области абдукции была сделана с использованием логического и вероятностного подходов, в третьей главе предпринята попытка описать принцип работы абдукции применительно к нейронной структуре и доказать оптимальность использования сетей для реализации алгоритма формирования причинно-следственных отношений объектов предметной области.

Анализ возможности нейронных сетей (НС) показал, что они предполагают покрытие почти полного диапазона задач абдукции и обеспечивают точные решения. Способность нейросетей к выявлению взаимосвязей между различными параметрами дает возможность выразить данные большой размерности более компактно, если данные тесно взаимосвязаны друг с другом. Обратный процесс — восстановление исходного набора данных из части информации. Известный как (авто) ассоциативная память этот процесс позволяет также восстанавливать исходный сигнал/образ из зашумленных/поврежденных входных данных.

Нейроподобные модели известны как системы параллельной и распределенной обработки информации или системы связей, что говорит в их пользу, поскольку данные свойства позволяют значительно увеличить скорость работы алгоритма и повысить эффективность результата его решения.

В главе 2 определение абдукции сформулировано следующим образом: абдукция - это процесс вывода причины из следствия или построения объяснений для наблюдаемых явлений.

С другой стороны нейронные сети - это класс алгоритмов, которые учат различать сходные и разнородные данные, т.е. производить их классификацию, используя учебный набор данных.

Проведенный анализ между этими определениями доказывает возможность использования НС для решения задачи абдукции. Абдукция может быть рассмотрена как обобщение из ряда наблюдений и синтеза гипотез для объяснения наблюдений. При имеющемся наборе гипотез предполагается, что алгоритм абдукции выберет одну из них, которая лучше всего объяснит наблюдаемые данные так, как она их понимает.

Для проектирования нейронной сети, которая бы решала задачу абдукции, использована 2-слойная архитектура (рис.1), в которой

- 1 слой состоит только из наблюдений,

- 2 слой состоит только из гипотез.

Рисунок 1. Двухслойная нейронная архитектура.

Проверка данной теории на практических задачах показала, что при решении сложных задач абдукции, когда для объяснения всех наблюдений недостаточно одной гипотезы, необходимо использовать третий слой - промежуточный (рис. 2).

СГ СО СП

Данный слой необходим для работы с объединением гипотез. Особенность этой архитектуры именно в наличии этого промежуточного слоя. Он используется только тогда, когда некое наблюдение можно объяснить только с помощью нескольких гипотез. Узлы на этом слое действуют как сложная гипотеза, представляющая собой объединение всех связанных гипотез.

Представленная трехслойная модель работает на основе конкуренции между гипотезами.

Представленный в работе алгоритм является итерационным. Он состоит из двух этапов:

1 - процесс инициализации сети;

2 - процесс конкуренции между гипотезами.

На первом этапе каждой гипотезе присваивается определенное значение, учитывающее степень доверия и объяснительное покрытие данных. Эти величины позволяют проводить сравнение между гипотезами. Далее на каждой итерации второго этапа происходит вычисление обновленного значения гипотез из слоя СГ до тех пор, пока сеть не стабилизируется. В результате одна или несколько гипотез выиграют конкуренцию и войдут в заключительный набор элементарных гипотез, с помощью которого можно объяснить наблюдения полностью, после чего следует проверка результата.

Для проверки работы алгоритма использован наглядный пример, результаты которого были отмечены на диаграмме, отображающей зависимость значений конкурирующих гипотез от различный временных интервалов (рис. 3).

Номер итерации

Рисунок 3.

Удалось доказать, что некоторые гипотезы затухают и принимают значение близкое к нулю, а две другие сохраняют работоспособность до завершения алгоритма.

Таким образом, показано, что фактически, одна гипотеза является явным победителем, а другая стабилизируется в значении, не равном нулю. Результаты диаграммы говорят о том, что выведенный алгоритм позволяет выявить ложную или неполную гипотезы и повышает значение правильной, соответствующей гипотезы. Другое важное следствие заключается в том, что на выходе алгоритма получаются реальные выходные значения, которые рассматриваются в виде степени доверия выводимой гипотезы.

В диссертации важная роль отведена оптимальности выводимого алгоритма решения абдуктивной задачи и оптимизации самой задачи абдукции, т.е. полученного решения. Поэтому в данной главе описан еще один метод выявления причинно-следственных отношений, использующий нейронную сеть Хопфилда. Выбор конкретной сети основан на результатах обзора и сравнения свойств сетей. Главным критерием, говорящим в пользу сети Хопфилда, является возможность просто и эффективно решать задачи воссоздания данных по неполной и искаженной информации.

Приведено определение оптимизации задачи абдукции, которая определяется свойством минимальности составной гипотезы: составная гипотеза #с, является лучшим объяснением наблюдаемых данных £><?, нежели другая составная гипотеза Нс2, если количество компонент первой меньше количества компонент второй, |Яс1| < |Яс2|. Формализована задача следующим образом:

если Я е Г, где Г = (Моа,МПр), то Нс min, т.е. учитывая, что Нс =col(h„h2,...,hL) dim# -»min.

Здесь Нс - подмножество множества гипотез Н, являющееся лучшим объяснением наблюдаемых данных D0, которое образует сложную (составную) гипотезу путем синтеза из набора простых гипотез А/, h2,...; Г-область допустимых простых гипотез, Mon - максимальное объяснительное покрытие данных, МпР - максимальное правдоподобие гипотезы, dim//. - вектор, элементы которого являются простыми гипотезами.

В данной главе доказано, что при решении задачи оптимизации абдукции могут возникнуть спорные ситуации между условиями области определения Г и самой постановкой задачи. Для решения этой проблемы установлено отношение приоритета, в соответствии с которым максимальное покрытие данных имеет наивысший приоритет, а наличие минимального количества гипотез — наименьший.

Т.к. синтез сложных гипотез требует значительных вычислений, следует максимально увеличить скорость синтезирования сложных объяснений из

элементарных гипотез, что становится возможным при использовании принципа параллельности. Этот вывод объясняет использование искусственных нейронных сетей для решения поставленной задачи.

Джон Хопфилд предложил нейронную сеть с сильно связанными нейронами, которую можно использовать для решения задач оптимизации. Важность этой модели заключается в возможности быстро находить приемлемые решения, хотя среди этих решений может и не быть оптимального. Акцент в данной модели делается на использование принципа параллельности, что является важным для поставленной в данной работе задачи. Работа модели заключается в поиске локальных минимумов функции энергии, которые являются устойчивыми состояниями сети.

При использовании нейронных сетей, необходимо преобразовать задачу в вычислительную модель нейронной сети. Для решения задачи синтеза абдукции нейронная переменная V) связана с каждой гипотезой АеЯ,. Здесь ^ - это накопительная функция, а Я, - подмножество Н, в котором каждая гипотеза А е Нг может объяснить некоторое непустое подмножество данных О0. Таким

образом определяется, включена ли простая гипотеза в составную.

Минимизировать количество элементов составной гипотезы ¿К удалось,

вводя следующее ограничение: все входные данные ¿еО0 должны быть объяснены полностью, т. е.

где — элементы матрицы инцидентности.

Далее будем принимать: У] - принадлежность простой гипотезы к сложной,

Q,J — значение матрицы инцидентности, связывающей гипотезы Л, и элементы данных е £>0.

Учитывая, что (¿1} по определению может принимать значения 0 или 1, введено следующее выражение:

Здесь первое слагаемое в фигурных скобках описывает ограничение задачи и приравнивается к нулю, в случае удовлетворения ограничения, и к единице в противоположном случае. Второе слагаемое следует приравнивать к нулю, когда гипотеза Ир объясняющая элемент данных с!1 е Д, входит в составную, т. е. У}=1. Это выражение удовлетворяет следующим условиям:

1. Каждое произведение не может быть отрицательным.

2. Каждое произведение приравнивается к нулю, когда гипотеза, объясняющая исходную величину, входит в составную. Иначе, произведение принимает значение единицы.

3. Сумма произведений равна нулю в случае, когда определен состав гипотез, необходимый для объяснения всех данных.

Учитывая вышеописанное выражение, определено значение Е составной гипотезы, которое принимает вид:

где а и р — положительные константы, р » а, т.к. объяснительное покрытие имеет больший приоритет, чем количество гипотез.

Первое слагаемое в формуле определения значения составной гипотезы представляет собой количество элементов составной гипотезы, а второе слагаемое — величину штрафа за отсутствие полного покрытия, которая принимает значение нуля в случае полного покрытия данных. Т.о., составная гипотеза, имеющая минимальное значение £, является наилучшим решением для рассматриваемой задачи.

В настоящей главе описан пример работы данной модели. При трех элементах данных и трех объясняющих гипотезах необходимо определить оптимальное решение.

В данном примере продемонстрировано избыточное объяснительное покрытие. Показано, что именно для его исключения из итогового решения и необходима задача оптимизации абдуктивного вывода. Также доказана ее оптимальность для поставленной в диссертации задачи.

В четвертой главе приведены основные практические результаты исследования, этапы создания и внедрения программно инструментального средства реализации задачи абдукции.

Рисунок 4. Покрытие трех элементов данных тремя гипотезами.

Обоснован выбор языка программирования, использованного в качестве реализации поставленной задачи.

Представленная программа спроектирована на основе использования алгоритмов абдуктивного вывода и работы сети Хопфилда, ориентирована на решение задачи при наличии неполной информации. В рамках автоматизации процесса обучения реализован процесс формирования объяснений в причинно-следственных отношениях объектов.

В качестве примера взята проблема отказа работы сети. Определены правила и следствия.

В качестве положительных результатов создания и внедрения программы можно выделить:

1. Использование современных и перспективных методик автоматизации процесса обучения, ориентированных на решение задач при наличии неполной информации, основанных на имитации реальных проблем отказа сети.

2. Возможность проведения обучения без участия человека как учителя.

3. Возможность осуществления имитационных экспериментов с целью анализа причинно-следственных отношений изучаемых предметных областей, в данном случае, работа сети.

4. Оптимизация абдуктивного вывода, т.е. определение огттимального решения из ряда возможных.

5. Возможность пользователям программы использовать предоставляемые поясняющие тексты в качестве объяснений наблюдаемого факта и, при необходимости, рекомендаций к устранению дефектов (например, наладка работы сети).

Программная часть, определенная как система выявления причинно-следственных отношений объектов предметной области, включает в себя модули, обеспечивающие ввод и редактирование правил с возможностью присваивания каждому из них значения истинности, формирование причинных гипотез и оптимизация абдуктивного вывода по принципу минимизации входящих в итоговое решение (сложную гипотезу) элементарных причинных гипотез. Процедура минимизации позволяет вычислить оптимальное решение из нескольких возможных. Ряд служебных функций расширяют возможности программы.

Результаты внедрения подтвердили эффективность проведенных в работе исследований. Также в настоящей главе приведены теоретические и практические обоснования оценки качества алгоритмического обеспечения представленной в диссертации программной системы.

В заключение диссертации приведены основные результаты и выводы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. В процессе выполнения диссертационного исследования проведён анализ технической диагностики объектов. Доказано, что в качестве системы диагностирования возможно использование автоматизированной системы обучения. Проведен анализ автоматизации систем обучения. Показано, что в данной теории недостаточно освещен вопрос решения задач, связанных с неполной информацией, что не позволяет в полной мере автоматизировать процесс принятия обоснованного решения.

2. Для решения задачи выявления причинно-следственных отношений объектов представлены формальный концептуальный анализ и абдуктивный вывод. Рассмотрены оба подхода с описанием алгоритмов, примеров их работы, положительных и отрицательных сторон.

3. Показано, что использование абдуктивного вывода является наиболее подходящим для решения задач с подобной логикой.

4. Для решения задачи абдукции предложено использовать нейронную структуру. Доказано, что использование нейронных сетей является оптимальным для реализации алгоритма формирования причинно-следственных отношений объектов с точки зрения быстроты работы и «независимости» от человеческого фактора.

5. Формализована задача оптимизации абдукции. Она определена как задача нахождения лучшего решения из нескольких возможных. На основе данной теории разработан математический аппарат формирования объяснений в причинно-следственных отношениях объектов, основанный на нейронной сети Хопфилда.

6. Создана программная реализация решения задачи формирования объяснений в причинно-следственных отношениях объектов, использующая за основу алгоритм абдуктивного вывода. Данная программа позволяет автоматизировать процесс технической диагностики объектов, а так же подготовки специалистов на предприятиях, вести оперативное консультирование по вопросам принятия обоснованного решения в условиях реального времени.

Получено свидетельство о государственной регистрации программы для

ЭВМ №2008614218 от 3 сентября 2008 г.

Получено два акта о внедрении от ЗАО РДТЕХ и ЗАО "СФЕРА".

СПИСОК ОСНОВНЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Бурлаченко Т.Б. Решение задач прогнозирования в системах с большой степенью неопределенности // Современный менеджмент, модели совершенства, управление общественными процессами: Тезисы доклада. Научно-практический семинар (конференция). - Дивноморск, АМИ,2006. -с. 120-123.

2. Бурлаченко Т.Б., Морозова Т.Ю. Модели прогнозирования, сравнение, области применения // Математическое моделирование и управление в сложных системах: Сборник научных трудов / Под общ. ред. А. П. Хныкина.

- М.: МГУПИ, 2006. - с. 20-24.

3. Бурлаченко Т.Б., Морозова Т.Ю. Применение нейронных сетей к обработке сигналов // Информационные технологии в науке, технике и образовании: Тезисы доклада. Сборник трудов Международной научно-технической конференции. - Сусс-Хургада-Москва, 2006. - с.254-259.

4. Бурлаченко Т.Б., Морозова Т.Ю. Выделение сигнала с помощью нейронных сетей // Современные направления теоретических и прикладных исследований: Тезисы доклада. Сборник научных трудов Международная научно-практическая конференция. Том 2. Технические науки. - Одесса: Черноморье, 2007. - с.15-19.

5. Бурлаченко Т.Б., Морозова Т.Ю. Модель нейрона, находящегося под действием шума // Вестник МГУПИ. №9. Технические и естественные науки.

- М., 2007. - с.45-50.

6. Бурлаченко Т.Б. Абдукция и нейронные сети // Современные направления теоретических и прикладных исследований: Тезисы доклада. Сборник научных трудов Международная научно-практическая конференция. Том 5. Технические науки, Физика и математика. - Одесса: Черноморье, 2008. -с.46-48.

7. Бурлаченко Т.Б., Морозова Т.Ю., Петров О.М. Использование нейронной сети Хопфилда для задачи абдукции // Наукоемкие технологии. №7. Том 9. -М.: Радиотехника, 2008. - с.5-10.

8. Бурлаченко Т.Б., Морозова Т.Ю. Нейросетевая оптимизация абдуктивных выводов в задачах диагностики технических систем // Мехатроника, Автоматизация, Управление. №8. - М., 2008. - с.19-23.

ЛР № 020418 от 08 октября 1997 г.

Подписано к печати 17.11.2008 г. Формат 60x84. 1/16. Объем 1,25 п л. Тираж 100 экз. Заказ № 206.

Московский государственный университет приборостроения и информатики

107996, Москва, ул. Стромынка, 20

Похожие работы

Информатика, вычислительная техника и управление
05.13.00