автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем

кандидата технических наук
Катасёв, Алексей Сергеевич
город
Казань
год
2006
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем»

Автореферат диссертации по теме "Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем"

На правах рукописи

КАТАСЁВ Алексей Сергеевич

НЕЙРОНЕЧЁТКАЯ МОДЕЛЬ И ПРОГРАММНЫЙ КОМПЛЕКС ФОРМИРОВАНИЯ БАЗ ЗНАНИЙ ЭКСПЕРТНЫХ СИСТЕМ

05.13.18 - Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата технических наук

Казань 2006

Работа выполнена в Казанском государственном техническом университете

им. А.Н. Туполева

Научный руководитель: доктор технических наук, профессор

Глова Виктор Иванович

Официальные оппоненты: доктор технических наук, профессор

Захаров Вячеслав Михайлович

доктор технических наук, профессор Латыпов Рустам Хафизович

Ведущая организация: институт проблем информатики

Академии Наук Республики Татарстан (ИПИ АН Р'Г), г. Казань

Защита состоится «¿¿Г» 2006 г. в часов на заседании дис-

сертационного совета Д 212.0^9.01 в'Казанском государственном техническом университете им. А.Н. Туполева по адресу: 420111, г. Казань, ул. К. Маркса, д. 10, зал заседаний Учёного совета.

С диссертацией можно ознакомиться в библиотеке Казанского государственного технического университета им. А.Н. Туполева.

«/57> \

Автореферат разослан « Л>» НО&ОрЗ. 2006 г.

Учёный секретарь диссертационного совета

доктор физико-математических наук, профессои< //Я^С Дзнилаев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Глобальная информатизация стимулировала разработку в различных проблемных областях человеческой деятельности автоматизированных диагностических систем. Это, как правило, интеллектуальные системы, моделирующие процесс рассуждения эксперта при принятии им решения - экспертные системы (ЭС). Основным элементом ЭС является база знаний, представленная множеством систематизированных правил, описывающих закономерности предметной области. Данные правила формулируются экспертом или формируются на основе анализа больших статистических массивов данных.

В первом случае эксперт явно или неявно формализует свои знания, опыт и интуицию в рамках выбранной модели представления знаний. Это сложный процесс, требующий большой аналитической работы.

Второе направление связано с разработкой и применением новых математических методов, способных эффективно анализировать статистические данные и извлекать из них полезные знания при минимуме работы эксперта. Использование данного подхода перспективно для формирования баз знаний экспертных систем нового поколения - мягких экспертных систем - в таких предметных областях как медицина, промышленность, нефтяная отрасль и др.

Для всех из них характерны следующие особенности:

> резкое увеличение объёмов обрабатываемой информации;

> необходимость одновременной обработки разнотипной информации;

> её нечёткость, качественность и субъективный характер;

> отсутствие формальных подходов к решению задач;

> необходимость решать задачи, свойственные только человеку;

> многокритериальное^ решаемых задач в условиях нечёткости критериев.

Актуально создание интеллектуальных систем обработки информации, способных эффективно решать поставленные задачи в указанных условиях.

Исследованию данной проблемы посвящены работы следующих учёных: Заде Л.А., Ларичева О.И., Поспелова Д.А., Аверкина А.Н., Финна В.К., Вагина В.Н., Кобринского Б.А., Загоруйко Н.Г., Ярушкиной Н.Г., Паклина Н.Б., Батыр-шина И.З., Подольской М.А., Гловы В.И., Аникина И.В. и др.

Однако, несмотря на это, многие вопросы обработки данных в указанных предметных областях не рассматривались. .Таким образом, актуальной задачей является разработка адекватных моделей, эффективных алгоритмов и реализующих их программных комплексов формирования баз знаний экспертных систем. Решению этой задачи посвящена настоящая диссертация.

Объект исследования: базы знаний интеллектуальных человеко-машинных систем поддержки принятия решений — экспертных систем.

Предмет исследования: методы, модели, алгоритмы и стратегии получения знаний для экспертных систем.

Цель работы: повышение эффективности построения баз знаний нечётких экспертных систем на основе моделей и алгоритмов ин^длектуального анализа данных, формирующих правила принятия решений. .

Научная задача: разработка формальной модели, алгоритма её обучения и программного комплекса формирования баз знаний экспертных систем.

Достижение поставленной цели и задачи потребовало решения вопросов:

> анализа эффективности методов интеллектуальной обработки информации и стратегий получения знаний для экспертных систем;

> разработки нейронечёткой модели формирования баз знаний, алгоритма её обучения и правил инициализации параметров;

> реализации программного комплекса на базе нейронечёткой модели;

> выполнения исследований для оценки эффективности работы модели;

> обучения нечёткой нейронной сети на множестве обучающих выборок. Методы исследования. Для решения обозначенных вопросов использованы

методы математического моделирования, нечёткой логики, искусственных нейронных сетей, мягких вычислений.

Достоверность полученных результатов. Предложенные в диссертационной работе модели и алгоритмы обоснованы теоретическими решениями и не противоречат известным положениям других авторов. Практическая апробация и внедрение в промышленную эксплуатацию результатов работы подтвердили эффективность метода формирования баз знаний экспертных систем. Научная новизна работы заключается в следующем:

1) предложена нейронечёткая модель формирования баз знаний экспертных систем в рамках нечётко-продукционной модели представления знаний;

2) разработан алгоритм обучения нечёткой нейронной сети и правила инициализации её параметров;

3) обоснованы критерии качества обучения нейронечёткой модели. Теоретическая значимость работы заключается в разработке:

1) модели, расширяющей возможности получения знаний для использования их в механизмах выводов экспертных систем;

2) алгоритма настройки её параметров с точки зрения обучающей выборки. Практическая ценность диссертационной работы заключается в разработке

и реализации программного комплекса на базе нечёткой нейронной сети, производящего анализ статистических данных и формирующего систему нечётко-продукционных правил для их использования в экспертных системах.

По проблеме диссертационной работы опубликовано 18 работ, в том числе 1 статья в журнале из списка, рекомендованного ВАК РФ, 5 статей и 12 тезисов докладов.

С целью апробации основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях: международной конференции «Нечёткие множества и мягкие вычисления в экономике и финансах» (Санкт-Петербург, 2004); .второй ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2004); седьмой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург, 2004); международной научно-методической конференции «Инновационное образование в техническом университете» (Казань, 2004); региональной научно-м^-одической конференции «Профессиональные компетенции в структуре модели современного инженера» (Нижнекамск, 2005); третьей ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2005); меж-

дународной молодёжной научной конференции «Туполевские чтения», посвя-щённой 1000-летию города Казани (Казань, 2005); четвёртой ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2006).

Реализация результатов работы. Результаты исследования:

> внедрены в промышленную эксплуатацию в виде системы предупреждения аварийных ситуаций в процессах поддержания пластового давления, решающей задачу оперативного выявления утечек из водоводов;

> использованы при построении базы знаний экспертной диагностической системы в вертеброневрологии на данных развития и особенностей клинических проявлений остеохондроза поясничного отдела позвоночника;

>■ внедрены в учебный процесс Казанского государственного технического университета им. А.Н. Туполева и используются при изучении материалов дисциплины «Математические основы человеко-машинных систем»;

> внедрены в учебный процесс Нижнекамского химико-технологического института и используются при изучении материалов дисциплины «Системы искусственного интеллекта».

Пути дальнейшей реализации. Созданный программный комплекс планируется использовать в составе мягких экспертных систем как инструмент эксперта для формирования и динамического пополнения баз знаний. Оптимизацию системы правил перспективно проводить на базе генетических методов. На защиту выносятся следующие результаты:

> нейронечёткая модель формирования баз знаний экспертных систем;

> алгоритм её обучения и правила инициализации параметров;

> программный комплекс для автоматизации формирования нечётко-продукционных правил из набора статистических данных.

Структура и объём диссертации. Диссертация изложена на 194 страницах машинописного текста, содержит 62 рисунка, 7 таблиц, состоит из введения, четырёх глав, заключения, списка использованной литературы из 93 наименований на 9 страницах и 2 приложений на 20 страницах.

Сведения о личном вкладе автора. Разработана нейронечёткая модель формирования баз знаний экспертных систем, предложен алгоритм её обучения, реализован программный комплекс на базе нечёткой нейронной сети, проведены прикладные исследования при работе с комплексом для оценки эффективности использования нейронечёткой модели в решении практических задач.

Разработана и реализована система предупреждения аварийных ситуаций на водоводах НГДУ «ДжалильНефть» ООО «ТатНефть». Проведена опытная эксплуатация системы, разработан план мероприятий по внедрению в промышленную эксплуатацию. Предложена методика оперативного обнаружения утечек из водоводов, реализованная в программном комплексе.

Разработаны этапы последовательного интеллектуального анализа разнотипных медицинских данных. В рамках данных этапов проведён анализ статистических данных диагностики поясничного остеохондроза. Выявлены значимые признаки и их группы, оказывающие максимальное влияние на тяжесть течения заболевания. Подготовлены обучающие выборки и проведено обучение нечёткой нейронной сети с получением системы правил.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована а^уальность темы проводимых исследований, сформулирована цель работы, приведена структура диссертации.

В первой главе рассматриваются вопросы и проблемы построения интеллектуальных человеко-машинных систем поддержки принятия решений. Анализируются методы повышения эффективности формирования баз знаний экспертных систем. Показывается, что при решении данной задачи целесообразно наряду с экспертными методами использовать методы интеллектуального анализа данных. Доказывается необходимость разработки нечёткой нейронной сети для обработки данных и построения модели предметной области в виде нечётко-продукционных правил. Ставятся задачи по разработке архитектуры нейронечёт-кой модели, алгоритма её обучения и правил инициализации параметров.

Для решения неформализованных задач требуется разработка систем поддержки принятия решений - экспертных систем, основой которых является база знаний. Перед разработчиками ЭС постоянно встают проблемы трудности «добычи» и формализации знаний, а также поиска новых способов их получения. Для этого используют извлечение, приобретение и формирование знаний.

При извлечении и приобретении знаний, в общем случае, требуется человек-эксперт, излагающий свои знания и опыт в рамках формальной модели, что накладывает ограничения на использование таких подходов.

Процессы формирования знаний привлекают разработчиков и исследователей своими способностями к автоматическому получению знаний, интерпретации баз данных путём извлечения «скрытых» в них закономерностей.

Существование «скрытых» знаний обусловлено большими объёмами накопленных данных. Для их анализа используются специальные методы Data Mining-, статистические пакеты, нейронные сети, эволюционные методы, алгоритмы поиска логических связей и закономерностей, а также гибридные модели, сочетающие в себе достоинства различных технологий.

Применение методов Data Mining является составной частью технологии Knowledge Discovery in Databases — обнаружение знаний в базах данных. Основные этапы данного процесса: .

1) выборка исходного набора данных — понимание и формулировка задачи анализа, создание наборов данных, получение обучающей выборки;

2) подготовка (предобработка) данных заключается в получении качественных, корректных данных с точки зрения методов их анализа;

. 3) преобразование (трансформация) данных осуществляется путём их сглаживания, агрегирования, обобщения, нормализации;

4) data mining — использование различных инструментальных средств для нахождения закономерностей в данных;

5) оценка (постобработка) данных — проверка построенных моделей и интерпретация полученных результатов.

Для обработки разнотипной, качественной, нечёткой с выраженным субъективным характером либо неполной и неточной информации большое распространение получили нейросетевые модели и нечёткие системы. До недавнего времени

эти направления развивались независимо, обладая достоинствами, недостатками, возможностями и ограничениями при решении практических задач. Эффективность нечётких систем обусловлена:

1) возможностью формализации их средствами нечетких лингвистических категорий, используемых челбвеком при решении задачи;

2) хорошей интерпретируемостью;

3) отсутствием необходимости в задании обучающей выборки нри условии возможности формализации решения задачи человеком-экспертом. Основные недостатки систем, базирующихся на нечёткой лотке:

1) исходный набор постулируемых нечётких правил должен формироваться человеком-экспертом и может оказаться неполным или противоречивым;

2) формирование нечёткой модели требует большой предварительной аналитической работы эксперта;

3) вид и параметры функций принадлежности (ФП) выбираются субъективно и могут оказаться не вполне отражающими реальную действительнос ть;

4) невозможно автоматическое приобретение знаний. Эффективность нейронных сетей обусловлена возможностью:

1) аппроксимировать функциональные зависимости в данных;

2) выражать «выход-выход» на основе обучения с минимумом предварительной аналитической работы человека-эксперта; ■ ,

3) автоматически приобретать знания. Недостатками нейронных сетей являются:

1) требование наличия объёмной и представительной обучающей выборки;

2) плохая интерпретируемость, невозможность объяснить результат. Представленные недостатки не могут быть преодолены в рамках рассмотренных направлений в отдельности, что делает каждое из них пригодным для решения одних классов задач и менее пригодным для других классов.

В настоящее время значительную актуальность приобрело создание гибридных технологий, обладающих достоинствами как нейронных сетей, так и нечётких систем. Примером являются нечёткие нейронные сети (ППС).

Их использование позволяет реализовать подход к формированию Ф11 нечётких множеств: выбирается параметризованная функция формы, параметры которой настраиваются с помощью алгоритма обучения нейронной сети с точки зрения обучающей выборки. В результате осуществляется аппроксимация экспериментальных данных с помощью нечётких систем.

Пусть нечёткой нейронной сетыо должно быть реализовало отображение {(х',У)}, где х1 - — вектор входных значений, у' — значение выхода

(I = 1, N ). В результате обучения будет получена система правил вида:

ЕСЛИ х, есть И х2 есть Лг1 И ... И х„ есть Ап] ТО у ~ г,, у «\,т где Ад — нечёткие числа, г, — вещественные числа.

Для более гибкого описания закономерностей предметной области необходимо учитывать важность нечётких ограничений на значения входных параметров и достоверность сформированных правил. Этому требованию удовлетворяет нечётко-продукционная модель представления знаний:

«ИСЛИ i\' есть л( (w{) И ... И Р/ есть А{ ( ) 'ГО возможно 7}» \CFJ\ (1) где ]'/ ■ • параметры правила; Л/ - их нечеткие ограничения; w/ - веса ограничений; С1'1 ■ ■ степень уверенности эксперта в достоверности сформированного правила (СККТЛШТУ FACTOR); 7}е7'-- назначаемый результат'.

Разработанная нечеткая нейронная сеть позволяет формировать систему правил » виде модели (1). Для этого решаются вопросы:

1) разработки структуры нечёткой нейронной сети;

2) инициализации параметров функций принадлежности;

3) разработки алгоритма обучения нейронной сети;

4) обучении построенной сиги и оценки качества полученных моделей.

Их решение позволило реализовать механизм анализа накопленных данных и построения модели предметной области и виде нечётко-продукционных правил.

Но второй главе описывается структура Ш1С, решаются вопросы идентификации её параметров. Приводится схема функционирования сети, описываются формы кривых для задания Ф11 нечётких множеств. Предлагается алгоритм обучения пейропечёткой модели, а также ех*о реализация. Обосновываются критерии качества обучения, показывается сходимость разработанного алгоритма.

Структура нечёткой нейронной сети определяется количеством нейронов во входном и выходном слоях, числом градаций входных нейронов и алгоритмом нечёткого логического вывода на модели (1).

Первые параметры задают количество нейронов в соответствующих слоях нейронной сети. Последний определяет число слоев и их функциональность.

Пулевой слой сети содержит входные Р-нейроны (Р - {Pip }, i,, --1, пр , пр — их количеств»), сигналы которых образуют нечеткие градации Л/)>( , где ig = 1, ng , ng ■ ■ число градаций. Для их моделирования используются треугольная, трапецеидальная, гауссова, двойная и сдвоенная гауссовы ФИ.

Множество Л-нейропов образует первый слой нейронной сети (A = {At },

iл ~\,пА , п^-п/,*пк — количество А-нейронов). Выходами нейронов являются значения функций принадлежности, определяющие степень срабатывания условных частей правил. С каждым Л-нейроном связан параметр w/(;( е[0..1], определяющий важность ограничения А1е, на входное значение Pip -го нейрона.

Второй слой сети состоит из //-нейронов, определяющих условные части правил, совокупность которых образует полную систему И = {И, }, i„ ~\,пи , пи-~пп£. 11а выходе формируется оценка степени срабатывания условий правила, характеризующая удовлетворение значений нейронов Ptp ограничениям .

В третьем слое рассчитывается коэффициент достоверности решения, равный произведению оценок степени срабатывания условий правила SKjfi и степени

доверия к принятому решению ^ . Множество Союгр-нсйропов С ~ {С,( }, ic ^ 1,ис , пс ■■ их количество.

Четвёртый слой содержит пт выходных Г-исйроиа: 1\т е.Т (/,■ -1 ,пг ). Их выходами являются взвешенные нормированные оценки общего коэффициента достоверности решения.

Пример 1ШС с двумя входами, тремя выходами и тремя градациями:

-Ь(сотр2 „г..........

N --■►Сотр,

ы Сотр4

Ы •!г|с<тП>5

Й,!_;Л!со„Ф7|

1^?пНСот1У

Рис. 1. Пример структуры нечёткой нейронной сети

Схема функционирования нечеткой нейронной сети.

1) На каждый ¡р -й вход нейронной сети последовательно подаются значения из обучающей выборки р\р (/ = 1,л, п - об'ьём выборки).

2) Рассчитываются значения функций принадлежности нейронов первого слоя У\р1, = О,',. ). гае /л^ (р]г ) - Ф11 ггй градации /,,-го нейрона.

3) Вычисляются выходные значения //-нейронов согласно выражению

И,. ' Пр

у'

^ И

1 _ /,,-т

|>"1

— - степень доверия к принятому решению; щ ",

4) Оцениваются коэффициенты достоверности решения Сотр-Л"^ ,

V ус"

где ^ =

V-!

ограничений, для которых значения нейронов I) известны (щ„ < пР ).

5) Рассчитываются выходы каждого Х-нейрона:

К = 1Хс/*+ -ИсИ^а^сма.гле х[. с/'

И'

|а'1

Здесь х]с - входные значения нейрона 1]г; с/^., ■■ ■ всса связей С^. и Т1}

Максимальная активность нейрона Th. достигается при условии коллинеарности векторов ¡X | и . Это условие лежит в основе алгоритма обучения.

Алгоритм обучения нечеткой нейронной сети.

1) Задаются начальное значение адаптивного шага обучения а (0<а<1), желаемая среднеквадратичная ошибка выхода нейрошюй сети Ет, а также минимальный порог изменения ошибки при обучении Л£тш.

2) Рассчитываются весовые коэффициенты w^ Л-нсйронов и производится

инициализация соответствующих параметров Ф11.

3)'Определяются значении векторов CF.

4) Выбирается очередной выходной нейрон.

5) IIa вход IHIC подаются последовательно образы из обучающей выборки, • соответствующие данному нейрону. Для каждого входного образа:

5.1. производится фаза прямого распространения сигнала но нейрошюй сети, определяется взвешенная активность выходного нейрона;

5.2. вычисляется среднеквадратичная ошибка выхода нейронной сети для

1-го входного образа Е',Т — —(Лу^. )2, где Дy\T — y[f —t,r -- абсолютная ошибка выхода; ri?. — требуемое значение выхода;

5.3. для минимизации К\т изменяются выходы Сотр-иейронов;

5.4. шлчислиются требуемые значения выходов Я-нейронов

, *[(' + 1) ($к,И «' , •. ' - момент времени;

5.5. рассчитываются среднеквадратичные ошибки выходов Я-нейронов К 1де ASkH ~Sk„ ~(Sk„ )п,реб - абсолютная ошибка выхода,.(S'n )lape6 --требуемое значение выхода;

5.6. для минимизации Е\ модифицируются параметры ФГ1 соответствующих Л-нейронов.

6) Вычисляется среднее значение ошибки выхода нейронной сети для всех

1 --1

входных образов: = •

' " 1-1

7) Рассчитывается изменение ошибки выхода: А= (/ -1) - Е'* (t).

8) 1хли 0SA/'^f SAh'luill, то процесс обучения заканчивается.

9) Нсли Ec''f > Ет, то происходит переход к шагу 10 алгоритма, иначе процесс обучения исч&гкой нейрошюй сети заканчивается.

10) Проверяется условие невозрастания Е"*. Ксли AE'f <0, то уменьшается адаитшшый шш1 обучения и происходит переход к 5-му шагу алгоритма. Алгоритм функционирует до тех нор, пока средняя ошибка выхода сети не

станет меньше заданной или изменение ошибки не будет превышать минимально допустимый уровень.

Рис. 2. Блок-схема алгоритма обучения нечёткой нейронной сети

Для реализации алгоритма обучения рассчитываются вектора весов связей СР и весов ограничений IV, производится инициализация параметров функций

принадлежности, настраиваются значения выходов Сотир-иейронов, а также значения параметров ФИ с точки зрения обучающей выборки.

Вычисление весовых коэффициентов с[к,г производится статистически. Данный параметр в модели (1) определяет уверенность эксперта в сформированном правиле, его универсальность. С точки зрения обучающей выборки это может

быть выражено частотой встречаемости шаблона правила в выборке.

щ.

Значения коэффициентов cf¡ , определяются как с/. , = —-, где и, - об-

с 4 п, '■

Т

щее количество раз, когда проявлялась активность С,(. -го нейрона при подаче на

вход нейронной сети обучающей выборки, соответствующей ¿¡-му выходному

"с "с

нейрону; я,. - объем выборки для нейрона Т^. Причём = п,г ==> ХсЛ-,у =

к:** ' ' '

в

Веса ограничении определяются по правилу = — где и1>( -

общее количество раз, когда проявлялась активность /г-го Л-нейрона, соответствующего ¡р-му входу; п1р — число строк в обучающей выборке, соответствующей

"в "к

7?-му выходному нейрону. Причём = => " 1 •

Для определения начальной формы функций принадлежности разработаны правила инициализации их параметров. Пример инициализации различных типов ФП приведён на рис. 3. .

Рис. 3. Пример инициализации различных типов функций принадлежносш: а — треугольная; ' б — трапецеидальная;

в — гауссова и сдвоенная гауссова; г — двойная гауссова

Разработаны правила обучения параметров нечёткой нейронной сети. Обучение выходных значений Сотр-нейроноа х^. требует минимизации среднеквадратичной ошибки выхода нейронной сети /¿¡г :

зе\

х; (f+i)=*'(о-«—•

' ■ 8x'lc(t)

Обучение параметров функций принадлежности требует минимизации среднеквадратичной ошибки выхода Я-нейронов Е'1и :

parif, (t +1) = par, . (г) - а -, ' " dPari,.ix (О

где Parir,s ~ параметр ФП, соответствующий is-VL градации 1>-го входа сети.

В диссертации приведены формулы настройки значений параметров нечёткой нейронной сети с течением времени. Качество обучения при этом определяется точностью аппроксимации данных в обучающей выборке.

Увеличение количества входов сети и числа градаций входных нейронов приводит к возрастанию времени обучения, повышению точности аппроксимации. При слишком большом количестве входов и их градаций одновременно ухудшается естественно-языковая интерпретация получаемых правил, достоверность каждого из них и веса их параметров уменьшаются.

Обобщение данных и формирование правил — сложная задача, которая заключается в достижении баланса между числом правил вывода и точностью аппроксимации функциональной зависимости. В некоторых случаях достаточная точность может быть обеспечена только большим числом правил или использованием лингвистических переменных, термы которых сложно интерпретировать в качественных категориях. В этом случае следует пожертвовать точностью аппроксимации для получения разумного числа удобных для восприятия правил.

Сходимость алгоритма обучения нечёткой нейронной сети обусловлена следующими основными факторами:

> настройка параметров нейронной сети производится в рамках алгоритма обратного распространения ошибки;

> в результате обучения происходит нечеткая и лингвистическая аппроксимация функциональных зависимостей в данных системой продукций. Сходимость алгоритма обратного распространения ошибки обусловлена его

способностью минимизировать среднеквадратичную ошибку выхода многослойных, нейронных сетей. Для этого с целью настройки синаптических связей используется метод градиентного спуска в пространстве весовых коэффициентов. С уменьшением ошибки выхода происходит настройка параметров правил с точки зрения обучающей выборки. При этом происходит аппроксимация имеющихся данных нечёткими гранулами, наделёнными лингвистической интерпретацией.

Экспериментальная способность нечеткой нейронной сети к аппроксимации с одновременным уменьшением ошибки обучения не противоречит принципам работы алгоритмов обучения нечётких моделей, что указывает на сходимость разработанного алгоритма обучения нейронной сети.

В третьей главе проводится исследование алгоритма обучения нечёткой нейронной сети. Описывается разработанное программное обеспечение, его назначение и пример функционирования. Изучаются режимы работы нечёткой нейронной сети, а также возможность ее использования в составе мягких экспертных систем. Проводится сравнение используемых ФП по критериям «скорость обучения» и «точность аппроксимации». Анализируется временная сложность вычисления при обучении нейронной сети. Исследуется влияние пропущенных значений во входных данных на качество ее обучения.

Для решения задачи аппроксимации функциональных зависимостей в экспериментальных данных нечёткими правилами продукций разработан программный комплекс «Нечёткая нейронная сеть» {Fuzzy Neural Network), реализованный в среде программирования Borland Delphi 6.0.

Имеется несколько режимов работы нейронной сети.

, Режим обучения сети предназначен для её параметрической адаптации к предъявляемым данным. Для этого минимизируется квадратичная сумма разностей между требуемым и полученным U(th Y) значением выхода нейронной сети, усреднённая на N примерах:

рО0 = Wb Y>- t,f => min,

N f.,

где Y — вектор параметров функций принадлежности. Вид функции F(Y) целиком зависит от данных из обучающей выборки.

После обучения нейронная сеть готова к генерации нечётких правил и представления их в удобном виде. Большое количество правил требует их фильтрации и цривлечения экспертов для оценки сформированных, закономерностей.

На тестовой выборке данных происходит оценка качества (адекватности) полученной модели. Величина оценки определяется не формуле:

1 l^-1—i 1Еобуч ~Етеет 1

Р р *

где £0буЧ - ошибка при обучении, /¿геСг — ошибка при тестировании.

Обученная нейронная сеть является системой нечеткого логического вывода. Она может использоваться как инструмент эксперта в составе мягкой экспертной системы и позволяет заменить (или дополнить) эвристический процесс построения базы знаний на процесс автоматизированного её формирования, извлекая закономерности из статистических выборок данных.

При обучении нечёткой нейронной сети стоит задача выбора типа ФГ1. Проведённые эксперименты позволили определить наилучшую (треугольную) и наихудшую (трапецеидальную) функции принадлежности по критериям «скорость обучения» и «точность аппроксимации».

Важным вопросом при обучении нечёткой нейронной сети является длительность процесса обучения. Для уменьшения ошибки выхода требуется изменение параметров нейронной сети. С увеличением их количества повышается время t прохождения и обработки входных сигналов, которое оценивается по формуле: 1~П/1 + пн+пс = пр* ng + 2 * пл/.

Значение данного параметра экспоненциально возрастает при увеличении количества градаций и числа входных нейронов сети.

Качество обучения нечёткой нейронной сети в первую очередь определяется полнотой данных в обучающей выборке, их репрезентативностью. Выборки нередко имеют пропущенные значения. В результате на вход программы анализа подаётся таблица с пропущенными ячейками. Большинство из известных методов не рассчитаны на такую работу, что является сдерживающим фактором их использования. Актуально применение методов, не требующих борьбы с пробелами и способных работать на некомплектных выборках. Этому требованию удовлетворяет разработанная нечёткая нейронная сеть. ' '

В четвертой главе рассматриваются практические вопросы формирования баз знаний на примере системы медицинской диагностики и комплексной системы предупреждения аварийных ситуаций технологического оборудования в процессах поддержания пластового давления. Анализируются особенности диагностического процесса в медицине. Рассматриваются этапы анализа медицинских данных на базе нечёткой нейронной сети. Приводятся примеры сформированных правил в рассматриваемых предметных областях. Описывается разработанная методика оперативного обнаружения утечек из водоводов. Даётся сравнение нечёткой нейронной сети с аналогичными программными методами и средствами формирования баз знаний экспертных систем.

В медицинских исследованиях проводится поиск и обоснование взаимосвязей различных качественных и количественных параметров в различных возрастных, половых, клинических группах, для определения их значимости для диагностики, прогноза течения заболевания, выбора тактики лечения, экспертизы трудоспособности. Признаки, обладающие наибольшей положительной и отрицательной связью, наиболее информативны в процессе диагностики и исследуются у пациента в первую очередь.

В процессе создания базы знаний диагностической системы в медицине важно определить и стандартизировать основные этапы сбора и анализа информации для обработки её с помощью нечёткой нейронной сети и выработки важных для врача правил. Каждый из этапов является изолированным логическим процессом с измерением параметров, их анализом, принятием этапного решения.

Для проверки возможности применения нечёткой нейронной сети на всех этапах медицинской диагностики использованы данные клинического, нейро-ортопедического, рентгенокомпьютернотомографического обследования 230 женщин в возрасте от 15 до 92 лет и 180 мужчин в возрасте от 16 до 81 года с различными синдромами поясничного остеохондроза на стационарном этапе обострения и в стадии начинающейся ремиссии. Контрольную группу составили 20 женщин в возрасте от 20 до 70 лет и 20 мужчин в возрасте от 17 до 73 лет, никогда не страдавших поясничными вертеброгенными болями.

Клиническое нейроортопедическое обследование проведено по методике В.П. Веселовского, Я.Ю. Попелянского. Рентгеновская компьютерная томография проводилась на рентгеновском компьютерном томографе SOMATOM AR.HP spiral фирмы SIEMENS при сканировании с шагом 3/3 мм. Изучены количественные и качественные характеристики состояния структур позвоночно-

двигательных сегментов, собственных мышц позвоночника и паравертебральных мышц на уровне 8] по методике М.А. Подольской, З.Ш. Нуриева.

Для получения системы продукций и их параметров измерено более 500000 количественных и качественных значений признаков течения поясничного остеохондроза по 822 параметрам. Подготовка обучающих выборок для ННС проведена в соответствии с разработанной и описанной в первой главе методикой. Учтено оптимальное количество входных и выходных параметров системы для численной и лингвистической интерпретации формируемых правил. В результате обучения сети на более чем 100 обучающих выборках получено более 500 правил, значимость которых оценивалась экспертами — специалистами-вертеброневрологами высокой квалификации.

Разработанная нечёткая нейронная сеть отвечает логике постановки диагноза экспертом и моделирует этапы его интеллектуальной деятельности. В большинстве случаев сформированные правила совпадали с мнениями экспертов, что позволяет использовать ННС в составе экспертных диагностических систем.

Проверка сети на медицинских данных позволила с большой точностью автоматизировать процесс диагностики. Это заложило математический фундамент создания экспертных систем нового поколения в любой отрасли медицины. Данные вертеброневрологического анализа послужили лишь многофакторной моделью, способной описать закономерности возникновения, развития, клинических особенностей заболевания, долгосрочного прогноза состояния пациентов. При соблюдении правил отбора информации, её стандартизации, ввода в нейронную сеть, созданная модель может служить математической оболочкой, способной в короткие сроки решать сложные экспертные задачи в медицине.

В рамках НИОКР № 1178-04 разработана система предупреждения аварийных ситуаций технологического оборудования в процессах поддержания пластового давления (ППД). Её внедрение на диспетчерских пунктах в цехах ППД необходимо для оперативного выявления утечек из водоводов по результатам анализа получасовых расходов воды. Система производит мониторинг состояния водоводов и оповещает диспетчера о наступлении аварийных ситуаций, принимая решение на основании сформированной базы знаний.

Для её формирования наряду с экспертами использовалась нечёткая нейронная сеть, с помощью которой обрабатывалась статистическая информация, представлявшая собой значения (в м3) получасовых расходов воды по всем водоводам цеха ППД-2 НГДУ «ДжалильНефть». Для подготовки обучающих выборок рассчитаны относительные отклонения расхода воды по каждому из водоводов за 0,5 часа и за 1 час. Отклонение по водоводу рассчитывается, как

где (2о - текущее измерение, О о. 5 - пол часа назад, £?/ - час назад, С*е ,

Обучающие выборки включали в себя поля «относительное отклонение по водоводу за 0,5 часа», «относительное отклонение по водоводу за 1 час» и «признак аварии». Последнее поле могло принимать значения 0 или 1. Обучение проводилось с использованием треугольных функций принадлежности.

В результате сформировано множество правил, из которых отобраны наиболее значимые, определяющие условия определения порывов. Кроме того экс-

пертным путём сформулированы дополнительные условия, влияющие на качество диагностики аварийности состояния водоводов. Разработана методика оперативного обнаружения утечек воды на основании экспертных правил и правил, сформированных с помощью нечёткой нейронной сети.

Экспертная система успешно прошла тестирование на лабораторных стендах «ТатАСУНефть», этап опытной эксплуатации и внедрена в промышленную эксплуатацию на диспетчерском пункте ЦППД-2 НГДУ «ДжалильНефть» ОАО «ТатНефть». При работе система показала эффективность используемого алгоритма оперативного обнаружения порывов.

Практическое использование результатов её работы позволило:

> повысить уровень безопасности функционирования технологического оборудования в процессах поддержания пластового давления;

> оперативно в автоматизированном режиме выявить аварийные ситуации, связанные с утечками на водоводах;

> снизить нагрузку на специалистов-технологов и диспетчеров при анализе информации по выявленным авариям.

В заключении диссертационной работы сформулированы научные результаты, полученные в ходе её выполнения, намечены направления перспективных исследований.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1) Проведён анализ эффективности методов интеллектуальной обработки информации и стратегий получения знаний для экспертных систем. Показана актуальность разработки новых математических методов и алгоритмов автоматизированного формирования баз знаний экспертных систем.

2) Разработана нейронечёткая модель формирования баз знаний, алгоритм её обучения и правила инициализации параметров. Структура нечёткой нейронной сети определяется количеством входов, выходов сети, числом градаций входных нейронов, а также алгоритмом нечёткого логического вывода. Алгоритм обучения модели основан на методе градиентного спуска и позволяет минимизировать ошибку выхода нейронной сети.

3) Реализован программный комплекс на базе нейронечёткой модели. Исследованы режимы работы нечёткой нейронной сети. Показана возможность использования комплекса в составе мягких экспертных систем.

4) Выполнены исследования с использованием разработанной нейронной сети для оценки эффективности её работы. Показано, что максимальная скорость обучения и точность аппроксимации достигаются при выборе треугольной функции принадлежности.

5) Проведено обучение нечёткой нейронной сети на множестве обучающих выборок. Нейронная сеть показала свою эффективность при анализе медицинских данных и в задаче формирования правил принятия решений в системах поддержания пластового давления.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Glova V.I., Anikin I.V., Katasev A.S., Pheoktistov O.N. The Knowledge Representation Mode] in Fuzzy Expert Systems Provided by Computing with Words and PRUF Language // Proceedings of the International Conference on Fuzzy Sets and Soft Computing in Economics and Finance (FSSCEF 2004). Saint-Petersburg, 2004. - p. 202-209.

2. Katasev A.S. The methods and instruments of DATA MINING in tasks of technological equipment faults and damages recognition // 7th International Conference on Pattern Recognition and Image Analysis: New Information Technologies (PRIA-7-2004). St. Petersburg, 2004. - p. 720-723.

3. Катасёв Л.С., Кривилёв M.A., Зубрин B.H. Комплексная система предупреждения сбоев и аварий технологического оборудования процессов ППД // XII Туполевские чтения. Международная молодёжная научная конференция. Казань, 2004 г.: тезисы докладов. - С. 46-47.

4. Катаеве А.С., Кривилёв М.А., Зубрин В.Н. Методы и средства предупреждения аварийных ситуаций в условиях неопределённости // XII Туполевские чтения. Международная молодёжная научная конференция. Казань, 2004 г.: тезисы докладов. - С. 47-48.

5. Катаева А.С., Кривилёв М.А. Извлечение структур знаний при решении прикладных задач // Инновационное образование в техническом университете: Международная научно-методическая конференция. Казань, 2004. -С. 86-88.

6. Катасёв А. С. Технологии Data Mining в задаче диагностики технологического оборудования // Инфокоммуникационные технологии глобального информационного общества: Сб. трудов 2-й ежегодной международной научно-практической конференции. Казань, 2004 - С. 335-339.

7. Катасёв А.С. Эффективное применение Data Mining в науке и образовании ii Профессиональные компетенции в структуре модели современного инженера: Материалы региональной научно-методической конференции. Нижнекамск, 2005. - С. 33-35.

8. Катасёв А. С., Кривилёв М.А., Гафиятов ИЗ. Интеллектуальный автоматизированный подход к извлечению правил из баз данных // Инфокоммуникационные технологии глобального информационного общества: тез. докладов 3-й ежегодной международной научно-практической конференции. Казань, 2005.-С. 103-104.

9. Катасёв А.С. Нейронечёткий подход к извлечению знаний из баз данных /I Туполевские чтения: Международная молодёжная научная конференция, посвященная 1000-летию города Казани: Материалы конференции. Казань, 2005. - С. 73-75.

10. Катасёв А.С., Кривилёв М.А. Методы приобретения знаний для экспертных систем ii Туполевские чтения: Международная молодёжная научная конференция, посвященная 1000-летию города Казани: Материалы конференции. Казань, 2005. - С. 75-77.

11. Катасёв А.С., Кривилёв М.А., Нигматуллина А.Н. Извлечение нечётких правил из баз данных // Туполевские чтения: Международная молодёжная

научная конференция, посвященная 1000-летию города Казани: Материалы конференции. Казань, 2005. - С. 82-84.

12. Катасёв A.C., Кривилёв М.А. Методы и программный комплекс принятия решений, оперативного выявления и предупреждения аварийных ситуаций // Инфокоммуникационные технологии глобального информационного общества: Сб. трудов 3-й ежегодной международной научно-практической конференции. Казань, 2005. - С. 231-239.

13. Катасёв A.C., Кривилёв М.А. Интеллектуальный автоматизированный подход к формированию баз знаний в экспертных системах // Инфокоммуникационные технологии глобального информационного общества: Сб. трудов 3-й ежегодной международной научно-практической конференции. Казань, 2005. - С. 250-25 6.

14. Глова В.И., Аникин И.В., Катасёв A.C. Система предупреждения аварий оборудования в процессах поддержания пластового давления Н Вестник Казанского государственного технического университета им. Л.Н. Туполева, №2,2006. - С. 46-49.

15. Катасёв A.C., Подольская М.А. Влияние числа входных параметров продукционных правил на качество обучения нечёткой нейронной сети при обработке медицинских данных // Инфокоммуникационные технологии глобального информационного общества: тез. докл. 4-й ежегодной между-нар. научно-практ. конференции. Казань, 2006. - С. 81-84.

16. Кривилёв М.А., Катасёв A.C., Подольская М.А. Разработка и реализация нечёткой нейронной экспертной системы диагностики поясничного остеохондроза позвоночника // Инфокоммуникационные технологии глобального информационного общества: тез. докл. 4-й ежегодной междунар. на-учно-практич. конференции. Казань, 2006. — С. 85-86.

17. Подольская М.А., Катасёв A.C. Стандартизация этапов сбора и анализа информации при поясничном остеохондрозе позвоночника на основе нечётких нейронных сетей // Инфокоммуникационные технологии глобального информационного общества: тез. докл. 4-й ежегодной междунар. на-учно-практич. конференции. Казань, 2006. - С. 89-92.

18. Глова В.И., Подольская М.А., Катасёв A.C. Нечёткая нейронная модель поиска закономерностей распределения разнотипных данных на примере медицинских исследований // Инфокоммуникационные технологии глобального информационного общества: тез. докл. 4-й ежегодной междунар. научно-практич. конференции. Казань, 2006. - С. 103-106.

Формат 60x84 1/16. Бумага офсетная. Печать офсетная. Печ.л. 1,0. Усл.печ.л. 0,93. Усл.кр.-отт. 0,98. Уч.-изд.л. 1,0. Тираде 100. Заказ И192.

Типография Издательства Казанского государственного технического университета 420111 Казань, К. Маркса, 10

Оглавление автор диссертации — кандидата технических наук Катасёв, Алексей Сергеевич

СПИСОК ИСПОЛЬЗУЕМЫХ СОКРАЩЕНИЙ.

ВВЕДЕНИЕ.

1. ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ.

1.1. Проблемы разработки систем поддержки принятия решений.

1.1.1. Задачи систем поддержки принятия решений.

1.1.2. Методы и системы анализа данных.

1.1.3. Методы и задачи Data Mining.

1.1.4. Структура, состав экспертных систем и их характеристики.

1.2. Технологии интеллектуального анализа данных.

1.2.1. Стратегии получения знаний для экспертных систем.

1.2.2. Обнаружение знаний в базах данных.I.

1.2.3. Подготовка обучающей выборки.

1.2.4. Репрезентативность обучающей выборки.

1.3. Методы нечёткой логики и нейронных сетей в задачах интеллектуального анализа информации.

1.3.1. Предпосылки использования методов искусственного интеллекта в решении задач интеллектуальной обработки информации.

1.3.2. Искусственные нейронные сети.

1.3.3. Нечёткая логика.

1.3.4. Нечёткие логические выводы.

1.3.5. Сравнительный анализ нечётких и нейросетевых моделей.

1.3.6. Нечёткие нейронные сети.

1.3.7. Примеры нечётких нейронных сетей.

1.3.8. Идентификация нейронечётких моделей.

1.3.9. Нечётко-продукционная модель представления знаний.

1.3.10. Схема нечёткого логического вывода на нечётко-продукционной модели представления знаний.

1.3.11. Постановка задачи по разработке структуры и алгоритма обучения нечёткой нейронной сети.

1.4. Выводы.

2. СТРУКТУРА И АЛГОРИТМ ОБУЧЕНИЯ НЕЙРОНЕЧЁТКОЙ МОДЕЛИ.

2.1. Структура нечёткой нейронной сети.

2.1.1. Идентификация параметров и слоёв нейронной сети.

2.1.2. Пример структуры нечёткой нейронной сети.

2.1.3. Схема функционирования нейронной сети.

2.1.4. Формы кривых для задания функций принадлежности нечётких " множеств.

2.2. Алгоритм обучения нейронечёткой модели.

2.2.1. Принципы обучения нечёткой нейронной сети.„.

2.2.2. Разработка алгоритма обучения сети.;„.

2.2.3. Реализация алгоритма обучения.

2.2.3.1. Определение весовых коэффициентов в нечётко-продукционных правилах.'.

2.2.3.2. Инициализация параметров функций принадлежности. Р/

2.2.3.3. Правша настройки параметров нейронной сети.'.

2.2.4. Критерии качества обучения нечёткой нейронной сети.

2.2.5. О сходимости алгоритма обучения нейронной сети.

2.4. Выводы.

3. ИССЛЕДОВАНИЕ АЛГОРИТМА ОБУЧЕНИЯ НА БАЗЕ РАЗРАБОТАННОГО ПРОГРАММНОГО КОМПЛЕКСА «НЕЧЁТКАЯ НЕЙРОННАЯ СЕТЬ».

3.1. Описание разработанного программного обеспечения.

3.1.1. Назначение программного комплекса.

3.1.2. Пример функционирования нейронной сети.

3.2. Режимы работы нечёткой нейронной сети.

3.2.1. Работа сети в режиме обучения.

3.2.2. Режим генерации и отбора значимых правил.

3.2.3. Тестирование нейронной сети на контрольной выборке данных.

3.2.4. Использование нечёткой нейронной сети в составе мягких экспертных систем.

3.3. Численно-параметрические исследования.

3.3.1. Сравнение функций принадлежности нечётких ограничений по критериям «скорость обучения» и «точность аппроксимации».

3.3.2. Временная сложность вычислений при обучении нечёткой нейронной сети.'.

3.3.3. Обучение нечёткой нейронной сети на комплектных и некомплектных выборках.

3.4. Выводы.

4. РЕШЕНИЕ ЗАДАЧИ ФОРМИРОВАНИЯ БАЗ ЗНАНИЙ ЭКСПЕРТНЫХ СИСТЕМ НА ОСНОВЕ НЕЧЁТКОЙ НЕЙРОННОЙ СЕТИ.

4.1. Формирование базы знаний системы медицинской диагностики на примере поясничного остеохондроза.

4.1.1. Особенности диагностического процесса в медицине.

4.1.2. Построение базы знаний системы медицинской диагностики.

4.1.3. Результаты использования нейронной сети.

4.2. Формирование базы знаний комплексной системы предупреждения сбоев и аварий технологического оборудования процессов поддержания пластового давления.

4.2.1. Общее описание системы.

4.2.2. Формирование базы знаний комплексной системы.

4.2.3. Методика оперативного обнаружения утечек из водоводов.

4.2.4. Полученные практические результаты.

4.3. Сравнение нечёткой нейронной сети с программными средствами формирования баз знаний экспертных систем.

4.3.1. Обзор программных средств построения систем нечёткого логического вывода.

4.3.2. Методы извлечения нечётких правил из баз данных.

4.4. Выводы.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Катасёв, Алексей Сергеевич

Глобальная информатизация стимулировала разработку в различных проблемных областях человеческой деятельности автоматизированных диагностических систем. Это, как правило, интеллектуальные системы, моделирующие процесс рассуждения эксперта при принятии им решения - экспертные системы (ЭС). Основным элементом ЭС является база знаний, представленная множеством систематизированных правил, описывающих закономерности в рассматриваемой предметной области. Данные правила формулируются экспертом или формируются на основе анализа больших статистических массивов данных.

В первом случае эксперт явно или неявно формализует свои знания, опыт и интуицию в рамках выбранной модели представления знаний. Это сложный процесс, требующий большой аналитической работы.

Второе направление связано с разработкой и применением новых математических методов, способных эффективно анализировать статистические данные и извлекать из них полезные знания при минимуме работы эксперта. Использование данного подхода перспективно для формирования баз знаний экспертных систем нового поколения - мягких экспертных систем - в таких предметных областях как медицина, промышленность, нефтяная отрасль и др. Для всех из них характерны следующие особенности:

У резкое увеличение объёмов обрабатываемой информации, переход от концепции «баз данных» к «горам данных»;

У необходимость одновременной обработки разнотипной информации; её нечёткость, качественность и субъективный характер; отсутствие формальных подходов к решению задач, эвристичность приёмов, используемых при этом для обработки информации; необходимость решать задачи, свойственные до настоящего времени только человеку; многокритериальное^ решаемых задач в условиях нечёткости критериев.

Для данных областей актуальность имеет создание интеллектуальных человеко-машинных систем обработки информации, способных эффективно решать поставленные задачи в указанных условиях.

Исследованию проблем построения интеллектуальных систем в этом направлении посвящены работы следующих учёных: Заде JI.A., Ларичева ОЖ, Поспелова Д.А., Аверкина А.Н., Финна В.К., Вагина В.Н., Кобринского Б.А., Загоруйко Н.Г., Ярушкиной Н.Г., Паклина Н.Б., Батыршина И.З., Подольской М.А., Гловы В.И., Аникина И.В. и др.

Однако несмотря на это многие вопросы обработки данных в указанных предметных областях не рассматривались. Таким образом, актуальной задачей является разработка адекватных моделей, эффективных алгоритмов и реализующих их программных комплексов формирования баз знаний экспертных систем. Решению этой задачи посвящена настоящая диссертация.

Объект исследования: базы знаний интеллектуальных человеко-машинных систем поддержки принятия решений - экспертных систем.

Предмет исследования: методы, модели, алгоритмы и стратегии получения знаний для экспертных систем.

Цель работы: повышение эффективности построения баз знаний нечётких экспертных систем на основе моделей и алгоритмов интеллектуального анализа данных, формирующих правила принятия решений.

Научная задача: разработка формальной модели, алгоритма её обучения и программного комплекса формирования баз знаний экспертных систем.

Достижение поставленной цели и задачи потребовало решения следующих вопросов: анализа эффективности методов интеллектуальной обработки информации и стратегий получения знаний для экспертных систем; разработки нейронечёткой модели формирования баз знаний, алгоритма её обучения и правил инициализации параметров; реализации программного комплекса на базе нейронечёткой модели; выполнения исследований с использованием разработанной нейронной сети для оценки эффективности её работы; обучения нечёткой нейронной сети на множестве обучающих выборок. Методы исследования. Для решения обозначенных вопросов использованы методы математического моделирования, нечёткой логики, искусственных нейронных сетей, мягких вычислений.

Достоверность полученных результатов. Предложенные в диссертационной работе модели и алгоритмы обоснованы теоретическими решениями и не противоречат известным положениям других авторов. Практическая апробация и внедрение в промышленную эксплуатацию результатов работы подтвердили эффективность метода формирования баз знаний экспертных систем. Научная новизна работы заключается в следующем:

1) предложена нейронечёткая модель формирования баз знаний экспертных систем в рамках нечётко-продукционной модели представления знаний;

2) разработан алгоритм обучения и правила инициализации параметров нечёткой нейронной сети;

3) обоснованы критерии качества обучения нейронечёткой модели. Теоретическая значимость работы заключается в разработке:

1) модели, расширяющей возможности получения знаний для использования их в механизмах выводов экспертных систем;

2) алгоритма настройки параметров модели с точки зрения обучающей выборки при её аппроксимации.

Практическая ценность диссертационной работы заключается в разработке и реализации программного комплекса на базе нечёткой нейронной сети, производящего в автоматизированном режиме анализ статистических данных и формирующего систему нечётко-продукционных правил для их использования в экспертных системах.

По проблеме диссертационной работы опубликовано 18 работ, в том числе 1 статья в журнале из списка, рекомендованного ВАК РФ, 5 статей и 12 тезисов докладов.

С целью апробации основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях:

У международной конференции «Нечёткие множества и мягкие вычисления в экономике и финансах» (Санкт-Петербург, 2004); У второй ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2004); У седьмой международной конференции «Распознавание образов и анализ изображений: новые информационные технологии» (Санкт-Петербург,

2004);

У международной научно-методической конференции «Инновационное образование в техническом университете» (Казань, 2004); У региональной научно-методической конференции «Профессиональные компетенции в структуре модели современного инженера» (Нижнекамск,

2005);

У третьей ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2005); У международной молодёжной научной конференции «Туполевские чтения», посвященной 1000-летию города Казани (Казань, 2005); У четвёртой ежегодной международной научно-практической конференции «Инфокоммуникационные технологии глобального информационного общества» (Казань, 2006).

Реализация результатов работы. Результаты исследования: У внедрены в промышленную эксплуатацию в виде системы предупреждения аварийных ситуаций в процессах поддержания пластового давления, решающей задачу оперативного выявления утечек из водоводов; У использованы при построении базы знаний экспертной диагностической системы в вертеброневрологии на данных развития и особенностей клинических проявлений остеохондроза поясничного отдела позвоночника; внедрены в учебный процесс КГТУ им. А.Н. Туполева и используются при изучении материалов дисциплины «Математические основы человеко-машинных систем».

Пути дальнейшей реализации. Созданный программный комплекс планируется использовать в составе мягких экспертных систем как инструмент эксперта для формирования и динамического пополнения баз знаний. Оптимизацию системы правил перспективно проводить на базе генетических методов. На защиту выносятся следующие результаты: нейронечёткая модель формирования баз знаний экспертных систем;' алгоритм её обучения и правила инициализации параметров; программный комплекс для автоматизации формирования нечётко-продукционных правил из набора статистических данных.

Структура и объём диссертации. Диссертация изложена на 194 страницах машинописного текста, содержит 62 рисунка, 7 таблиц, состоит из введения, четырёх глав, заключения, списка использованной литературы из 93 наименований на 9 страницах и 2 приложений на 20 страницах.

Заключение диссертация на тему "Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем"

4.4. Выводы

Особенности мягкого формирования знаний с использованием нейроне-чёткой модели изучены при построении баз знаний интеллектуальных систем в следующих предметных областях:

1) в медицине - в составе экспертной системы диагностики клинических проявлений остеохондроза поясничного отдела позвоночника и прогноза течения заболевания;

2) в нефтяной отрасли - в составе автоматизированной системы управления технологическим процессом поддержания пластового давления при решении задачи оперативного выявления утечек из водоводов.

В процессе создания базы знаний интеллектуальной диагностической системы в медицине важно определить и стандартизировать основные этапы сбора и анализа информации для обработки её с помощью нечёткой нейронной сети и выработки важных для врача правил.

Каждый из этапов является изолированным логическим процессом с измерением параметров, их анализом, принятием этапного решения. Такой анализ может быть проведён экспертом-медиком самостоятельно или при помощи аппарата нечёткой нейронной сети.

Для проверки возможности её применения на всех этапах процесса медицинской диагностики использованы данные клинического, нейро-ортопедического, рентгенокомпьютернотомографического обследования пациентов в различных возрастных, половых и клинических группах.

При помощи нечёткой нейронной сети проанализированы возможные варианты зависимости различных качественных и количественных признаков. В большинстве случаев получаемые правила совпадали с мнениями экспертов, что позволяет в дальнейшем использовать нейронную сеть самостоятельно. Подтверждена её эффективность в диагностическом процессе клинических проявлений остеохондроза позвоночника, возможность использования в составе экспертных диагностических систем в медицине.

В системах поддержания пластового давления нейронная сеть сформировала базовые правила, определяющие условия возникновения утечек из водоводов. Кроме того экспертным путём сформулированы дополнительные условия, влияющие на качество диагностики аварийности состояния водоводов. Разработанная методика оперативного обнаружения утечек воды позволила улучшить технико-экономические показатели по закачке жидкости в пласт.

Практическая апробация нечёткой нейронной сети показала возможность и эффективность её использования для решения задачи формирования баз знаний экспертных систем.

ЗАКЛЮЧЕНИЕ

В ходе диссертационного исследования решены следующие задачи.

1) Проведён анализ эффективности методов интеллектуальной обработки информации и стратегий получения знаний для экспертных систем. Показана актуальность разработки новых математических методов и алгоритмов автоматизированного формирования баз знаний экспертных систем.

2) Разработана нейронечёткая модель формирования баз знаний, алгоритм её обучения и правила инициализации параметров. Структура нечёткой нейронной сети определяется количеством входов, выходов сети, числом градаций входных нейронов, а также алгоритмом нечёткого логического вывода. Алгоритм обучения модели основан на методе градиентного спуска и позволяет минимизировать ошибку выхода нейронной сети.

3) Реализован программный комплекс на базе нейронечёткой модели. Исследованы режимы работы нечёткой нейронной сети. Показана возможность использования комплекса в составе мягких экспертных систем.

4) Выполнены исследования с использованием разработанной нейронной сети для оценки эффективности её работы. Показано, что максимальная скорость обучения и точность аппроксимации достигаются при выборе треугольной функции принадлежности.

5) Проведено обучение нечёткой нейронной сети на множестве обучающих выборок. Нейронная сеть показала свою эффективность при анализе медицинских данных и в задаче формирования правил принятия решений в системах поддержания пластового давления.

Перспективным видится решение следующих задач:

1) реализации мягкой экспертной системы, формирующей и динамически пополняющей базу знаний с использованием нечёткой нейронной сети;

2) оптимизации системы правил, проверки её на полноту и непротиворечивость с применением генетических алгоритмов.

Библиография Катасёв, Алексей Сергеевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Afifi A.A., Elashoff R.M. Missing observations in multivariate statistics // J.Amer. Statist. Assoc. 1966. V. 61. P. 595-604.

2. Bezdek J.C. Fuzzy Mathematics in Pattern Classification. PhD thesis, Applied Math. Center, Cornell University, Italca, 1973. p. 234.

3. Duch W., Adamczak R., Grabczewski K. A new methodology of extraction, optimization and application of crisp and fuzzy logic rules // IEEE Trans, on Neural Networks. V. 11,2000.

4. Frawley M.J., Piatesky-Shapiro G., Matheus C.J. Knowledge discovery in databases: An overview. AI Magazine, 1992. pp. 1-27.

5. Fuzzy Logic Toolbox. User's Guide, Version 2. The Math Works Inc., 1999.

6. Grossberg S. Competitive learning: From interactive activation to adaptive resonance // Cognitive Science, 1987, no 11, pp. 23-63.

7. Hebb D. The organization of behavior. New York: Wiley, 1961. p. 280.

8. Hopfield J. Neural Networks and physical systems with emergent collective computational abilities // Proceedings of the National Academy of Science USA, 1984.-V. 9.-pp. 147-169.

9. Hornik K., Stinchcombe M., White H. Multilayer feedforward networks are universal approximators//Neural networks, 1989. V. 2.-pp. 359-366.

10. Jang J.R. Structure determination in fuzzy modeling: a fuzzy CART approach // Proc. of IEEE Intern. Conf. on Fuzzy Systems. Orlando, Florida, 1994.

11. Jang JR., Sun C.T. ANFIS: Adaptive-Network-based Fuzzy Inference Systems // IEEE Tranc. on Systems, Man and Cybernetics, 1993. V. 23. - pp. 665-685.

12. JangJ.R., Sun C.T., Mizutani E. Neuro-Fuzzy and Soft Computing. A Computational Approach to Learning and Machine Intelligence. Prentice Hall, 1997.-p. 613.

13. Klawonn F., Nauck D., Kruse R. Generation Rules from Data by Fuzzy and Neuro-Fuzzy Methods // Proc. of the Third German Workshop "Fuzzy-Neuro-Systeme' 95", 1995.

14. Kosko B. Competitive Adaptive Bidirectional Associative Memories // Proceedings pf the IEEE First International Conference on Neural Networks. IEEE Press, 1987. V. 2. - pp. 759-766.

15. Kosko B. Fuzzy systems as universal approximators // IEEE Transactions on Computers, V. 43, No 11, November 1994. P. 1329-1333.

16. Lipmann R. An introduction to computing with neural nets // IEEE Acoustic, Speech and Signal Processing Magazine, No 2, 1987. pp. 4-22.

17. Mamdani E.H. Application of fuzzy logic to approximate reasoning using linguistic systems // Fuzzy Sets and Systems, 1977. V. 26. - pp. 1182-1191.

18. Mitaim S., Kosko B. Adaptive joint fuzzy sets for function approximation. Proceedings of the 1997 International Conference on Neural Networks, 1997.

19. Mitaim S., Kosko B. What is the Best Shape for a Fuzzy Set in Function Approximation // 5th IEEE International Conference on Fuzzy Systems (FUZZY-96). V. 2. - pp. 1237-1243.

20. Mitra S., Pal S., Mitra P. Data Mining in Soft Computing Framework: A Survey 11 IEEE Trans, on Neural Networks. V. 13, 2002.

21. Podolskaja M.A. The Forestalling Muskular Activity Mehanism of Spine Defense in its Dystrophy Development. J.Brain Pathology, 4:570 (1994), vol.4, №4, sept/1994. (Журнал патологии головного мозга, Лондон, Онтарио, 1994, т. 4, с. 570).

22. Popelansky Y.Y., Podolskaja M.A. Uber cerebrale Faktoren spondlogener Er-krankungen. Y. Manuele Medicin, 1990, 28: 48-50. (Журн. Мануальн. медицина, 1990, 28: 48-50. Ньюйорк, Берлин, Лондон, Париж, Токио, Гонконг, Барселона).

23. Rumelhart D., Hinton G,, Williams R. Learning representation by back propagation errors //Nature, 1986, № 323, pp. 533-536.

24. Sun R. Beyond Simple Rule Extraction: The Extraction of Planning Knowledge from Reinforcement Learners // Proc. of the IEEE Intern. Joint Conf. on Neural Networks. Lake Como, Italy, 2000.

25. Takagi Т., Sugeno M. Fuzzy identification of systems and its application to modeling and control // IEEE Transactions, Systems, Man and Cybernetics, 1985.-V. 15.-pp. 116-132.

26. Wang L.X. Fuzzy Systems are universal approximators I I Proc. of the First Intern. Conf. on Fuzzy Systems, 1992.

27. Widrow В., Hoff M. Adaptive switching circuits // In 1960 IRE WESCON Convention Record. DUNNO, 1960, pp. 96-104.

28. Zadeh L.A. Fuzzy logic, neural networks and soft computing // Communications of the ACM. V. 37,1994.

29. Zadeh L.A. Fuzzy Sets // Inform. Contr. V. 8, 1965. p. 338-353.

30. Zhang Y.Q., Fraser M.D., Gagliano R.A., Kandel A. Granular Neural networks for numerical-linguistic data fusion and knowledge discovery // IEEE Trans, on Neural Networks. V. 11,2000.

31. Аверкин A.H., Батыршин КЗ., Блишун А.Ф. и др. Нечёткие множества в моделях управления и искусственного интеллекта / Под ред. Д.А. Поспелова. М.: Наука, 1986. 312 с.

32. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей. Справочное издание под ред. Айвазяна С.А. -М.: Финансы и статистика, 1985.-471 с.

33. Аникин И.В. Модели нечётких нейронных сетей // Эволюционное моделирование / Под ред. В.А. Райхлина. Труды Казанского городского семинара «Методы моделирования». Вып. 2. Казань: Изд-во «Наука», 2004.-С. 111-136.

34. Аникин КВ., Шагиахметов М.Р. Разработка экспертной системы нечеткого принятия решений о выборе методов увеличения нефтедобычи нанефтяных месторождениях / Труды восьмой национальной конференции по ИИ с международным участием. М.: Физматлит, 2002.

35. Асаи К., ВатадаД., Иваи С. и др. / Под ред. Т. Тэрано, К. Асаи, М. Су-гено. Прикладные нечёткие системы. М.: Мир, 1993. - 368 с.

36. Баргесян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. СПб.: БХВ-Петербург, 2004.-336 е.: ил.

37. Батыршин И.З. Параметрические классы нечётких конъюнкций в задачах оптимизации нечётких моделей // Исследования по информатике. Вып. 2. ИПИАН РТ. Казань: Отечество, 2000.

38. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: Наука, 1974.-415 с.

39. Веселовский В.П. Практическая вертеброневрология и мануальная терапия. Рига. 1991.-344 с.

40. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. СПб.: Питер, 2001. - 384 е.: ил.

41. Генкин А.А. Новая информационная технология анализа медицинских данных (программный комплекс ОМИС). СПб.: Политехника, 1999. -191 е.: ил.

42. Глова В.И., Аникин КВ., Аджели М.А. Мягкие вычисления (soft computing) и их приложения: Учебное пособие / Под ред. Глова В.И. Казань: Изд-во Казан, гос. техн. ун-та. - 2000. - 98 с.

43. Глова В.И., Аникин И.В., Шагиахметов М.Р. Методы многокритериального принятия решений в условиях неопределённости в задачах нефтедобычи. Препринт 04П2. Казань: / Изд-во Казан, гос. техн. ун-та, 2004. -31с.

44. Глова В.И, Подольская М.А. «Ведифит-1» экспертная система по диагностике и физиотерапии вертебрального синдрома поясничного остеохондроза, ориентированная на ПЭВМ. Материалы I Международного конгресса вертеброневрологов. Казань, 1991. С. 114-115.

45. Головко В.А. Нейронные сети: обучение, организация и применение. Кн. 4: Учеб. пособие для вузов / Общая ред. А.И. Галушкина. М.: ИПРЖР, 2001.-256 е.: ил.

46. Городецкий В.И., Самойлов В.В., Малое А.О. Современное состояние технологии извлечения знаний из баз и хранилищ данных (часть 1) // Новости искусственного интеллекта. 2002. - № 3. - С. 3-12.

47. Городецкий В.И., Самойлов В.В., Малое А.О. Современное состояние технологии извлечения знаний из баз и хранилищ данных (часть 2) // Новости искусственного интеллекта. 2002. - № 4. - С. 3-9.

48. Дьяконов В., Круглое В. Математические пакеты расширения MATLAB. Специальный справочник. СПб.: Питер, 2001.-480 е.: ил.

49. Дюбуа Д., Прад А. К анализу и синтезу нечётких отображений // Нечёткие множества и теория возможностей. Последние достижения: Пер. с англ. / Под ред. P.P. Ягера. М.: Радио и связь, 1986. С. 229-240.

50. Дюк В., Самойленко A. Data Mining: учебный курс. СПб.: Питер, 2001. -386 е.: ил.

51. Жанатауов С.У. Методы прогностических переменных // Машинные методы обнаружения закономерностей. Новосибирск, 1981. Вып. 88: Вычислительные системы. С. 151-155.

52. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та математики, 1999. - 270 с.

53. Загоруйко Н.Г., Ульянов Г.В. Локальные методы заполнения пробелов в эмпирических таблицах // Экспертные системы и распознавание образов. Новосибирск, 1988. Вып. 126: Вычислительные системы. С. 75-121.

54. Заде JI.A. Основы нового подхода к анализу сложных систем и процессов принятия решений // Математика сегодня. М.: Знание, 1974. 55 с.

55. Заде JI.A. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. 168 с.

56. Змитрович А.И. Интеллектуальные информационные системы. Мн.: НТООО «ТетраСистемс». - Минск, 1997. - 368 с.

57. Кобринский Б.А. Искусственный интеллект и медицина: возможности и перспективы систем, основанных на знаниях // Новости искусственного интеллекта. 2001. - № 4. - С. 44-51.

58. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх С.В. Базы данных. Интеллектуальная обработка информации. М.: Издатель Молгачева С.В., Издательство Нолидж, 2001. - 496 е., ил.

59. Круглое В.В. Адаптивные системы нечёткого вывода // Нейрокомпьютеры: разработка и применение.-2003.-№ 5.-С. 15-19.

60. Круглое В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия - Телеком, 2001. - 382 е.: ил.

61. Круглое В.В., Дли М.И. Интеллектуальные информационные системы: компьютерная поддержка систем нечёткой логики и нечёткого вывода. М.: Физматлит, 2002. - 256 с.

62. Круглое В.В., Дли М.И., Голунов Р.Ю. Нечёткая логика иискусственные нейронные сети. М.: Физматлит, 2001. - 224 с.

63. Кендэл М., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973.-899 с.

64. Леоненков А.В. Нечёткое моделирование в среде MathLab и fuzzy TECH.- СПб.: БХВ-Петербург, 2003. 736 е.: ил.

65. Маренко В.А. Способы представления данных в экспертных системах // Математические структуры и моделирование. 2001. - № 8. - С. 34-39.

66. Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения. -М.: Радиотехника, 2000. 272 с.

67. Паклин Н.Б. Адаптивные модели нечёткого вывода для идентификации нелинейных зависимостей в сложных системах: Дисс. на соиск. уч. степ, к-та техн. наук. Ижевск, 2004. - 162 с.

68. Питер Джексон. Введение в экспертные системы: Пер. с англ.: Уч. пос.- М.: Издательский дом «Вильяме», 2001. 624 е.: ил.

69. Подольская М.А. Мышечная преднастройка при поясничном остеохондрозе. Автореферат канд. диссертации. Казань, 1983. - 16 с.

70. Подольская М.А. Подвижность вероятностного прогнозирования в области моторики больных с неврологическими проявлениями поясничного остеохондроза. Материалы III съезда невропатологов и психиатров Белоруссии. -Минск, 1986. С. 93-95.

71. Подольская М.А. Синдром дистрофии дорзальных мышц позвоночника // Актуальные вопросы неврологии. Новокузнецк, 1997. - с. 86-88.

72. Подольская М.А., Глова В.И., Богатова Н.М., Балоев М.А. Автоматизированные системы в диагностике и физиотерапии вертебрального синдрома поясничного остеохондроза. Материалы II Международного конгресса вертеброневрологов. Казань, 1992. С. 61-62.

73. Подольская М.А., Нуриев З.Ш. Компьютерно-томографическое исследование паравертебральных мышц на поясничном уровне при дистрофических вертеброгенных заболеваниях // Медицинская визуализация. -2004.-№4.-С. 127-136.

74. Попелянский Я.Ю. Вертебральные синдромы поясничного остеохондроза. Казань. 1974. 284 с.

75. Попелянский Я.Ю., Подольская М.А. Вероятностное прогнозирование и мышечная преднастройка механизмы защиты опорно-двигательного аппарата позвоночника. Материалы V Всесоюзного съезда геронтологов. - Киев, 1988 - 97 с.

76. Попелянский Я.Ю., Подольская М.А., Веселовский В.П., Третьяков В.П. Миофиксация в пато- и саногенезе поясничного остеохондроза. // Журн. Невропатол. и психиатр. 1984. - №4. - С. 503-507.

77. Растригин JI.A., Пономарёв Ю.П. Экстраполяционные методы проектирования и управления. М.: Машиностроение, 1986. 120 с.

78. Реброва О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA. М., МедиаСфера, 2003. 312 с.

79. Розенблат Ф. Принципы нейродинамики: Персептрон и теория механизмов мозга: Пер. с англ. М.: Мир, 1965. - 480 с.

80. Себестиан Г.С. Процессы принятия решений при распознавании образов: Пер. с англ. Киев: Техника, 1965. 152 с.

81. Сенилов М.А., Цепелев В.П. Программные средства для разработки систем нечёткой логики и эволюционных алгоритмов // Информационные технологии в инновационных проектах: Тр. IV Междунар. науч.-техн. конф. Ч. 2. - Ижевск: Изд-во ИжГТУ, 2003. - С. 87-89.

82. Степанов А.А., Подольская M.A. Мышечная преднастройка и вероятностное прогнозирование при шейном остеохондрозе. Кн. // Реабилитация больных с вертеброневрологическими заболеваниями, Казань, 2000.

83. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В.Э. Фигурнова. 3-е изд., перераб. и доп. - М.: ИНФРА - М, 2003. -544 е., ил.

84. Флейс Дж. Статистические методы для изучения таблиц долей и пропорций. М.: Финансы и статистика, 1989. - 319 с.

85. Черняховская М.Ю. Представление знаний в экспертных системах медицинской диагностики. Владивосток: Институт автоматики и процессов управления ДВНЦ АН СССР, 1983.-212 с.

86. Штовба СД. Идентификация нелинейных зависимостей с помощью нечёткого логического вывода в пакете MATLAB // Exponenta Pro: Математика в приложениях.-2003.-№2.-С. 9-15.

87. Ярушкина Н.Г. Нечёткие нейронные сети (часть 1) // Новости искусственного интеллекта. -2001. -№ 2-3. С. 47-51.

88. Ярушкина Н.Г. Нечёткие нейронные сети (часть 2) // Новости искусственного интеллекта. 2001. - № 4. - С. 23-28.

89. Ярушкина Н.Г. Основы теории нечётких и гибридных систем: Учеб. пособие. М.: Финансы и статистика, 2004. - 320 е.: ил.