автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Дистанционная диагностическая система на основе гибридных моделей знаний

кандидата технических наук
Ле Нгуен Виен
город
Волгоград
год
2015
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Дистанционная диагностическая система на основе гибридных моделей знаний»

Автореферат диссертации по теме "Дистанционная диагностическая система на основе гибридных моделей знаний"

На правах рукописи

Ле Нгуен Виен

ДИСТАНЦИОННАЯ ДИАГНОСТИЧЕСКАЯ СИСТЕМА НА ОСНОВЕ ГИБРИДНЫХ МОДЕЛЕЙ ЗНАНИЙ

05.13.01 - Системный анализ, управление и обработка информации (промышленность)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

5 ^ЕЗ 2015

005558436

Волгоград-2015

005558436

Работа выполнена на кафедре «Системы автоматизированного проектирования и поискового конструирования» в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Волгоградский государственный технический университет».

Научный руководитель доктор технических наук, профессор

Камаев Валерий Анатольевич.

Официальные оппоненты: Лосев Александр Георгиевич,

доктор физико-математических наук, профессор, ФГАОУ ВПО «Волгоградский государственный университет», кафедра Математического анализа и теории функций, профессор;

Филатова Наталья Николаевна,

доктор технических наук, профессор, ФГБОУ ВПО «Тверской государственный технический университет», кафедра Автоматизации технологических процессов, профессор.

Ведущая организация ФГБОУ ВПО «Пензенский государственный

университет», г. Пенза.

Защита состоится «26» марта 2015 г. в 13.00 на заседании диссертационного совета Д 212.028.04, созданного на базе «Волгоградский государственный технический университет» по адресу: 400005, г. Волгоград, пр. им. Ленина, 28, ауд. 209.

С диссертацией можно ознакомиться в библиотеке и на сайте www.vstu.ru «Волгоградский государственный технический университет».

Автореферат разослан «¿3 » 2015 г.

Ученый секретарь /Э ^

диссертационного совета оШ-Ь^ООи^ Водопьянов Валентин Иванович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Внедрение современных информационных технологий в разные сферы человеческой деятельности (технологической, биотехнической, медицинской, социальной и др.) приводит к появлению новых задач, решение которых связано с автоматизацией диагностических процедур для определения состояния сложных систем. Поддержка принятия решений в диагностических задачах становится необходимым этапом процесса управления в условиях роста объемов разнородной информации в современном обществе и усложнения объектов управления.

Для повышения эффективности диагностических процедур, должны использоваться подходы, объединяющие достижения искусственного интеллекта, нечеткой математики, интеллектуального анализа данных и пр.

Одна из основных задач при создании диагностических экспертных систем заключается в формировании и структурировании системы знаний рассматриваемой предметной области. Для создания базы знаний необходима интеграция различных источников. Тенденции развития современных экспертных систем связаны с внедрением технологий, позволяющих автоматизировать процесс пополнения и оптимизации баз знаний. Для этого необходимо найти пути интеграции различных моделей формирования и представления знаний, разработать алгоритмы, обеспечивающие возможность эффективной настройки баз знаний.

Наиболее актуальными на сегодняшний день являются системы приобретения знаний, основанные на интеграции технологий использующих знания экспертов и методы извлечения знаний из баз данных (KDD - knowledge discovery in databases).

При дистанционной диагностике часто встречается неопределенность информации. Выявленный комплекс признаков не всегда соответствует тому или иному состоянию объекта и может соответствовать разным диагностическим решениям, в том числе с близкими вероятностями для них. Информация, используемая для постановки диагноза и назначения исследования, в большинстве своем является нечеткой.

Выявление состояния исследуемого объекта в реальном времени играет важную роль при создании дистанционной экспертной системы. Диагностические гипотезы должны быть получены за приемлемое время и использоваться для поддержки лиц, принимающих решения о дальнейшем исследовании.

Создание современных диагностических экспертных систем связано с целым рядом проблем: не учитывается высокий уровень неопределенности получаемой диагностической информации; отсутствуют эффективные методики интеграции знаний, полученных из разнотипных источников; существующие методы приобретения знаний, как правило, обладают низкой адаптивностью и не подразумевают использование механизмов обратной связи для установления новых зависимостей и корректировки правил в базе знаний.

В связи с этим разработка дистанционной диагностической экспертной системы (ДДЭС), базирующейся на знаниях, полученных от экспертов и с

использованием технологий извлечения знаний из статистических данных, является актуальной.

Степень разработанности темы исследования.

Использование методов математической статистики для диагностики основано на использовании экспериментальных данных. В работах Д.А. Новикова, О.Ю. Ребровой, A.B. Дедова, Н. Бейли, A.B. Гайнера и др. разработаны подходы к решению задачи диагностики на основе анализе экспериментальных данных.

Методы построения интеллектуальных систем на основе знаний экспертов представлены в исследованиях Б.А. Кобринского, О.И. Ларичева, и др. В их работах, а также в диссертациях Д.Е. Дьяченко, Н.С. Безруковой, Д.А. Уваровой и др. разработаны модели, алгоритмы и программные средства для поддержки принятия диагностических решений.

К основным результатам по созданию систем принятия решений в условиях неопределенности относятся работы Д.А. Поспелова, Н.Г. Ярушкиной, В.В. Круглова, Д. Рутковского, Н.П. Деменкова, Б. Лю, L.A. Zadeh, E.H. Mamdani и др.

Вопросам разработки методов автоматизации процессов приобретения знаний посвящены работы Г.С. Осипова, Г.В. Рыбиной, В.В. Курейчика, S.M. Easterbrook, R. Dieng и др.

Целью данной диссертационной работы является повышение эффективности процедур дистанционной диагностики объекта за счет создания экспертной системы на основе интеграции различных моделей формирования и представления знаний. Для достижения сформулированной цели в диссертации были поставлены и решены следующие основные задачи:

1. Провести анализ состояния исследований и разработок диагностических систем (существующие системы, модели, методы и алгоритмы), и разработать постановку задачи для автоматизации процедур дистанционной диагностики объекта с использованием методов инженерии знаний.

2. Разработать информационную модель ДДЭС, и ее основные компоненты (база знаний, компонент приобретения знаний, механизм вывода диагностического решения и др.) и соответствующее математическое обеспечение.

3. Разработать структурно-функциональное решение (архитектура, диаграммы программных классов, схема базы данных и основные алгоритмы) ДДЭС.

4. На основе разработанных моделей и алгоритмов реализовать ДДЭС, провести тестирование и апробацию разработанных алгоритмов.

Объектом исследования является процесс диагностики объекта в дистанционном режиме.

Предметом исследования являются методы формирования и представления знаний в диагностической экспертной системе.

Научной новизной обладают следующие полученные результаты:

1. Разработана гибридная модель представления знаний, отличающаяся от известных аналогов комбинацией фреймовой и нечетко-продукционной баз

знаний, для снижения неопределенности при выявлении связей между признаками и диагностическим решением.

2. Разработан алгоритм формирования базы знаний, в котором наряду с экспертными знаниями используются знания, полученные из баз данных, что позволяет организовать процедуру обратной связи для установления новых зависимостей и корректировки правил в базе знаний.

3. Разработан механизм вывода диагностического решения, в котором используется комбинация обратного и прямого вывода, что позволяет уменьшить время получения диагностического решения за счет применения КЕТЕ-сети для нечеткого вывода.

Практическая значимость диссертации. На основе предложенного комплекса взаимосвязанных моделей и алгоритмов автоматизации постановки диагноза объекта на базе экспертных знаний и анализа статистической информации разработана диагностическая экспертная система, предназначенная для дистанционной диагностики на основе выявленных признаков; оценки динамики состояния сложных объектов в различных сферах диагностической деятельности.

Реализация и внедрение результатов работы. Результаты работы реализованы в виде программы «Дистанционная экспертная система предварительной диагностики». Система прошла апробацию и использовалась в процессе проведения медицинских консультаций пациентов, находящихся на дому; лиц, нуждающихся в государственной социальной помощи; для организации сбора информации о потребностях пациентов в медицинском обслуживании на дому и формирования графиков посещения врачей с учетом тяжести состояний.

Методы исследования. В диссертационной работе использовались: теория экспертных систем, теория нечетких множеств, методы нечеткой логики, методы интеллектуального анализа данных, объектно-ориентированного программирование.

Основные положения, выносимые на защиту:

1. Модель представления знаний на основе объединения фреймовой и нечетко-продукционной моделей.

2. Алгоритм формирования знаний на основе интеграции технологий, использующих знания экспертов и методы извлечения знаний из статистических данных.

3. Алгоритм поиска и исключения противоречий в базе знаний.

4. Механизм вывода диагностического решения на основе комбинации обратного и прямого вывода.

5. Процедура нечеткого вывода с применением КЕТЕ-сети.

6. Дистанционная диагностическая экспертная система для решения задачи медицинской предварительной диагностики.

Достоверность полученных в диссертационной работе теоретических результатов и сформулированных на их основе выводов обеспечивается использованием современных методов проведения научных исследований и корректным применением математического аппарата. Достоверность научных

положений и выводов диссертационной работы обоснована: применением современных методов исследования и моделирования сложных систем; согласованностью научных выводов с результатами теоретических обобщений и данными других авторов, представленными в научно-технической литературе.

Апробация результатов исследования. Основные результаты работы докладывались, обсуждались и получили одобрение на 13 международных конференциях, в том числе на 51-ой Внутривузовской научной конференции ВолгГТУ (Волгоград, 2014); на XXVII международной научной конференции «Математические методы в технике и технологиях» (Тамбов, 2014); на XII Всероссийском совещании по проблемам управления (Москва, 2014); на Международной научно-технической конференции «Информационные системы и технологии» (Нижний Новгород, 2014); на XIII Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2014); на 52-ой Международной научной студенческой конференции «Студент и научно-технический прогресс» (Новосибирск, 2014); на VII Региональной научно-практической студенческой конференции «России -творческую молодежь» (Камышин, 2014); на Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых «Научная сессия ТУСУР - 2014» (Томск, 2014); на IX Всероссийской научно-практической конференции проблемы управления в социально-экономических и технических системах (Саратов, 2014); на Международной конференции 11th Joint Conference on Knowledge-Based Software Engineering (Волгоград, 2014); на ежегодной Всероссийской научной школе-семинаре «Методы компьютерной диагностики в биологии и медицине» (Саратов, 2014); на XIX региональной конференции молодых исследователей Волгоградской области (Волгоград, 2014); III Международной научно-практической конференции «Современные технологии и управление» (р.п. Светлый Яр Волгоградской области, 2014).

Публикация результатов исследований. Основные результаты диссертации отражены в 17 опубликованных научных работах, в том числе 4 - в изданиях, рекомендованных ВАК для публикаций основных результатов кандидатских диссертаций.

Соответствие паспорту научной специальности. Указанная область исследования соответствует паспорту специальностей 05.13.01 — «Системный анализ, управление и обработка информации», а именно пункту 5 - «Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», пункту 10 — «Методы и алгоритмы интеллектуальной поддержки при принятии управленческих решений в технических, экономических, биологических, медицинских и социальных системах», пункту 13 - «Методы получения, анализа и обработки экспертной информации».

Объем и структура диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованных источников и приложений. Основное содержание диссертации изложено на 119 страницах, включая список литературы из 121 наименований, из которых 26 на иностранных языках.

Соискатель выражает благодарность д.т.н. доценту Садовниковой Наталье Петровне и к.т.н. Панченко Дмитрию Петровичу за вклад в виде практических советов и консультаций по теме диссертации.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении излагаются актуальность темы диссертационной работы, ее цели, задачи, предмет и объект исследования, научная новизна, практическая значимость работы, степень достоверности, апробация результатов и положения, выносимые на защиту.

В первой главе проведен анализ состояния исследований и разработок в области диагностических систем. Представлены анализ области диагностики состояния объекта и обзор основных подходов к проектированию диагностических систем в рассматриваемой области. Показано, что развитие современных информационных и телекоммуникационных технологий привело к необходимости и возможности разработки эффективных диагностических экспертных систем, которые могут использоваться дистанционно.

На основании обзора технологий использования экспертных систем диагностики состояния объекта сделан вывод о необходимости решения следующих проблем: управление знаниями; интеграция знаний из различных источников; неопределенность информации; точность диагностики за приемлемое время в режиме реального времени.

Проведен аналитический обзор отечественных и зарубежных диагностических систем. Показано, что в существующих системах не реализован весь набор требования к Д ДЭС.

Сформирована постановка задачи диагностики состояния объекта. Задачи диагностики состояния сложного объекта можно формализовать следующим образом:

мо = (к,а,зк,1,е,0)

где: к знания и опыты группы экспертов; А \К —> БК - построение полной, непротиворечивой и достаточно большой БЗ; ж,/->о - вычисление интегральной оценки наличия диагноза с помощью БЗ; БК ={£>,5,,5'С,м,о) -экспертные знания в БЗ; О = (д} - множество классов диагнозов, к которыми относится исследуемый объект; 5 = - множество признаков, которые проявляются у исследуемого объекта; ^с = ',5^'},о,}} - множество комплексов признаков, здесь при наличии диагноза Ц признак ^ имеет экспертную оценку силы проявления м = — множество групп диагнозов, здесь диагноз

Ц принадлежит в группе мч; с = •фч\ор)\ - множество групп признаков, здесь признак принадлежит в группе Ор. Все диагнозы, входящие во множество, рассматриваются как полная система несовместимых событий. И не требуется обязательная независимость признаков.

Состояние исследуемого объекта описывается набором к имеющихся признаков с входными оценками на шкале, обозначаемым I = {{5"к,х4)}, а состояние

диагностики состояния исследуемого объекта - набором И возможных классов диагнозов с выходными оценками на шкале, обозначаемым 0 = {(01,,у„}}. Дня оценки силы проявления признаков и отнесения исследуемого объекта к КДР используется единая количественная шкала [0.0; 1.0].

Вторая глава посвящена разработке моделей и методов построения дистанционной диагностической экспертной системы. Информационная модель ДДЭС задается следующим образом: (]¥М,Щи1,1Е,ЕМ,КА)

где: шм - рабочая память; кв - база знаний; ш - пользовательский интерфейс; ¡е — механизм вывода диагностического решения; ш - объяснение решения; кл - приобретение знаний, которое разбивается на формирование и проверку базы знаний.

На рисунке 1 представлена общая структурная схема ДЦЭС.

Ш

Пользователи

7,8

Эксперты (инженеры по знаниями)

й—-

Пользовательский интерфейс III

Рабочая память УУМ

4,6

Объяснение решения ЕМ

Механизм вывода диагностического решения 1Е

I

10

1 - Информация пользователя на естественном языке (ЕЯ);

2 - Инф. пользователя на внутреннем языке (ВЯ);

3 - Экспертные знания;

4 - Результирующая инф. на ВЯ;

5 - Инф. диагностики на ВЯ;

Приобретение

знаний ------3------*

КА

Режим решения задач Режим приобретения

6 - Объяснительная инф. на ВЯ;

7 - Результирующая инф. на ЕЯ;

8 - Объяснительная инф. на ЕЯ;

9 - Данные, знания экспертов и инженера ло знаниями на ЕЯ;

10 - Данные, знания экспертов и инженеров по знаниями на ВЯ.

Рисунок 1 - Общая структурная схема ДЦЭС Рабочая память (РП) предназначена для хранения информации об исследуемом объекте, вводимой пользователями, и результирующей информации в текущий момент решения задачи диагностики. Когда факты поступления новой информации актуализированы, создается элемент рабочей памяти (ЭРП) для каждого факта в виде кортежей фиксированной длины.

Объяснение решения (ОР) предназначено для отслеживания поведения системы на основе анализа протокола вывода, каждая запись которого соответствует одному диагностическому заключению на основании проявляющихся признаков. Поэтому пользователи могут понять, почему и как решение сформировано системой на каждом этапе.

Пользовательский интерфейс (ПИ) обеспечивает преобразование сообщений с внутреннего языка системы на естественный язык и обратно.

База знаний (БЗ) является ключевым понятием ДЦЭС. Для представления знаний в БЗ используется гибридная модель, сочетающая фреймовую и нечетко-продукционную модель.

Фреймовая база знаний (ФБЗ) используется для описания области диагностики (группы диагнозов, диагнозы, группы признаков, отдельные признаки), а также для представления статистических сведений о состоянии пациента (количественные оценки силы проявления признаков; количественные интегральные оценки вероятностей для различных диагнозов, оцененные на основе выявленных признаков). Нечетко-продукционная база знаний (НПБЗ) содержит описания причинно-следственных отношений, связывающих диагнозы с комплексами признаков.

База знаний задается следующим образом:

кв= (fqfsqfsmfssfsq{fid}, {пц\ {щ}, {Fiq}, {Fiq}}

где: fc — фрейм-класс; fsd - фрейм-прототип диагноза; fsm — фрейм' прототип группы диагнозов; fss - фрейм-прототип отдельного признака; fsg -фрейм-прототип группы признаков; fsc - фрейм-прототип комплекса признаков; {fid,} - множество фреймов-экземпляров диагнозов; [fim - множество фреймов-экземпляров групп диагнозов; {f/5*} - множество фреймов-экземпляров отдельных признаков; {f/g4} - множество фреймов-экземпляров групп признаков; {fsc ,} - множество фреймов-комплексов признаков для диагнозов.

Под фреймом-классом понимается фрейм верхнего уровня для представления совокупности фреймов-прототипов. Фрейм-класс определяется именем и совокупностью слотов. Фрейм-класс задается следующим образом:

FC = (NFC, {(NS, TS, VS, {PDS,}), {PMSj}})

где: nfc - имя фрейма-класса; т - имя слота; ts - тип данных слота; ks -значение слота; {pds,} - множество демонов, выполняемых при обращении к значению слота; {pms]} - множество присоединенных процедур.

Нечетко-продукционное правило (Hi111) задается следующим образом:

FR=(NFR, {(L , I ГС, (L КД i Л}, со)

где: nfr - имя НПП; lvs„lts, - лингвистическая переменная (ЛП) i-ro признака и ее лингвистический терм (ЛТ) из предпосылки НПП; lvd.ltd - ЛП диагноза и ее ЛТ из заключения НПП; ш - весовой коэффициент НПП.

Формирование базы данных (ФБЗ) может быть представлено следующим образом (см. рисунок 2).

Для заполнения таблиц базы знаний эксперт определяет основные понятия, описывающие область диагностики и взаимосвязи между ними: диагнозы и их группы; отдельные признаки и их группы; комплексы признаков для диагнозов.

На следующем этапе эксперт определяет основные лингвистические переменные (ЛП): переменные признаков - входные; переменные диагнозов -выходные. Для оценки значений ЛП используется единая качественная шкала: Н -низкий; НС - ниже среднего; С - средний; ВС - выше среднего; В - высокий. Соответствующие лингвистические термы (ЛТ) представляют нечеткое

множество, заданное с помощью соответствующих функций принадлежности,

Организация экспертного опроса

I

1

2

Эксперты

--2-

Заполнение таблиц БМЗ

База обучающих

выборок

1 1-----

База обучающихся

НПБЗ -

I I

L .

Генерирование векторов параметров НПБЗ

«-4

—1-

Фреймовая база знаний

Нечетко-продукционная база

Обучение НПБЗ

Извлечение знаний из статистических данных

Источники статистических данных _«Орел data»

1 - Диагнозы и их группы, отдельные 4 - Зависимости между ЛТ переменных

признаки и их группы, комплексы признаков признаков и диагнозов;

для диагнозов; 5 _ Зависимости между ЛП признаков и

2- Экспертные оценки силы проявления диагнозов; признаков при наличии диагнозов; 6 - Обучающиеся НПБЗ;

3-Статистические данные; 7 - Обученная НПБЗ.

Рисунок 2 - Схема формирования базы знаний Для извлечения знаний из статистических данных строятся модели, которые определяют соответствие различных одновременно наблюдаемых категориальных характеристик и могут быть представлены в виде простых правил. В данном случае такими характеристиками являются диагнозы наблюдаемых у исследуемых объектов или их признаки. Для реализации данного подхода используется алгоритм построения ассоциативных правил (АП) Apriori. Необходимо выполнить двухуровневую обработку данных следующим образом:

выявление зависимостей между множеством ЛП признаков и ЛП каждого диагноза;

выявление зависимостей между множеством ЛТ переменных признаков и ЛТ переменной каждого диагноза.

В зависимости от значимости АП можно определить весовой коэффициент Hi ill, который характеризует его достоверность.

Обучение нечетко-продукционной базы знаний (ОНПБЗ) осуществляется с применением генетического алгоритма и кода Грея для настройки параметров и коэффициентов НПП. А проверка базы знаний (ПБЗ) предназначена для поиска и исключения конфликтных (два разных диагнозов имеют схожие комплексы признаков) и избыточных НПП (одинаковые комплексы признаков присутствуют у сходных диагнозов). Ниже приведен алгоритм поиска и исключения противоречий в БЗ.

Шаг 1. Для каждого /-ого комплекса признаков из уже имеющегося множества «У» для всех диагнозов:

Шаг 1.1. Вычислить коэффициент сходства Кульчинского вновь создаваемого (т.е. комплекса признаков-кандидата на добавление в множество) и 7-ого рассматриваемого комплекса признаков из имеющегося множества по следующей формуле:

■ К = [1/2: (А) +1/2; (Я,)]- Е пЛпМ/2

где: А, - экспертная оценка силы проявления 1-го признака в создаваемом комплексе л; В, - экспертная оценка силы проявления г'-го признака в рассматриваемом комплексе в; р - количество признаков в комплексе а ; д -количество признаков в комплексе в\ р - количество признаков, общих в комплексе признаков лив.

Шаг 1.2. Сравнить вычисляемый коэффициент сходства для вновь создаваемого комплекса признаков, который является кандидатом на добавление в множество, с _/-ым, рассматриваемым в отношении превышения заданного порогового значения.

а) Если коэффициент сходства превышает заданный порог и диагнозы различны, то правила создаваемого комплекса признаков конфликтны. Тогда создаваемый комплекс признаков добавляется в список для модификации. В случае редактировании комплекса признаков необходимо перейти к началу цикла проверки.

б) Если коэффициент сходства превышает заданный порог и диагнозы сходны, то правила создаваемого комплекса признаков избыточны. Тогда комплекс признаков-кандидат в БЗ не добавляется. Перейти к окончанию алгоритма.

в) Если коэффициент сходства не превышает заданный порог и диагнозы сходны, то рассматриваемый комплекс признаков добавляется в список для модификации. При редактировании комплекса признаков необходимо повторить текущий цикл проверки.

г) Если коэффициент сходства не превышает заданный порог и диагнозы различны, то создаваемый новый комплекс признаков до сих пор непротиворечив.

Шаг 2. Добавить комплекс признаков-кандидат в БЗ после успешной проверки на непротиворечивость.

Механизм вывода диагностического решения (МВДР) предназначен для получения диагностического заключения на основании входных оценок выявленных признаков. В зависимости от текущей интегральной оценки выводимый диагноз может находиться в одном из трех возможных состояний:

неактивный кандидат (не рассматривается в качестве диагностической

гипотезы);

потенциальный кандидат (имеет смысл рассмотреть в качестве диагностической гипотезы);

активный кандидат (помещенный в список диагностических гипотез).

Под диагностической гипотезой понимается диагноз с оценкой его наличия. Список диагностических гипотез - это, по сути, список пар «активный диагноз -интегральная оценка наличия», упорядоченных в убывающем порядке значений оценок.

Комбинированный МВДР реализуется следующим образом:

- генерация дополнительных вопросов по ведущим признакам и запрос оценок силы проявления (осуществляется с применением обратного вывода);

- формирование диагностического заключения (осуществляется с применением прямого вывода после каждого обратного вывода).

Генерация дополнительных вопросов (ГДВ) состоит из четырех этапов: выделение основного диагноза; определение ведущего признака выделенного диагноза; генерация дополнительного вопроса по определенному признаку; запрос оценки силы проявления признака у исследуемого объекта.

Формирование диагностического заключения (ФДЗ) происходит каждый раз при поступлении новых фактов в РП. Для обеспечения скорости вывода решения при больших БЗ и количестве фактах в РП применяется RETE-сеть. При использовании такой сети БЗ при трансляции преобразуется в сеть вывода решения. С ее помощью определяются изменения в конфликтном множестве диагнозов, вызванных вновь поступившими фактами.

Использование RETE-сети для вывода решения на нечеткой модели типа Мамдани в условиях неопределенности представлено следующим образом. Каждый комплекс признаков для диагноза соответствует одному фрагменту RETE-сети. Факт, попадающий на его вход, сигнализирует об успешной активации фрагмента сети и подает сигнал для активизации заключения. Для выбора одного или нескольких активных диагнозов из списка потенциальных кандидатов применяется комбинированный критерий, рассчитанный как сумма коэффициентов новизны и специфики. После разрешения конфликта выполняется НЛП для каждого активного диагноза. Далее происходит обновление состояния РП и формирование заключения о диагнозе.

В третьей главе приводится программная реализация дистанционной диагностической экспертной системы. Сформированы основные требования, предъявляемые кДДЭС. Реализуемая система должна обеспечить:

- объединение фреймовой иерархии и нечетко-продукционных правил для представления нечетких знаний;

- возможность создания, модификации и расширения БЗ (по критериям полноты и непротиворечивости) на основе интеграции технологий, использующих знания экспертов и методы извлечения знаний из баз статистических данных;

- возможность вывода диагностического решения в условиях неопределенности информации о выявленных признаках;

- работу с диагностической системой в режиме реального времени;

- возможность объяснения полученного решения;

- обеспечение удаленного доступа к диагностической системе, как для пользователей, так и экспертов;

- разграничение прав доступа пользователей (эксперты, конечные пользователи).

В качестве инструментальных средств разработки ДДЭС были выбраны язык программирования С# и интегрированная среда разработки Microsoft Visual

Studio. Используется сервер баз данных Microsoft SQL Server. Приложения реализованы с помощью технологий платформ .NET Framework и веб-сервера IIS.

Для организации архитектуры ДДЭС применяется комбинация из трех следующих архитектурных шаблонов с возможностью разграничения пользовательского приложения, сервера приложений и сервера базы данных (см. рисунок 3). Использование веб-ориентированных технологий при разработке сервера приложений позволило четко разграничить его на уровень логики, уровень доступа к данным и уровень представления. На сервере приложений ядро системы разработано с использованием объектно-ориентированного подхода. Ядро системы также разработано в виде программных модулей на компонентной технологии следующим образом. При создании NET WinForms-прштожения реализуются и тестируются функциональности модулей в отдельных библиотеках динамической компоновки. Затем можно использовать их в виде СОМ-объектов к?* LA^ так и в других приложениях.

; Пользовательское приложение I ................ ................................

| (Веб-браузеры)

| ДлЛЛ Эксперты |

I Пользователи! !

Пользовательский интерфейс JNEH^Win Form^pw^

I СОМ-Интерфвйс

X

Сервер приложений (Веб-сервер IIS)

Уровень представления

( i Попьзоаательсний интерфейс 11 (ASP.NET MVC веб-приложение)

\ Уровень логики

Ядро сисгвагы t основная бизнес-

(Библиотеки -DLL)

• Уровень доступа кданньм

Источник данных (для доступа к БД м управления данные) (Библиотеки .DLL)

MiningLibrary (извлечение знаний из статистических данных)

(библиотеки динамической компоновки)

П

ю *

LearningLibrary (обучение НПБЗ)

BuildingLlbrary (заполнение таблиц БЗ)

DataAccess Layer (Доступ к БД и управление данными)

11 • • ill

ÜI

I Сервер базы да юных j (Microsoft SQL Server) ! Контур интерфейса с БД

DeferredAdv iceLibrary (отсроченная консультация)

.............

Administrât onUDrary (управлению сведенияк« о пользователях)

I (добавляемые м ! редактируемые компоновки)

Преобразование знаний в/из данные

KnowiedgeBaseLibrary

CatalogLiörary (электронный справочник)

Генерация дополнительных вопросов

Рабочая память

Ч

Объяснение вывода решения

Формирование диа гностического

заключения bnlineAdf се Library

TestLIbrary (проверка БЗ)

1 - Данные; 2-Знания;

3 - Факты проявления признаков;

4 - Факты наличия диагнозов;

5 - Запись журнала вывода решения;

6 - Объяснительная информация;

7 - Экспертные знания экспертов;

8 - Статистические данные;

9 - Обучающиеся НПБЭ и обучающие выборки; 10-База НПП;

11 - Обученная НПБЭ;

12 - Информация о пользователях;

13 - Отправленные анкеты;

14 - Справка, рекомендация по исследованию.

Рисунок 3 - Схема архитектуры ДДЭС

Диаграмма классов ДДЭС представлена двумя следующими уровнями: представления знаний; вывода диагноза.

База данных ДДЭС состоит из таблиц, которые можно разделить на шесть основных категорий: экспертных данных; статистических данных; ассоциативных правил; обучающихся НПБЗ. Для манипулирования данными используются хранимые процедуры, которые создаются с помощью языка Т-БРЬ.

Основные алгоритмы ДДЭС:

Алгоритм приобретения знаний представлен последовательностью шагов:

Шаг 1. Выбрать режим работы для формирования БЗ:

Шаг 1.1. Заполнить таблицы БЗ.

Шаг 1.1.1. Заполнить таблицы диагнозов и их групп.

Шаг 1.1.2. Заполнить таблицы отдельных признаков и их групп.

Шаг 1.1.3. Заполнить таблицы комплексов признаков для диагнозов.

Шаг 1.2. Выполнить извлечение знаний из статистических данных.

Шаг 1.3. Обучить НПБЗ для настройки параметров и коэффициентов НПП.

Шаг 2. Проверить БЗ для поиска и исключения противоречий.

Алгоритм постановки диагноза представлен последовательностью таких шагов:

Шаг 1. Выбрать группу диагнозов или группу признаков при необходимости (по истории диагностики исследуемого объекта и др.).

Шаг 2. Цикл «изучение состояния объекта»:

Шаг 2.1. Выполнить генерацию вопроса по ведущему признаку.

Шаг 2.2. Ввести входную оценку силы проявления ведущего признака.

Шаг 2.3. Вычислить интегральные оценки наличия возможных диагнозов.

Пока ни одно активный диагноз не сформирован, перейти к шагу 2.1.

Шаг 3. Сформировать диагностическое заключение (список проявляющихся признаков и диагностических гипотез).

Шаг 4. Вывести предлагаемое диагностическое заключение.

Четвертая глава посвящена испытанию и внедрению ДЦЭС.

Для оценки работоспособности предложенных методов и алгоритмов была разработана ДЦЭС для решения задачи медицинской предварительной диагностики в удаленном режиме - ДЦЭС МПД. Предварительная диагностика представляется как первый этап диагностического процесса для сбора и структурирования данных, и определения первичных характера болезней на основе полученной информации.

В ходе разработки ДДЭС МПД были выявлены три группы пользователей: врачи-терапевты, которые анализируют анкеты пациента (личные данные, симптоматика и истории болезни), на основе которых осуществляется поддержка врачебных решений для дальнейшего обследования (т.е. направления на различные анализы, а также на осмотр узкими специалистами);

- пациенты, которые не могут по ряду причин часто добраться в медучреждение, но нуждаются в объективной оценке своей симптоматики, на основе которой осуществляются визит врача на дом или запись на прием к соответствующему врачу;

студенты-медики, которые хотят повысить свою квалификацию и получить опыт постановки первичного диагноза.

Для установления новых зависимостей и корректировки НПП в БЗ предлагается механизм «обратной связи», который основан на идее «отсроченной медицинской консультации». Реализуется возможность пополнения базы статистических данных на основе анализа информации, полученной после обработки анкет, по которым решения не были приняты автоматически. На рисунке 4 представлена схема отсроченной медицинской консультации, состоящей из пяти основных этапов.

На положении компонентной архитектуры была расширена возможность разработанной системы добавлением (или редактированием) в ее ядро двух динамических компоновок: отсроченной консультации; управления сведениями о врачах, и также лечебно-профилактических учреждениях. И также в схему базы данных добавлены их две соответствующие категории таблиц данных.

Заполнение и отправление анкеты врачам по специальности

-1-

1

_1_

-3-------(

Занесение в базу данных

Принятие анкеты от пациента

-2*

Анализ симптоматики пациента в анкете

-4

Отправление пациенту рекомендаций для обследования

1 - Отправленная пациентом анкета; 3 - Симптоматика пациента и заключение врача;

2 - Принятая врачом анкета; 4 - Рекомендации пациенту для обследования.

Рисунок 4 - Схема отсроченной медицинской консультации

Процедура ДДЭС МПД в рабочем режиме представлена последовательностью шагов:

Шаг 1. Выполнить аутентификацию пациента (ввод имени и адреса электронной почты для обратной связи).

Шаг 2. Заполнить анкеты «личных данных» и «истории болезни» пациента (ввод возраста, пола, профессии, места работы и др.)

Шаг 3. Заполнить последовательно анкету «симптоматики», на основании которой поставить предварительный диагноз.

Шаг 4. Выбрать режим работы:

Шаг 4.1. Поддержать врача-терапевта, принимающего решение для дальнейшего обследования.

Шаг 4.2. Выбор варианта пациента:

а) Результат предварительного диагноза не принят. Отправить анкеты пациента врачу-специалисту для отсроченной консультации.

б) Результат предварительного диагноза принят. Порекомендовать пациенту запись на прием к врачу-специалисту.

Шаг 4.3. Обучить студентам-медикам предварительной диагностике.

Процедура ДДЭС МПД в режиме отсроченной медицинской представлена последовательностью шагов:

Шаг 1. Выполнить авторизацию врача-специалиста (ввод логина и пароля).

Шаг 2. Загрузить список отправленных анкет по соответствующей специальности.

Шаг 3. Для каждой отправленной анкеты проверить анкеты пациента:

а) Если анкеты приняты, то сформировать и записать новое диагностическое заключение в базу данных, тогда отправить письмо пациенту по указанной электронной почте.

б) Если анкеты неприняты, то направить ее врачам по предлагаемой узкой специальности.

Описана разработанная система, в состав которой входят семь следующих подсистем:

1. Подсистема пополнения БЗ реализует следующие функции:

- заполнение таблиц основных понятий области медицинской диагностики;

- задание функций принадлежности JIT переменных.

2. Подсистема извлечения знаний из баз статистических данных предназначена для выявления взаимосвязей между ЛП «симптомов и заболеваний» и их ЛТ, на основании которых сформированы Hi 111.

3. Подсистема обучения НПБЗ предназначена для генерирования и настройки параметров функций принадлежности и весов правил в НПБЗ.

4. Подсистема отсроченной консультации реализует следующие функции:

- заполнения анкет пациента;

- обмена сообщениям между пациентом и врачом;

- внесения информации в базу статистических данных.

5. Подсистема онлайн-консультации реализует следующие функции:

- генерации дополнительных вопросов по ведущим симптомам, и запроса оценок силы проявления выявленных симптомов у пациента;

- вычисления интегральных оценок обнаружения наличия возможных заболеваний на основе информации о симптоматике;

- формирования предлагаемого диагностического заключения (анкеты пациента, и результат предварительного диагноза).

6. Подсистема справочников представляет собой электронный медицинский справочник, к которой может оперативно обращаться врач при принятии решения о целесообразности обследования пациента у врача-специалиста или назначении анализов.

7. Подсистема администрирования предназначена для управления сведениями о врачах (Ф.И.О., контактные данные, медицинское учреждение, специальность врача, график его работы).

С помощью разработанной системы можно решать следующие задачи: формирования БЗ в режиме приобретения знаний; постановки предварительного диагноза в режиме удаленной консультации.

В результате реализаций процедур приобретения знаний с помощью предложенных методов и алгоритмов был сформулирован набор Hi ill. На их базе была построена БЗ для диагностики рассматриваемых заболеваний. Эта БЗ была положена в основу ДДЭС МПД, предназначенной для постановки предварительного диагноза - преимущественно в удаленной форме. Тестирование показало, что в 79% случаев результаты диагностика совпадали с результатами предварительного диагноза, поставленного врачами.

Использование ДДЭС МПД для обучения технологиям предварительной диагностики проверялось на основе группы, состоявшей из 10 студентов 6-ого курса в медицинском университете г. Волгограда (специальность - «лечебное дело»). Преподаватель оценивал знания студентов на основе сравнения их ответов и результатов диагностики, выданных разработанной системой. Кроме того, после каждого ответа студентам предоставляется информация, объясняющая вывод решения.

Схема использования ДДЭС МПД для записи на прием пациента к врачу-специалисту приведена ниже (см. рисунок 5. а).

По сведениям практикующих врачей более 30% пациентов попадают на прием не к тому специалисту. Многим назначают избыточные обследования, что приводит к липшим затратам времени и денежных средств.

Предлагаемый подход позволяет снизить количество процедур при предварительной диагностике и повысить обоснованность последующих назначений.

Схема использования ДДЭС МПД для поддержки деятельности врача-терапевта, принимающего решение о дальнейшем обследовании, приведена ниже (см. рисунок 5. б).

Рисунок 5 - а) Схема организации записи пациента на прием к врачу-специалисту; б) Схема поддержки деятельности врача-терапевта, принимающего решение о дальнейшем обследовании пациента

Тестирование ДДЭС МПД проводилось на основе сравнения диагноза, поставленного врачом-терапевтом без использования и с использованием разработанной системы. За счет того, что процесс предварительной диагностики автоматизирован, и имеет удобный пользовательский интерфейс, врач может оперативно запросить симптомы по предложению системы или осуществить самостоятельный поиск в базе, время постановки предварительного диагноза сокращается в два раза. Это позволяет сократить срок всего процесса обследования при обеспечении достоверности результата.

В заключении приведены основные научные и практические результаты диссертационной работы, а также предложены возможные направления дальнейших исследований.

В приложениях приведены экранные формы ДДЭС МПД.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

На основе проведенных исследований решены все поставленные задачи и получены следующие основные результаты:

1. Проведен анализ подходов к созданию интеллектуальных систем диагностики, выявлены недостатки используемых моделей и методов. Определены основные требования к дистанционной интеллектуальной диагностической системе.

2. Сформулирована в общем виде постановка задачи диагностики сложных систем. Построена концептуальная модель диагностики состояния объекта.

3. Разработана информационная модель ДДЭС, и ее основные компоненты:

- база знаний, основанная на объединении фреймовой и нечеткой модели представления знаний;

- приобретение знаний, основанное на интеграции технологий использующих знания экспертов и знания, извлеченные из баз данных;

- механизм вывода диагностического решения, основанный на комбинации обратного и прямого вывода;

- и др. (рабочая память, объяснение решения и пользовательский интерфейс).

4. Разработано математическое обеспечение ДДЭС, которое включает следующие алгоритмы:

- приобретения знаний для формирования БЗ;

- заполнения таблицы БЗ;

- извлечения знаний из статистических данных;

- обучения НПБЗ для параметров и коэффициентов Hl 111;

- поиска и исключения противоречий в БЗ;

- постановки диагноза;

- генерации вопросов по ведущим признакам, и запроса оценок их проявления;

- вычисления интегральных оценок наличия возможных диагнозов.

5. Разработана архитектура ДДЭС на основе трехслойных шаблонов с возможностью разграничения уровней логики, доступа к данным и уровней представления.

6. Реализована ДДЭС МПД на основе разработанных моделей и алгоритмов.

7. Проведено тестирование и апробация разработанной ДДЭС МПД на базовом наборе Hl 111.

Основные положения диссертации опубликованы в 17 работах, основными из которых являются:

Статьи в ведущих научных журналах и изданиях, рекомендованных ВАК Министерства образования и науки РФ:

1. Обзор подходов к проектированию медицинской системы дифференциальной диагностики / Ле Нгуен Виен, Камаев В.А., Панченко Д.П., Трушкина O.A. // Известия ВолгГТУ. Серия "Актуальные проблемы управления,

вычислительной техники и информатики в технических системах". Вып. 20 : межвуз. сб. науч. ст. / ВолгГТУ. - Волгоград, 2014. - № 6 (133). - С. 50-58.

2. Модель представления знаний при создании медицинской экспертной системы дифференциальной диагностики / Jle Нгуен Виен, Камаев В.А., Панченко Д.П., Трушкина O.A. // Известия ВолгГТУ. Серия "Актуальные проблемы управления, вычислительной техники и информатики в технических системах". Вып. 20 : межвуз. сб. науч. ст. / ВолгГТУ. - Волгоград, 2014. - № 6 (133). - С. 41, 50.

3. Приобретение медицинских знаний в дистанционной медицинской экспертной системе предварительной диагностики / Jle Нгуен Виен, Н. П. Садовникова // Прикаспийский журнал: управление и высокие технологии. -2014.-№4.-С. 185-196.

4. Архитектура медицинской экспертной системы дифференциальной диагностики / Ле Нгуен Виен, Камаев В.А., Панченко Д.П., Трушкина O.A. // Вестнике СамГТУ. Серия «Технические науки». - 2014. - № 3(43). - С. 23-28.

Публикации в журналах, индексированных в международной базе цитирования Scopus:

5. An Intelligent Medical Differential Diagnosis System Based on Expert Systems / Камаев B.A., Панченко Д.П., Ле Нгуен Виен, Трушкина O.A. // Knowledge-Based Software Engineering : Proceedings of 11th Joint Conference, JCKBSE 2014 (Volgograd, Russia, September 17-20, 2014) / ed. by A. Kravets, M. Shcherbakov, M. Kultsova, Tadashi Iijima ; Volgograd State Technical University [etc.], - [Б/м] : Springer International Publishing, 2014. - P. 576-584. - (Series: Communications in Computer and Information Science ; Vol. 466).

Публикации в научных журналах, материалах международных и всероссийских конференций:

6. Подход к проектированию медицинской экспертной системы дифференциальной диагностики / Камаев В.А., Панченко Д.П., Ле Нгуен Виен, Трушкина O.A. // Проблемы управления в социально-экономических и технических системах : сб. науч. ст. по матер. X всерос. науч. конф., 10-11 апр. 2014 г. / Саратовский гос. техн. ун-т. - Саратов, 2014. - С. 26-28.

7. Ле, Нгуен Виен Проектирование медицинской экспертной системы дифференциальной диагностики / Ле Нгуен Виен, Трушкина O.A., Камаев В.А. // Материалы 52-й международной научной студенческой конференции МНСК-2014 (11-18 апр. 2014 г.). Информационные технологии / Новосибирский гос. ун-т, Сибирское отд-ние РАН, Правительство Новосибирской области. - Новосибирск, 2014.-С. 148.

8. Ле, Нгуен Виен Модель представления знаний при создании медицинской экспертной системы дифференциальной диагностики [Электронный ресурс] / Ле Нгуен Виен, Камаев В.А. // XII всероссийское совещание по проблемам управления (ВСПУ-2014), Москва, 16-19 июня 2014 г. : тр. / Ин-т проблем управления им. В.А. Трапезникова РАН. - М., 2014. - 1 электрон, опт. диск (DVDROM). - С. 3998-4009.

9. Приобретение медицинских знаний в медицинской экспертной системе дифференциальной диагностики / Ле Нгуен Виен, Трушкина O.A., Панченко Д.П.,

Камаев В.А. // Научная сессия ТУСУР-2014 : матер, всерос. науч.-техн. конф. студентов, аспирантов и молодых учёных, г. Томск, 14-16 мая 2014 г. В 5 ч. Ч. 3 / ФГБОУ ВПО "Томский гос. ун-т систем управления и радиоэлектроники (ТУСУР)". - Томск, 2014. - С. 43-46.

10. Jle, Нгуен Виен Механизм вывода диагностического решения в дистанционной медицинской экспертной системе предварительной диагностики / Ле Нгуен Виен // Кибернетика и программирование. - 2015. - № 1. - С. 16-26. URL: http://e-notabene.ru/kp/article 13722.html

11. Управление выводом решения в медицинской экспертной системе дифференциальной диагностики / Камаев В.А., Панченко Д.П., Ле Нгуен Виен, Трушкина O.A. // Будущее технической науки : сб. матер, (тез. докл.) XIII междунар. молодёжной науч.-техн. конф., Нижний Новгород, 23 мая 2014 г. / Нижегородский гос. техн. ун-т им. P.E. Алексеева. - Нижний Новгород, 2014. - С. 33-34.

12. Камаев, В.А. Архитектура медицинской экспертной системы дифференциальной диагностики / Камаев В.А., Панченко Д.П., Ле Нгуен Виен // Информационные системы и технологии. ИСТ-2014 : матер. XX междунар. науч.-техн. конф. (18 апр. 2014 г.), посвящ. 100-летию проф. Г.В. Глебовича / Нижегородский гос. техн. ун-т им. P.E. Алексеева, Ин-т радиотехники и информ. технологий. - Нижний Новгород, 2014. - С. 285-286.

13. Ле, Нгуен Виен Программная реализация медицинской экспертной системы дифференциальной диагностики / Ле Нгуен Виен, Панченко Д.П. // Программные системы и вычислительные методы. - 2014. - № 3. - С. 291-297.

14. Программная реализация медицинской экспертной системы дифференциальной диагностики / Камаев В.А., Панченко Д.П., Ле Нгуен Виен, Трушкина O.A. // Математические методы в технике и технологиях. ММТТ-27 : сб. тр. XXVII междунар. науч. конф. В 12 т. Т. 3, секции 6, 7, 8 / Саратовский гос. техн. ун-т им. Ю.А. Гагарина [и др.]. - Саратов, 2014. - С. 116-120.

15. Камаев, В.А. Дистанционная медицинская экспертная система дифференциальной диагностики / Камаев В.А., Садовникова Н.П., Ле Нгуен Виен // Методы компьютерной диагностики в биологии и медицине - 2014 : матер, всерос. школы-семинара, посвящ. 105-летию Саратовского гос. ун-та им. Н.Г. Чернышевского / под ред. Д.А. Усанова ; Саратовский гос. ун-т им. Н.Г. Чернышевского. - Саратов, 2014. - С. 192-195.

Публикации в других изданиях:

16. Ле, Нгуен Виен Диагностика заболеваний с использованием методов теории вероятностей / Ле Нгуен Виен, Трушкина O.A. // Приволжский научный вестник. - 2014. - № 2. - С. 9-11.

17. Использование формул условных вероятности и энтропии при медицинской диагностике / Ле Нгуен Виен, Трушкина O.A., Камаев В.А., Панченко Д.П. // России - творческую молодёжь : тез. докл. VII регион, науч.-практ. студ. конф., посвящ. 20-летию Камышинского технол. ин-та (филиал) ВолгГТУ (г. Камышин, 21-22 мая 2014 г.). В 2 т. Т. 2 / ВолгГТУ, КТИ (филиал) ВолгГТУ. - Волгоград, 2014. - С. 91.

Личный вклад соискателя в работах по опубликованным совместным научным работам:

В работах [1, 6] соискателю принадлежат описание обзор подходов к проектированию диагностических системы диагностики. В работе [7] соискатель описывает проектирование диагностических системы на основе экспертных систем. В работах [2, 8] соискатель описывает модель представления знаний при создании дистанционной диагностической экспертной системы. В работах [3, 9] соискатель описывает способы приобретения знаний в дистанционной диагностической экспертной системе. В работах [10, 11] соискателю принадлежит описание методов и принципов управления выводом решения в дистанционной диагностической экспертной системе. В работах [4, 12] соискатель описывает архитектуру дистанционной диагностической экспертной системы. В работах [13, 14] соискателем описывается программная реализация дистанционной диагностической экспертной системы. В работах [5, 15] соискатель описывает разработку дистанционной диагностической экспертной системы, и также ее применение для решения задачи медицинской предварительной диагностики в удаленном режиме. Основные положения диссертации опубликованы в соавторстве с научными руководителем и консультантами.

Подписано в печать 27.01.2015 г. Формат 60x84 1/16. Бумага офсетная. Печать трафаретная. Печ. л.1,0. Тираж 100 экз. Заказ № 46.

Типография ИУНЛ Волгоградского государственного технического университета. 400005, г. Волгоград, просп. им. В.И. Ленина, 28, корп. №7.