автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.09, диссертация на тему:Разработка системы интеллектуальной поддержки принятия решений в детской аллергологии

кандидата технических наук
Арутюнян, Ирэна Вазгеновна
город
Санкт-Петербург
год
1996
специальность ВАК РФ
05.13.09
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка системы интеллектуальной поддержки принятия решений в детской аллергологии»

Автореферат диссертации по теме "Разработка системы интеллектуальной поддержки принятия решений в детской аллергологии"

рга о.

2 3 ЛЕН

На правах рукописи

Арутюнян Р1рэна Вазгеновна

"РАЗРАБОТКА СИСТЕМЫ ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ДЕТСКОЙ АЛЛЕРГОЛОГИИ".

Специальность: 05.13.09 - Управление в биологических

и медицинских системах

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата технических наук

Санкт-Петербург - 1996

Работа выполнена в Северо-Западном заочном политехническом институте.

Научный руководитель:

з-д.н. и т. РФ, академик, доктор биологических наук, профессор Гугкин В.И.

Официальные оппоненты:

доктор технических наук, профессор Попечителев Е.П. кандитат медицинских наук ^ОТР. т'^РП^"-. 1

Ведущая организация - Кафедра детских болезней ВМА

Защита состоится -Ьг 199^. в ¡19,00часов на

заседании диссертационного совета Д 063.36.09 Санкт-Петебургского государственного электротехнического университета им. В.И.Ульянова (Ленина), по адресу: 197376, г.Санкт-Петербург, ул. проф.Попова 5.

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан 1

1996г.

"Ученый секретарь диссертационного совета

Юлдашев З.М.

Общая характеристика работы Актуальность темы. В последние десятилетия отмечен рост частоты аллергических заболеваний (АЗ).

Масштабность и распространенность АЗ в последние годы предъявляет новые требования к уровню их диагностики и лечения.

Проблема диагностики и контроля за лечением АЗ в педиатрии стала особенно актуально. Её практическая значимость побудила к поиску и восполнению пробела в вопросах создания новых информационных технологий в детской аллергологии. Разработка интеллектуальной системы поддержки (СИП) принятия решений в детской аллергологии позволит по клиническим, анамнестическим и лабораторным признакам осуществить диагностику и контроль за лечением АЗ. Разработка подобной системы позволит облегчить лечебно-диагностический процесс.

Существующие,а также появившиеся в последнее время СИП могут решить эту проблему только односторонне: они предназначены не для решения проблем детской аллергологии и используют только экспертное оценивание. Цель работы.

Целью работы является разработка и исследование СИП диагностики и контроля за лечением АЗ в педиатрии.

Для достижения поставленной цели было необходимо решить следующие основные задачи:

1 .Сформировать обучающую и контрольную выборки. 2.0пределить набор информативных признаков (обобщенных характеристик) для классификации состояний пациента. З.Разработать и исследовать модель принятия решений применительно к диагностике АЗ в педиатрии.

4.Синтезировать решающие правила, позволяющие минимизировать "зону неопределенности" между классами.

5. Экспериментально исследовать СИП.

Методы исследования. При выполнении работы использовались методы системного анализа и искусственного интеллекта, аппарат математической статистики и распознавания образов. Научная новизна.

1.На основании анализа клинических методов принятия решений обоснован о использование продукционной модели для построения СИП диагностики АЗ в педиатрии.

2.Сформулированы основные требования для построения СИП диагностики АЗ в педиатрии.

3.Выявлены информативные признаки используемые для дифференциальной диагностики АЗ у детей.

4.Синтезирован алгоритм правил принятия решений.

5.Разработаны модели классификациии, осуществляемые врачом при отнесении состояния пациента к одному из возможных трех степеней тяжести.

Практическая значимость. Ценность полученных в работе результатов при диагностике АЗ в педиатрии заключается в использовании предложенных в работе правил принятия решений. При этом предложены критерии для оценки тяжести состояния пациента, полученные в результате экспериментальных исследований.

Разработаны классы и модели, которые следует выбрать после оценивания тяжести состояния больного. В результате теоретических и экспериментальных исследований определены пять классов заболеваний и 3 степени для оценивания тяжести состояния пациента.

Практическое значение имеют определение уровня ^Е при наличии определенных информативных лабораторных показателей с одной стороны и клинических и анамнестических данных - с другой. Использование информативных лабораторных показателей позволяет оперативно определить уровень ^Е не только на данном этапе, но и в последующем, т.к. при проведении лечебных мероприятий уровень ^Е как правило претерпевает изменения.

Результаты работы целесообразно использовать в аллергологических кабинетах поликлиник, аллергических отделениях многопрофильных детских больниц, а также в лабораториях, не имеющих возможность определить Внедрение результатов работы. Разработанная СИП проходила испытания с 1994г. в отделении аллергологии Детской городской больницы №1 Санкт-Петербурга, в клинике Санкт-Петербургской Государственной педиатрической медицинской академии, в клинике Государственного медицинского университета. В дальнейшем планируется внедрение и в других медицинских учреждениях.

Апробация. Результаты работы докладывались на конференциях: "Диагностика, информатика, метрология-94" (СПб,

электротехнический университет, 28-30 июня, 1994), 5 Национальный конгресс пульмонологов (Москва, 28-31 марта, 1995), "Курорты, экология, бизнес" (СПб, 14-15апреля 1995), "Болезни органов дыхания" (Киев, 1995).

Публикации. Самостоятельно и в соавторстве опубликовано 7 печатных работ, из них 6 тезисов.

Положения, выносимые на защиту. 1.Модели, полученные в результате проведенного впервые многофакторного статистического анализа, дают возможность

отнести заболевание пациента к одному из пяти возможных классов

заболеваний после оценивания тяжести состояния.

2.Система и правила принятия решений при диагностике A3 в

педиатрии.

Объём работы. Диссертация состоит из введения, четырех глав, 21 таблиц, И рисунков и списка литература, который содержит 185 наименований. Основной текст изложен на 100 машинописных страницах. Вся работа -126 страниц.

Содержание работы Во введении обоснованы исследования, перечислены результаты, определяющие актуальность темы, сформулированы цель и задачи,; -новизну и практическую ценность работы.

Первая глава содержит аналитический обзор известных СИП диагностики. Рассмотрены этапы традиционной (клинической) диагностики A3 в педиатрии.

Проанализированы основные сложности, возникающие при диагностике A3 в педиатрии. При ранней диагностике A3 в педиатрии используется огромный массив анамнестических, клинических у, лабораторных данных. Очень многие лабораторные методики под силу не любому медицинскому учреждению.

В работе показано, что совокупности информативных параметров недостаточны доя диагностики A3 в педиатрии. Необходимы соответствующие правила принятия решений, разработанные с использованием аппарата математической статистики.

Как следует из проведенного анализа в работе, самым сложным этапом при дифференциальной диагностике - определение уровня IgE (иммуноглобулин Е). Повышение уровня этого показателя зачастую опережает клинические проявления аллергического процесса.При

дифференциальной диагностике и контроле за лечением АЗ в педиатрии иммуноглобулин Е является одним из основных критериев. Но методики определения ^Е очень дорогостоящие и поэтому одна из задач, которая стояла перед нами - выявление решающих правил для определения уровня ^Е математическими методами. Во второй главе рассмотрены основные методики разработки СИП. Анализируется современное состояние развития методологии СИП-одного из направлений разработки систем искусственного интеллекта. Показано, что в настоящее время медицина является одним из основных поставщиков идей и новых методов в данной области.

Оценка целесообразности и возможности разработки СИП, проведенная по таким критериям как возможность построения строгих алгоритмов, наличие экспертов, характер решаемой задачи и статичность знаний, показала, что разработка СИП принятия решений в детской аллергологии оправдана.

Сформулированы следующие требования к СИП диагностики и контроля за лечением АЗ в педиатрии:

1 .Знания должны соответствовать только аллергическим заболеваниям в педиатрии (система предназначена только для диагностики и в педиатрии).

2.Приобретение знаний должно быть возможным от большего количества экспертов.

3.Система должна обеспечить решение реальной задачи - диагностику и контроль за лечением АЗ у детей.

В принципе, как и любая диагностическая задача, она сводится к задачам классификации, но вся сложность этого вопроса в том, что нет единого мнения у экспертов предметной области при классификации болезней.Отсюда и сложности: сколько экспертов, столько и мнений.

Работа данной СИП, предназначенная для диагностики и контроля за лечением АЗ, основана на знаниях, использующих продукционные модели (модели, основанные на использовании правил принятия решений).

4.Система должна запрашивать минимальное количество информации для принятия решений. При этом вопросы, задаваемые системой, не должны повторяться.

5.Система должна быть достаточна прозрачной. Пользователь должен знать, что именно проверяет система в каждый момент времени и для чего системой запрашивается информация (СИП должна выдавать сообщение при переходе проверки от класса к классу).

6.Система должна быть дружелюбна к пользователю, т.е. должна быть проста в работе и предоставлять помощь в любой момент времени.

7.Должны быть соблюдены общие требования к разработке программного продукта, а именно:

-Соответствие общепринятым стандартам. Используемые клавиши должны иметь принятую функциональную нагрузку. При некотором отличии от общепринятых норм, подсказка выдается внизу экрана. -Сообщения по ходу работы системы должны быть логически верны и оправданы. Система не должна оставлять в неведении относительно выполняемых ее в данный момент действий.

-Возможность просмотра результатов работы как на экране, так и распечатанным на принтере.

-Обработка непредвиденных действий пользовагеля(система не должна выходить из строя при неверном обращении).

-Система должна иметь возможность корректировки ошибочно введенной пользователем информации.

Показано, что самый важный момент в разработке СИП разработка базы знаний. Она строится путем "извлечения" знаний

экспертов. "Извлечение" знаний наталкивается на следующие проблемы:

-эксперт чаще всего знает больше, чем может сказать разработчику СИП;

-передача знаний экспертом невозможна без ошибок;

-попытки решить первые две проблемы приводят к резкому росту

затрат и усилий.

Для разработки базы знаний принят подход-обучение с минимальными требованиями к эксперту. Частным случаем предлагаемого нами подхода, является предоставление эксперту готовых правил принятия решений, которым эксперт дает оценку. Сложным моментом при реализации подхода - получение решающих правил на начальной этапе.

Предложено решить проблему получения правил на начальном этапе с помощью методик распознавания образов.

Определена следующая последовательность этапов разработки СИП: ¡.Исключение информационно-избыточных признаков и их значений, объединение признаков не влияющие на проведение разделения на классы, то есть проведение минимизации описания (обобщение данных).

2.Используя пакеты прикладных программ, синтезирующих решающие правила без ограничений на размер функций, получить первичную базу знаний.

З.Записанную базу знаний представить экспертам на языке привычном для пользователя.

Третья глава посвящена СИП, построенной на продукционной модели. Для разработки системы была использована база данных, накопленная на отделении аллергологии Детской городской больницы №1 Санкт-Петрбурга.

База данных состояла из верифицированных наблюдений аллергических больных. Наблюдения базы данных состояли из 54 анамнестических, клинических и лабораторных показателей.

В результате применения следующих, решающих правил были получены управляющие и управляемые переменные:

Упиц—■ гХ|тт + ГгХзтт + ... + ГпХгаит!

(О-

¥тах= Г|Х|тах"1~ ГгХгтах "Ь ... + ГпХптах. После выявления управляемой переменной определяются её взаимозависимости с управляющими признаками. При этом, генеральная совокупность была разбита на две выборки. Основным критерием разбиения была управляемая переменная-^Е (1ёЕ<200усл.ед.,300<1цЕ<1500усл.ед.). С помощью корреляционного анализа были выявлены линейные зависимости.

Таблица №1

Коэффицеиты корреляции и их достоверности (1%Е<200ед/л)

Хз Х5 Хб Х9 X»

№<200 Я=-0.61 Я=0.43 11=0.63 11=0.61 Я=-0.36

Р=0.02 Р=0.02 Р=0.01 Р=0.П Р=0.12

Обозначения принятые в таблице №1:

Хз- а.1-глобулин; Х5 -возраст появления первых симптомов; Хб-продолжигельность грудного вскармливания; Х^-возраст ребенка в момент обращения; Х1з-лимфоциты.

Таблица М2 Коэффиценты корреляции и их достоверности (300<%Е<1500ед/л )

Х2 Х3 Х4 хб х8 X? Хн

1бЕ<300 1 о * г=0.64 г=0.53 г=0.42 г=0.5 г=0.4 г=0.4

1дЕ<150С р=0.05 р=0.003 р=0.02 р=0.07 р=0.02 р=0.08 р=0.09

Обозначения принятые в таблице №2:

Хг-лимфоциты; Хз-моноциты; Х^-продолжительность грудного вскармливания; Хб-общий белок; Х8-а|-глобулин; Хэ-аг-глобулин; Хи ^-глобулин.

В результате проведения процедуры минимизации из 54 признаков осталось 12.

После проведения процедуры минимизации были выделены основные критерии для оценки тяжести состояния. Были разработаны правила для расчета уровня ^Е и выделены все классы заболеваний, для которых были выделены основные интервалы колебаний уровня 1дЕ и соответственно модели, которые выбиралсиь врачом после классификации состояния пациента.На обучающей выборке был проведен многофакторный регрессионный анализ.

Если при расчете корреляционной матрицы многие признаки оказались информативными в обеих группах (и соответственно они переставали быть информатиными), то при многофакторном регрессионном анализе была проведена корректировка этих показателей, а именно: признаки которые вносили свой вклад (повышали детерминированность модели хотя бы на 2%) в коэффицент детерминации, были оставлены. Остальные признаки исключались только на данный момент.

В результате многофакторного регрессионного анализа были получены две модели, которые выбирались после оценивания тяжести состояния и которые соответствовали определенному классу заболеваний.

На основании многофакторного регрессионного анализа нами было получено уравнение определения уровня IgE и последующих его колебаний, при выборе первой модели (IgE <200ед/л):

Y(IgE) = 9.2*Хб + 10*Х9 (2),

где Хб - продолжительность грудного вскармливания выраженная в месяцах; Х9 - возраст больного (в годах) в момент обращения. При этом, коэффицент детерминации этой модели -И.-квадрат= 86,5%, модель значима, т.к. критерий Фишера F=33.5 (F>0.001), р=0.000 (уровень значимости). Коэффиценты линейного уравнения модели значимы для X«: р= 0.0072, Х9: р= 0.0010. При этом, эта модель полностью подтвердила мнение медиков и полученные ими [Нишева Е.С., 1996] результаты: чем дольше ребенок кормится грудью, тем выше значение IgE (если имело место внутриутробная сенсибилизация).

Для расчета уровня IgE при выборе второй модели можно производить по следующей формуле (300 <IgE <1500):

Y(IgE) = 51Xe + 63.5Хз (3),

где Хз - моноциты, Х8 -ai.

Когда значение ai ближе к нижнему пределу нормы от 3,1% и ниже , то основным критерием становится значение эозинофилов. Было получено, что в этом случае, эозинофилы вместо 5% верхней границы имеют значение от 15%-20%. Мы предполагаем, что в какой-то

момент патологического процесса ац хотя бы отчасти, выполняют функции зозинофилов. Когда и почему происходит "смена функций", к сожалению не удалось установить, т.к. зависимость 1дЕ от а! получена впервые. И, роль а\ в механизме формирования аллергической реакции не совсем выяснена (тоже получена впервые). И второй случай. При значениях моноцитов 9% и ниже, также следует обратить внимание на значение зозинофилов. В этом случае, ^Е рассчитывается по значениям зозинофилов и а).глобулинов. Такое доведение" управляющих переменных не удалось выяснить, так как тоже получена впервые. Обе модели были уточнены и скорректированы в результате проведения пошагового регрессионного анализа на контрольной выборке.

После проведения пошагового многофакторного регрессионного анализа был проведен дискришшантный анализ.

Дискримииаптный Анализ для FH.E1.IGE Дискриминантная Собственное Относительный Каноническая

Функция Значение Процент Корреляция

1 311.73092 99.23 .99840

2 2.40664 .77 .84051 Функции ХИ-КВАДРАГ ЭР Уровень Произошли Лямбда Значимости

0 .0093860 48.797497 26 .00436

1 .2935440 8.580095 12 .73832

Как видно из проведенного дискриминантного анализа, для описания первой модели вполне достаточна дискриминантная функция первого порядка, т.к. она описывает модель с определенностью на 99.23%.

Дискриминантная функция проверяется с помощью двух критериев: А? их2- Критерий Фишера равен Р= 48.8, уровень значимости р= 0.004, значение второго критерия 0.0009 с тем же уровнем значимости.

Дискриминантный анализ второй модели:

Дискримипаитпый Анализ для F1LE2. Y Дискриминантная Собственное Относительный Каноническая

Функция Значение Процент Корреляция

1 13.877742 92.48 .96581

2 .910972 6.07 .69044

3 .216760 1.44 .42207

Функции Wilks ХИ-КВАДРАТ DF Уровень

Произошли Лямбда Значимости

0 .0289070 42.524041 24 .01127

I .4300715 10.125645 14 .75294

2 .8218548 2.354299 6 .88440

Из общей характеристики второй модели следует, что для решения диагностической задачи вполне достаточно применить дискриминантаую функцию первого порядка, имеющий суммарный вклад в дисперсию симптомов 92.48%. Оценки уровня значимости дискриминантной функции по критерию Лямбда и Хи : уровень значимости для двух критериев р=0.01.

В результате пошагового многофакторного регрессионного и дискриминантного анализов, нами получены решающие правила для диагностики аллергического заболевания у детей.

Основные классы заболеваний, полученные в результате анализа:

1. Пищевая аллергия-ПА.

2. Респираторный аплергоз-РА.

3. Бронхиальная асгма-БА.

4. РА + ПА.

5. БА + ПА.

Основные степени для оценивания тяжести состояния:

1.1- легкая;

2. II - ср. тяжести;

3. III - тяжелое.

После получения базы знаний и представления ее экспертам, был разработан общий диагностический алгоритм. Алгоритм дифференциальной диагностики:

1. Проводится сбор анамнеза по всем возможным заболеваниям, если продолжительность грудного вскармливания > 4мес. и сумма баллов от эффекта проведенной ранее терапии < 13; сумма баллов жалоб при поступлении < 7; косвенная генетическая отягощенность, то выбирается первая модель для расчета IgE и для последующей дифференциальной диагностики.

2.Если же уровень IgE соответствует возрастной норме (после выполнения вышеизложенных шагов, то наличие атопии маловероятно (исключается аллергическое заболевание).

3.Если же £ > 21 (полученная в результате выполнения 1-го пункта, то выбирается вторая модель: 3-я степень тяжести состояния: бронхиальная астма, бронхиальная астма плюс пищевая аллергия или же пищевая аллергия.

4.После выбора моделей проводят дифференциальную диагностику по уровню IgE.

5.На последнем этапе - постановка патогенетического диагноза.

В четвертой главе приводятся результаты сравнительного анализа.Сравнительный анализ работы двух систем был проведен с помощь точного метода преобразования Фишера. Сравнительный анализ работы решающих правил - с помощью двустороннего критерия Колмогорова-Смирнова. Для первой модели: I?- 1..09; р= 0.26. Для второй модели: X2 = 0.96; р= 0.38

Таблица ЖгЗ Результаты сравнительного анализа работы двух систем

КЛАССЫ 1 2 3 4 5

КОЛИЧЕСТВО 54 60 65 56 65

НАБЛЮДЕНИЙ

КОЛИЧЕСТВО 2- 3.6% 3-4.6% 2-3.3% 2-3.6% 2-3.1%

ОПАСНЫХ ОШИБОК 6-11% 8-13% 9-14% 8-14% 8-12%

КОЛИЧЕСТВО 3-5.5% 3-4.4% 3-5.1% 3-5.4% 2-4.6%

ПЕРЕСТРАХОВОЧНЫХ 8-15% 10-15% 9-14% 8-14% 8-12%

ОШИБОК

ОТКАЗЫ ОТ ОТВЕТА - - - - -

Таблица 4.

Сравнительный анализ результатов работы двух систем

КЛАССЫ ОПАСНЫЕ ОШИБКИ СТРАХОВОЧНЫЕ ОШИБКИ ЗНАЧИМОСТЬ РАЗЛИЧИЙ

3.7% - 11% 5.5% - 15% ЗНАЧИМО

1 р< 0.03 р <0.05

2 4.6%-13.3% 4.4%-15.3% ЗНАЧИМО

р < 0.05 р<0.002

3 3.3%-13.8% 5.1%-13.8% ЗНАЧИМО

р< 0.04 р<0.004

4 5.4%-14.2% 3.6%-14.2% ЗНАЧИМО

р<0.04 р<0.05

5 4.б%-12.3% 3.1%-12.3% ЗНАЧИМО

р<0.05 р<0.02

В заключении диссертации сформулированы основные результаты и выводы заключающиеся в следующем:

1. Разработан и исследован алгоритм системы интеллектуальной поддержки при ранней диагностике и контроле за лечением аллергических заболеваний в педиатрии.

2. Впервые проведен многофакторный статистический анализ крупного информационного массива, содержащего все основные данные об иследовании пациентов с аллергическими заболеваниями (анамнестический, клинический, лабораторный и инструментальный блоки).

3. Определен необходимый и достаточный набор информативных признаков для ранней диагностики и контроля за лечением A3 в педиатрии.

4. В результате проведенного статистического анализа, разра-ботаны критерии для оценки тяжести состояния пациента.

5. Приведены, в результате проведенного многофакторного и пошагового многофакторного регрессионного анализ, решающие правила для расчета уровня управляемой переменной - IgE.

6. Определены классы заболеваний, соответствующие тому или иному тяжести состояния при колебаниях уровня IgE.

7. Разработаны требования к СИП диагностики и контроля за лечением A3 в педиатрии.

8. Проведен сравнительный анализ работы разработанной системы, с экспертной системой, построенной на логическом решающем правиле. Анализ выявил преимущество данного подхода. Опубликованные работы по теме диссертации:

1. Нишева Е.С., Арупонян И.В. и др. Изучение спонтанной ли-берации биологически активных веществ из лейкоцитов перифе-

рической крови у детей с аллергическими заболеваниями // Вопросы охраны материнства и детства, Ме4 С.20-23, 1991.

2. Гуткин В.И., Арутюнян И.В., Кибальченко А.Г. Система интеллектуальной поддержки диагностики аллергических заболеваний в педиатрии // Тезисы доклада на научно-технической конференции "Диагностика, информатика, метрология - 94", Санкт-Петербург, электротехнический университет, стр.315, 1994.

3. Гуткин В.И., Арутюнян И.В. Экспертная система диагностики и контроля аллергических заболеваний в педиатрии И Тезисы докл. научно-технической конференции "Диагностика, информатика, метрология-1994", стр. 316, Санкт-Петербург, электротехнический университет, 1994.

4. Нишева Е.С,, Кириллов М.А., Арутюнян И.В. Факторы риска бронхиальной астмы у детей II Тезисы докл. научно-технической конференции "Диагностика, информатика, метрология-94", сгр.Збб, электротехнический университет. Санкт-Петербург, 1994.

5. Арутюнян И.В. Проблемы создания экспертных систем в педиатрии. /15 национальный конгресс пульмонологов. Тезисы доклада. М., доклад №788, 1995.

6. Арутюнян И.В., Нишева Е.С. Система интеллектуальной поддержки диагностики и контроля за лечением аллергических заболеваний в педиатрии.//5 национальный конгресс пульмоно-логов.Тезисы доклада.-М., доклад №7,1995.

7.Гуткин В.И., Арутюнян И.В., Кибальченко А.Г. Система интеллектуальной поддержки диагностики аллергических заболеваний у деггей. Тезисы доклада // Научно-техническая конференция "Проблемы физической и биомедицинской электроники". Киев, 18-20 мая, 1995.