автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Структурные модели принятия решений в клинической медицине
Автореферат диссертации по теме "Структурные модели принятия решений в клинической медицине"
Российская Академия Наук Институт проблем передачи информации
р Г 0 ~ На правах рукописи
2 и сен ;з:)5
СТЕНИНА Ирина Ивановна
СТРУКТУРНЫЕ МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ В КЛИНИЧЕСКОЙ МЕДИЦИНЕ
05.13.17 - Теоретические основы информатики
Автореферат диссертации на соискание ученой степени кандидата технических наук
Москва 1995 г.
Работа выполнена в Институте проблей передачи информации Российской Академии Наук.
Научнее руководители:
доктор технических наук В.В.Зяблов кандидат технических наук В.С.Переверэев-Орлов
Официальные оппоненты:
член-корреспондент РАН О.И.Ларичев кандидат технических наук М.Н.Вайнцвацг
Ведущая организация: Вычислительный центр РАН
Защита диссертации состоится " " _ 1995 г.в_
на заседании Диссертационного совета Д.003.29.01 при Институте проблем передачи информации РАН по адресу 101447, Москва, ГСП-4, Б.Каретный пер. 19.
С диссертацией можно ознакомиться в библиотеке Института проблем передачи информации РАН.
Автореферат разослан " " _ 1995 г.
Ученый секретарь Диссертационного совета доктор технических наук
С.Н.Степанов
- 1 -
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Одной из активно развивающихся областей ин-юрматики является разработка систем поддержки реиений в слабофор-[ализованных областях, типичным примером которой является медици-1а. Исследойание и формализация выбора оптимальной тактики при [едостаточной информации сохраняет своп актуальность в медицине в :вязи с необходимостью интеграции разнородных данных при появлении ;овых методов обследования и лечения, решением исследовательских адач и повышением эффективности передачи опыта.
Современные подходы к моделированию характеризуются тенденцией объединению возможностей двух технологий: использования методов нализа эмпирических данных, позволяющих обосновать и повысить ка-ество принимаемых решений, и методов организации медицинской ин-ормации на основе экспертных знаний, позволяющих опираться на пыт эксперта и строить модель в естественном для врача языке, азработка моделей интегрированного типа ведется в основном в на-равлении развития идей машинного обучения. Один из предложенных одходов (К.В1ит,1982) заключается в построении концептуальной мо-ели с помощью технологий экспертных систем и пополнении ее факта-и, найденными в процессе поиска статистических закономерностей в азе данных. При. этом возможности анализа базы прецедентов .для азработки общей структуры модели практически не используются, ругой подход связан с использованием моделей индуктивного вывода, спешность которого в значительной мере зависит от объема и ка-ества обучающей выборки. Для большинства же областей клинической едицины характерна зашумленность данных при малом объеме выборок, роме того, модель принятия решения в целом при этом остается крытой от эксперта и пользователя, а опыт применения методов ана-иза данных в медицине показывает, -что слабая интерпретируемость одели служит препятствием для ее широкого практического нспользо-ания. Еще одним подходок к объединению данных и знаний в одной одели является метод структурной организации информации (Гель-анд,1984), направленный на выявление когнитивной структуры описа-ия объектов в процессе анализа прецедентов принятия-решений и эстроение на ее основе логической схемы решения с помощью анализа
ч
грифицированных данных. Метод позволяет работать с небольшими вы-зрками при условии четкой формализации понятий, необходимой для
получения устойчивых и воспроизводимых результатов. Однако его
к
применение для построения целостной модели проблемной области, включающей уже известные схемы решений, приводит к определенному рассогласовании с присущими человеку способами оценки ситуаций и гипотез, надежность которых обеспечивается в большей мере избыточность» информации, чем четкость» данных.
В представляемой работе предлагаются несколько- технологий разработки моделей, направленных на поддержку принятия решения при выборе оптимальной тактики и естественно вписывающихся в практическую деятельность врача. Технологии используют идеи голосующих решателей и структурной организации информации и развивают их для построения "нежесткой" эвристической классификации. Рассматриваются модели для разных типов клинических задач и в различной мере опирающиеся на экспертные знания и результаты исследования данных.
Цель работы - развитие методов разработки структурных моделей принятия решений в слабоформализованных областях типа медицинских, основанных на интеграции экспертных знаний и результатов анализа данных.
Для достижения поставленной цели.решались следующие задачи:
- исследование свойств данных и знаний в различных областях клинической медицины,
- выбор принципов и форм организации медицинской информации, позволяющих строить целостную, полную и естественно интерпретируемую модель принятия решения,
- разработка метода решения задачи прогнозирования, основанного на классификации типов течения заболевания,
- исследование возможностей привлечения экспертных знаний в процесс построения решающих правил при решении задачи классификации,
- формализация технологии представления структурной модели принятия решения в виде иерархической пороговой сети при создании базы знаний,
- создание моделей принятия решений и реализация их в виде консультирующих систем для нескольких областей клинической медицины.
\
Методы исследования. В работе используются методы инженерии знаний, математической статистики, методы проведения сравнительных
клинических исследований.
Научная новизна работы состоит в следующей:
- Разработай- метод решения задачи прогноза заболевания, основанный на моделировании когнитивной структуры экспертной тактики с помощью экспертной кластеризации базы прецедентов и пополнении модели статистически обоснованными вариантами решения.
- Формализована технология построения синдромоподобных решающих правил для задач классификации в слабоформализованных областях.
- Разработаны этапы создания концептуальной модели" проблемной области, . основанной на интеграции экспертных знаний и результатов анализа данных.
- Разработана технология создания базы знаний консультирующей системы с помощью выявления и представления знаний в виде иерархической пороговой сети. Предложена модель активного диалога с пользователем.
- В процессе анализа данных получены новые, имеющие научную и практическую важность, результаты в ряде медицинских областей. Предложены алгоритны принятия решений, составившие основу баз знаний соответствующих консультирующих систем.
Положения, выносимые на защиту.
1. Метод решения задачи прогнозирования с помощью экспертного
и статистического анализа нечетких данных динамического наблюдения.
2. Метод построения системы интерпретируемых реиающих правил для задач классификации в слабоструктурированных областях.
3. Технология выявления и представления знаний с помощью направленной пороговой сети.
4. Модель активного диалога с пользователем.
Практическая ценность. Работа ^является частью выполняемого в ИППИ РАН комплекса исследований по разработке средств анализа данных и создания консультирующих систем для слабоформализованных областей. Разработанные нетоды позволяют формализовать ряд этапов совместной работы инженеров по знаниям и экспертов в процессе конструирования модели принятия решений и повысить качество анализа медицинских данных. Использование предложенных методов позволи-
ло совместно с врачами провести комплекс научных исследований и решить ряд практически важных клинических задач.
Реализация и внедрение результатов. На основе полученных ре-
1 V
зулЬтатов в области нефрологии, относящихся к прогнозированию сроков развития хронической почечной недостаточности и планированию потребности в гемодиализе и пересадке почки для больных с хроническим гломерулонефритом, созданы и распространены методические рекомендации Министерства здравоохранения РФ. Разработан и используется в отделении эндокринологии Московской медицинской академии алгоритм обследования больных с синдромом галактореи для раннего выявления аденом гипофиза. Созданы и проверены в клинике консультирующие системы:
- Диагностика нефрологических заболеваний. Лечение и прогноз течения хронического гломерулонефрита. (Отделение нефрологии НИИ пересадки тканей и трансплантации органов).
- Диагностика рахитоподобных заболеваний у детей. (НИИ педиатрии и детской хирургии. Омская областная детская больница).
- Первичная дифференциальная диагностика туберкулеза и рака легкого (Кафедра пульмонологии Московской медицинской академии).
Практическая -значимость-работы подтверждена актами'о внедрении.
Публикации и апробация работы. По теме диссертационной работы опубликовано 30 печатных работ. Результаты исследований в медицинских областях докладывались и обсуждались на 7 Всесоюзных и международных конференциях. Методы, выносимые на защиту, и результаты их применения докладывались на Всесоюзном научно-практическом семинаре "Интеллектуальное программное обеспечение ЭВМ"(Ростов-на-Дону, 1990), Всесоюзной конференции "Проблемы разработки и внедрения экспертных систем (Москва, 1989), научно-практическом семинаре по когнитивной психологии (Переяславль-Залесский, 1990) и обсуждались на научных семинарах Межфакультетской лаборатории им. А.Н.Бе-лозерсхого МГУ и лаборатории информационных технологий анализа и защиты данных ИППИ РАН.
Структура диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений.
- 5 -
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во ВВЕДЕНИИ обоснована актуальность работы, поставлены цели и задачи исследования, кратко охарактеризованы методы объединения экспертной информации и результатов анализа выборочных данных при построении логической модели решения, рассматриваемые в диссертации и выносимые на защиту.
В ПЕРВОЙ ГЛАВЕ исследуются условия, в которых должно осуществляться принятие врачебных решений, рассматриваются свойства медицинских данных и знаний. Обсуждаются существующие подходы к моделированию принятия решений, обосновывается выбор формы модели и принципов ее построения.
В работе приводится обзор литературных данных, характеризующих различные стороны процесса - формирования врачебного заключения, рассматриваются особенности построения медицинских классификационных схем. Отмечается актуальность учета при разработке нодели ряда общих свойств познавательной деятельности человека, таких как множественность форм репрезентации знания, возможность абстрагирования обобщений без достаточного осознания со стороны субъекта, необходимость избыточного числа степеней свободы умственного образа по отношению к оригиналу для однозначности его восприятия. Рассматриваются причины, по которым врачи отдают предпочтение "мягкой" форме модели типа сбора аргументов в пользу той или иной гипотезы, сравнения с эталонами или поиска аналогов. Поскольку контекст, в котором клиницист анализирует проблемную ситуацию, всегда оказывается очень широким и'включает практически все основные сведения о патофизиологии человека, модель всегда будет ограниченной и может быть предоставлена врачу только в качестве вспомогательного средства анализа. В данной работе рассматриваются модели, направленные на поддержку решения с помощью предоставления заключения о проблемной ситуации. Заключение содержит возможно полный зписок интегральных факторов, влияющих на выбор решения и относя-цихс!я к некоторой подобласти медицины, оставляя врачу принятие ре-пения в более полном контексте.
Разработка моделей интегрированного типа, опирающаяся на экс-тертные знания и результаты анализа эмпирических данных, не только гпособствует передачеч опыта эксперта, но и позволяет расширить его
^представления с помощью исследования сложных для принятия решений ситуаций. Конструирование модели в естественном для врача языке, во-первых, облегчает ее понимание, вписывание в систему профессиональных знаний и практическое применение, во-вторых, позволяет осуществлять, смысловой контроль, всех этапов формирования модели. Поэтому в данной работе ставилась задача создания модели как легко интерпретируемой и обоснованной логической схемы принятия врачебных решений. Схема строится с учетом структуры отношений в системе понятий, используемых экспертами, отражает структуру решаемых подзадач, поэтому она может быть названа структурной моделью. Анализ данных' в процессе создания модели используется для выявления ее структурных элементов, пополнения и тестирования.
Модель принятия решений должна приникать, правильно интерпретировать и преобразовывать данные, характеризующиеся зашумленностью, неустойчивостью и неполнотой. Выборки в медицинских областях имеют принципиально малый объем, иначе они неоднородны и несопоставимы. Поэтому выявить тонкости структуры данных без привлечения экспертных знаний невозможно и применение статистических методов может иметь только вспомогательный характер.
Для выбора формы представления экспертных знаний и решающих правил в работе анализируется принятое в недицине синдрсмное описание картины заболевания, которое может рассматриваться как система обобщений с единицей анализа - симптомокомплексом. Синдром отмечается у больного, если наблюдается некоторая существенная часть из входящих в него симптомов. При этом предполагается согласованность динамики их проявлений. В качестве модели синдрокного описания нохет быть использована иерархическая сеть с нестрогими конъюнкциями в узлах. Такая форма достаточно естественно отражает структуру высказывания эксперта и хорошо согласуется с рядом ведущих когнитивных свойств понятийных структур: обобщением свойств объектов'некоторого класса по их специфическим признакам, целенаправленностью, разнотипностью отношений концептов, отсутствие» логической жесткости, "размытостью" обобщений. Методики выявления синдромоподобных логических конструкций способствуют вербализации личностного звания, поэтому построенные синдромы активно используются врачами в дальнейшем при обучении, объяснении своих решений.
ВО ВТОРОЙ ГЛАВЕ рассматривается способ создания структурной модели принятия решений для задачи классификации. Способ заключается в формировании системы решающих правил в процессе интерактивного анализа данных при непосредственном участии эксперта. Методика распространяет на нечеткие данные применение идей построения систем голосующих решателей, предложенных в 60-х^годах для задач распознавания М.Н.Вайнцвайгом и Н.Н.Бонгардон. Одноуровневые пороговые решатели, построенные совместно с экспертом в процессе анализа данных, предложены для решения медицинских задач И.П. Лукашевич и B.C. Переверэевым-Орловым.
Задачами данной работы являлись:
- проверка возможности использования сети нестрогих конъюнкций как формы выдвижения и проверки на данных нечетких экспертных гипотез и как формы поиска закономерностей при анализе данных, позволяющей строить эффективные модели классификации в различных медицинских областях;
- формализация технологии построения многоуровневой пороговой сети в процессе интерактивного анализа данных;
- выявление компонентов знаний эксперта о структуре задачи, учет которых повышает качество модели.
Для областей с большим числом исходных признаков использовались три версии программы интерактивного анализа данных, созданные В.Е.Левитом, В.Г.Труновым и Н.Д.Гуровым.
Данные для задачи представлены значениями исходных признаков зписания объектов и значением классифицирующего признака. Решающие лравила строятся з виде нестрогих конъюнкций, образованных из ис-содных признаков, которые интерпретируются как синдромы. Всякий зиндром может быть использован в качестве входного элемента в других синдромах, поэтому их совокупность образует сеть. Признак вхо-1ит в синдром с некоторым диапазоном^своих значений, способ переш-:алирования его в бинарный признак (симптом) определяется •кспертон и исследуется на данных. Синдром считается выполненным |ля некоторого объекта, если число входящих в узел симптомов попа-[ает в определенный диапазон пороговых значений. Порог может опре-еляться экспертом или настраивается по данным. Классификационное ешекие принимается голосованием по наборам правил за каждый из лассов или с помощью., построения дерева решений.
Определяющим для построения синдрома является выбор однородных наборов признаков, образующих смысловую целостность с точки зрения эксперта и сходных по характеру взаимосвязи с классифицирующим признаком. В синдром включаются признаки, которые важны по смыслу, даже если они редки в рассматриваемое подклассе, или часто встречающиеся в подклассе и редкие в альтернативных подмножествах. Критерием качества синдрома, помимо чувствительности и специфичности, является устойчивость к исключению отдельных признаков и монотонность зависимости числа описываемых объектов от значения порога выполнения синдрома. Величина порога при этом имеет второстепенное значение. Для объектов, не описанных построенными синдромами, строятся новые синдромы с помощью временного исключения распознанных объектов. Учет знания о наличии подклассов и описания их подсиндромами значительно улучшает устойчивость результатов.
Инженер по знанияи осуществляет процесс статистического анализа и использует промежуточные результаты для выявления несоответствия гипотез эксперта данным как повод их уточнения. Выдвигаемая экспертом гипотеза вначале обычно имеет вид списка признаков -кандидатов в синдром. В результате обсуждения зависимости выполнения гипотезы от наличия или-отсутствия конкретных признаков, как правило выясняется, что гипотеза имеет более сложную структуру:, часть признаков является обязательной, остальные могут быть ранжированы по степени важности их присутствия в синдроме; поэтому на исходном списке организуется иерархия подсиндромов.
С помощью этой технологии было решено несколько практических задач в различных областях медицины, показавших эффективность поиска решений в виде синдромной сети, форма выдвижения гипотез была сочтена естественной и достаточной для представления сложных диагностических правил врачами разных специальностей: кардиологии, пульмонологии, педиатрии," эндокринологии. Использование предложений и оценок эксперта в большинстве случаев улучшал качество и устойчивость реиающих правил на контрольной выборке.
Пример 1. Дифференциальная диагностика стенокардии и нейроцир-куляторной дистонии для больных с жалобами на бояь в области сердца. В этой задаче, решавшейся с кардиологом С.А.Аббакумовым, от анализа данных ожидалось подтверждение и формализация представлений эксперта об информативности данных анамнеза, так как ранее.
считалось, что различение атипичных форм на ранних этапах диагностического обследования невозможно. Описание больного включало 42 признака и верифицированный диагноз. На основании экспертной оценки наблюдения-были разделены на пять подгрупп по типичности симптоматики, для которых, были сформированы синдромные "портреты". Решающее правило относило наблюдения к классам с помощью голосования синдромов, наблюдения с противоречивым голосованием или•отсутствием сходства с синдромами относились к группе с неопределенным диагнозом.
Частоты выполнения синдромов' Решение: "Стенокардия" "Неопред." "Дистония" обучающая выборка:
стенокардия 79 6
дистония 1 5
экзаменационная выборка:
стенокардия 18 4
дистония 3 2
О 60
1 65
Пример 2. Рентгенологическая диагностика рака и туберкулеза легких для больных, направляемых во фтизиатрическое учреждение с первичным диагнозом туберкулез легких. Работа выполнялась с пульмонологом О.В.Агринским. Использовались 128 характеристик затемнения в легком.
Частоты выполнения синдромов
Всего ИНФТ ТБКЛ ФКАВ дисс пнвм ТУБ
на обучении: 153
туберкулез 93 38 19 28 39 19 60
злокач.опухоль 42 1 1 1 0 1 2
пневпония 14 0 0 • ■ 3 3 11 6
доброкач-опухоль 7 0 . 2^ 0 0 0 0
на экзамене: 141 -
туберкулез 76 33 17 - 29 32 19 54
злокач.опухоль 50 3 5 2 3 2 5
пневмония 7 1 1 2 2 3 3
доброкач.опухоль 8 0 2 0 0 0 0
3 таблице приводятся частоты выполнения "синдромных портретов" , построенных на основе формализации экспертных представлений о виде тени для наиболее часто встречавшихся форм туберкулеза (ИНФТ-инфильтративной, ТБКЛ-туберкуломы, ФКАВ-фиброзно -кавернозной'), пневмонии (ПНВМ)'и их обобщенный синдром (ТУБ); * ■
%
В ТРЕТЬЕЙ ГЛАВЕ предложен метод построения подели выбора тактики С помощью выявления классов наблюдений, однородных с точки зрения вида закономерности, определяющей исход заболевания. Рассматривается технология анализа нечетких динамических данных при неоднородной выборке..
Метод рассмотрен на примере решения задачи прогнозирования исхода заболевания и выбора лечебной тактики при хроническом гломе-рулонефрите. Этапы построения модели заключались в следующем.
I. Уточнение медицинской постановки проблемы, целей анализа данных и области применимости модели.
Хронический гломерулонефрит, одна из ведущих причин летальности в молодом возрасте, в результате прогрессирования приводит к наступлению хронической почечной недостаточности (ХПН), требующей для поддержания жизни пациента заместительной терапии (гемодиализа и пересадки почки).. Разброс сроков наступления, ХПН значителен. - .от нескольких месяцев до десятков лет. Прогноз темпа прогрессирования определяет выбор лечебной тактики, но обоснования выбора являются спорными, поскольку в современной нефрологии проблема прогнозирования исхода практически не изучена. Значение клинического образа болезни комплексно не исследовалось в виду его разнообразия и непостоянства, в то же время врачам по опыту хорошо известен прогноз для некоторых вариантов течения.
Цель анализа данных была определена как исследование исхода заболевания при различных вариантах течения и различных лечебных тактиках. Определение контингента больных, для которых строится модель и которые включаются в исследование, включало способ верификации диагноза и исхода, а также требование отсутствия интеркур-рентных заболеваний. В исследование было включено 255 наблюдений с достаточно прослеженным течением заболевания.
II. Предварительная структуризация области. Выявление ключевых компонентов оценки состояния.
На этом этапе при интервьюировании экспертов, использовании литературы и анализе примеров были выявлены ключевые компоненты развернутого заключения о состоянии больного (ведущий синдром, характер динамики его проявлений, острота, тяжесть, стадия заболевания и др.)- Анализ примеров показал, что тяжесть состояния больного-определяется для различных вариантов течения заболевания по наборам малопересекающихся признаков, при этом характер влияния признаков на исход может быть противоположным. Кроме того, распределение сроков наступления исходов на всей выборке оказалось полимодальным. Это дало основания предположить наличие разного типа зависимостей исходных и прогнозируемых показателей для разных типов течения. Исследование факторов, влияющих на исход, в такой ситуации целесообразнее проводить в более однородных подмножествах наблюдений.
III-Составление словаря описания и сбор данных.
Карта признаков исходного описания включала полные данные о динамике клинических проявлений и курсах терапии. Описание было полуформализованным, т.к. имело нерегулярную длину. Каждый случай заболевания был представлен в виде чередования периодов течения (обострение, ремиссия и др.), описанных стандартным способом, при этом число периодов для разных больных оказывалось разным. Кроме того, карта содержала экспертные оценки состояния больного в каждый период заболевания и описание особенностей конкретного случая. В таком виде был собран архив данных для экспериментального исследования.
IV. Уточнение и формализация экспертных заключений. Выявление типов течения.
В соответствии с определениями эксперта компоненты заключения вычислялись для пациентов анализируемой подгруппы и сравнивались с имеющимися в карте заключениями. Анализ несовпадений формальной и экспертной оценок как правило приводил к уточнению структуры обобщений. С помощью сортировки экспертом имеющегося множества наблюдений на основании субъективных оценок сходства клинической картины были ориентировочно очерчены возможные типы течения заболевания. При этом значительная часть больных (около трети) была отнесена к "особым" случаям, т.е. не классифицирована.
V. Анализ исходов для различных типов течения:
Выявленные типы отражали представления врача о тяжести течения заболевания, которая в значительной мере определяет исход. Поэтому обнаружилась сильная, связь с исходом в трех из шести типов: в од-ком неблагоприятный исход в течение 10 лет наблюдения не отмечался независимо от проведенной терапии, в другом - не отмечался на фоне однотипной терапии, в третьем - в подавляющем большинстве случаев . наблюдался в ранние сроки. Для остальных типов с нестабильной симптоматикой и большим разбросом сроков наступления ХПН для оценки прогноза был необходим многофакторный анализ данных .
VI. Построение обобщенных показателей динамики.
Для применения методов анализа данных требуется общее признаковое пространство для всех объектов исследуемой группы. Переход к регулярному описанию возможен путен формирования интегральных признаков. В данной задаче такие признаки в явном виде не содержались ни в медицинских документах, ни в словах эксперта и выявлялись при сравнении экспертом примеров наблюдений с различными картинами течения. С помощью метода репертуарных решеток и анализа кривых динамики ведущих синдромов были сформированы варианты интегральных оценок динамики: число обострений некоторого вида, отношение их суммарной продолжительности к длительности периода наблюдения, продолжительность периодов максимально активного лечения и др. Это позволило создать базу данных с описанием наблюдений .в '"терминах" обобщенных динамических характеристик, провести" анализ их связи с исходом заболевания и формализовать способ определения типов течения.
VII. Построение многофакторного правила прогноза.
Для анализа данных важным моментом является точность постановки задачи, определяющая формирование исходных признаков (например, данные за первый год наблюдения) и вид прогнозируемого показателя (например, наступление ХПН в течение ближайшего года от нонента данного поступления). Реальная же практическая задача прогнозирования может быть только приближена серией нескольких "точных" постановок. С этим важным противоречием приходится считаться во нно-гих областях (например, при прогнозе "живучести" энергетического оборудования). В данном случае исследовались различные варианты постановки задачи, соответствующие прогнозу наступления ХПН в различные сроки от момента выявления заболевания по данным за не-
сколько различных сроков наблюдения, наряду с этим, по настоянию экспертов исследовалось влияние на исход факторов, определяемых по полным данным течения всей болезни вплоть до наступления ХПН (например, учащение рецидивов), что существенно влияет на содержание модели принятия решения.
Для исследования влияния факторов были применены методы анализа кривых выживаемости, регрессионная модель Кокса, лог-линейный анализ и анализ многомерных таблиц сопряженности. Но практически результаты их применения могли быть использованы для подтверждения влияния и взвешивания отдельных неблагоприятных факторов и включения их врачом в собственную "неявную" модель принятия решения. Для построения "явной" модели эксперты предпочли метод формирования балльных решавших правил без взвешивания, поскольку он воспринимался как достаточно естественная имитация сбора аргументов в пользу некоторой гипотезы. В правила включались признаки, влияние которых клинически значимо и статистически достоверно.
Часть выявленных неблагоприятных факторов была использована для пересмотра оснований классификации объектов. Остальные факторы использовались для создания правил прогнозирования в рамках типа течения. Влияние вида терапии как отдельного фактора для большинства типов вычленить оказалось невозможным, т.к. ее назначение оказалось высоко кореллированным с тяжестью состояния пациента и было единообразным при определенном типе течения. Поэтому прогноз определялся при условии назначения принятой терапии.
Анализ наблюдений, ранее неклассифицированных экспертом, показал, что значительная их часть после уточнения оснований классифи-\ кации может быть отнесена к различным классам. Другая часть пациентов вначалё имела благоприятный тип течения, который затем трансформировался в неблагоприятный, имеющий некоторые общие особенности (как стадия склерозирования). Для этой части наблюдений оказалось возможным применить имеющиеся правила прогноза, но для разных периодов течения ,- разные.
Ниже в таблице представлены результаты прогнозирования исхода. Точность прогнозирования без учета ближайшего эффекта терапии составила 88% на обучающей выборке (172 наблюдения) и 34К на экзаменационной (83 наблюдения); с учетом ближайшего эффекта - 94Х на обучающей выборке и 892'на экзаменационной. Почти все ошибки отно-
сились к гипердиагностике неблагоприятного течения (33 из 33, 15 из 18), что предпочтительнее пропусков в диагностике.
Результаты прогнозирования наступления ХПН I______________________________________________________________
Тип течения Прогноз Доля правильных прогнозов
обучение экзамен обучение экзамен Ближайший эффект терапии не учитывается учитывается
неактивный
нефротический
нефрот.-гипертонический активный нефритический постоянный или часто рецидивирующий редко рецидивирующий
вторичный активный
полож.к 5 г. 66/66
к.10 г. 29/29
полож.к 5 г. 34/40
к 10 г. 16/16
ОТриц.К 4-5Г. 10/15
отриц.к 4-6г. 11/19
полож.к 5 г. 24/24
'к 10 г. 23/23 ОТриц К 5-6Г. 7/8
22/22 66/66 22/22
10/10 ' 29/29 10/10
16/19 38/40 16/19
7/7 16/16 7/7
4/10 13/15 7/10
11/15 15/19 12/15
14/14 24/24 14/14
11/11 23/23 11/11
3/3 7/8 3/3
В таблице приведены отношения числа правильных прогнозов к числу наблюдений."
При обсуждении окончательной формы модели эксперты выразили желание ужесточить требования к однородности . типов течения, что позволило более ярко выделить "эталоны" наблюдений, упростить их определения-' При этом возрастает доля "пограничных" наблюдений, но увеличивается свобода и гибкость принятия решения с воаиожностыо применения опытным врачом интуитивного способа оценки близости некоторого наблюдения к "эталону". "Эталонный" вариант модели был представлен в виде методического пособия, полный■вариант - в виде консультирующей системы.
В ЧЕТВЕРТОЙ ГЛАВЕ рассматривается технология разработки концептуальной модели при создании системы поддержки решений. Предложена модель активного диалога с пользователем. Описано несколько
' разработанных систем, различающихся по сложности структуры модели в зависимости от характера знаний о проблемной области. При создании систем использовались программные средства и рпециальные языки программирования диалога и синдронкой базы знаний, разработанные В.С.Переверзевым-Орловым, Е.А.Ващенко и О.А.Кузнецовой, а также программа визуализации и тестирования синдромных деревьев, разработанная совместно с программистом Н.Д.Гуровым.
В качестве основного примера рассматривается консультирующая система по нефрологии. Система создавалась с целью представления результатов решения задачи .прогнозирования, а также множества выявленных в процессе решения аспектов методики анализа информации и принятия решений одной из ведущих медицинских школ. Модель прогноза дополнена моделью диагностики, построенной на основе высказываний эксперта. Цель консультирующей подсистемы была определена как формирование развернутого заключения о характере состояния пациента с выдвижением рекомендаций по дальнейшему обследованию и тактике лечения при подтвержденном диагнозе. Классификация типов течения, схема выбора лечения и прогноз тенпов прогрессирования гломе-рулонефрита формировались на основе результатов, изложенных в предыдущей главе. В целом концептуальная модель для компьютерной системы потребовала значительно более глубокой - алгоритмизации по сравнению с методической схемой, вызванной необходимостью анализа не только типа течения заболевания в целом, но и типа ситуации, актуальной в данный момент, учетом возможной неполноты входной информации, разработкой сценария диалога для сбора данных о пациенте.
Методика составления словаря описания заключалась в интервьюировании эксперта о достаточно полном списке симптомов, обычно вносящихся в историю заболевания пациента, составлении диалоговой программы сбора информации и автоматического формирования текстового описания ситуации. Текст предъявлялся эксперту для оценки" достаточности его для определения развернутого заключения.
Диагностический модуль базы представляет собой множество независимых деревьев решений с общим набором исходных признаков и общим заключением. Модель формирования заключения о диагнозе строилась как иерархическая сеть связей симптомокомплексов■и диагнозов.
Каждый симптомохомплекс имеет имя, список аргументов (входящих в него симптомов и других симптомокомплексов), значение (число выполненных симптомов) и диапазон значений, при которых он считается выполненным. Число уровней в сети зависит от степени детализации исходных признаков в вопроснике, которая определяется общими целями системы. Диагностическая сеть содержит около 70 деревьев. Типичный диагностический синдром имеет 4-6 уровней, 20-40 узлов, около десяти симптомов в узле. Пороговые правила позволяет компактно описать большое число возможных состояний (например, уаел из 6 синптомов с порогом выполнения 4 соответствует 22 возможным состояниям).
Диагностическое дерево строилось с помощью разбиения списка значимых для некоторого диагноза симптомов на подсписки, однородные по силе и характеру связи с диагнозом, на,которых затем строилось несколько уровней обобщений. Сначала общий список разбивался на подсписки в соответствии с экспертной оценкой типа связи симптома с диагнозом (обязательный, патогномоничный, высокоспецифичный, слабоспецифичный, отвергающий). Для проверки однородности подсписка и выбора порога его выполнения эксперту предлагалась серия вопросов о возможности выдвижения диагностической гипотезы на основании какого-либо одного признака, затем каких-либо двух и т.д. Вопрос предлагался в виде примера с достаточно полным " контекстом анализа. Кроме того, для каждого дерева формировался набор примеров с околопороговыми значениями входящих в него узлов для некоторых выбранных подмножеств симптомов в каждом узле (однородность списков в узле к этому моменту считалась ' уже оттестированной). Примеры предъявлялись эксперту на карточках в случайной порядке для целой группы диагнозов. Порог выполнения узла дерева не является критическим, если симптонокомплексы строятся не в минимизиро-. ванном, а избыточном пространстве признаков. Одному и тому же синптомокомплексу с разными порогами могут также соответствовать несколько подсетей-гипотез, различающихся степенью уверенности в выдвигаемом диагнозе.
Для выявления синтаксических и смысловых ошибок с экспертом анализировалась также графические схемы деревьев решений, выделенные из сети и соответствующие отдельным формам заболевания и/или некоторой степени уверенности в выдвигаемой гипотезе. Каждый по-
дуль, соответствующий определенному диагнозу, тестировался также как автономная компьютерная система.
Модель выбора лечения отличается от диагностической значительно большей связанностью сети, вызванной более сложной структурой подзадач. Онаг включает чередование нескольких уровней обобщения • (сужения сети) и уровней порождения комбинаций на основе этих обобщений (расширения сети). Для проверки качества модели использовался метод быстрого прототипирования отдельной подзадачи и тестирование его на полном наборе комбинаций параметров, входных для данной подзадачи (их число, как правило, не превышало 4->7). В подсистеме выбора тактики таких прототипов было около двадцати, общее число узлов - около тысячи. Затем- осуществлялся сбор подзадач-модулей в общую систему, согласование их входных и выходных параметров и тестирование на примерах в предположении об отсутствии существенных " для задачи признаков описания с неизвестными значениями. После этого модель пополнялась ситуациями с возможным отсутствием их значений и тестировалась повторно. Проведена проверка системы в условиях заполнения данных другими врачами клиники, где осуществлялась разработка. В настоящее время проводится проверка в условиях другой клиники.
' Так как исходное описание в значительной мере является субъективным и неустойчивым, игнорирование мнения пользователя о принимаемых системой промежуточных решениях может приводить к неправильной интерпретации данных. Для того, чтобы предоставить врачу возможность контроля формирования решёний, в системе предлагается режим активного диалога (программное обеспечение разработано Е.А.Ващенко). При этом интерфейс имеет окно сбора исходной информации об объекте, окно, где накапливается описание ситуации в терминах промежуточных заключений и окно выбора возможных альтернатив. Это позволяет по шагам следить за- ходом формирования заключений. Пользователь может подтвердить Оценку системы, изменить, ее, остановить процесс вывода и запросить объяснения, вернуться назад к любому вопросу и уточнить значения признаков, поскольку становится ясен, контекст их использования.
- 18 -
Заключение. Основные результаты диссертационной работы:
- Предложены нетоды создания модели принятия клинических решений, объединяющей экспертные знания и результаты анализа данных, удобные для непосредственного использования в клинике.
- Разработан метод решения задачи медицинского прогнозирования, основанный на выявлении однородных подгрупп наблюдений.
- Формализована методика построения решающих правил в виде иерархической системы нестрогих конъюнкций для задач классификации с нечеткими данными.
- Разработана технология представления знаний.с помощью пороговой сети и модель активного диалога с пользователем.
J - Предложенные методы анализа клинических данных применены к решению исследовательских задач в различных областях медицины и позволили получить имеющие научную и практическую важность результаты.
- Созданы модели принятия решений для нескольких медицинских областей. На их основе сформированы базы знаний соответствующих консультирующих систем.
Список основных работ, опубликованных по теме диссертации:
1.H.A.Бродский, BVА.Варшавский', И.М.Гельфанд, 'М.Я.Ратнер, Б.И.Ро-зенфельд, В.В.Серов, И.И.Стенина. Определение морфологической картины гломерулонефрита по клинихо-фунхциональнын данным с помощью формальной схемы, моделирующей мышление клинициста. Препринт, М.,Науч.совет "Кибернетика" АН СССР, 1982, 30с.
2.Стенина И.И. База знаний, сконструированная из базы данных. Тез. докл. Всесоюзн.конф."Проблемы разработки и внедрения экспертных систем. М., 1989, стр. 93-94.
3.М.Ratner, V.V.Serov, V.Warschawsky,, M.2ubkin, I.I.Stenina, B.P.Smollich, H.Klinkman. Klinische und morphologische Faktoren гиг Einschätzung der Progressionstendenz der chronischen Glomerulonephritis. Z.Urol.Nephrol., 1990, 83, H.10, S.559-565.
4.Melnichenko G.A.,Dedov I.I.,Levin .3.1.,Citel E.P., Stenina I.I, Management of various forms of giperprolactinemic hypogonadism in women. In: Wissenschaftliche beitrage der Fridrich-Schiller
- 19 -
Universität, Dena, 1989, pp.219-220.
5.И.И.Стенина. Экспертные знания и статистические данные в медицинских консультирующих системах. Тез.докл.Всесоюзного научно-практического семинара "Интеллектуальное программное обеспечение ЭВМ", Ростов-на-Дону, 1990, стр.85. ' •• • •
6.М.Я.Ратнер, В.В.Серов, В.А.Варшавский, Л.С.Бирюкова, И.И.Стенина. Катамнестическая оценка эффективности комплексной патогенетической терапии больных с различными клинико-морфологическими вариантами хронического гломерулонефрита. Терапевтический архив, 1990, N 6, стр.14-18.
7-М.Я.Ратнер, М.Л.Зубкин, Э.М.Балакирев, И.И.Стенина. Прогнозирование сроков потребности в активных методах лечения при хронической почечной.недостаточности. Методические рекомендации. МЗ СССР, М., 1991, 12 стр.
8.М.Уа.Ratner, V.V.Serov, V.A.Warschawsky, I.I.Stenina, I.M.Slut-skii. A Prediction of Accelerated Progression of Chronic Glomerulonephritis. Soviet Archives of Internal Medicine, 1992, Vol.64, No.2, pp.242-245.
9-V.S.Pereverzev-Orlov, I.I.Stenina, V.G.Trunov. Syndrome Analysis of Data. Pattern Ree.and Image Anal.,1993, V.3, Mo.4, pp.500-505.
Л
Подписано к печати _1995 года.
Отпечатано на ротапринте в Формат бумага 30x42/4
Производственном комбинате . Объем Д пл..
Литературного фонда Зак. • •
уд. Усиевича, д. 8-а Теп. 152:17-7] ~~
-
Похожие работы
- Разработка базовых систем информационной поддержки лечебно-диагностических процессов
- Разработка моделей и алгоритмов диагностики и выбора тактики лечения вертебрально-базилярной недостаточности на основе многовариантного подхода
- Интеллектуализация управления процессом лечения аутоиммунного тиреоидита на основе многомерного статистического анализа и нейросетевого моделирования
- Анализ и оптимизация офтальмологической помощи в регионе на основе информационного мониторинга и эффективного распределения ресурсов клинического центра
- Алгоритмизация управления гемодинамическими характеристиками у больных инфарктом миокарда на основе математической модели кровообращения
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность