автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Методы решения задачи медицинской диагностики на основе математической модели предметной области

кандидата технических наук
Москаленко, Филипп Михайлович
город
Владивосток
год
2010
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Методы решения задачи медицинской диагностики на основе математической модели предметной области»

Автореферат диссертации по теме "Методы решения задачи медицинской диагностики на основе математической модели предметной области"

На правах рукописи

Москаленко Филипп Михайлович

МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ МЕДИЦИНСКОЙ ДИАГНОСТИКИ НА ОСНОВЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ПРЕДМЕТНОЙ ОБЛАСТИ

05.13.18 - математическое моделирование, численные методы и комплексы программ

Автореферат

диссертации на соискание ученой степени кандидата технических наук

! л по ¿л]

Владивосток 2010

4843269

Работа выполнена в лаборатории интеллектуальных систем Института автоматики и процессов управления ДВО РАН

Научный руководитель: доктор физико-математических наук,

профессор Клещёв Александр Сергеевич

Научный консультант: доктор медицинских наук

Черняховская Мери Юзефовна

Официальные оппоненты: доктор технических наук, профессор

Девятисильный Александр Сергеевич

Ведущая организация: Институт математики им. С.Л. Соболева

Сибирского отделения РАН, г. Новосибирск

Защита состоится «11» февраля 2011 года в 10 часов на заседании диссертационного совета Д.005.007.01 в Институте автоматики и процессов управления ДВО РАН по адресу: 690041, г. Владивосток, ул. Радио, 5.

С диссертацией можно ознакомиться в библиотеке Института автоматики и процессов управления ДВО РАН.

Автореферат разослан «28» декабря 2010 г.

Учёный секретарь

диссертационного совета Д.005.007.01

доктор технических наук, профессор Кулешов Евгений Львович

к.т.н.

Лебедев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Системы медицинском диагностики являются одним из приложений методов искусственного интеллекта. Их разработка имеет целью помочь врачу избежать собственных ошибок. Задачей таких систем является определение заболевания, которым болен пациент, на основе данных о его наблюдениях и построение объяснения принятого решения.

Значительный вклад в разработку систем медицинской диагностики для ЭВМ внесли отечественные к зарубежные ученые: H.H. Амосов, И.П. Быховскии, A.A. Вишневский, И.М. Гельфанд, Е.В. Гублер, A.C. Клещев, Б.А. Кобринский, Г.А. Хай, M.IO. Черняховская, В. Chandrasekaran, С.A. Kulikowski, R.S. Ledley, L.B. Lusted, F. Mizoguchi., S.G. Pauker, E.H. Shortliffe, P. Szolovits и другие.

Были разработаны модели медицинской диагностики, описывающие знания в форме правил, фреймов, патофизиологических моделей, а также модели онтологии медицинской диагностики; предложены методы решения задачи диагностики, которые либо моделируют рассуждения врача, либо обрабатывают заданные экспертами правила, либо проверяют соответствие состояния больного и клинических картин заболеваний, описанных врачом; разработаны методы оптимизации алгоритмов диагностики, состоящие в использовании извлекаемой из баз знаний дополнительной информации или в использовании специальных сред разработки и техник программирования; некоторые системы медицинской диагностики созданы на базе сетевых технологий и предоставляют доступ к системе через сеть Интернет; наиболее широко в практической медицине применяются узконаправленные системы, способные проводить диагностику одного или небольшого числа заболеваний в какой-то области.

Однако модели знаний, лежащие в основе современных экспертных систем медицинской диагностики, все еще заметно проще реальных представлений врачей, большинство таких систем имеет локальную реализацию, а время работы многих систем всё ещё чрезмерно велико.

Таким образом, актуальной задачей является разработка методов решения задачи медицинской диагностики, основанных на математической модели онтологии, приближенной к реальным представлениям в области медицины, в терминах которой знания представлены в форме, понятной врачам, и которые позволяют определять не только диагноз пациента, но и причину каждого заболевания, а также объяснять изменение во времени наблюдаемых значений признаков с учетом индивидуальных особенностей пациента и происшедших с ним событий. При этом система, основанная на таких методах, должна быть способна ставить диагноз в приемлемое для врача время и предоставлять удаленный доступ многим пользователям-врачам.

Целью диссертационной работы является разработка и исследование математической модели онтологии, методов и комплекса программ для решения задачи медицинской диагностики на многопроцессорной вычислительной системе.

Для достижения этой цели необходимо решить следующие задачи:

1)разработать математическую модель онтологии медицинской диагностики, отвечающую современным представлениям экспертов в этой области;

2)сформулировать задачу медицинской диагностики в терминах этой онтологии, разработать методы её решения и реализующий их алгоритм для многопроцессорной вычислительной системы;

3)разработать концепцию и методы реализации комплекса программ для решения задачи медицинской диагностики с использованием многопроцессорной вычислительной системы в качестве сервера приложений;

4)провести экспериментальное исследование вычислительной сложности реализованного алгоритма решения задачи медицинской диагностики и исследовать практическую применимость разработанного комплекса программ.

Методы исследования. Для решения указанных задач применялись элементы теории множеств, математической логики, теории формальных языков, методы разработки онтологии и построения их моделей, методы системного, объектно-ориентированного, параллельного программирования, методы разработки пользовательских интерфейсов.

Научная новизна работы состоит в следующем:

• впервые разработаны онтология медицинской диагностики и её математическая модель, отличающиеся от известных максимальной приближенностью к реальным представлениям экспертов в области медицинской диагностики в нашей стране;

• впервые разработаны метод и алгоритм решения задачи медицинской диагностики, основанные на математической модели нетривиальной онтологии, а так же доказаны теоремы об остановке и корректности алгоритма;

• впервые сформулирована концепция сетевого ресурса, предназначенного для обеспечения процесса согласованного решения комплекса задач по хранению, управлению и обработке данных и знаний в области медицинской диагностики острых заболеваний, с возможностью удаленного доступа.

Практическая ценность работы состоит в следующем:

• реализован алгоритм медицинской диагностики, способный работать в последовательном и параллельном режимах, основанный на математической модели нетривиальной онтологии и производящий поиск соответствия истории болезни пациента и картин заболеваний, описанных врачами;

• разработан комплекс программ (с применением платформы облачных вычислений Многоцелевой банк знаний) для решения задачи медицинской диагностики, способный проводить диагностику острых заболеваний в любой области медицины в приемлемое время и при этом выдавать понятное врачу объяснение полученного результата.

Реализация результатов работы. Результаты работы использованы в учебном процессе:

• во Владивостокском государственном медицинском университете - материалы второй и пятой глав используются для знакомства студентов с фор-

мальным представлением острых заболеваний глаза и его придаточного аппарата в курсах лекции по офтальмологии, материалы четвертой главы используются для практики в постановке диагнозов в области офтальмологии;

• в Дальневосточном государственном университете - материалы диссерта-ипп используются в учебном процессе при чтении курса лекций по СД «Системы искусственного интеллекта» студентам специальности 010503.65 «Математическое обеспечение и администрирование информационных систем».

Результаты работы использованы в научной работе и исследованиях сотрудников кафедры ПО ЭВМ в Институте математики н компьютерных наук ДВФУ и сотрудников лаборатории интеллектуальных систем ИЛПУ ДВО РАН.

Положения, выносимые на защиту:

• модель онтологии медицинской диагностики, максимально приближенная к реальным представлениям экспертов;

• метод решения частной задачи медицинской диагностики и реализующий его корректный алгоритм;

• доступный через сеть Интернет комплекс программ, позволяющий проводить медицинскую диагностику за приемлемое время, а также редактировать базы знаний, наблюдений и историй болезни.

Обоснованность и достоверность результатов работы обеспечиваются применением теоретических методов разработки интеллектуальных систем и подтверждены результатами экспериментальных исследований.

Апробация работы. Основные научные и практические результаты работы докладывались и обсуждались на следующих международных и российских конференциях и семинарах: втором Международном научно-практическом семинаре «Высокопроизводительные параллельные вычисления на кластерных системах» (Нижний Новгород, 2002), Дальневосточной математической школе-семинаре имени академика Е.В. Золотова (Владивосток. 2002, 2003, 2004, 2006, 2008; Хабаровск, 2005), открытом Дальневосточном конкурсе программных средств студентов, аспирантов и молодых специалистов «Программист» (Владивосток, 2003, 2004, 2006, 2009), II и III международных конференциях «Параллельные вычисления и задачи управления» (Москва, 2004, 2006), XIII международной конференции «Знание-Диалог-Решение» (Болгария, Варна, 2007), научной сессии МИФИ (Москва, 2008). конференции «Системный анализ в медицине» (Благовещенск, 2009), Первой Российско-Тихоокеанской конференции в области компьютерных технологий и приложений (Владивосток, 2010).

Публикация результатов работы. По материалам диссертации опубликованы 32 печатные работы, в том числе: 5 статей в журналах, входящих в Перечень ВАК РФ, 7 статей в других российских и иностранных журналах, 3 препринта, 17 тезисов и трудов конференций.

Структура п объём работы. Диссертационная работа состоит из введения, пяти глав, заключения, списка литературы из 128 наименований, и трёх приложений. Основная часть работы изложена на 139 страницах, содержит 5 таблиц и 12 рисунков.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность выполненных в диссертации исследований, формулируется цель работы, рассматривается научная и практическая значимость результатов, приводятся сведения об апробации и реализации основных положений диссертации.

Первая глава представляет собой обзор литературы, в котором рассматриваются существующие системы медицинской диагностики, основанные на знаниях, и их составляющие. При этом особое внимание уделяется таким характеристикам систем, как: использование моделей знаний, основанных на сложных онтологиях; присутствие элементов оптимизации алгоритма и/или базы знаний; использование многопроцессорных вычислительных систем; возможность расширения базы знаний экспертами.

Во второй главе приводится описание онтологии (и её модели) предметной области «медицинская диагностика», которая учитывает взаимодействие причинно-следственных отношений различных типов. Данная онтология близка к реальным представлениям медицины в нашей стране и описывает сочетанную и осложненную патологии, динамику патологических процессов во времени, а также воздействие лечебных мероприятий и других событий на проявления заболеваний. Математическая модель онтологии медицинской диагностики представляется в виде необогащенной системы логических соотношений с параметрами на языке прикладной логики и включает определения терминов модели знаний (параметры), определения терминов модели действительности (неизвестные), а также ограничения целостности неизвестных и параметров и соотношения между ними. Термины и онтологические соглашения в модели объединены в три раздела: базовые понятия и онтологические соглашения, описание причинно-следственных связей и описание причин значений признаков и заболеваний.

Первая часть модели описывает базовые понятия и онтологические соглашения знаний и действительности предметной области. К базовым терминам знаний относятся: признака, события, особенности, наблюдения, множества значений, условия, необходимое условие, заболевания, периоды динамики, интервал. К базовым терминам действительности относятся: моменты, наблюдавшиеся особенности, выполнено, диагноз, развитие, интервалы развития признака. Также в этой части модели описываются онтологические соглашения, задающие ограничения на значения базовых терминов знаний и действительности. Например, соглашение о том, что названия всех признаков. событий и особенностей различны, выглядит так:

признаки п события = 0 & особенности О события = 0 & & признаки п особенности = 0

Вторая часть модели содержит термины знаний и действительности, описывающие различные причинно-следственные связи, их ограничения целост-

ности, а также онтологические соглашения о соответствии между знаниями и действительностью. Они сгруппированы в семь разделов: общие термины и онтологические соглашения, описание нормальных реакций, описание реакций на воздействие событий, описание клинических проявлений, описание клинических проявлений, измененных воздействием событий, описание этио-логий, описание осложнений. Например, описание нормальных реакций задаётся с помощью пяти предложений на языке прикладной логики:

• Термин знания о нормальных реакциях это множество структурных значений с атрибутами следствие, варианты, воздействующие факторы, каждое их которых описывает знания о конкретной нормальной реакции. Значением первого атрибута является имя признака, второго - множество вариантов нормальной реакции для этого признака, третьего - множество особенностей.

знания о нормальных реакциях = = (следствие признаки, варианты —> {}вс1рианты нормы, воздействующие факторы —> {}особенности)

• Термин знаний варианты нормы это множество структурных значений с атрибутами область значений следствия, условия на воздействующие факторы, каждое из которых описывает знания о конкретном варианте нормальной реакции. Значением первого атрибута является множество значений признака в этом варианте, а второго - условие.

варианты нормы = (область значений следствия —> множества значений, условие на воздействующие факторы —> условия)

• В знаниях о нормальных реакциях в любом варианте нормы область значений следствия - это собственное подмножество возможных значений признака, являющегося следствием згой нормальной реакции.

(знания о нормальной реакции: знания о нормальных реакциях) (вариант: вариаиты(т.\\й\ш\ о нормальной реакции)) область значений с:1едстаия(аариа.т) с с возможные значения{сле<)ствие(зиа.тя о нормальной реакции))

• Термин действительности нормальные реакции это множество структурных значений с атрибутами следствие и вариант, каждое из которых описывает нормальную реакцию, происходящую в ситуации. Значением первого атрибута является имя признака, а второго - вариант нормы.

нормальные реакции = (следствие —» признаки,

вариант —» варианты кормы)

• Если в ситуации присутствует некоторая нормальная реакция, то в множестве знания о нормальных реакциях присутствует такой элемент, у которого следствие совпадает со следствием нормальной реакции, в множестве вариантов нормы этого элемента содержится вариант нормы из нормальной реакции и для него выполнено условие на воздействующие факторы.

(нормальная реакция: нормальныереакгщи) (у (знания о нормальной реакции: знания о нормальных реакциях) следствие{гтмш о нормальной реакции) = = с:/едствие(нормальная реакция) & & й£7/шй7/т(нормальная реакция) е

е варианты^знания о нормальной реакции) & & выпо.теио(условие на воздействующие

факторы(вариант(нормальная реакция))))

В третьей части модели онтологии определяются термины, описывающие причины значений признаков на интервалах их развития, а также термины, описывающие причины заболеваний. При описании причин значений признака на интервале его развития приводятся соотношения, устанавливающие, какие из причинно-следственных связей, действующих на некотором интервале времени, связанном с наблюдаемым признаком, определяют значения этого признака. Для этого определяется множество всех возможных причинных закономерностей, которые могли бы регулировать значения рассматриваемого признака для всех моментов времени, попадающих в этот интервал. Вводится понятие приоритета причины значений признака. Приоритет зависит от модальности причинно-следственной связи («необходимость» приоритетнее «возможности») и от того, к какому классу она принадлежит (порядок увеличения приоритета: нормальная реакция « реакция на воздействие события « клиническое проявление « клиническое проявление, изменённое воздействием события « клиническое проявление заболевания-осложнения « клиническое проявление заболевания-осложнения, изменённое воздействием события). Причинно-следственная связь, определяющая значения признака на этом интервале, имеет максимальный приоритет в множестве возможных причин.

При описании причин заболеваний приводятся соотношения, устанавливающие, какая причинно-следственная связь (из множества этиологий и осложнений) является причиной заболевания из диагноза. Для этого определяется множество всех возможных причинных закономерностей, которые могли бы быть причиной рассматриваемого заболевания. Вводится понятие приоритета причины заболевания, который зависит от модальности причинно-следственной связи и от того, когда она началась (более ранняя причина имеет больший приоритет). Причинно-следственная связь, являющаяся причиной заболевания, имеет максимальный приоритет в множестве возможных причин.

Третья глава содержит постановку общей задачи медицинской диагностики (прямой и обратной) в терминах математической модели её онтологии, постановку частной обратной задачи и описание методов её решения: последовательного, модифицированного и параллельного - для многопроцессорной вычислительной системы. Здесь же приводятся формулировки теорем об

остановке н корректности алгоритма, реализующего эти методы, эквивалентности последовательной версии и модифицированной параллельной версии, а также даются сведения о реализации модифицированной параллельной версии.

Задача медицинской диагностики, наиболее часто решаемая врачами в их практике, состоит в определении всех возможных альтернативных диагнозов больного на основе знаний предметной области и данных его обследования, к которым относят значения признаков (в моменты их наблюдения), значения анатомо-физиологических особенностей (постоянные во времени) и значения произошедших событий (в моменты, когда они происходили). В каждый диагноз могут входить несколько заболеваний, протекающих одновременно или последовательно. Считается, что все наблюдения протекают на определённом временном отрезке, называемом периодом наблюдения, на котором моменты времени измеряются вещественными числами, каждое из которых есть число часов, прошедших с момента начала наблюдений (нуля часов). Считается, что до этого момента, наблюдения признаков отсутствуют, а заболевания не протекают. Такая задача относится к классу обратных задач. Ей соответствует прямая задача, состоящая в определении возможных состояний пациента (значений наблюдаемых признаков) в те или иные моменты времени на основе известного диагноза, значений особенностей и происходящих событий.

В терминах модели онтологии математическая постановка обратной задачи может быть сформулирована следующим образом:

Дано:

• медицинские знания, удовлетворяющие ограничениям целостности знаний:

■ знания о наблюдениях (признаках, событиях, анатомо-физиологических особенностях пациента) и их возможных значениях',

1 знания о заболеваниях и длительностях их периодов развития',

■ знания о возможных причинах заболеваний - знания об этиологиях и знания об осложнениях',

■ знания о значениях признаков при отсутствии заболеваний - знания о нормальных реакциях и знания о реак!/иях на воздействие событий:

■ знания о причинно-следственных связях между заболеваниями и наблюдениями - знания о клинических проявлениях и знания о клинических проявлениях, изменённых воздействием событий',

• результаты наблюдений больного:

• наблюдавшиеся аиатомо-физиологические особенности и результаты их наблюдения (значения),

■ наблюдавшиеся признаки, моменты их наблюдения и их значения в эти моменты,

■ произошедшие события, моменты, в которые они происходили, и их значения в эти моменты.

Найти:

• все альтернативные диагнозы пациента (один диагноз - множество заболеваний, которыми болен пациент на протяжении периода наблюдений), и:

• объяснение каждого диагноза - причину каждого заболевания в диагнозе (вариант этиологии или вариант осложнения),

• время пана/а и время кош/а каждого периода развития каждого заболевания,

• причины всех наблюдаемых значений признаков (нормальные реакции, ре-акг/ии на воздействие события, клинические проявления заболеваний и клинические проявления, изменённые воздействием событий, возможно, с указанием номера периода динамики и/или причины-события) при каждом диагнозе.

Связи между тем, что дано, и тем, что требуется найти, определяются моделью онтологии и базой знаний.

В связи с тем, что применяемая модель онтологии учитывает большое число связей между процессами, протекающими в организме больного, ожидается, что метод решения сформулированной выше задачи медицинской диагностики, анализирующий все эти связи, будет иметь высокую вычислительную сложность. Поскольку в данной работе рассматривается детерминированная модель, то основным видом зависимости между патологическими процессами является их синхронизация по времени. Такие зависимости возникают, когда больной болен одновременно несколькими заболеваниями (поскольку клинические проявления каждого из этих заболеваний синхронизированы относительно его начала), при осложнениях одних заболевании другими (поскольку клинические проявления осложнения синхронизированы относительно начала этого осложнения), при наличии у заболевания более чем одного периода развития (поскольку в каждом периоде развития его клинические проявления синхронизированы относительно начала и конца этого периода). Когда моменты, относительно которых синхронизированы разные процессы, неизвестны, вычислительная сложность задачи диагностики значительно возрастает из-за дополнительного перебора гипотез о значениях этих моментов.

В случае острых заболеваний (за исключением тяжёлых травм) на начальном (т.е. первом) этапе их развития практически важно поставить диагноз больному как можно скорее; при этом осложнения еще, как правило, не развились. В этой ситуации известны все моменты времени, относительно которых синхронизированы разные процессы; начало заболевания и моменты, в которые происходили различные события (например, связанные с экстренными лечебными мероприятиями). Поэтому процессы, соответствующие изменению значений разных признаков, могут обрабатываться независимо друг от друга.

В этом случае может быть сформулирована частная практически полезная обратная задача медицинской диагностики (и соответствующая ей част-

ная прямая задача), которая получается из поставленной выше, если на модель онтологии наложить следующие ограничения:

• диагноз пациента может включать не более одного заболевания (на протяжении всего периода наблюдений пациент болен одним заболеванием или здоров);

• в качестве причин заболеваний не рассматриваются осложнения одного заболевания другим;

• каждое заболевание имеет единственный период развития;

• если пациент болен некоторым заболеванием, то момент начала этого заболевания известен.

Благодаря тому, что при решении такой обратной задачи процессы, соответствующие изменению значений разных признаков, могут обрабатываться независимо друг от друга, для повышения эффективности метода решения задачи диагностики может быть выполнено его распараллеливание, что позволит исполнять реализованный алгоритм на многопроцессорной вычислительной системе (МВС).

Кроме того, при описанных выше условиях сокращается количество анализируемых причинно-следственных связей (ПСС) при поиске причин значений признака (если признак входит в клиническую картину заболевания, то рассматриваются только клинические проявления и клинические проявления, измененные воздействием события; если же признак не входит в клиническую картину заболевания, то рассматриваются только нормальные реакции и реакции на воздействие события).

Следующие допущения являются естественным дополнением предыдущих:

• если пациент болен, то это заболевание протекает на протяжении всего периода наблюдений (т.е. никакой признак и никакое событие не имеют значений после окончания заболевания);

• наблюдения признаков производятся не ранее начала заболевания из диагноза, тогда как события могут происходить до начала заболевания - в отрицательные моменты времени;

• при наблюдении пациента известны значения всех его аиатомо-физиологических особенностей.

Естественным методом решения частной обратной задачи медицинской диагностики является перебор всех возможных значений выходных данных (диагнозов), при котором для каждого заболевания выполняется решение прямой задачи - построение всех возможных схем развития ПСС и поиск среди них тех, которым соответствуют все наблюдаемые значения признаков пациента.

Результатом решения частной обратной задачи является:

• либо подтверждённая гипотеза о том, что пациент здоров, с объяснением (указанием причин наблюдаемых значений признаков);

• либо несколько взаимоисключающих подтверждённых гипотез о диагнозе, каждая из которых представляет собой одно заболевание, которым болен пациент на всём периоде наблюдений, вместе с объяснением (указанием причин наблюдаемых значений признаков и, возможно, причины самого заболевания);

• либо отказ от диагноза (пациент болен неизвестным заболеванием или введённые результаты наблюдений пациента противоречат базе знаний -ошибка в данных или знаниях).

Перебор гипотез о диагнозе начинается с гипотезы о том, что пациент здоров. В случае её подтверждения прочие гипотезы не рассматриваются.

При рассмотрении каждой гипотезы наблюдаемые признаки обрабатываются независимо друг от друга. При работе с каждым признаком ищется причина каждого его наблюдаемого значения. Это выполняется последовательно, от самого раннего по времени наблюдения значения до самого позднего. Для поиска причины очередного значения признака необходимо знать, какие связи присутствуют между процессами, протекающими в организме пациента, в момент наблюдения, и найти среди них ту, которая является причиной наблюдаемого значения, т.е. для которой наблюдаемое значение принадлежит области значения следствия. Для этого на основе информации из базы знаний (с учётом значений событий и анатомо-физиологических особенностей) строятся все возможные схемы развития во времени ПСС, каждая из которых протекает согласно одному из возможных вариантов её развития. Любая ПСС начинается в определённый момент времени в соответствии с одним из вариантов своего развития и протекает определённое время:

• реакция на воздействие события (РВС) или клиническое проявление, изменённое воздействием события (КПИВС), начинается в момент, когда происходит событие (при выполнении необходимого условия этой ПСС, и для её варианта - при выполнении условия на воздействующие факторы и вхождении значения события в множество допустимых значений), а длительность протекания этой ПСС определяется длительностью периодов динамики используемого варианта этой ПСС;

• нормальная реакция (НР) или клиническое проявление (КП) начинается в момент начала наблюдений (0 часов), что также является моментом начала заболевания (при выполнении условия на воздействующие факторы для варианта этой ПСС. а для КП - также при выполнении необходимого условия) и протекает на протяжении всего периода наблюдения (для варианта КП это так, потому что сделано предположение о том, что пациент наблюдается только во время протекания заболевания).

ПСС, развивающиеся в соответствии с одним из возможных вариантов, накапливаются (добавляются в момент гипотетического начала их действия и удалятся по окончании действия) в множестве гипотез о развитии вариантов

причинно-следственных связей (МГРВПСС). В нём все ГТСС делятся на два подмножества: с высоким (МГРВПССвп) и с низким приоритетом (МГРВПССнп). ПСС в каждом подмножестве хранятся в отсортированном виде, критерий - момент начала действия варианта ПСС.

Таким образом, в каждый момент наблюдения некоторого признака в МГРВПСС ищется тот вариант, который является причиной рассматриваемого значения, то есть:

• который имеет наивысший приоритет среди других в МГРВПСС,

• в множество значений следствия которого (для периода динамики, протекающего в момент наблюдения) входит это наблюдаемое значение признака.

Поскольку алгоритм, реализующий метод решения частной обратной задачи медицинской диагностики, при достаточно большом наполнении базы знаний вынужден выполнять переборы высокой вычислительной сложности, то время его работы при таких условиях (теоретически) велико. В связи с этим встаёт вопрос о разработке оптимизированных методов и реализующих их алгоритмов с целью уменьшения времени, затрачиваемого на решение этой задачи. Решить задачу оптимизации можно двумя путями:

• за счет сокращения переборов, выполняемых алгоритмом, при использовании некоторых дополнительно извлекаемых знаний;

• за счет распараллеливания алгоритма для его выполнения на МВС.

Для выполнения первой оптимизации сокращается перебор гипотез о диагнозе, то есть возможных заболеваний. Очевидно, что определённые значения признаков могут наблюдаться только при протекании у пациента некоторых заболеваний, количество которых может быть либо сопоставимо с количеством заболеваний в базе знаний, либо существенно меньше его. Таким образом, для сокращения первого перебора, необходимо по базе знаний для каждого значения каждого признака определить, при каких заболеваниях это значение может наблюдаться (максимум - все заболевания, минимум - ни одного). На основе этой информации и наблюдений пациента при начале диагностики становится возможным получить для каждого наблюдаемого значения множество заболеваний, при которых оно может встретиться, и в качестве множества гипотез рассматривать пересечение всех таких множеств.

Для распараллеливания в алгоритме решения задачи диагностики необходимо выделить вычислительную часть, несколько экземпляров которой можно запускать одновременно на вычислительных узлах МВС для независимой параллельной обработки наблюдаемых признаков, и управляющую часть. Исследование алгоритма медицинской диагностики показывает, что в нем возможно распараллеливание на одном из двух уровней: параллельно исследуются гипотезы о диагнозе или параллельно исследуются наблюдаемые признаки для каждой гипотезы. Ввиду того, что обработка одних гипотез о диагнозе может занять существенно больше времени, чем обработка других,

распараллеливание производится на втором уровне. В этом случае в функции управляющей части входит формирование множества гипотез о диагнозе для проверки, формирование заданий вида <заболевание; признак> для вычислительных частей, их раздачу и приём результатов, формирование итогового результата.

Реализация параллельного модифицированного алгоритма медицинской диагностики выполнена на языке ANSI С++ с применением библиотеки функций параллельного программирования MPI, что позволяет компилировать и запускать её на различных платформах.

В четвёртой главе описана концепция банка знаний по медицинской диагностике и приводится описание его реализации в рамках платформы облачных вычислений Многоцелевой банк знаний.

Банк знаний по медицинской диагностике - это комплекс программ, который обеспечивает процесс согласованного решения задач по сбору, хранению, управлению и обработке данных и знаний в области медицинской диагностики и является объединением всей этой информации в единый ресурс с возможностью удаленного доступа к нему многим пользователям. Архитектура банка включает следующие компоненты:

• информационное наполнение (ИН), хранящееся на сервере банка знаний п содержащее знания (о наблюдениях и заболеваниях) и данные (истории болезни пациентов), сформированные согласно модели;

• программное наполнение (ПН), ориентированное на интеллектуальную поддержку пользователей банка, разработанное в соответствии с технологией «клиент-сервер» (в совокупности с ИН образуется «трехзвенная» архитектура) и включающее:

■ средства по редактированию данных из ИН (баз знаний о наблюдениях и заболеваниях и базу историй болезни), выполняющие также роль подсистемы доверия, так как они обеспечивают возможность просмотра базы знаний.

■ средства по обработке данных из ИН: оптимизатор базы знаний о заболеваниях и интеллектуальный решатель задачи медицинской диагностики.

■ административную подсистему.

Кроме того, отметим следующие особенности архитектуры:

• ИН банка состоит из разделов, каждый из которых содержит знания и данные конкретной области медицинской диагностики (офтальмология, иммунология и т.п.);

• поскольку алгоритм диагностики предназначен для реализации на МВС, то часть средств ПН и все компоненты ИН находятся на сервере банка знаний, а подсистема, непосредственно выполняющая диагностику - на МВС.

Пользователи банка знаний делятся на следующие группы:

• эксперты, которые формируют базы знаний о наблюдениях и о заболеваниях;

• гости банка, которые знакомятся с применяемыми базами знаний;

• врачи, которые:

■ формируют истории болезни пациентов,

■ пользуются подсистемой медицинской диагностики;

• администратор, который:

■ выполняет функции главного эксперта банка - на основе персональных баз знаний экспертов формирует общую базу знаний о заболеваниях для каждого раздела банка и выполняет её оптимизацию (выделение неявной информации о связи признаков и заболеваний),

■ осуществляет управление полномочиями пользователей. Архитектура компонент сервер-части банка знаний по медицинской диагностике представлена на рис. 1, где присутствуют следующие обозначения:

• прямоугольниками обозначены компоненты ИН и ПН;

• стрелки, имеющие изгибы под прямым углом, обозначают передачу

информации между компонентами ИН, ПН и МВС;

• изогнутая стрелка обозначает вызов программы диагностики.

Рис. 1. Архитектура сервер-части банка знаний по медицинской диагностике

Реализация прототипа банка знаний по медицинской диагностике выполнена с использованием разработанной в ИАПУ ДВО РАН платформы Многоцелевого Банка Знаний (МБкЗ), предназначенной для поддержки жизненного цикла совместимых систем обработки информации. При этом программное наполнение разработанного специализированного банка знаний (СБкЗ) по медицинской диагностике доступно пользователям через сеть Интернет и включает в себя:

• редактор ИРУО, являющийся частью МБкЗ, который используется для редактирования на языке ИРУО моделей онтологий и целевой информации, формируемой по этим моделям - баз знаний и историй болезни;

• информационно-административную систему (ИАС), также входящую в состав МБкЗ, с помощью которой выполняется управление правами пользователей;

• решатель задачи медицинской диагностики;

• преобразователь базы знаний о заболеваниях (публикатор).

Доступ к МВС предоставляется серверу МБкЗ. На нём работает слабофункциональная серверная часть решателя, реализованная на языке Java, которая ведёт общение с пользователем через интерфейсную часть и выполняет запуск реализации алгоритма медицинской диагностики на МВС с последующей трансляцией её результатов к клиенту-пользователю.

Поскольку алгоритм диагностики для быстрой постановки диагноза должен иметь быстрый доступ к знаниям и данным с как можно меньшим количеством промежуточных трансляционных узлов/прослоек, то до начала диагностики на МВС отправляется наполнение базы знаний о заболеваниях, для чего в подсистему оптимизации этой базы знаний (публикатор) встроен выполняющий это код. При начале диагностики из ИН банка на МВС транслируется только история болезни пациента.

По окончании диагностики все полученные результаты транслируются с МВС сервер-частью решателя в интерфейсную клиент-часть.

В пятой главе приводятся данные экспериментального исследования свойств алгоритма медицинской диагностики при различных объёмах входных данных и знаний и различной конфигурации аппаратной платформы, а также исследование производительности прототипа банка знаний на реальных данных.

Полное исследование временной сложности алгоритма медицинской диагностики делится на две основные стадии: исследование зависимости времени работы алгоритма от объёма знаний предметной области (варьируется количество заболеваний и количество признаков) и от объёма данных (варьируется количество наблюдений значений признаков и количество происходящих событий). При выполнении каждого этапа исследования варьируются три характеристики:

• основная варьируемая характеристика этапа исследования (см. выше),

• использование оптимизации по данным (сокращение перебора гипотез),

• использование параллелизма - варьирование количества запускаемых параллельно копий программы (одна - работает только сервер-процесс, две -работают сервер-процесс и один клиент-процесс, три и более - работают сервер-процесс и не менее двух клиент-процессов).

Исследование производительности алгоритма выполнялось на МВС Aleph, расположенной в ИАПУ ДВО РАН. Данная МВС работает под управлением ОС Linux, состоит их 4 узлов с псевдо-2-ядерными (НТ) процессорами Intel Pentium4 3GHz и общей зеркалируемой файловой системой.

На рис. 2.а и 2.6 представлены результаты измерения времени работы алгоритма при проведении исследования на первом этапе первой стадии - исследование зависимости времени работы алгоритма от количества заболеваний. При этом выбирается количество заболеваний, равное 0 (только знания о здоровом пациенте), 10, 20, 30 и 40. Помимо этого база знаний включает информацию о 12 анатомо-физиологических особенностях (по 3 значения у каждой), 100 признаках (по 6 значений у каждого), 10 событиях (по 6 значений у каждого). Наблюдения пациента включают значения всех особенностей. 8 событий и 5 моментов наблюдения каждого признака из 100. Данные пациента сгенерированы таким образом, чтобы одна из гипотез о диагнозе подтвердилась.

Время Время

а б

Рис. 2. Время работы алгоритма диагностики при варьировании количества заболеваний в базе знаний (а - с использованием оптимизации; б— без использования оптимизации)

За счёт оптимизации в случаях, когда количество заболеваний больше 0 (10, 20. 30 и 40), число исследуемых гипотез о заболевании сократилось до 5, 8, 12 и 13 соответственно (что составляет 2, 2,5, 2,5 и 3 раза соответственно).

Полученные значения говорят о том, что использование оптимизации по данным существенно сократило время постановки диагнозов (в среднем в 1-2 десятка раз). Данные, полученные при варьировании числа заболеваний в базе знаний, говорят о том, что при их увеличении временная сложность алгоритма растёт менее, чем линейно (вывод сделан на основе данных, полученных при использовании оптимизации и наиболее оптимальной загрузке МВС - при 7 клиент-процессах и сервер-процессе).

Для оценки практической применимости разработанного специализированного банка знаний в рамках платформы МБкЗ было сформированное его наполнение в области офтальмологии. Были созданы база знаний о наблюдениях и база знаний о заболеваниях с описанием 13 заболеваний и нормальной физиологии. В базу историй болезни банка были занесены 24 истории болезни реальных больных. В результате отладки базы знаний о заболеваниях система

во всех случаях выдала более конкретные диагнозы по сравнению с диагнозами, поставленными врачами. В случае недостаточного количества данных о пациенте помимо правильного диагноза выдавались и несколько альтернативных.

Процесс диагностики любой истории болезни занимает не более 30 сек, из которых 10-15 сек тратится на передачу истории болезни на МВС, около 5 секунд уходит на саму диагностику и 5-10 сек уходит на получение результатов диагностики на ПК пользователя. Формирование удобочитаемого объяснения полученных результатов занимает также порядка 30 сек.

Исследование производилось с использованием компьютера с ОС MS Windows ХР, процессором Intel Pentium-4 НТ ЗГГЦ, 2ГБ оперативной памяти.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. Разработана математическая модель онтологии медицинской диагностики острых заболеваний. Модель учитывает взаимодействие причинно-следственных связей различных типов. Онтология близка к реальным представлениям медицины в нашей стране и описывает сочетанную и осложненную патологии, динамику патологических процессов во времени, а также воздействие лечебных мероприятий и других событий на проявления заболеваний. Модель онтологии включает определения терминов модели знаний и модели действительности, а также систему соотношений, состоящую из ограничений целостности модели знаний и модели действительности и соотношений между ними.

2. Даны постановки прямой и обратной задач медицинской диагностики в терминах модели онтологии, а также постановка частной практически полезной обратной задачи, для которой разработан метод решения, допускающий оптимизацию по данным и естественное распараллеливание. Для алгоритма её решения доказаны теоремы об остановке, корректности и о функциональной эквивалентности исходной и модифицированной параллельной версий алгоритма.

3. Разработана концепция комплекса программ для решения задачи медицинской диагностики, названного банком знаний по медицинской диагностике. Выполнена его реализация в виде специализированного банка знаний в рамках платформы Многоцелевого банка знаний и многопроцессорной вычислительной системы, применяемой в качестве сервера приложений. Программные компоненты банка доступны через сеть Internet.

4. Проведено экспериментальное исследование вычислительной сложности разработанного алгоритма решения задачи медицинской диагностики, показавшее, что в широком диапазоне объёмов модельных баз знаний и историй болезни время его работы на одном процессоре не превышает нескольких минут, а использование многопроцессорной вычислительной системы и оптимизации сокращает время работы в несколько раз. Кроме того, исследование применимости реализованного комплекса программ по медицинской диагностике на реальных историях болезни (в области офтальмологии) подтвердило его практическую полезность.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Клещёв A.C., Москаленко Ф.М., Черняховская М.Ю. Модель онтологии предметной области «Медицинская диагностика». Часть 1. Неформальное описание и определение базовых терминов. // НТИ. Серия 2. - 2005. - №12. - С. 1-7.

2. Клещёв A.C., Москаленко Ф.М., Черняховская, М.Ю. Модель онтологии предметной области «Медицинская диагностика». Часть 2. Формальное описание причинно-следственных связей, причин значений признаков и причин заболеваний. // НТИ. Серия 2. - 2006. - №2. - С.19-30.

3. Москаленко Ф.М. Задача медицинской диагностики и алгоритм её решения, допускающий распараллеливание. // Информатика и системы управления. - 2005. - №2(10). - С.52-63.

4. Москаленко Ф.М. Параллельный оптимизированный алгоритм медицинской диагностики. // Информатика и системы управления. - 2006. -№1(11). - С.87-98.

5. Москаленко Ф.М. Экспериментальное исследование временной сложности параллельного алгоритма диагностики, основанного на реальной онтологии медицины. И Информатика и системы управления. - 2006. -№2(12). - С.42-53.

6. Москаленко Ф.М. Проект компьютерного банка знаний по медицинской диагностике. // Информатика и системы управления. - 2007. - №2(14). -С.55-66.

7. Москаленко Ф.М. Компьютерный банк знаний по медицинской диагностике (в области офтальмологии). // Открытый дальневосточный конкурс программных средств студентов, аспирантов и молодых специалистов «Программист 2009». (Сборник докладов). -Владивосток. -2009. - С.15-19.

8. Москаленко Ф.М., Черняховская М.Ю. База наблюдений в области офтальмологии для банка медицинских знаний. // Информатика и системы управления. - 2009. - №2(20). - С.40-49.

9. Москаленко Ф.М., Черняховская М.Ю. Формирование баз знаний о заболеваниях на основе онтологии медицины. // Информатика и системы управления. Материалы III научной конференции «Системный анализ в медицине». - Благовещенск. - 2009. - №4(22). - С.200-202.

10. Moskalenko Ph. M., Chernyakhovskaya М. Yu. An implementation of the computer bank of medical diagnostics for ophthalmology. // First Russia and Pacific Conference on Computer Technology and Applications (RPC-2010). -Vladivostok, Russia. -2010. -pp.340-343.

11. Москаленко Ф.М., Черняховская М.Ю. База заболеваний «конъюнктивит» для компьютерного банка знаний. // Информатика и системы управления. - 2010. - №4(26). - С.94-103.

Личный вклад автора. Все результаты, составляющие основное содержание диссертационной работы, получены автором самостоятельно. В работах [1,2] автором разработана и формализована модель онтологии медицинской диагностики. В работах [8,9,11] автор формализовал знания в области офтальмологии. В работе [10] автор дал сведения о реализации программной системы и описал результаты исследования её производительности.

Москаленко Филипп Михайлович

Методы решения задачи медицинской диагностики на основе математической модели предметной области

Автореферат

Подписано к печати 21.12.10 Усл.печл, 1.0 Уч.-изд.л. 0.8

Формат 60x84/16 Тираж 100 Заказ 40

Издано ИАПУ ДВО РАН. Владивосток, Радио, 5 Отпечатано участком оперативной печати ИАПУ ДВО РАН Владивосток, Радио, 5

Оглавление автор диссертации — кандидата технических наук Москаленко, Филипп Михайлович

ВВЕДЕНИЕ.

ГЛАВА 1. Системы медицинской диагностики, основанные на знаниях.

1.1. Общая характеристика систем медицинской диагностики.

1.2. Используемые в экспертных системах модели медицинской диагностики, основанные на онтологиях.

1.3. Задачи, решаемые существующими системами медицинской диагностики.

1.4. Методы решения задачи медицинской диагностики и их свойства.

1.5. Элементы оптимизации в системах медицинской диагностики.

1.6. Особенности реализации систем медицинской диагностики.

1.7. Экспериментальное исследование и практическое применение систем медицинской диагностики.

1.8. Выводы.

ГЛАВА 2. Математическая модель онтологии предметной области «медицинская диагностика».

2.1. Неформальное описание онтологии предметной области «медицинская диагностика». 27

2.1.1. Неформальное описание действительности.

2.1.2. Неформальное описание знаний.

2.2. Расширение языка прикладной логики «Категории» и модернизированная прикладная логическая теория «Определение разбиений».

2.2.1. Расширение «Категории».

2.2.2. Прикладная логическая теория «Определение разбиений».

2.3. Базовые понятия и онтологические соглашения, описывающие знания и действительность предметной области.

2.3.1. Базовые понятия и онтологические соглашения, описывающие знания предметной области (параметры модели онтологии).

I 2.3.2. Базовые, понятия и онтологические .соглашения, описывающие действительность предметной области (неизвестные модели онтологии).

2.4. Термины знаний и действительности, описывающие различные причинно-следственные связи, их ограничения целостности, а также онтологические соглашения о соответствии между знаниями и действительностью.

2.4.1. Термины знаний и действительности, описывающие нормальные ч реакции, и онтологические соглашения о соответствии между ними. 42 !

2.4.2. Термины знаний и действительности, описывающие реакции на воздействие событий, и онтологические соглашения о соответствии между ними.

2.4.3. Термины знаний и действительности, описывающие клинические проявления заболеваний, и онтологические соглашения о соответствии между ними.

2.4.4. Термины знаний и действительности, описывающие клинические проявления заболеваний, изменённые воздействием событий, и онтологические соглашения о соответствии между ними.

2.4.5. Термины знаний и действительности, описывающие этиологии, и онтологические соглашения о соответствии между ними.

2.4.6. Термины знаний и действительности, описывающие осложнения, и онтологические соглашения о соответствии между ними.

2.4.7. Общие термины и онтологические соглашения, используемые для описания причинно-следственных связей.

2.5. Термины и соглашения, описывающие интервалы развития признака и причины заболеваний.

2.5.1. Термины и соглашения, описывающие интервалы развития признака.

2.5.2. Описание причин заболеваний, входящих в диагноз.

2.6. Выводы.

ГЛАВА 3. Задача медицинской диагностики и методы её решения.

3.1. Постановки задач медицинской диагностики.

3.2. Метод решения частной обратной задачи медицинской диагностики.

3.3. Алгоритм решения частной обратной задачи медицинской диагностики.

3.3.1. Описание подзадач.

3.3.2. Описание данных.

3.3.3. Алгоритмы подзадач.

3.3.4. Теоремы об остановке и корректности алгоритма.

3.4. Оптимизация метода решения частной обратной задачи медицинской диагностики.

3.4.1. Сокращение переборов.

3.4.2. Алгоритм анализа базы знаний.

3.4.3. Модифицированный алгоритм медицинской диагностики.

3.4.4. Распараллеливание алгоритма медицинской диагностики.

3.4.5. Теорема об эквивалентности оптимизированной и исходной версий алгоритма.

3.5. Выводы.

ГЛАВА 4. Компьютерный банк знаний по медицинской диагностике.

4.1. Общие принципы создания банка знаний по медицинской диагностике.

4.2. Информационное наполнение банка знаний по медицинской диагностике.

4.3. Задачи, решаемые с помощью банка знаний пользователями различных типов, и соответствующее им программное наполнение.

4.4. Реализация прототипа банка знаний по медицинской диагностике.

4.4.1. Общие сведения.

4.4.2. Сведения о реализации решателя задачи медицинской диагностики.

4.4.3. Сведения о реализации параллельного модифицированного алгоритма медицинской диагностики.

4.4.4. Сведения о реализации публикатора.

4.5. Выводы.

ГЛАВА 5. Экспериментальное исследование алгоритма медицинской диагностики и подсистемы медицинской диагностики в составе прототипа банка знаний.

5.1. Общие сведения об экспериментальном исследовании временной сложности параллельного модифицированного алгоритма медицинской диагностики.

5.2. Результаты исследования производительности алгоритма.

5.2.1. Зависимость времени работы алгоритма от количества заболеваний.

5.2.2. Зависимость времени работы алгоритма от количесгва признаков.

5.2.3. Зависимость времени работы алгоритма от количества моментов наблюдения признаков.

5.2.4. Зависимость времени работы алгоритма от количества наблюдаемых событий

5.3. Результаты исследования практической применимости разработанного прототипа банка знаний.

5.4. Выводы.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Москаленко, Филипп Михайлович

Актуальность работы. Системы медицинской диагностики являются одним из приложений методов искусственного интеллекта. Их разработка имеет целью помочь врачу избежать собственных ошибок. Задачей таких систем является определение заболевания, которым болен пациент, на основе данных о его наблюдениях и построение объяснения принятого решения.

Значительный вклад в разработку систем медицинской диагностики для ЭВМ внесли отечественные и зарубежные ученые: H.H. Амосов, И.П. Быховский, A.A. Вишневский, И.М. Гельфанд, Е.В. Гублер, A.C. Клещев, Б.А. Кобринский, Г.А. Хай, М.Ю. Черняховская, В. Chandrasekaran, С.А. Kulikowski, R.S. Ledley, L.B. Lusted, F. Mizoguchi., S.G. Pauker, E.H. Shortliffe, P. Szolovits и другие.

Были разработаны модели медицинской диагностики, описывающие знания в форме правил, фреймов, патофизиологических моделей, а также модели онтологий медицинской диагностики; предложены методы решения задачи диагностики, которые либо моделируют рассуждения врача, либо обрабатывают заданные экспертами правила, либо проверяют соответствие состояния больного и клинических картин заболеваний, описанных врачом; разработаны методы оптимизации алгоритмов диагностики, состоящие в использовании извлекаемой из баз знаний дополнительной информации или в использовании специальных сред разработки и техник программирования; некоторые системы медицинской диагностики созданы на базе сетевых технологий и предоставляют доступ к системе через сеть Интернет; наиболее широко в практической медицине применяются узконаправленные системы, способные проводить диагностику одного или небольшого числа заболеваний в какой-то области.

Однако модели знаний, лежащие в основе современных экспертных систем медицинской диагностики, все еще заметно проще реальных представлений врачей, большинство таких систем имеет локальную реализацию, а время работы многих систем всё ещё чрезмерно велико.

Таким образом, актуальной задачей является разработка методов решения задачи медицинской диагностики, основанных на математической модели онтологии, приближенной к реальным представлениям в области медицины, в терминах которой знания представлены в форме, понятной врачам, и которые позволяют определять не только диагноз пациента, но и причину каждого заболевания, а также объяснять изменение во времени наблюдаемых значений признаков с учетом индивидуальных особенностей пациента и происшедших с ним событий. При этом система, основанная на таких методах, должна быть способна ставить диагноз в приемлемое для врача время и предоставлять удаленный доступ многим пользователям-врачам.

Целью диссертационной работы является разработка и исследование математической модели онтологии, методов и комплекса программ для решения задачи медицинской диагностики на многопроцессорной вычислительной системе.

Для достижения этой цели необходимо решить следующие задачи:

1) разработать математическую модель онтологии медицинской диагностики, отвечающую современным представлениям экспертов в этой области;

2) сформулировать задачу медицинской диагностики в терминах этой онтологии, разработать методы её решения и реализующий их алгоритм для многопроцессорной вычислительной системы;

3) разработать концепцию и методы реализации комплекса программ для решения задачи медицинской диагностики с использованием многопроцессорной вычислительной системы в качестве сервера приложений;

4) провести экспериментальное исследование вычислительной сложности реализованного алгоритма решения задачи медицинской диагностики и исследовать практическую применимость разработанного комплекса программ.

Методы исследования. Для решения указанных задач применялись элементы теории множеств, математической логики, теории формальных языков, методы разработки онтологий и построения их моделей, методы системного, объектно-ориентированного, параллельного программирования, методы разработки пользовательских интерфейсов.

Научная новизна работы состоит в следующем:

• впервые разработаны онтология медицинской диагностики и её математическая модель, отличающиеся от известных максимальной приближенностью к реальным представлениям экспертов в области медицинской диагностики в нашей стране;

• впервые разработаны метод и алгоритм решения задачи медицинской диагностики, основанные на математической модели нетривиальной онтологии, а так же доказаны теоремы об остановке и корректности алгоритма;

• впервые сформулирована концепция сетевого ресурса, предназначенного для обеспечения процесса согласованного решения комплекса задач по хранению, управлению и обработке данных и знаний в области медицинской диагностики острых заболеваний, с возможностью удаленного доступа.

Практическая ценность работы состоит в следующем:

• реализован алгоритм медицинской диагностики, способный работать в последовательном и параллельном режимах, основанный на математической модели нетривиальной онтологии и производящий поиск соответствия истории болезни пациента и картин заболеваний, описанных врачами;

• разработан комплекс программ (с применением платформы облачных вычислений Многоцелевой банк знаний) для решения задачи медицинской диагностики, способный проводить диагностику острых заболеваний в любой области медицины в приемлемое время и при этом выдавать понятное врачу объяснение полученного результата.

Реализация результатов работы. Результаты работы использованы в учебном процессе:

• во Владивостокском государственном медицинском университете — материалы второй и пятой глав используются для знакомства студентов с формальным представлением острых заболеваний глаза и его придаточного аппарата в курсах лекций по офтальмологии, материалы четвертой главы используются для практики в постановке диагнозов в области офтальмологии;

• в Дальневосточном государственном университете - материалы диссертации используются в учебном процессе при чтении курса лекций по СД «Системы искусственного интеллекта» студентам специальности 010503.65 «Математическое обеспечение и администрирование информационных систем».

Результаты работы использованы в научной работе и исследованиях сотрудников кафедры ПО ЭВМ в Институте математики и компьютерных наук ДВФУ и сотрудников лаборатории интеллектуальных систем ИАПУ ДВО РАН.

Положения, выносимые на защиту:

• модель онтологии медицинской диагностики, максимально приближенная к реальным представлениям экспертов;

• метод решения частной задачи медицинской диагностики и реализующий его корректный алгоритм;

• доступный через сеть Интернет комплекс программ, позволяющий проводить медицинскую диагностику за приемлемое время, а также редактировать базы знаний, наблюдений и историй болезни.

Обоснованность и достоверность результатов работы обеспечиваются применением теоретических методов разработки интеллектуальных систем и подтверждены результатами экспериментальных исследований.

Апробация работы. Основные научные и практические результаты работы докладывались и обсуждались на следующих международных и российских конференциях и семинарах: втором Международном научно-практическом семинаре «Высокопроизводительные параллельные вычисления на кластерных системах» (Нижний Новгород, 2002), Дальневосточной математической школе-семинаре имени академика Е.В. Золотова (Владивосток, 2002, 2003, 2004, 2006, 2008; Хабаровск, 2005), открытом Дальневосточном конкурсе программных средств студентов, аспирантов и молодых специалистов «Программист» (Владивосток, 2003, 2004, 2006, 2009), II и III международных конференциях «Параллельные вычисления и задачи управления» (Москва, 2004, 2006), XIII международной конференции «Знание-Диалог-Решение»

Болгария, Варна, 2007), научной сессии МИФИ (Москва, 2008), конференции «Системный анализ в медицине» (Благовещенск, 2009), Первой Российско-Тихоокеанской конференции в области компьютерных технологий и приложений (Владивосток, 2010).

Публикация результатов работы. По материалам диссертации опубликованы 32 печатные работы: 8 старей в российских журналах (из них 5 -в журналах, входящих в Перечень рекомендованных ВАК РФ), 4 статьи в иностранных журналах, 3 препринта, 17 тезисов и трудов конференций.

Структура и объём работы. Диссертационная работа состоит из . введения, пяти глав, заключения, списка литературы из 128 наименований и трёх приложений. Основная часть работы изложена на 139 страницах, содержит 5 таблиц и 12 рисунков.

Личный вклад автора. Все результаты, составляющие основное содержание диссертационной работы, получены автором самостоятельно. В работах [14-17, 71-73] автором разработана и формализована модель онтологии медицинской диагностики, основанная на знаниях экспертов. В работах [12, 13] автором описан метод медицинской диагностики и реализующий его алгоритм. В работах [43, 74] автор разработал концепцию программной системы, а в работе [102] дал сведения о её реализации и описал результаты исследования её производительности. В работах [44-46, 57, 58] автор формализовал знания о наблюдениях и острых заболеваниях в области офтальмологии.

Заключение диссертация на тему "Методы решения задачи медицинской диагностики на основе математической модели предметной области"

5.4. Выводы

В главе получены следующие результаты [41, 44, 45,,58, 59, 102]:

1) описан метод проведения исследования временной; сложности алгоритма; медицинской диагностики, приведённого в главе 3;

2) приведены данные о времени работы алгоритма: медицинской диагностики при различных, наполнениях базы знании и>различном объёме наблюдений, которые показывают, что:

• оптимизация; заметно- ускоряет процесс постановки диагноза^ в - особенности, при наличии большого количества заболеваний в базе знаний,

• наибольшая скорость постановки диагноза наблюдается при запуске не менее одного и не более двух процессов на каждом узле применявшейся многопроцессорной вычислительной системы (по одному для каждого ядра процессора).

• время работы алгоритма на всех использованных модельных наборах данных: при запуске оптимального числа процессов и использовании» оптимизации не превышает нескольких минут и растёт как максимум линейно, относительно - изменяемой величины данных, за: исключением увеличения количества произошедших событий, где оно растёт экспоненциально (так как при рекурсии происходит обработка большего числа запущенных вариантов ПСС в множестве МГРВПСС);

3) приведены данные о времени и результатах работы подсистемы диагностики прототипа банка знаний-; при обработке реальных историй болезни., которые показывают, что, несмотря на использовании сложной модели онтологии и сетевых технологий, время работы подсистемы диагностики- соответствует времени, затрачиваемому на постановку диагноза наиболее быстрым современным системам медицинской диагностики (не превышает 1 минуты).

Заключение

1. Разработана математическая модель онтологии медицинской диагностики острых заболеваний. Модель учитывает взаимодействие причинно-следственных связей различных типов. Онтология близка к реальным представлениям медицины в нашей стране и описывает сочетанную и осложненную патологии, динамику патологических процессов во времени, а также воздействие лечебных мероприятий и других событий на проявления заболеваний. Модель онтологии включает определения терминов модели знаний и модели действительности, а также систему соотношений, состоящую из ограничений целостности модели знаний и модели действительности и соотношений между ними.

2. Даны постановки прямой и обратной задач медицинской диагностики в терминах модели онтологии, а также постановка частной практически полезной обратной задачи, для. которой разработан метод решения, допускающий оптимизацию по данным и естественное распараллеливание. Для алгоритма-её решения доказаны теоремы об остановке, корректности и о функциональной эквивалентности исходной и модифицированной-параллельной версий алгоритма.

3. Разработана концепция* комплекса программ для решения задачи медицинской» диагностики, названного банком знаний по медицинской диагностике. Выполнена его реализация в виде специализированного' банка знаний в рамках платформы Многоцелевого банка знаний и многопроцессор ной вычислительной системы, применяемой в качестве сервера приложений. Программные компоненты банка доступны через сеть Internet.

4. Проведено экспериментальное исследование вычислительной сложности реализованного алгоритма решения- задачи медицинской диагностики, показавшее, что в широком диапазоне объёмов модельных баз знаний и историй болезни время его работы на одном процессоре не превышает нескольких минут, а использование многопроцессорной вычислительной системы и оптимизации сокращает время работы в несколько раз. Кроме того, исследование применимости разработанного комплекса программ по медицинской диагностике на реальных историях болезни (в области офтальмологии) подтвердило его практическую полезность.

Библиография Москаленко, Филипп Михайлович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Боженко В.К., Сотников В.М. Использование многопараметрических методов анализа информации в онкологии // Вестник РНЦРР МЗ РФ! - 2006. ~ №6. - Электронный ресурс.. URL: http://vestiiik.mciT.ru/vestnik/v6/papers/ bozhenv6.htm (дата обращения: 02.10.2006).

2. Брейкин Т.В., Камалова JI.3., Попкова С.Я., Карташевская A.A. Проектирование экспертных систем медицинской диагностики на базе нечеткой логики с применением методов системного моделирования // Управление в сложных системах. Уфа. - 1999. - С. 127-134.

3. Бурдаев В.П. Прикладные, экспертные системы, основанные на оболочке «ТЕСНЕХР». Электронный ресурс. URL: http://uacm.kharkov.ua/eng/index. shtml7eexpert.htm (дата обращения: 03.03.2003).

4. Горбань А.Н., Дунин-Барковский В.Л., Кирдин А.Н. и др. Нейро-информатика. Новосибирск: Наука. Сибирское предприятие РАН, 1998. -296с.

5. Зильбер А.П., Шифман E.M., Павлов А.Г., Белоусов С.Е. Интернет-проект «Компьютерная диагностика преэклампсии». Электронный ресурс. URL: http://critical.onego.ru/critical/medlogic/ (дата обращения: 01.03.2003).

6. Клещёв A.C., Артемьева И.Л. Математические модели онтологий предметных областей. Часть 1. Существующие подходы к определению понятия «онтология» // НТИ. Серия 2. 2001. - №2. - С.20-27.

7. Клещёв A.C., Артемьева И.Л. Математические модели онтологий предметных областей. Часть 2. Компоненты модели // НТИ. Серия 2. — 2001. -№3.- С. 19-28.

8. Клещёв A.C., Артемьева И.Л. Математические модели онтологий предметных областей. Часть 3. Сравнение разных классов моделей онтологий // НТИ. Серия 2.-2001.- №4. С. 10-15.

9. Клещёв A.C., Артемьева И.Л. Необогащенные системы логических соотношений. Часть 1 // НТИ. Серия 2. 2000. - №7. - С Л 8-28.

10. Клещёв A.C., Артемьева И.Л. Необогащенные системы логических соотношений. Часть 2 // НТИ. Серия 2. 2000. - №8. - С.8-18.

11. Клещёв A.C., Москаленко Ф.М. Оптимизированный алгоритм решения задачи медицинской диагностики // 27-ая Дальневосточная школа-семинар им. академика Е.В.Золотова (тезисы докладов). Владивосток: Дальнаука. - 2002. - С.120-124.

12. Клещёв A.C., Москаленко Ф.М., Черняховская М.Ю: Модель онтологии медицинской диагностики // XXX Дальневосточная математическая школа-семинар им. академика Е.В.Золотова (тезисы докладов). Хабаровск: Изд-во ДВГУПС. - 2005. - С. 187.

13. Клещёв A.C., Москаленко Ф.М., Черняховская M.K)t Модель онтологии предметной области «Медицинская диагностика». Часть 1. Неформальное описание и определение базовых терминов // НТИ. Серия 2. 2005. - №12. - С. 1-7.

14. Клещёв A.C., Москаленко Ф.М., Черняховская М.Ю. Онтология и модель онтологии предметной области «Медицинская диагностика»: Препринт. Владивосток: ИАПУ ДВО РАН, 2005. 44с.

15. Клещёв A.C., Самсонов В.В. МАКРОРЕПРО — язык спецификации компиляции баз знаний в базы правил: Препринт. Владивосток: ДВО РАН, 1992. 25с.

16. Клещёв A.C., Самсонов В.В., Черняховская М.Ю. Медицинская, экспертная система Консультант-2. Представление знаний: Препринт. Владивосток: ИАПУ ДВО АН СССР, 1987. 44с.

17. Клещёв A.C., Черняховская М.Ю. Системы медицинской диагностики, основанные на принципах искусственного интеллекта. Представление медицинского знания: Препринт. Владивосток: ИАПУ ДВНЦ АН СССР, 1982.-39с.

18. Клещёв A.C., Черняховская М.Ю. Системы представления проблемно-ориентированных знаний // Техническая кибернетика. — 1982. — № 5. -С.43-63.

19. Кобринский Б.А. Автоматизированные диагностические и информационно-аналитические системы в педиатрии // Русский медицинский журнал. 1997. - Электронный ресурс. URL: http://www.rmj.ru/rmj7t7/n4/ 5.htm (дата обращения: 06.03.2006).

20. Кобринский Б.А. Ретроспективный анализ медицинских экспертных систем // Новости Искусственного Интеллекта. 2005. - №2. - С.6-16.

21. Лагутин A.B., Седунов И.М., Семенченко Е.А., Морох В.А. Экспертная система «Диагностика коматозных состояний» // Фирма АдминРу — 1992. — Электронный ресурс. URL: http://www.adminru.com (дата обращения: 15.02.2005).

22. Марьянник Б.В. Метод виртуальных статистик и его применение в партнерских системах для компьютерной диагностики // Компьютер, хроника. 1996. - №5. - С.65-74. - Электронный ресурс. URL: http://www.pedklin.ru/Publ/25.html (дата обращения: 15.02.2005).

23. Москаленко Ф.М. Банк знаний по медицинской диагностике, основанный на нетривиальной онтологии // Научная сессия МИФИ-2008. Сборник научных трудов. В 15 томах. Т. 10. Интеллектуальные системы и технологии. М.: МИФИ. - 2008. - С.87-88.

24. Москаленко Ф.М. Задача медицинской диагностики и алгоритм её решения, допускающий распараллеливание // Информатика и системы управления. 2005. - №2(10). - С.52-63.

25. Москаленко Ф.М. Параллельный оптимизированный алгоритм медицинской диагностики // Информатика и системы управления. 2006. — №1(11). — С.87-98.

26. Сборник докладов. Владивосток: ИАПУ ДВО РАН. - 2006. - С.76-80.

27. Москаленко Ф.М. Проект компьютерного банка знаний по медицинской диагностике // Информатика и системы управления. 2007. — №2(14). —1. С.55-66.i

28. Москаленко Ф.М. Прототип банка знаний по диагностике острых J конъюнктивитов // XXXIII Дальневосточная математическая школа-I семинар им. академика Е.В.Золотова (тезисы докладов). Владивосток: j Изд-во Дальнаука. - 2008. - С.25-27.

29. Москаленко Ф.М. Система оптимизирующих преобразований медицинской f базы знаний для многопроцессорного вычислительного комплекса //

30. Москаленко Ф.М. Экспертная система медицинской диагностики, основанная1 на реальной онтологии медицины, для многопроцессорной ЭВМ // Труды II

31. Москаленко Ф.М., Клещёв A.C., Черняховская М.Ю. Концепция компьютерного1.банка знаний по медицинской диагностике // Proceedings of the ХШ-th International

32. Орлов В.А., Клещёв A.C. Компьютерные банки знаний. Модель процессаредактирования информационного наполнения // Информационныетехнологии. 2006. - №7. - С. 11 -16.

33. Орлов В.А., Клещёв A.C. Компьютерные банки знаний. Универсальный подход к решению проблемы редактирования информации // Информационные технологии. 2006. - №5. - С.25-31.

34. Попов Э.В. Экспертные системы реального времени // Открытые системы. 1995. - Электронный ресурс. URL: http://www.osp.ru/os/1995/02/178608/ (дата обращения: 11.04.2004).

35. Самсонов В.В. Разработка и исследование методов преобразования прикладных семантических сетей в базы правил: Дис. . канд. тех. наук. Владивосток. 1993. 181с.

36. Самсонов В.В., Сорокин B.C., Черняховская М.Ю. Экспериментальная медицинская экспертная система Консултант-2 // Проблемы проектирования экспертных систем: Тез. докл. Всесоюз. школы-совещания. 4.2. -Москва. 1988. - С.238-239.

37. Хай Г.А. Компьютерная поддержка работы врача // Информационные технологии в здравоохранении. 2001. - №10-12. - С.10-11.

38. Черняховская М.Ю. Представление знаний в экспертных системах медицинской диагностики Владивосток, ДВНЦ АН СССР. - 1983. - 212с.

39. Черняховская М.Ю., Мельников В.Я., Догадова Л.П., Негода В.И., Москаленко Ф.М. Формальное представление знаний о конъюнктивитах: Препринт. Владивосток: ИАПУ ДВО РАН, 2007. 56с.

40. Черняховская М.Ю., Москаленко Ф.М., Мельников В.Я., Негода В.И., Догадова Л.П. Формальное представление знаний о конъюнктивитах (издание второе, исправленное и дополненное): Препринт. Владивосток: ИАПУ ДВО РАН, 2009. 56с.

41. Allen J.F. Maintaining knowledge about temporal intervals // Comm. ACM. -1983. №26. - pp.832-843.

42. Allen J.F., Hayes P.J., Moments and points in an interval-based temporal logic // Computational Intelligence. 1989. - №5. - pp.225-238.

43. Andrade H., Saltz J. Query Optimization in Kess An Ontology-Based KBMS // in: Proceedings of the 15th Brazilian Symposium on Databases. - 2000. -Электронный ресурс. URL: ftp://ftp.cs.umd.edu/pub/hpsl/papers/edbt2000.ps.Z (дата обращения: 15.05.2005)

44. Anigbogu S.O., Inyiama H.C. Artificial Intelligence-based medical diagnostic expert system for malaria and the related ailments // Journal of computer science & its applications. June 2006. - №1. - Vol.12. - pp.3-8.

45. Augusto J.C. Temporal reasoning for decision support in medicine // Artificial Intelligence in Medicine. 2005. - №33. - pp.1-24.

46. Chabat F., Hansell D.M., Guang-Zhong Yang. Computerized Decision Support in Medical Imaging. London: Imperial College, 1997. Электронный ресурс. URL: http://www.doc.ic.ac.uk/~gzy/pub/chabat-decision-support.pdf (дата обращения: 20.10.2002).

47. Côté R.A., Rothwell D.J., Palotay J.L., Beckett R.S., Brochu L. (eds): The Systematized Nomenclature of Human and Veterinary Medicine: Snomed International. Northfield, II: College Of American Pathologists. 1993.

48. Detmer W.M., Shortliffe E.H. Using the Internet to Improve Knowledge Diffusion in Medicine. Stanford, 1997. Электронный ресурс. URL: http://www-smi.stanford.edu/pubs/SMIReports/SMI-97-0658.pdf (дата обращения: 10.10.2002).

49. Droy J.-M., Darmoni S.J., Massari P., Blanc Т., Moritz F., Leroy J. SETH: an expert system for the management on acute drug poisoning. 1995. Электронный ресурс. URL: http://www.chu-rouen.fr/dsii/publi/seth.html (дата обращения: 15.05.2007).

50. Gamper J., Nejdl W. Abstract Temporal Diagnosis in Medical Domains // in: Artificial Intelligence in Medicine. 1997. - №10(3). - pp.209-234. -Электронный ресурс. URL: http://www.inf.unibz.it/~gamper/publ/aim97.pdf (дата обращения: 19.09.2006).

51. Gangemi A., Pisanelli D., Steve G. Ontology Integration: Experiences with Medical Terminologies // in: Guarino N. (Ed.), Formal Ontology in Information Systems. -IOS Press. 1998. -pp: 163-178.

52. Heijst G.V., Schreiber A.Th., Wielinga B.J. Using explicit ontologies in KBS development // International Journal of Human-Computer Studies. 1997. -Vol.46.-pp.l83-292.

53. Ingargiola G. Building Classification Models: ID3 and C4.5. Электронный ресурс. URL: http://www.cis.temple.edu/~ingargio/cis587/readings/id3-c45.html (дата обращения: 11.10.2006).

54. Kappen В., Wiegerinck W., Braak E. Decision support for medical diagnosis. 2000. Электронный ресурс. URL: http://www.snn.ru.nl/nijmegen/components/ compubman/pubs/KappenSTT.pdf (дата обращения: 11.11.2005).

55. Kononenko I. Machine Learning for Medical Diagnosis: History, State of the Art and Perspective. 2000. Электронный ресурс. URL: http://lkm.fri.uni-lj.si/ xaigor/slo/clanki/aimedOO.pdf (дата обращения: 11.10.2007).

56. Kukar M. Transductive reliability estimation for medical diagnosis I I Artificial Intelligence in Medicine. -2003. -№29. -pp.81-106.

57. Kulikowski C.A., Weiss S.M. Representation of Expert Knowledge for Consultation: The CASNET and EXPERT Projects // Ch.2 in: Szolovits P. (Ed.), Artificial Intelligence in Medicine. Westview Press, Boulder, Colorado. - 1982.

58. Lavalette G.R. et all. Formalisation for decision support in anesthesiology // Artificial Intelligence in Medicine. 1998. - Vol.11. - pp.189-214.

59. Lucas P. Bayesian Analysis, Pattern Analysis and Data Mining in Health Care // in: Current Opinion in Critical Care. 2004. - pp.399-403. - Электронный ресурс. URL: http://www.cs.ru.nl/~peterl/cun-ent-opinion.pdf (дата обращения: 11.11.2007).

60. Oehm S., Siessmeier Т., Buchholz H.-G., Bartenstein P., Uthmann T. A Knowledge-Based System for the Diagnosis of Alzheimer's Disease // Proceedings of the 9th Conference on Artificial Intelligence in Medicine in Europe (AIME 2003). 2003. - pp.117-121.

61. Pisanelli D.% Gangemi A., Steve G. An ©ntological Analysis of the UMLS Metathesaurus // Journal of the American Medical Inforlatiocs Association. -1998. ~№5. -pp.810-814.

62. Quan H., Fehr N., Roos L. Studying Health Care: Some ICD-10 Tools. 2006. Электронный ресурс. URL: http://www.bibalex.org/supercourse/supercourseppt /22011-23001/2237l.ppt (дата обращения: 08.11.2005).

63. Rector A., Rogers J., Pole P. The Galen High Level Ontology // in: Proceedings of Medical Informatics in Europe (MIE'96). -1996: pp.174-178.

64. Sawar S.J. Diagnostic Decision Support System of POEMS. 1999. Электронный ресурс. URL: http://www.cbl.leeds.ac.uk/sawar/projects/poems/ poems-in-detail.html (дата обращения: 07.11.2002).

65. Shahar Y. The RÉSUMÉ project. 2006. Электронный ресурс. URL: http://smi-web.stanford.edu/projects/resume/ (дата обращения: 07.07.2007).

66. Sordo M., Buxton H., Watson D. A Hybrid Approach to Breast Cancer Diagnosis // 2001. Электронный ресурс. URL: http://www.acl.icnet.uk/ PUBLICATIONS/sordo/chapter2001.pdf (дата обращения: 17.08.2004).

67. Spackman К., Campbell К., Côté R. SNOMED RT: A Reference Terminology for Health Care // in: Proceedings of the 1997 Amia Annual Symposium. Nashville, Tn. October 25-29, 1997. Philadelphia, Pa: Hanley & Belfus. - 1997.

68. Spreckelsen С., Habermeyer E., Spitzer K. Integrational aspects of a knowledge-based assistance system in psychiatry. Электронный ресурс.

69. Teije A., Rotterdam E. Diagnostic Reasoning with Anaesthesia Knowledge // 1998. Электронный ресурс. URL: http://www.cs.vu.nl/~annette/postscript/ CESA96.ps (дата обращения: 17.11.2003).

70. Ultsch A., Korus D., Kleine T. Integration-of Neural Networks and Knowledge-Based Systems in-Medicine // in: 5th Conf. on Artificial Intelligence in Medicine Europe AIME'95. Lecture Notes in Artificial Intelligence. - 1995. - №934. -pp.425-426,

71. Vilain M. Kautz H. Constraint propagation algorithms for temporal reasoning // in: Proceedings of the Fifth National Conference on Artificial Intelligence. -1986. pp.377-382.

72. Waiss S.M:, Kuiikowski C.A., Amarel S., Safir A. A model-based method, for computer-aided medical decision-making // Artificial Intelligence. 1978. -№2. - Vol.11. - pp. 145-172.

73. Zweigenbaum P. Consortium Menelas: Menelas: Coding and Information Retrieval from Natural Language Patient Discharge Summaries // Advances in Health Telematics. Amsterdam: IOS Press. - 1995. - pp.82-89.

74. Zweigenbaum P., Bachimont В., Bouaud J., Charlet J., Boisvieux J.-F. Issues In the Structuring and Acquisition of an Ontology for Medical Language Understanding // Methods of Information In Medicine. 1995. -№34(1/2). - pp. 15-24.