Эмпирическое восстановление математических моделей медицинской диагностики

Газарян, Варвара Арамовна

Математическое моделирование, численные методы и комплексы программ

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Эмпирическое восстановление математических моделей медицинской диагностики

кандидата физико-математических наук: Газарян, Варвара Арамовна
город: Москва
год: 2013
специальность ВАК РФ: 05.13.18
цена: 450 рублей

Диссертация по информатике, вычислительной технике и управлению на тему «Эмпирическое восстановление математических моделей медицинской диагностики»

Автореферат диссертации по теме "Эмпирическое восстановление математических моделей медицинской диагностики"

На правах рукописи

ГАЗАРЯН Варвара Арамовна

ЭМПИРИЧЕСКОЕ ВОССТАНОВЛЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ МЕДИЦИНСКОЙ ДИАГНОСТИКИ

Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук

16 МАЯ -'¡ИЗ

005059»оч

Москва —2013

005059864

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Московский государственный университет имени М.В. Ломоносова»

Научный руководитель: доктор физико-математических наук,

профессор Пытьев Юрий Петрович

Официальные оппоненты: Киселёв Михаил Иванович,

доктор физико-математических наук, профессор, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный технический университет имени Н.Э. Баумана», профессор кафедры «Метрология и взаимозаменяемость»

Голубцов Пётр Викторович,

доктор физико-математических наук, доцент, федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный университет имени М.В. Ломоносова», профессор кафедры математики физического факультета

Ведущая организация: федеральное государственное бюджетное

образовательное учреждение высшего профессионального образования «Российский университет дружбы народов»

Защита диссертации состоится « ^^ » ¿(Л&Щ^ 2013 г. в // часов на заседании диссертационного совета Д212.141.15 при Московском государственном техническом университете имени Н.Э. Баумана по адресу: Москва, Рубцовская наб., 2/18, ауд. 1006 л.

С диссертацией можно ознакомиться в библиотеке Московского государственного технического университета имени Н.Э. Баумана.

Автореферат разослан« * » ил&Я^ 2013 г.

Учёный секретарь диссертационного совета, кандидат технических наук, доцент

А.В. Атгетков

Общая характеристика работы

Актуальность темы. Теоретико-вероятностные методы широко применяются при моделировании многих аспектов случайности, неточности и нечёткости, которые свойственны сложным физическим, техническим, экономическим, социальным и медицинским объектам. Такие объекты часто характеризуются изменчивостью во времени, неформализованным и, в ряде случаев, субъективным характером их описания. В то же время, вероятностные методы на практике оказываются недостаточно эффективными при математическом моделировании такого рода объектов.

Причины неэффективности вероятностных методов обусловлены многими факторами. Вероятностные методы в своей основе используют предположения о стохастической природе объектов и существовании вероятностной модели изучаемых явлений. Если моделируемый объект не является стохастическим, то вероятностной модели не существует. Тогда неточность и нечёткость, свойственные объектам, нельзя охарактеризовать в вероятностных терминах. Однако судить о стохастичности объекта не всегда просто вследствие отсутствия критерия вероятностной природы объектов в теории вероятностей.

При эмпирическом построении вероятностной модели сложного, но заведомо стохастического объекта, также возникают трудности принципиального характера: если в процессе получения данных объект эволюционирует, его вероятностные характеристики непредсказуемо изменяются, а их оценки оказываются неадекватными. В этом случае эмпирическое построение вероятностной модели стохастического объекта невозможно, поскольку данные наблюдений не позволяют оценить эволюцию его вероятностных свойств. Если же вероятностные характеристики стохастического объекта неизменны, эмпирическое построение его вероятностной модели с необходимой точностью может оказаться нереализуемым вследствие достаточно большого объема необходимых данных наблюдений.

Ввиду неэффективности вероятностных методов при математическом моделировании сложных медицинских объектов, для создания автоматизированных систем их диагностирования естественно обратиться к невероятностным моделям случайности, нечёткости и неопределённости. В теории возможностей (Ю.П. Пытьев; 2007) показано, что в то время как вероятностную модель стохастического объекта, непредсказуемо эволюционирующего во времени, эмпирически построить невозможно, его возможностная модель при достаточно слабых ограничениях на характер эволюции вероятностной модели может быть восстановлена, причём точно и на основании конечного числа наблюдений. Если к этому добавить, что возможностная модель и не стохастического объекта может быть построена эмпирически на основе заключений экспертов, то предпочтительность возможностного моделирования постановки диагноза, при котором используются как «чёткие», так и неформализованные данные, становится очевидной.

Для решения проблем медицинской диагностики заболеваний с 60-х годов прошлого века применяются методы вычислительной математики. Задача медицинской диагностики рассматривается как задача идентификации, в которой требуется принять решение о принадлежности медицинского объекта, в данном случае - субъекта (пациента), к одному из М заданных классов заболеваний, либо о том, что данный субъект не относится ни к одному из выделенных классов. В диссертации употребляются также термины «классификация» и «распознавание», понимаемые как «идентификация», то есть отнесение субъекта к одному из заранее определённых классов, причём «отсутствие выделенных заболеваний» рассматривается как отдельный класс. Признаками, характеризующими субъект, являются симптомы заболевания, обнаруженные в результате обследования и опроса пациента; каждый симптом может принимать как количественные, так и качественные значения. В диссертации рассмотрены два этапа решения задачи идентификации: обучения и постановки предварительного диагноза. Процесс обучения состоит в определении характерных значений признаков (симптомов) заболевания в каждом из М классов по обучающей выборке объектов. Класс «норма», как правило, характеризуется значениями признаков заболеваний, находящимися «в пределах нормы». На основании результатов обучения проводится идентификация - отнесение диагностируемого пациента к одному из М классов, либо к классу «отсутствие выделенных заболеваний», если у данного пациента не наблюдается характерных симптомов изучаемых классов. При этом он может страдать заболеваниями, диагностика которых выходит за рамки основной цели проведённого исследования.

Цель проведённых исследований - разработка, исследование и применение вероятностных и возможностных методов математического моделирования процессов постановки медицинского диагноза, разработка алгоритмов и программ обучения и распознавания в условиях нечёткого описания медицинских объектов, изменчивости во времени их вероятностных характеристик и ограниченного размера обучающих выборок, создание возможностной медицинской диагностической системы - её математических основ и компьютерной реализации.

Методы исследования. При решении задач, возникших в ходе выполнения диссертационной работы, использовались вероятностные и возможностные методы идентификации, методы эмпирического построения возможностных моделей стохастических объектов, а также статистическая теория оценивания и проверки гипотез.

Достоверность и обоснованность научных результатов и выводов гарантируется строгостью используемого математического аппарата и подтверждается сравнением результатов, полученных с использованием различных методов, вычислительных экспериментов и врачебных заключений. Сформулированные в работе допущения обоснованы как путём их содержательного анализа, так и методами математического моделирования, а разработанные методы идентификации заболеваний обладают математически обоснованными критериями оптимальности решающих процедур.

Научная новизна. В диссертации получены следующие новые научные результаты, выносимые на защиту:

1. Разработаны и исследованы: вероятностная модель диагностики заболеваний; новый вариант алгоритма диагностики заболеваний типа «Кора», включающий процесс обучения системы компьютерной диагностики и процесс распознавания - постановку предварительного диагноза пациенту на основании решающего правила, минимизирующего математическое ожидание вероятности потерь, сопутствующих ошибочной классификации; программное обеспечение для реализации данного алгоритма.

2. Разработаны и исследованы: возможностная модель медицинского объекта; метод эмпирического построения возможностной модели медицинского объекта, основанный на гранулировании пространства значений признаков заболеваний, позволяющий определять характерные симптомы заболеваний; алгоритм, осуществляющий эмпирическое построение гранулированного пространства с возможностью; программное обеспечение для эмпирического восстановления возможностной модели медицинского объекта.

3. Разработаны и исследованы: возможностная модель диагностики, в которой решающее правило минимизирует возможность потерь при постановке диагноза; возможностный алгоритм «Кора», определяющий на этапе обучения нечёткие представительные наборы каждого заболевания и осуществляющий классификацию заболеваний при нечётком описании симптомов и изменчивости их вероятностных характеристик; программный комплекс диагностики заболеваний, включающий компьютерную реализацию вероятностного и возможностного алгоритмов «Кора».

4. Разработаны: возможностный метод оценивания эффективности лечения пациентов определённым препаратом; алгоритм сравнения возможностей различных изменений уровней биохимических показателей крови пациентов, больных хроническим панкреатитом, позволяющий сделать вывод об эффективности их лечения данным препаратом. Проведён сравнительный анализ вероятностного и возможностного алгоритмов классификации заболеваний, показывающий преимущества возможностного моделирования медицинских объектов и процесса компьютерной постановки медицинского диагноза.

Практическая значимость диссертационной работы связана с её прикладной ориентацией, а полученные результаты могут быть использованы при математическом моделировании процессов постановки медицинского диагноза. Предложенные в диссертации алгоритмы поиска характерных признаков классов заболеваний, предварительной постановки диагноза, и разработанный на их основе программный комплекс позволяют решать следующие задачи медицинской диагностики: нахождения отличительных особенностей функциональных нарушений желудочно-кишечного тракта (ЖКТ) и трёх форм острого аппендицита (ОА), формализации и анализа симптомов заболевания «синдром раздражённого кишечника» (СРК),

исследования влияния пищевых добавок на состояние больных хроническим панкреатитом (ХП).

Апробация работы. Основные результаты диссертационной работы неоднократно докладывались на научных семинарах кафедр компьютерных методов физики и математики физического факультета МГУ им. М.В. Ломоносова, научном семинаре «Молекулярное моделирование и разработка биологически активных соединений» НИВЦ МГУ им. М.В. Ломоносова, а также на международной конференции «Ломоносов - 2003» (Москва, 2003), ХШ-й Всероссийской конференции «Математические методы распознавания образов» (Москва, 2007), Международной научно-практической конференции «Румянцевские чтения. Экономика, государство, общество в XXI веке» (Москва, 2009).

Публикации. Основные научные результаты диссертации отражены в 8 научных работах, в том числе в 5 статьях из Перечня ведущих рецензируемых научных журналов и изданий ВАК РФ.

Личный вклад соискателя. Все исследования, результаты, которые изложены в диссертационной работе, проведены лично соискателем в процессе научной деятельности. Из совместных публикаций в диссертацию включен лишь тот материал, который непосредственно принадлежит соискателю; заимствованный материал обозначен в работе ссылками.

Структура и объём работы. Диссертация состоит из введения, 4 глав, заключения и списка литературы. Диссертационная работа изложена на 150 страницах, содержит 34 иллюстрации. Библиография включает 106 наименований.

Содержание работы

Во введении обоснована актуальность темы, сформулированы цель и задачи исследования, научная новизна, теоретическая и практическая значимость полученных результатов, их достоверность, основные положения, выносимые на защиту, а также приведены данные о структуре и объёме диссертационной работы.

В первой главе представлен аналитический обзор современных математических методов компьютерной диагностики: дискриминантного анализа, вероятностных, алгебраических, поиска логических закономерностей и нечётких моделей медицинских экспертных систем. Отмечены особенности этих методов, показано, что в большинстве из рассмотренных моделей диагностики достижение наилучшего результата на этапе обучения осуществляется за счёт такого выбора эмпирических параметров, который обеспечивает наименьшее число ошибок диагностики на репрезентативной выборке. Изменение эмпирических параметров позволяет усовершенствовать данный алгоритм, но вывод об оптимальности выбора самого алгоритма достаточно проблематичен. В вероятностной модели распознавания при существовании вероятностной модели объектов оптимальным является байесовский алгоритм распознавания, минимизирующий ожидаемую

вероятность потерь, вызванных неблагоприятными для здоровья пациента последствиями постановки ему ошибочного диагноза.

Во второй главе предложена и исследована теоретико-вероятностная модель медицинской диагностики.

В разделе 2.1 сформулировано правило постановки медицинского диагноза, минимизирующее математическое ожидание вероятности потерь. Согласно предположению о стохастической природе объектов, каждый из них характеризуется и-мерным случайным вектором признаков х = (z'>Z2>--->z")T > принимающим значения х g X, где

х = (х\х2,...,х")Г, (1)

xJ eXJ — значение /-ого признака (симптома), и- число признаков, Х = Х1хХ2х...хХ".

Решение о принадлежности пациента / = х, х е X, к классу к принимается при хеХк, где Х],Х2,...,ХМ - некоторое упорядоченное разбиение множества

значений признаков: X = |JXy,A'; Ç\Xt =0, i ф j; i, j = 1 ,...,M. Показано, что

j-1

минимум потерь достигается на любом упорядоченном разбиении X', удовлетворяющем условию Xj с jx е Х,5Дх) = min(х)J, j = 1,...,М, где

M M

- математическое ожидание вероятности потерь при отнесении пациента х к j-му классу, pr(x \ к) - переходная вероятность вектора признаков х в классе к, рг(к) - априорные вероятности заболеваний, к = 1,...,М, h,, - задаваемая врачом вероятность потерь, сопутствующих постановке диагноза j пациенту, страдающему заболеванием к, в отличие от используемой ранее в теории статистических решений величины потерь.

Для оценки переходных вероятностей pr(x \ к) и решения задачи классификации заболеваний в рамках вероятностной модели, разработан вероятностный алгоритм классификации типа «Кора», рассмотренный в разделе 2.2. Существует несколько разновидностей данного алгоритма. На этапе обучения алгебраического алгоритма «Кора» (Ю.И. Журавлёв, 2002) происходит построение информативных фрагментов обучающих объектов каждого класса - характерных сочетаний значений признаков, называемых представительными наборами класса. Варьируя эмпирические параметры, которые вводятся на этапах обучения и распознавания алгебраического алгоритма, можно добиваться разных результатов диагностики, однако решение многомерной задачи оптимизации в этом случае представляет значительные трудности.

В вероятностном алгоритме на этапе обучения по обучающей выборке находятся все представительные наборы, порождённые всеми объектами всех

классов. Для принятия решения о диагнозе требуется не полное описание объекта х вектором значений признаков (1), а только его представительные наборы D*,qe {[,...,Qk},к е{1,...,М}. Приведены оценки Хёфдинга ошибок приближения вероятностей ргф\ | /), ' е {!,..., М} представительных наборов их частотами как для неизменных, так и для меняющихся вероятностных характеристик объектов. На этапе распознавания осуществляется постановка диагноза согласно следующему решающему правилу:

Дан объект х = (х1, х2,... , x" J , который следует отнести к одному из M классов. Пусть Dkqt - представительный набор объекта х, имеющий минимальное математическое ожидание вероятности потерь среди всех представительных наборов класса к'.

Sk{Dli)=mmSSDkq),q = l,...,Qk,Sk{Dkq) = YJlikpr{Dl \i)pr(i).

Тогда, согласно оптимальному решающему правилу, объект х относится к классу к*, в котором математическое ожидание вероятности потерь

Sk- (Dkq _ ) минимально:

В разделе 2.3 показаны основные отличия вероятностного алгоритма «Кора» от используемых ранее алгоритмов — это уменьшение числа входных параметров при обучении и применение аналога оптимального решающего правила, минимизирующего ожидаемое число ошибочных диагнозов при классификации.

Применение вероятностного алгоритма «Кора» к результатам тестирования больных на основании данных расширенных опросников ГУ НИИ Питания РАМН, содержащих около 400 вопросов по гастроэнтерологии и психосоматике, привело к созданию более информативного нового теста оценки самочувствия больного (TOC). Далее в качестве исходных данных алгоритма «Кора» использовались ответы на вопросы TOC и были получены значения признаков, характерные для функциональных нарушений, а также подтверждено предположение врачей о том, что психосоматические изменения являются важной составной частью функциональных нарушений ЖКТ. В результате компьютерного моделирования вероятностного алгоритма «Кора»: получена общая картина симптомов функционального нарушения СРК без детального описания симптомов различных классов СРК; осуществлена диагностика острого аппендицита (ОА), позволившая выявить больных ОА без уточнения формы ОА.

В третьей главе предложена и исследована теоретико-возможностная модель медицинского объекта. В разделе 3.1 кратко изложены элементы теории возможностей (Ю.П. Пытьев; 2007). В основе теории возможностей лежит конструкция линейного счётно-аддитивного интеграла р(-): L(X)—*£, определённого на классе ЦХ) функций/(■): и принимающего значения в

шкале £=([0,1], <, +, •) - отрезке [0,1] с естественной упорядоченностью, определённой неравенством < и операциями сложения +, определённой как max, и умножения •, определённой как min. Такие определения операций даются вследствие того, что численные значения возможности, отличные от нуля и единицы, не могут быть содержательно истолкованы, - существенна только упорядоченность возможностей. Поэтому рассматривается класс Г непрерывных, строго монотонных преобразований /(•): [0,1 ]—>[0,1 ], у(0)=0, у(\) = 1, не меняющих упорядоченность возможностей, и определяющих группу Г автоморфизмов у \£—*£ шкалы £ значений возможности, согласно которым, V/(-) е Г /[0,1] = [ОД], Va,be [0,1]

y(a + b) = y(a) + y(b), y{a x b) = y(a) x y(b), a<b<^> y(a) < y(b) и, в то же время, группу Г изоморфизмов у: £—> у£, согласно которым, \//(-)еГ а —> у (а), где ае£, у(а) еу L. В шкале у £ определены операции сложения, умножения и отношения: \/а,Ье£

a + b-> у {а+Ь) = у(а) + y(b), axb y(axb) = у(а) х y(b), а < b <=> у(а) < у(Ь). Тогда определения операций сложения + как max и умножения • как min следуют из требований непрерывности и коммутативности операций + и •, и свойств элементов 0 и 1 шкалы £: 0*а = 0, l'a = а, 0+а — a, l+a = 1.

Поскольку Г - группа изоморфизмов, то в теории возможностей действует принцип относительности, согласно которому каждый исследователь при построении возможностной модели использует свою шкалу £, совпадающую со шкалой любого другого исследователя с точностью до преобразования £—* у £, у е. Г. При построении возможностной модели можно использовать различные шкалы в зависимости от специфики эксперимента. Информативными являются только такие заключения, которые не меняются при изменении шкал. Не имеет смысла говорить о равенстве возможности какого-либо события конкретному числовому значению, кроме 0 и 1. Можно лишь сравнивать значения возможностей событий, говорить об их равенстве и упорядоченности, причём эти утверждения остаются одинаковыми в любой шкале и имеют один и тот же смысл для всех исследователей.

В разделе 3.2 рассмотрена теоретико-возможностная модель симптомов заболеваний. При эмпирическом построении вероятностной модели стохастического медицинского объекта возникают принципиальные трудности, поскольку вероятностные характеристики симптомов пациентов непредсказуемо меняются, а их оценки оказываются неадекватными. По аналогии с вероятностным моделированием, г-ый объект (пациент)

Обозначим рг1=рг(х1) и р,=р{*,) значения вероятности и, соответственно, возможности равенства х, =х, для г-го объекта, / = 1,, у = !,...,«.

характеризуется и-мерным нечетким вектором признаков принимающим значения х,. е X,

(2)

Упорядочив вероятности векторов значений симптомов х,,х2,... в модели (Х,<Р(Х), Рг):

рг, >рг2 >...>0, рг,+рг2+... = 1, (3)

определим их возможностную модель (X, СР(Х), .Р), в которой возможности векторов значений симптомов удовлетворяют условию

1 = А >р2>...>0. (4)

Конкретная упорядоченность в (4), содержащая в определённых местах строгие неравенства, а в остальных — равенства, определяет единственную (с точностью до эквивалентности) возможностную модель, в которой

Рп=Рп+,,если ргп <(1 -рг, -рг2 ~...-ргп_х)12, (5)

Рп > Рп+1, если рг„ > (1 - рг, -рг2 -.,.- ргпЛ)!2. (6)

При выполнении условий (5), (6) возможность является максимально согласованной с вероятностью (Ю.П. Пытьев; 2007) и число строгих неравенств в (4) максимально. Векторы симптомов х„ и хп+| различаются по значимости, если р„ > р„+, (6), однако на практике разности вероятностей векторов значений признаков оказываются малыми и выполняется условие (5), следовательно, различие вероятностей не приводит в данном случае к различию возможностей.

С целью того, чтобы стохастические детали стали различимыми для возможности, проведено гранулирование пространства X: векторы значений признаков хь Хг, хз, ..., удовлетворяющие условию (3), объединены в непересекающиеся гранулы и>,г, -и>2, ... так, чтобы возможности этих гранул были строго упорядочены: р] > р\ > ... , р] = р(^). Условие строгой упрядоченности возможностей гранул , , ... названо в диссертации условием максимальной разделённости — (>»). При выполнении условия (»>) значения признаков, объединённые в одну гранулу (имеющие одинаковую возможность), неразличимы с точки зрения их значимости при данном заболевании, - в пределах каждой гранулы вероятности отдельных векторов х, входящих в неё, могут меняться во времени. Соответственно, значения признаков принципиально «различны», если принадлежат гранулам, имеющим разные возможности. При гранулировании осуществляется преобразование пространства с возможностью (Х,<Р(Х),Р), элементарными событиями которого являются векторы значений признаков, в пространство с возможностью \ХТ,<Р(ХТ),РТ) с элементарными событиями - гранулами , / = 1,2,..., представляющими собой наборы значений признаков, возможности которых в пространстве (ХГ,<Р(ХГ),РГ) удовлетворяют условию максимальной разделённости (»>). Доказана теорема, определяющая свойства гранулированного пространства с возможностью (хт,<Р(ХТ),РТ) и способ построения максимально разделённых гранул.

Теорема. Пусть (Х,(Р(Х),Рг) - дискретное вероятностное пространство, X = {х,,х2,...}, (Р(Х) - а- алгебра всех подмножеств X, причем вероятности prf элементарных событий х(, г' = 1, 2,... удовлетворяют условиям Рг\ >РГ2>prt+pr2+... = l, (Х,<Р(Х),Р) - максимально согласованное с (Х,(Р(Х),Рг) возможностное пространство, являющееся максимально разделённым (>»). Пусть I = {/,,/2,...} - разбиение множества натуральных

со

чисел N: /, п = 0 при (J/„ = min k > min k для любых j>i,

i, j = 1, 2,____ Рассмотрим соответствующее разбиению I вероятностное

пространство (хГ,<Р(ХГ),Ргг), где ХТ = {iv,r, ...}, wf = (Jxt. Тогда

keif

вероятности pr,T = Pr(wf) = ^prk, /' = 1,2,... удовлетворяют условию

kel,

упорядоченности: prf > pr2 >..., а максимально согласованное с (xT,(P(XT),VrT) возможностное пространство (ХГ,<Р(ХГ),РГ) снова (>»).

Разработаны алгоритмы поиска гранул значений признаков заболевания, удовлетворяющих условию (>»), и программное обеспечение для эмпирического восстановления возможностной модели симптомов заболеваний. Показано, что для повышения информативности диагностики заболевания, помимо условия (»>), на гранулы целесообразно наложить следующие условия: число элементарных событий пространства X, содержащихся в каждой из них, должно быть минимальным; вероятности prj, prl,... также должны быть минимальными, pr{ = pr(wj). При выполнении данных требований число упорядоченных по значимости гранул будет максимальным.

Программная реализация алгоритма гранулирования пространства значений признаков заболевания включает интерфейс, демонстрирующий в диалоговом режиме поиск наборов значений признаков (симптомов), упорядоченных по значениям их возможностей при данном заболевании. Наиболее значимыми для данного заболевания являются гранулы значений признаков wf, имеющие максимальную возможность p(wf) = 1. Результатом применения данного алгоритма в двух классах функционального заболевания СРК явилось создание детализированной картины симптомов данного заболевания. Варианты гранулирования в первом и втором классах СРК приведены на рис. 1 и рис. 2 соответственно. В каждом классе представлено по две гранулы wf и с возможностями р] и р[: 1 = р\ > р\. В каждой грануле по горизонтали - признаки (симптомы) объектов, по вертикали - их значения. Затемнённые участки соответствуют значениям признаков объектов, входящих в данную гранулу.

Рис. 2. Вариант гранулирования во втором классе СРК

В четвёртой главе предложена и исследована теоретико-возможностная модель медицинской диагностики. Раздел 4.1 посвящён возможностному моделированию процесса постановки медицинского диагноза. В возможностной модели медицинской диагностики оптимальным является такое правило постановки диагноза, которое минимизирует возможность сопутствующих ему потерь.

Пусть се - нечёткий элемент, значениями которого являются номера классов (заболеваний) ке{1,...,М]. Распределение характеризует

нечёткую связь между зарегистрированными у пациента симптомами заболевания и реальным его состоянием (диагнозом) и определяет возможностную модель состояния больного. ср/-а!{_х,к) - возможность равенств Х = х, се = к, х е X, ке {\,...,М). 1ы е [0,1] - задаваемая врачом возможность потерь при отнесении объекта класса к к классу d, d = 1 ,...,М Нечёткий элемент <5, принимающий значения на множестве {1 ,...,М}, - решение о состоянии больного (рекомендуемый диагноз). Распределение переходных возможностей - нечёткое правило постановки диагноза д, основанное на наблюдаемом у больного наборе симптомов х; ^(d | х) - переходная возможность постановки диагноза д = d, когда х =х - наблюдающиеся у больного симптомы.

Возможность потерь, определяющая качество правила ns]x постановки диагноза, определена как

РЦл-^)= sup min (lkd,n5b(d\x),к)), (7)

Оптимальным является такое правило л постановки диагноза, которое минимизирует возможность потерь (7). Задача минимизации возможности потерь (7) сводится к следующей задаче на минимум для каждого вектора значений признаков х е X:

шах тт(я,'5|)1(с/1 x),Pd(x)) ~ min , (8)

1 <diU я'1'»*)

где

р"(х) = 2Й5min(/t"' ' (9)

- возможность потерь, сопутствующих решению о постановке диагноза S = d больному при наличии у него симптомов зс = х> хеХ> de{l,...,M}. При этом оптимальное правило л'6]х постановки диагноза предписывает при наличии у больного симптомов х = х ставить диагноз S = d, возможность которого тем больше, чем меньше возможность потерь, обусловленных таким решением. Таким образом, для построения оптимального правила постановки диагноза d по обучающей выборке методом гранулирования следует восстановить распределение переходных возможностей к= 1,...,М на основании

построенной в разделе 3.2. возможностной модели симптомов заболеваний.

По аналогии с вероятностным, в разделе 4.2 предложен возможностный алгоритм классификации типа «Кора». Нечёткие представительные наборы класса определены как гранулы значений признаков, имеющие в данном классе единичную возможность, а в остальных классах — меньшие возможности. В возможностном алгоритме на этапе обучения по обучающей выборке находятся все нечёткие представительные наборы классов.

Для классификации объекта х требуется не всё его описание, а только нечёткие представительные наборы, которыми он обладает. Поэтому в качестве ^!iE(x|к) в (9) используется значение переходной возможностиp(ws представительного набора ws объекта х при условии принадлежности его к классу к. Сформулировано правило принятия решения в возможностном алгоритме «Кора»:

Дан объект х = (х\х2 ,...,x"J, который следует отнести к одному из М классов. Пусть w, - нечёткий представительный набор объекта х, имеющий минимальную возможность потерь на множестве всех представительных наборов класса к:

Рк О*) = шах min(Ij к, p(ws | d)).

15а<М

Тогда объект х относится к классу d*, в котором возможность потерь при постановке диагноза d*, минимальна:

Pd. К.) = min Pd (wSj), d = 1 ,...,M.

При этом согласно (8), оптимальное правило ж'^ постановки диагноза предписывает при наличии у больного симптомов х = * ставить диагноз ö = d',

возможность которого тем больше, чем меньше возможность потерь, обусловленных таким решением.

Проведён сравнительный анализ результатов вероятностного и возможностного моделирования процесса постановки медицинского диагноза, а также вероятностного и возможностного алгоритмов типа «Кора». Если вероятностные характеристики стохастического медицинского объекта непредсказуемо меняются во времени, то его вероятностную модель эмпирически построить невозможно при любом объёме обучающих выборок. Основное преимущество возможностного моделирования заключается в том, что возможностная модель такого объекта может быть восстановлена точно на основании конечного числа наблюдений, если при изменчивости вероятностей векторов значений признаков выполняется условие (6), которое является достаточно слабым ограничением на характер эволюции вероятностной модели. Для практического построения возможностной модели симптомов важна эмпирическая интерпретация возможности, согласно которой при достаточно большом объёме обучающих выборок упорядоченность возможностей векторов симптомов из X (или любых подмножеств X) почти наверно точно прогнозирует такую же упорядоченность частот. Фактически, чем выше значимость (возможность) симптомов при определённом заболевании, тем чаще при этом заболевании наблюдаются такие симптомы. Алгоритм постановки диагноза при возможностном моделировании оценивает последствия разных вариантов ошибочного диагноза. Эти ошибки могут иметь различные последствия для больного: одни при отнесении здорового человека к классу «патология» и совсем иные при отнесении пациента с серьёзным заболеванием к классу «норма». Руководствуясь результатами проведённых медицинских исследований и компьютерной диагностики, врач ставит пациенту окончательный диагноз и назначает лечение.

В разделе 4.3 представлены результаты работы программного комплекса диагностики заболеваний, включающего компьютерную реализацию вероятностного и возможностного алгоритмов «Кора», а также позволяющего проводить процедуру гранулирования и постановки диагноза в диалоговом режиме с участием врача. В результате практического применения вероятностного алгоритма «Кора»:

1. Получена общая картина симптомов функционального нарушения «синдром раздражённого кишечника» (СРК) без детального описания симптомов различных классов СРК.

2. Разработан новый тест оценки самочувствия больного (ТОС), содержащий вопросы о гастроэнтерологических и психоэмоциональных особенностях пациентов, страдающих функциональными нарушениями.

3. В задаче диагностики острого аппендицита (ОА) классификация больных на классы «ОА» (с точностью 91%) и «неподтверждённый диагноз (НД)» (с точностью 97%) осуществляется только при определённых значениях входных параметров. Следует отметить, что даже при выборе оптимальных параметров наблюдаются случаи ошибочного отнесения больных ОА к классу

НД. Выделить существенные свойства различных форм ОА и провести их классификацию с помощью вероятностного алгоритма «Кора» не представляется возможным ни при каких значениях эмпирических параметров.

В результате применения алгоритмов гранулирования и возможностного алгоритма «Кора»:

1. Получена детальная картина симптомов двух классов СРК, выявлены особенности СРК, неразличимые в рамках вероятностной модели.

2. На этапе обучения получены нечёткие представительные наборы 3-х классов О А и класса «НД».

3. На этапе диагностики пациенты с симптомами ОА разделены на два класса ОА и класс «НД» с точностью диагностики 85% в первом классе ОА, 89% - в объединённом втором классе ОА и 86% - в классе «НД» без использования эмпирических параметров. Ни один больной ОА не отнесён к классу «НД».

4. Исследовано влияние размера и структуры обучающей выборки на результаты обучения и диагностики, что позволило установить улучшение качества диагностики при включении в обучающую выборку «нетипичных» представителей классов. Выполнен скользящий контроль вероятностного и возможностного алгоритмов «Кора», свидетельствующий об устойчивости процедур обучения и диагностики.

На рис. 3 приведены результаты классификации одного из объектов 3-го класса «катаральный аппендицит» экзаменационной выборки вероятностным (а) и возможностным (б) алгоритмами «Кора». На рис. 3,а чёрным отмечены значения признаков, входящие в представительный набор, по которому принято решение о диагнозе. На рис. 3,6 все выделенные значения признаков составляют гранулу максимальной возможности третьего класса. Серым отмечены значения признаков объекта, чёрным - остальные значения признаков, входящие в гранулу.

а б

Классификация:

С ; '.-.¿■Л' *|

КЮ№ з с т :

ьпел.) »>:т£*-чЛгт«х г н тлпч .> «гго н«**«. С

Результаты классифло^-м

К«сс:

! 1 .......

| с 1 £

Ц я

1 Объект к к.пзс£уМ? 3

Рис. 3. Ошибочная классификация объекта 3-го класса вероятностным алгоритмом «Кора» (а) и безошибочная - возможностным (б)

Раздел 4.4 посвящен возможностному методу анализа эффективности лечения заболеваний. Задача возникла в медицинской практике в связи с необходимостью компьютерной оценки величины влияния лечения пациента определённым препаратом на его состояние. Для определения значимости эффекта от лечения в данной статистической совокупности объектов (пациентов) предложена возможностная интерпретация результатов проверки статистических гипотез о наличии изменений биохимических показателей крови после лечения данным препаратом.

Рассматриваются независимые случайные величины г, = - со,-, /=1 ,...,п, где 0)1, XI ~ уровни некоторого биохимического показателя г-го пациента до и после применения лечебного препарата соответственно, г,- = б + <з,, /=1 ,...,п, где е\,ег,...,еп — независимые случайные величины, имеющие распределение N(0, сг2), в — неизвестная константа, характеризующая величину влияния препарата. Проверяется гипотеза Но: в = во при альтернативе Н1 : в Ф во. На основании леммы Неймана-Пирсона построена наиболее мощная несмещённая область принятия гипотезы Но против альтернативы Н1. и доверительное множество параметра во уровня доверия рге [0,1]. Показано, что вариант распределения возможностей параметра в можно определить равенством

Р{вл\~2) = \-Ы{рг\рге{0,Х\, г»-1 (рг )

\ = рг ; р[{) - плотность распределения Стьюдента с п-1 степенью

-г*-1 (рг )

свободы, ¿„обл.= 2 л2 - выборочная дисперсия. Тогда Р(О0 \г) - значение Б/ып

возможности равенства параметра распределения значению вй при наблюдении г,, ..., гп.

В работе оцениваются возможности тех значений параметра в, которые представляют интерес для врачей. Численные значения возможностей гипотез не имеют смысла — важна лишь их упорядоченность. Вывод о степени влияния лечения делается на основании значения параметра во максимальной возможности: в данной группе больных с максимальной возможностью произошло изменение изучаемого биохимического показателя на во.

В результате вычислительного эксперимента установлена упорядоченность возможностей гипотез об изменениях уровней биохимических показателей анализа крови пациентов, страдающих хроническим панкреатитом, после лечения. В качестве примера на рис. 4,а представлены значения возможности (по вертикали) гипотез об изменении уровня холестерина и билирубина в группе пациентов, не принимавших назначенный гастроэнтерологом препарат, а на рис. 4,6 - принимавших данный препарат. Значения параметра в (по горизонтали) выражены в

2-в„

5/-УЙ

-I'—.1

<т^(рг)} = 2 \рШ,

где

г—X2"

п м

процентах от середины диапазона нормы биохимического показателя. На основании полученных результатов сделан вывод об эффективности лечения данным препаратом.

а б

Рис. 4. Сравнение возможностей (по вертикали) гипотез об изменении уровня холестерина и билирубина в группе пациентов, не принимавших назначенный гастроэнтерологом препарат - (а) и принимавших данный препарат - (б)

Основные результаты диссертационной работы

1. Разработаны и исследованы: вероятностная модель диагностики заболеваний; вероятностный алгоритм диагностики заболеваний типа «Кора», включающий алгоритм обучения системы компьютерной диагностики и алгоритм классификации - постановку предварительного диагноза пациенту на основании решающего правила, минимизирующего математическое ожидание вероятности потерь при постановке диагноза; программное обеспечение для реализации данного алгоритма.

2. Разработаны: возможностная модель медицинского объекта; метод эмпирического построения возможностной модели медицинского объекта, основанный на гранулировании пространства значений признаков заболеваний, позволяющий определять характерные симптомы заболеваний; алгоритм, осуществляющий эмпирическое построение гранулированного пространства с возможностью; программное обеспечение для реализации данного алгоритма.

процедуру гранулирования и постановки диагноза в диалоговом режиме с участием врача.

4. Предложен возможностный метод оценки эффективности лечения пациентов определённым препаратом. Разработан алгоритм сравнения возможностей различных изменений уровней биохимических показателей крови пациентов, больных хроническим панкреатитом, позволяющий сделать вывод об эффективности их лечения данным препаратом. Проведён сравнительный анализ вероятностной и возможностной моделей медицинской диагностики, показывающий преимущества возможностного моделирования медицинских объектов и процесса постановки медицинского диагноза.

Основные результаты диссертации отражены в научных работах

1. О задаче компьютерной диагностики заболеваний желудочно-кишечного тракта / В.А. Газарян [и др.] II Вестник Моск. ун-та. Сер. 3. Физика. Астрономия. 2003. № 2. С. 12-15.

2. О теоретико-возможностной симптоматике заболеваний / В.А. Газарян [и др.] // Вестник Моск. ун-та. Сер. 3. Физика. Астрономия. 2005. № 4. С. 3-6.

3. Теоретико-возможностная модель компьютерной диагностики заболеваний / В.А. Газарян [и др.] // Вестник Моск. ун-та. Сер. 3. Физ. Астрон. 2006. № 6. С. 15-18.

4. О теоретико-возможностных методах решения задач медицинской диагностики / В.А. Газарян [и др.] // Интеллектуальные системы. 2008. Т. 12. Вып. 1-4. С. 65-82.

5. О теоретико-возможностных методах анализа эффективности лечения / В.А. Газарян [и др.] // Интеллектуальные системы. 2010. Т. 14. Вып. 1-4. С. 107-122.

6. Об одной теоретико-возможностной модели распознавания / В.А. Газарян [и др.] // Ломоносов - 2003: труды Международной научной конференции. М., 2003. С. 64-66.

7. О теоретико-возможностном методе медицинской диагностики / В.А. Газарян [и др.] // Математические методы распознавания образов: труды 13-й Всероссийской конференции. Зеленогорск, 2007. С. 25.

8. О теоретико-возможностных методах обучения и распознавания в задачах медицинской диагностики / В.А. Газарян [и др.] II Румянцевские чтения. Экономика, государство, общество в XXI веке: труды Международной научно-практической конференции. М., 2009. С. 57-63.

Подписано к печати 29.04-АЗ Тнртж АОр Зжпз ЗД

Отпечатано в отделе оперативной печати фкзнческога фпкулзэтета МГУ

Текст работы Газарян, Варвара Арамовна, диссертация по теме Математическое моделирование, численные методы и комплексы программ

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный университет имени М.В. Ломоносова»

На правах рукописи

04201357982

ГАЗАРЯН Варвара Арамовна

ЭМПИРИЧЕСКОЕ ВОССТАНОВЛЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ МЕДИЦИНСКОЙ ДИАГНОСТИКИ

Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ

Диссертация на соискание учёной степени кандидата физико-математических наук

Научный руководитель: доктор физико-математических наук, профессор Ю.П. Пытьев

Москва-2013

Содержание

Введение 5

Глава 1. Математические методы медицинской диагностики.

Обзор 15

1.1. Необходимость создания нового комплексного метода компьютерной оценки функциональных нарушений в системе пищеварения............................................................................15

1.2. Классификация заболеваний методом дискриминантного анализа.... 17

1.3. Логические решающие функции.................................................21

1.4. Выбор системы информативных признаков..................................24

1.5. Нечёткие модели медицинских экспертных систем.........................27

Глава 2. Теоретико-вероятностная модель медицинской

диагностики 31

2.1. Правило постановки медицинского диагноза, минимизирующее

риск потерь...............................................................................31

2.2. Алгоритм типа «Кора». Обучение. Распознавание.........................34

2.3. Отличия вероятностного алгоритма «Кора» от используемых

ранее алгоритмов........................................................................42

2.4. Использование вероятностного алгоритма «Кора» для компьютерной оценки функциональных нарушений желудочно-кишечного тракта........................................................................44

Глава 3. Теоретико-возможностная модель медицинского объекта 48

3.1. Возможность как альтернативная вероятности модель феномена случайности.............................................................................48

3.1.1. Мера возможности. Возможность нечёткого события.............. 48

3.1.2. Теоретико-возможностная модель, согласованная с

теоретико-вероятностной моделью.............................................54

3.1.3. Проблемы эмпирического построения и интерпретации вероятностной модели.............................................................57

3.2. Теоретико-возможностная модель симптомов заболеваний.............58

3.2.1. Стохастическая модель возможности при анализе

симптомов заболеваний.......................................................... 58

3.2.2. Алгоритм построения теоретико-возможностной модели. Выявление признаков заболевания, удовлетворяющих условию максимальной разделённости....................................................................63

3.2.3. Алгоритм гранулирования пространства значений

признаков заболевания...............................................................................66

3.2.4. Вычислительный эксперимент. Диагностические критерии функциональных нарушений при неформализованном характере данных. Результаты применения алгоритмов гранулирования...........71

Глава 4. Теоретико-возможностная модель медицинской

диагностики 82

4.1. Теоретико-возможностная модель постановки медицинского

диагноза. Правило постановки диагноза, минимизирующее риск потерь.......................................................................................82

4.2. Возможностный алгоритм классификации «Кора». Обучение и распознавание...........................................................................89

4.3. Диагностика заболеваний. Вычислительный эксперимент..............92

4.3.1. Диагностика острого аппендицита методом

дискриминантного анализа.......................................................92

4.3.2. Применение вероятностного алгоритма «Кора» для

диагностики острого аппендицита............................................100

4.3.3. Применение возможностного алгоритма «Кора» для диагностики острого аппендицита. Сравнительный анализ вероятностного и возможностного алгоритмов «Кора»..................107

4.3.4. Результаты работы программного комплекса

диагностики заболеваний........................................................117

4.4. Возможность в статистической теории проверки гипотез в задачах медицинской диагностики...............................................122

4.4.1. Возможность в статистической теории проверки гипотез. Параметр распределения вероятностей как нечёткий элемент..........122

4.4.2. Применение теории проверки гипотез в задачах медицинской диагностики.......................................................124

4.4.3. Результаты вычислительного эксперимента.........................128

Выводы 139

Список литературы 142

Введение

Теоретико-вероятностные методы широко применяются при моделировании многих аспектов случайности, неточности и нечёткости, которые свойственны сложным физическим, техническим, экономическим, социальным и медицинским объектам. Такие объекты часто характеризуются изменчивостью во времени, неформализованным и, в ряде случаев, субъективным характером их описания. В то же время, вероятностные методы на практике оказываются недостаточно эффективными при математическом моделировании такого рода объектов.

Причины неэффективности вероятностных методов обусловлены многими факторами. Зачастую моделируемые объекты просто не имеют хорошо определенной стохастической компоненты, в то время как вероятностные методы в самой своей основе используют предположение о стохастической природе объектов и существовании вероятностной модели изучаемых явлений. Если моделируемый объект не является стохастическим, то вероятностной модели не существует. Тогда неточность и нечёткость, свойственные объектам, нельзя охарактеризовать в вероятностных терминах. Однако судить о вероятностной или невероятностной природе объекта не всегда просто. Проблема заключается в отсутствии критерия вероятностной природы объектов в теории вероятностей.

При эмпирическом построении вероятностной модели сложного, но заведомо стохастического объекта также возникают принципиальные трудности, если в процессе получения данных объект эволюционирует, его вероятностные характеристики непредсказуемо изменяются, и их оценки оказываются неадекватными. Тогда эмпирическое построение вероятностной модели стохастического объекта невозможно, если данные наблюдений не позволяют оценить эволюцию его вероятностных свойств.

Если же стохастическая природа объекта не вызывает сомнений, а его вероятностные характеристики стационарны, эмпирическое построение его вероятностной модели с необходимой точностью может оказаться нереализуемым из-за слишком большого объема необходимых наблюдений.

Особенностью клинической практики в настоящее время является постоянная работа над повышением точности диагноза. Благодаря применению таких высокотехнологичных методик как современное ультразвуковое обследование, различные варианты компьютерной томографии и т.д., возможность получения успешных результатов значительно возросла. Однако большинство предлагаемых методик требуют вложения значительных материальных средств, некоторые процедуры небезопасны для здоровья больного. В клинической практике нередко встречаются случаи (например, различные функциональные нарушения), в которых даже самые совершенные методы обследования неэффективны.

С 60-х годов прошлого века для решения проблем медицинской диагностики заболеваний применяются методы вычислительной математики [1-3]. Как правило, в этом случае математическое моделирование диагностической процедуры связано с решением сложной проблемы распознавания образов, в которой заболевания представлены как некоторые образы, охарактеризованные совокупностями признаков, вариабельных в количественном и качественном отношении.

Задача медицинской диагностики рассматривается как задача идентификации, в которой требуется принять решение о принадлежности медицинского объекта, в данном случае - субъекта (пациента), к одному из М определённых врачами классов заболеваний (среди которых может быть и класс «норма»), либо о том, что данный субъект не относится ни к одному из выделенных классов. Далее в диссертации употребляются также термины «классификация» и «распознавание», понимаемые как «идентификация», то есть отнесение субъекта к одному из заранее

определённых классов, причём «отсутствие выделенных заболеваний» рассматривается как отдельный класс. Признаками, характеризующими субъект, являются симптомы заболевания, обнаруженные в результате обследования и опроса пациента, каждый симптом может принимать различные количественные либо качественные значения. В диссертации рассмотрены два этапа решения задачи классификации заболеваний -обучения и постановки предварительного диагноза [4, 5]. Процесс обучения состоит в определении характерных значений признаков (симптомов) заболевания в каждом классе по обучающей выборке объектов. Класс «норма», как правило, характеризуется значениями признаков заболеваний, находящимися в пределах нормы. После этого на основании результатов обучения проводится распознавание - отнесение к одному из М классов диагностируемых пациентов либо отказ от классификации в случае отсутствия характерных симптомов изучаемых классов. Пациент при этом может страдать заболеваниями, диагностика которых выходит за рамки исследования.

Особый интерес представляют функциональные расстройства, при которых часто отсутствует органическая патология, и нарушения выявляются методом исключения. Формализация таких нарушений достигается введением стандартных опросников для самооценки состояния пациента. Значениями признаков нарушений являются результаты ответов на вопросы анкеты. Функциональные расстройства не являются заболеваниями согласно медицинской терминологии. Поэтому не принято говорить о постановке диагноза пациенту, страдающему функциональными нарушениями. Разработанные в диссертации методы медицинской диагностики следует рассматривать как методы классификации. Результатом классификации является отнесение такого пациента к тому или иному классу функциональных расстройств.

При моделировании медицинских объектов исследователям приходится на практике сталкиваться с нечёткостью их описания,

вызванной изменчивостью во времени, неформализованным и во многих случаях субъективным характером симптомов заболевания. Часто имеет место неоднозначность трактовки симптомов заболевания разными специалистами, мнения врачей расходятся. Возникающие в связи с этим проблемы традиционно решаются в рамках вероятностных методов моделирования медицинских объектов. Основная идея, заложенная в этих методах, опирается на представление о том, что анализ частоты встречаемости симптомов позволяет выделить признаки, характерные для того или иного заболевания. Недостаточная эффективность вероятностных методов моделирования медицинских объектов связана прежде всего с принципиальными проблемами эмпирического построения их вероятностных моделей при изменчивости состояния пациентов, ограниченном размере обучающей выборки и нечётком описании характеристик самочувствия больного и симптомов заболевания. Ввиду неэффективности вероятностных методов при моделировании сложных медицинских объектов, для создания автоматизированных диагностических систем естественнее обратиться к невероятностным моделям случайности, нечёткости и неопределённости. В теории возможностей, разработанной в [6], показано, что в то время как вероятностную модель стохастического объекта, непредсказуемо эволюционирующего во времени, эмпирически построить невозможно, его возможностная модель при достаточно слабых ограничениях на характер эволюции вероятностной модели может быть восстановлена, причём точно и на основании почти наверное конечного числа наблюдений. Если к этому добавить, что возможностная модель и не стохастического объекта может быть построена эмпирически на основе заключений экспертов, то предпочтительность возможностного моделирования постановки диагноза, в которой используются как «чёткие» данные, полученные в результате применения современных медицинских технологий, так и неформализованные данные, отражающие субъективную самооценку, интуицию и опыт врача, становится очевидной.

Целью работы является разработка, исследование и применение вероятностных и возможностных методов математического моделирования процессов постановки медицинского диагноза, разработка алгоритмов и программ обучения и распознавания в условиях нечёткого описания медицинских объектов, изменчивости во времени их вероятностных характеристик и ограниченного размера обучающих выборок, создание возможностной медицинской диагностической системы - её математических основ и компьютерной реализации.

При решении задач, возникших в ходе выполнения диссертационной работы, использовались вероятностные и возможностные методы идентификации, методы эмпирического построения возможностных моделей стохастических объектов, а также статистическая теория оценивания и проверки гипотез.

Диссертация состоит из введения, 4 глав, заключения и списка литературы. Диссертационная работа изложена на 150 страницах, содержит 34 иллюстрации. Библиография включает 106 наименований.

Первая глава посвящена обзору традиционных компьютерных методов диагностики: дискриминантного анализа, имеющего в основе решающего правила критерий минимума расстояния [7-9], параметрических алгоритмов поиска логических закономерностей [10-15], методов поиска информативных систем признаков [16, 17], а также современных методов диагностики, использующих нечёткие выводы [18-20]. Отмечены особенности этих методов, связанные в основном с ограничениями на свойства объектов обучающей выборки, необходимостью задания эмпирических параметров в процессе обучения системы распознавания, а также отсутствием аналитических критериев качества.

Во второй главе предложена и исследована теоретико-вероятностная модель постановки диагноза в условиях не меняющихся во времени вероятностных характеристик симптомов заболеваний, включающая поиск характерных значений признаков (симптомов) заболевания в каждом классе

по обучающей выборке больных и постановку предварительного диагноза на основе решающего правила, минимизирующего математическое ожидание вероятности потерь, сопутствующих постановке диагноза. Для решения этих задач разработан новый вариант алгоритма типа «Кора» [2127].

Алгоритм впервые использован для диагностики функциональных нарушений желудочно-кишечного тракта (ЖКТ), представляющих для врачей особый интерес ввиду отсутствия диагностических критериев. Применение алгоритма «Кора» к результатам тестирования больных на основании данных расширенных опросников, содержащих около 400 вопросов, привело к созданию нового теста оценки самочувствия больного (TOC). Выделены основные признаки (симптомы) функциональных расстройств ЖКТ, а также подтверждено предположение врачей о том, что психосоматические изменения являются важной составной частью заболевания и сопутствуют функциональным нарушениям.

Показаны отличия вероятностного алгоритма «Кора», предложенного в диссертации, от используемых ранее алгоритмов. В параметрическом алгоритме и при обучении и при диагностике используются входные параметры (веса признаков, объектов и др.). Критерием качества алгоритма является функция близости объекта к представительным наборам класса, значение которой варьируется в зависимости от того, какие параметры заданы на входе системы распознавания. В вероятностном алгоритме на этапе классификации применяется аналог оптимального решающего правила, минимизирующего в среднем число ошибочных диагнозов.

В третьей главе предложена и исследована теоретико-возможностная модель медицинского объекта [28, 29]. Кратко изложены элементы теории возможностей, показана целесообразность использования возможностных методов обучения и распознавания в медицинской диагностике в силу неформализованного характера данных, изменчивости состояния пациентов и ограниченного размера обучающих выборок. Благодаря вероятностному

алгоритму «Кора» картина функциональных нарушений прояснилась лишь в общих чертах, врачам требовалось более детальное описание. Для выделения характерных признаков классов была создана возможностная модель симптомов заболеваний [30], обеспечивающая врачей обоснованными диагностическими критериями. Определение таких критериев стало возможным благодаря применению разработанных в диссертации алгоритмов гранулирования пространства значений признаков заболеваний - объединения значений признаков в непересекающиеся гранулы, упорядоченные по значениям их возможностей при данном заболевании. Полученное новое описание объектов обладает большей информативностью для возможностной диагностики заболеваний. Для каждого класса заболеваний найдены наиболее характерные симптомы -гранулы значений признаков, имеющие максимальную возможность. Выявлены осо�

Похожие работы

Информатика, вычислительная техника и управление
05.13.00