автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.09, диссертация на тему:Интерактивная методология представления данных для нейросетевого моделирования медицинских задач

кандидата технических наук
Дворчик, Игорь Семенович
город
Санкт-Петербург
год
1997
специальность ВАК РФ
05.13.09
Автореферат по информатике, вычислительной технике и управлению на тему «Интерактивная методология представления данных для нейросетевого моделирования медицинских задач»

Автореферат диссертации по теме "Интерактивная методология представления данных для нейросетевого моделирования медицинских задач"

На правах рукописи

'Зрь Семенович

ИНТЕРАКТИВНАЯ МЕТОДОЛОГИЯ ПРЕДСТАВЛЕНИЯ ДАННЫХ ДЛЯ НЕЙРОСЕТЕВОГО МОДЕЛИРОВАНИЯ МЕДИЦИНСКИХ ЗАДАЧ

Специальность: 05.13.09 -управление в биологических и медицинских системах (включая применение вычислительной техники)

Автореферат диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург - 1.997

Работа выполнена в медицинском центре Питсбургского университета, США (Pittsburgh, PA,USA) и Санкт-Петербург ском государственном электротехническом университете.

Научные руководители: доктор медицинских наук, профессор доктор технических наук, профессор

МАРШ В.

ПОПЕЧИТЕЛЕВ Е.П.

Официальные оппоненты: доктор технических наук, профессор КОВБАСА С<И.

кандидат медицинских наук, ст.н.сотр. ТЕМИРОВ A.A.

Ведущая организация - Северо-западный политехнический институт

Защита состоится " 2/" 1997 г. в /О

часов

на заседании диссертационного совета Д 063.36.09 Санкт-Петербургского государственного электротехнического университета по адресу: 197376, Санкт-Петербург, ул; проф. Попова, 5.

С диссертацией можно ознакомится в библиотеке университета.

Автореферат разослан

Ученый секретарь диссертационного совета

ЪЛ? 1997 г.

Юлдашев З.М.

^¿Що

Общая характеристика работы

Актуальность проблемы. Развитие теории и технических приложений искусственных нейросетей в последние два десятилетия привело к внедрению в медицину нейросетевого моделирования экспериментальных данных. Особенно широко в медицине и биологии используются нейросети с передачей сигнала в одном, а ошибки - в обратном направлении -"Ьаскргорада^оп" (БПИНС) . Способность БПИНС аппроксимировать любую функцию с заданной степенью точности, их устойчивость к шумам и помехам, присущим медицинским данным, отсутствие необходимости предполагать определенные распределения.анализируемых данных сделали их основой широко распространенных методов статистического моделирования сложных, нелинейных медицинских и биологических процессов. Нейросетевое моделирование экспериментальных данных позволяет повысить качество медицинского обслуживания, снизить непроизводительные затраты и найти более эффективные пути лечения. Разработанные на основе БПИНС-моделей системы, диагностирующие инфаркт миокарда, предсказывающие длительность пребывания пациентов в реанимации и другие, составляют неотъемлемую часть современного клинического процесса.

Однако, повсеместное применение БПИНС для моделирования .экспериментальных данных в медицине и биологии ограничивается относительной трудностью медицинской.интерпретации полученных моделей. Особенно существенным этот недостаток становится в таких областях медицины, в которых исследователь имеет дело скорее с клиническими гипотезами, чем с достоверными знаниями. К таким областям медицины относятся, например, трансплантология, электрофизиология, техноемкие области анестезиологии и др. В этих случаях целью моделирования является проверка разнообразных гипотез, а прогностическая эффективность модели служит критерием правильности гипотезы.

- Эти обстоятельства требуют интерактивной методологии функционирования .системы человек-компьютер, позволяющей закладывать в анализ конкретную гипотезу и оценивать ее

при помощи нейросетевой модели. Поскольку биообъект описывается набором характеристических признаков, то и клинические гипотезы или экспертные знания медицинского специалиста (о качественно однородных клинических состояниях, о симптомокомллексах и т.д.) могут быть выражены „ виде гипотезы о характерной многомерной структуры признаков. Число возможных гипотез может быть велико,' а медицинские данные характеризуются пропусками значений некоторых признаков (упущенные значения), поэтому для повышения эффективности проверки разнообразных гипотез требуется методология, позволяющая БПИНС-модели автоматически обрабатывать данные с упущенными значениями.. Так как для нормальной работы БПИНС требуется предварительное масштабирование данных, то целесообразно разработать методологию, обеспечивающую проведение масштабирования с учетом любой из возможных клинических гипотез или экспертных знаний медицинского специалиста.

Целью диссертационной работы является улучшение качества принятия■решений в лечебном процессе посредством повышения прогностической эффективности нейросетевого моделирования медицинских задач.

Для достижения этой цели в диссертационной работе решена основная задача разработки интерактивной методологии (ИМ) представления' данных для нейросетевого моделирования, позволяющей выявлять соответствие различных клинических гипотез структуре характеристических признаков и обрабатывать данные с упущенными значениями. В процессе решения основной задачи решены следующие частные задачи:

1) анализ методических возможностей нейросетевого моделирования при изучении сложных комплексов медико-биологических данных;

2) разработка методики последовательного нейросетевого моделирования, позволяющей распространить интерактивную методологию на моделирование нестационарных бинарны? клинических процессов;

3) разработка методики проверки эффективности интерактивной методологии на примере анализа математически} моделей и реальных данных;

4) разработка нейросетевых моделей времени проводимости атриовентрикулярного узла и индивидуального прогнозирования йнутричерепной гипертонии на основе ¡цоплерографи-ческого анализа;

5) разработка на основе интерактивной методологии системы индивидуального прогнозирования рецидива гепато-карциономы (ГК) после трансплантации печени.

В работе использованы методология системного анализа и искусственного интеллекта, теория синтеза биотехнических систем, теория вероятности, математическая статистика и биостатистика, методы машинного моделирования и обработки экспериментальных данных.

Научную новизну составляют:

1) интерактивная методология представления данных для нейросетевого моделирования, позволяющая оценивать соответствие многомерной структуры признаков и данных с упущенными значениями клиническим прогнозам;

2) методика последовательного нейросетевого моделирования нестационарных бинарных клинических процессов, характеризующихся ограниченным временем нестационарности и неубывающим риском прогнозируемого события;

3) методики проверки эффективности интерактивной методологии представления данных для нейросетевого анализа с помощью математических моделей и реальных данных;

ч4) модель атриовентрикулярного узла, позволяющая на основании данных о последовательности возбуждающих импульсов определять время его проводимости;

5) модель предсказания внутричерепной гипертонии у пациентов, страдающих острой печеночной недостаточностью, основанная на данных доплерографического анализа;

6) система индивидуального прогнозирования рецидива гепатокарциономы, позволяющая оценивать вероятность и время рецидива.

Практическую ценность работы составляют:

- предложенная интерактивная методология, позволившая статистически значимо повысить прогностическую эффективность нейросетевых моделей и автоматически обрабатывать данные с упущенными значениями;

- результаты проверки эффективности предложенной методологии на примере математических моделей и реальных данных;

- модель атриовентрикулярного узла для изучения времени его проводимости, что имеет большое значение при диагностике различных патологий, и модель неинвазивного предсказания внутричерепной гипертонии у пациентов с печеночной недостаточностью, что позволяет избежать дополнительных осложнений в процессе лечения;

- система индивидуального прогнозирования гепатокар-циономы, которая дает возможность более эффективно распределять донорские органы, тем самым улучшая лечебный процесс. Система также сделала возможным разделение пациентов, страдающих ГК, на, однородные по тяжести болезни категории, для которых можно давать более точные оценки влияния других видов терапий.

Основные положения, выносимые на защиту.

1) Интерактивная методология представления данных для нейросетевого моделирования дает возможность получения многообразия представлений структуры признаков, описывающих состояние биообъекта, позволяет статистически значимо повысить прогностическую эффективность нейросетевых моделей и обрабатывать данные с упущенными значениями.

2) Методика последовательного нейросетевого моделирования, распространяющая интерактивную методологию на исследование нестационарных процессов, позволяет моделировать бинарные клинические процессы, характеризующиеся ограниченным временем нестационарности и неубывающим риском прогнозируемого события.

Реализация. Разработанная система прогнозирования рецидива гепатокарциономы внедрена в Институте Трансплантации Питтсбургского медицинского центра, где она' проходила испытания с декабря 1994 года. Планируется ее внедрение в клинике Мэйо и Фэйерфакском госпитале (США). Есть интерес к этим методикам в российских клинических центрах.

Апробация. Результаты работы, докладывались и обсуждались • на Всемирном конгрессе по нейросетям (San Diego, California, 1994), конференции по моделированию в здраво-

охранении (Las Vegas, Nevada, 1994), Всемирном конгрессе по вычислительной медицине и биотехнологии (Austin, Texas, 1995), на заседании кафедры БМЭ и ОС СПб ГЭТУ (1996), на встречах с ведущими специалистами Санкт-Петербурга в этой области.

Публикации. По материалам диссертационной _ работы опубликовано 11 работ, в том числе 7 статей и 4 тезисов докладов.

Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, списка литературы, включающего 142 наименования, и 8 приложений. Основная часть работы изложена на 14 8 страницах. Работа содержит 16 рисунков и 13 таблиц.

Основное содержаний работа

Во введении обоснована актуальность темы, определена цель работы и сформулированы задачи исследования, научные положения, выносимые на защиту, научная новизна и практическая значимость результатов.

В первой главе проведен анализ существующих подходов к построению нейросетевых моделей в медицине, а именно, основные этапы БПИНС - моделирования и трудности, связанные с особенностями моделирования медицинских экспериментальных данных. Проанализированы математические принципы,

лежащие в основе многослойных БПИНС и их функциональные

1

характеристики.

В связи с трудностями накопления больших объемов экспериментальных данных в медицине получили распространение статистические методы, позволяющие оценивать прогностическую эффективность БПИНС-модели без. использования больших по объему тестирующих выборок (метод перекрестной валида-ции, бутстрэп и др.). Особое внимание при этом• уделяется критег».'ям прогностической эффективности нейросетевых моделей и, в частности, методу оперативной характеристики, позволяющему делать объективные оценки прогностической эффективности модели, учитывая существование зон неразличимых состояний.

Комбинация вычислительных возможностей нейросетей с перечисленными статистическими методами дает возможность успешно моделировать широкий класс медицинских задач. Однако, относительная сложность качественной интерпретации нейросетевой модели является существенным недостатком 0в тех областях медицины, где задачей исследования является не математическое описание известных функций и состояний биообъекта, а, скорее, их обнаружение. В этих случаях числовая модель служит для проверки клинических гипотез и возможность ее интерпретации является насущной необходимостью.

Рассмотрены статистические методы обработки данных с упущенными значениями (анализ толйко полных данных, подстановочные методы, весовые процедуры и др.). Эти методы позволяют получать оценки упущенных значений, но в то же время обладают недостатками, мешающими их использованию в моделировании медицинских экспериментальных данных. К наиболее характерным можно отнести следующие: необходимость предположения о случайности распределения упущенных значений (подстановочные методы, весовые процедуры), потеря части информации (анализ только полных данных), которая неприемлема в дорогостоящих медицинских исследованиях; вычислительная сложность (моделирование упущенных значений); отсутствие соответствующих программ в статистических пакетах.

В то же время, нейросеть обладает естественной способностью обрабатывать данные с упущенными значениями, если вместо упущенных значений подставлять нули. При использовании сигмоидной функции как передаточной функции нейросетц. в соответствии с методом'уменьшения градиента, применяющегося для минимизации глобальной ошибки при тренировке ВПИНС, изменение Ди^,- веса связи между г -м нейроном слоя 5—1 и у-м нейроном слоя у происходит по следующему принципу:

Ди

где ву - локальная ошибка на нейроне у слоя 5, х/~' - выходной сигнал нейрона I- слоя 5—1, а X - тренировочный коэффициент. Соответственно если ;с*~'=0, то и изменения

весов между / -м нейроном слоя 5-1 и нейронами слоя .г не происходит, а значит нейросетью обрабатывается вся имеющаяся информация за исключением упущенных значений!

Интерактивная методология, позволяющая проверять разнообразные клинические гипотезы, интерпретировать числовые результаты моделирования и обрабатывать экспериментальные данные с упущенными значениями, облегчит решение части проблем, сопутствующих статистическому Моделированию в медицине. На основании проведенного анализа сформулированы основные задачи исследования.

Во второй главе излагается интерактивная методология представления данных для нейросетевого моделирования.

В связи с существующим представлением о БПИНС как классификаторе, понижающем размерность характеристического пространства признаков до тех пор, пока не становится возможным линейное разделение между классами, целесообразно представлять данные для нейросетевого анализа в форме, учитывающей характерные особенности решаемой классификационной задачи. Такое представление должно упростить процесс линейного разделения, тем самым улучшая прогностическую, эффективность нейросетевой модели. Широкий класс медицинских задач, при решении которых используются ВПИНС, связан с диагностированием состояния биообъекта на основании значений характеристических признаков! Анализ клинической диагностики показывает, что в ее основе лежит симптомокомплексный подход. Представление многомерного характеристического пространства признаков в форме, соответствующей симптомокомплексу и является характерной особенностью решаемой задачи, которая упрощает процесс классификации и улучшает прогностическую эффективность нейросетевой модели.

В тех же случаях, когда целью моделирования является определение симптомокомплексов, характерных для данного состояния, биообъекта, и исследователю приходится руководствоваться различными гипотезами, то каждую гипотезу можно представить в виде определенной структуры многомерного характеристического пространства признаков. В этом случае прогностическая эффективность нейросети может слу-

жить критерием верности рассматриваемой клинической гипотезы и результатом моделирования будет служить не' только диагностика состояния биообъекта, но и вывод о правильности конкретной клинической гипотезы о характерном для диагностируемого состояния симптомокомллексе.

На основании вышеуказанных.соображений сформулированы основные требования, предъявляемые к ИМ:

1)' для возможности рассмотрения разнообразных клинических гипотез о характерных для. состояния биообъекта симптомокомплексах, выраженных в гипотезах о многомерной структуре характеристического пространства признаков, должно существовать многообразие представлений переменной. При этом каждое представление должно быть взаимно однозначным отображением реальной переменной на ее образ;

2) методология должна допускать различную степень детализации переменной и подчеркивать ее иерархическую структуру, соответствующую конкретной гипотезе;

3) методология должна учитывать существующую функцию распределения переменной;

4) методология должна позволять автоматическую (без дополнительных вычислительных процедур) обработку данных с упущенными значениями.

В соответствии с вышеуказанными требованиями была разработана методология подготовки данных к нейросетевому анализу, позволяющая создавать множественные представления числовых данных, каждое из которых отражает конкретную гипотезу о диагностическом симптомокомплексе. Преследуемая цель - проверка клинических гипотез путем созда-ия и валидации множества нейросетевых моделей, в каждую из которых данные заводятся в форме,' соответствующей гипотетической структуре характеристических признаков. Поскольку существующие статистические методы многократной валидации прогностической эффективности построенной модели позволяют объективно оценивать ее эффективность, то естественно предположить, что клиническая гипотеза о симптомокомплексе, вызвавшая модель, с наибольшей прогностической эффективностью, является наиболее близкой к действительности .

Разработан алгоритм, позволяющий осуществлять представления числовой переменной X = (л,,в виде многообразия нелинейных трансформаций этой переменной. При этом каждая трансформация представляет из себя квантованный набор трансформируемых значений, учитывающий функцию распределения переменной X. Трансформационная функция ф(Х,Ы,С) зависит от двух свободных параметров, один из которых, N, отвечает за количество квантованных отрезков и иерархическую структуру трансформированных значений, а второй, С, - за степень сжатия. Все упущенные значения переводятся в нуль, который, в свою очередь, обособлен от всех ¿стальных значений. Так, например, при трансформации переменной X с минимальным (х^У и максимальным (х^) значениями с одновременным масштабированием всех трансформированных значений между 0,1 и 1, значение х0 переменной X, находящееся внутри А-го отрезка с началом в переходит в трансформированное значение ЗТ0 по' формуле:

У -01+09с£р 0,9РкС1х0-хы)

где Р} и Рк - априорные вероятности того, что значение переменной X попадает в отрезки 7 и к, соответственно. Пример работы алгоритма на искусственно генерированных двумерных данных показан на рис. 1.

Рис.1. Вид данных до (А) и после (В) трансформации.

Для возможности использования ИМ в нестационарных клинических процессах разработана методология последовательного нейросетевого моделирования (ПНМ). В случае, если задачей исследования является прогнозирование вероятности и времени бинарного медицинского события, характе-

ризующегося ограниченным временем не стационарности и неубывающим риском прогнозируемого события, весь интервал нестационарности разбивается на квазистационарные участки по принципу сохранения набора характеристических признаков и их статистической значимости на любом интервале квазистационарного участка.

Предложена методика выбора оптимальной нейросетевой модели на каждом квази- стационарном участке и условия связности этих моделей, учитывающая целевую функцию клинического исследования. Так, если клинической задачей является определение максимального числа позитивных исходов, то на каждом участке из множества моделей, обладающих одинаковой прогностической эффективностью, выраженной в площади под кривой чувствительности, выбирается та, которая обладает требуемой чувствительностью (процент верно определенных позитивных исходов) при наибольшей величине критического значения предсказаний нейросетевой модели, разделяющего позитивные и негативные исходы; если задача заключается в идентификации максимального числа негативных исходов, то выбирается модель с наименьшей величиной критического значения.

В третьей главе изложены материалы экспериментальных исследований, проведенных на искусственно генерированных и лабораторных данных с целью определения влияния ИМ на прогностическую эффективность нейросетевых моделей и их способность обрабатывать данные с упущенными значениями.

В экспериментах, посвященных исследованию влияния ИМ на прогностическую эффективность нейросетевых моделей, сравнивались значения глобальной ошибки и скорость обучения идентичных БПИНС, тренированных с использованием и без использования ИМ. В экспериментах, посвященных исследованию влияния ИМ на обработку данных с упущенными значениями, проводилось сравнение прогностических эффектив-ностей нейросетевых моделей, использующих ИМ для обработки данных с идентичными моделями, использующими подстановочные. методы. Для сравнения были выбраны однофакторный дисперсионный анализ и последующее сравнение между труп-* нами с поправкой.Бонферони и уровнем значимости в 5%,

Х2-тест и многофакторный анализ дисперсии с контрастами Хелмерта.

Результаты показали, что прогностическая эффективность нейросетей изменяется в широком диапазоне в зависимости от клинических гипотез о симптомокомплексах, в соответствии с которыми данные были'представлены для нейро-сетевого анализа. В тех случаях, когда гипотеза отражала реальную картину с высокой степенью достоверности, прогностическая эффективность нейросетевой модели статистически значимо превосходила эффективность моделей, построенных без использования ИМ.

Установлено, что ИМ позволяет обрабатывать данные с упущенными значениями, составляющими до 10% от общего объема информации, с результатами, статистически значимо превосходящими результаты, полученные с помощью подстановочных методов. При этом не нужно предполагать наличие случайного распределения "пущенных значений по характеристическим признакам, что необходимо для использования соответствующих статистических методов.

В четвертой главе на основании разработанной ИМ строятся две нейросетевые модели: первая - определяющая время проводимости атриовентрикулярного узла (АВУ) на основании данных о последовательности возбуждающих импульсов, и вторая - предсказывающая на базе доплерографического анализа внутричерепную гипертонию (ВГ) реанимационных больных, страдающих острой печеночной недостаточностью.

Модель проводимости АВУ. При проведении исследований влияния ИМ на прогностические эффективности нейросетевых моделей,' описанных в третьей главе, была построена модель проводимости АВУ на базе четырех предшествующих сигналов и трех соответствующих им проводимостей (см. рис. 2).

Поскольку прогностическая эффективность модели падает с сокращением предшествующей импульсной истории, задачей данного исследования было установление возможности компенсировать сокращение истории многообразием ее представлений, допускаемым ИМ. Это важно для построения аналитической модели проводимости АВУ

Г"""1 —I-!

АН

---> [

Рис. 2. Импульсации атриовентрикулярного узла: АА -время между последовательными возбуждающими импульсами; АН - времй .Проводимости АВУ.

В соответствии с целью исследования построена группа моделей, каждая из которых получала на вход различные представления информации о двух предшествующих сигналах и одной проводимости. Количество представлений информации варьировалось для различных моделей. По окончании тренировки нейросети тестировались на 200-х последовательностях сигналов, случайным образом выбранных и не включенных в тренировку. Абсолютная и глобальная ошибки при тестировании определяется в соответствии с выражением:

200

1=1

где - выходной сигнал нейросети; О, - реальное значение времени проводимости, служила мерой прогностической эффективности модели'.

Однофакторный дисперсионный анализ и последующее сравнение между группами с поправкой Бонферони на уровень значимости показали, что прогностическая эффективность статистически значимо ¡возрастает при увеличении числа представлений предшествующей истории (см. табл. 1) . Так, например, модель, на вход которой подавалось пять различных представления каждого из двух сигналов и одной проводимости, значимо превосходила модель, на вход которой подавались значения четырех сигналов и трех проводимостей. Таким образом, ИМ позволила эффективно прогнозировать проводимость АВУ на базе только двух предшествующих сигналов и одной проводимости.

Моделирование ВР на основе доплерографического анализа . Неинвазивный контр о.?* внутричерепного давления (ВД) реанимационных больных, страдающих острой печеночной не-

Достаточностью, понижает вероятность осложнений (кровопотери, инфекции и т.д.) и позволяет осуществить необходимое лечение до момента наступления необратимых

Таблица 1

Модель Е

4 АА; 3 АН; 1 представление 1.45±1.32

3 АА; 2 АН; 1 представление 1.53±0.82

2 АА; 1 АН; 1 представление 1.б 9±0.7 7

2 АА; 1 АН; 3 представления 1.37±0.80

2 АА; 1 АН; 4 представления 1.29±0.84

2 АА; 1 АН; 5 представлений 1.19±0.73

поражений мозга. С целью определения возможности использования дoплepoгpaфичeqкoгo устройства, измеряющего скорость церебрального кров^ока, для неинвазивной диагностики ВГ было проведено исследование, заключающееся в попытке скоррелировать показания доплерографических замеров полученные для 172 реанимационных пациентов с их ВД. В каждой додлерографической волне измерялись 24 составляющих. Тест Стьюдента установил 15 из них, которые коррелируют с ВД. Для учета существующих клинических гипотез об изменениях, происходящих в доплерографической волне при повышении ВД, и при наличии 9% значений упущенных данных, разработанная ИМ была использована при построении нейро-сетевой модели ВГ. Валидация модели показала, что модель обладает следующей эффективностью - предсказаний : площадь под кривой чувствительности С=0,929. Чувствительность (процент верно предсказанных моделью пациентов с ВГ) и специфичность (процент верно предсказанных моделью пациентов с ВД ниже 20 мм рт. ст.), вычисленные для критического значения выходного нейрона, равного 0,6, были 93,3% и 75%, соответственно.

Исследование показало, чти ИМ позволяет создать ней— росетевую модель, верно предсказывающую ВГ у пациентов с острой печеночной недостаточностью в 86,5% случаев. При

этом 93,3% пациентов, страдающих ВГ, могут быть неинва-зивно идентифицированы моделью, и, таким образом, избегнуть возможных осложнений.

Пятая глава посвящена разработке системы прогнозирования индивидуальной вероятности и времени возникновения рецидива ГК после трансплантации печени.

Задача прогнозирования может быть представлена еле-, дующим образом: вероятность рецидива (Л) ГК для пациента / является функцией набора параметров и времени:

й, . Параметры хи...х„ являются соответствующими

признаками и фиксированы для каждого пациента в момент трансплантации. Анализ показал, что ни у одного пациента рецидив ГК не наступил позднее, чем через 4 года после трансплантации. При этом у 98,6% пациентов с рецидивом он наступил в течение трех лет. Таким образом, задача прогнозирования вероятности и времени рецидива ГК является частным случаем задачи Прогнозирования бинарного медицинского события, характеризующегося ограниченным временем не стационарности и неубывающей функцией риска'прогнозируемого события, и может быть сведена к следующим частным задачам: 1) определение квази стационарных интервалов на основе принципа разбиения; 2) определение набора признаков, отвечающих за рецидив ГК на каждом из интервалов и построение модели прогноза; 3) выбор критических значений предсказаний нейросетевой модели на основании принципов принятия медицинского решения и оценка эффективности моделей в соответствии с заранее выбранными критериями.

Для построения прогностической системы анализировалась информация от 214 пациентов, прошедших трансплантацию печени с 1981 по -1992 год в связи с ГК в медицинском центре Питтсбургского университета. Однопараметрический анализ Каплана-Мейера, в котором категории сравнивались на основе логарифмического рангового критерия, и многопараметрический анализ на основе шаговой логистической регрессии использованы для нахождения квази стационарных участков моделирования.и соответствующих признаков на каждом участке.

В соответствии с анализом были построены нейросетевые

«¿одели, прогнозирующие вероятность рецидива ГК у конкретного пациента вообще и в течение одного и двух лет. Для нейросетевого анализа использованы трехслойные нейросети с полным набором межнейронных связей; Для первичной вали-дации моделей использован метод перекрестной валидации, основанный на статистике случайных выборок. Эффективность , построенных моделей оценена с помощью анализа кривой чувствительности системы (см. табл. 2) . В таблице чувствительность, специфичность и процент верных предсказаний (ПВП) даны для значения 0,55, разделяющего негативные и позитивные исходы. • Исследование критических значений предсказаний системы позволило выделить зоны различимых состояний и идентитифицировать те комбинации признаков,

Таблица 2

Модель № Площадь под кривой чувствительности Чувствительность Специфичность ПВП

Модель I 0,96 90% 90% 90%'

Модель II 0, 96 78% 95,4% . 90, 6%

Модель III 0,95 91,5% 86,4% 88,3%

которые либо всегда приводят к рецидиву ГК, либо никогда не приводят к нему. Описанная прогностическая система прошла испытания в медицинском центре Питтсбургского университета, в результате которых выявилось что рецидив ГК может быть-предсказан со 100% вероятностью для более чем 70% трансплантационных кандидатов предоперационно. Разработанная система используется для выбора кандидатов на пересадку печени.

Основные результаты работы:

1)Проведен анализ методических возможностей нейросетевого моделирования сложных комплексов медико-биологической информации. Показано преимущество комбинаций нейросетевого моделирования со статистическими методами отбора существенного комплекса характеристических признаков.

2)Разработана интерактивная методология представления. данных для нейросетевого моделирования, позволяющая выявить соответствие различных клинических гипотез структуре характеристических признаков, строить нейросетезые

модели с учетом этих структур, и тем,самым, либо внедрять в моделирование экспертные знания медицинских специалистов, либо выявлять наиболее верную медицинскую гипотезу* Интерактивная методология также дает возможность автоматически обрабатывать данные с упущенными значениями.

3) Разработана методика последовательного нейросерсг-вого моделирования, позволяющая распространить интерактивную методологию представления данных на моделирование нестационарных бинарных клинических процессов, характеризующихся ограниченным временем и неубывающей функцией риска периода нестационарности.

4)Разработана методика оценки эффективности интерактивной методологии на примере анализа математических моделей и реальных данных. Результаты экспериментальных исследований показали, что интерактивная методология позволяет статистически значимо повышать прогностическую ценность алгоритмов обработки данных, предоставляя медицинскому пользователю эту информацию в более привычном и понятном виде.

5)На основе интерактивной методологии представления данных разработаны модели

- атриовентрикулярного узла, позволяющая на основании данных о последовательности возбуждающих импульсов определять время его проводимости; показано, что ИМ позволяет компенсировать сокращение истории случайным образом генерированных возбуждающих импульсов многообразием представлений этой сокращенной истории;

- предсказания внутричерепной гипертонии у пациентов, страдающих острой печеночной недостаточностью, основанная на данных доплерографического анализа. ИМ позволила получить модель с высокой прогностической эффективностью, которая позволила предсказать неинвазивным путем ВГ у 93,3% пациентов.

6)На основе интерактивной методологии и методики последовательного .нейросетевого моделирования разработана система индивидуального прогнозирования вероятности и времени рецидива гепатокарциономы после пересадки печени. Система позволяет повысить эффективность трансплантации

путем более обоснованного распределения донорских органов. Система также дает возможность предоперационно разделять пациентов на однородные по тяжести заболевания категории, что повышает точность оценок влияния других видов терапии на рецидив ГК и продолжительность жизни пациента.

Список опубликованных работ по теме диссертации:

1.Dvorchik I, Doyle HR. "Improvement of Backpropagation Network's Learning Potentials by Employment of Alternative Clustering and Quantization Data Algorithm." Proceeding of The World Congress on Neural Networks, San Diego, CA 1994; 3:686-690.

2. Dvorchik I, Subotin M, Marsh W,' McMichael J, and Fung JJ. "Performance of Multi-Layer Feedforward Neural Networks to Predict Liver Trans-plantation Outcome." Methods of Information in Medicine 1996, Vol 35, 12-18.

3.Dvorchik I, Marsh W,' Ourari V, Subotin M, Dd>yle HR. "Multisolutional Clustering and Quantization Algorithm (MCQ)." Computers in Biology and Medicine. 1996, 26(5):439-450.

4.Marsh W.J, Dvorchik I, Subotin M, Popechitelev E.P, Ballan V, Rakela J, Fung J.J, and Iwatsuki S. "The Prediction of Risk of Recurrence and Time to Recurrence of Hepatocellular Carcinoma After Orthotopic Liver Transplantation: A Pilot Study". Hepatology 1997, 1-000

'5.Doyle H.R, Dvorchik I, Mitchell SH, Marino I.R, Ebert F, McMichael J, Fung J.J. "Predicting Outcome after Liver Transplantation: A Connectionist Approach." Annals of Surgery. 1994; 219(4): 4.0?L415.

6.McMichael J, Dvorchik I, Subotin M, Lieberman R. "Improved Training and Performance of Multi-Layer Feedforward Neural Networks Using an Alternative Approach to Data . Processing and Missing Data Treatment." 1994 SCS Western Multiconference, Simulation in the Health Sciences, (ed) Anderson and Katzper; 199-202, 1-995.

7.Madriaga J.R, Subbotin V.M, Lopez SR, Shahin M, Ferres J, Dvorchik I, Subotin M.V, Wang Z, Naleznik M.A, Carr

B.I, Valdiva L.A, Rao A.S, Fung J.J. "Quantitative Assessment of the Development of Hepatoma in a Buffalo Rat Model" Transplant Proceedings: 1997, 29:1-000,

6-Dvorchik I, Doyle HR, McMichael J. "Employing a Novel Clustering and Quantization Algorithm for Data Preprocessing Improves Neural Network Performance." World Congress on Computational Medicine, Public Health and Biotechnology, Austin, Texas. Тез. Докл., 1995, 3:372-379.

9.Marsh W, Dvorchik I, Casavilla A, Iwatsuki S. "Should All Patients With Hepatocellular Carcinoma (HCC) Be Denied Liver Transplantation". American Hepato-Billiary Congress. Тез. Докл., 1997, 1-000.

10.Marsh W, Dvorchik I, Subotin M, Casavilla A, Iwatsuki S. Correlation of Grade of Vascular Invasion (GVI) With Pathological Characteristics For Patients With Hepatocellular Carcinoma." American Assossiation For The Study of Liver Diseases. Hepatology. Тез. Докл., 1996, 27:342.

Подписано к печати 16.04.97. Формат 60x84 1/16 Бумага офсетная. Печать офсетная Печ.л. 1.0 Уч.-изд.л. 1.0 Тираж 100 экз. Эак. 75

Издательско-полиграфический центр ГЭТУ 197376. Санкт-Петербург. Ул. Проф. Попова. 5