автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Автоматизированная система количественной оценки операционного риска
Автореферат диссертации по теме "Автоматизированная система количественной оценки операционного риска"
На правах рукописи УДК 519.7:616-053.2
Г
ДРАГУН ИГОРЬ АНАТОЛЬЕВИЧ
Автоматизированная система количественной оценки операционного риска
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Барнаул-2006
Работа выполнена на кафедре прикладной физики, электроники и комплексного обеспечения информационной безопасности Алтайского государственного университета
Научные руководители: доктор медицинских наук, профессор
Устинов Геннадий Георгиевич
кандидат физико-математических наук, доцент Зацепин Павел Михайлович
Официальные оппоненты: доктор физико-математических наук, профессор
Шайдук Александр Михайлович
доктор технических наук, профессор Пятковский Олег Иванович
Ведущая организация: Институт вычислительного моделирования
СО РАН (г. Красноярск)
Защита диссертации состоится 27 декабря 2006 г., в 14 22 часов, на заседании диссертационного совета Д 212.005.04. при Алтайском государственном университете по адресу: 656049, г. Барнаул, пр. Ленина, 61, конференц-зал АлтГУ
С диссертацией можно ознакомиться в научной библиотеке Алтайского государственного университета по адресу: 656049, г. Барнаул, пр. Ленина, 61; с авторефератом диссертации -на сайте АлтГУ: http://www.asu.ru/
Автореферат разослан «_» ноября 2006г.
Ученый секретарь диссертационного совета доктор физико-математических наук, профессор
Безносюк С.А.
£006 А
ОБЩАЯ ХАРАКТЕРИСТИКА ДИССЕРТАЦИОННОЙ РАБОТЫ
Актуальность темы. В настоящее время исследования и разработки в различных областях науки и техники предполагают обработку больших объемов информации связанной с описанием состояния и поведения исследуемых объектов. Это предполагает применение различных методов, также поиск и создание моделей ее обработки. Вместе с необходимостью применения математических моделей для описания состояний и поведения объектов растут и требования к эффективности этих моделей. Эти вопросы являются особенно актуальными в таких областях как обработка аэрокосмической информации, геофизических, медико-биологических данных и пр.
Одной из наиболее важных проблем в современной медицине является сложность количественной оценки операционного риска. Оценка операционного риска подразумевает интегральную оценку тяжести предоперационного состояния пациента при угрозе летального исхода. В ситуациях с тяжело устанавливаемым или неясным диагнозом часто очень важно точно оценить тяжесть заболевания, в то время как универсальных количественных оценок тяжести не существует, а известные модели не применяются из-за разных возможностей медучреждений. Сложность оценки тяжести состояния обусловлена большим количеством симптомов, различных для каждого заболевания и большой лабильностью клинических проявлений заболевания. На практике степень тяжести состояния пациента определяется качественно. При этом используется небольшой набор наиболее значимых, по мнению врача симптомов, в то время как менее значимые симптомы не учитываются. Поэтому актуальным направлением повышения эффективности оценки операционного риска является применение математических методов анализа медико-биологических данных и разработка проблемно-ориентированных моделей и систем обработки информации.
Анализ известных методик оценки тяжести состояний больных показал, что общепринятыми являются статистические и вероятностные подходы, используемые при дифференциальной диагностике и прогнозировании. Однако достижения последних лет в области медицинской нейроинформатики показывают, что нейросетевые модели позволяют более точно проводить диагностику и прогнозировать состояния больных.
Изложенные выше факты свидетельствуют об актуальности проведения
исследований в целях поиска наиболее эффектите^т^щ^щ^щщр;
оделеи
БИБЛИОТЕКА С.-Петербург 03 200$а<АвУ1
оценки риска и разработки на их основе системы обработки информации и интеллектуальной поддержки принятия решений. Это позволит более точно оценивать степень тяжести предоперационного состояния пациента и своевременно проводить лечебные мероприятия.
Исходные данные. Исследования по оценке степени операционного риска проводились на статистическом материале больных желчно-каменной болезнью (ЖКБ), прооперированных за последние 12 лет в Больнице № „5 г. Барнаула. Истории болезни пациентов хирургического отделения здесь являются не верифицированными по степени тяжести состояний больных ЖКБ. Выбор именно желчно-каменной болезни обусловлен её частотой и достаточно высокой послеоперационной летальностью при осложнениях.
Цель исследования: разработка эффективной математической модели интегральной количественной оценки тяжести предоперационного состояния больных ЖКБ, а также- разработка проблемно-ориентированной системы анализа информации и количественной оценки операционного риска. Основные задачи исследования:
1. Анализ известных методик количественной оценки степени операционного риска.
2. Исследование эффективности вероятностных и нейросетевых моделей для количественной оценки операционного риска больных желчно -каменной болезнью.
3. Разработка алгоритмов выделения комплекса факторов риска - набора наиболее значимых симптомов при оценке тяжести заболевания.
4. Разработка программного продукта, реализующего систему анализа клинико-лабораторных данных, поиска факторов риска и количественной оценки операционного риска для больных желчно-каменной болезнью. Объектом исследования являются связи между комплексом клинико-
лабораторных данных и степенью тяжести предоперационного состояния больных желчно - каменной болезнью.
Предметом исследования является эффективность математических моделей для расчета степени тяжести предоперационного состояния больного (оценки операционного риска), использующих данные клинико-лабораторных показателей больных.
Методы исследования. При выполнении работы проводился анализ медицинских данных с применением вероятностно-статистических методов, аппроксимации зависимостей, математического программирования и методов нейросетевого анализа.
Научная новизна работы:
1. Обоснована эффективность совместного применения вероятностной и нейросетевой математических моделей для высокоточной и разносторонней количественной оценки степени операционного риска.
2. Предложены алгоритмы поиска и найден комплекс факторов риска -наиболее значимых признаков при оценке тяжести предоперационного состояния больных ЖКБ.
3. Разработаны нейросетевая и вероятностная модели количественной оценки операционного риска больных желчно-каменной болезнью. Теоретическая значимость результатов работы. Исследования по
оценке операционного риска у больных желчно-каменной болезнью показали, что вероятностные и нейросетевые модели позволяют эффективно количественно оценивать тяжесть предоперационного состояния пациентов, а также выделять комплекс наиболее значимых симптомов при оценке тяжести заболевания. Вероятностно-статистические методы позволяют провести анализ распределений значений симптомов, выделить дифференциально-диагностические границы диапазона значений признаков, превышение которых существенно при рассматриваемой клинической ситуации. Нейросетевые методы анализа данных позволяют создавать высокочувствительные и высокоспецифичные структуры нейронных сетей, использование которых дает высокую точность при количественной оценке операционного риска. Таким образом,' совместное использование вероятностных И нейросетеых моделей в автоматизированной системе количественной оценке риска позволяет провести высокоточный и разносторонний анализ данных. При этом вероятностные модели можно порекомендовать для быстрой, предварительной обработки клинико-лабораторных данных, в то время как нейросетевые методы - для более точного анализа информации при оценке операционного риска.
Предложенные в работе методы и модели интегральной оценки состояний объектов могут эффективно применяться также в биологии, экойомике, технике и прочих предметных областях, в которых существует необходимость в обработке больших объемов слабо формализованных данных.
Практическая значимость результатов работы. Использование вероятностно-статистических и нейросетевых моделей составляет практическую основу для построения автоматизированной системы количественной оценки степени операционного риска. Рекомендации системы могут использоваться врачами для поддержки принятия решений о тяжести предоперационного состоянии больного желчно-каменной болезнью.
Нейросетевая система расчета степени тяжести состояния может эффективно применяться не только для оценки степени операционного риска, но и для прогнозирования послеоперационных исходов у больных ЖКБ, а также может осуществлять диагностику основных осложнений желчно-каменной болезни. Оценка риска, прогнозирование и диагностика могут осуществляться без привлечения высококвалифицированных экспертов в условиях периферических медицинских учреждений. Использование проблемно-ориентированной системы поддержки принятия решений повышает оперативность принятия решений и снижает уровень субъективизма при проведении лечения больных ЖКБ.
Основные результаты диссертационной работы реализованы в виде программного комплекса «АСКОР» для оценки тяжести состояний больных ЖКБ, внедренного 'в двух медицинских учреждениях Алтайского края и использующегося в медицинской практике.
На защиту выносятся следующие положения:
1. Вероятностная и нейросетевая модели количественной оценки операционного риска, совместное использование которых позволяет провести высокоточный и разносторонний анализ клинико-лабораторных данных больных ЖКБ.
2. Алгоритмы выделения комплекса факторов операционного риска больных желчно - каменной болезнью, заключающих в себе основную диагностическую информацию.
3. Реализация автоматизированной системы количественной оценки операционного риска у больных желчно-каменной болезнью, позволяющая рассчитать степень тяжести предоперационного состояния больного, провести диагностику основных осложнений и спрогнозировать возможные исходы операции.
Апробация результатов. Основные положения и отдельные результаты исследования докладывались и обсуждались на международной конференции по по математическому моделированию и информационным технологиям (Новосибирск, 2002), XII всероссийском научном семинаре «Нейроинформатика и ее приложения» (Красноярск, 2004), 3-й междисциплинарной конференции «НБИТТ-21» (Петрозаводск, 2004), XIII всероссийском научном семинаре «Нейроинформатика и ее приложения» (Красноярск, 2005), XIV всероссийском научном семинаре «Нейроинформатика и ее приложения» (Красноярск, 2006).
Публикации. По теме диссертации опубликовано 14 печатных работ, в
том числе 3 статьи в сборниках статей, 11 тезисов докладов на конференциях. Получена одна официальная регистрация программного продукта, реализующего экспертный модуль «АСКОР».
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 104 источников, 8 приложений. Общий объем работы составляет 143 страницы, содержит 15 рисунков, 26 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность исследования, определены цели, задачи, объект, предмет, методы исследования. Раскрыты научная новизна, теоретическая и практическая ценность, сформулированы положения, выносимые на защиту.
В первой главе диссертационной работы «Математические методы в медицине» определены понятия операционный риск, диагностика и прогнозирование заболеваний, обозначена методика количественной оценки операционного риска. Рассмотрены математические методы, наиболее часто применяемые в медицине для оценки тяжести состояний и диагностики. Изложены основные идеи математического подхода, в рамках которого производится анализ клинико-лабораторных данных больных и формализация процесса эмпирической диагностики. Также рассмотрены способы построения проблемно-ориентированных систем диагностики и оценки тяжести состояний пациентов с помощью вероятностно-статистических и нейросетевых методов.
Оценка риска оперативного вмешательства подразумевает оценку тяжести предоперационного состояния. При этом для количественной оценки операционного риска необходимо и достаточно рассматривать два состояния -опасное или тяжелое состояние и альтернативное состояние пациента. Оценка операционного риска у больных желчно-каменной болезнью проводилась при угрозе летального исхода операции, т.е. тяжесть послеоперационного состояния оценивалась по предоперационным клиническим данным.
При такой постановке задачи оценка операционного риска может трактоваться как задача клинического прогнозирование послеоперационного состояния по предоперационным данным. Также, учитывая тот факт, что рассматривается предоперационное состояние, тяжесть которого характеризуется либо одним, либо другим исходом операции, можно говорить о задаче диагностики предоперационного состояния пациента. Таким образом, для решения задачи количественной оценки- степени операционного риска
можно применять математические методы и модели диагностики и прогнозирования.
В первой главе обосновано применение вероятностно-статистических и нейросетевых методов для решения задач оценки состояний сложных систем. Приведены способы применения нейросетевых и вероятностно-статистических методов для решения задач диагностики и оценки тяжести состояний больных.
Во второй главе диссертационной работы «Вероятностно-статистические методы оценки операционного риска» приведены результаты исследований эффективности непараметрических вероятностно-статистических методов анализа информации для количественной оценки операционного риска больных желчно - каменной болезнью.
Для проведения исследований был собран статистический материал, содержащий клинико-лабораторные данные предоперационного состояния пациентов Больницы №5 г. Барнаула, прооперированных в период с 1990 по 2002 гг. Каждая запись в базе данных содержит информацию, состоящую из трех логических блоков:
• информация о тяжести предоперационного состояния, характеризованная летальным исходом операции (Аг) либо его отсутствием (АО. Априорные вероятности групп А[ и Аг составили 0,82 и 0,18 соответственно;
• качественная информация о наличии обнаруженных у пациента осложнений основного заболевания, сопутствующих заболеваниях, об отклонениях в функционировании той или иной системе жизнедеятельности организма (21 признак);
• количественные данные лабораторных и инструментальных тестов состояния больного ЖКБ (38 признаков).
Основными непараметрическими методами, решающими задачу диагностики в вероятностном пространстве симптомов являются методы распознавания образов, опирающиеся на стратегии Байеса, Неймана-Пирсона и Вальда. Введение вероятностной меры в пространстве клинико-лабораторных признаков осуществляется вычислением частот значений в интервалах, образованных квантованием диапазона значений признака, при котором подчеркивается дифференциально-диагностическая информация. Наиболее мощным критерием различия распределений является информационная мера Кульбака (1), не использующая параметры выборок, а потому пригодная для распределений любого вида:
• ' л\)
где Р(лУА,) и Р(х1;/А;) - вероятности наличия признака х„ значения которого х, принадлежат интервалу с номером э. Использование меры Кульбака позволяет:
• оценить информативность и уровень значимости распределений значений признака;
• провести разбиение диапазонов изменения значений любого количественного признака на интервалы таким образом, чтобы подчеркнуть наиболее значимую дифференциально-диагностическую информацию;
• минимизировать влияние случайных флуктуаций значений признака;
• формировать двумерные признаки в условиях недостаточности статистического материала.
Рассчитанные при помощи такого квантования интервалы одномерного симптома называются интервальной структурой, а признак, сформированный парой интервальных структур - бинарной структурой. Одномерные и двумерные признаки ранжируются по убыванию их информативности (величине меры Кульбака), тем самым выделяется подмножество наиболее информативных, значимых признаков.
Исследования непараметрическими методами статистики организованы следующими тремя стратегиями распознавания образов, каждая из которых дает вероятность летального исхода операции у конкретного пациента, и тем самым количественно оценивает риск операции:
• стратегия Вальда (2), когда принятие решения основывается на вычислении отношения правдоподобия последовательно для признаков, упорядоченных по убыванию информативности:
а ^р(А) Р(*,/4) Р(х„х,/4) Р(аг„.,,х„/4) 1-«. ( .
1 -р Ртр{Ах) Р(.ул,) Р(х„*2/4) Пх^/А,) р '
аир здесь вероятности ошибок классификации первого и второго рода.
• стратегия Байеса (3), когда решение принимается в соответствии с формулой Байеса:
1
• последовательная стратегия Байеса (многошаговый байесовский алгоритм) (4), когда признаки упорядочиваются по убыванию информативности и на каждом шаге используется формула Байеса, в которой
априорной вероятностью считается апостериорная вероятность, вычисленная на предыдущем шаге:
PU//)__Р(х"М,)Р„.,(Л,/*"') (4)
P„(V*") =
р(х"/^)Р„., (Л/*";')
Р(х" / Л,)Р„_,(4 / х"-1) ■+ Р(х" / Л) P„-, (4 / .V""1)' Для корректной, более достоверной оценки эффективности моделей, учитывая недостаточно большие объемы обучающих выборок при количественной оценке тяжести состояний исследуемых больных, применена серия тестирований на данных, не участвовавших в обучении, средние результаты которой представлены в табл. 1.
Таблица 1
Средние результаты серии тестов на данных, не участвовавших в обучении при количественной оценке риска вероятностными методами, использующих одномерные и двумерные признаки
Стратегия Интервальные структуры Интервальные и бинарные структуры
Se, % Sp, % Se, % Sp, %
Байеса 63,8±2,5 80,9±1,2 71,2±2,7 84,3±1,4
Байеса (многошаговая) 82,5±3,1 82,8±2,1 84,1±3,2 84,7±2,3
Вальда 60,б±4,2 71,6±1,4 66,9±4,3 70,9 ±1,7
Примечание: серия из 10 тестов; признаков: одномерных - 55, двумерных - 52; всего больных - 1172, группа А) - 904, группа Аг - 268; обучающие - 70%, тестируемые - 30%.
В табл. 1 приведены значения параметров, часто используемых в медицине для оценки качества моделей диагностики - чувствительность (Бе) и специфичность (Эр), являющиеся аналогами ошибок первого и второго рода теории принятия решений Неймана. Чувствительность определятся как доля лиц с положительным результатом теста в популяции с изучаемым заболеванием. Специфичность - это доля лиц с отрицательным результатом теста в популяции без изучаемой болезни. При использовании данных критериев точности модели оптимальным следует считать одновременно высокочувствительный и высокоспецифичный диагностический тест.
1Л
Для повышения эффективности работы указанных стратегий распознавания образов, разработаны и реализованы алгоритмы поиска набора факторов риска:
1. Оптимальный набор
• Количество и порядок признаков одновременно обеспечивают .максимумы чувствительности и специфичности
2. Взаимодополняющие наборы
• Количество и порядок признаков обеспечивает максимум чувствительности
• Количество и порядок признаков обеспечивает максимум специфичности
Средние результаты серии тестирований вероятностных методов, использующих факторы риска, представлены в табл. 2.
Таблица 2
Средние результаты серии тестов на данных, не участвовавших в обучении при количественной оценке риска вероятностными методами, использующих
факторы риска
Стратегия Оптимальный набор Взаимодополняющие наборы
Se, % Sp, % Se, % Sp, %
Байеса 76,6±2,6 92Д±1,3 92,3±2,8 97,4±1,б
Байеса (многошаговая) 91,4±3,2 93,7±2,2 95,8±3,3 98,2±2,5
Вальда 70,2±4,3 9б,5±1,7 93,5±4,5 97,4±1,9
Примечание: серия из 10 тестов; наборы признаков: оптимальный - 73, взаимодополняющие - 71 (max Se) и 97 (шах Sp); всего больных - 1172, группа Aj - 904, группа А2 - 268; обучающие - 70%, тестируемые - 30%.
Как видно из табл. 1 и табл. 2, вероятностные модели больше смещают оценку риска в сторону специфичных тестов, т.е. при оценке вероятности летального исхода операции метод не выявляет опасного состояния в ряде случаев. Однако следует отметить некоторые особенности анализа информации вероятностными методами:
• нет необходимости предварительной обработки количественных данных, только кодирование качественных данных;
• возможность обработки данных с распределениями вероятности любого вида. Методы являются непараметрическими т.е.
характеристики распределения (среднее значение, стандартное отклонение) не влияют на результат;
• возможность обработки данных с пропусками значений признаков у конкретного пациента, что в медицинской практике является нормой, так как всеобъемлющие лабораторные тесты проводятся крайне редко;
• возможность выявления дифференциально-диагностических границ значений признаков, что достаточно важно, так как и в пределах нормы заключена диагностическая информация;
• возможность выделения факторов риска - оптимального набора признаков для диагностики;
• возможность обучения и дообучения методов. Результаты проведенного единожды анализа данных компактно представляются в виде набора интервальных и бинарных структур, использование которых с вероятностными методами распознавания образов позволяет оценивать операционный риск состояния пациента, данные которого не участвовали в обучении.
Таким образом, на данном этапе оценена эффективность и проведен расчет количественной оценки операционного риска у больных желчнокаменный болезнью с помощью вероятностно-статистических методов распознавания образов. Так как анализ вероятностно-статистических методов выявил более высокую специфичность, когда требуется также и высокая чувствительность, необходимо рассмотреть другие модели оценки операционного риска, например, нейросетевые модели.
В третьей главе диссертационной работы «Нейросетевые методы оценки операционного риска» обосновывается выбор модели искусственных нейронных сетей (ИНС) для количественной оценки риска операции, рассматривается выбор оптимальной архитектуры ИНС. Также приводятся результаты количественной оценки операционного риска у больных ЖКБ, анализируется эффективность данного вида ИНС для оценки риска, и сравниваются методики обработки медико-биологических данных нейросетевыми моделями и вероятностно - статистическими методами.
Показано, что применение многослойных искусственных нейросетей прямого распространения, обучаемых по алгоритму обратного распространения ошибки, также называемых многослойным персептроном, наиболее эффективно для количественной оценки операционного риска. Данный вид ИНС в ряде областей используют для решения задач распознавания образов и
классификации, также применяют и в медицине для прогнозирования и диагностики. Благодаря способности многослойного персептрона к обобщению анализируемой информации, при обучении неявным образом выявляются взаимосвязи между входными и выходными данными. Результат работы каждого выходного нейрона обученной нейросети носит нечеткий характер и дает количественную оценку уверенности в соответствии входных данных выходным. Таким образом, при распознавании тяжелого, угрожающего состояния на выходе нейросети мы получаем количественную оценку уверенности наличия этого состояния, тем самым количественно оцениваем риск. Кроме того, для обученной нейросети можно количественно оценить вклад каждого входного нейрона при распознавании. Тем самым можно выделить набор наиболее информативных при оценке риска признаков -комплекс факторов риска.
Для количественной оценки наличия опасного состояния достаточно одного выходного нейрона, однако, учитывая возможность использования ИНС для диагностики, также возможно и наличие двух выходных нейронов. Таким образом, структура нейросети для оценки операционного риска может быть следующей: количество входных нейронов равно количеству исследуемых признаков; скрытых слой, количество нейронов в котором заранее неопределенно и выходной слой - один или два нейрона.
В качестве активационной функции нейронов выбрана экспоненциальная сигмоидная функция, применяемая в большинстве случаев в ИНС для прогнозирования и диагностики (5):
У = /(«) = 777——г; (5)
где у - значение выхода нейрона, а - характеристика "экспоненциальной сигмоидальной функции; 5 - входной сигнал нейрона, рассчитываемый по формуле (б):
N
5 = (6)
где н> - вес синапса (связи нейронов), х - значение входного сигнала, Ь -смещение нейрона. Формулы (5) и (6) представляют математическую модель нейрона, с частным случаем сигмоидной экспоненциальной функцией активации.
Так как нейросети способны обрабатывать лишь количественную информацию, большую роль играет предварительная обработка данных. Предобработку клинико-лабораторных данных больных можно разделить на три этапа:
1) восстановление, пропущенной при сборе, недостающей информации, если таковая имеется;
2) предобработка количественной информации;
3) предобработка качественной информации.
Проблема частичного отсутствия статистических данных является характерной для медико-биологических данных. Связано это со многими причинами сбора и хранения информации в медучреждениях, а также с невозможностью проводить полное обследование каждого пациента. Так, для оценки операционного риска значения клинико-лаборатоных показателей фиксировались в 7-дневный предоперационный период, а при плановом лечении лабораториями контролируются только те симптомы, значения которых не соответствуют общепринятым нормам. Поэтому нейросетевая обработка данных для оценки риска у больных ЖКБ была бы невозможна без восстановления пропущенной информации.
Пропущенные, недостающие данные больных желчно-каменной болезнью были восстановлены предложенным нами методом, который описывается в четвертой главе диссертационной работы. При этом возникла необходимость сокращения общего объема статистического материала: всего больных-686, А, -497, А2- 189.
Количественные данные представлены в безразмерном виде путем масштабирования к единой шкале [0:1] по формуле (7):
(7)
Предварительная обработка качественных данных заключалась в бинарном кодировании числовыми значениями наличия либо отсутствия того или иного качественного показателя: 0-отсутствует; 1-присутствует. Так же закодированы данные о летальном исходе операции: 1-летальный исход; 0-успешная операция.
Численный эксперимент для анализа эффективности модели многослойного персептрона при количественной оценке операционного риска состоял в следующем. Прошедшие предварительную обработку данные использовались для обучения и тестирования различных архитектур нейросетей с сигмоидной экспоненциальной функцией активации, имевших на выходе один и два нейрона. Для поиска наиболее эффективных архитектур нейросети в эксперименте анализировались чувствительность (Бе) и специфичность (Бр) многослойного персептрона. Эксперимент состоял в итеративном переборе четырех параметров нейросетей: это количество слоев скрытого слоя (от 1 до 3); количество нейронов в каждом слое скрытого слоя (от 5 до 30 с шагом 5);
характеристика сигмоида (от 0,5 до 3,5 с шагом 0,5) и скорость обучения (от 0,1 до 0,7). Таким образом, было обучено 882 различных архитектур с одним выходным нейроном и 882 архитектур с двумя выходными нейронами. В табл. 3 представлены характеристики качества работы трех архитектур нейросетей, средние значения безошибочности которых в серии тестирований оказались наибольшими.
Таблица 3
Средние результаты серии тестов на данных, не участвовавших в обучении при количественной оценке риска нейронными сетями,
использующих все признаки
Один выходной нейрон Два выходных нейрон
Архитектура нейросети Результаты Архитектура нейросети Результаты
Слоев Нейронов в слое Se, % Sp, % Слоев Нейронов в слое Se, % Sp, %
2 5 97,3±5,2 98,5±1,9 2 20 94,6±5,3 95,9±1,8
2 5 9б,1±4,8 98,1±1,7 2 5 93,3±5Д 95,4±1,9
2 10 94,6±5Д 97,3*1,8 2 25 93,3±4,9 9б,4±1,7
Примечание: серия из 10 тестов; входных нейронов (признаков) - 55; всего больных - 686, группа Ai - 497, группа Аг - 189; обучающие - 70%, тестируемые - 30%.
Для поиска комплекса факторов риска использован метод оценки информативности, основанный на градиенте функции оценки по входным сигналам и обучаемым параметрам сети. Проанализировав относительную значимость входов нейросетей, указанных в табл. 3-, были выделены 46 наиболее информативных признаков. С использованием наиболее информативных признаков проведен аналогичный описанному выше численный эксперимент, результаты которого приведены в табл. 4.
Следует отметить незначительное снижение точности нейросетей, обученных на факторах риска, однако, выделенные наиболее информативные признаки, по мнению эксперта, соответствуют действительности. Анализируя показатели чувствительности и специфичности количественной оценки операционного риска у больных ЖКБ при помощи нейросетевых моделей, следует отметить что, обработка медико-биологических данных многослойными ИНС является высокочувствительным и высокоспецифичным тестом. То есть при оценке операционного риска с помощью нейросетей количество ошибочных ответов, как и количество нераспознанных состояний, будет допустимо малым.
Таблица 4
Средние результаты серии тестов на данных, не участвовавших в обучении при количественной оценке риска нейронными сетями, использующих комплекс факторов риска
Один выходной нейрон Два выходных нейрон
Архитектура нейросети Результаты Архитектура нейросети Результаты
Слоев Нейронов в слое Бе, % Бр, % Слоев Нейронов в слое Бе, % Бр, %
2 5 89.б±5,2 91.8±1,9 1 10 97,4±4,8 74,3±1,8
1 5 84.4±5,0 91.2±1,8 1 5 94,8±5,3 83,б±1,8
1 5 84.4±4,8 91.8±1,б 1 5 92,2±5,2 91,2±1,9
Примечание: серия из 10 тестов; входных нейронов (признаков) - 46; всего больных - 686, группа А] - 497, группа Аг -189; обучающие - 70%, тестируемые - 30%.
Также проведен сравнительный анализ вероятностных и нейросетевых моделей для оценки тяжести предоперационных состояний больных. В табл. 5 представлены основные характеристики, достоинства и недостатки, вероятностных и нейросетевых методов, выявленные в ходе исследований по количественной оценки операционного риска у больных ЖКБ.
Таблица 5
Основные характеристики вероятностно - статистических и нейросетевых методов
Характеристика методов
¡И II
00 =г
Ь £ ш 5
Т
ГО
ьг ю х х
ф и §
О О-
з-
с; _
5 °
т о о. о
го
•ей) х
X 01
5
3 л т
х го
1 3
2 а §
с и 5
3
ё ю
¡5 о.
О ° Е с с
г о £ С£ I х о -О х
<г 5 а
0 ь
Ш 3
1
2 Э
а. с
£5 к
21 и ю
о го
£ >
3 О.
=г о
X -в-§.1Й
01 И.
ГГ с
т о:
0 I
С ш
о: Й
1
1 5 £&
ю
Вероятностно -статистические методы
Нейросетевые методы
О>
О) >. 2
х х 5 г
X о •©• ь
* Ь » 1
о;
г
8
5
ГО С1
го
го =Г
01 х
го Ч
О)
X
го СГ
го
о:
го
а
V-01 X
& X
Таким образом, при разработке автоматизированной системы количественной оценки операционного риска, исходя из характеристик методов, вероятностные модели можно порекомендовать для предварительной обработки клинико-лабораторных данных и поиска факторов риска, в то время как нейросетевые методы - для построения высокоточных моделей для оценки операционного риска.
Учитывая имеющийся средний процент летальных исходов после операции у больных желчно-каменной болезнью в Больнице №5 г. Барнаула (около 15%), можно предполагать что, применение нейросетевых технологий для оценки риска операций поможет снизить уровень летальности.
В четвертой главе диссертационной работы «Автоматизированная система количественной оценки риска (АСКОР)» описывается архитектура и идеология системы, раскрывается назначение каждого объекта системы, определяется область применения системы.
Система АСКОР разрабатывалась как наиболее удобный инструмент медицинского работника для скорейшего достижения цели - количественной оценки риска интересующей клинической ситуации. АСКОР по сути, является экспертной объектно-модульной системой поддержки принятия клинических решений посредствам анализа нейросетевыми и вероятностно статистическими методами клинико-лабораторных данных и извлечения знаний из эмпирической информации. Результатом обработки данных является основной объект системы - компьютерный образ состояния, содержащий информационные структуры, отражающие взаимосвязи между интересующей клинической ситуации и эмпирической информацией (Рис. 1).
Клинический образ болезни
Эмпирические данные
Цели и задачи
разработки
Конструктор оболочки предметной ^
области
Математические инструменты V— анализа данных
Компьютерный образ состояния
Система бланков База знаний
Рис. 1. Соотношения основных объектов системы
Система АСКОР включает:
1. Менеджер проектов.
2. Конструктор оболочки предметной области (генератор компьютерного образа состояния).
3. Информационную систему бланков, для удобного и быстрого ввода клинической, лабораторной и инструментальной информации.
4. Исследовательский модуль - математический инструментарий адекватного анализа эмпирических данных.
5. Систему управления базой данных.
6. Механизм формирования базы знаний на основании результатов работы исследовательского модуля.
7. Экспертный модуль, обеспечивающий общение с базой знаний и предоставляющий данные для поддержки принятия решений.
Конструктор оболочки предметной области - это модуль, создающий систему бланков для сбора медико-физиологических данных, здесь так же конкретизируются клинические ситуации, распознавание которых проводит экспертный модуль, и происходит обработка статистического материала (исследовательский модуль).
Исследовательский модуль содержит следующие функции:
• предварительная обработка данных: восстановление пропущенной при сборе информации, кодирование качественных и преобразование количественных данных;
• формирование интервальных структур и бинарных структур - анализ распределений значений признаков в вероятностном пространстве;
• поиск комплекса информативных признаков - факторов риска;
• обучение нейронных сетей и вероятностных стратегий распознавания;
• вычисление критериев качества работы системы.
При желании пользователя по результатам работы исследовательского модуля может быть сформирован подробный отчет, в котором поэтапно отражены процесс обработки данных и результаты тестирования.
Для восстановления пропущенной информации в АСКОР реализованы два метода; заполнение пропусков наиболее вероятными значениями по выборке и предложенная нами модификация разработки Лаборатории неравновесных систем Института вычислительного моделирования .СО РАН (г. Красноярск). Данный метод представляет собой итерационный процесс построения последовательности одномерных квазилинейных моделей, в
результате которого исходная таблица данных с пропусками представляется в виде, дающем способ правдоподобного восстановления пропущенных данных и аппроксимирующем известные данные.
Процесс принятия решений в АСКОР схематично изображен на рис. 2. Посредствам системы бланков, взаимодействующей с базой знаний, формируется компьютерный образ состояния пациента. Экспертный модуль обеспечивает количественную оценку соответствия компьютерного образа пациента распознаваемому состоянию нейросетевыми и вероятностно -статистическими методами.
Рис. 2. Процесс принятия решений в АСКОР
Результатом работы экспертного модуля является отчёт экспертизы, в котором фиксируются:
• значения всех медико-биологических показателей пациента;
• результаты количественной оценки риска (тяжести) состояния, на основе которых могут приниматься решения о назначении или изменении планового клинического лечения;
•таблица факторов риска конкретного пациента - признаки, значения которых отражают патологию тех или иных органов. Таким образам, разработанная и реализованная нами система АСКОР реализует эффективные методы анализа и обработки медико - биологических данных, и может применяться для:
в количественной оценки риска операций;
• количественной оценки тяжести клинических ситуаций;
• диагностики и прогнозирования одного из двух альтернативных
заболеваний;
• поддержки принятия клинических решений.
Рабйта системы АСКОР протестирована на двух проектах количественной оценки операционного риска больных механической желтухой и желчно - каменной болезнью и внедрена для практического применения в двух больницах Алтайского края. Также, полечена официальная регистрация экспертного модуля АСКОР.
В заключении диссертации формулируются основные выводы, приводятся важнейшие результаты работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
В ходе проведенного исследования решены поставленные задачи и достигнуты следующие результаты:
1. Поэтапно проанализирован процесс обработки данных пациентов с желчно-каменной болезнью вероятностно-статистическими и нейросетевыми методами, проведена сравнительная характеристика моделей.
2. Выявлено, что для эффективной количественной оценки операционного риска у больных желчно-каменной болезнью необходимо совместное использование вероятностно-статисТйческих и нейросетевых'методов.
3. Обосновано использование вероятностно-статистических методов для предварительной обработки данных и поиска факторов, риска, в то время как нейросетевых методов - для получения высокоточных моделей количественной оценки операционного риска.
4. Выявлен комплекс факторов риска - набор наиболее информативных признаков при оценке тяжести предоперационного состояния больных желчно - каменной болезнью.
5. Предложены и обучены архитектуры искусственных нейронных сетей, способные количественно оценивать операционный риск, проводить диагностику предоперационных состояний больных ЖКБ и прогнозировать исход операции.
6. Создан программный комплекс, реализующий автоматизированную систему количественной оценки операционного риска «АСКОР» у больных желчно - каменной болезнью и внедрен в двух больницах Алтайского края.
ПУБЛИКАЦИИ ПО ТЕМЕ ИССЛЕДОВАНИЯ
1. Драгун И.А. Компьютерная технология в оценке операционного риска //Физика, радиофизика - новое поколение в науке. Сб. науч. работ молодых ученых, Вып. 2, Изд. АГУ, Барнаул, 2001, - с.29 - 32.
2. Драгун И.А. Применение непараметрических критериев статистики в компьютерной оценке степени риска предоперационного состояния больных механической желтухой //Физика, радиофизика - новое поколение в науке. Сб. науч. работ молодых ученых, Вып. 3, Изд. АГУ, Барнаул, 2002, - с.22 - 24.
3. Драгун И.А. Поддержка принятия решений при операциях у больных механической желтухой // Труды Междунар. конф. молодых ученых по мат. моделир. и информ. техн-ям. г. Новосибирск, 29-31 окт. 2002 г. - с.74-76.
4. Драгун И.А. Применение математических методов в клинической медицине // Интеллектуальный потенциал учёных России - 2002: Сб. статей. - Барнаул, Изд-во БЮИ, 2002. - с. 34-36.
5. Устинов Г.Г., Поляков В.В., Драгун И.А. Формализованная оценка степени операционного риска // Вестник АНЦ СО АН ВШ. 2003 г. №1. - с. 54-58.
6. Драгун И.А. О возможности нейросетевой оценке степени операционного риска //Физика, радиофизика - новое поколение в науке. Сб. науч. работ молодых ученых, Вып. 4, Изд. АГУ, Барнаул, 2004, - с.51 - 54.
7. Драгун И.А., Поляков В.В., Устинов Г.Г., Зацепин П.М. Система «Медэксперт» для диагностики и оценки степени операционного риска // Труды Третьей междисциплин, конф. конференция («НБИТТ-21»). г. Петрозаводск, 21-23 июня. 2004 г. - с.21-22.
8. Драгун И.А., Поляков В.В., Устинов Г.Г., Зацепин П.М. О возможности нейронечеткой оценки степени операционного риска // Нейроинформатика и ее приложения: Материалы XIII всероссийского семинара. Красноярск, 2004. С. 60-62.
9. Драгун И.А. Предобработка данных для нейросетевой оценки операционного риска // Нейроинформатика и ее приложения: Материалы XIII всероссийского семинара. Красноярск, 2005. - с. 74-76.
10. Драгун H.A.; Устинов Г.Г.; Зацепин ГШ. Нейросетевые методы оценки степени операционного риска // Известия АлтГУ 1(45). Барнаул, 2005. С. 102-104.
11. Драгун И.А. Предобработка данных для нейросетевой оценки операционного риска // Известия АлтГУ 1(49). Барнаул, 2006. С. 147-148.
12. Использование нейросетевого алгоритма встречного распространения для анализа степени операционного риска / П.М. Зацепин, C.B. Радюк, М.А. Санталов, И.А. Драгун, Г.Г. Устинов // Нейроинформатика и ее приложения: Материалы XIII всероссийского семинара. Красноярск, 2006. -с. 74-7б.
13. Автоматизированная информационная система количественной оценки операционного риска / Драгун И.А., Поляков В.В., Устинов Г.Г., Зацепин П.М. // Нейроинформатика и ее приложения: Материалы XIII всероссийского семинара. Красноярск, 2006. - с. 77-79.
14. Драгун И.А., Поляков В.В., Устинов Г.Г., Зацепин П.М. Прогнозирование летального исхода операции больных механической желтухой (прогнозирование). Per. номер 2006611654 (17.05.2006) // Официальный бюллетень «Изобретения. Полезные модели» 2006. №3 (56). С. 116.
Подписано к печати 23.11.2006
Формат 60x84/16 Печать офсетная
Бесплатно Уч. - изд. л. 1.0
Тираж 100 экз._Заказ ¿Ш_
Типография Алтайского государственного университета 656049, г. Барнаул, ул. Димитрова, 66
с?оозЛ
Оглавление автор диссертации — кандидата технических наук Драгун, Игорь Анатольевич
Введение.
I. MAI Е MATH ЧЕС КИЕ МЕТОДЫ В МЕДИЦИНЕ.
I. I. Применение математических методов в медицине.
1.2. Методика количественной оценки операционного риска.
1.3. Медицинские критерии оценки точности методов.
1.4. Общая характеристика эмпирического материала.
1.5. Основные этапы разработки медицинских информационных систем поддержки принятия решений.
1.6. Выводы.
И. ВЕРОЯТНОСI НО - СТАТИСТИЧЕСКИЕ МЕТОДЫ
КОЛИЧЕС'1 ВЕННОЙ ОЦЕ1 ПСИ ОПЕРАЦИОННОГО РИСКА.
2.1. Концепция различия и уровень значимости.
2.2. Введение вероятностной меры в пространство признаков.
2.3. Критерий информативности Кульбака.
2.4. Формирование интервальных и бинарных структур.
2.5. Стратегия распознавания образов Байеса.
2.6. Стратегия распознавания образов Вальда.
2.7. Многошаговая Байесовская стратегия распознавания образов.
2.8. Ajii оритмы поиска факторов риска.
2.9. Анализ результатов количественной оценки операционного риска у больных желчно - каменной болезнью вероятностно - статистическими методами.
2.10. Выводы.
III. НЕЙРОСЕТЕВЫЕ МЕТОДЫ КОЛИЧЕСТВЕННОЙ ОЦЕНКИ
Ol IEPAIJHOIIIЮГО РИСКА.
3.1. Обзор нейросетевых методов и их возможностей.
3.2. Обоснование выбора многослойной нейросети с последовательными связями.
3.3.11редобрабогка медико - биолог ических данных для нейросетевой количественной оценки риска.
3.4. Анализ результатов количественной оценки операционного риска у больных желчно - каменной болезнью нейросетевыми методами.
3.5. Сравнительный анализ вероятностных и нейросетевых методов для количественной оценки операционного риска.
3.6. Выводы.
IV. АВТОМАТИЗИРОВАННАЯ СИСТЕМА КОЛИЧЕСТВЕННОЙ ОЦЕНКИ
0Г1ЕРАЦИ011Н0Г0 РИСКА.
4.1. Идеология и архитектура системы.
4.2. Компьютерный образ клинической ситуации.
4.3. Исследовательский модуль.
4.4. База данных ЛСКОР.
4.5. Информационная система бланков.
4.6. База знаний АСКОР.
4.7. Экспертный модуль и процесс принятия решений.
4.8.11роект системы АСКОР «Оценка операционного риска у больных
ЖКБ».
4.9. Выводы.
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Драгун, Игорь Анатольевич
Актуальное и». В настоящее время исследования и разработки в различных областях науки и техники нреднола1ают обработку больших объемов информации связанной с описанием состояния и поведения исслед>емых объектов. Это предполагает применение различных методов, а также поиск и создание моделей ее обработки. Вместе с необходимостью применения математических моделей для описания состояний и поведения объектов растут и требования к эффективности этих моделей. Эти вопросы являются особенно актуальными в таких областях как обработка аэрокосмической информации, геофизических, медико-биоло1ических данных и пр.
Анализ видов математических моделей [1], используемых в медицине, показал, что модели, отражающие процессы регулирования в биологических системах как процессы с обратными связями в виде замкнутых контуров регулирования или хотя бы как процессы с прямыми связями и уравнениями взаимосвязей между звеньями регулирующих систем, встречаются относительно редко. Этот факт по существу соответствует теоретическим концепциям биокибернетики, общей кибернетики и общей теории систем, согласно которым организм человека и высших животных относятся к очень сложным по своей природе системам с недетерминированным поведением. Поэтому из>чение патологических состояний человека ведется с позиций системною подхода, чаще всею, путем статистической проверки определенных I инотез.
На практике, при проведении планово! о лечения пациентов, основываясь на собственном опыте, врач - клиницист ставит диагноз, качественно оценивает степень тяжести состояния больного, оценивает риск проведения лечебных мероприятий [2]. В ситуациях с тяжело >С1анавливаемым или неясным диапюзом часто очень важно количественно оценить тяжесть заболевания, в то время как универсальных методов количественной оценки тяжести не существует.
Одной из наиболее важных проблем в современной медицине является сложность количественной оценки онерационною риска. Оценка операционною риска подразумевает оценку степени тяжести предоперационною состояния пациента при угрозе летального исхода или возможных послеоперационных осложнений [3]. Сложность оценки степени тяжести состояния обусловлена большим количеством симптомов, различных д 1я каждого заболевания и большой лабильностью клинических проявлений заболевания. На практике степень тяжести состояния пациента определяется качественно. При этом используется небольшой набор (5-10) симптомов или факторов риска, значения которых наиболее явно отражают заболевание пациента, в то время как менее значимые симптомы не учитываются. Поэтому одним из путей повышения эффективности оценки операционного риска является применение математических методов анализа данных и разработка проблемно-ориентированных систем обработки информации.
Данная диссертационная работа посвящена разработке автоматизированной системы для количественной оценки операционного риска при любом заболевании пациента. Разработка системы ведется с позиций системного подхода и основывается на применении известных математических моделей, адекватно описывающих состояние пациента. Исследования по количественной оценке операционного риска проводились на статистическом материале больных желчно - каменной болезнью (ЖКБ), прооперированных за последние 12 лет (1990 - 2002 п\) в Больнице № 5 г. Барнаула. Выбор именно желчно - каменной болезни обусловлен её частотой и достаточно высокой послеоперационной летальностью при осложнениях. Создание такой системы позволит более точно оценивать степень тяжести предоперационного состояния при определенном заболевании пациента и своевременно проводить лечебные мероприятия. Использование проблемно-ориентированной системы поддержки принятия решений поможет повысить оперативность действий врачей - клиницистов и снизить уровень субъективизма при проведении лечения больных ЖКБ.
Состояние вопроса. Исследования по поиску математических моделей, наиболее эффективно отражающих поведение организма пациента в условиях патологии, ведутся не один десяток лет [3, 4, 5, 6, 7, 8]. Однако следует привести некоторые особенности имеющихся на данный момент достижений в области оценки тяжести состояний больных:
• большинство методик разрабатываются для конкретных заболеваний, и часто оказываются непригодными для ряда других;
• анализ данных ведется статистическими методами, а большинство выводов статистических исследований делается при условии нормальности распределений данных, что не справедливо для всех меди ко - биологических показателей;
• недостаточно хорошо изучена значимость многих факторов, оказывающих влияние на постановку диагноза, и часто в исследованиях изучаются лишь ге признаки, которые, по мнению врача, наиболее явно отражают заболевание; • из-за сложности обработки данных не всегда применяются наиболее мощные критерии и медики ограничиваются, например, линейным приближением или степенным уравнением. Цель исследования. Цель работы заключается в разработке эффективной математической модели интегральной количественной оценки тяжести предоперационного состояния больных ЖКБ, а также в разработке проблемно - ориентированной системы анализа медико-биологической информации и количественной оценки операционного риска. Основные задачи исследования:
1. Анализ известных методик количественной оценки степени операционного риска.
2. Исследование эффективности вероятностных и нейросетевых моделей для количественной оценки операционного риска больных желчно -каменной болезнью.
3. Разработка алгоритмов выделения комплекса факторов риска - набора наиболее значимых симптомов при оценке тяжести заболевания.
4. Разработка программного продукта, реализующего систему анализа клинико-лабораторных данных, поиска факторов риска и количественной оценки операционного риска для больных желчнокаменной болезнью.
Научная новизна работы заключается в достижении следующих научных результатов:
1. Обоснована эффективность совместного применения вероятностной и нейросетевой математических моделей для высокоточной и разносторонней количественной оценки степени операционного риска.
2. Предложены алгоритмы поиска и найден комплекс факторов риска -наиболее значимых признаков при оценке тяжести предоперационного состояния больных ЖКБ.
3. Разработаны нейросетевая и вероятностная модели количественной оценки операционного риска больных желчно-каменной болезнью.
Положения, выносимые на защиту.
1. Вероятностная и нейросетевая модели количественной оценки операционного риска, совместное использование которых позволяет провести высокоточный и разносторонний анализ клинико-лабораторных данных больных ЖКБ.
2. Алгоритмы выделения комплекса факторов операционного риска больных желчно - каменной болезнью, заключающих в себе основную диагностическую информацию.
3. Реализация автоматизированной системы количественной оценки операционного риска у больных желчно-каменной болезнью, позволяющая рассчитать степень тяжести предоперационного состояния больного, провести диагностику основных осложнений и спрогнозировать возможные исходы операции.
Теоретическая значимость результатов работы. Исследования по оценке операционного риска у больных желчно-каменной болезнью показали, что вероятностно-статистические и нейросетевые модели позволяют эффективно количественно оценивать тяжесть предоперационного состояния пациентов, а также выделять комплекс наиболее значимых симптомов при оценке тяжести заболевания. Вероятностно-статистические методы позволяют провести анализ распределений значений симптомов, выделить дифференциально-диагностические границы диапазона значений признаков, превышение которых существенно при рассматриваемой клинической ситуации. Нейросетевые методы анализа данных позволяют создавать высокочувствительные и высокоспецифичные структуры нейронных сетей, использование которых дает высокую точность при количественной оценке операционного риска. Таким образом, совместное использование вероятностных и нейросетеых моделей в автоматизированной системе количественной оценке риска позволяет провести высокоточный и разносторонний анализ данных. При этом вероятностные модели можно порекомендовать для быстрой, предварительной обработки клинико-лабораторных данных, в то время как нейросетевые методы - для более точного анализа информации при оценке операционного риска.
Предложенные в работе методы и модели интегральной оценки состояний объектов могут эффективно применяться также в биологии, экономике, технике и прочих предметных областях, в которых существует необходимость в обработке больших объемов слабо формализованных данных.
Практическая значимость результатов работы. Использование вероягностно-сгагистических и нейросетевых моделей составляет практическою основу для построения автоматизированной системы количественной оценки степени операционного риска. Рекомендации системы могут использоваться врачами для поддержки принятия решений о тяжести предоперационного состоянии больного желчно-каменной болезнью. Нейросетевая система расчета степени тяжести состояния может эффективно применяться не только для оценки степени операционного риска, но и для прогнозирования послеоперационных исходов у больных ЖКБ, а гакже можег осуществлять диагностику основных осложнений желчно-каменной болезни. Оценка риска, прогнозирование и диагностика могут осуществляться без привлечения высококвалифицированных экспертов в условиях периферических медицинских учреждений. Использование проблемно-ориентированной системы поддержки принятия решений может повысить оперативность принятия решений и снизить уровень субъективизма при проведении лечения больных ЖКБ.
Основные результаты диссертационной работы реализованы в виде программною комплекса «АСКОР» для оценки тяжести состояний больных ЖКБ, внедренною в двух медицинских учреждениях Алтайского края и использующеюся в медицинской практике.
Публикации. По теме диссертации опубликовано 14 печатных работ, в том числе 3 статьи в сборниках статей, 11 тезисов докладов на конференциях. Получена одна официальная регистрация программною продукта, реализующего экспертный модуль «АСКОР».
Апробация результатов. Основные положения и отдельные результаты исследования докладывались и обсуждались на международной конференции по математическому моделированию и информационным технологиям (Новосибирск, 2002), XII всероссийском научном семинаре «Нейроинформатика и ее приложения» (Красноярск, 2004), 3-й междисциплинарной конференции «ПБИТТ-21» (Петрозаводск, 2004), XIII всероссийском научном семинаре «Нейроинформатика и ее приложения» (Красноярск, 2005), XIV всероссийском научном семинаре «11ейроинформатика и ее приложения» (Красноярск, 2006).
Внедрение. Программа для ЭВМ Автоматизированная система количественной оценки операционного риска «АСКОР» была внедрена в двух клинических больницах Алтайского края. В Алтайском юсударственном университете на физико-техническом факультете в учебном процессе испольювалась реализованная в программе для ЭВМ модель диагноешки.
Оруктура работы. Во введении обоснована актуальность исследования, определены цели, задачи, объект, предмет, методы исследования. Раскрыты научная новизна, теоретическая и практическая ценность, сформулированы положения, выносимые на защиту. Указывается новизна разработок, апробация результатов и их внедрение.
В первой главе диссертационной работы «Методы математического моделирования в медицине» определены понятия операционный риск, диагностика и прогнозирование заболеваний, обозначена методика количественной оценки операционного риска. Рассмотрены математические модели, наиболее часто применяемые в медицине для оценки тяжести состояний и диагностики. Изложены основные идеи математического подхода, в рамках которого производится системный анализ и формализация процесса эмпирической диагностики. Также рассмотрены способы построения проблемно - ориентированных систем диагностики и оценки тяжести состояний пациентов с помощью вероятностно - статистических и нейросетевых методов.
Во второй главе диссертационной работы «Вероятностно -статистические методы оценки операционного риска» приведены результаты исследований эффективности непараметрических вероятностно -статистических методов анализа информации для количественной оценки операционной) риска больных желчно - каменной болезнью.
В третьей главе диссертационной работы «Нейросетевые методы оценки операционною риска» обосновывается выбор модели искусственных нейронных сетей (ИНС) для количественной оценки риска операции, рассматривается выбор оптимальной архитектуры ИНС. Также приводятся результаты количественной оценки операционного риска у больных ЖКБ, анализируется эффективность данного вида ИНС для оценки риска, и сравниваются методики обработки медико-биологических данных нейросетевыми моделями и вероятностно - статистическими методами.
В четвертой главе диссертационной работы «Автоматизированная система количественной оценки риска (АСКОР)» описывается архитектура и идеология системы, раскрывается назначение каждого объекта системы, определяется область применения системы.
В заключении формулируются основные результаты работы.
I. МАТЕМАТИЧЕСКИЕ МЕТОДЫ В МЕДИЦИНЕ
1.1. Применение математических меюдов в медицине
В медицине и смежных с ней областях математические методы используются для установления степени достоверности и обобщения информации, получаемой в ходе клинических, медико-биологических и лабораторных исследований.
Математические методы в медицине это совокупность приемов формализованного изучения процессов, происходящих в живых организмах, их популяциях, в сфере охраны здоровья, с использованием количественных способов описания явлений и объектов биомедицинской природы, а также связей между ними. Необходимость привлечения математических методов связана, в частности, с отсутствием иных возможностей преодолеть органически присущие изучению биологических объектов трудности: высок) ю вариабельность индивидуальных показателей состояния органов, физиологических систем, биохимических процессов целостного организма в норме и при патолог ии [ 1,10,12].
В развитии прикладных достижений математики в медицине можно выделить 5 основных групп методов, тесно связанных между собой и охватывающих большинство областей биомедицинской науки [9,10,11,12,13]:
1. Анализ клинико-лабораторных данных для выявления природы взаимосвязей показателей жизнедеятельности;
2. Планирование биомедицинских экспериментов;
3. Обработки медико-биологической информации для поддержки принятия решений и получения рекомендаций;
4. Математическое моделирование биомедицинских систем;
5. Реализации процессов управления объектами биомедицинской природы.
Анализ клинических, медико-биологических и лабораторных данных осуществляется с применением подходов теории вероятности и математической статистики. Такие подходы используются, например, для оценки достоверности различий результатов испытаний лекарственных препаратов в экспериментальной и контрольных группах [14]. Статистические методы важны как средство накопления и систематизации информации. При попытках обнаружения связей между наблюдаемыми показателями и для получения обобщающих выводов вероятностно-статисгические методы позволяют выдвинут!» и проверить (подтвердить или опровергнуть) содержательность гипотез о связи изучаемых процессов и явлений путем количественной оценки «силы» взаимосвязей [15,16]. Одним из важных достижений математических методов в медицине, основанных на статистике, является возможность формирования репрезентативных (представительных) выборок [17,18]. Путем ограничения числа объектов, подлежащих обследованиям, удается сэкономить значительные ресурсы (например, при эпидеми0л01ических исследованиях), получив интересующие характеристики явления на основе изучения ограниченного числа наблюдений (например, относительно малых контингентов населения при необходимости установления распространенности тою или иного заболевания).
К первой группе математических методов тесно примыкает так называемое планирование эксперимента - подход, позволяющий достичь поставленных целей наиболее рациональным и экономным способом [12]. При планировании эксперимента специалист (организатор здравоохранения, экспериментатор, врач-лаборант) указывает цель рабопл и характеристики объектов, подлежащие установлению, а математик-консультант определяет минимальное количество объектов, подлежащих исследованию для получения достоверных выводов, объемы измерений, частоту замеров и пр. Математические методы планирования в медицине получают распространение и в связи с ростом технической оснащенности учреждений здравоохранения дорогостоящими высокопроизводительными автоматизированными приборами (биохимическими анализаторами, полиграфами, компьютерными томографами и др.) и необходимостью их наиболее эффективного использования.
Особое направление применения в медицине имеет третья группа математических методов - для обработки медико-биологической информации и принятия решений (получения рекомендаций) на ее основе. Цель методов данной группы - повысить надежность и объективность принимаемых специалистами решений [10,13,19]. При этом, математические методы могут имитировать ход анализа данных или процедуры принятия решений врача либо исследователя, использовать с той же целью чисто математические способы обработки и анализа данных. Третья группа математических методов ориентирована на решение конкретных задач - выявление факторов риска, диагностику, прогнозирование, выбор оптимальной лекарственной терапии и др. Пели задачи диагностики или отнесения объекта исследования к определенному типу (классу) объектов решаются с применением ЭВМ, то говорят о машинной диагностике, автоматической классификации и др. Важное направление этой области математических методов связано с выбором наиболее удобного для специалиста представления информации. Хорошо известные методы систематизации и представления медико-биологических данных (таблицы, графики, номограммы, гистограммы) дополняются чрезвычайно наглядными формами визуального представления информации с помощью ЭВМ [20,21,22,23,24].
Четвертая группа математических методов включает самые разнообразные подходы, направленные на перспективу использования современных средств вычислительной техники и их уникальных возможностей для нужд практического здравоохранения, для решения наиболее актуальных вопросов теоретической медицины и биологии. Они охватывают ряд биомедицинских задач, которые поддаются математическому описанию, например, в виде уравнений, построенных на основе экспериментальных и клинических наблюдений и (или) теоретических соображений [25,26,27,28]. Совокупность уравнений, часто очень сложных, описывающих разнообразные аспекты функционирования объекта (организма, биологической системы) или взаимодействующих объектов, часто называют математическими моделями. Разработка и исследование математических моделей производится в рамках отдельного направления - так называемого математического моделирования. Математические модели наиболее эффективно применяются для изучения воздействия лечебных или повреждающих факторов на организм и отдельные ею системы, прогнозирования развития отдельных направлений медицинской службы и их оснащения ресурсами. Математические модели обсчитываются в различных вариантах на ЭВМ с использованием реальных (например, полученных непосредственно с обследуемого объекта) или ожидаемых теоретических характеристик моделируемых процессов [29,30]. Математические модели строятся и решаются на основе алгоритмов -системы фиксированного числа правил, составляющих формальное описание содержания и последовательности решения задач конкретного типа [31,32,33].
Специализированные математические методы применяют для реализации процессов управления объектами биомедицинской природы [34,35]. Этими вопросами занимается отдельная наука - кибернетика.
Исходя из анализа литературы, для анализа клинико-лабораторных данных и планирования биомедицинских экспериментов уже более 50 лет с успехом применяются методы статистики и теории вероятности. Более того, применение вероятностно-статистических методов для выявления природы взаимосвязей показателей организма является общепринятым и широко используется в практике [36,37]. В то же время, для поддержки принятия решений в диагностике, прогнозировании и пр. применяются самые различные математические подходы. Количество публикаций по данному направлению постоянно растет, однако, общепринятых и широко используемых в клинической практике математических методов не существует. Причины этого носят достаточно сложный характер и постоянно дискутируются. Основные из них связаны с возможностями прикладной математики в медицине и с самой областью применения.
Во-первых, диагностика подразумевает некую количественную оценку состояния пациента, а в условиях большой вариабельности клинических проявлений, изменчивости параметров организма во времени довольно сложно анализировать весь комплекс клинико-лабораторных показателей, необходимых для постановки диагноза в условиях неопределенности [10,12]. Для принятия эффективных диагностических решений удобнее пользоваться небольшим числом параметров, адекватно характеризующих состояние организма. Полому ряд исследований но применению математических методов в клинической медицине направлен на разработку и использование неких интегральных показателей состояния организма, разработку угрозометрических шкал, индексов тяжести и бальных оценок состояния больною [2, 6].
Во-вторых, применение для диагностики математических методов, и как следствие научно-технического прогресса, ЭВМ, имеет психологический аспект, связанный с характером работы врача. Врач является исследователем, и ею работа носит творческий характер, однако он несет прямую ответственность за результат своей деятельности. Принимая решение о диагнозе или лечении, он опирается на знания и опыт, свои собственные и коллег, являющихся для него авторитетом. Очень важно при этом обоснование решения, если оно подсказывается со стороны. Результат, подсказанный компьютерной программой, работающей по алгоритму, созданному другим человеком, во многом лишает исследователя творческой инициативы. Навязанное таким образом решение, даже будучи достоверным, психологически подвергается серьезному сомнению [38,39].
Наибольшее распространение в медицине для решения задач диагностики, назначении лечебных мероприятии, прогнозировании течения заболеваний и и\ исходов получили математические методы распознавания образов [40,41,42,43]. При этом состояние организма больного описывается набором значении клинико-лабораторных признаков, и образует некий образ состояния в пространстве показателей, описанный на математическом языке. Процесс распознавания, по с>ти, соответствует количественному сопоставлению образа состояния пациента образу распознаваемой патологии, полученный при обработке и анализе статистической информации, адекватно описывающей данное заболевание. Среди методов распознавания образов наиболее распространены следующие:
1. параметрические методы, решающие задачу в исходном пространстве признаков; среди них наиболее известны алгоритмы Кора и Форель, нахождение разделяющей гиперплоскости с помощью дискриминантной функции Фишера [44,45];
2. непараметрические методы, использующие введение вероятностной меры в пространстве признаков; среди них наиболее известны методы, опирающиеся на стратегии Байеса, Неймана - Пирсона и Вальда [46,47,48,49,50,51,52,53];
3. меюды, использующие технологию нейронных сетей [54,55,56,57,58].
Параметрические методы используются для оценки тяжести состояний пациентов, эффективности лечения, прогнозирования и выявления осложнений при различных заболеваниях [6, 7]. При этом для построения решающих правил используются кластерный анализ, критерии Стыодента и Вилкоксона, корреляционный и дискриминантный анализы [4]. Для изучения влияния различных факторов риска у детей при неотложных состояниях применяется дисперсионный многофакторный корреляционный анализ, что позволяет прогнозировать исходы лечения наиболее тяжелых больных [5]. Для оценки информативности признаков в [8] используют информационную меру Шеннона, адаптированную к выборкам малою объема, при помощи мноюфакторного анализа выявляются внутренние взаимосвязи между различными клинико-лабораторными показателями.
Параметрические модели основаны на статистически обоснованной аппроксимации эмпирических распределений известными вероятностными законами, чаще всего нормальным законом. Они являются наилучшим способом описания одномерных распределений признаков при условии, что }становлена близость данною эмпирического распределения к существующему теоретическому [42,45]. В противном случае применение данной модели является некорректным и может приводить к противоречивым выводам. Также, применяемые для распознавания образов при параметрическом подходе математические инструменты - Евклидово расстояние, расстояние Махаланобиса и др. - приводят к удовлег верительным результатам при выполнении обременительных условии (нормальности, однородности координат, большого расстояния между образами).
Непараметрические вероятностные модели составляют, пожалуй, наиболее многочисленную группу математических моделей распознавания образов, использ>емых до настоящею времени. При геометрической интерпретации они могут быть легко представлены в пространстве признаков [48,49]. Если изучаемые биообъекты характеризуются одним признаком, то это пространство одномерно, если двумя - двумерно и т.д. В пространстве признаков каждое наблюдение представлено изображающей точкой, группа наблюдений - скоплением точек. Бальные оценки состояния и функциональности организма, применяемые не один десяток лет, также относятся к вероятностным методам. Так, например, в [2] обсуждается разработка бальных шкал для оценки тяжести и прогнозирования исходов у хирургических больных. В [3] приводятся карта риска оперативных вмешательств, содержащая наиболее информативные признаки и балы, соответствующие наличию у пациента определенных градаций признаков. Для получения интегральной характеристики степени риска операции определена зависимость между суммой балов факторов риска и исходами оперативных вмешательств, выделены градации риска операции. В [37] разработана магематическая модель прогнозирования эффективности глюкокортикоидной терапии нефротической формы гломерулонефритом с использованием теоремы Байеса и последовательной процедуры Вальда. Рассматривается использование вероятностных моделей при обработке и интерпретации медико-биологической информации и при создании логико-математических алгоритмов для решения задачи прогнозирования развития патологии и выбора дифференцированной терапии [37].
Как отмечается в работах [46,47,49], согласно теоретическим концепциям биокибернетики, общей кибернетики и общей теории систем, организм человека и высших животных относятся к очень сложным, вероятностным но своей природе системам. Поэтому применение непараметрических вероятностных методов для оценок состояния человеческою организма зачастую дает более удовлетворительные результаты, чем применение параметрических методов статистики.
Наиболее молодым и перспективным в области применения математических методов в медицине является направление технологи искусственных нейронных сетей. Основная составная единица любой искусственной нейронной сети - искусственный нейрон - функционирует подобно своему биологическому прототипу. В целом нейронные сети представляют собой объединения нейронов в определенные структуры и моделируют функциональность отдельных участков мозга.
Благодаря своим основным свойствам - обучаться и обобщать информацию, нейронные сети используются для распознавания образов, ассоциативной памяти, аппроксимации функций и др. В медицине нейросети применяют для решения задач диагностики, дифференциальной диагностики, прогнозирования, выбора стратегии и тактики лечения и др. Так, например, в работе [56] предлагается нейросетевая модель для прогнозирования исходов оперативных вмешательств по поводу ишемической болезни сердца. В [57] нейросетевая модель используется для определения лечебной тактики у больных язвенной болезнью. В [54] нейронные сети применяются для анализа влияния анастезиологических агентов на соматосенсорные пути. След>ет отметить, что правильно обученная нейронная сеть сама собой представляет решающее правило, по которому некоторый вектор входных данных в задаче диагностики или прогнозирования, может быть отнесен к одному из распознаваемых образов. Также нейронные сети способны анализировать диагностическую значимость признаков, значения которых подаются на вход сети. В работах [55,58,59,60] обсуждаются клинико-лабораторные показатели, диагностическая значимость которых оказывалась наибольшей, например, в приложении к желчнокаменным заболеваниям [59] или при прогнозировании осложнений инфаркта миокарда [55].
Богатый потенциал применения математических методов в медицине вместе с распространением дешевых и мощных ЭВМ позволяет разрабатывать диагностические и прогностические программные продукты, призванные осуществлять информационную поддержку медицинской деятельности [61,62,63,64,65]. Как показывает анализ литературы, за последние 10 лет значительно увеличилось количество и уровень компьютерных систем информационной поддержки в медицине [62,63]. Например, в [61] обсуждается информационная система поддержки принятия решений в магнитокардиографии, в работе [64] описывается автоматизированная информационно-аналитическая система
I Отологическая лаборатория». В работе [65] излагается концепция построения компьютерной системы электрокардиорграфической диагностики состояния сердечно-сосудистой системы на основе искусственных нейронных сетей.
Однако, несмотря на достаточно мощную математическую базу, некоторые из важнейших участков лечебно-диагностических технологий практически не используют возможности ЭВМ. Поэтому, одной из актуальных задач на сегодняшний день является разработка и внедрение информационных систем в медицине. Несомненно, это будет способствовать повышению качества диагностической информации, а также надежности и объективности принимаемых специалистами решений.
Заключение диссертация на тему "Автоматизированная система количественной оценки операционного риска"
4.9. Выводы
Проведены исследования но применению математических методов распознавания образов для количественной оценки операционного риска. В ходе исследований показана применимость к задаче количественной оценки риска вероятное пю-статистических методов и математического аппарата нейросетевых технологий. В результате исследований разработана компьютерная программная оболочка - Автоматизированная Система Количественной Оценки Риска (АСКОР), использующая вероятностные и нейросетевые методы распознавания образов.
АСКОР является экспертной объектно-модульной системой поддержки принятия клинических решений посредствам анализа нейросетевыми и вероятностно - статистическими методами клинико - лабораторных данных и извлечения знаний из эмпирической информации. Для применения при различных заболеваниях и клинических ситуациях создаются проекты системы. В режиме разработки проекта, посредствам взаимодействия эксперта-клинициста и компьютера, происходит создание семантическая прагматическая формализация поставленной задачи: это создание информационной системы бланков для ввода кинико-лабораторных данных больных, обработка статистических данных и формирование базы знаний, хранящей решающие правила распознавания состояний пациентов. Результатом обработки данных является основной объект системы -компьютерный образ состояния, содержащий информационные структуры, отражающие взаимосвязи между интересующей клинической ситуации и эмпирической информацией. В режиме выполнения проекта АСКОР пользователь, посредствам общения с системой бланков, базой знаний и экспертным модулем получает всю возможную информацию для поддержки решения поставленных задач и достижения намеченных целей.
Таким образом, результатом проведенных исследований являются разработка и внедрение Автоматизированной Системы Количественной Оценки Риска способной:
1. Структурировать и формализовать эмпирические данные и знания медицинских экспертов - клиницистов;
2. Проводить обработку и анализ вероятностно-статистическими и нейросетевыми методами эмпирическою материала больных: качественных и количественных клинико-лабораторных признаков заболеваний;
3. Выявлять системные взаимосвязи симптомов заболевания и формировать наборы факторов риска - наиболее информативных признаков при количественной оценке 1яжести состояний больных;
4. Осуществлять информационную поддержку принятия клинических решений при диагностике, прогнозировании и оценке степени операционного риска.
-
Похожие работы
- Инструменты и технологии управления операционными процессами взаимодействия финансовых операторов экономических систем
- Автоматизированная система управления операционными рисками банковского платежного электронного документооборота на основе нечетких метрических оценок
- Динамическая итеративная оценка рисков информационной безопасности в автоматизированных системах
- Процессы вирусной атаки на клиент-серверные системы
- Информационное обеспечение управления рисками хозяйственных операций в социально-экономических системах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность