автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Нейросетевая система диагностики вирусного гепатита
Автореферат диссертации по теме "Нейросетевая система диагностики вирусного гепатита"
На правах рукописи
АРТЮХИН Василий Валерьевич
НЕИРОСЕТЕВАЯ СИСТЕМА ДИАГНОСТИКИ ВИРУСНОГО ГЕПАТИТА
Специальности: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей; 05.11.17 - Приборы, системы и изделия медицинского назначения
Автореферат диссертации на соискание ученой степени кандидата технических наук
003161367
ПЕНЗА 2007
003161367
Работа выполнена в государственном образовательном учреждении высшего профессионального образования «Пензенский государственный педагогический университет им. В Г. Белинского».
Научный руководитель - доктор технических наук, доцент
Горбаченко В. И.
Научный консультант - кандидат медицинских наук
Соломаха А. А.
Официальные оппоненты1 доктор технических наук
Иванов А. И.;
доктор технических наук, профессор Геращенко С. И.
Ведущая организация - ОАО «Н1111 "Рубин"»
Защита состоится « 9 » 2007 г., в /V часов, на заседа-
нии диссертационного совета Д 212 186.01 в государственном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, Пенза, ул Красная, 40.
С диссертацией и авторефератом можно ознакомиться в научной библиотеке государственного образовательного учреждения высшего профессионального образования «Пензенский государственный университет» и на сайте университета, www.pnzgu.ru
Автореферат разослан « Я » 2007 г
Ученый секретарь диссертационного совета кам^идвт.технических наук, профессор / у / Шашков Б. Д.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы В настоящее время решающую роль в снижении стоимости медицинского обслуживания при сохранении его качества и повышении эффективности играют информационные технологии
Последнее десятилетие ознаменовано ростом интереса к нейросе-тевым методам обработки информации. Расширяются сферы применения нейросистем. Актуальные задачи практической медицины являются идеальным полем для использования нейросетевых технологий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов.
Наибольший интерес для практического здравоохранения представляют системы диагностики и дифференциальной диагностики заболеваний. При этом для принятия решений могут использоваться самые разнообразные данные1 анамнез, клинический осмотр (создаются экспертные системы диагностики, ограничивающиеся только этим набором), результаты лабораторных тестов и сложных функциональных методов. Список областей медицины, в которых начали применяться новые технологии, чрезвычайно обширен и продолжает расти.
Вирусный гепатит широко распространён в человеческом обществе В работах А. Д. Аммосова, О. Н. Ястребовой дано число инфицированных вирусом гепатита, которое составляет 200-300 млн человек -3-4,5 % населения земного шара.
Гепатит В - глобально распространённая опасная вирусная инфекция. Ежегодно в мире регистрируется около 50 млн больных только острой инфекцией вирусного гепатита В. Из них до 600 тыс. больных умирает. Около 100 тыс человек погибает от редких, особо тяжелых фулминантных форм инфекции, смертность от которых достигает 70-90 %
Вирусный гепатит В (ВГВ) отличается исключительно высокой инфекционностью. Заражение возможно при инокуляции очень малых объёмов крови от больного' 0,1-0,5 мкл. Следовательно, даже визуально неразличимые следы зараженной крови могут оказаться причиной инфекции. Одновременно с высокой инфекционностью ВГВ причиной частой передачи возбудителя является также высокая устойчивость вируса и вирусной ДНК в условиях окружающей среды и в известных режимах дезинфекции.
По общей численности и распространённости больных хроническим гепатитом В в России до сих пор нет надёжных данных (что описано в работе А Д. Амосова), так как регистрация и государственный учет этих больных по стране не налажены. На примере Санкт-Петербурга, где регистрация больных хроническими вирусными гепатитами ведется с 1970 г, показано, что численность хронических больных постоянно растёт.
Гепатит С (ГС) подобно гепатиту В (ТВ) имеет повсеместное, но не равномерное распространение. По данным Национальных служб здоровья, ежегодно в США регистрируется от 150 до 175 тыс. новых случаев гепатита С, в Западной Европе - 170 тыс., в Японии - более 350 тыс. заболеваний.
По данным О Н. Ястребовой, частота обнаружения маркеров вирусного гепатита С (ВГС) среди доноров крови в странах Северной Европы составляет 0,01-0,2 %, в Южной Европе - 0,5-1,2 %, в Японии - 3-6 %, 10-20 % в странах Африканского континента, в России -1-5 % (более высокий процент в районах Сибири и Дальнего Востока), в Прибалтике - 1-3 %, в бывших республиках Средней Азии и Молдове-5-12%.
Таким образом, вместе с ВИЧ-инфекцией гепатит В и С в настоящее время - одна из самых широко распространённых и опасных вирусных инфекций, вызывающих повсеместную тревогу за здоровье населения, сокращение средней продолжительности жизни людей во всем мире
Важной проблемой службы переливания крови является невозможность ранней диагностики вирусного гепатита. Решение этой задачи мотивируется тенденцией значительного распространения ге-мотрансмиссивных заболеваний (заболеваний, передающихся при переливании донорской крови) В связи с постоянной трансформацией вирусов гепатита не представляется возможным выработать чёткие критерии диагностики этого заболевания (работы В. К Калн-берзс). По этой причине совершенствование методов лабораторной диагностики нередко задерживается.
Наиболее эффективным методом определения вирусного гепатита признана клиническая лабораторная диагностика Существуют два основных метода: иммуноферментный анализ (ИФА) и полимеразно-цепная реакция (ПЦР) ИФА выявляет антитела инфекции, а ПЦР
исследует ее антигенную структуру. Однако они являются дорогостоящими методами. Поэтому необходимо использовать менее дорогостоящие и более доступные методы диагностики
В предлагаемом подходе вирусный гепатит будет диагностироваться по результатам общего, биохимического и иммунологического анализов крови Врач, просматривая результаты анализов, не может сразу поставить точный диагноз, так как необходимо выявить скрытые взаимосвязи между лабораторными показателями и гепатитом. Для этого необходимо применять формальные методы. В медицине достаточно популярны статистические методы. Однако их применение в рассматриваемой области имеет объективные ограничения из-за нечёткой трактовки моделей нормы, адаптации и патологии В этой связи последние годы характеризуются широким применением нейросетевых технологий в медицинской практике, что отражено в работах А. Н Горбаня, В. Б Лифшица. Следует указать, что нередко диагностическая эффективность прогнозных моделей варьируется в пределах 70-85 %, что является недостаточным.
Применению нейронных сетей для диагностики вирусного гепатита посвящены работы L Ozyilmaz, А. Drägulescu. При анализе данных работ выявлены проблемы в использовании нейронных сетей выбор наиболее информативных признаков для диагностики, определение оптимальной архитектуры нейронной сети, отсутствие автоматизированных систем для определения вирусного гепатита.
Цель работы - разработка нейронных сетей, позволяющих распознавать клинико-лабораторную характеристику вирусного гепатита как для отдельных случаев, так и с целью массового обследования без привлечения дорогостоящих методов диагностики вирусного гепатита, создание системы для диагностики вирусного гепатита.
Для достижения поставленной цели решаются следующие задачи.
1) сбор и статистическая обработка исходных данных, выбор информативных параметров,
2) исследование архитектур нейронных сетей с целью выбора рациональной структуры;
3) разработка экспертной системы диагностики вирусного гепатита,
4) тестирование разработанной системы в Пензенской областной клинической больнице им Н. Н Бурденко.
Методы исследования. При решении поставленных задач использовались методы статистического анализа и теория нейронных сетей
Научная новизна.
1. Предложен способ понижения размерности исходных данных, основанный на анализе корреляционной связи между входными векторами и выходами сети в обучающей выборке, позволивший использовать сокращенный набор лабораторных показателей для диагностики вирусного гепатита
2. Предложен способ заполнения пропусков в данных, основанный на бутстреп-методе, дающий возможность учесть характер и особенности распределения анализов больных и здоровых людей.
3. Исследованы следующие архитектуры нейронных сетей для диагностики вирусного гепатита, персептрон, многослойный персеп-трон, радиально-базисная нейронная сеть, сеть ЬУ<3, и выбрана архитектура сети доя диагностики вирусного гепатита.
4. Предложен и исследован двухшаговый вариант алгоритма градиентного спуска обучения радиально-базисной сети (КВБ), отличающийся от известных алгоритмов способом задания центров и вычисляемым коэффициентом скорости обучения весов сети, позволивший исключить неформальный и трудоемкий процесс подбора коэффициента скорости обучения и повысить точность данных сетей для диагностики вирусного гепатита
Практическая ценность состоит в создании нейросетевой экспертной системы диагностики вирусного гепатита, которая может помочь врачу-хирургу сократить затраты и время на исследования и повысить достоверность результата.
На защиту выносятся:
1) способ понижения размерности исходных данных,
2) способ заполнения пропусков в данных;
3) сравнение статистических и нейросетевых методов диагностики вирусного гепатита;
4) способ задания центров нейронов и вычисляемый коэффициент скорости обучения весов радиально-базисной сети;
5) программная реализация нейронной сети для диагностики вирусного гепатита
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах Первой международной дистанционной научно-практической конференции «Новые технологии в медицине» (Санкт-Петербург, 2004), XI, XIII, XIV всероссийских семинарах «Нейроинформа-тика и ее приложения» (Красноярск, 2003, 2005, 2006); Ш, IV, V, VI всероссийских научно-технических конференциях «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2003-2006), III Всероссийской научно-практической конференции «Экология и ресурсо- и энергосберегающие технологии на предприятиях народного хозяйства» (Пенза, 2003), Всероссийском постоянно действующем научно-техническом семинаре «Экологическая безопасность регионов России и риск от техногенных аварий и катастроф» (Пенза, 2003), 2-й Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде MATLAB» (Москва, ИПУ РАН, 2004), XIV научных чтениях памяти академика Н. Н Бурденко «Актуальные вопросы современной клинической медицины» (Пенза, 2004), VI, VII международных научно-технических конференциях «Новые информационные технологии и системы» (Пенза, 2004, 2006); XI межрегиональной научно-практической конференции молодых учёных и соискателей «Актуальные вопросы диагностики, лечения и реабилитации больных» (Пенза, 2004), V, VI всероссийских научно-практических конференциях «Окружающая природная среда и экологическое образование и воспитание» (Пенза, 2005-2006); 2 Workshop of Russian Section of IEEE Computational Intelligence Society (Москва, ИПУ им. В А Трапезникова, 2005); XVIII Всероссийской научно-технической конференции студентов, молодых ученых и специалистов «Биотехнические, медицинские и экологические системы и комплексы» (Рязань, 2005), VIII Всероссийской научно-технической конференции «Нейроинформатика-2006» (Москва, 2006).
Реализация работы и внедрение результатов.
Получено свидетельство об официальной регистрации программы для ЭВМ № 2006612147 «Нейродиагност. Экспертная система диагностики вирусного гепатита», выданное Федеральной службой по интеллектуальной собственности, патентам и товарным знакам, зарегистрированное в Реестре программ для ЭВМ 20.06.2006 г.
Получено удостоверение на рационализаторское предложение № 280 «Способ диагностики гепатита у хирургических больных», выданное Соломахе А А и Артюхину В. В. БРИЗом Пензенской областной клинической больницы им. Н Н. Бурденко и медицинским факультетом Пензенского государственного университета.
Основные результаты и положения диссертационной работы внедрены в работу отделения переливания крови Пензенской областной клинической больницы им. Н. Н. Бурденко, г. Пенза; МЛПУС «Городская больница № 1 им. Н. А. Семашко», г. Ростов-на-Дону
Основные результаты, изложенные в диссертационной работе, использованы в НИР, проводимой в рамках гранта «Нейросетевая диагностика вирусного гепатита у хирургических больных» за № А04-3.16-625 для поддержки научно-исследовательской работы аспирантов вузов Федерального агентства по образованию.
Основные результаты диссертационной работы использованы в НИР, осуществляемой в рамках тематического плана научно-исследовательских работ Пензенского государственного педагогического университета, проводимых по заданию Федерального агентства по образованию в 2006 г.
Публикации. По теме диссертации опубликовано 27 работ, в том числе 2 статьи в реферируемых журналах
Структура и объем работы. Диссертация состоит из введения, 3-х глав, заключения, приложений и списка литературы из 80 наименований Работа содержит 104 страницы основного текста, 27 рисунков, 12 таблиц
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении отражены актуальность темы, цели и задачи диссертации, новизна и практическая ценность полученных результатов, структура диссертации и положения, выносимые на защиту.
В первой главе выполнен анализ существующих методов диагностики вирусного гепатита. Исследование лабораторных методов показало целесообразность применения формализованных методов диагностики без использования дорогостоящих методов и с сокращенным набором лабораторных анализов.
Осуществлен анализ способов заполнения пропущенных данных, показавший целесообразность использования способа замены пропусков, основанного на бутстреп-методе, позволяющего заполнить
пропуски в соответствии с характером и особенностями лабораторных показателей больных и здоровых людей.
Проведено исследование способов понижения размерности, позволяющих уменьшить количество анализов, используемых для диагностики вирусного гепатита. Для этого предлагается более полно проанализировать критерий Манна-Уитни, корреляционный анализ и алгоритм box-counting.
Исследование статистических методов диагностики показало возможность применения для определения вирусного гепатита дискри-минантного анализа
При анализе нечёткой логики для диагностики вирусного гепатита было выявлено, что, хотя данный способ обладает рядом преимуществ, у него есть серьезные недостатки, такие, как требование большого количества времени для конструирования и настройки функций принадлежности и неспособность автоматически усваивать правила вывода принятых решений. Это ограничивает применение нечеткой логики для диагностики вирусного гепатита.
Исследование нейросетевых методов диагностики, а также анализ работ по данной области показали, что нейронные сети обладают рядом достоинств для проведения диагностики. Однако существуют трудности с процессом обучения и созданием архитектуры сети. Основное внимание необходимо уделить этим вопросам Предполагается исследовать следующие виды сетей, персептрон, многослойный персептрон, радиально-базисные сети и сети для классификации векторов (LVQ).
Во второй главе проводится исследование статистических и нейросетевых методов диагностики вирусного гепатита.
Предлагается способ понижения размерности исходных данных, основанный на анализе корреляционной связи между входными векторами и выходами сети в обучающей выборке, позволивший использовать сокращенный набор анализов для диагностики вирусного гепатита: аланинамино-трансфераза (АЛТ), гамма-глутамил-транс-пептидаза (ГТТ), щелочная фосфатаза, аспартатамино-трансфераза (ACT), тимоловая проба, билирубин.
Разработан способ заполнения пропусков, основанный на бутст-реп-методе, позволяющий в отличие от известных способов учесть характер и особенности распределения анализов больных и здоровых Для каждого анализа диапазон изменения признака [хтш,л;тах]
разбивается на отрезки [ *тт, лс| ], , х2 ], (х2, хъ ],. ,{хп, лтах ], каждому из них ставится в соответствие вероятность того, что случайная величина X примет значение, принадлежащее данному интервалу Тем самым по исходным данным строится эмпирическая функция плотности распределения (кусочно-постоянная функция)
РО ПРИ хтт рх при хх <х<х2,
/(*) = ]
Рп при хп<х<*тах Далее с вероятностью р{ выбирается интервал (хг,хг+1), пропуск
в данных заполняется случайным числом, равномерно расположенным в выбранном интервале
Данный способ заполнения пропусков не изменяет эмпирическую функцию распределения, что позволяет обойти проблему возведения признака в ранг существенных при простом заполнении случайным числом в интервале [хтш, хтах ], так как редкие и резко выделяющиеся значения признака после заполнения пропусков так и остаются редкими
Исследовано использование статистического метода на примере дискриминантного анализа для диагностики вирусного гепатита. Достоверность диагностики составила 84,62 %
Применение нейронных сетей занимает отдельное место среди методов обработки данных, превосходя статистические методы в универсальности, оставаясь при этом методом, мало чувствительным к форме данных как таковых.
Исследовано применение персептрона и многослойного персеп-трона для диагностики вирусного гепатита. Достоверности составили 87,41 и 90,91 % соответственно
Исследовано применение радиально-базисных нейронных сетей для диагностики вирусного гепатита, и выявлены достоинства этих сетей по сравнению с многослойными сетями, имеющими сигмои-дальные функции активации Используемые радиальные функции гауссовского типа по своей природе имеют локальный характер и принимают ненулевые значения только в зоне вокруг определенного центра. Это позволяет легко установить зависимость между параметрами базисных функций и физическим размещением обучающих
данных в многомерном пространстве Поэтому удаётся относительно просто найти удовлетворительные начальные условия процесса обучения с учителем Обучение при начальных условиях, близких к оптимальным, многократно увеличивает вероятность достижения успеха с помощью радиальных сетей Важное достоинство радиальных сетей - значительно упрощенный алгоритм обучения При наличии только одного скрытого слоя и тесной связи активности нейрона с соответствующей областью пространства обучающих данных точка начала обучения оказывается гораздо ближе к оптимальному решению, чем это имеет место в многослойных сетях. Выигрыш во времени увеличивается, если принять во внимание процедуру формирования оптимальной (с точки зрения способности к обобщению) структуры сети Однако наряду с достоинствами существуют проблемы в обучении КВБ-сетей
Одной из проблем обучения ИВР нейронной сети является подбор первоначального расположения центров сд.. Одним из простейших способов определения параметров 11ВР является случайный выбор Такой подход допустим при условии, что равномерное распределение обучающих данных полностью соответствует специфике задачи Так как оно не соответствует поставленной задаче диагностики вирусного гепатита, то необходимо учитывать характер распределения анализов для выбора начального расположения центров с^ нейронов 1ШР-сети Коэффициенты скорости обучения сети очень важны для сходимости сетевых параметров Подбор коэффициентов представляет собой трудно формализуемую задачу, требующую больших затрат машинного времени. Если коэффициенты являются большими, параметры сети колеблются и не сходятся. Если коэффициенты слишком малы, то скорость сходимости будет низкой. Опыт показывает, что коэффициенты скорости обучения убывают по мере повышения точности обучения Поэтому подбор коэффициентов производится по «худшему» случаю, что существенно замедляет процесс обучения.
Наиболее критичным к коэффициентам обучения являются веса радиально-базисной нейронной сети. Кроме того, веса сети входят линейно в выражение решения, что упрощает вычисление коэффициента скорости обучения
Предложен и исследован двухшаговый вариант алгоритма градиентного спуска обучения ЯБР-сети, отличающийся от известных ал-
горитмов способом задания центров и вычисляемым коэффициентом скорости обучения весов сети, а также позволивший исключить неформальный и трудоемкий процесс подбора коэффициента скорости обучения и повысить точность этих сетей для диагностики вирусного гепатита до 90,21%.
Алгоритм выбора центров нейронов Ш№-сети. Каждый из р обучающих векторов рассматривается как потенциальный центр ра-диально-базисной функции. Каждому обучающему вектору х, ставим в соответствие функцию сЬз!:(хг)
р
равную сумме расстояний от потенциального центра хг до других обучающих векторов
Величина функции сЬз1:(хг) обратно пропорциональна количеству векторов , находящихся в окрестности потенциального центрах,. Малое значение (^(х,) свидетельствует о том, что вектор х( располагается в области, в которой сосредоточено большое количество векторов х^.
После расчета значений сИв^х,) для всех потенциальных центров среди них отбирается вектор с5, имеющий наименьшее значение ¿1зг(хг). Для выбора следующих центров необходимо, прежде всего, исключить С1 и векторы, расположенные в непосредственной близости к С1 .
Процесс нахождения следующих центров с2,с3,.. ,си осуществляется последовательно на множестве обучающих векторов, которое уменьшается при исключении ближайшего окружения центра, обнаруженного на предыдущем этапе Этот процесс завершается в момент локализации всех центров.
Алгоритм вычисления коэффициента скорости обучения.
При зафиксированных центрах и ширине подставим формулу гра-
- (/) И) (/-1) дЕ^
диентного алгоритма обучения весов Щ -щ -гг —г-гг в
М
функционал ошибки =
1=1
т
к=1
. Выберем ско-
рость обучения л(" ^ из условия минимума функционала Е^
-,
р „
ЪВг
1=1
где
со (2)
¿=1 дн^ '
Коэффициент скорости обучения т/и ^ несложно вычислить с использованием выражений (1), (2).
Экспериментально доказана эффективность предложенных алгоритмов первоначального расположения центров нейронов ИВР-сети и вычисляемого коэффициента скорости обучения весов по сравнению со случайным заданием центров и постоянным коэффициентом скорости обучения. Ошибка уменьшилась с 11,89 до 9,79 %, и количество итераций - с 61 до 16
Экспериментальные исследования применения сетей классификации векторов (ЬУС>) для диагностики вирусного гепатита показали достоверность 82,52 %. Данный результат хуже, чем достигнутый многослойным персептроном и радиально-базисной нейронной сетью
С учетом результатов проведенных исследований установлено, что оптимальный способ диагностики состоит в определении вирусного гепатита по шести лабораторным показателям, что позволяет экономить средства лечебно-профилактических учреждений Так как многослойный персептрон и радиально-базисная нейронная сеть обладают своими преимуществами и недостатками, для программной
реализации будут использованы обе сети. Проведенные эксперименты показали, что для дальнейшей программной реализации целесообразно использовать многослойный персептрон с двумя нейронами в скрытом слое и радиально-базисную нейронную сеть с двумя нейронами в скрытом слое.
В третьей главе приведены основные этапы разработки экспертной системы, которая будет способствовать принятию решений врачом-экспертом
Исследовано и экспериментально подтверяодено, что при диагностике вирусного гепатита алгоритм градиентного спуска для многослойного персептрона не уступает по точности алгоритму Левенберга-Марк-вардта, но является более простым и требует меньше ресурсов, поэтому именно он будет выбран для использования в программной реализации
Для реализации работы экспертной системы была выбрана среда разработки Visual С++ 6 0 Реализованная экспертная система выполняет функции обучения нейронных сетей и диагностики вирусного гепатита с помощью многослойного персептрона и сети RBF
Был создан класс Neuron, в котором реализованы основные функции нейросетевого метода. Scaling, Summator, Tansig, Error, Net_error, Sim и Train
Функция Scaling позволяет привести все исходные данные к одному диапазону. Эта функция использует метод линейного шкалирования, так как в многослойном персептроне используется функция гиперболического тангенса, и все данные приводятся к диапазону [-1; 1] Необходимость шкалирования также возникает при использовании RBF.
Функция Summator реализует адаптивный линейный сумматор На вход функции поступают промасштабированный ранее массив входных значений и вектор весовых коэффициентов.
Выход адаптивного сумматора поступает на вход функции Tansig, реализующей функцию активации Результатом применения этой функции является выходное значение данного нейрона
Для подсчета ошибок сети используется функция Error. Для определения общего количества ошибок сети - функция Net_error В качестве ошибки рассматриваются выходы сети, не попавшие в указанный пользователем интервал или неправильно распознанные сетью
Функция Sim реализует функцию моделирования многослойного персептрона, аналогичную функции sim пакета прикладных программ MATLAB. На вход функции подаются исходные данные, на выходе получается выходное значение сети.
Функция Train реализует механизм обучения многослойного персептрона методом скорейшего спуска, который использует алгоритм обратного распространения ошибки На выходе получаем обученную сеть Обучение ведется с использованием тестового множества Данный подход позволяет избежать переобучения сети.
Для реализации работы сети RBF использовался ряд функций Функция getCenter применяется для инициализации центров нейронов RBF-сети Функция calcR2 служит для вычисления квадрата евклидова расстояния между двумя векторами. Для подсчета общего количества ошибок сети используется функция Net_error В качестве ошибки рассматриваются выходы сети, не попавшие в указанный пользователем интервал или неправильно распознанные сетью Функция Train реализует механизм обучения радиально-базисной нейронной сети с помощью разработанного градиентного алгоритма обучения
Предложенная экспертная система для диагностики вирусного гепатита позволяет на сокращенном наборе анализов диагностировать вирусный гепатит с помощью многослойного персептрона и радиально-базисной сети с достоверностью 91,61 и 90,21 % соответственно, что не превышает ошибку сетей, созданных с использованием пакета NNT MATLAB.
Тестирование экспертной системы на данных реальных больных отделения гепатологии и донорах отделения переливания крови Пензенской областной больницы им. Н Н Бурденко показало, что для диагностики вирусного гепатита лучше применять радиально-базисную нейронную сеть.
В приложениях представлены результаты статистического анализа для выбора информативных признаков и диагностики вирусного гепатита, листинг основных функций, реализованных в экспертной системе, и документы, подтверждающие внедрение результатов диссертационной работы
ОБЩИЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ
1. Проведен анализ лабораторных методов диагностики вирусного гепатита, показавший целесообразность применения формализованных методов диагностики без использования дорогостоящих методов анализа и с сокращенным набором лабораторных анализов.
2. Предложен способ понижения размерности исходных данных, основанный на анализе корреляционной связи между входными векторами и выходами сети в обучающей выборке, позволивший использовать сокращенный набор анализов для диагностики вирусного гепатита
3 Для заполнения пропусков в исходных данных предложен способ, основанный на бугстреп-методе, позволяющий в отличие от известных способов учесть характер и особенности распределения лабораторных показателей больных и здоровых.
4 Проведено сравнение статистических и нейросетевых методов диагностики вирусного гепатита. Достоверность дискриминантного анализа составила 86,5 %, тогда как достоверность нейросетевых методов варьировалась от 90,21 до 90,91 %. Доказана эффективность применения нейросетевого подхода для диагностики вирусного гепатита
5. Предложен и исследован двухшаговый вариант алгоритма градиентного спуска обучения радиально-базисной сети, отличающийся от известных алгоритмов способом задания центров и вычисляемым коэффициентом скорости обучения весов сети, позволивший исключить неформальный и трудоемкий процесс подбора коэффициента скорости обучения и повысить точность этих сетей для диагностики вирусного гепатита до 90,21 %.
6. Исследованы следующие архитектуры нейронных сетей, ориентированных на диагностику вирусного гепатита- персептрон, многослойный персептрон, радиально-базисная нейронная сеть, сеть ЬУ<3, лучший результат диагностики вирусного гепатита показали многослойный персептрон и радиально-базисная нейронная сеть. Достоверность составила 90,91 и 90,21 % соответственно Так как многослойный персептрон и радиально-базисная нейронная сеть обладают и преимуществами, и недостатками, для реализации в экспертной системе будут использованы обе сети
7 Реализована экспертная система, способствующая принятию решения врачом-экспертом, выполняющая функции обучения нейронных сетей и компьютерной диагностики вирусного гепатита с
помощью многослойного персептрона и радиально-базисной нейронной сети и позволяющая на сокращенном наборе анализов проводить диагностику с достоверностью 91,61 %.
СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в изданиях, рекомендованных ВАК России
1. Артюхин, В В Нейросетевой метод диагностики вирусного гепатита / В. В. Артюхин, А А Соломаха, В. И. Горбаченко // Нейрокомпьютеры. разработка, применение. - 2005. - № 7. - С. 34-35.
2. Артюхин, В В. Технология нейросетевого прогнозирования в абдоминальной хирургии / В. В. Артюхин, А. А Соломаха // Вестник новых медицинских технологий. - Тула, 2003. - Т. X. - № 1-2. - С. 56.
Публикации в других изданиях
3 Артюхин, В. В. Современные нейросетевые технологии в медицине / В. В Артюхин, А. А. Соломаха // Новые технологии в медицине . сб. докл. Первой междунар. дистанц научн.-практ. конф. -СПб • Изд-во СПбГПУ, 2004.-С. 119-121.
4 Артюхин, В. В. Нейронные сети для диагностики вирусного гепатита в хирургической клинике / В. В. Артюхин, А. А. Соломаха, В И. Горбаченко // Нейроинформатика и ее приложения XI Всероссийский семинар - Красноярск, 2003 - С. 150-151.
5 Артюхин, В. В. Нейросетевое прогнозирование инфекционной безопасности компонентов донорства в хирургической клинике / В В. Артюхин, А. А. Соломаха, В. И. Горбаченко // Проблемы информатики в образовании, управлении, экономике и технике Ш Всероссийская научно-техническая конференция,- Пенза, 2003. - С. 127-129.
6 Артюхин, В. В Метод дифференциальной диагностики вирусного гепатита в учреждениях службы крови и эндоэкологическое прогнозирование / В В Артюхин, А А. Соломаха, Л. А Емелина // Экология и ресурсо- и энергосберегающие технологии на предприятиях народного хозяйства. III Всероссийская научно-практическая конференция сб. материалов - Пенза, 2003. - С. 164-166.
7. Артюхин, В. В Эндоэкологические факторы риска послеоперационных осложнений в абдоминальной хирургии и нейросетевое
прогнозирование / В. В Артюхин, А А. Соломаха // Экологическая безопасность регионов России и риск от техногенных аварий и катастроф Всероссийский постоянно действующий научно-технический семинар • сб материалов - Пенза, 2003. - С 137-140
8. Артюхин, В. В Использование пакета Neural Network ToolBox среды MATLAB для диагностики гепатита у хирургических больных / В В. Артюхин, А. А. Соломаха, В И Горбаченко // 2-я Всероссийская научная конференция «Проектирование научных и инженерных приложений в среде MatLab». - М : ИПУ РАН, 2004. - С 1262-1265
9 Артюхин, В. В. Информационные технологии в дифференциальной диагностике вирусного гепатита В и С / В. В Артюхин,
A. А. Соломаха // XIV научные чтения памяти академика Н Н Бурденко «Актуальные вопросы современной клинической медицины» материалы обл науч -практ конф - Пенза Информ -изд. центр ПГУ, 2004. - С 325-326.
10 Артюхин, В. В Экспериментальное обоснование использования нейронных сетей для диагностики вирусного гепатита /
B. В. Артюхин, А. А Соломаха, В. И. Горбаченко // Проблемы информатики в образовании, управлении, экономике и технике IV Всероссийская научно-техническая конференция. - Пенза, 2004. - С. 15-17.
11 Артюхин, В В Опыт применения пакета Neural Network Toolbox среды MATLAB для диагностики заболеваний в хирургии / В В Артюхин, А А. Соломаха, В И. Горбаченко // Новые информационные технологии и системы • тр. VI Междунар науч -техн конф Ч. 1 - Пенза: Информ -изд. центр ПГУ, 2004. - С. 116-118
12. Артюхин, В. В О диагностике вирусного гепатита в хирургической клинике / ВВ. Артюхин, А. А. Соломаха // Актуальные вопросы диагностики, лечения и реабилитации больных : материалы XI межрегион науч.-практ. конф молодых учёных и соискателей. -Пенза, 2004 - С. 238-239
13. Артюхин, В. В Нейросетевая диагностика вирусных заболеваний печени для объективизации эндоэкологической ситуации в регионах России / В. В Артюхин [и др ] // Экология и промышленность России. - 2005. - февраль. - С 40-41.
14. Артюхин, В В Эндоэкологический мониторинг за распространением вирусных заболеваний печени в регионах России / В В Артюхин [и др.] // Окружающая природная среда и экологиче-
ское образование и воспитание : сб. ст. V Всерос. науч -пракг. конф. -Пенза Приволжский Дом знаний, 2005. -С 60-62.
15. Артюхин, В В. Нейросетевая экспертная система диагностики вирусного гепатита / В. В. Артюхин [и др.] //Нейроинформатика и её приложения • материалы ХШ Всерос семинара, Красноярск, 7-9 октября 2005 / под ред. А Н Горбаня, Е М Миркеса. - Красноярск . ИВМ СО РАН, 2005. - С. 5-7.
16 Артюхин, В В Нейросетевая экспертная система диагностики вирусного гепатита / В В Артюхин, А. А Соломаха, В И Горбачен-ко // Проблемы информатики в образовании, управлении, экономике и технике V Всероссийская научно-техническая конференция. -Пенза, 2005. - С 44-46
17 Артюхин, В. В. Нейросетевая экспертная система диагностики вирусного гепатита / В В Артюхин [и др.] // 2 Workshop of Russian Section of IEEE Computational Intelligence Society, Москва, 16 ноября 2005. - M.. Инст-т проблем упр. им. В А. Трапезникова, 2005.
18. Артюхин, В. В. Нейросетевая экспертная система массового обследования на вирусный гепатит / В. В Артюхин // Биотехнические, медицинские и экологические системы и комплексы XVIII Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов -Рязань, 2005. - С. 103-104.
19 Артюхин, В В. Нейросетевая диагностика вирусного гепатита / В В Артюхин И Научная сессия МИФИ - 2006 VHI Всероссийская научно-техническая конференция «Нейроинформатика-2006» сб. науч тр , 24-27 января 2006 В 3-х Ч.Ч2.-М/ МИФИ, 2006. - С. 52-58
20. Артюхин, В. В. Проектирование компьютерной системы для эндоэкологического мониторирования и диагностики вирусного гепатита / В. В. Артюхин, А. А Соломаха, В. И Горбаченко // Окружающая природная среда и экологическое образование и воспитание : сб ст VI Всерос науч.-практ конф., 17—18 февраля 2006. - Пенза • Приволжский Дом знаний, 2006 - С 151-160
21 Артюхин, В В Диагностирование вирусного гепатита с применением нейронных сетей различной архитектуры / В. В. Артюхин, В И Горбаченко // Нейроинформатика и ее приложения . материалы XIV Всерос семинара, 6-8 октября 2006 / под ред. А Н. Горбаня, Е М. Миркеса - Красноярск ИВМ СО РАН, 2006 - С. 14-15
22. Артюхин, В В. Нейросетевая диагностика вирусного гепатита /
B. В. Артюхин // Сборник материалов Всероссийского конкурса инновационных проектов аспирантов и студентов по приоритетному направлению развития науки и техники «Информационно-телекоммуникационные системы», 12-15 октября 2006 / под ред А О. Сергеева. - М • ГНИИ ИТТ «Информика», 2006. - С. И 7-118.
23. Артюхин, В. В. Экспертная система диагностики вирусного гепатита / В В. Артюхин //Интеллектуальные системы и компьютерные науки : материалы IX Междунар конф, 23-27 октября 2006. -М : Изд-во мех -мат. фак МГУ, 2006. - Т. 2. - Ч. 1 - С. 47-49
24. Артюхин, В. В. Диагностика вирусного гепатита с помощью статистических методов / ВВ. Артюхин // Проблемы информатики в образовании, управлении, экономике и технике. VI Всероссийская научно-техническая конференция, 21-22 ноября 2006 - Пенза, 2006 -
C. 137-139.
25. Артюхин, В В. Диагностика вирусного гепатита с помощью нейросетевых методов / В В Артюхин, А А Соломаха // Проблемы информатики в образовании, управлении, экономике и технике
VI Всероссийская научно-техническая конференция, 21-22 ноября 2006. - Пенза, 2006 - С 135-137
26 Артюхин, В В Определение вирусного гепатита с помощью нейронных сетей различной архитектуры / В. В Артюхин, В И. Гор-баченко // Новые информационные технологии и системы . тр
VII Междунар науч -техн конф., 29-30 ноября 2006 - 4 2.- Пенза; Информ.-изд. центр ПГУ, 2006. - С. 13-16.
27. Артюхин, В. В. Компьютерная программа диагностики вирусного гепатита / В. В Артюхин [и др ] // Известия высших учебных заведений Поволжский регион. Медицинские науки. - 2007 - № 2. -С. 31-38.
Артюхин Василий Валерьевич
Нейросетевая система диагностики вирусного гепатита
Специальности 05 13 11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей, 05 11 17 - Приборы, системы и изделия медицинского назначения
Редактор Е П Мухина Технический редактор Н А Въялкова Корректор С Н Сухова Компьютерная верстка Р Б Вердниковой
ИД № 06494 от 26 12 01 Сдано в производство 03 10 07 Формат 60x84^/16 Бумага писчая Печать офсетная Уел печ л 1,16 _Заказ № 546 Тираж 100_
Издательство Пензенского государственного университета 440026, Пенза, Красная, 40
Оглавление автор диссертации — кандидата технических наук Артюхин, Василий Валерьевич
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ ФОРМАЛИЗОВАННЫХ МЕТОДОВ ДИАГНОСТИКИ ВИРУСНОГО ГЕПАТИТА
1.1 Анализ лабораторных методов диагностики вирусного гепатита.
1.2 Анализ способов понижения размерности исходных данных.
1.3 Анализ способов заполнения пропусков в исходных данных.
1.4 Анализ статистических методов диагностики.
1.5 Анализ возможности использования нечеткой логики для диагностики вирусного гепатита.
1.6. Анализ нейросетевых методов диагностики.
Выводы к главе 1.
ГЛАВА 2. ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ И НЕЙРОСЕТЕВЫХ МЕТОДОВ ДИАГНОСТИКИ ВИРУСНОГО ГЕПАТИТА.
2.1 Постановка задачи.
2.2 Исследование статистических методов.
2.2.1 Проверка медицинских анализов на соответствие нормальному закону распределения.
2.2.2 Выбор лабораторных показателей.
2.2.2.1 Исследование гистограмм распределения анализов больных и здоровых для выбора информативных признаков.
2.2.2.2 Исследование применения критерия Манна-Уитни для выбора информативных признаков.
2.2.2.3 Исследование применения корреляционного анализа для выбора информативных признаков.
2.2.2.4 Исследование применения алгоритма box-counting для выбора информативных признаков.
2.2.2.5 Сравнение статистических методов выбора анализов.
2.3 Реализация способа заполнения пропусков.
2.4 Диагностика вирусного гепатита с помощью дискриминантного анализа.
2.5 Исследование нейронных сетей для диагностики вирусного гепатита.
2.5.1 Исследование персептрона.
2.5.1.1 Разработка математической модели нейронной сети.
2.5.1.2 Экспериментальные исследования.
2.5.2 Исследование многослойного персептрона для диагностики вирусного гепатита.
2.5.2.1 Разработка модели нейронной сети.
2.5.2.2 Экспериментальные исследования.
2.5.3 Исследование радиально-базисных нейронных сетей.
2.5.3.1 Разработка модели нейронной сети.
2.5.3.2 Экспериментальные исследования.
2.5.4 Исследование LVQ-сетей для диагностики вирусного гепатита.
2.5.4.1 Разработка модели нейронной сети.
2.5.4.2 Экспериментальные исследования.
Выводы к главе 2.
ГЛАВА 3. РАЗРАБОТКА ЭКСПЕРТНОЙ СИСТЕМЫ «НЕЙРОДИАГНОСТ» ДЛЯ ДИАГНОСТИКИ ВИРУСНОГО ГЕПАТИТА.
3.1 Разработка алгоритма обучения многослойного персептрона, реализованного в экспертной системе.
3.1.1 Разработка модели нейронной сети.
3.1.2 Экспериментальные исследования.
3.2 Разработка нейросетевой экспертной системы.
3.3 Возможности экспертной системы.
3.4 Экспериментальное исследование экспертной системы.
Выводы к главе 3.
Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Артюхин, Василий Валерьевич
В настоящее время решающую роль в снижении стоимости медицинского обслуживания при сохранении его качества и повышении эффективности играют информационные технологии.
Последнее десятилетие ознаменовано ростом интереса к нейросетевым методам обработки информации. Расширяются сферы применения нейросистем. Актуальные задачи практической медицины являются идеальным полем для использования нейросетевых технологий, и именно в этой области наблюдается наиболее яркий практический успех нейроинформационных методов.
Наибольший интерес для практического здравоохранения представляют системы диагностики и дифференциальной диагностики заболеваний. При этом для принятия решений могут использоваться самые разнообразные данные: анамнез, клинический осмотр (создаются экспертные системы диагностики, ограничивающиеся только этим набором), результаты лабораторных тестов и сложных функциональных методов. Список областей медицины, в которых начали применяться новые технологии, чрезвычайно обширен и продолжает расти.
Вирусный гепатит широко распространён в человеческом обществе. По оценкам различных авторов [1; 2] число инфицированных вирусом составляет 200 - 300 млн. человек, что составляет 3 - 4,5 % населения земного шара.
Гепатит В - глобально распространённая опасная вирусная инфекция. Ежегодно в мире регистрируется около 50 млн. больных только острой инфекцией вирусного гепатита В. Из них до 600 тыс. умирает. Из числа последних около 100 тыс. человек погибает от редких, особо тяжелых фулминантных форм инфекции, смертность от которых достигает 70 - 90 %.
Вирусный гепатит В (ВГВ) отличается исключительно высокой инфекционностью. Заражение гепатитом В возможно при инокуляции очень малых объёмов крови от больного: 0,1 - 0,5 мкл. Следовательно, даже визуально неразличимые следы зараженной крови могут оказаться причиной инфекции. Одновременно с высокой инфекционностью ВГВ причиной частой передачи возбудителя является также высокая устойчивость вируса и вирусной ДНК в условиях окружающей среды и в известных режимах дезинфекции.
По общей численности и распространённости больных хроническим гепатитом В в России до сих пор нет надёжных данных [1], так как регистрация и государственный учёт этих больных по стране не налажены. На примере Санкт-Петербурга, где регистрация больных хроническими вирусными гепатитами ведется с 1970 г., численность хронических больных постоянно растёт.
Гепатит С (ГС), подобно гепатиту В (ГВ), имеет повсеместное, но не равномерное, распространение. По данным Национальных служб здоровья, ежегодно в США регистрируется от 150 до 175 тыс. новых случаев гепатита С, в Западной Европе - 170 тыс., в Японии - более 350 тыс. заболеваний.
Частота обнаружения маркеров вирусного гепатита С (ВГС) среди доноров крови в странах Северной Европы составляет 0,01-0,2 %, в Южной Европе— 0,5-1,2 %, в Японии— 3-6 %, 10-20 % в странах Африканского континента, в России - 1-5 % (более высокий процент в районах Сибири и Дальнего Востока), в Прибалтике - 1-3%; в бывших республиках Средней Азии и Молдове - 5-12% [2].
Таким образом, вместе с ВИЧ-инфекцией гепатит В и С в настоящее время - одна из самых широко распространённых и опасных вирусных инфекций, вызывающих повсеместную тревогу за здоровье населения, сокращение средней продолжительности жизни людей во всём мире [1; 2].
Важной проблемой службы переливания крови является невозможность ранней диагностики вирусного гепатита. Решение этой задачи мотивируется тенденцией значительного распространения гемотрансмиссивных заболеваний (заболеваний, передающихся при переливании донорской крови). В связи с постоянной трансформацией вирусов гепатита не представляется возможным выработать чёткие критерии диагностики этого заболевания [3]. По этой причине совершенствование методов лабораторной диагностики нередко задерживается.
Наиболее эффективным методом определения вирусного гепатита признана клиническая лабораторная диагностика. Существует два основных метода: иммуноферментный анализ (ИФА) и полимеразно-цепная реакция (ПЦР). ИФА выявляет антитела инфекции, а ПЦР исследует ее антигенную структуру. Однако они являются дорогостоящими методами. Поэтому необходимо использовать менее дорогостоящие и более доступные методы диагностики.
В предлагаемом подходе вирусный гепатит будет диагностироваться по результатам общего, биохимического и иммунологического анализов крови. Врач, просматривая результаты анализов, не может сразу поставить точный диагноз, так как необходимо выявить скрытые взаимосвязи между лабораторными показателями и гепатитом. Для этого необходимо применять формальные методы. В медицине достаточно популярны статистические методы. Однако их применение в рассматриваемой области имеет объективные ограничения из-за нечёткой трактовки моделей нормы, адаптации и патологии. В этой связи последние годы характеризуются широким применением нейросетевых технологий в медицинской практике [5; 6]. Следует указать, что нередко диагностическая эффективность прогнозных моделей варьирует в пределах 70 - 85%, что является недостаточным. [7].
В работах [8; 9] рассматривается применение нейронных сетей для диагностики вирусного гепатита. При анализе данных работ выявлены проблемы в использовании нейронных сетей: выбор наиболее информативных признаков для диагностики, определение оптимальной архитектуры нейронной сети, отсутствие автоматизированных систем для определения вирусного гепатита.
Цель работы — разработка нейронных сетей, позволяющих распознавать клинико-лабораторную характеристику вирусного гепатита как для отдельных случаев, так и с целью массового обследования без привлечения дорогостоящих методов диагностики вирусного гепатита, создание системы для диагностики вирусного гепатита.
Для достижения поставленной цели решаются следующие задачи:
1) сбор и статистическая обработка исходных данных, выбор информативных параметров;
2) исследование архитектур сетей с целью выбора рациональной структуры;
3) разработка экспертной системы диагностики вирусного гепатита;
4) тестирование разработанной системы в Пензенской областной клинической больнице им. Н. Н. Бурденко.
Методы исследования. При решении поставленных задач использовались методы статистического анализа и теория нейронных сетей.
Научная новизна:
1. Предложен способ понижения размерности исходных данных, основанный на анализе корреляционной связи между входными векторами и выходами сети в обучающей выборке, позволивший использовать сокращенный набор лабораторных показателей для диагностики вирусного гепатита.
2. Предложен способ заполнения пропусков в данных, основанный на бутстреп-методе, дающий возможность учесть характер и особенности распределения анализов больных и здоровых людей.
3. Исследованы следующие архитектуры нейронных сетей для диагностики вирусного гепатита: персептрон, многослойный персептрон, радиально-базисная нейронная сеть, сеть LVQ и выбрана архитектура сети для диагностики вирусного гепатита.
4. Предложен и исследован двухшаговый вариант алгоритма градиентного спуска обучения радиально-базисной сети (RBF), отличающийся от известных алгоритмов способом задания центров и вычисляемым коэффициентом скорости обучения весов сети, позволивший исключить неформальный и трудоемкий процесс подбора коэффициента скорости обучения и повысить точность данных сетей для диагностики вирусного гепатита.
Практическая ценность состоит в создании нейросетевой экспертной системы диагностики вирусного гепатита, которая может помочь врачу-хирургу сократить затраты и время на исследования и повысить достоверность результата.
На защиту выносятся:
1) способ понижения размерности исходных данных;
2) способ заполнения пропусков в данных;
3) сравнение статистических и нейросетевых методов диагностики вирусного гепатита;
4) способ задания центров нейронов и вычисляемый коэффициент скорости обучения весов радиально-базисной сети;
5) программная реализация нейронной сети для диагностики вирусного гепатита.
Достоверность научных и практических результатов: обучение и тестирование проводилось на реальных данных больных гепатитом и донорах отделения переливания крови Пензенской областной клинической больницы им. Н. Н. Бурденко. При тестировании достоверность результата составила 90,91 % для многослойного персептрона и 90,21% для радиально-базисной нейронной сети.
Реализация работы н внедрение результатов.
Получено свидетельство об официальной регистрации программы для ЭВМ № 2006612147 «Нейродиагност. Экспертная система диагностики вирусного гепатита», выданное Федеральной службой по интеллектуальной собственности, патентам и товарным знакам, зарегистрированное в Реестре программ для ЭВМ 20.06.2006 г.
Получено удостоверение на рационализаторское предложение № 280 «Способ диагностики гепатита у хирургических больных», выданное Соломахе А. А. и Артюхину В. В. БРИЗом Пензенской областной клинической больницы им. Н. Н. Бурденко и медицинским факультетом Пензенского государственного университета.
Основные результаты и положения диссертационной работы внедрены в работу отделения переливания крови Пензенской областной клинической больницы им. Н. Н. Бурденко, г. Пенза; МЛПУС «Городская больница № 1 им. Н. А. Семашко», г. Ростов-на-Дону.
Основные результаты, изложенные в диссертационной работе, использованы в НИР, проводимой в рамках гранта «Нейросетевая диагностика вирусного гепатита у хирургических больных» за № А04-3.16-625 для поддержки научно-исследовательской работы аспирантов вузов Федерального агентства по образованию.
Основные результаты диссертационной работы, использованы в НИР, осуществляемой в рамках тематического плана научно-исследовательских работ Пензенского государственного педагогического университета, проводимых по заданию Федерального агентства по образованию в 2006 г.
Апробация работы: Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:
Первой международной дистанционной научно-практической конференции
Новые технологии в медицине» (Санкт-Петербург, 2004); XI, XIII, XIV всероссийских семинарах «Нейроинформатика и её приложения»
Красноярск, 2003, 2005, 2006); III, IV, V, VI всероссийских научнотехнических конференциях «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2003-2006); III Всероссийской научно-практической конференции «Экология и ресурсо- и энергосберегающие технологии на предприятиях народного хозяйства»
Пенза, 2003); Всероссийском постоянно действующем научно-техническом семинаре «Экологическая безопасность регионов России и риск от техногенных аварий и катастроф» (Пенза, 2003); 2-й Всероссийской научной конференции «Проектирование научных и инженерных приложений в среде
MATLAB» (Москва, ИПУ РАН, 2004); XIV научных чтениях памяти
10 академика Н. Н. Бурденко «Актуальные вопросы современной клинической медицины» (Пенза, 2004); VI, VII международных научно-технических конференциях «Новые информационные технологии и системы» (Пенза, 2004, 2006); XI межрегиональной научно-практической конференции молодых учёных и соискателей «Актуальные вопросы диагностики, лечения и реабилитации больных» (Пенза, 2004); V, VI всероссийских научно-практических конференциях «Окружающая природная среда и экологическое образование и воспитание» (Пенза, 2005-2006); 2 Workshop of Russian Section of IEEE Computational Intelligence Society (Москва, ИПУ им. В. А. Трапезникова, 2005); XVIII Всероссийской научно-технической конференции студентов, молодых учёных и специалистов «Биотехнические, медицинские и экологические системы и комплексы» (Рязань, 2005); VIII Всероссийской научно-технической конференции «Нейроинформатика-2006» (Москва, 2006).
Публикации: По теме диссертации опубликовано 27 работ, в том числе 2 статьи в реферируемых журналах.
Структура и объём работы: Диссертационная работа состоит из введения, 3-х глав, заключения, приложений и списка литературы из 80 наименований.
Заключение диссертация на тему "Нейросетевая система диагностики вирусного гепатита"
ОБЩИЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ
1. Проведен анализ лабораторных методов диагностики вирусного гепатита, показавший целесообразность применения формализованных методов диагностики без использования дорогостоящих методов лабораторного обследования и с сокращенным набором лабораторных анализов.
2. Предложен способ понижения размерности исходных данных, основанный на анализе корреляционной связи между входными векторами и выходами сети в обучающей выборке, позволивший использовать сокращенный набор анализов для диагностики вирусного гепатита.
3. Для заполнения пропусков в исходных данных предложен способ, основанный на бутстреп-методе, позволяющий в отличие от известных способов учесть характер и особенности распределения лабораторных показателей больных и здоровых людей.
4. Проведено сравнение статистических и нейросетевых методов диагностики вирусного гепатита. Достоверность дискриминантного анализа составила 86,5%, тогда как достоверность нейросетевых методов варьировалась от 90,21% до 90,91%. Доказана эффективность применения нейросетевого подхода для диагностики вирусного гепатита.
5. Предложен и исследован двухшаговый вариант алгоритма градиентного спуска обучения радиально-базисной сети, отличающийся от известных алгоритмов способом задания центров и вычисляемым коэффициентом скорости обучения весов сети, позволивший исключить неформальный и трудоемкий процесс подбора коэффициента скорости обучения и повысить точность этих сетей для диагностики вирусного гепатита до 90,21%.
6. Исследованы следующие архитектуры нейронных сетей, ориентированных на диагностику вирусного гепатита: персептрон, многослойный персептрон, радиально-базисная нейронная сеть, сеть LVQ, лучший результат диагностики вирусного гепатита показали многослойный персептрон и радиально-базисная нейронная сеть. Достоверность составила 90,91 и 90,21% соответственно. Так как многослойный персептрон и радиально-базисная нейронная сеть обладают и преимуществами, и недостатками, для реализации в экспертной системе будут использованы обе сети.
7. Реализована экспертная система, способствующая принятию решения врачом-экспертом, выполняющая функции обучения нейронных сетей и компьютерной диагностики вирусного гепатита с помощью многослойного персептрона и радиально-базисной нейронной сети и позволяющая на сокращенном наборе анализов проводить диагностику с достоверностью 91,61%.
Библиография Артюхин, Василий Валерьевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Аммосов, А. Д. Гепатит В. Издание 2. Переработанное и дополненное. / А. Д. Аммосов. Кольцове: ЗАО «Вектор-Бест», 2005. — 128 с.
2. Ястребова, О. Н. Гепатит С. Информационно-методическое пособие. Издание 2. Переработанное и дополненное / О. Н. Ястребова. -Кольцово: ЗАО «Вектор-Бест», 2005. — 36 с.
3. Калнберзс, В. К. Гемотрансфузия в современной хирургии / В. К. Калнберзс, М. В. Калнберза, Ю. В. Жукова // Проблемы гематологии и переливания крови. — 1999. №2. - С. 9 - 10.
4. Соринсон, С. Н. Вирусные гепатиты / С. Н. Соринсон. JL: Медицина, 1987. —264 с.
5. Горбань, А. Н. Нейронные сети на персональном компьютере / А. Н. Горбань, Д. А. Россиев. Новосибирск: Наука. Сибирская издательская фирма РАН, 1996. - 276 с.
6. Статистический и нейросетевой методы идентификации и прогнозирования в медицине / В. Б. Лифшиц, Т. И. Булдакова, С. И. Суятинов, С. В. Колентьев // Информационные технологии. -2004. -№3.- С. 60-63.
7. Щетинин, В. Г. Применение компьютерных «нейронных сетей» в клинической лабораторной диагностике / В. Г. Щетинин, А. А. Соломаха // Клиническая лабораторная диагностика.— 1998. — №10. — С. 21 -33.
8. Ozyilmaz, L. Artificial Neural Networks for Diagnosis of Hepatitis Disease / L. Ozyilmaz, T. Yildirim — Neural Networks, 2003. Proceedings of the International Joint Conference. July 20-24, 2003. — 2003. — V. 1. — P. 586-589. —ISBN 0-7803-7898-9.
9. Dragulescu, A. Prognosis and Diagnosis in Hepatitis С using Expert Systems and Statistical Analyses / A. Dragulescu, A. Albu, C. Gavriluta, S. Filip, K. Menyhardt. — SACI 2006. 3rd Romanian-Hungarian Join
10. Symposium on Applied Computational Intelligence. — Timisoara, Romania, May 25-26, 2006.
11. Ю.Техническое руководство американской ассоциации банков крови. Пер. с англ.: — Милан: Европейская школа трансфузионной медицины, 2000. — 1056 с.
12. Приказ Министерства Здравоохранения РФ от 21.10.2002 г. №322 «О применении в практике здравоохранения иммуноферментных тест-систем для выявления поверхностного антигена вируса гепатита В и антител к вирусу гепатита С в сыворотке крови человека».
13. Славин, М. Б. Методы системного анализа в медицинских исследованиях / М. Б. Славин. М.: Медицина, 1989.
14. Swingler, К. Applying Neural Networks. A practical Guide (перевод Ю. П. Маслобоева) // http://www.matlab.ru/neuralnetwork/
15. Дубров, А. М. Многомерные статистические методы: Учебник / А. М. Дубров, В. С. Мхитарян, J1. И. Трошин. — М.: Финансы и статистика, 1998. 352 с. - ISBN 5-279-01945-3
16. Айвазян, С. А. Прикладная статистика: Основы моделирования и первичная обработка данных / С. А. Айвазян, И. С. Енюков, JI. Д. Мешалкин. М.: Финансы и статистика, 1983. - 472 с.
17. Холлендер, М. Непараметрические методы статистики / М. Холлендер, Д. Вульф. М.: Финансы и статистика, 1983. — 518 с.
18. Ежов, А. А. Нейрокомпьютинг и его применения в экономике и бизнесе / А. А. Ежов, С. А. Шумский. — М., 1998. — 222 с.
19. Литтл, Р. Дж. А. Статистический анализ данных с пропусками /Р. Дж. А. Литтл, Д. Б. Рубин. — М.: Финансы и статистика, 1991. — 336 с.
20. Кобринский, Б. А. Принципы математико-статистического анализа данных медико-биологических исследований / Б. А. Кобринский //Российский вестник перинатологии и педиатрии. — 1996. — №4.1. С. 60-64.
21. Эфрон, Б. Нетрадиционные методы многомерного статистическогоанализа / Б. Эфрон. М.: Финансы и статистика, 1988. - 263 с. 23.Орлов, А. И. Прикладная статистика. Учебник. / А.И.Орлов.- М.: Издательство «Экзамен», 2004. - 656 с.
22. Факторный, дискриминантный и кластерный анализ: Пер. с англ. / Дж. Щ. Ким, Ч. У. Мыоллер, У. Р. Клекка и др.; Под ред. И.С. Енюкова. — М.: Финансы и статистика, 1989. —215 с.
23. Yuceer, С. A rotation, scaling and translation invariant pattern classification system / C. Yuceer, K. Oflazer // Pattern Recognition — 1993. — Vol. 26.1. P. 687-710.
24. Zaden, L. A. The concept of linguistic variable and its application to approximate reasoning. Part 1-3 / L. A. Zaden // Information Sciences. — 1975. —Pp. 199-249.
25. Нейроинформатика / A. H. Горбань, В. Л. Дунин-Барковский, А. Н. Кирдин и др. — Новосибирск: Наука. Сибирское предприятие РАН, 1998. — 296 с.
26. Переверзев-Орлов, В. С. Советчик специалиста. Опыт разработки партнерской системы / В. С. Переверзев-Орлов. // М.: Наука, 1990. — 133 с.
27. Fu, Н.С. A fuzzy neural network for knowledge learning / H. C. Fu, J. J. Shann // Int. J. Neural Syst. — 1994. — V.5, № 1. — P. 13-22.
28. Масалович, А. И. От нейрона к нейрокомпьютеру / А. И. Масалович. // Журнал доктора Добба. — 1992. — №.1. — С. 20-24.
29. Stefanuk, V.L. Expert systems and its applications / V. L. Shtefanuk // The lectures of Union's workshop on the main problems of artificial intillegence and intellectual systems. Part 2, Minsk, 1990. — P. 36-55.
30. Горбань, A. H. Новая игрушка человечества / A. H. Горбань, В. И. Фриденберг. // МИР ПК. — 1993. — № 9.
31. Горбань, А. Н. Нейрокомпьютер или аналоговый ренессанс / А. Н. Горбань. // МИР ПК. — 1994. — № 10.
32. Rozenbojm, J. An expert clinical diagnosis system for the support of the primary consultation / J. Rozenbojm, E. Palladino, A. C. Azevedo. // Salud. Publica Мех. — 1993. — V.35, № 3. — P. 321-325.
33. Poli, R. A Neural Network Expert System for Diagnosing and Treating Hypertension / R. Poli, S. Cagnoni, R. Livi, et al. // Computer. — 1991. — №3. —P. 64-71.
34. Gindi, G. R. Neural network and conventional classifiers for fluorescence-guided laser angioplasty / G. R. Gindi, C. J. Darken, К. M. O'Brien, et al. // IEEE Trans. Biomed. Eng. — 1991. — V.38, № 3. — P. 246-252.
35. Allen, J. Development of a neural network screening aid for diagnosing lower limb peripheral vascular disease from photoelectric plethysmography pulse waveforms / J. Allen, A. Murray // Physiol. Meas. — 1993. — V.14, № 1. —P. 13-22.
36. Astion, M. L. Application of neural networks to the classification of giant cell arteritis / M. L. Astion, M. H. Wener, R. G. Thomas, G. G. Hunder, D.A. Bloch // Arthritis Reum. — 1994. — V.37, № 5. — P. 760-770.
37. Baxt, W. G. A neural network trained to identify the presence of myocardial infarction bases some decisions on clinical associations that differ from accepted clinical teaching / W. G. Baxt // Med. Decis. Making. — 1994. — V.14, №3. —P. 217-222.
38. Baxt, W. G. Complexity, chaos and human physiology: the justification for non-linear neural computational analysis / W. G. Baxt // Cancer Lett. — 1994. — V.77, № 2-3. — P. 85-93.
39. Baxt, W. G. Use of an artificial neural network for the diagnosis of myocardial infarction / W. G. Baxt // Ann. Intern. Med. — 1991. — V.l 15, № 11. — P. 843-848.
40. Guo, Z. Artificial neural networks in computer-assisted classification of heart sounds in patients with porcine bioprosthetic valves / Z. Guo, L.G. Durand, H.C. Lee, et al. // Med. Biol. Eng. Comput. — 1994. — V.32, № 3.1. P. 311-316.
41. Rinast, E. Neural network approach for computer-assisted interpretation of ultrasound images of the gallbladder / E. Rinast, R. binder, H.D. Weiss //Eur. J.Radiol. — 1993. —V. 17, №3. —P. 175-178.
42. Modai, I. Clinical decisions for psychiatric inpatients and their evaluation by a trained neural network /1. Modai, M. Stoler, N. Inbar-Saban, et al // Methods Inf. Med. — 1993. — V.32, № 5. — P. 396-399.
43. Ercal, F. Neural network diagnosis of malignant melanoma from color images / F. Ercal, A. Chawla, W. V. Stoeker, et al // IEEE Trans. Biomed. Eng. — 1994. — V.41, № 9. — P. 837-845.
44. Gross, G. W. Neural networks in radiologic diagnosis. II. Interpretation of neonatal chest radiographs / G. W. Gross, J. M. Boone, V. Greco-Hunt, et al // Invest. Radiol. — 1990. — V.25, № 9. — P. 1017-1023.
45. Floyd, С. E. Jr. Prediction of breast cancer malignancy using an artificial neural network / С. E. Jr. Floyd, J. Y. Lo, A. J. Yun, et al // Cancer. — 1994. — V.74, № 11. — P. 2944-2948.
46. Haykin, S. Neural networks, a comprehensive foundation. / S. Haykin. -N.Y.: Macmillan College Publishing Company. 1994.
47. Hornik, K. Multilayer feedforward networks are universal approximators. / K. Hornik, M. Stichcombe, H. White. // Neural Networks, 1989. Vol. 2. -Pp. 359-366.
48. Методика box-counting // http://iissvit.narod.ru/htm/vip28.htm
49. Хайкин, С. Нейронные сети: полный курс, 2-е издание: Пер. с англ. / С. Хайкин. М.: Издательский дом «Вильяме», 2006 — 1104 е.: ил. — ISBN 5-8459-0890-6 (рус.)
50. Duda, R. О. Pattern Classification and Scene Analysis. /R. О. Duda, P. E. Hart. New York: Wiley, 1973.
51. Fukunaga, K. Statistical Pattern Recognition, 2nd edition / K. Fukunaga. -New York: Academic Press, 1990.бЗ.Осовский, С. Нейронные сети для обработки информации: Пер. с польского И. Д. Рудинского. / С. Осовский М.: Финансы и статистика, 2004. - 344 с.
52. Hertz, J. Wstep do teorii obliczen neuronowych. Wyd II. / J. Hertz, A. Krogh, R. Palmer. Warszawa: WNT, 1995.
53. Barron, A. R. Approximation and estimation bounds for artificial neural networks. Machine learning / A. R. Barron. Vol. 14, 1994. - Pp. 115-133.66.0sowski, S. Sieci neuronowe w ujeciu algorytmicznym. / S. Osowski. -Warszawa: WNT, 1996.
54. Rosenblatt, F. Principle of neurodynamics. / F. Rosenblatt. -N.Y.: Spartan, 1992.
55. Weymaere, N. On the initialization and optimization of multilayer perseptron / N. Weymaere, J. P. Martens // IEEE Trans. Neural Networks, 1994.-Vol. 5.-Pp. 738-751.
56. Gill, P. Practical Optimization / P. Gill, W. Murray, M. Wright. N.Y.: Academic Press, 1981.
57. Widrow, B. Adaptive signal processing / B. Widrow, S. Stearns. N.Y.: Prentice Hall, 1985.
58. Marquardt, D. An algorithm for least squares estimation of nonlinear parameters. / D. Marquardt SIAM, 1963. - Pp. 431-442.
59. MacKay, D. J. C. Bayesian interpolation / D. J. C. MacKay //Neural Computation. 1912. Vol. 4. № 3. - P. 415-447.
60. Foresee, F. D. Gauss-Newton approximation to Bayesian regularization / F. D. Foresee, M. T. Hagan // Proceedings of the 1997 International Joint Conference on Neural Networks. 1997. P. 1930-1935.
61. Артюхин, В. В. Технология нейросетевого прогнозирования в абдоминальной хирургии / В. В. Артюхин, А. А. Соломаха // Вестник Новых Медицинских Технологий. Тула, 2003, Т. X, №1-2, С. 56.
62. Артюхин, В. В. Нейросетевой метод диагностики вирусного гепатита / В. В. Артюхин, А. А. Соломаха, В. И. Горбаченко //Нейрокомпьютеры: разработка, применение, 2005, № 7, С. 34-35.
63. Kohonen, Т. Self-Organization and Associative Memory. 2nd ed. / T. Kohonen. Berlin: Springer-Verlag, 1987.
64. Медведев, В. С. Нейронные сети MATLAB 6 /B.C. Медведев, В. Г. Потёмкин. М.: ДИАЛОГ-МИФИ, 2002. - 496 с.
-
Похожие работы
- Разработка и исследование информационно-измерительной системы поддержки принятия решений при диагностике и прогнозировании
- Морфофункциональные изменения печени как фактор патогенеза желчнокаменной болезни и возможности их коррекции
- Методы и средства ранней диагностики, оценки тяжести течения и прогнозирования исходов вирусного гепатита на основе нечетких моделей принятия решений
- Нейросетевая экспертная система на основе прецедентов для решения проблем абонентов сотовой сети
- Дифференцированная иммунотерапия персистирующей HBV-инфекции рекомбинантной анти HBV-вакциной
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность