автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей
Автореферат диссертации по теме "Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей"
РГ6 од На правах рукописи
/ А - .и ^Т^
СУСНИНА Алла Васильевна
МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СИСТЕМЫ ПРОГНОЗИРОВАНИЯ РЕЦИДИВИРУЮЩЕГО ИНФАРКТА МИОКАРДА НА ОСНОВЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ
ециальность 05.13.11 - Математическое и программное обеспечение
вычислительных машин, комплексов, систем и сетей 1ециальность 05.13.09 - Управление в биологических и медицинских системах (включая применение вычислительной техники)
Автореферат диссертации на соискание ученой степени кандидата технических наук
Рязань 1999
Работа выполнена в Рязанской государственной радиотехнической академии.
Научный руководитель:
доктор технических наук, профессор Пылькин А.Н.
Научный консультант:
доктор медицинских наук, профессор Якушин С.С.
Официальные оппоненты:
доктор физико-математических наук, профессор Вихров С.П.
кандидат технических наук, доцент Булаев М.П.
Ведущая организация:
Московский государственный институт электроники и математики
Защита диссертации состоится / февраля 2000 г. в /У часов на заседании совета Д063.92.03 по защите диссертации в Рязанской государственной радиотехнической академии по адресу: 390005, г. Рязань, ул. Гагарина, 59/1, ауд. 235.
С диссертацией можно ознакомиться в библиотеке Рязанской государственной радиотехнической академии.
Автореферат разослан «Д^» декабря 1999 г.
Ученый секретарь диссертационного совета, к.т.н., доцент
Телков И.А
РЦО, 1^0. у^'ТН'Ь ! О
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Особенностью современной медицины является лубокое проникновение в нее новых информационных технологий.
Огромные возможности дает применение математических методов и вы-шслителыюй техники в борьбе с наиболее распространенными заболеваниями :ердечно-сосудистой системы.
В области диагностики и лечения больных инфарктом миокарда (ИМ) в юследнее время достигнуты определенные успехи. Тем не менее, около 15-20% 5ольных острым ИМ погибают на догоспитальном этапе, еще 15% в больнице, )бщая летальность составляет 30-35%. Причины устойчивости столь высокой 1етальности до конца не изучены.
Отсутствие явного прогресса в исходе болезни заставляет глубже исследовать основные факторы заболевания, более точно прогнозировать течение ЯМ.
Целью прогноза в медицине является обоснование и обеспечение адек-)атных лечебных мероприятий, направленных на сохранение жизни больного и тредотвращение угрожающих ему осложнений, а не доказательство их неотвратимости. Большинство этих мероприятий обременительны для больного, сопря-кены с некоторым риском, а в настоящее время и весьма дорогостоящи, что эграничивает их использование с профилактической целью. Известно также, что зсложнения наблюдаются лишь у части больных ИМ и обычно возникают вне-¡апно.
Проблема прогнозирования осложнений, которые могут возникнуть в "оспитальный период ИМ, очень актуальна и является сложной задачей кардио-югии.
Рецидивирующий инфаркт миокарда (РИМ) - одно из наиболее серьез-л>1х осложнений ИМ.
Прогноз при этой форме течения ИМ обычно неблагоприятен. Леталь-тость при рецидивирующем течении крупноочаговых ИМ даже в условиях спе-диализированных отделений составляет около 50%.
В задачах прогноза в медицине можно выделить только приблизительный ибор наиболее важных начальных условий (факторы заболевания, ограничен-юе количество примеров для обучения), алгоритм нахождения ответа нельзя 1етко определить. Неявные задачи медицины стали идеальным полем для применения нейросетевых технологий, именно в этой области наблюдается наибо-1ее яркий практический успех нейроинформационных методов.
Основные принципы создания нейросетевых систем изложены в работах ^еных России А.Н.Горбаня, Э.М.Куссуля, А.И.Галушкина, Д.А.Россиева, З.В.Золотарева, С.Е.Головенкина и зарубежных авторов Ф.Розенблатта, Х>.Уоссермана, Д.-Э.Бэстэнса, А. Кп^Ь и др.
Целью диссертационной работы является разработка единой систем! прогнозирования возникновения и исхода рецидивирующего инфаркта миокард (СП РИМ) на основе математического аппарата искусственных нейронных сете (ИНС) для выработки оптимальной стратегии лечения конкретного больногс повышение точности прогноза.
Для достижения цели необходимо:
* провести анализ существующих систем прогноза ИМ и РИМ;
* провести анализ исходной информации, заданной в виде кар больных;
* обосновать метод решения задачи;
* разработать систему прогнозирования РИМ и реализовать ее пр( граммным путем;
* провести экспериментальные исследования разработанной системы.
Методы исследования. Исследования проводились на основе теории в( роятности, математической статистики, методов теории распознавания образо] метода кластерного анализа, математического аппарата искусственных нейро! ных сетей, структурного и объектно-ориентированного подхода.
Научная новизна.
1. Разработан способ прогнозирования возможности возникновения исхода РИМ.
2. Разработана методика предварительной оценки исходной информаци в задачах прогноза с использованием искусственных нейронных сетей пр наличии ограниченного количества примеров для обучения.
3. Предложено и обосновано применение метода кластерного анализ для уменьшения размерности вектора входных параметров при ограниченно выборке исходной информации.
4. Выявлены группы факторов, оказывающих идентичное влияние ъ возникновение и исход РИМ, что позволяет произвести уменьшение количеств факторов путем введения «синтетических» факторов, обобщающих влияю группы родственных.
Практическая ценность работы заключается в том, что разработанны способ системы прогнозирования РИМ на основе искусственных нейронны сетей позволяет получить точность прогноза возникновения и исхода РИМ 9( 95%. Разработанная методика предварительной оценки исходной информации задачах прогноза с ограниченным количеством примеров для обучения позвол: ет оценить возможность применения искусственных нейронных сетей для реш< ния задачи. Получена матрица коэффициентов нейросети для решения задач прогноза РИМ.
Примечание. Под точностью прогноза в работе понимается оценка ве-ооятности правильного распознавания объектов тестовой последовательности.
Практическая ценность результатов диссертационной работы подтверждается актами внедрения.
Достоверность полученных в диссертационной работе результатов обосновывается применением апробированных методов исследований и подтверждается результатами экспериментов на тестовых выборках исходной информации.
Реализация и внедрение результатов.
Система прогнозирования возникновения и исхода рецидивирующего инфаркта миокарда, разработанная в диссертационной работе, используется для анализа состояния больного при его поступлении в инфарктное отделение Рязанского областного клинического кардиологического диспансера с целью выработки стратегии лечения конкретного больного.
Методика анализа исходной информации для решения задач прогнозирования с применением нейросетевых технологий при наличии ограниченного количества примеров для обучения используется в учебном процессе в Рязанской государственной радиотехнической академии:
S на кафедре электронных вычислительных машин в курсе «Системы искусственного интеллекта» студентами специальности 2201 - «Вычислительные системы комплексы и сети»;
■S на кафедре вычислительной и прикладной математики в курсе «Теория принятия решений» студентами специальности 2204 - «Программное обеспечение вычислительной техники и автоматизированных систем».
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:
1. Международные научно-технические семинары «Проблемы передачи и обработки информации в информационно-вычислительных сетях», Рязань, 1997г., 1999г.
2. III Международный славянский конгресс «Электроника в медицине. Мониторинг, диагностика, терапия», Санкт-Петербург, 1998г.
3. Научно-практическая конференция Всероссийского научного общества кардиологов «Артериальные гипертензии и сердечная недостаточность», Рязань, 1998.
Публикации. По теме диссертации опубликовано 7 работ. В том числе 3 статьи в межвузовских сборниках, 4 тезисов и материалов докладов на международных и всероссийских конференциях и семинарах.
Структура и объем диссертации. Диссертационная работа состоит и введения, четырех глав, заключения и приложений. Основной текст содержи 213 страниц, 18 таблиц и 40 рисунков.
Список литературы состоит из 101 наименования.
Основные результаты, выносимые на защиту:
1. Способ прогнозирования рецидива инфаркта миокарда на основ искусственных нейронных сетей.
2. Методика предварительной оценки информации в задачах про гноза с использованием искусственных нейронных сетей при наличии огра ниченного количества примеров для обучения.
3. Методика уменьшения размерности вектора входных факторов з счет выделения групп факторов и их объединения.
4. Пакет прикладных программ системы прогнозирования РИМ н основе искусственных нейронных сетей.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертационной работь сформулированы основные задачи и научные результаты, которые выносятся н защиту, представлено краткое содержание глав диссертации.
В первой главе «Обзор и анализ систем прогнозирования инфаркт миокарда и его осложнений» проведен анализ существующих систе! прогнозирования возникновения, течения и исхода ИМ, а также его осложнение Разработана классификация рассмотренных систем с точки зрени использованного при разработке математического метода, объема исходно выборки, количества факторов заболевания, точности и срока прогнозг Сформулированы основные задачи, решение которых позволит создать боле эффективную и универсальную СП РИМ. Обоснована целесообразност применения математического аппарата ИНС для решения задачи прогноза РИМ
К настоящему времени известны формулы количественной оценк прогноза различных стадий течения ИМ: Э.Ш. Халфен, С.А. Пичугина, Schnui Peel, Norris и др. Наряду с традиционной общеврачебной методико прогнозирования, основанной на клиническом методе, разработаны систем] прогноза с использованием математических методов: математическо статистики, теории распознавания образов, экспертных оценок, ИНС Применение математических методов значительно расширяет возможност врача в установлении прогноза заболевания.
Исследованиям рецидивирующего ИМ посвящены работы Ю.М.Баш Н.М.Устинскова, АЛ.Сыркин, И.М.Гельфанд, Е.М.Амосова и др.
К основным недостаткам известных систем можно отнести:
* Определение индивидуального прогноза у большей части больных ос тается неудовлетворительным.
* Точность прогноза в рассмотренных системах колеблется в пределах 78-89%. В группе с благоприятным прогнозом вероятность предвидения составит 88 - 89%. В группе с неблагоприятным прогнозом -58- 63%.
* В большинстве случаев объявленные авторами технические характеристики систем не подтверждаются независимыми исследователями.
* Клинические факторы разнообразны. Нет единой точки зрения на зыбор факторов прогноза, как инфаркта миокарда, так и рецидивирующего шфаркта миокарда. Особое внимание следует уделить выделению риск-факторов рецидива ИМ.
* Не существует единых систем прогнозирования возникновения и исхода рецидива ИМ.
* Прогностические схемы должны со временем, по мере совершенство-зания методов лечения и развития новых математических методов, периодиче-:ки уточняться и корректироваться.
Характерной особенностью систем прогноза в медицине является эграниченный объем выборки для исследования и большое количество факторов заболевания. Традиционный путь решения подобных задач состоит в уменьшении количества факторов путем исключения наименее информативных. Ряд факторов при этом теряется. Применение ИНС позволяет сохранить все факторы, заданные предметными специалистами. Основное отличие использования ИНС при разработке систем прогноза состоит в том, что в этом :лучае нет резкой потери работоспособности системы при уменьшении объема зыборки исходной информации ниже критического значения. Задачи прогноза в медицине имеют также «нечеткий» характер ответа, совпадающий со способом зыдачи результата нейронными сетями
Нейросети эффективны для решения неформализуемых задач, связанных : необходимостью включения в алгоритм решения задач процесса обучения на эеальном экспериментальном материале (наличие примеров). С их помощью ложно найти решающие правила, основываясь на выявляемых скрытых закономерностях в многомерных данных.
Для разработки СП РИМ выбран математический аппарат ИНС.
Во второй главе «Разработка и исследование математической модели :истемы прогнозирования» проведен анализ исходной информации, определен шособ ее кодирования, оценена возможность решения задачи стандартными методами теории распознавания образов, сформулирована методика тредварительной обработки исходной информации в задачах прогноза с «¡пользованием ИНС при наличии ограниченного количества примеров для обучения. Для уменьшения количества факторов за счет их группировки трименен метод кластерного анализа.
Исходная информация задана в виде карт больных. В карту включены 25 факторов заболевания, которые содержат объективные и анамнестические дан-
ные, результаты лабораторных исследований, результаты обработки электрокардиограммы и другие показатели.
Известно, что наилучшие результаты прогноза могли бы быть получены при наличии модели предметной области. Однако для сложной системы (человека) построение подобной модели проблематично. В связи с этим объект прогноза рассматривается как совокупность множества входных параметров (факторов заболевания) и исхода заболевания.
Выделены две группы факторов. К первой группе относятся факторы, которые характеризуются количественными показателями (например, возраст больного, артериальное давление, экстрасистолия, количество лейкоцитов £ крови и т.д.). Вторую группу факторов составляют сведения о больном, выраженные в медицинских терминах и понятиях, которые не имеют цифровых значений (наличие и характер болей, различные осложнения), результаты полученной ЭКГ.
Факторы обеих групп разделены на 5 градаций. Увеличение номера градации соответствует усилению степени выраженности конкретного фактора Произведено кодирование входной информации. При кодировании использоваь принцип битовой маски.
В работе использована выборка больных, полученная врачами инфарктного отделения кардиологического диспансера. Все больные разделены на 2 класса в зависимости от исхода заболевания (Класс 1- больные с нелетальныр. исходом РИМ, Класс 2 - больные с летальным исходом РИМ, Класс 3 - боль ные, выписанные после определенного срока лечения в стационаре без РИМ).
Так как множество значений результатов прогноза ограничено конкрет ной выборкой больных, задача прогноза сводится к задаче распознавания обра зов, а именно как задача классификации с учителем.
В работе показано, что стандартные методы теории распознавание образов (Байеса, рекуррентные, минимизации эмпирического риска) не могу; быть применены для решения конкретной задачи из-за ограниченного объем; исходной информации и значительного количества факторов заболевания.
Задача распознавания имеет удовлетворительное решение, еоп пространство факторов само по себе задает свойство, под действием которой распознаваемые образы в этом пространстве легко разделяются. То есть длз прогноза должны быть использованы факторы, имеющие определяюще« значение при разделении на классы. Набор факторов (словарь признаков) зада! специалистами предметной области и обсуждению не подлежит.
Разработка системы прогноза на основе ИНС является сложной, плох* формализуемой задачей. Обучение нейросети (наиболее трудоемкая часть) н< может быть гарантированно успешным процессом. В связи с этим, в работ« поставлены и решены следующие задачи:
* произведена оценка качества факторов (под качеством фактор, понимается способность влияния на разделение объектов);
* разработана методика уменьшения количества факторов.
Для оценки качества факторов впервые применена методика, использующая количественные оценки (критерии разделимости факторов), применяемые при составлении словаря признаков в теории распознавания образов.
На первом этапе производится качественный анализ факторов в табличном процессоре Excel 97 пакета Microsoft Office 97 при работе со средствами «Анализ данных», раздел «Описательная статистика». Производится оценка средних значений, дисперсий и стандартных отклонений каждого фактора по классам. Анализ характеристик позволяет выделить факторы, являющиеся наиболее значимыми при разделении объектов, либо их отсутствие.
На втором этапе сравнительная оценка качества факторов производится по количественным критериям разделимости.
Пусть требуется произвести сравнительную оценку факторов jc/ и xs, I, s = 1, ...,N, иначе - определить, какой из этих факторов обладает лучшими разделительными свойствами.
Будем полагать, что качество фактора xi выше, чем качество фактора
Xs, I, s = 1, ...,N, если в соответствии с выбранным критерием показатель качества xi больше или меньше показателя качества фактора xs •
Условные плотности распределений f i (х,) неизвестны, однако известны оценки первых и вторых моментов этих распределений, т.е. т}, и D]t ■
Пусть заданы классы Q(, i =1,...,т, (т=3) и известны факторы для каждого класса Xj,j = 1,...N, N=25 .Факторы могут быть условно подразделены на две группы.
К первой группе относятся факторы, значения которых незначительно изменяются при переходе от одного объекта данного класса к другому объекту и заметно изменяются при переходе от объекта одного класса к объектам другого класса.
Ко второй группе относятся факторы, значения которых чувствительны к переходам от одного объекта данного класса к другому объекту этого же класса и незначительно изменяются при переходах от объектов одного класса к объектам других классов.
Факторы первой группы полезней факторов второй группы в смысле разделения классов. Количественная оценка качества факторов Xj,j = 1,—N, произведена следующим образом.
Пусть некоторый механизм вырабатывает значения j -го фактора с вероятностями, равными оценке априорной вероятности у'-го фактора в /-ом классе P(Qii), i = 1, т, j=l,...N. Оценка мат. ожидания некоторой фиктивной вели-
s
чины, принимающей значение mß с вероятностями P(Q.,),
т
Щтр] = HmßPiQß) ■ (О Оценка мат. ожидания дисперсии у'-го фактора по /=1
ш
классам: M[Dß] = TlDßP( Qß)- (2) Если M[D,,]< M[Dsi],l,s = 1,...N, то при /=1
прочих равных условиях качество фактора х/ выше, чем качество фактора xs ■ Дисперсия оценки мат. ожидания распределений факторов при переходе
от класса к классу определяется по формуле: ß.=M{[mß—M(mji)Y}- О)
Если ßn > £)si, то при прочих равных условиях качество фактора xi выше, чем
качество фактора xs •
Критерием сравнительной оценки факторов является величина Kj = M[DßVDji. (4) Качество фактора X/ выше качества фактора xs, если Ki< Ks • При этом наилучший фактор тот, который реализует minKj = min{M[DßVr)~} . (5)
Если критерии, рассчитанные по формуле (4), не позволяют выделил факторы, являющиеся базовыми для разделения по классам, то разработчш должен пересмотреть исходный набор факторов. Полученные критерии позволяют также в случае необходимости (недостаточный объем выборки требует уменьшения факторного пространства) исключать факторы в порядке, обрапкж их качеству.
Для уменьшения количества факторов за счет их группировки примене! метод кластерного анализа, но не в традиционной постановке.
Обычно метод кластерного анализа применяется для группировки родст венных или близких объектов (объект характеризуется набором факторов) пс критериям близости в многомерном пространстве (факторы используются даи группировки объектов). В настоящей работе предложено рассматривать в каче стве объектов анализа факторы состояния больного, то есть группировать ш объекты по степени их близости в многомерном факторном пространстве, а са ми факторы по степени их близости друг к другу у всего множества объектов решая таким образом «обратную» задачу кластерного анализа. В качестве мерь близости можно использовать близость законов распределения, коэффициента попарной корреляции и т.д. В настоящей работе в качестве меры близости ис пользовано Евклидово расстояние. Необходимо вычислить по известным значе ниям факторов у разных больных расстояния между всеми возможными парам! факторов. Предварительно значения факторов должны быть нормированы. Н:
следующем шаге определяется Евклидово расстояние между всеми парами фак-
личество больных.
Далее следует объединить пары факторов с наименее различающимися значениями в один фактор. Это объединение происходит по минимальному среди полученных расстояний. Матрица расстояний пересчитывается для вновь
число факторов в группе <7, т, - число факторов в группе
Общая схема метода последовательной кластеризации. Процесс начинается с рассмотрения п объектов; затем два ближайших объекта объединяются в один кластер, число кластеров становится п-1. Действия повторяются до тех пор, пока все п объектов не попадут в один кластер, содержащий все объекты.
После проведенной группировки, каждой группе и фактору, не вошедшему ни в одну группу, ставится в соответствие новый выходной фактор, значение которого будет равно среднему значению всех факторов, вошедших в группу. Реально процесс должен быть остановлен введенным ограничением. Критерий остановки процесса состоит в сокращении факторов до уровня, при котором объем выборки исходной информации становится достаточным.
Кроме чисто технических результатов по данной методике получены результаты, которые не выносятся на защиту, но представляют научный интерес для специалистов в области медицины - выяснилось примерно одинаковое влияние неродственных факторов.
В третьей главе «Разработка системы прогнозирования на основе нейро-компьютерных технологий» сформулированы и применены для разработки системы прогноза основные принципы создания нейросетевых систем.
Разработана общая структура СП РИМ с учетом предварительной обработки входной информации и варианты структур СП РИМ СМодель 1 и Модель 2), различающиеся способом кодирования выходной информации (рис. 1). Модуль предварительной обработки реализует группировку факторов методом кластерного анализа. Этот модуль может быть использован, если результаты обучения сети будут неудовлетворительными или сеть не сможет обучиться совсем.
СП РИМ, независимо от выбранной модели, функционирует в двух режимах: режиме обучения и режиме текущего прогноза.
Модуль интерфейса пользователя реализует удобный интерфейс для ввода данных в конкретном режиме. В этом же модуле происходит кодирование данных.
(б), к, I - номера факторов, п - ко-
СТРУКТУРА СП РИМ
Исходная
БАЗА ДАННЫХ 1
1 к г к
ИНТЕРФЕЙС ПОЛЬЗОВАТЕЛЯ
Данные для прогноза
1
Прогноз
МОДУЛЬ ПРЕДВАРИТЕЛЬНОЙ ОБРАБОТКИ ИНФОРМАЦИИ
НЕИРОПАКЕТ
СТРУКТУРА МОДЕЛИ 1
ИНТЕРФЕЙС ПОЛЬЗОВАТЕЛЯ
СТРУКТУРА МОДЕЛИ 2
ИНТЕРФЕЙС ПОЛЬЗОВАТЕЛЯ
Рис.1
Режим обучения. Процесс обучения рассматривается как настройка ар хитектуры сети и весов связей для эффективного выполнения специальной зада чи: некоторое множество входов должно приводить к требуемому множеств} выходов. Нейросеть настраивает веса связей по обучающей выборке. Исходна) информация должна быть разделена на две части: обучающую и тестовую. По следовательность примеров при обучении упорядочена случайным образом.
Если какой-то из классов примеров представлен недостаточно, случайный выбор должен происходить таким образом, чтобы примеры из слабо пред-:тавленной группы встречались чаще.
Следует проверить, чтобы при обучении не было одинаковых примеров, этносящихся к разным классам. Просто отбрасывать такие примеры нельзя, их
необходимо включить в тестовую последовательность.
При просмотре исходной информации для СП РИМ больных с одинаковыми значениями факторов, относящихся к разным классам, не обнаружено.
Исходная выборка для СП РИМ неоднородна. Недостаточно представлены примеры Класса 2 и Класса 3. Сформированы две обучающие и цве тестовые последовательности.
Коренное отличие методологии создания нейросетевых систем от традиционных состоит в том, что система никогда не является полностью законченной, продолжая накапливать опыт в процессе эксплуатации. По мере заполнения оазы данных, процесс обучения можно провести заново.
В качестве алгоритма обучения нейросети выбран стандартный алгоритм обучения - алгоритм обратного распространения ошибки.
Средняя квадратичная ошибка определяется как сумма квадратов разностей между желаемой величиной выхода ¿/^ и реально полученными на сети
значениями ук для каждого примера: е = у)2 (8)- Здесь Р - число
Р 4=1 *
примеров в обучающем множестве. При обучении сети параметр е изменялся в диапазоне (0.02 - 0.1).
Режим прогноза. Для Модели 1 текущие данные конкретного больного из эазы поступают в модуль Нейросеть 1, который определяет возможность возникновения РИМ. При прогнозе возникновения РИМ текущие данные поступают в модуль Нейросеть 2, который выдает прогноз о возможном исходе заболевания.
Для Модели 2 текущие данные конкретного больного поступают в модуль Нейросеть, который определяет одновременно возможность и возникновения и исхода РИМ.
На основании полученного прогноза врач может определить стратегию печения конкретного больного.
В качестве архитектуры нейросети использована многослойная сеть с прямыми связями обратного распространения. Входной слой является распределительным. Количество входов соответствует размерности факторного пространства (25). Количество нейронов выходного слоя определяется структурой системы прогноза (2 выхода). Количество скрытых слоев и количество нейронов в скрытых слоях определяется экспериментальным путем.
В четвертой главе «Экспериментальные исследования системы прогнозирования рецидивирующего инфаркта миокарда» проведены эксперименталь-
ные исследования разработанных моделей СП РИМ, проведено обучение сети, получены оценки вероятности правильного распознавания объектов для двух структур (Модель 1 и Модель 2) на тестовых выборках, нейросеть приведена к логически прозрачному виду (определено количество нейронов в скрытом слое).
Проведено 63 эксперимента. При обучении нейросети, использован конструктивный подход изменения конфигурации нейросети.
Проведено пробное обучение вариантов структур Модели 1 и Модели 2 на минимальном количестве нейронов в скрытом слое п=2 и на максимально возможном количестве нейронов п=25. Во всех случаях сеть обучилась за конечное число шагов. После обучения проводилась проверка работы системы на двух тестовых выборках.
Критерии работы нейросети.
1. Средняя квадратичная ошибка по обоим выходам нейросети по формуле (8): М8Е1 и МБЕ2.
2. Общая средняя квадратичная ошибка М8Ео=(МБЕ1+М8Е2)/2.
3. Корень квадратный из средней квадратичной ошибки УМБЕ1 и УМБЕ1 и УМ5Ео=(УМБЕ1+УМБЕ2)/2.
На рис. 2 показаны результаты эксперимента для Класса 2 Модели 2.
Класс 2 " ■ • ■ рим ■ лет.рим
100%
0%
количество нейронов
Рис.2. Оценка вероятности правильного распознавания для объектов Класса 2 (Модель 2) При выборе базовой структуры СП РИМ учитывалось наличие двух видо! ошибок исхода заболевания. Ошибка первого рода возникает, когд; прогнозируется благоприятный исход, а на самом деле он неблагоприятный Если прогнозируется неблагоприятный исход, а на самом деле оь благоприятный, то возникает ошибка второго рода. Для врача более важно{ ошибкой является ошибка первого рода. Таким образом, при выбор« окончательного варианта ошибки первого рода должны быть ниже. То есть дл? больных Класса 3 важнее процент правильно определенных прогнозов наличш РИМ. Для больных Класса 2 - процент правильно определенного прогнозг летального РИМ. В качестве базовой структуры СП РИМ выбрана Модель 2 Лучшие результаты работы системы с точки зрения точности прогноза получены для конфигурации нейросети с 9 а 12 нейронами в скрытом слое. Проведень дополнительные эксперименты для этих конфигураций, с целью исключение
возможности локального минимума. На рис.3 показаны графики средних квадратичных ошибок.
Работа сети на основании оценок средних квадратичных ошибок выходов сети более стабильна при 12 нейронах в скрытом слое.
Результаты работы базовой Модели 2 для объектов всех классов: Класс 1: наличие РИМ -100%, нелетальный исход -100%; Класс 2: наличие РИМ - 100%, летальный исход - 92.3%; Класс 3: нет РИМ -100%, нелетальный исход - 100%.
еь*эд1 ■
ЦМО
цшо 0:020 Осло
2 3 4
нмржпермнга
«во ОСИ) 0010 0000
кмержгерменга
Рис. 3. а) - сеть с и=Р б) — сеть с п=12
В связи с тем, что получена высокая точность прогноза, модуль предварительной обработки информации при проведении экспериментов не использовался. По этой же причине не проводились эксперименты для сети с несколькими скрытыми слоями.
Разработан пакет прикладных программ системы прогнозирования РИМ на языке программирования Object Pascal в среде визуального программирования Delphi 3.0. Нейропакет состоит из отдельных модулей. Данные о больных хранятся в базе данных формата Paradox.
Архитектура нейропакета приведена на рис. 4.
Модуль интерфейса осуществляет связь с пользователем с помощью кнопочного интерфейса, реализует задачи ведения системной базы данных, просмотр базы данных пользователя, осуществляет межмодульный интерфейс.
Ядро нейропакета составляет модуль Neuron. В нем разработаны объекты нейрон, слой нейронов, нейросеть. Здесь же находятся метод Teach, реализующий алгоритм обратного распространения. Основой нейрона является динамический массив, элементами которого являются веса входов.
Модуль ввода исходной информации осуществляет заполнение формы на Зольного (реализована структура карты больного).
Модуль подготовки обучения производит подготовку данных для обучения, осуществляет вызов метода Teach нейросети.
Модуль формирования массивов коэффициентов - вспомогательный мо дуль, формирует динамические массивы коэффициентов в сети, нейронов и ело ев нейронов.
Рис. 4. Архитектура нейропакета ЗАКЛЮЧЕНИЕ
Основные результаты, полученные в диссертационной работе:
1. Проведен анализ существующих систем прогнозировани возникновения, течения и исхода ИМ, а также его осложнений.
2. Разработана классификация рассмотренных систем с точки зрени использованного при разработке математического метода, точности прогноза : срока прогноза.
3. Обоснована целесообразность и эффективность применени математического аппарата ИНС для решения задачи прогноза возникновения : исхода РИМ.
4. Проведен анализ исходной информации.
5. Оценена возможность решения задачи прогноза РИМ методам теории распознавания образов.
6. Определен способ кодирования входной информации.
7. Разработана методика предварительной обработки исходно информации в задачах прогноза с использованием ИНС при наличи ограниченного количества примеров для обучения.
8. Показана возможность применения метода кластерного анализа дл оценки разделения как входных, так и выходных объектов задачи
9. Предложено и обосновано применение метода кластерного анализа для уменьшения размерности вектора входных параметров при ограниченной выборке исходной информации.
10. Выявлены группы факторов, оказывающих идентичное влияние на возникновение и исход РИМ, что позволяет произвести уменьшение количества факторов путем введения «синтетических» факторов, обобщающих влияние группы родственных.
11. Разработаны две структуры СП РИМ, различающиеся способом кодирования выхода.
12. Для обучения нейросети в СП РИМ использован стандартный алгоритм обучения (алгоритм обратного распространения ошибки). В качестве архитектуры нейросети использована многослойная нейросеть с прямыми связями обратного распространения.
13. Работоспособность вариантов структур СП РИМ доказана с помощью экспериментов на тестовых выборках исходной информации с использованием программной системы.
14. Получена матрица коэффициентов нейросети для решения задачи прогноза РИМ.
15. Разработан пакет прикладных программ системы прогнозирования РИМ на основе искусственных нейронных сетей на языке программирования Object Pascal в среде визуального программирования Delphi 3.0.
16. На основании проведенных экспериментов, определены базовые структура СП РИМ и конфигурация нейросети, позволяющие прогнозировать возникновение и исход РИМ с точностью ~ 90-95%.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Суснина A.B., Сазонова Н.С. Анализ влияния метеоусловий на прогнозирование возникновения рецидива инфаркта миокарда. /Проблемы передачи и обработки информации в информационно-вычислительных сетях. Тез.докл. 7-го Международного научного технического семинара. М., НИЦПрИС, 1997. -132 с.
2. Суснина A.B., Сазонова Н.С., Токарева Л.Г., Болонина JI.M. Сезонность и смертность от рецидивирующего инфаркта миокарда. /III Междунар. славянский Конгресс по электростимуляции и клинической электрофизиологии сердца. «Кардиостим-1998», С-П, 1998.
3. Суснина A.B., Сазонова Н.С. Формализация задачи рецидивирующего инфаркта миокарда. Межвуз. сб. научн. трудов «Информатика и прикладная математика». Рязань, РГПУ, 1998, 108 с.
4. Суснина A.B. Программная модель системы прогнозирования рецидива инфаркта миокарда. Межвуз. сб. научн. трудов «Математическое и программное обеспечение вычислительных систем». М., Минобразование России, НИПрИС, 1998,- 152 с.
5. Пылькин А.Н., Якушин С.С., Суснина A.B., Сазонова Н.С. Анали; проблем разработки системы прогнозирования рецидива инфаркта миокарда ш базе аппарата искусственных нейронных сетей. Межвуз. сб. научн. трудов «Вычислительные машины, комплексы и сети». Рязань, РГРТА, 1999.
6. Якушин С.С., Сазонова Н.С, Суснина A.B., Зайцева Н.В. Факторь риска и возможности прогнозирования рецидива инфаркта миокарда. Сборнш тезизов «К 10-летию Моск. обл. кардиол. центра, 60-летию Жуковской горболь ницы», Жуковский, 1999, 248 с.
7. Пылькин А.Н., Суснина A.B. Предварительная обработка априорно! информации в задачах прогноза с использованием нейронных сетей при нали чии ограниченного количества примеров для обучения. /Проблемы передачи i обработки информации в информационно-вычислительных сетях. Тез.докл. 8-г< Международного научного технического семинара. М: НИЦПрИС, 1999. - 132 с
Оглавление автор диссертации — кандидата технических наук Суснина, Алла Васильевна
3ведение
Глава 1. Обзор и анализ систем прогнозирования чнфаркта миокарда и его осложнений
1.1. Обзор систем прогнозирования возникновения, течения, исхода и осложнений инфаркта миокарда 2\
1.1.1. Основные этапы в развитии прогностических показателей
1.1.2. Системы прогнозирования, основанные на использовании математических методов
1.1.3. Системы прогнозирования рецидивирующего инфаркта миокарда
1.2. Классификация систем прогнозирования инфаркта миокарда и рецидивирующего инфаркта миокарда
1.3. Формулировка требований к разработке системы прогнозирования рецидивирующего инфаркта миокарда
Выводы
Глава 2. Разработка и исследование математической модели системы прогнозирования
2.1. Анализ исходной информации
2.1.1. Понятие фактора прогноза
2.1.2. Структура карты больного
2.2. Постановка задачи прогноза РИМ как задачи классификации
2.2.1. Задача обучения
2.2.2. Возможные методы решения задачи пассификации
2.2.3. Оценка объема реальной выборки
2.3. Определение частоты появления факторов по лассам
2.4. Кодирование входной информации
2.5. Исследование параметров факторов в юответствии с принадлежностью больных к классам
2.5.1. Оценка параметров факторов
2.5.2. Методика предварительной обработки исходной шформации в задачах прогноза с использованием НС при наличии ограниченного количества примеров для обучения
2.5.3. Применение критериев метода кластерного анализа для оценки разделимости объектов задачи
2.5.4. Применение метода кластерного анализа для руппировки факторов
2.6. Обоснование применения математического аппарата ИНС для разработки СП РИМ
Выводы
Глава 3. Разработка системы прогнозирования на основе нейрокомпьютерных технологий
3.1 .Общие положения теории НС
3.1.1. Стандартные структуры нейронных сетей
3.1.2. Методика разработки нейросетевых систем
3.2. Разработка структуры СП РИМ 125 3.2.1. Кодирование выходной информации
3.3. Выбор алгоритма обучения нейронной сети
3.3.1. Алгоритм обратного распространения ошибки
3.3.2. Критерии качества работы нейронной сети
3.3.3. Разработка структуры нейронной сети в СП РИМ
3.3.4. Разделение исходной информации на обучающую и тестовую выборки
3.4. Определение оптимальной структуры нейронной
Выводы лава 4. Экспериментальные исследования системы 1рогнозирования рецидивирующего инфаркта миокарда
4.1. Экспериментальное исследование моделей
4.1.1. Методика проведения экспериментов
4.1.2. Оценка качества Модели
4.1.3. Оценка качества Модели
4.1.4. Выбор базовой модели системы
4.2. Общие сведения о нейропакете 163 4.2.1. Файл настройки системы
Выводы
Введение 1999 год, диссертация по информатике, вычислительной технике и управлению, Суснина, Алла Васильевна
Актуальность темы. Одной из основных особенностей современной медицины является глубокое проникновение в нее средств и методов вычислительной техники.
Использование современных информационных технологий дает возможность создать дистанционные консультативно-диагностические центры, позволяющие резко повысить уровень медицинской помощи населению и делающие реальным массовое обследование населения с целью выявления групп лиц, предрасположенных к тому или иному заболеванию.
Существует пять основных направлений применения электронно-вычислительных машин (ЭВМ) в кардиологии: диагностика, прогнозирование, лечение, организация информационно-поисковых систем, моделирование [11].
Огромные возможности дает применение математических методов и вычислительной техники в борьбе с наиболее распространенными заболеваниями сердечно-сосудистой системы.
Инфаркт миокарда (ИМ) - заболевание, которое может закончиться практически полным выздоровлением без какой-либо медицинской помощи, и наоборот, привести к летальному исходу, несмотря на все усилия врачей. Однако между этими крайностями находится многочисленная группа больных, судьба которых во многом зависит от своевременности и оперативности проведения лечебных мероприятий [50].
В области диагностики и лечения больных ИМ в последнее время достигнуты определенные успехи. Однако летальность при этом заболевании все еще остается высокой. Сотрудниками Московского центра неотложной кардиологии установлено, что общегородская летальность в стационарах снизилась лишь на 1.2%, и так же, как и 10 лет назад, умирает каждый четвертый больной. Причины устойчивости столь высокой летальности до конца не изучены. Имеет значение и запоздалая госпитализация, и недостаточное качество лечения. Даже в наиболее оснащенных отделениях летальность достигает 12-13%. Отсутствие явного прогресса в исходе болезни заставляет глубже исследовать основные факторы возникновения летальных исходов, более точно прогнозировать течение ИМ и с учетом этого выбирать оптимальные методы лечения [47].
Составной частью прогноза исхода заболевания является возможность прогнозирования осложнений, которые могут возникнуть в госпитальный период ИМ. Эта проблема очень актуальна и является одной из наиболее сложных задач кардиологии. Прогнозирование необходимо осуществлять при поступлении больного в стационар, сразу же после проведения стандартных методов обследования. Оно должно быть быстрым, проводиться неоднократно в процессе наблюдения за больным по мере поступления новых данных о его состоянии.
Получение прогноза осложнений позволяет врачу целенаправленно проводить профилактику, усилить наблюдение за больным, скорректировать режим физической активности пациента (особенно в предполагаемые сроки возникновения осложнения).
В клинической практике врач, как правило, определяет прогноз эвристически, полагаясь на свой опыт и интуицию. В более сложных случаях прогноз составляется несколькими специалистами, что повышает его точность. Эффективность знаний и опыта отдельных специалистов при определении прогноза значительно повышается за счет применения математического анализа медицинской информации о состоянии больного и использования при этом ЭВМ [3].
Самым ранним подходом к решению проблемы прогноза ИМ была оценка тяжести состояния больного путем сопоставления ведущих клинических признаков, имеющих неблагоприятное прогностическое значение. Подход привлекает простотой, а использование привычного понятия «клинический синдром» делает способ прогнозирования доступным для широкого круга лечащих врачей. Работы в этом направлении продолжаются. Уточнена прогностическая значимость клинических симптомов, лабораторных и инструментальных показателей. Оценивая прогноз у больного ИМ, врач основывается на совокупности наиболее существенных признаков болезни, но не учитывает их комбинации, взаимное влияние, а также отсутствие некоторых симптомов. Нельзя составить прогноз по одному из проявлений болезни [26].
Дальнейшее развитие прогнозирования осуществлялись по нескольким направлениям: формулировка критериев отбора больных для прогнозирования [8,10], объективизация признаков и устранение произвольности в выборе их весовых значений, четкое определение каждого признака для достижения максимальной его воспроизводимости [1], расширение (до нескольких суток) периода сбора данных прогноза [10], использование групп симптомов в качестве единого прогностического признака [8], продление времени действия прогноза на весь период лечения больного в стационаре [1,8].
Более совершенным шагом в развитии прогностических оценок стало изучение сочетаний клинических признаков с помощью математических методов анализа. Для количественной оценки отобранных признаков использовали различные параметрические и непараметрические методы (выработка линейных, кусочно-линейных дискриминантных функций), составляй в результате схему или форму расчета прогностического индекса [25].
К настоящему времени разработаны формулы количественной оценки прогноза различных стадий течения [1,21,24,25,40]. Наряду с традиционной общеврачебной методикой прогнозирования, основанной на клиническом методе, применяются математические методы оценки прогноза с использованием ЭВМ [2,3,8,9,10,14,20,28,33,34,38,43,47,53], что позволило значительно расширить возможности врача в установлении прогноза заболевания.
Тем не менее разработанные системы имеют ряд недостатков:
• Индивидуальный прогноз у большей части остается неудовлетворительным.
• Точность прогноза колеблется в пределах 78 - 89%, причем, если в группах с благоприятным прогнозом заболевания вероятность предвидения составляет 88 - 89%, то в группах с неблагоприятным прогнозом - всего 58 - 63% [27].
• В большинстве случаев объявленные авторами технические характеристики разработанных систем не подтверждаются независимыми исследователями.
• Недостаточно внимания уделяется прогнозу возникновения различных осложнений ИМ.
Анализ работ, посвященных клинико-математическому прогнозированию исходов ИМ, показывает, что все они носят поисковый характер и нацелены в основном на исследование возможностей использования различных клинических данных и математических приемов их обработки для прогнозирования исхода и течения ИМ [26]. Особый интерес представляют те математические методы прогнозирования, реализация которых доступна любому врачу в любом лечебном учреждении [27].
Одной из целей прогноза в медицине является обоснование и обеспечение адекватных лечебных мероприятий, направленных на сохранение жизни больного и предотвращение угрожающих ему осложнений, а не доказательство их неотвратимости [26]. Большинство этих мероприятий обременительны для больного и сопряжены с некоторым риском, а в настоящее время и весьма дорогостоящи, что ограничивает их использование с профилактической целью. Известно также, что подобные осложнения наблюдаются лишь у части больных ИМ и часто возникают внезапно. Таким образом, одним из непременных условий целенаправленного предотвращения таких осложнений и, следовательно, неблагоприятного исхода ИМ является своевременное и достаточно достоверное их предвидение. Лечебная помощь больным ИМ во многом основывается на ранней диагностике тяжелых осложнений. К сожалению, врачебное прогнозирование в этой области пока еще не удовлетворяет двум последним требованиям [10].
Предвидение риска конкретных, угрожающих больному осложнений, на предупреждение которых должно быть ориентировано лечение, интересует лечащих врачей в гораздо большей мере, чем прогноз риска летального исхода [26].
Рецидивирующий инфаркт миокарда (РИМ) является одним из наиболее серьезных осложнений ИМ.
Повторные некрозы миокарда могут развиваться спустя дни, месяцы и годы после перенесенного ИМ и являются наряду с внезапной смертью одной из основных причин летальности у больных [13].
По отношению к перенесенному ИМ повторные некрозы могут быть разделены на ранние и поздние.
В отечественной литературе принят термин «рецидивирующий инфаркт миокарда» для повторных некрозов, развивающихся в процессе излечения от перенесенного ИМ. В зарубежной литературе этот вид осложнения ИМ не выделяется.
В настоящей работе под РИМ понимается вариант болезни, при котором новые участки некроза миокарда возникают в сроки от 72 часов после развития ИМ и до окончания основных процессов рубцевания, то есть приблизительно в течение 8 недель. При этом после возникновения каждого нового очага некроза отсчет времени начинается заново [16, с.8].
Увеличение размеров очага некроза и появление новых очагов в течение первых 72 часов развития после развития ИМ рассматривается как расширение зоны формирующегося ИМ, и в таких случаях диагноз не ставится.
К РИМ не относится также и затяжное течение ИМ, при котором не возникает «спокойных» промежутков, а имеет место длительный - от нескольких дней до одной недели и более - период следующих один за другим болевых приступов с постоянно повышенной активностью ферментов крови, лихорадкой и другими признаками свежих некротических изменений в миокарде [50, с. 163].
Клиническое значение рецидивов ИМ чрезвычайно велико. Уменьшается масса сократительного миокарда, возрастает число больных с хронической недостаточностью и нарушениями сердечного ритма. Значительно увеличивается продолжительность стационарного лечения. Вновь возникший некроз резко увеличивает опасность летального исхода [50, с.165].
Частота появления рецидивирующих форм ИМ колеблется от 4 до 31% [32]. Прогноз при этой форме течения ИМ обычно неблагоприятен, так как в 80% случаев развивается сердечная недостаточность, в том числе у 30% больных - сердечная астма и отек легких. Летальность при рецидивирующем течении крупноочаговых ИМ даже в условиях специализированных отделений высока и составляет около 50%о.
По данным А.Л. Сыркина [16, с.94] из 656 больных, оставшихся в живых спустя 72 часа после возникновения ИМ, в период дальнейшего пребывания в стационаре погиб 41 человек, при этом среди больных с РИМ умерли 32 из 105 человек, а среди остальных лишь 9 из 551. Таким образом, РИМ стал причиной 35% всей больничной летальности от ИМ, среди оставшихся в живых спустя 72 часа от начала болезни и погибших в более поздние сроки РИМ был основной причиной смерти (78% погибших больных).
При сопоставлении затяжного и рецидивирующего ИМ важной особенностью последнего является его нередкое возникновение на фоне более или менее удовлетворительного состояния больного. При затяжном течении опасность, как правило, очевидна, поэтому больной находится под постоянным наблюдением в палате интенсивной терапии.
Рецидив возникает в любые сроки больничного лечения, вплоть до момента выписки больного из стационара. Существуют определенные трудности и в диагностике РИМ. Поскольку значительная часть рецидивов связана с гибелью участков мышцы, находящихся среди уже некротизированной ткани, они «умирают молча», без болей [50, с. 166]. Следует также отметить, что РИМ значительно чаще, чем ИМ, дает разнообразные осложнения, что приводит к удлинению сроков больничного лечения, а также увеличивает смертность от ИМ [36].
Таким образом, не вызывает сомнения важность изучения этой формы ИМ, что обусловлено ее значительной частотой и тяжестью течения [22].
Теоретический и практический интерес представляет прогнозирование развития и исхода рецидивов. Имеющиеся в литературе сведения о РИМ немногочисленны и противоречивы. До настоящего времени не существует общепринятых критериев постановки диагноза РИМ [22]. Из-за многообразия проявлений болезни и их комбинаций прогнозирование исхода представляет чрезвычайно сложную задачу. Для улучшения результатов прогнозирования применяется ряд математических методов, но у значительной части больных индивидуальный прогноз остается недостаточно достоверным [12].
Одной из первых работ, посвященных прогнозу возникновения РИМ, является работа Ю.М. Бала и соавт. [4]. Ценность разработанного метода снижается в связи с тем, что прогноз каждый раз дается лишь на ближайшие три дня и необходимы многократные повторные определения выделенных факторов заболевания. В работе также не рассматривается вопрос об исходе РИМ, что позволило бы врачу более дифференцированно обосновать и выбрать тактику лечения: сроки повторного пребывания больного в отделении интенсивной терапии, степень и продолжительность ограничения режима, повторное назначение антикоагулянтов прямого действия и т.д. [12]. Противоречивы оценки точности прогноза по этой системе. Точность прогноза по системе Ю.М. Бала составляет - 65% [27], хотя сам автор завышает это значение до 80%.
В работах Н.М. Устинсковой и A.JI. Сыркина. [12, 16] предложен метод прогноза ближайшего исхода (будет выписан больной из стационара или умрет) у больных РИМ, оставшихся в живых через 72 часа после возникновения рецидива ИМ. Недостатками метода следует считать многочисленность признаков, определяющих заболевание, субъективность ряда признаков (например, признак «общее состояние» в определенной степени зависит от квалификации врача), а также то, что достоверность отобранных наиболее информативных признаков неоднородна.
И.М. Гельфанд и соавт. [19] отмечают, что попытка прогнозировать специально рецидивирующее течение ИМ, оказалась неудачной. В процессе работы выяснилось, что одновременно с РИМ прогнозируется летальный исход, не обусловленный рецидивом.
E.H. Амосова [22] в своем исследовании отмечает несомненный практический и теоретический интерес прогнозирования развития рецидивов, поскольку этот вопрос фактически не изучен и считает, что большее внимание стоит уделить определению риск-факторов возникновения рецидивов.
Больше работ, посвященных прогнозу РИМ, в отечественной литературе, не встретилось. Поскольку за рубежом данный вид заболевания не классифицируется, работ зарубежных авторов, посвященных прогнозированию РИМ, нет.
В общей постановке задачи прогноза не представляется возможным учесть все реально имеющиеся условия, от которых зависит ответ, а можно выделить только приблизительный набор наиболее важных начальных условий (в медицине: факторов заболевания). Так как часть входной информации при этом не учитывается, ответ носит неточный, приблизительный характер, алгоритм нахождения ответа не может быть точно и однозначно определен.
При решении таких задач в последнее время наиболее часто применяется математический аппарат искусственных нейронных сетей (ИНС). Однако, его использование может обеспечить успешное решение задачи (с точки зрения временных затрат разработчика) при выполнении двух условий:
• возможности использования универсального типа архитектуры нейросети и универсального алгоритма обучения (отсутствие необходимости в их разработке для каждого типа задач);
• наличия примеров (предыстории, фиксированного опыта), на основании которых производится обучение нейронных сетей [76].
За многие годы наблюдений за больными, перенесшими ИМ, врачами Рязанского кардиологического центра выделены основные факторы риска РИМ, накоплены истории болезней, разработана структура карты больного ИМ. Все это теоретически позволяет решить задачу прогноза возникновения этого заболевания, применив ИНС [92, 93, 94].
Целью диссертационной работы является разработка единой системы прогнозирования возникновения и исхода РИМ (СП РИМ) на основе математического аппарата ИНС для выработки оптимальной стратегии лечения конкретного больного, повышение точности прогноза.
Для достижения цели необходимо решить следующие задачи: 1. Провести анализ существующих систем прогноза ИМ и РИМ.
2. Провести анализ исходной информации, заданной в виде карт больных.
3. Обосновать метод решения задачи.
4. Произвести кодирование исходной информации.
5. Оценить исходную информацию с точки зрения разделения больных на классы.
6. Определить кодирование выходной информации.
7. Разработать структуру СП РИМ и на ее основе программный нейропакет.
8. Определить алгоритм обучения нейросети СП РИМ
9. Задать начальную конфигурацию нейросети (или нейросетей).
10. Разделить исходную информацию на обучающую и тестовую последовательности.
11. Провести экспериментальное исследование СП РИМ, на основании которого определить конфигурацию нейросети, способную обеспечить заданное качество прогноза.
Научная новизна диссертации состоит в следующем.
1. Обоснована целесообразность и эффективность применения математического аппарата ИНС для решения задачи прогноза возникновения и исхода РИМ.
2. Разработан способ прогнозирования возможности возникновения и исхода РИМ.
3. Разработана методика предварительной оценки исходной информации в задачах прогноза с использованием ИНС при наличии ограниченного количества примеров для обучения.
4. Предложено и обосновано применение метода кластерного анализа для уменьшения размерности вектора входных параметров при ограниченной выборке исходной информации.
5. Выявлены группы факторов, оказывающих идентичное влияние на возникновение и исход РИМ, что позволяет произвести уменьшение количества факторов путем введения «синтетических» факторов, обобщающих влияние группы родственных.
6. Разработан пакет прикладных программ системы прогнозирования РИМ на основе искусственных нейронных сетей.
Практическая ценность работы заключается в том, что применение разработанных моделей построения СП РИМ на основе использования аппарата ИНС позволяет получить качество прогноза исхода и возникновения РИМ 9095%. Разработанная методика предварительной оценки исходной информации в задачах прогноза с ограниченным количеством примеров для обучения позволяет оценить возможность применения ИНС для решения задачи. Получена матрица коэффициентов нейросети для решения задачи прогноза РИМ.
Примечание. Под точностью прогноза понимается оценка вероятности правильного распознавания объектов тестовой последовательности.
Практическая ценность результатов диссертационной работы подтверждается актами внедрения.
Достоверность полученных в диссертационной работе результатов подтверждается результатами эксперимента на тестовых выборках исходной информации.
Диссертационная работа состоит из введения, четырех глав, заключения и приложений.
Заключение диссертация на тему "Математическое и программное обеспечение системы прогнозирования рецидивирующего инфаркта миокарда на основе искусственных нейронных сетей"
Основные результаты, полученные в диссертационной работе:
1. Проведен анализ существующих систем прогнозирования возникновения, течения и исхода ИМ, а также его осложнений.
2. Разработана классификация рассмотренных систем с точки зрения использованного математического метода для прогноза, точности прогноза и срока прогноза.
3. Обоснована целесообразность и эффективность применения математического аппарата ИНС для решения задачи прогноза возникновения и исхода РИМ.
4. Проведен анализ исходной информации.
5. Оценена возможность решения задачи прогноза РИМ методами теории распознавания образов.
6. Определен способ кодирования входной информации.
7. Разработана методика предварительной обработки исходной информации в задачах прогноза с использованием ИНС при наличии ограниченного количества примеров для обучения.
8. Показана возможность применения метода кластерного анализа для оценки разделения как входных, так и выходных объектов задачи
9. Предложено и обосновано применение метода кластерного анализа для уменьшения размерности вектора входных параметров при ограниченной выборке исходной информации.
10. Выявлены группы факторов, оказывающих идентичное влияние на возникновение и исход РИМ, что позволяет произвести уменьшение количества факторов путем введения «синтетических» факторов, обобщающих влияние группы родственных.
11. В качестве математической модели выбран математический аппарат
ИНС.
12. Разработаны две структуры СП РИМ, различающиеся способом кодирования выхода.
13. Для обучения нейросети в СП РИМ использован стандартный алгоритм обучения, конфигурация нейросети определена как стандартная многослойная сеть с прямыми связями обратного распространения.
14. Работоспособность структур СП РИМ доказана с помощью эксперимента на тестовых выборках исходной информации с использованием программной системы.
15. Разработан пакет прикладных программ системы прогнозирования РИМ на основе ИНС на языке программирования Object Pascal в среде визуального программирования Delphi 3.0 .
16. Получена матрица коэффициентов нейросети для решения задачи прогноза РИМ.
17. На основании проведенных экспериментов, определена структура СП РИМ и базовая конфигурация нейросети. Оценка вероятности правильного распознавания объектов составила:
Класс 1: РИМ ~ 100%, нелетальный исход ~ 100%;
Класс 2: РИМ ~ 100%, летальный исход ~ 92.3%;
Класс 3: нет РИМ ~ 100%, нелетальный исход ~ 100%.
Материалы диссертации опубликованы в 7 научных работах [82, 91, 92, 93, 94, 95, 101]. Разработан и зарегистрирован в Федеральном институте промышленной собственности способ прогнозирования возможности возникновения и исхода рецидивирующего инфаркта миокарда (№.99110119 (010579) от 12.05.99)
Содержание основных разделов диссертации докладывалось на:
172
- Международном научно-техническом семинаре «Проблемы передачи и обработки информации в информационно-вычислительных сетях», Рязань, 1997г., 1999г.; на III Международном славянском конгрессе «Электроника в медицине. Мониторинг, диагностика, терапия», Санкт-Петербург, 1998г.;
- Научно-практической конференции Всероссийского научного общества кардиологов «Артериальные гипертензии и сердечная недостаточность», Рязань, 1998.
Заключение
Библиография Суснина, Алла Васильевна, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Халфен Э.Ш., Яценко К.С., Хампиев А.Х. О математической оценке прогноза у больных инфарктом миокарда /Советская медицина. 1965, №4, с. 151-154.
2. Прикладные аспекты прогнозирования инфаркта миокарда /И.Ступелис, Н.Станайтите, Р.Петкявичене и др. //Кардиология. 1969, №12, с. 40-47.
3. Жаров Е.И., Степанов A.B. Математическое прогнозирование при крупноочаговом инфаркте миокарда по показателям гемодинамики /Кардиология. 1970, №12, с. 73-80.
4. О возможности прогнозирования рецидива инфаркта миокарда /Бала Ю.М., Гусев А.И., Руссман И.Б. и др. // Терапевтический архив.- 1972. т. 34, №3, с. 6-9.
5. Аншелевич Ю.В., Слайдынь А.К., Шафро И.С. К оценке методов прогнозирования ближайших исходов инфаркта миокарда /Кардиология. 1970, №12, с. 81 84.
6. Дитятов В.П. Сравнительная оценка некоторых методов математического прогнозирования ближайшего исхода инфаркта миокарда. / Вопросы неотложной помощи. Свердловск, 1977, с. 36-38.
7. Сыркин А.Л., Маркова А.И. Рецидивирующий некроз как осложнение подострого периода инфаркта миокарда/Кардиология. 1977, №2, с. 62-66.
8. Прогнозирование исхода инфаркта миокарда с помощью программы «Кора-3» /Гельфанд И.М., Губерман Ш.А., Сыркин A.JI. и др. //Кардиология. -1977. т. 17, №6. - с. 19-23.
9. Головня Л.Д., Губерман Ш.А. Определение ближайшего прогноза и тяжести состояния больных инфарктом миокарда с помощью математических методов /Кардиология. 1977. - т. 17, №7, с. 138-143
10. Прогнозирование исхода крупноочагового инфаркта миокарда с помощью программы узнавания /М.А.Алексеевская, И.М.Гельфанд, Ш.А.Губерман и др. //Кардиология. 1977. т. 17, №7, с. 26-31.
11. Халфен Э.Ш. Основные направления использования математики и вычислительной техники в кардиологии /Кардиология. 1977. - т.17, №7, с. 5-13.
12. Прогнозирование исхода рецидивирующего инфаркта миокарда /Н.М.Устинскова, А.Л.Сыркин, А.И.Маркова, А.А.Журавель //Кардиология. -1979.-т. 19, №5, с. 29-34.
13. И.Виноградов A.B., Мовшович Б.Л., Наддачина Т.А. Рецидивирующее и затяжное течение инфаркта миокарда. Сообщение 1. Рецидивирующий инфаркт миокарда/Советская медицина. 1979, №1, с. 23-27.
14. Дитятев В.П., , Вайсбурд И.Ф., Хейнокен И.М. Динамическое прогнозирование течения инфаркта миокарда по данным острого периода с помощью ЭВМ. /В кн.: Атеросклероз, ишемическая болезнь сердца. Свердловск, 1980, с. 72-79.
15. Статистическая оценка некоторых факторов риска повторного инфаркта миокарда /Попова И.Л., Королев В.Д., Коновалова Т.С. и др. //Сборник научных трудов Ряз. мед. ин-та, 1980, т.70, с. 22-25
16. Сыркин А.Л. и др. Рецидивирующий инфаркт миокарда. М.: Медицина, 1981. - 120 с.
17. Прогнозирование исхода инфаркта миокарда в динамике заболевания /Кожин Н.И., Медлин М.С., Николаенко Е.Я. и др. //Предболезнь болезнь -выздоровление. 4.1. - М., 1981, с. 371-373.
18. Некоторые подходы к проблеме прогноза течения и исхода инфаркта миокарда/Предболезнь болезнь - выздоровление. ч.1. - М., 1981, с. 431-434.
19. К прогнозированию неосложненного течения инфаркта миокарда /Гельфанд И.М., Губерман Ш.А., Котов Ю.Б. и др. //Терапевтический архив. -1982 т.54, №3, с. 64-67.
20. Хроменков И.И. Метод экспертных оценок в прогнозировании инфаркта миокарда /Теоретические и практические вопросы профилактики, диагностики и лечения наиболее распространенных заболеваний Сибири и Дальнего Востока. 1983, с. 162-163.
21. Халфен Э.Ш. Опыт четырехлетней апробации программы прогнозирования возможности возникновения инфаркта миокарда у обследуемого лица /Труды Сарат. мед. ин-та, 1983, т. 108, с. 3-9.
22. Амосова E.H. Особенности течения и прогнозирования рецидивирующего инфаркта миокарда /Врачебное дело. 1983. - №2. - с. 52-55.
23. Бабарскене P.C., Вилкаускас Л.Л., Димша И.И. Прогнозирование течения и исхода острого инфаркта миокарда /Кардиология. 1983. - т.23, №1, с. 1618.
24. Халфен Э.Ш. Прогнозирование возможности возникновения инфаркта миокарда / Кардиология. 1983. - т.23, №1, с. 19-25.
25. Вельский Н.Е., Юрова Т.А. Вопросы прогнозирования исхода инфаркта миокарда /Клиническая медицина. 1983. - т.61, №1, с. 64-69.
26. Гогин Е.Е., Саблин В.М. Прогнозирование ближайших исходов при инфаркте миокарда (достижения, трудности и перспективы) /Кардиология. -1983.-т.23, №1, с. 5-9.
27. Гусев А.И., А.Н. Дрыганова. Сравнительная оценка методов прогнозирования исхода инфаркта миокарда /Болезни сердца и сосудов. Воронеж, 1984, с. 6-8.
28. Вопросы математического прогнозирования исходов инфаркта миокарда /Семенко C.B., Бабицкий B.JL, Ярыгина В.М. и др.//Болезни сердца и сосудов. Воронеж, 1984, с. 31-34.
29. Попова Б., Караламбаев Н. Частота повторных инфарктов и внезапная сердечная смерть у больных, перенесших острый инфаркт миокарда /Кардиология. 1984. - т.24, №1, с. 97-99.
30. Прогностическое значение коагулологических факторов у больных инфарктом миокарда /М.Я.Коган-Пономарев, А.Б. Доборовольский, И.И.Староверов и др. /Кардиология, 1985. т.35, №7, с. 38-43.
31. Минаева М.Н., Тарала Г.Т., Бессонова Г.А. Рецидивирующий инфаркт миокарда/Актуальные проблемы практической медицины. Ставрополь, 1986, с. 201-203.
32. Факторы риска повторного инфаркта миокарда /Захаров В.Н., Бурав-лев М.В., Дечко Е.П. и др. //Советская медицина. 1986. - №;, с. 3-6.
33. Copec Т.С., Амирбекян B.C., Кадрян A.A. Рецидивирующий инфаркт миокарда: клиническое своеобразие, диагностические трудности /Актуальные вопросы клинической медицины. М., 1987, с. 55-58.
34. Мисюнене Н.Б. Факторы, определяющие развитие повторного инфаркта миокарда. Минск, 1987, с. 65.
35. Опыт математического прогнозирования ближайших исходов инфаркта миокарда /А.А.Манцев, С.И.Северин, В.Н.Малыгин и др. //Военно-медицинский журнал. 1987.- №7. - с. 63-64.
36. Чаинский Л.П., Мацик A.B., Степанчук Б.И. Диагностические индексы в прогнозировании отдаленных исходов инфаркта миокарда /Врачебное дело.1987. -№10. -с. 32-34.
37. Халфен Э.Ш., Шварц И.Л. Шестилетняя апробация программы прогнозирования возможности возникновения инфаркта миокарда -/Кардиология.1987. -т.27,№9, с. 43-47.
38. Эхокардиография для прогноза острого инфаркта миокарда (по результатам применения алгоритма распознавания образов) /Несветов В.Н., Бер-штейн П.Б., Горцакалян Э.Л., Орлов М.В. //Советская медицина. 1987. - №12, с. 88-91.
39. Алмазов В.А., Бондаренко Б.Б., Чавнецов В.Ф., Селезнева Л.М. Отдаленный прогноз больных, перенесших инфаркт миокарда /Актуальные вопросы диагностики и лечения в неотложной кардиологии. М., 1988, с. 140-152.
40. Мешалкин Л.Д., Галков А.Ф. Экспертно-статистические методы построения алгоритмов прогноза инфаркта миокарда /Медицинская техника.1988. -№6, с. 16-22.
41. Стрелецкая Г.И., Писарева Н.И. Прогностическое значение математического анализа ритма сердца при неотложных состояниях в остром периоде инфаркта миокарда /Неотложные состояния в клинике внутренних болезней. -Горький, 1989, с. 117-118.
42. Рябинин В.А., Ельков А.Н. Компьютерный анализ факторов риска летальных исходов как основы прогнозирования и выбора лечебной тактики при ИМ /Лечение ИМ. М., 1989, с. 12-24.
43. Солоненко ИИ, Дець Г.Д., Кузьменко Б.В., Мельник И.В. Прогнозирование клинического течения мелкоочагового инфаркта миокарда /Гипертоническая болезнь, атеросклероз и коронарная недостаточность. Киев, 1989, -Вып. 21, с. 10-14.
44. Глазунов И.С., Деев А.Д., Жуковский Г.С. Практическая оценка риска возникновения острого инфаркта миокарда или внезапной смерти /Кардиология. 1989. - т.29, №11, с. 70-72
45. Сыркин A.JI. Инфаркт миокарда. М.: Медицина, 1991, 304 с.
46. Прогноз раннего постинфарктного периода при осложненном течении инфаркта миокарда / Абакумов Ю.Е., Васюк Ю.А., Захарова Т.Ю. и др. //Кардиология. 1993. - т.ЗЗ, №2, с. 27-30.
47. Прогностическая значимость данных кардиологического скрининга в отношении развития инфаркта миокарда в ближайшие 7 лет /Козлов И.Д., Фо-лина Р.Ф., Апанасевич В.В. и др. //Терапевтический архив. 1993.- т.65, №4, с. 14-17.
48. Прогнозирование вероятности развития инфаркта миокарда у больных с нестабильной стенокардией /Тащук В.К., Малиновская И.Э., Сычев О.С. и др. //Врачебное дело. 1994. - №2. - с. 26-29.
49. Прогноз острого инфаркта миокарда в зависимости от возраста и параметров очага некроза на госпитальном этапе /Арутюнов Т.П., Дмитриев Д.В., Марфунина A.A., Мелентьева A.C. //Клиническая геронтология. 1995. - №1, с. 20-22.
50. Апрелова Т.А. Оценка тяжести инфаркта миокарда и прогнозирование его исходов с помощью специальных математических систем. Дис. Канд. Саратов , 1971.
51. Ступелис И.Г., Станайтите Н.И., Пуртулите Г. и др. В кн: Кардио-реаниматология и ангиология. Вильнюс, 1968, с. 16-19.
52. Трушинский З.К. В кн.: Современные вопросы кардиологии. Вып. 1. М., 1967, с. 9-21.
53. Schnur S. «Arch. Intern. Med.», 1953, v. 39, р. 1018-1025.
54. Peel A.A.F, Semple Т., Wang J et a. «Brit. Heart J.» , 1962, v. 24, p. 745760.
55. Huges W.L., Kalbfleisch J.M., Brandt E.N. et a. «Arch. Intern. Med.», 1963, v.lll.p. 338-345.
56. Gironi G., Conte G., Andreola F. «Minerva Cardioangiol.», 1966, v.14, p. 363-367.
57. Selvini A., Ricci F., Gironi G., «Minerva med.», 1967, v. 58, p. 41134117.
58. Norris R.M., Brandt P.W.T., Caughely D.E. et a. «Lancet», 1969, v. 2, p. 274-278.
59. Генкин A.A., Гублер E.B. В кн.: Применение математических методов в биологии. JI. 1964, сб. 3, с 174.
60. Генкин A.A., Гублер Е.В. В кн.: Вычислительная техника в физиологии и медицине. М., 1968, с. 70.
61. Заферман Д.М. Исследование задачи управления лечением ишемиче-ской болезни сердца. Афтореф. Дис. Канд. М., 1970.
62. Кульбак С. Теория информации и статистика. М., 1967.
63. Вапник В.Н., Червоненкис А.Я.Теория распознавания образов. М., «Наука», 1974, с. 416.
64. Закс JI. Статистическое оценивание.М., 1976.
65. Экспертные оценки в научно-техническом прогнозировании. / Добров Г.М., Ершов Ю.В., Левин Е.И. и др. Киев, 1974.
66. Чистяков В.М. Информационный анализ. Новосибирск, 1974.
67. Бешелев С.Д., Гурвич Ф.Г. Математико-статистические методы экспертных оценок. М., 1980.
68. Ивченко Г.И., Медведев Ю.И. Математическая статистика, /учеб. Пособие для втузов. М.,1993, 304 с.
69. Ступелис И.Г. В кн.: Автоматизация, организация, диагностика. М., 1971,ч. 2, с. 502-505.
70. Горбань А.Н. Нейроинформатика. // Интернет. E-mail: gor-ban@cc.krascience.rssi.ru; amse@cckr.krasnoyarsk.su
71. Горелик A.JL, Скрипкин В.А. Методы распознавания. Учебное пособие для вузов. 3-е изд., перераб. и доп. - М., Высшая школа, 1989. - 232 е.: ил.
72. Баталова З.С., Куренков Е.Ф. Неймарк Ю.И., Образцова Н.Д. Некоторые алгоритмы медицинской диагностики и прогнозирования
73. Дуда Р., Харт П. Распознавание образов и анализ сцен. М., «Мир»,1976.
74. Ивахненко А.Г., Юрачковский Ю.П. Моделирование сложных систем по экспериментальным данным. М., «Радио и связь», 1987. 120 с.
75. Ивахненко А.Г. Самообучающиеся системы распознавания и автоматического регулирования.- Киев: Техника, 1969.- 392 с.
76. Суснина A.B., Сазонова Н.С. Формализация задачи рецидивирующего инфаркта миокарда. Межвуз. Сб. научн. трудов «Информатика и прикладная математика». Рязань, РГПУ, 1998, 108 с.
77. Розенблатт Ф. Принципы нейродинамики. Перцептрон и теория механизмов мозга. М.: Мир, 1965. 480 с.
78. Уоссерман Ф. Нейрокомпьютерная техника: Теория и практика. Пер с англ. М.: Мир, 1992. 240 с.
79. Современные направления развития нейрокомпьютерных технологий в России. /Галушкин А.// Открытые системы. 1997.- №4. - с.25-28.
80. Hertz, A. Krogh, and R.G. Palmer, Introduction to the Theory of Neural Computation, Addison-Wesley, Reading, Mass., 1991.
81. Haykin, Neural Networks: A Comprehensive Foundation, MacMillan College Publishing Co., New York, 1994.
82. Введение в искусственные нейронные сети. / Анил К. Джейн,Жианчанг Мао, К М. Моиуддин // Открытые системы. 1997 - №4. - с. 16-24.
83. Галушкин А.Н. Применение нейрокомпьютеров в финансовой деятельности. //Интернет. E-mail: http://www.bmstu.ru/facult/iu/iu4/rus/staübook2/gl 9.htm
84. Куссуль Э.М. Ассоциативные нейроподобные структуры. //Интернет. E-mail: gorban@cc.krascience.rssi.ru; amse@cckr.krasnoyarsk.su
85. Якушин С.С., Сазонова Н.С, Суснина A.B., Зайцева Н.В. Факторы риска и возможности прогнозирования рецидива инфаркта миокарда. Сборник тезизов «К 10-летию Моск. обл. кардиол. центра, 60-летию Жуковской гор-больницы», Жуковский, 1999, 248 с.
86. Суснина A.B. Программная модель системы прогнозирования рецидива инфаркта миокарда. Межвуз. сб. научн. трудов «Математическое и программное обеспечение вычислительных систем». М.: Минобразования России, НИЦПрИС, 1998. 152 с.
87. Сазонова Н.С., Суснина A.B., Якушин С.С. Способ прогнозирования возможности возникновения и исхода рецидивирующего инфаркта миокарда. Заявка на изобретение №. 99110119 (010579) от 12.05.99
88. Бэстэнс Д.-Э, Ван ден Берг В.-М, Вуд Д. Нейронные сети и финансовые рынки: принятие решений в торговых операциях. М.: ТВП, 1997, 236 с.182
89. Головенкин С.Е., Горбань А.Н., Шульман В.А., Россиев Д.А. и др. Осложнения инфаркта миокарда: база данных для апробации систем распознавания и прогноза. ВЦК СО РАН и КГМА. //Интернет. E-mail: gor-ban@cc.krascience.rssi.ru; amse@cckr.krasnoyarsk.su
90. Итоги науки и техники: физические и математические модели нейронных сетей. Том 1, М., изд. ВИНИТИ, 1990.
91. Artificial Neural Networks Concepts and Theory, IEEE Computer Society Press, 1992.
92. Richard P. Lippmann, An Introduction to Computing withNeural Nets, IEEE Acoustics, Speech, and Signal ProcessingMagazine, April 1987.
-
Похожие работы
- Прогнозирование рецидивирующего течения инфаркта миокарда на основе имитационного моделирования нейроструктур
- Прогнозирование рецидивирующего инфаркта миокарда на основе имитационного моделирования нейроструктур
- Алгоритмизация прогнозирования и выбора тактики лечения осложнений трансмурального инфаркта миокарда на основе нейросетевого моделирования
- Моделирование, алгоритмизация и прогнозирование исходов трансмурального инфаркта миокарда при различных схемах медикаментозной терапии
- Нейронные сети для обработки временных рядов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность