автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.17, диссертация на тему:Интеллектуальная система поддержки принятия решений скрининг-диагностики рака желудка на основе комбинированных классификационных правил

кандидата технических наук
Бабков, Александр Сергеевич
город
Курск
год
2014
специальность ВАК РФ
05.11.17
цена
450 рублей
Диссертация по приборостроению, метрологии и информационно-измерительным приборам и системам на тему «Интеллектуальная система поддержки принятия решений скрининг-диагностики рака желудка на основе комбинированных классификационных правил»

Автореферат диссертации по теме "Интеллектуальная система поддержки принятия решений скрининг-диагностики рака желудка на основе комбинированных классификационных правил"

На правах рукописи

т Г /

Схъб

Бабков Александр Сергеевич

ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ СКРИНИНГ-ДИАГНОСТИКИ РАКА ЖЕЛУДКА НА ОСНОВЕ КОМБИНИРОВАННЫХ КЛАССИФИКАЦИОННЫХ ПРАВИЛ

Специальность 05.11.17 - Приборы, системы и изделия медицинского назначения

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Курск 2014

005554242

005554242

Работа выполнена в ФГБОУ ВПО «Юго-Западный государственный университет» на кафедре биомедицинской инженерии

Научный руководитель: доктор технических наук, профессор,

Серебровский Вадим Владимирович

Официальные оппоненты: Егошина Ирина Лазаревна

доктор технических наук, доцент, Поволжский государственный технологический университет, профессор кафедры радиотехнических и медико-биологических систем

Руденко Вероника Викторовна кандидат технических наук, доцент, «Курская государственная сельскохозяйственная академия имени И.И. Иванова», доцент кафедры информатики и электроэнергетики

Ведущая организация: ФГБОУ ВПО «Воронежский государственный

технический университет» (г. Воронеж)

Защита диссертации состоится «30» сентября 2014 года в 16.00 часов на заседании диссертационного совета Д 212.105.08 при ФГБОУ ВПО «Юго-Западный государственный университет» по адресу: 305040, г. Курск, ул. 50 лет Октября, 94 (конференц-зал).

С диссертацией можно ознакомиться в библиотеке Юго-Западного государственного университета и на сайте www.swsu.ru.

Автореферат разослан «11» августа 2014 г.

Ученый секретарь диссертационного совета Д 212.105.08

Снопков В.Н.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Актуальность диссертационного исследования обусловлена тем, что своевременная диагностика онкологических заболеваний позволяет существенным образом снизить смертность, улучшить качество терапевтических и хирургических последствий, снизить экономические затраты на лечение и последующую реабилитацию больных. В процессе скрининга рака желудка обязательным является осуществление анализа крови и расчета значений соответствующих онкомаркеров. Так как состав крови отражает происходящие в организме изменения при развитии патологических процессов, то анализ происходящих изменений состава крови позволяет повысить качество скрининг- диагностики. Достаточно оперативное осуществление системного анализа происходящих структурных изменений врачом затруднительно в силу необходимости обработки большого количества информации в условиях ее нечеткой определенности. В соответствии с этим возникает потребность в разработке интеллектуальной системы поддержки принятия решений (СППР) для скрининг-диагностики на основе современных компьютерных технологий, позволяющей осуществлять раннее выявление рака желудка и/или формировать в процессе скрининга рекомендации о необходимости продолжения обследования пациента в специализированных центрах или клиниках.

Степень разработанности темы исследования. В силу различных объективных и субъективных причин, ухудшения экологической обстановки и роста психологического напряжения людей наблюдается тенденция к ухудшению попу-ляционных свойств здоровья населения. Возникает необходимость в массовом качественном медицинском обследовании людей с применением скрининговых систем, стандартизации методов и автоматизированных технологий, которые позволяют проектировать качественные интеллектуальные системы поддержки принятия решений для выявления определенных классов заболеваний. В Российской Федерации, начиная с 1990 года, ведутся разработки в области скрининг, а здоровья детей и подростков (системы ВИТА-90, АКДО, АСПОН, КМАДО, АСДОК, САНУС, КАСМОН и др.). Аналогичные системы существуют в США (фирмы «Соп1гоГОа1е-Согр», «СЕТ2СОЯР») и других странах. Базовая автоматизированная система скрининг-диагностики включает в себя подсистемы регистрации пациента автоинтервьюирования, проверки работы различных физиологических и сенсорных систем организма, анализа ЭКГ и артериального давления, результаты лабораторных анализов различных биологических проб. К настоящему времени разработаны и эксплуатируются системы скрининга различных групп заболеваний. Скрининг заболеваний осуществляется по: раку яичников, шейки матки, молочной железы, предстательной железы, легких, прямой кишки, мочевого пузыря, полости рта, кожи, поджелудочной железы. В настоящее время скрининг рака желудка осуществляется в основном методами фото-флюорографии с двойным контрастированием и гастроскопией в специализированных центрах или клиниках. С этой целью применяются онкомаркеры типа РЭА, СА242, СА72.4, СА19.9 с диагностической эффективностью порядка 60-65%. Автоматизированных скрининговых диагностических систем рака желудка в условиях массовой диспансеризации населения не разработано, что снижает диагностическую эффективность на ранней стадии развития заболевания и приводит к росту летальности.

Таким образом, научно-технической задачей исследования является повышение диагностической эффективности скрининговых систем рака желудка на ос-

нове результатов общего анализа крови и информации об образе жизни, жалобах и состоянии здоровья обследуемого путем применения современных информационных и компьютерных интеллектуальных технологий.

Работа выполнена в соответствии с федеральной целевой программой «Предупреждение и борьба с социально значимыми заболеваниями» и с научными направлением ФГБОУ ВПО «Юго-Западный государственный университет» «Медико-экологические информационные технологии».

Объект исследования. Пациенты, у которых предполагается наличие онкологических заболеваний желудка.

Предмет исследования. Методы, математические модели и интеллектуальная система поддержки принятия решений о необходимости клинического обследования пациента в процессе скрининг-диагностики рака желудка.

Цель работы: Разработка интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка, позволяющей по результатам общего анализа крови и анамнеза определять людей с риском наличия исследуемого заболевания с использованием комбинированных классификационных правил принятия решений.

Для достижения поставленной цели необходимо решить следующие задачи:

- разработать информационно-аналитическую модель скрининг-диагностики рака желудка;

- разработать метод оценки классификационных возможностей структур медицинских данных для синтеза решающих диагностических правил;

- разработать метод синтеза нечетких математических моделей скрининг-диагностики рака желудка на основе информации о структуре связей между показателями крови и анамнеза пациента;

- сформировать пространство информативных признаков для построения автоматизированной системы интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка;

- на репрезентативной обучающей выборке синтезировать диагностические решающие правила для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка;

- разработать алгоритм и программное обеспечение интеллектуальной системы скрининг-диагностики рака желудка на основе анализа изменений в структуре связей между регистрируемыми показателями крови пациента;

- провести верификацию полученных диагностических правил соотнесения обследуемого к группе риска болеющих раком желудка на репрезентативной контрольной выборке.

Научная новизна исследований. В диссертации получены следующие результаты, характеризующиеся научной новизной:

- информационно-аналитическая модель для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка, позволяющая с приемлемым для медицинской практики качеством по результатам анализа крови и общей информации о состоянии пациента, содержащейся в анамнезе, принимать решения о необходимости дальнейшего клинического обследования;

- метод оценки классификационных возможностей структур медицинских данных, основанный на вычислении мер доверия к выборкам и признаковому пространству, позволяющий повысить качество работы решающих правил в условиях скрининга;

- метод синтеза нечетких математических моделей скрининг-диагностики рака желудка, отличающийся применением в качестве классификаторов решающих правил, основанных на использовании мер близости между регистрируемыми и расчетными значениями показателей крови, что позволяет с системной точки зрения анализировать происходящие в процессе развития заболевания структурные изменения в организме на ранней стадии;

- диагностические решающие правила для интеллектуальной системы скрининг-диагностики рака желудка, отличающиеся применением оценок риска наличия заболевания по показателям, характеризующим образ жизни, текущее состояние пациента, перенесенные заболевания и результаты общего анализа крови как совместно, так и по отдельности;

- алгоритм, структура и программное обеспечение интеллектуальной системы скрининг-диагностики рака желудка на основе анализа изменений в структуре связей между регистрируемыми показателями крови пациента, отличающиеся использованием синтезированных методом группового учета аргументов математических моделей, отражающих различные взаимосвязи между регистрируемыми показателями у больных и не больных раком желудка людей и позволяющие формировать рекомендации по ведению пациентов с начальными стадиями исследуемого заболевания.

Теоретическая и практическая значимость работы состоит в том, что для повышения качества медицинского обслуживания в области профилактики рака желудка разработаны:

- информационно-аналитическая модель для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка; метод оценки классификационных возможностей структур медицинских данных;

- метод синтеза математических моделей и комплекс классификационных решающих правил скрининг-диагностики рака желудка;

- алгоритмическое и программное обеспечение, составляющие основу интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка, позволяющей формировать рекомендации о необходимости обследования пациента в специализированных центрах. Применение предложенных в диссертации методов и средств позволяет улучшить качество медицинского обслуживания людей, имеющих высокий риск и страдающих таким заболеванием как рак желудка.

Методология и методы исследования. Для решения поставленных задач использовались методы теории синтеза биотехнических систем системного анализа, статистической обработки экспериментальных данных, теории нечетких множеств, экспертного оценивания, группового учета аргументов, математического моделирования.

Положения, выносимые на защиту: 1. Метод оценки классификационных возможностей структур медицинских данных для синтеза диагностических правил, основанный на применении мер доверия, позволяет корректировать правила принятия решений с целью улучшения качества классификации. 2. Информационно-аналитическая модель и структура интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка позволяют на основе результатов общего анализа крови и анамнеза оценивать риск наличия заболевания и формировать качественные рекомендации о необходимости обследования в специализированных центрах. 3. Математические модели, отражающие связи между показателя-

ми крови, позволяют проанализировать системные изменения в структуре крови при возникновении рака желудка. 4. Решающие правила, основанные на анализе образа жизни, анамнеза пациента и вычислении мер близости между значениями регистрируемых показателей крови и их расчетными по идентифицированными математическими моделями величинами, позволяют осуществлять диагностику заболевания с приемлемым для практической медицины качеством.

Степень достоверности и апробация результатов. Результаты исследования показали их воспроизводимость в различных условиях, непротиворечивость концепциям системного анализа и теории синтеза биотехнических систем, а так же аналогичным результатам, полученным другими исследователями. Методы, модели и алгоритмы скрининг-диагностики рака желудка построены на теории распознавания образов, группового учета аргументов и нечеткой логики принятия решений и согласуются с ранее опубликованными экспериментальными данными по теме диссертации. Предложенные в работе методы, модели и алгоритмы переданы в опытную эксплуатацию на кафедре факультетской хирургии медицинского института НИУ «БелГУ» и используются в учебном процессе кафедры биомедицинской инженерии Юго-Западного государственного университета при обучении студентов специальности 200401. Основные теоретические положения и научные результаты диссертационной работы докладывались, обсуждались и получили положительную оценку на следующих конференциях и семинарах: VI Международной студенческой электронной научной конференции «СТУДЕНЧЕСКИМ НАУЧНЫЙ ФОРУМ 2014»(Москва, 2014); Международная заочная научно-практическая конференция «Актуальные вопросы в научной работе и образовательной деятельности» (Тамбов, 2014); Международная научно-практическая конференция «Научный прогресс на рубеже тысячелетий - 2014»; «Математические методы в прикладных задачах» (Курск, 2013); «Алгоритмы и программы математических и физических задач» (Курск, 2013); «X МЕгшАЯООМ УЁОЕСКО - РЯАКТ1СКА» (Прага 2014), на научно-технических семинарах кафедр биомедицинской инженерии и информатики и прикладной математики ЮЗГУ (Курск - 2012, 2013, 2014).

Структура и объем работы. Диссертация работы состоит из введения, 4 глав, заключения, приложения и библиографического списка, включающего 81 отечественных, 46 зарубежных источников, 2 ссылки на электронные ресурсы. Работа изложена на 148 листах машинописного текста, содержит 16 рисунков и 17 таблиц.

Публикации. По материалам диссертации опубликовано 10 печатных работ, из них 3 статьи в рецензируемых научных журналах.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы исследования, определены цели и задачи работы, ее научная новизна и теоретическая и практическая значимости; определены методы решения сформулированных задач; приведены сведения об апробации результатов работы.

В первой главе проведен анализ состояния проблем и показано, что наиболее адекватным математическим аппаратом исследования для решения задач скрининг - диагностики рака желудка являются гибридные модели, строящиеся на основе методологии мягких вычислений и методов группового учета аргументов (МГУА). В заключении раздела сформулированы цели и задачи исследования.

Во второй главе разрабатываются модель и методы оценки классификационных возможностей структур данных и синтеза нечетких математических моделей скрининг-диагностики рака желудка для интеллектуальной системы поддержки принятий решений. В силу технологической сложности прямого решения задач ранней диагностики рака желудка в режиме проведения профилактических мероприятий, основной задачей, решаемой в данном диссертационном исследовании, является скрининг-диагностика, с принятием решения о необходимости клинического обследования пациентов с достаточно высоким риском появления и развития рака желудка.

Для решения этой задачи в работе предлагается информационно-аналитическая модель скрининг-диагностики рака желудка, приведенная на рис. 1.

Жалобы больного, образ жизни, наследственность

Блок определения риска заболевания

Блок регистрации текущих показателей крови

Блок расчета интегральных показателей 2

Блок расчета риска заболевания по нечетким самоорганизационным моделям

База показателей крови Блок синтеза моделей взаимосвязей между показателями крови

Блок расчета интегральных показателей 1

База моделей системных взаимосвязей

Блок принятия решения о клиническом обследовании

V

Решение о клиническом обследовании

Рис. 1. Информационно-аналитическая модель скрининг-диагностики рака желудка

В соответствии с этой моделью на первом этапе исследований формируется база показателей крови на основе историй болезней с клинически подтвержденным диагнозом рак желудка (класс о\) и людей, нестрадающими рассматриваемым заболеванием людей (класс со0). В качестве исходных данных в базе показателей крови используются традиционно получаемые при лабораторном анализе признаки

X; (концентрация эритроцитов, лейкоцитов, лимфоцитов, гемоглобина цветовой показатель, СОЭ, содержание глюкозы, натрия, билирубина и т.д.) и интегральные показатели, рассчитываемые на их основе по формуле:

п\

-Х„

V

_У-^а» 0,1

п

)2)

(1)

где: Ук,. - >ое - значение к-го интегрального показателя, х1] - j-oe значение ¡-го частного показателя крови у пациента - среднее значение ¡-го частного по-

казателя в классе со0, О ■ - дисперсия ¡-го частного показателя крови, а,. к е [0,1] - весовые коэффициенты, определяющие информационный вклад показателя дг,- в формирование интегрального показателя Ук.

Множество интегральных показателей У определяется в блоке расчета интегральных показателей 1.

Для повышения качества принятия решений кроме лабораторных показателей крови в качестве информативных признаков используется ряд дополнительных легко получаемых показателей (блок «Жалобы больного, образ жизни, наследственность»).

На втором этапе синтеза информационно-аналитической модели на объектах обучающей выборки множеств X и У с использованием структурно-параметрической идентификации МГУА формируются модели взаимосвязей информативных показателей, которые в общем виде представляются полиномами Колмогорова-Габора:

пг тг

где: 2,1 - переменная (из множеств X или У); /1,1,о,«, - свободный член для модели отклика в классе «„(/ = 0,1) на множестве X или У; - весовой коэффици-

ент слагаемого I для отклика функции2,1 в классе &>,,(/ = 0,1) на множестве X или У; Рп ,. } щ - степень аргумента ] в терме с номером 1 для модели отклика функции

отклика 2,1 в классе «,,(/ = 0,1) на множествах X или У; пг - количество рядов селекции (термов полинома); тг - количество переменных ъ.

Для удобства использования указанных моделей формируется «База моделей системных взаимосвязей», в которой множество идентифицированных моделей располагается по критерию информативности, позволяя сократить время их выборки из базы.

Процесс синтеза моделей осуществляется с использованием известных алгоритмов МГУА.

Полученные модели типа (2) размещаются в базе моделей системных взаимосвязей в виде систем уравнений:

ха)„1=^х((Ае;{ха,1^,) = 1,...п1,]-*0, 1=1,...,и1 ;

= к = \,...,п2 ; (3)

УщХ = к = \,...,п2,

где nl, n2 — количество показателей во множествах X и Y, соотвественно; V,, к - соответственно, i-й показатель из множества X„ и k-й из множества Y., по классам wt; А(, В(, Се - вектора настраиваемых параметров по классам а>е, полученные в ходе синтеза моделей типа (2); Fxe, FYl, FXYl - функционалы структурных моделей в классе со, (2).

По данным, формируемым блоком «Жалобы больного, образ жизни и наследственность», используя рекомендации по синтезу гибридных нечетких решающих правил, разработанных на кафедре биомедицинской инженерии Юго-Западного государственного университета (БМИ ЮЗГУ) для блока определения риска заболевания синтезируется функция уверенности вида:

=Fag{{pRt^{q,)}), (4) где U - уверенность в классе а\; - значение i-oro показателя множества Q,

i=l,...,49; pRtt0i ,(q,) - значение функции риска, вычисляемое для показателя qi согласно справочным общепризнанным; Fag - функция агрегации.

Решение о необходимости дальнейшего клинического обследования принимается, если численное значение уверенности превышает определенный экспертами пороговый уровень.

На третьем этапе синтеза информационно-аналитической модели определяются функции соответствия реальных измеренных значений показателей крови (блок регистрации текущих показателей крови) и интегральных показателей (формула (1), блок расчета интегральных показателей 2) значениям тех же показателей, полученных с помощью моделей, размещенных в базе моделей системных взаимосвязей. Используя функции соответствия как элементы нечетких решающих правил по рекомендациям кафедры БМИ ЮЗГУ синтезируются частные нечеткие решающие правила определения уверенности в классах а\ и со0. Эти частные правила принятия решений располагаются в блоке расчета риска заболевания по нечетким самоорганизационным моделям. Финальные решающие правила, агрегирующие правила типов (3) и (4), реализуются блоком принятия решения о клиническом обследовании.

Одним из важных этапов процесса синтеза решающих правил, особенно в условиях неполноты данных и плохой формализации, является процесс формирования и оценки обучающих и контрольных выборок.

Из множества способов формирования обучающих и контрольных выборок в работе выбран способ распределения всего их объема на обучающую и контрольную в соответствии с правилом «золотого сечения».

На основании анализа различных подходов к процессам обучения классификации (распознавания образов) можно сделать вывод, что на будущее качество принятия решений влияют, с одной стороны, качественный и количественный состав обучающей выборки и, с другой стороны, качественный и количественный состав пространства информативных признаков. В свою очередь, обучающие выборки характеризуются такими показателями, как репрезентативность (принадлежность генеральной совокупности), объем и экспертное доверие. Признаковое пространство можно охарактеризовать статистическими показателями информативности, экспертным доверием к составу признаков и размерностью.

Указанные качественные и количественные показатели, характеризующие обучающие выборки и пространство признаков носят в основном эмпирический характер с явно выраженной нечеткостью определений. Исходя из этого, для описания вводимых показателей с учетом сложившейся терминологии в области нечеткой логики принятия решений и теории уверенностей для обозначения целостной характеристики обучающей выборки введем понятие меры доверия к обучающим способностям выборки (МДВ), а для обозначения классификационной возможности пространства признаков - меру доверия к признаковому пространству (МДП).

Для расчета этих показателей в работе предлагается метод оценки классификационных возможностей обучающих данных.

В ходе реализации этого метода искомые показатели (меры доверия) определяются по формулам:

..пв а, • МДР + аг • МДО + «з • МДЭВ

ЩВ = —--(5)

а, + а2 + а3 ' к '

д ,дт-1 _ Р\ • мди + рг ■ мдэп + /?з • мдк ^ (6) Р\ + Рг + Ръ

где МДР - мера доверия к репрезентативности выборки; МДО - мера доверия к объему выборки; МДЭВ - мера доверия экспертов к выборке; МДИ - мера доверия к информационной ценности признакового пространства; МДЭП - мера доверия экспертов к составу признаков; МДК - мера доверия к размерности (количеству) информативных признаков; с, Д - весовые коэффициенты, определяющие вклад указанных мер доверия в расчет МДВ и МДП, соответственно (0<а1 < 1; 0<Д <1; / = 1,2,3) .

В диссертационной работе приводятся рекомендации по расчету каждой из составляющих выражений (5) и (6).

Учитывая, что составляющие МДВ и МДП дополняют друг друга в оценке классификационных возможностей используемых медицинских данных, общая мера классификационного доверия к данным МДД определяется выражением: МДД = МДВ + МДП - МДП ■ МДВ . (7)

Полученные значения мер МДД позволяют уточнять степень доверия к синтезируемым решающим правилам, поскольку учитывают не только работу самих классификационных правил, но и особенности тех данных, которые привлекаются для процессов обучения и контроля работы автоматизированной системы классификации.

Наполнение блоков информационно-аналитической модели, приведенной на рис. 1, и базы знаний интеллектуальной системы поддержки принятия решений (ИСППР) осуществляется в соответствии с предлагаемым методом синтеза нечетких решающих правил скрининг-диагностики рака желудка реализуемым следующей последовательностью действий.

1. Выбирается пространство информативных признаков: X = х^,х2,...,хл-частные показатели общего анализа крови; У = у,,.у2,...,у,12 - интегральные показатели; £? = характеристики образа жизни, предыдущих и существующих заболеваний, жалоб больного, наследственности и т.п. Для выбранного признако-

вого пространства формируются обучающие и контрольные выборки, для которых по формуле (7) рассчитывается показатель МДД.

2. Для классов со0 и <У, в ходе реализации алгоритмов МГУА формируется пакет математических моделей типа (3) по которым рассчитываются коэффициенты детерминации моделей апроксимантов /?2 и /?2 (где I = \,...,Т . номера моделей (3) в общем их списке (класс о\), 5 = 1,...,Б - номера моделей (3) в общем их

списке моделей класса со0). Величины ^ определяют частные меры доверия к адекватности математических моделей МДМ0 и МДМ| по отношению к их возможностям описывать структуры связей между исследуемыми признаками для классов <ы0и со1 (МДМ01 = Л2 и МДМХ$ = Л2).

3. Мера доверия к адекватности моделей взаимосвязи МДМ для двух альтернативных классов определяется выражением:

у0-МДМ0+угМДМ,

Уо+У\

где: /о, У\ - весовые коэффициенты, определяющие предпочтение риска соотнесения пациента к классу здоровых или возможно болеющих людей.

В выражении (8) составляющие МДМ0 и МДМ] определяются выражениями:

МДМ =

(8)

<=1 5

МДМ{=\-Ц{\-МДМ05)

4. По аналогии с классическим понятием функций принадлежности, принятой в теории нечеткой логики принятия решений, введем понятие функции соответствия результатов модельных вычислений по формулам (3) и результатов реальных измерений X и вычислений У - / {(¡1(), /щ{(1ке).

В качестве базовых переменных для этих функций выбраны меры близости (!1( и г/,, между измеренными .V, и ук и вычисленными по формулам (3) .г,- * и ук* значениями ¡-ого частного и к-ого интегральных показателей:

¿и =

с1к,г =

Ук-Ук

Ук

где I - номер исследуемых классов (I = 0,1).

Функции соответствия определяются кусочно-линейными зависимостями

вида:

1, если с1,< а

ь-а,

, если Ь>с!(>а,

(9)

Ъ-а

О, если с1,> Ъ

В работе параметры функций соответствия (9) определяются по гистограммам распределения классов в соответствии с рекомендациями, разработанными на кафедре БМИ ЮЗГУ.

5. Уверенность в классификации по системам моделей (3) иМщ с учетом функций соответствия (9) определяется выражением:

т | т2

им,, -^

"1

/и, + /и2

где тх - количество моделей, построенных по множеству признаков X; тг- количество моделей, построенных по множеству интегральных показателей У.

Для регулирования соотношений между количеством ошибок первого и второго родов на экспертном уровне выбираются величины двух порогов Рщ и Р(л,

алгоритм принимаемых решений по которым определяется таблицей 1.

Таблица 1 Диагностические заключения относительно порогов Ра

им >Р <ч> щ> им >Р (У, (1\ им <Р <ч> «ъ им >Р им <Р им <Р ^ им >Р Щ> - «Ъ им <Р щ * го. Идентификатор (№) ситуации Описание ситуации

0 0 0 1 2 Здоров - класс юо

0 0 1 0 1 Дополнительное обследование

0 1 0 0 3 Болен - класс Щ

1 0 0 0 1 Дополнительное обследование

Элементами таблицы служат двоичные переменные, формируемые следующим образом: если значение иМне превышает значения порога РШ(, то элемент

таблицы равен нулю. В противном случае - единице.

6. Для дополнительных показателей множества О определяется частная уверенность выражением (4).

7. С учетом мер доверия к данным (7) и к адекватности математических моделей (8) определяется общая мера недоверия МНК к принимаемым решениям из-за ограничений по данным и используемым моделям:

МНК=тт(1,2-МДД-МДМ-МДД).

8. Финальные уверенности в отнесении обследуемого к классам со0 и <цопределяется по формулам:

=тах(0 ~МНК),ич =тах(0 ,ЦМЧ +1!()-(\- ) - МНК). (11)

С учетом соотношения ошибок первого и второго рода решение о выборе дальнейшей тактики ведения обследуемого по показателю I]щ определяется по

таблице, аналогичной таблице 1.

9. На объектах контрольной выборки с известным решением проверяется качество срабатывания полученных решающих правил, и, если оно удовлетворяет

экспертов, процесс обучения заканчивается. В противном случае, используя пакеты обучающих программ кафедры БМИ ЮЗГУ, осуществляется корректировка параметров решающих правил в сторону минимизации ошибок классификации.

В третьей главе разработаны основные элементы интеллектуальной системы поддержки принятия решений (ИСППР) скрининг - диагностики рака желудка. В качестве оригинальных элементов ИСППР в ее состав вошли следующие основные элементы:

- база данных показателей общего анализа крови для обучения системы классификации;

- модуль формирования пакетов математических моделей;

- модуль расчета мер доверия к данным и моделям;

- модуль информационной селекции показателей; таблица показателей анамнеза и «образа жизни» обследуемого (<3);

- модуль формирования интегральных показателей;

- пакет программ расчета рисков; модуль вычисления мер доверия;

- модуль визуализации; модуль подготовки документации;

- модуль протоколирования работы системы поддержки принятия решений;

- модуль диагностики состояния обследуемого (на предмет выявления рака желудка);

- модуль формирования рекомендаций для ЛПР;

- модуль параметров для расчета функций соответствия результатов модельных вычислений и измерений - параметры а и Ь для функций /(<:/,;<:) и /{с1к;С) в альтернативных классах со0и а>(;

- модуль расчета мер близости с/, и с1к в альтернативных классах а>0 и а>,;

- таблица классификационных порогов;

- модуль вычисления значений функций соответствия;

- модуль вычисления риска по анализу анамнеза и «образа жизни, истории болезни, жалоб и т.п.»;

- модуль формирования идентификационных данных пациента (по медицинской карте);

- база данных показателей «образа жизни» и анамнеза;

- модуль идентификации временного тренда;

- модуль прогноза оперативности обследования;

- модуль подготовки электронной медицинской карты.

Все элементы ИСППР функционируют в рамках двух подсистем:

«Подсистема формирования рекомендаций для ЛПР» и «Подсистема настройки», взаимодействие которых между собой осуществляется с помощью внутреннего интерфейса системы. Указанные подсистемы посредством внешнего дружественного интерфейса реализуют следующие целевые функции системы:

- первая сообщает ЛПР информацию рекомендательного характера о необходимости дальнейшего клинического обследования пациента;

- вторая осуществляет определение необходимых для нормального функционирования модулей «Подсистемы формирования рекомендаций для ЛПР» структур, параметров и условий.

На рисунке 2 в качестве примера приведена экранная форма, используемая при настройке ИСППР.

ц) Та

пгзг

-I"- Н5^ |0<1|-]р1-|х2р

36Тз ■3.5 +12

- 624.2 . О

- 643.5 > О

- 724.5 • О

- 289.4 + О

О

0.2 5

Вййй

НО

= 433,7 = 507,2

5 - 471.3

Го

515.4 + О

553.5 ч- О

5 = 824.Э

| [......Цр.урм&т.р..!;

- -0.2 4

- О 3

чад Iх4 ( ИМ

95.9 1.2 О.С

оЗ. 0,2 т 00

1 оо 1 оо 1 оо 1 оо

;ЮО 1 оо 100 1 оо юо юо

Рис. 2. Скриншот режима «Просмотр параметров идентифицированной модели»

В процессе обучения ИСППР было сформировано пространство признаков, которое после минимизации по критерию Стьюдента состоит из признаков X: х, -эритроциты; х2 - гемоглобин; х3 - цветовой показатель; х9 - моноциты; х10 - СОЭ и интегрального показателя У (названного «ЭрГеМо»), рассчитываемого по формуле:

У = 220-(хЗ-0.9б/+0.1-(х9-5.7/ . (12)

По группе показателей (2, характеризующих образ жизни, субъективные жалобы, перенесенные и существующие заболевания выбраны: половозрастной фактор; страна проживания; особенности питания; употребление алкоголя; курение; общее самочувствие; ранее перенесенные болезни; болезнь Ментрие, вирусы и бактерии, семейный анамнез, характер ритма жизни; недостаток физической активности; дефицит витаминов и питания; характеристика окружающей среды.

Каждый из этих показателей ранжируется по баллам с определением формул частных рисков для вычисления значения интегрального риска (формула 4).

По полученному списку информативных признаков синтезируются функции соответствия (9), примеры графиков которых приведены на рисунке 3.

Рис. 3. Функции в классе

В заключении третьего раздела разрабатывается алгоритм управления процессом скрининг - диагностики рака желудка состоящий из следующих основных этапов.

1. Путем анализа анамнеза пациента формируется вектор значений показателей Q и определяется значение риска наличия заболевания рШ10{ ■

2. По результатам общего анализа крови формируется вектор значений X*, включающий в себя такие показатели крови как: «Эритроциты», «Гемоглобин», «Цветовой показатель», «Моноциты», «СОЭ».

3. Рассчитывается значение интегрального показателя (формула 1).

4. По значениям векторов Х*и интегрального показателя У ИСППР определяет уверенности 11М и С/М в отнесении пациентов к классу «здоровых» (не

болен раком желудка) и «болен раком желудка». Эти значения сообщаются ЛПР.

5. По значениям иМ„ и ШГ, в режиме диалога ИСППР и ЛПР оценивается

необходимость и проводится коррекция порогов срабатывания решающих правил (коррекция таблицы 1).

6. По формулам 11 определяется финальная уверенность в принимаемом решении в необходимости клинического обследования пациента.

В четвертой главе синтезированы финальные математические модели по обучающим выборкам и проведена оценка их эффективности по репрезентативным контрольным выборкам.

В основу базы знаний разрабатываемой ИСППР положены математические модели типа (3). В ходе процесса обучения в работе получены уравнения входящие в «Базу моделей системных взаимосвязей» (рис. 1). Примеры уравнений приведены ниже:

Х\' =4.3 + 0.032-Х2-4.54-ХЗ, (13)

Х2", = -135.5 + 31.45• ^1 + 143.26 X3 + 0.035 Х9-0.02-ХН), (14)

= 3,56 + 0,031-Х2-3,74-ХЗ, (15)

Х2'6Ш] =-11277 + 37.56-Х1 + 119.57-^3 + 0.04-Х9-0,017-Х10, (16)

Х2°'88 • ^То°'°7 • У0'02

=0,06 + 0,05--=0^4-> (17)

Х9

-36,5 + 132,5--0Д)5 —0,07 -0,1 -0.07 ' (18)

Х\ • Х9 * XI0 • У

л., . . ж Х"2. 'Х9 *Х\0 ^

^з^ =0.26 + 0.15---, (19)

-;---0.38 -0.2 -0.13 —1.18

Х910 = 0.44+ 0.245-XI •Х2 ■ХЗ ■У , (20)

у0'12

Х10„^=-37.04 +55.07(21) XI -Х9'

--Х2°'25

(22,

--Г21'84

XI* =1.77 + 0.000271-^-=-, (23)

—— ГТ.Г90 074

Х214 ц =49,57 + 17,95-_0 05 _0(Ш5, (24)

ЛПО • У

Х90т

ХЗ,^ =-0,065 + 38,41--007 _075 _003, (25)

Х10 -Х2 -У

XI0'38

=8.41-1453,9-_,43 __024, (26)

Х2' -ХЗ

___0,38 -0,36

1^=6,31 + 2,09-Х9 , (27)

ХЗ

где: Хк2'ц - отклик показателя к2 модели к1 в базе моделей альтернативного класса, со, (для У -к1=12 для класса соп и к1=17 для класса со1 ); хкЗ 'и У' - чис-

лепное значение регистрируемого частных хк1 и интегрального У показателей, соответственно, в степени р (в случае р=1 - данный параметр не указывается).

Анализ полученных моделей позволяет сделать следующие выводы о происходящих структурных изменениях в составе крови при заболевании раком желудка с точки зрения произошедших специфических изменениях характера связей между анализируемыми показателями:

- в анализируемых альтернативных классах в рассматриваемых моделях присутствуют как общие для них аргументы, так и оригинальные - это говорит о том, что состав крови определяется как общими для всего организма «правилами», так и специфическими для определенной системной патологии, к которой, безусловно, относится рак желудка;

- количество эритроцитов в крови у не болеющих раком желудка людей характеризуется дополнительным влиянием отношения значений показателей ЭрГеМо и СОЭ, что подчеркивает увеличение возможностей учета количества эритроцитов и полученной зависимости для диагностики рака желудка;

- при возникновении рака желудка уменьшаются классификационные возможности показателя «СОЭ» в условиях изменения связи с ЭрГеМо с отрицательно степенной на положительно степенную, что позволяет использовать этот факт в качестве диагностической характеристики;

- количество моноцитов в крови при заболевании изменяет свою «связь» с цветовым показателем с прямой на обратную, что подчеркивает происходящие в этом случае изменения содержания «гемоглобина в эритроцитах»;

- показатель «СОЭ» при заболевании не идентифицировал функциональную зависимость от остальных показателей методами самоорганизационного моделирования, что подчеркивает «разболансировку» системы кроветворения;

- в функциональных зависимостях интегрального показателя «ЭрГеМо» на высоком уровне корреляции появляется обратная зависимость от показателя «цветовой показатель», что, в том числе, подчеркивает необходимость учета показателей «Эритроциты» и «Гемоглобин» при скрининг-диагностики заболевания.

На основе данных математических моделей, наборов функций соответствий, решающих правил по функциям уверенности (11) и выбранных экспертами пороговых значений (таблица 1) с соответствующими элементами, спроектирована нечеткая база знаний ИСППР, правила классификации в которой проверялись на репрезентативной контрольной выборке с расчетом таких показателей качества (ПК) как: диагностическая чувствительность (ДЧ), диагностическая специфичность (ДС), прогностическая значимость положительных (П3+)и отрицательных (ПЗ ) результатов испытаний и диагностическая эффективность (ДЭ).

По результатам статистических испытаний на выборке объемом 75 человек на каждый класс были получены результаты, приведенные на рисунке 4 (заштрихованные столбцы).

Рис. 4. Диаграммы значений показателей качества классификации 1ЛС

Показатели качества характеризуются следующими значениями: ДЧ=0,79; ДС=0,91; ПЗ* =0,89; П3~ =0,81; ДЭ=0,85.

Для сравнения сплошными диаграммами приведены показатели качества при использовании линейной дискриминантной функции, полученной на тех же выборках. МК - качество скрининг-диагностики, достигаемое при использовании онко-маркеров.

Таким образом, проведенные исследования на экзаменационных выборках показали повышение диагностической эффективности скрининг-диагностики рака желудка в случае применения предлагаемой методики на 18±2 % по сравнению с существующими тестами скрининг-диагностики рака желудка и дискриминантным анализом.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.

Диссертационная работа посвящена решению научных и практических задач, связанных с повышением качества скрининг-диагностики рака желудка за счет применения разработанной интеллектуальной системы поддержки принятия решений скрининг-диагностики, основанной на нечетких диагностических комбинированных классификационных правилах, что позволяет по результатам общего анализа крови и анамнеза определять людей с высоким риском наличия исследуемого заболевания и формировать соответствующие рекомендации.

В ходе проведенных исследований получены следующие основные результаты:

1. Разработанные информационно-аналитическая модель и структура интеллектуальной системы поддержки принятия решений скрининг- диагностики позволяют на основе результатов общего анализа крови и анамнеза оценивать риск наличия заболевания и формировать рекомендации о необходимости обследования в специализированных центрах.

2. Разработан метод оценки классификационных возможностей структур медицинских данных для синтеза диагностических правил, основанный на применении мер доверия, что позволяет корректировать правила принятия решений с целью улучшения качества классификации.

3.Разработан метод синтеза нечетких математических моделей, отражающий связи между показателями общего анализа крови, позволяющий анализировать происхо-

дящие системные изменения в структуре крови при возникновении рака желудка, что повышает эффективность скрининг-диагностики рака желудка.

4. Сформировано пространство информативных признаков для ранней диагностики рака желудка, позволяющее в процессе скрининга рака желудка повысить качество диагностического процесса на ранней стадии заболевания без применения специализированного обследования.

5. Синтезированы на репрезентативной обучающей выборке диагностические решающие правила для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка.

6. Разработаны алгоритм, структура и программное обеспечение интеллектуальной системы скрининг-диагностики рака желудка на основе анализа изменений в структуре связей между регистрируемыми показателями крови пациента.

7. Получены нечеткие решающие правила, основанные на анализе образа жизни, анамнезе пациента и вычислении мер близости между значениями регистрируемых показателей крови и их расчетными по математическим моделям значениями, позволяющими осуществлять диагностику с приемлемым для практической медицины качеством, где диагностическая чувствительность равна 0,79, диагностическая специфичность - 0,91, диагностическая эффективность - 0,85.

СПИСОК НАУЧНЫХ РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в рецензируемых научных журналах и изданиях:

1. Бабков,А.С. Классификация методов прогнозирования поведения систем [Текст] / М.В. Артеменко, A.C. Бабков // Современные проблемы науки и образования. - 2013. - №6. - URL: www.science-education.ru/113-11527 (дата обращения: 19.07.2014).

2. Бабков, A.C. Информационно-аналитическая модель поддержки принятия решений в процессе диагностики рака желудка [Текст] / М.В. Артеменко,

B.В. Серебровский, A.C. Бабков // Фундаментальные исследования. - 2014. - №6. -

C. 18-23.

3. Бабков, A.C. Алгоритм ранней диагностики рака желудка на основе анализа структуры показателей крови [Текст] / Системный анализ и управление в биомедицинских системах. - М., 2014. - Т. 13 №2. - С. 463-465.

Научные работы в других изданиях:

4. Бабков, A.C. Системная оценка коэффициентов уверенности различий между диагностическими классами в условиях выборок [Текст] / A.C. Бабков // VI Международной студенческой электронной научной конференции «СТУДЕНЧЕСКИЙ НАУЧНЫЙ ФОРУМ 2014». - М., 2014. - URL: http://www.scienceforum.ru/ 2014/763/5960 (дата обращения: 19.07.2014).

5. Бабков, A.C. Формирование выборок фактологического материала диагностических систем с оценкой квалификационных возможностей [Текст] / A.C. Бабков // Международная заочная научно-практическая конференция «Актуальные вопросы в научной работе и образовательной деятельности». - Тамбов, 2014. - С. 23-24.

6. Бабков, A.C. Система поддержки принятия решений ранней диагностики рака желудка [Текст] / М.В. Артеменко, В.В. Серебровский, A.C.

Бабков // Международная заочная научно-практическая конференция «Актуальные вопросы в научной работе и образовательной деятельности». - Тамбов, 2014. - С. 24-26.

7. Бабков, А.С.Формирование информативного признакового множества [Текст] // X Международная научно-практическая конференция «Научный прогресс на рубеже тысячелетий — 2014». - Прага, 2014. - С. 98-101.

8. Бабков, A.C. Синтез решающих правил ранней диагностики рака желудка на основе анализа связей между показателями крови [Текст] / A.C.Бабков, В.В.Серебровский, М.В.Артёменко // Материалы международной научно-практической конференции «Интегративные процессы в образовании и медицине -2014». - Курск, 2014. - С. 33-42.

9. Бабков, A.C. Технология применения системы поддержки принятия решения необходимости клинического обследования рака желудка [Текст] // Материалы международной научно-практической конференции «Интегративные процессы в образовании и медицине -2014». - Курск, 2014. - С. 24-33.

10. Бабков, A.C. Метод доклинической диагностики рака желудка [Текст] // Сборник материалов XVII Международной конференции, посвященной 50-летию Юго-Западного государственного университета 21-23 мая 2014 года. - Курск, 2014. -С. 34-37.

Подписано в печать 26.07.2014г. Формат 60x84 1/16. Печатных листов 1.25. Тираж 100 экз. Заказ №62. Юго-Западный государственный университет. Издательско-полиграфический центр ЮЗГУ. 305040, Курск, ул. 50 лет Октября, 94.

Текст работы Бабков, Александр Сергеевич, диссертация по теме Приборы, системы и изделия медицинского назначения

юго-западный государственный университет

На правах рукописи

04201460995

Бабков Александр Сергеевич

Интеллектуальная система поддержки принятия решений скрининг-диагностики рака желудка на основе комбинированных

классификационных правил

Специальность 05.11.17 «Приборы, системы и изделия медицинского назначения».

Диссертация

на соискание ученой степени кандидата технических наук

Научный руководитель:

доктор технических наук, профессор

Серебровский Вадим Владимирович

Курск-2014

СОДЕРЖАНИЕ

Введение.....................................................................................4

Глава 1 Аналитический обзор и постановка задач исследования...............11

1.1 Скрининг-диагностика рака желудка............................................11

1.2 Принципы самоорганизационного моделирования...........................15

1.3 Синтез нечетких решающих правил..............................................20

Цели и задачи исследования............................................................23

Глава 2 Модель и методы скрининг-диагностики рака желудка для интеллектуальной системы поддержки принятия решений.....................26

2.1 Информационно-аналитическая модель системы поддержки принятия решений скрининг-диагностики рака желудка.....................................26

2.2 Формирование обучающих и контрольных выборок и метод оценки классификационных возможностей структур медицинских данных...........33

2.3 Метод синтеза нечетких решающих правил скрининг-диагностики рака желудка на основе данных о структуре связей между показателями крови .. 40

Выводы второй главы....................................................................48

Глава 3 Разработка основных элементов интеллектуальной системы скрининг-диагностики рака желудка...............................................................49

3.1 Разработка структуры интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка......................................49

3.2 Формирование пространства информативных признаков....................83

3.3 Синтез функций риска диагностики рака желудка............................89

3.4 Алгоритм управления процессом скрининг-диагностики рака желудка на

основе показателей крови и анамнеза обследуемого.............................101

Выводы третьей главы..................................................................105

Глава 4 Результаты экспериментальных исследований.........................107

4.1 Формирование обучающих и контрольных выборок........................107

4.2 Математические модели структуры связей между показателями крови.......................................................................................112

4.3 Диагностические возможности решающих правил..........................118

Выводы четвертой главы...............................................................123

Заключение...............................................................................124

Библиографический список...........................................................126

Приложение.............................................................................. 139

ВВЕДЕНИЕ

Актуальность работы. Актуальность диссертационного исследования обусловлена тем, что своевременная диагностика онкологических заболеваний позволяет существенным образом снизить смертность, улучшить качество терапевтических и хирургических последствий, снизить экономические затраты на лечение и последующую реабилитацию больных. В процессе скрининга рака желудка обязательным является осуществление анализа крови и расчета значений соответствующих онкомаркеров. Так как состав крови отражает происходящие в организме изменения при развитии патологических процессов, то анализ происходящих изменений состава крови позволяет повысить качество скрининг- диагностики. Достаточно оперативное осуществление системного анализа происходящих структурных изменений врачом затруднительно в силу необходимости обработки большого количества информации в условиях ее нечеткой определенности. В соответствии с этим возникает потребность в разработке интеллектуальной системы поддержки принятия решений (СППР) для скрининг-диагностики на основе современных компьютерных технологий, позволяющей осуществлять раннее выявление рака желудка и/или формировать в процессе скрининга рекомендации о необходимости продолжения обследования пациента в специализированных центрах или клиниках.

Степень разработанности темы исследования. В силу различных объективных и субъективных причин, ухудшения экологической обстановки и роста психологического напряжения людей наблюдается тенденция к ухудшению популяционных свойств здоровья населения. Возникает необходимость в массовом качественном медицинском обследовании людей с применением скрининговых систем, стандартизации методов и автоматизированных технологий, которые позволяют проектировать качественные интеллектуальные системы поддержки принятия решений для выявления определенных классов заболеваний. В Российской Федерации начиная с 1990 года ведутся разработки в области скрининга здоровья детей и

подростков (системы ВИТА-90, АКДО, АСПОН, КМАДО, АСДОК, САНУС, КАСМОН и др.). Аналогичные системы существуют в США (фирмы «Сог^гоП^еСогр», «ОЕТгССЖР») и других странах. Базовая автоматизированная система скрининг-диагностики включает в себя подсистемы регистрации пациента автоинтервьюирования, проверки работы различных физиологических и сенсорных систем организма, анализа ЭКГ и артериального давления, результаты лабораторных анализов различных биологических проб. К настоящему времени разработаны и эксплуатируются системы скрининга различных групп заболеваний. Скрининг заболеваний осуществляется по: раку яичников, шейки матки, молочной железы, предстательной железы, легких, прямой кишки, мочевого пузыря, полости рта, кожи, поджелудочной железы. В настоящее время скрининг рака желудка осуществляется в основном методами фото-флюорографии с двойным контрастированием и гастроскопией в специализированных центрах или клиниках. С этой целью применяются онкомаркеры типаРЭА, СА242, СА72.4, СА19.9 с диагностической эффективностью порядка 60-65%. Автоматизированных скрининговых диагностических систем рака желудка в условиях массовой диспансеризации населения не разработано, что снижает диагностическую эффективность на ранней стадии развития заболевания и приводит к росту летальности.

Таким образом, научно-технической задачей исследования является повышение диагностической эффективности скрининговых систем рака желудка на основе результатов общего анализа крови и информации об образе жизни, жалобах и состоянии здоровья обследуемого путем применения современных информационных и компьютерных интеллектуальных технологий.

Работа выполнена в соответствии с федеральной целевой программой «Предупреждение и борьба с социально значимыми заболеваниями» и с научными направлениями федерального государственного бюджетного образовательного учреждения высшего профессионального

образования «Юго-Западного государственного университета» «Медико-экологические информационные технологии».

Объект исследования. Пациенты, у которых предполагается наличие онкологических заболеваний желудка.

Предмет исследования. Методы, математические модели и интеллектуальная система поддержки принятия решений о необходимости клинического обследования пациента в процессе скрининг-диагностики рака желудка.

Цель работы: Разработка интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка, позволяющей по результатам общего анализа крови и анамнеза определять людей с риском наличия исследуемого заболевания с использованием комбинированных классификационных правил принятия решений.

Для достижения поставленной цели необходимо решить следующие задачи:

- разработать информационно-аналитическую модель скрининг-диагностики рака желудка;

разработать метод оценки классификационных возможностей структур медицинских данных для синтеза решающих диагностических правил;

разработать метод синтеза нечетких математических моделей скрининг-диагностики рака желудка на основе информации о структуре связей между показателями крови и анамнеза пациента;

сформировать пространство информативных признаков для построения автоматизированной системы интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка;

на репрезентативной обучающей выборке синтезировать диагностические решающие правила для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка;

- разработать алгоритм и программное обеспечение интеллектуальной системы скрининг-диагностики рака желудка на основе анализа изменений в структуре связей между регистрируемыми показателями крови пациента;

- провести верификацию полученных диагностических правил соотнесения обследуемого к группе риска болеющих раком желудка на репрезентативной контрольной выборке.

Научная новизна исследований. В диссертации получены следующие результаты, характеризующиеся научной новизной:

- информационно-аналитическая модель для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка, позволяющая с приемлемым для медицинской практики качеством по результатам анализа крови и общей информации о состоянии пациента, содержащейся в анамнезе, принимать решения о необходимости дальнейшего клинического обследования;

метод оценки классификационных возможностей структур медицинских данных, основанный на вычислении мер доверия к выборкам и признаковому пространству, позволяющий повысить качество работы решающих правил в условиях скрининга;

- метод синтеза нечетких математических моделей скрининг-диагностики рака желудка, отличающийся применением в качестве классификаторов решающих правил, основанных на использовании мер близости между регистрируемыми и расчетными значениями показателей крови, что позволяет с системной точки зрения анализировать происходящие в процессе развития заболевания структурные изменения в организме на ранней стадии;

- диагностические решающие правила для интеллектуальной системы скрининг-диагностики рака желудка, отличающиеся применением оценок риска наличия заболевания по показателям, характеризующим образ жизни, текущее состояние пациента, перенесенные заболевания и результаты общего анализа крови как совместно, так и по отдельности;

- алгоритм, структура и программное обеспечение интеллектуальной системы скрининг-диагностики рака желудка на основе анализа изменений в структуре связей между регистрируемыми показателями крови пациента, отличающиеся использованием синтезированных методом группового учета аргументов математических моделей, отражающих различные взаимосвязи между регистрируемыми показателями у больных и не больных раком желудка людей и позволяющие формировать рекомендации по ведению пациентов с начальными стадиями исследуемого заболевания.

Теоретическая и практическая значимость работы состоит в том, что для повышения качества медицинского обслуживания в области профилактики рака желудка разработаны:

- информационно-аналитическая модель для интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка; метод оценки классификационных возможностей структур медицинских данных;

метод синтеза математических моделей и комплекс классификационных решающих правил скрининг-диагностики рака желудка;

- алгоритмическое и программное обеспечение, составляющие основу интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка, позволяющей формировать рекомендации о необходимости обследования пациента в специализированных центрах. Применение предложенных в диссертации методов и средств позволяет улучшить качество медицинского обслуживания людей, имеющих высокий риск и страдающих таким заболеванием как рак желудка.

Методология и методы исследования. Для решения поставленных задач использовались методы теории синтеза биотехнических систем системного анализа, статистической обработки экспериментальных данных, теории нечетких множеств, экспертного оценивания, группового учета аргументов, математического моделирования.

Положения, выносимые на защиту: 1. Метод оценки классификационных возможностей структур медицинских данных для синтеза

диагностических правил, основанный на применении мер доверия, позволяет корректировать правила принятия решений с целью улучшения качества классификации. 2. Информационно-аналитическая модель и структура интеллектуальной системы поддержки принятия решений скрининг-диагностики рака желудка позволяют на основе результатов общего анализа крови и анамнеза оценивать риск наличия заболевания и формировать качественные рекомендации о необходимости обследования в

специализированных центрах. 3. Математические модели, отражающие связи между показателями крови, позволяют проанализировать системные изменения в структуре крови при возникновении рака желудка. 4. Решающие правила, основанные на анализе образа жизни, анамнеза пациента и вычислении мер близости между значениями регистрируемых показателей крови и их расчетными по идентифицированными математическими моделями величинами, позволяют осуществлять диагностику заболевания с приемлемым для практической медицины качеством.

Степень достоверности и апробация результатов. Результаты исследования показали их воспроизводимость в различных условиях, непротиворечивость концепциям системного анализа и теории синтеза биотехнических систем, а так же аналогичным результатам, полученным другими исследователями. Методы, модели и алгоритмы скрининг-диагностики рака желудка построены на теории распознавания образов, группового учета аргументов и нечеткой логики принятия решений и согласуются с ранее опубликованными экспериментальными данными по теме диссертации. Предложенные в работе методы, модели и алгоритмы переданы в опытную эксплуатацию на кафедре факультетской хирургии медицинского института ЕМУ «БелГУ» и используются в учебном процессе кафедры биомедицинской инженерии Юго-Западного государственного университета при обучении студентов специальности 200401. Основные теоретические положения и научные результаты диссертационной работы докладывались, обсуждались и получили положительную оценку на следующих

конференциях и семинарах: VI Международной студенческой электронной научной конференции «СТУДЕНЧЕСКИЙ НАУЧНЫЙ ФОРУМ 2014»(Москва, 2014); Международная заочная научно-практическая конференция «Актуальные вопросы в научной работе и образовательной деятельности» (Тамбов, 2014); Международная научно-практическая конференция «Научный прогресс на рубеже тысячелетий - 2014»; «Математические методы в прикладных задачах» (Курск, 2013); «Алгоритмы и программы математических и физических задач» (Курск, 2013); «X МЕгшАкОБМ УЁБЕСКО - РЯАКТЮКЛ» (Прага 2014), на научно-технических семинарах кафедр биомедицинской инженерии и информатики и прикладной математики ЮЗГУ (Курск - 2012, 2013, 2014).

Структура и объем работы. Диссертация работы состоит из введения, 4 глав, заключения, приложения и библиографического списка, включающего 81 отечественных, 46 зарубежных источников, 2 ссылки на электронные ресурсы. Работа изложена на 148 листах машинописного текста, содержит 16 рисунков и 17 таблиц.

ГЛАВА 1 АНАЛИТИЧЕСКИЙ ОБЗОР И ПОСТАНОВКА ЗАДАЧ

ИССЛЕДОВАНИЯ

1.1 СКРИНИНГ-ДИАГНОСТИКА РАКА ЖЕЛУДКА

Рак желудка (РЖ) представляет собой крайне актуальную проблему современной онкологии во всем мире. По сводным эпидемиологическим данным это заболевание в мире является четвертым наиболее частым после рака легких, молочных желез, толстой кишки. Ежегодно диагностируется более 930 тыс. новых случаев выявления РЖ, а одногодичная летальность составляет более 700 тыс. (более 75%) [123].

В России это заболевание стабильно занимает второе место в структуре онкологических заболеваний и летальности. Ежегодно РЖ заболевают 46 тыс. человек, а одногодичная летальность составляет 56% [123]). Россия занимает место в первой десятке в мире по уровню заболеваемости РЖ.

Среднее время от появления специфических симптомов до постановки диагноза РЖ составляет 3 месяца, что свидетельствует как о поздней обращаемости пациентов к врачу, так и об объективных сложностях диагностики, о необходимости оптимизации тактики обследования на доклиническом, т.е. поликлиническом уровне.

Вопрос о сроках диагностики опухолевого поражения желудка стоит достаточно остро. Если в специализированных клиниках время от момента обращения до постановки диагноза сведено к минимуму, то в общей лечебной сети этот процесс по объективным причинам может растянуться на недели. В нашем исследовании среднее время от момента обращения до момента диагностики составило 15,7 дня, а в период до 30 суток морфологически верифицированный диагноз РЖ был установлен у большинства - 416 (87,8%) пациен�