автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Интеллектуальный анализ данных и алгоритмы классификации в диагностике венозных заболеваний по данным комбинированной термометрии

кандидата технических наук
Анисимова, Екатерина Вячеславовна
город
Волгоград
год
2013
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Интеллектуальный анализ данных и алгоритмы классификации в диагностике венозных заболеваний по данным комбинированной термометрии»

Автореферат диссертации по теме "Интеллектуальный анализ данных и алгоритмы классификации в диагностике венозных заболеваний по данным комбинированной термометрии"

На правах рукописи

Анисимова Екатерина Вячеславовна

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ И АЛГОРИТМЫ КЛАССИФИКАЦИИ В ДИАГНОСТИКЕ ВЕНОЗНЫХ ЗАБОЛЕВАНИЙ ПО ДАННЫМ КОМБИНИРОВАННОЙ ТЕРМОМЕТРИИ

05.13.01 - Системный анализ, управление и обработка информации

(промышленность)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Волгоград - 2013

г 11::::; ш

005531008

Работа выполнена на кафедре компьютерных наук и экспериментальной математики Федерального государственного автономного образовательного учреждения высшего профессионального образования "Волгоградский государственный университет".

Научный руководитель доктор физико-математических наук, профессор

Лосев Александр Георгиевич.

Официальные оппоненты: Сперанский Дмитрий Васильевич

доктор технических наук, профессор, Российская открытая академия транспорта Московского государственного университета путей сообщения, кафедра высшей и прикладной математики, профессор;

Яновский Тимур Александрович кандидат физико-математических наук, доцент, Волгоградский государственный технический университет, кафедра «Системы

автоматизированного проектирования и поискового конструирования», доцент.

Ведущая организация Южно-Уральский государственный университет.

Защита состоится 2 июля 2013 г. в 14.00 на заседании диссертационного совета Д 212.028.04 при Волгоградском государственном техническом университете по адресу: 400005, г. Волгоград, пр. Ленина 28.

С диссертацией можно ознакомиться в библиотеке Волгоградского государственного технического университета.

Автореферат разослан «Л/у> губШлЛ^ 2013 г.

Учёный секретарь *

диссертационного совета Водопьянов Валентин Иванович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В современном мире патологии вен нижних конечностей причисляют к «болезням цивилизацию), а число страдающих нарушениями венозного оттока исчисляется сотнями миллионов. Рентгенологические методы и ультразвуковое сканирование не решили проблему ранней диагностики и динамического контроля над течением венозных заболеваний, в том числе в связи с инвазивностью первых и высокой стоимостью последних. Кроме того, в настоящее время приоритетными в медицине являются безопасные, как для пациента, так и для медицинского персонала, способы диагностики. Одним из таких способов является комбинированная термометрия, возникшая в последние десятилетия и уже практикуемая в различных областях медицины. Комбинированная термометрия - это биофизический метод неинвазивного обследования, заключающийся в измерении внутренних и поверхностных температур тканей по интенсивности их теплового излучения, соответственно, в микроволновом (РТ) и инфракрасном (Ж) диапазоне и последующей их регистрацией в виде числовых данных.

Пространственное представление о распределении температуры в органе может оказать существенную помощь в определении наличия патологического процесса. Кроме того, изменение температуры тканей обычно предшествует структурным изменениям, которые обнаруживаются при общепринятых методах исследования - УЗИ, рентгенографии, пальпации. Именно поэтому, комбинированная термометрия представляет особый интерес для ранней диагностики заболеваний.

Однако, несмотря на то, что данные о температурных полях пациента носят объективный характер, постановка диагноза на их основании по-прежнему остается «искусством» врача, и во многом носит субъективный характер. Последнее серьезно сужает уникальные возможности комбинированной термометрии в первичной диагностике.

Разработка диагностических методик на основе интеграции медицинских знаний и математических методов искусственного интеллекта является актуальной задачей. При современном развитии технологий, трудности диагностики зачастую возникают не из-за дефицита необходимой информации, а из-за отсутствия соответствующих методов ее структуризации. Данную проблему можно решить созданием интеллектуальных диагностических систем. Интеллектуальными их принято называть в связи с тем, что в них предусмотрен механизм обоснования предлагаемых решений, использующий множество высококачественных специальных знаний из предметной области [Корбинский Б.А. (ВИТ, 2008)]. Впрочем, не претендуя на роль «истины в последней инстанции», подобная система в большей степени призвана быть консультантом и помощником для специалиста, который принимает окончательное решение.

Различные методики диагностики требуют соответствующих наборов информационно-ценных признаков. В связи с этим, актуальным является направление дискриминантного анализа, основной задачей которого является поиск потенциально полезных зависимостей в больших массивах данных. Причем, зачастую использование для одной задачи несколько алгоритмов классификации, отличающихся стратегией распознавания и набором признаков, делает результаты диагностики более точными. При этом используется масса различных алгоритмов и их комбинаций. Вызвано это в том числе и тем, что создание универсального классификатора, без приложения к какой-либо реальной задаче, оказывается бесплодной затеей. Значительно более плодотворным является подход, при котором вначале решается реальная практическая задача, а затем применяемые подходы обобщаются на группу проблем, близких первоначальной.

Актуальность данной работы заключается, во-первых, в необходимости разработки диагностических методик, основанных на данных комбинированной термометрии, на базе интеграции медицинских знаний и математических методов искусственного интеллекта;

во-вторых, в необходимости создания алгоритмов поиска информационно-ценных диагностических признаков по данным комбинированной термометрии;

в-третьих, в возможности повышения точности ранней диагностики, с помощью соответствующих алгоритмов классификации;

в-четвертых, в необходимости реализации программных решений по автоматизации обработки данных, полученных методом комбинированной термометрии;

в-пятых, работа выполнена при финансовой поддержке Министерства образования и науки РФ (ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 20072012 годы», госконтракт № 16.513.11.3067) и выполняется в рамках Государственного задания вузам от 01.01.2011 № 8.2419.2011.

Целью диссертационной работы является повышение эффективности и качества диагностики заболеваний вен нижних конечностей по данным комбинированной термометрии.

Поставленная цель обусловила необходимость решения следующих задач:

1. формирование и верификация обучающей выборки данных, полученных с помощью комбинированной термометрии;

2. выявление влияния физиологических особенностей организма и условий проведения измерений на термометрические данные;

3. разработка алгоритмов нахождения высокоинформативных признаков заболеваний, на основе данных комбинированной термометрии и их реализация на основе созданной обучающей выборки;

4. разработка алгоритмов классификации пациентов, на основе найденных диагностических признаков.

Методы исследования. Для решения поставленных задач использовались основные положения теории системного анализа и обработки информации в медицинских системах, методы математической статистики,

математического и компьютерного моделирования, дискриминантного анализа, экспертного оценивания и теории принятия решения.

Достоверность и обоснованность результатов. Адекватность и обоснованность результатов работы подтверждается их апробацией и результатами использования в интеллектуальном аппаратно-программном комплексе диагностики венозных заболеваний, внедренном в Волгоградском флебологическом центре профессора Ларина С.И.

Научная новизна полученных результатов, выносимых на защиту, заключается в следующем:

1. исследована зависимость данных комбинированной термометрии от физиологических особенностей организма и условий проведения измерений;

2. разработан метод поиска высокоинформативных диагностических признаков поведения температурных полей на основе данных комбинированной термометрии.

3. выполнен поиск высокоинформативных признаков для диагностики венозных заболеваний нижних конечностей.

4. на основе совокупности высокоинформативных признаков построены алгоритмы, позволяющие относить пациента к одному из диагностических классов.

Практическая значимость работы состоит в том, что в исследовании разработана и научно обоснована совокупность методов поддержки принятия решения при диагностике заболеваний по данным комбинированной термометрии, позволяющая повысить эффективность лечебных мероприятий и предполагающая реализацию в интеллектуальном аппаратно-программном комплексе.

Внедрение разработанных моделей и методов позволит проводить эффективную раннюю диагностику, а также повысит качество дифференциальной диагностики и динамического контроля течения венозных заболеваний.

Результаты работы успешно использовались при разработке интеллектуального аппаратно-программного комплекса диагностики заболевания вен нижних конечностей, применяемого в данный момент в Волгоградском флебологическом центре профессора Ларина С.И.

Основные положения и результаты, выносимые на защиту:

1. Обнаружены новые закономерности поведения температурных полей различных групп пациентов.

2. Создан алгоритм нахождения диагностических признаков по данным комбинированной термометрии.

3. Выполнена практическая реализация метода поиска высокоинформативных признаков для диагностики венозных заболеваний нижних конечностей.

4. Построены два алгоритма классификации, реализующих первичную диагностику, т.е. причисление пациента к одному из классов «Норма» или «Болен».

Внедрение. Результаты работы применяются специалистами, а алгоритмы диагностики используются в интеллектуальном аппаратно-программном комплексе диагностики венозных заболеваний по данным комбинированной термометрии, применимым в Волгоградском флебологическом центре профессора Ларина С.И.

Апробация работы. Основные положения диссертации докладывались и обсуждались на X Всероссийской конференции «Биомеханика 2010» (Саратов, 2010 г.), XXV Международной научной конференции «Математические методы в технике и технологиях» (Волгоград, 2012 г.), XI Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2012 г.), региональных конференциях молодых исследователей Волгоградской области (Волгоград, 2010-2012 гг.); конференциях профессорско-преподавательского состава ВолГУ (Волгоград, 2009-2013 гг.), научных семинарах ВолГУ и ВолГТУ.

Личный вклад. Выбор направления исследования определялся совместно с научным руководителем. Результаты получены автором лично. Анализ и интерпретация результатов осуществлялись совместно с научным руководителем.

Публикации. Основные результаты диссертационной работы опубликованы в 8 печатных работах, четыре из которых в изданиях, рекомендованных ВАК РФ.

Объем и структура работы. Работа состоит из введения, трех глав с выводами, заключения и приложения.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность работы, дается краткая характеристика темы, формулируются цель и задачи исследования, представляются основные научные результаты, выносимые на защиту.

Первая глава «Комбинированная термометрия в медицине» посвящена изучению основ и особенностей комбинированной термометрии в медицине, физиологическим параметрам организма, оцениваемым с ее помощью, методике диагностики заболеваний вен нижних конечностей по данным комбинированной термометрии.

По методике комбинированной термометрии обследование пациентов проводится посредствам последовательного измерения кожной (ИК) температуры и глубокой микроволновой термометрии (РТ) в 12 симметричных точках, расположенных по задней поверхности обеих голеней пациента, в положении пациента «лежа на животе» и «стоя». Точки измерения были выбраны, исходя из анатомического строения голени и внутреннего кровотока ноги, следующим образом. Первые три точки расположены на вершине латеральной головки икроножной мышцы (1), в подколенной ямке (2), на вершине медиальной головки икроножной мышцы (3). Второй ряд точек расположен по центру латеральной головки икроножной мышцы (4), между головками икроножной мышцы (5), и по центру медиальной головки икроножной мышцы (6). Третий ряд точек расположен в нижней части

икроножной мышцы - латерально (7), в центре (8) и медиально (9). Последние точки измерения температуры находятся на наружной стороне ахиллова сухожилия в области латеральной лодыжки (10), по центру ахиллова сухожилия (11) и по его внутренней поверхности в области медиальной лодыжки (12) (рис. 1). На основе данных измерений строятся температурные поля голени пациентов, анализируя которые врач ставит диагноз.

Рис. 1. Расположение точек на задней поверхности голени

В результате исследований, проведенных в течение последних лет, была создана база данных пациентов. В нее включены результаты обследований, проведенных специалистами Волгоградского флебологического центра профессора Ларина С.И. Обучающая выборка включает в себя информацию о 105 пациентах (210 голеней). Выборка разделена на два контрольных класса: «Норма» (34 голени) и «Болен» (176 голеней). Последний, в свою очередь, делится в соответствии с преобладанием того или иного нарушения следующим образом:

• класс «Норма-2» - 50 здоровых голеней пациентов с патологией;

• класс «ВБ ХВН 0-1» - 36 голеней пациентов с наличием варикозной болезни с хронической венозной недостаточностью степени 0-1;

• класс «ВБ ХВН 2-3» - 20 голеней пациентов с наличием варикозной болезни с хронической венозной недостаточностью степени 2-3;

• класс «ГГГБ (реканализация)» - 29 голеней пациентов с наличием постгромботической болезни в стадии реканализация;

• класс «ГГГБ (окклюзия)» - 29 голеней пациентов с наличием постгромботической болезни в стадии окклюзия;

• класс «ОВТ» - 12 голеней пациентов с острым венозным тромбозом.

Основным результатом первой главы является качественное и

количественное описание влияния физиологических особенностей организма и условий проведения измерений на данные комбинированной термометрии. В частности рассматривалось воздействие пола, возраста пациента, температуры окружающей среды и физических нагрузок на результаты измерения комбинированной термометрии. Влияние оценивалось с помощью коэффициента корреляции Пирсона (г). Значимость коэффициента корреляции оценивалась по критерию Стьюдента при уровне значимости а = 0,05 и степени свободы к= п - 2, где п - объем выборки. В результате было выявлено, что во всех группах пациентов отсутствовала значимая корреляция ИК и РТ-температур с полом и возрастом пациентов. Изменения температуры внешней среды имело значительное влияние на температуры голеней измеряемые в инфракрасном и в микроволновом диапазоне. Однако корреляция между изменением температуры среды и температурой голеней была различна у разных групп. Также значимое влияние на температурные показатели имеет изменение положения тела пациента с горизонтального на вертикальное.

Отметим, что методика обследования пациентов с помощью данных комбинированной термометрии предусматривает соблюдение обычного для пациента режима физических нагрузок до обследования, измерения должны проводиться в положении пациента лежа и стоя при температуре окружающей среды не ниже 19°С и не выше 26°С.

Вторая глава «Высокоинформативные признаки классификации»

посвящена методике нахождения высокоинформативных признаков заболеваний вен нижних конечностей.

В работе, на базе интеллектуального анализа данных, были найдены высокоинформативные диагностические признаки поведения температурных полей нижних конечностей. Анализ предметной области показал, что при постановке диагноза значимыми являются:

• наличие и месторасположение «аномальных» температурных зон;

• наличие и степень симметрии температурных полей;

• уровень изменчивости температурных полей, в том числе в зависимости от положения, режима измерения и т.д.

На первом этапе определения существования и месторасположения «аномальных» температурных зон, был сформирован набор функций-индикаторов, указывающих на наличие в соответствующей точке (или соответствующей области голени) экстремума. Например, функция-индикатор, определяющая наличие температурного минимума в /-точке голени, имеет вид

^.....~ (0, если ^ > ттм ' 0)

к = 1,4,1=7 = 1,12, где £■( /(;, температуры в /-той и /-той точках голени, а к - индикатор,

определяющий диапазон измерения (ИК или РТ) и положение («лежа» или

«стоя»). В работе исследовались и более общие ситуации. В частности,

рассматривались функции-индикаторы, позволяющие провести сравнение

температур в различных областях голени. Пусть Г = (11,..., 112) - вектор, где

^ Г 1< если I — я точка включена, в рассматриваемую область, 1 ~~ (0, если £ - я точка не включена, в рассматриваемую область.

Функция-индикатор, описывающая сравнение средней температуры выбранной

области и средней температуры оставшейся части голени, имеет вид:

1, если щЕ&^п 10 > ^^£=1(1 - го С|(к о, если ^Е&^п сук < - здп г£)'

й = 1д,|г1 = г1 + - + г12.

Далее определялось - сколь часто наблюдается максимум (минимум) в рассматриваемой точке (области). Для дальнейшего исследования оставляли функции-индикаторы, предоставляющих экстремумы не менее чем у 5% пациентов рассматриваемых групп, причем изучаемый эффект в одной из диагностических групп должен наблюдаться не менее чем в 2 раза чаще, чем в альтернативной. Например, для функций-индикаторов, описывающих наличия температурного минимума в положении «стоя» при измерении в ИК-диапазоне (к-1), были получены следующие показатели {табл.1).

Таблица 1

Функции-индикаторы наличия температурного минимума

Класс ¡тіп /й" Л? /¡Г?1

«Норма» 9% 0% 3% 0% 0% 0%

«Болен» 30% 2% 2% 2% і% 0%

/Й" /Й" гтіп Т10,1 /її 1 ґтіп /12.1

«Норма» 0% 9% 0% 26% 21% 18%

«Болен» 5% 8% 1% 14% 12% 13%

Указанному выше критерию отбора удовлетворяет только признак описывающий наличие температурного минимума в первой точке.

Отобранные указанным выше способом признаки были проранжированы с помощью статистической информативности. Данная величина показывает, насколько хорошо исследуемый признак отделяет один класс от другого и вычисляется по формуле

/ = -1п(2Й). (3)

Здесь Ь — количество пациентов I группы, 1 - количество пациентов I группы, у которых выполнен рассматриваемый признак; М — количество пациентов II

группы, т — количество пациентов II группы, у которых выполнен изучаемый признак, а

гп!

биноминальный коэффициент.

Далее было проведено исследование функций, описывающих наличие и степень симметрии температурных полей. Был сформирован набор функций, показывающих перепад температур между верхней и нижней частями голени -«осевой градиент», а так же колебания относительно центральной оси голени -«латерально-медиальный градиент» (ЛМГ). Данные характеристики являются значимыми при диагностике венозных заболеваний нижних конечностей. В частности, функция, описывающая «осевой градиент» (ОГ) имеет вид

9к ¿12,к) ~ ~ з (4)

и функция, описывающая «латерально-медиальный градиент» (ЛМГ)

9 к ,к) = ¿31-2,к ' ¿31,к-

Для каждой такой функции были найдены «значимые» интервалы изменения. Покажем алгоритм нахождения таких промежутков на примере функции, описывающей «осевой градиент» -д^1-

Пусть д^1 - значение «осевого градиента» для /-той голени из обучающей выборки при к-м режиме измерения температуры и положении пациента. Вначале вычислялось выборочное среднее

п

где п - количество голеней в выборке. Затем рассчитывалось стандартное отклонение

^ = = ^ (7)

Границы «значимого» интервала (А";Вк) находились по правилу «одной сигмы», т.е.

Ак = Мк- ак; Вк = Мк + ак. (8)

Таким образом, область значений функции разбивается на три промежутка по следующей схеме (рис. 2).

ШІП Л' в" тах

Рис. 2. Схема разбиения на интервалы области значений функции Далее был проведен анализ - сколь часто для пациентов из каждого диагностического класса встречаются значения в найденных промежутках. Например, для функции, описывающей «осевой градиент» (4), для измерений ИК в положении «стоя» были получены следующие результаты.

Таблица 2

Область изменения ОГ

Датчик, положение ноги БІГ-НИ ¡Ж Осевой градиент

Инт-л Норма Болен

34 125

ИК стоя 1 <0.3 (выполнено у 4 чел.) -12% (выполнено у 53 чел.) -42%

2 (0.3;0.5) (выполнено у 24 чел.) -70% (выполнено у 54 чел.) -43%

3 >1.5 (выполнено у 6 чел.) -18% (выполнено у 18 чел.) -15%

Как и в случае отбора признаков, определяющих температурные «аномалии», применялись два основных правила. А именно, для дальнейшего исследования оставлялись пары (функция, промежуток), в которых присутствуют значения не менее 5% пациентов рассматриваемых 1рупп, причем изучаемый эффект в одной из диагностических групп должен наблюдаться в 2 раза чаще, чем в альтернативной. Например, в рассматриваемом выше примере, в интервале № 1 в каждом классе признак выполняется больше, чем у 5% пациентов, при этом для класса «Болен» он

выполняется в 3,5 раза чаще. Затем для отобранных таким образом признаков происходила их оценка с помощью статистической информативности.

Одними из немаловажных классификационных характеристик стали так называемые «эмпирические» признаки (наличие отека, варикозного расширения вен, боли и кожных изменений), которые выявляется на стадии первичного осмотра, пальпации и опроса пациента. Каждый из таких признаков так же оценивался с помощью статистической информативности.

На следующем этапе, для дальнейшего изучения были оставлены признаки, имеющие достаточно высокую статистическую информативность, а именно - / > 3. В результате был получен следующий их набор (табл. 3).

Таблица 3

Набор высокоинформативных признаков

м I Признаки Диапазон измерения, положение пациента

1. 21,4 Наличие отека

2. 17,1 Наличие варикозного расширения вен

3. 9,6 Наличие боли

4. 6,7 Средняя температура голени выше, чем температура в точке (2) ИКлежа

5. 6,4 Средняя температура точек (10), (11), (12) выше, чем средняя температура голени ИКстоя

6. 6 Температура точки (12) выше, чем средняя температура голени ИКстоя

7. 5,9 Температура точки (2) не является самой большой температурой голени РТстоя

8. 5,9 ЛМГ меньше, чем -0,3 °С РТстоя

9. 5,6 Осцилляция температуры больше, чем 2,5°С ИКстоя

10. 5,3 Средняя температура точек (10), (11), (12) больше, чем средняя температура точек (7), (8), (9) или средняя температура точек (7), (8), (9) больше, чем средняя температура точек (4), (5), (6) или средняя температура точек (4), (5), (6) больше, чем средняя температура точек (1), (2), (3) ИКстоя

11. 5,2 Наличие кожных изменений

12. 4,9 Температура точки (12) выше, чем средняя температура голени РТ лежа

13. 4,7 Температура точки (11) выше, чем средняя температура голени ИКстоя

14. 4,5 Средняя температура голени выше, чем температура ИК лежа

в точке (1)

15. 4,1 Температура точки (1) является самой низкой температурой голени ИК стоя

16. 4,1 Температура точки (4) не самая большая температура голени РТ лежа

17. 3,9 Температура точки (3) при измерении в положении «стоя» больше, чем температура точки (3) при измерении в положении «лежа» РТ

18. 3,7 Температура точки (10) выше, чем средняя температура голени ИК лежа

19. 3,5 Температура точки (2) при измерении в положении «стоя» больше, чем температура точки (2) при измерении в положении «лежа» РТ

20. 3,1 ОГ меньше, чем 0,3°С ИКстоя

21. 3 Температура точки (4) при измерении в положении «стоя» больше, чем температура точки (4) при измерении в положении «лежа» ИК

Полученные признаки являются одновременно значимыми для врача при постановке диагноза, и позволяют построить алгоритмы первичной диагностики.

В третьей главе «Классификация по данным комбинированной термометрии» представлено описание двух разработанных алгоритмов классификации, реализующих первичную диагностику, т.е. причисление пациента к одному из классов «Норма» или «Болен». Первый алгоритм основывается на полученных признаках из второй главы.

На первом шаге первого алгоритма каждой голени приписывается вектор (аъ ..., аг), из г высокоинформативных признаков, характерно отделяющих класс «Норма» от класса «Болен», по следующему правилу:

_ ( /г, если I - й признак выполнен 1 - {О, если I - й признак не выполнен,

где /г - информативность I - го признака.

На втором шаге вычисляется число 5) = аг + а2 + ••* + аг, где ] - номер голени в выборке.

На третьем шаге, число 5} сравнивается с числом, являющимся «критерием классификации» - Бо- В зависимости от результата сравнения голень относится либо к классу «Норма», либо «Болен».

На четвертом шаге, у пациента сравниваются диагнозы обеих голеней. Если хотя бы одна из них классифицирована как «Болен», то пациент приписывается к классу «Болен».

Важным элементом данного алгоритма является нахождение «критерия классификации» - Бо- Для его определения, использовался модифицированный алгоритм поиска «значимых» интервалов области значений 5/ для каждого из классов. Вначале производились вычисления выборочного среднего (6) и стандартного отклонения (7), затем по правилу «одной» сигмы (8) для каждого из двух классов были получены следующие «значимые» интервалы {табл. 4).

Таблица 4

Интервалы значений изменения 5}

Класс «Норма» Класс «Болен»

А, в, А2 в2 Асг

5,2 22,3 21 65,3 21,6 -

После проведения вычислительных экспериментов было решено О Л2+Вг

остановиться на величине = —-—.

Для повышения эффективности алгоритма, были проведены вычислительные эксперименты, заключавшиеся в реализациях указанного алгоритма для различных комбинаций высокоинформативных признаков, и нахождении оптимального набора. Наилучшие результаты показал следующий набор из 13 признаков (табл. 5).

Таблица 5

Признаки алгоритма классификации

Нй Признаки Диапазон измерения, положение пациента /

1. Наличие отека 21,4

2. Наличие варикозного расширения вен 17,1

3. Наличие боли 9,6

4. Средняя температура голени выше, чем температура в точке (2) ИК лежа 6,7

5. Температура точки (2) не является самой большой температурой голени РТстоя 5,9

6. ЛМГ меньше, чем -0,3°С РТстоя 5,9

7. Осцилляция температуры больше, чем 2,5°С ИКстоя 5,6

8. Наличие кожных изменений 5,2

9. Температура точки (11) выше, чем средняя температура голени ПК стоя 4,7

10. Средняя температура голени выше, чем температура в точке (1) ИК лежа 4,5

11. Температура точки (1) является самой низкой температурой голени ИКстоя 4,1

12. Температура точки (10) выше, чем средняя температура голени Ж лежа 3,7

13. Температура точки (2) при измерении в положении «стоя» больше, чем температура точки (2) при измерении в положении «лежа» РТ 3,5

В качестве основных показателей эффективности диагностики в медицине традиционно используются следующие параметры.

1. Точность диагностики, рассчитываемая по формуле:

^ип + Мио

,, -100% N

2. Точность диагностики здоровых (специфичность):

.. -100%

3. Точность диагностики больных (чувствительность):

., ■ 100%

где Кип - количество пациентов, у которых подтвердился диагноз «Болен»; КГио - количество пациентов, у которых подтвердился диагноз «Норма»; Ылп -количество пациентов, у которых не подтвердился диагноз «Болен»; Мл0 -количество пациентов, у которых не подтвердился диагноз «Норма».

Классификация на основе минимизированного признакового пространства позволила с достаточно высокой достоверностью описать состояние пациента. А именно, его на тестовой выборке показала точность 82,3%, специфичность -100% и чувствительность 82,1%.

Второй алгоритм основан на применении группы исключающих признаков. При помощи вычислительного кластера была рассчитана наилучшая комбинация высокоинформативных закономерностей, характерных для пациентов класса "Болен" (см. табл. 6).

Таблица б

Признаки, характерные для класса "Болен"

№ Признак Положение I

1 Разность температуры в точке (3) со средней температурой по голени больше чем 1 ИК стоя 9,5

2 Разность температуры в точке (2) со средней температурой по голени меньше чем -0.2 ИК лежа 11,6

3 АЛМГ больше чем 4.7 ИКстоя 8,7

4 АЛМГ больше чем 4.6 ИК лежа 7,5

5 Разность температуры в точке (2) с точкой (3) по голени меньше чем -0.5 ИК лежа 18,3

6 Разность температуры в точке (6) с точкой (8) по голени больше чем 1.4 ИК лежа 9,9

7 Более одного визуального признака 19,6

Так же была найдена комбинация закономерностей, характерных для здоровых пациентов (см. табл. 7).

Таблица 7

Признаки, характерные для класса "Норма"

№ Признак Положение I

1 ЛМГ больше чем 2.2 (или) РТМ стоя 3,4

ЛМГ меньше чем -1 (или) ИКстоя

Разность температуры в точке (10) с точкой (12) по голени меньше чем -0.7 РТМ стоя

2 Среднее ИК - среднее РТМ больше чем -2.0 (или) Лежа 4,5

Разность температуры в точке (8) с точкой (11) по голени меньше чем -0.5 (или) ИК лежа

Разность температуры в точке (5) с точкой (7) по голени меньше чем -0.6 (или) РТМ лежа

Разность температуры в точке (2) с точкой (12) по голени больше чем 2.7 РТМ лежа

3 Разность температуры в точке (2) с точкой (3) по голени больше чем 0.6 (или) РТМ стоя 4,8

Разность температуры в точке (2) с точкой (12) по голени меньше чем 0.2 (или) ИКстоя

Разность температуры в точке (1) с точкой (11) по голени меньше больше чем 1.2 РТМ стоя

Здесь АЛМГ («абсолютный латерально-медиальный градиент») - перепад температур от наружной к внутренней поверхности голеней, вычислялся по формуле:

9к 2 (к,к' - > кг,к) = (9)

1^1,к ~ *3,к\ + |Чк — с6,к| + |с7,к ~ Цк| + кю,к — кг,к\.

На первом этапе осуществлялась проверка признаков, характерных только для больных голеней (см. признаки 1-7 в табл. б). При выполнении хотя бы одного из них ставился диагноз «Болен», иначе - продолжалось тестирование.

На втором этапе, последовательно проверяем выполнение признаков, характерных только для здоровых голеней (см. признаки 1-3 в табл. 7). При выполнении хотя бы одного признака ставим диагноз «Норма».

По окончанию проверки, голени, не получившие диагноз ни на первом, ни на втором этапе считаем больными.При проверке второго алгоритма оказалось, что специфичность метода составила 90%, чувствительность - 92,8%, а точность - 92%.

В Заключении подведены основные итоги диссертационного исследования.

В приложениях представлены основные данные, связанные с поиском высокоинформативных признаков.

В заключении автор выражает глубокую признательность и благодарность за постановку задач, поддержку, полезные замечания и постоянное внимание к работе своему научному руководителю доктору физико-математических наук, профессору Лосеву Александру Георгиевичу. Автор так же выражает признательность и благодарность членам научного семинара «Математическое моделирование во флебологии», в особенности Ставрову Тимофею Александровичу.

СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи, в журналах, рекомендованных ВАК:

1. Анисимова, Е.В. О некоторых характерных признаках в диагностике венозных заболеваний нижних конечностей методом комбинированной термографии / Е.В. Анисимова, Т.В. Замечник, А.Г. Лосев, Е.А. Мазепа // Вестник новых медицинских технологий. - 2011. - №2 (Т. XVIII). - Тула, 2011.-С. 329-330.

2. Анисимова, Е.В. Теоретические исследования отдельных физических и физиологических факторов, влияющих на качество обследования пациентов с варикозной болезнью вен нижних конечностей методом комбинированной термографии / Е.В. Анисимова, Т.В. Замечник, С.И. Ларин, А.Г. Лосев, Е.А. Мазепа // Вестник новых медицинских технологий. - 2011. - №4 (Т. XVIII). - Тула, 2011. - С.280-282.

3. Анисимова, Е.В. Об одной математической модели диагностики венозных заболеваний по данным комбинированной термометрии / Е.В. Анисимова, Т.В. Замечник, А.Г. Лосев // Вестник новых медицинских технологий. -2012.- №2 (Т. XIX).-Тула, 2012. - С. 239-241.,

4. Анисимова, Е.В. Алгоритм локализации патологии в диагностике венозных заболеваний нижних конечностей по данным комбинированной термометрии / Е.В. Анисимова, А.Г. Лосев, Т.А. Ставров // Естественные и технические науки. -2012. -Ы 5. - Т. 61. - С. 324-327

Публикации в других изданиях:

1. Анисимова, Е.В. Интеллектуальная система комбинированной термометрии диагностики варикозных заболеваний / Е.В. Анисимова, Д.А. Веденяпин, Т.В. Замечник, С.И. Ларин, А.Г. Лосев, А.С. Черкасов Н Тезисы докладов X Всероссийской конференции "Биомеханика 2010", 16-22 мая 2010 г. - Саратов : Изд-во СГТУ, 2010. - С. 25-26.

2. Анисимова, Е.В. Статистические методы создания базы знаний в экспертном комплексе диагностики варикозных заболеваний / Е.В. Анисимова // «XV региональная конференция молодых исследователей Волгоградской области, 9-12 ноября 2010»: сб. науч. тр. - Физика и математика. Выпуск 4. - Волгоград : Изд-во ВолГУ, 2011. - С. 79-80.

3. Анисимова, Е.В. Об одной математической модели диагностики венозных заболеваний по данным комбинированнной термометрии / Е.В. Анисимова // XXV Международная научная конференция

математические методы в технике и технологиях : тез. докл. междунар. науч.-практ. конф., 28-30 мая 2012 г. - Волгоград, 2012.

4. Лосев, А.Г., Интеллектуальный комплекс диагностики венозных заболеваний / А.Г. Лосев, Е.В. Анисимова, Д.А. Веденяпин, Т.А. Ставров // Теоретические и прикладные вопросы современных информационных технологий : тез. докл. науч.конф., 13-20 августа 2012 г. - Улан-Удэ : Изд-во ВСГУТУ, 2012. - С.72-74.

Подписано в печать 30.05 2013 г. Формат 60x84/16. Бумага офсетная. Гарнитура Тайме. Усл. печ. л. 1,2. Тираж 100 экз. Заказ 118.

Издательство Волгоградского государственного университета. 400062 Волгоград, просп. Университетский, 100. E-mail: izvolgu@volsu.ru

Текст работы Анисимова, Екатерина Вячеславовна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО

ОБРАЗОВАНИЯ ВОЛГОГРАДСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИСТЕТ

На правах рукописи

Анисимова Екатерина Вячеславовна

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ И АЛГОРИТМЫ КЛАССИФИКАЦИИ В ДИАГНОСТИКЕ ВЕНОЗНЫХ ЗАБОЛЕВАНИЙ ПО ДАННЫМ КОМБИНИРОВАННОЙ ТЕРМОМЕТРИИ

Специальность:

05.13.01 - системный анализ, управление и обработка информации

(промышленность)

Диссертация

на соискание ученой степени кандидата технических наук

го

00

л со

со 8

^ § Научный руководитель:

^^ О) доктор физико-математических наук,

профессор Лосев А.Г.

Волгоград - 2013

СОДЕРЖАНИЕ

ВВЕДЕНИЕ.................................................................................................................4

Глава 1. Комбинированная термометрия в медицине..............................23

§1.1. Основы и особенности комбинированной термометрии в медицине.....................23

§ 1.2. Методика диагностики заболеваний вен нижних конечностей по данным комбинированной термометрии.................................................................................................30

§ 1.3. Физиологические параметры, оцениваемые комбинированной термометрией.....34

§ 1.4. Экспертная база данных и ее верификация................................................................37

§ 1.5. Влияние физиологических процессов на результаты термометрии........................43

§ 1.6. Интеллектуальный аппаратно-программный комплекс диагностики варикозных заболеваний..................................................................................................................................63

§ 1.7. Заключение....................................................................................................................66

Глава 2. Высокоинформативные признаки классификации...................68

§2.1. «Эмпирические» признаки...........................................................................................68

§ 2.2. Признаки существования экстремальных температурных зон голени....................75

§ 2.3. Признаки симметрии температурных полей голени................................................82

§ 2.4. Признаки изменчивости температурных полей голени...........................................90

§ 2.5. Метод формирования набора признаков и метод оценивания

высокоинформативных признаков.............................................................................................92

§ 2.6. Заключение..................................................................................................................104

Глава 3. Классификация по данным комбинированной термометрии 106

§ 3.1. Первый алгоритм верификации хронической венозной недостаточности. Критерий классификации. Критерии оценки эффективности алгоритма............................106

§ 3.2. Минимизация набора высокоинформативных признаков для первого алгоритма 111

§ 3.3. Второй алгоритм верификации хронической венозной недостаточности............115

§ 3.4. Заключение..................................................................................................................117

ЗАКЛЮЧЕНИЕ.....................................................................................................119

СПИСОК ЛИТЕРАТУРЫ...................................................................................121

ПРИЛОЖЕНИЕ А.................................................................................................130

ВВЕДЕНИЕ

В современном мире патологии вен нижних конечностей причисляют к «болезням цивилизации», а число страдающих нарушениями венозного оттока исчисляется сотнями миллионов. Рентгенологические методы и ультразвуковое дуплексное сканирование не решили проблему ранней диагностики и динамического контроля над течением венозных заболеваний, в том числе в связи с инвазивностью первых и высокой стоимостью последних. Кроме того, многие специалисты указывают на увеличение информативности комплекса диагностических мероприятий. В настоящее время приоритетными в медицине являются безопасные, как для пациента, так и для медицинского персонала, способы диагностики. Одним из таких методов является комбинированная термометрия, возникшая в последние десятилетия и уже практикуемая в различных областях медицины, в том числе и в диагностике венозных заболеваний. Комбинированная термометрия (иначе, комбинированная термография) - это биофизический метод неинва-зивного обследования, заключающийся в измерении внутренних и поверхностных температур тканей по интенсивности их теплового излучения, соответственно, в микроволновом (РТ) и инфракрасном (ИК) диапазоне и последующей их регистрацией в виде числовых данных.

Пространственное представление о распределении температуры в органе может оказать существенную помощь в определении наличия патологического процесса. Кроме того, согласно существующим в настоящее время представлениям, изменение температуры тканей обычно предшествует структурным изменениям, которые обнаруживаются при общепринятых методах исследования - УЗИ, рентгенографии, пальпации (см., например, [1]). Поэтому, комбинированная термометрия представляет особый интерес для ранней диагностики заболеваний.

Однако, несмотря на то, что данные о температурных полях пациента носят объективный характер, постановка диагноза на их основании по-прежнему остается «искусством» врача, и во многом носит субъективный характер. Последнее серьезно сужает уникальные возможности комбинированной термометрии в первичной диагностике.

Разработка диагностических методик на основе интеграции медицинских знаний и математических методов искусственного интеллекта является актуальной задачей. При современном развитии технологий, трудности диагностики зачастую возникают не из-за дефицита необходимой информации, а из-за отсутствия соответствующих объективных методов ее структуризации, алгоритмов выделения симптом-комплексов, выявления наиболее значимых и существенных признаков заболевания и т.д. Многие из указанных выше проблем можно решить созданием интеллектуальных диагностических комплексов. Интеллектуальными такие системы принято называть в связи с тем, что в них предусмотрен механизм обоснования предлагаемых решений (см., например, [39]), использующий специальные знания из предметной области. Впрочем, не претендуя на роль «истины в последней инстанции», подобный комплекс в большей степени призван быть консультантом и помощником для специалиста, который принимает окончательное решение, то есть является системой поддержки принятия диагностических решений.

Различные методики диагностики требуют соответствующих наборов информационно-ценных признаков. Причем, зачастую использование для одной задачи несколько алгоритмов, отличающихся стратегией распознавания и набором признаков, делает результаты диагностики более надежными и точными, чем решение, основанное на результатах действия одного алгоритма. В связи с этим, актуальным является направление дискриминантного анализа, основной задачей которого является поиск потенциально полезных зависимостей (знаний) в больших массивах данных. При этом используется огромное количество различных методов, алгоритмов и их всевозможных комбинаций. Вызвано это в том числе и тем, что создание универсального классификатора, без приложения

к какой-либо реальной задаче, оказывается бесплодной затеей. Последнее признается большинством исследователей. Значительно более плодотворным является подход, при котором вначале решается реальная практическая задача, а затем применяемые подходы обобщаются на группу проблем, близких первоначальной (см., например, [72]).

Таким образом, актуальность темы диссертационного исследования определяется необходимостью и возможностью повышения эффективности диагностики, в особенности - первичной, заболеваний вен нижних конечностей по данным комбинированной термометрии. В основе решения данной задачи лежит применение автоматизированных средств поддержки принятия диагностических решений на базе выявления высокоинформативных признаков. Работа выполнена при финансовой поддержке Министерства образования и науки РФ по ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012 годы» (госконтракт № 16.513.11.3067) и выполняется в рамках Государственного заказа от 01.01.2011 № 8.2419.2011.

Основной целью диссертационного исследования является повышение эффективности и качества диагностики заболеваний по данным комбинированной термометрии.

Для достижения цели необходимо решить следующие задачи:

• формирование и верификация обучающей выборки данных, полученных с помощью комбинированной термометрии;

• выявление влияния физиологических особенностей организма и условий проведения измерений на термометрические данные;

• разработка алгоритмов нахождения высокоинформативных признаков заболеваний, на основе данных комбинированной термометрии и их реализация на основе созданной обучающей выборки;

• разработка алгоритмов классификации пациентов на основе найденных диагностических признаков.

Для решения поставленных задач использовались основные положения теории системного анализа и обработки информации в медицинских системах, методы математической статистики, математического и компьютерного моделирования, дискриминантного анализа, экспертного оценивания и теории принятия решения.

Научная новизна в работе заключается в следующем.

1. исследована зависимость данных комбинированной термометрии от физиологических особенностей организма и условий проведения измерений;

2. разработан метод поиска высокоинформативных диагностических признаков поведения температурных полей на основе данных комбинированной термометрии.

3. выполнен поиск высокоинформативных признаков для диагностики венозных заболеваний нижних конечностей.

4. на основе совокупности высокоинформативных признаков построены алгоритмы, позволяющие относить пациента к одному из диагностических классов.

Таким образом, в исследовании разработана и научно обоснована совокупность методов поддержки принятия решения при диагностике венозных заболеваний по данным комбинированной термометрии, позволяющая повысить качество диагностики и предполагающая реализацию в интеллектуальном аппаратно-программном комплексе. Также найдены новые закономерности поведения температурных полей различных групп пациентов. Внедрение разработанных моделей и методов позволяет проводить адекватную первичную диагностику, а также повышает качество дифференциальной диагностики и динамического контроля течения венозных заболеваний. Результаты работы использовались при разработке интеллектуального аппаратно-программного комплекса диагностики заболевания вен нижних конечностей, применяемого в данный момент в Волгоградском флебологическом центре профессора Ларина С.И.

Разработанные модели диагностики вен нижних конечностей и их реализация в экспертном комплексе позволят оптимизировать процесс лечения, улучшить клинический прогноз, снизить количество пациентов с утратой трудоспособности и снизить ее степень.

Основные положения диссертации докладывались и обсуждались на X Всероссийской конференции «Биомеханика 2010» (Саратов, 2010 г.), XXV Международной научной конференции «Математические методы в технике и технологиях» (Волгоград, 2012 г.), XI Всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2012 г.), региональных конференциях молодых исследователей Волгоградской области (Волгоград, 2010-2012 гг.); конференциях профессорско-преподавательского состава ВолГУ (Волгоград, 2009-2013 гг.), научных семинарах ВолГУ и ВолГТУ.

По материалам диссертационной работы опубликовано 8 печатных работ, четыре из которых в изданиях из списка ВАК РФ. В работах, опубликованных в соавторстве, лично соискателю принадлежит: в работе [8], [9] - изучение вопроса создания базы знаний и ее представления; в [10] - анализ влияния различных факторов на методику комбинированной термометрии; [7], [9], [11],

[12], [57]- статистическая обработка данных и поиск закономерностей; в [11],

[13] - оценка признаков классификации, а так же построение алгоритмов классификации на основе этих признаков.

Во введении обосновывается актуальность работы, дается краткая характеристика темы, формулируются цель и задачи исследования, представляются основные научные результаты, выносимые на защиту.

Первая глава посвящена изучению основ и особенностей комбинированной термометрии в медицине, физиологическим параметрам организма, оцениваемым с ее помощью, методике диагностики заболеваний вен нижних конечностей по данным комбинированной термометрии.

По методике комбинированной термометрии (см., например, [53]) обследование пациентов проводится посредствам последовательного измерения

кожной (ИК) температуры и глубокой микроволновой термометрии (РТ) в 12 симметричных точках, расположенных по задней поверхности обеих голеней пациента, в положении пациента «лежа на животе» и «стоя». Точки измерения были выбраны, исходя из анатомического строения голени и внутреннего кровотока ноги, следующим образом. Первые три точки расположены на вершине латеральной головки икроножной мышцы (1), в подколенной ямке (2), на вершине медиальной головки икроножной мышцы (3). Второй ряд точек расположен по центру латеральной головки икроножной мышцы (4), между головками икроножной мышцы (5), и по центру медиальной головки икроножной мышцы (6). Третий ряд точек расположен в нижней части икроножной мышцы - лате-рально (7), в центре (8) и медиально (9). Последние точки измерения температуры находятся на наружной стороне ахиллова сухожилия в области латеральной лодыжки (10), по центру ахиллова сухожилия (11) и по его внутренней поверхности в области медиальной лодыжки (12). На основе данных измерений строятся температурные поля голени пациентов, анализируя которые врач ставит диагноз.

9

3

б

1:

Рисунок 1 - Расположение точек на задней поверхности голени

В результате исследований, проведенных в течение последних лет, была создана база данных пациентов. В нее были включены результаты обследова-

ний, проведенных специалистами Волгоградского флебологического центра профессора Ларина С.И. Обучающая выборка включает в себя информацию о 105 пациентах (210 голеней). Выборка разделена на два контрольных класса: «Норма» (34 голени) и «Болен» (176 голеней). Последние в свою очередь делятся в соответствии с преобладанием того или иного нарушения следующим образом:

• класс «Норма-2» - 50 здоровых голеней пациентов с патологией;

• класс «ВБ ХВН 0-1» - 36 голеней пациентов с наличием варикозной болезни с хронической венозной недостаточностью степени 0-1;

• класс «ВБ ХВН 2-3» - 20 голеней пациентов с наличием варикозной болезни с хронической венозной недостаточностью степени 2-3;

• класс «ПТБ (реканализация)» - 29 голеней пациентов с наличием по-сттромботической болезни в стадии реканализация;

• класс «ПТБ (окклюзия)» - 29 голеней пациентов с наличием пост-тромботической болезни в стадии окклюзия;

• класс «ОВТ» - 12 голеней пациентов с острым венозным тромбозом.

Основным результатом первой главы является качественное и количественное описание влияния физиологических особенностей организма и условий проведения измерений на данные комбинированной термометрии. В частности рассматривалось влияние пола, возраста пациента, температуры окружающей среды и физических нагрузок на результаты измерения комбинированной термометрии. Разделение больных проводилось по полу, возрасту на группы: 18-34 лет, 35-54 лет, 55-80 лет; а также по наблюдению температуры окружающей среды: меньше 19°С, от 19°С до 26°С, и выше 26°С. Влияние оценивалось с помощью коэффициента корреляции Пирсона (г). Значимость коэффициента корреляции оценивалась по критерию Стьюдента (см., например, [2], [38]) при уровне значимости а = 0,05 и степени свободы к= п - 2, где п - размер выборки.

В результате анализа полученных результатов, было выявлено, что во всех группах пациентов отсутствовала значимая корреляция ИК и РТ- температур с полом и возрастом пациентов. Изменения температуры внешней среды имело значительное влияние на температуры голеней и в инфракрасном, и в микроволновом диапазоне. Однако корреляция между изменением температуры среды и температурой голеней была различна у разных групп. Также значимое влияние на температурные показатели имеет изменение положения тела пациента с горизонтального на вертикальное. Указанные аспекты учитываются в методике комбинированной термометрии.

Кроме того отметим, что методика обследования пациентов с помощью данных комбинированной термометрии предусматривает соблюдение обычного для пациента режима физических нагрузок до обследования, измерения должны проводиться в положении пациента лежа и стоя при температуре окружающей среды не ниже 19°С и не выше 26°С. Последнее учитывалось при создании обучающей выборки, в нее не включались результаты измерений, которые проводились при температуре окружающей среды ниже 19°С и выше 26°С.

Вторая глава посвящена формированию набора высокоинформативных признаков заболеваний вен нижних конечносте�