автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Система анализа данных и прогнозирования в медико-биологических исследованиях, реализующая математические методы классификации
Автореферат диссертации по теме "Система анализа данных и прогнозирования в медико-биологических исследованиях, реализующая математические методы классификации"
V
О
гД
На правах рукописи
Спивак Инна Геннадиевна
СИСТЕМА АНАЛИЗА ДАННЫХ И ПРОГНОЗИРОВАНИЯ В МЕДИКО-БИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ, РЕАЛИЗУЮЩАЯ МАТЕМАТИЧЕСКИЕ МЕТОДЫ КЛАССИФИКАЦИИ
05.13.16 - Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Ростов - на - Дону 1998
Работа выполнена в Ростовском ордена Трудового Красного Знамени государственном университете.
Научные руководители: доктор физико-математических наук,
профессор Горстко А.Б.,
Ведущая организация: Таганрогский радиотехнический университет Защита состоится « 24 » сентября 1998 г. в 11 часов на заседании диссертационного Совета К 063.52.12 по физико-математическим и техническим наукам в Ростовском государственном университете по адресу: 344090, г. Ростов - на -Дону, пр. Стачки 200/1, корпус 2, Вычислительный центр РГУ, ауд. 401.
С диссертацией можно ознакомиться в научной библиотеке РГУ по адресу: г. Ростов - на - Дону, ул. Пушкинская, 148.
кандидат физико-математических наук, профессор Ерусалимский Я.М.
Официальные оппоненты: доктор технических наук,
профессор Белявский Г.И.
кандидат физико-математических наук, доцент Сурков Ф.А.
Автореферат разослан « /
Ученый секретарь диссертационного совета
К 063.52.12 кандидат физ.-мат. наук, с. н. с.
Муратова Г.В.
Общая характеристика работы
Цель работы - изучение и программная реализация математических методов анализа данных медико-биологических исследований, предназначенных для сбора и обработки качественной и количественной информации об объектах наблюдений, позволяющих классифицировать изучаемые объекты по группам выбираемых характеристик и прогнозировать их поведение на основе полученных результатов; создание программного комплекса, реализующего описанные возможности, и его использование для анализа данных конкретных медицинских наблюдений.
Актуальность темы. В медицинской и биологической науках накоплен обширный статистический материал о различных наблюдениях за динамикой живых организмов, анализ которого невозможен без применения компьютерной технологии и математических методов обработки информации. Выделение закономерностей в изменении состояния наблюдаемых объектов требует решения задач классификации и прогнозирования динамики объектов наблюдений. Решение этих задач связано с применением специфических математических знаний. Поэтому актуальной является проблема анализа описанных задач, возникающих в медицине и биологии, построения общей схемы их решения и создание комплекса программ, реализующих эту схему и позволяющих исследователю, не имеющему специальных знаний в области математики, применять специфические математические методы в своей работе, существенно расширяя свои возможности.
Методы исследования. Для решения поставленных задач использовались методы и понятия корреляционного, регрессионного,
дискриминантного анализа, теории распознавания образов, теории информации и кодирования.
Научная новизна и практическая значимость работы. В диссертации получены следующие основные результаты:
- проанализирован и программно реализован математический аппарат, позволяющий классифицировать объекта медико-биологических исследований по различным наборам описывающих их признаков и на основе полученной классификации прогнозировать динамику состояния наблюдаемых объектов;
- создан программный комплекс, включающий реализацию выбранного математического аппарата, являющийся инструментом, предоставляющим возможность исследователям в области медицины и биологии собирать и обрабатывать данные соответствующих наблюдений;
- построены с помощью созданного программного обеспечения и результатов обработки статистического материала решающие правила прогнозирования состояния здоровья детей, возникновения врожденных пороков развития ( ВПР ) и наследственных заболеваний (НЗ) у них, оценки эффективности лечения и выживаемости онкологических больных.
Программный комплекс создан для обработки и изучения данных медико-биологических исследований, которые вследствие большого объема материала не могут бьггь проведены без помощи ЭВМ и требуют применения не всегда доступного для исследователя специфического математического аппарата. Для использования разработанного программного продукта не требуется специальных знаний в области вычислительной техники и программирования, что делает его доступным инструментом для медиков и биологов.
Апробация работы. Результаты работы публиковались в материалах международных и всероссийских научных конференций: International Ecological Congress ( Voronezh, Russia, 1996), International Conference "Low doses of ionizing radiation: biological effects and regulatory control" ( Seville, Spain, 1997), Всероссийской научно-технической конференции студентов, молодых ученых и специалистов "Биотехнические, медицинские и экологические системы и комплексы" ( Рязань, 1997), VI Международной научно-практической конференции "Традиционные и нетрадиционные методы оздоровления детей" (Смоленск, 1997), П Всероссийском Симпозиуме "Математическое моделирование и компьютерные технологии" ( Кисловодск, 1998), 1 Всероссийской научно-практической конференции "Информатизация в педиатрической науке и практике" (Екатеринбург, 1998), а также неоднократно докладывались и обсуждались на научных семинарах кафедры "Прикладной математики и программирования" механико-математического факультета РГУ.
Использование пакета для анализа данных о состоянии здоровья детей, рожденных в семьях участников ликвидации последствий аварии на Чернобыльской АЭС, позволило построить правило прогнозирования возникновения у них врожденных пороков, которое опубликовано в пособии для врачей "Критерии риска врожденных пороков развития и наследственных заболеваний у детей, рожденных в семьях участников ликвидации последствий аварии на Чернобыльской АЭС", связанном с проведением профилактических мероприятий в указанной категории семей.
Публикации. Основные результаты, полученные с помощью разработанного программного комплекса опубликованы в работах [1] - [8], список которых приводится в конце автореферата. Работы [1], [2], [4], [5], [8]
выполнены совместно с сотрудниками Ростовского НИИ Акушерства и Педиатрии, их результаты принадлежат каждому из авторов в равной мере.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложения. Общий объём диссертационной работы - 172 страницы, в том числе: 156 страниц машинописного текста, 19 таблиц, 8 рисунков, 2 приложения. В списке литературы 51 название.
Содержание работы
Во введении дается общая характеристика работы, формулируются цели и задачи исследования, анализируется актуальность проведенных разработок, приводится обзор полученных результатов.
Первая глава посвящена проблемам применения математических методов и компьютерных технологий к задачам классификации и прогнозирования, возникающих при обработке результатов исследований в медицине и биологии. Эффективное решение задач обработки накопленных знаний возможно только с использованием современных математических методов, средств хранения и обработки информации, а также вычислительной техники. В тоже время необходимы средства аккумулирования знаний, выделения и накопления опыта в различных областях наблюдений за живым организмом. С другой стороны, необходимы средства, позволяющие воспользоваться этим опытом. Исследование методов решения описанных выше задач опиралось на работы В.П. Петленко, А.Ю. Барановского, Б.А. Кобринского, Л.Л. Иошлы, Ю.Й. Неймарка, Т.Б. Постновой и других. Анализ многих приведенных в диссертации работ показал, что при обработке данных медико-биологических исследований используется сходный математический аппарат. Кроме того, объем
изучаемой информации требует использования различных программных продуктов. Опыт совместной с медиками и биологами исследовательской деятельности свидетельствовал об испытываемых ими трудностями при использовании существующих пакетов прикладных программ, так как они требуют специальных знаний в области математической теории и не всегда обеспечены дружественным пользователю интерфейсом. Поэтому сделан вывод о необходимости создания инструмента, предусматривающего возможность создания информационных баз данных и первичную статистическую обработку собранных сведений, предлагающего схемы анализа полученных материалов, зависящие от поставленных в прикладном исследовании задач, и программную реализацию этих схем, применение которых позволяет строить правила классификации объектов или прогностические правила для определения динамики состояния объекта в будущем, а также дает возможность оценки достоверности полученных результатов.
Во второй главе освещаются природа задач классификации и прогнозирования, возникающих при обработке данных медико-биологических исследований, и математические методы решения этих задач.' Отмечается, что процесс решения задачи классификации объектов медико-биологических наблюдений и прогнозирования изменения их состояния состоит из следующих этапов:
описание и кодирование состояния изучаемых объектов; описание и отбор признаков, наиболее существенных для классификации и прогнозирования;
формирование правила отнесения объектов к изучаемым классам на основе выделенной системы признаков;
определение достоверности полученных результатов;
использование полученного правила для классификации объектов и прогнозирования изменения их состояния.
Приводятся различные способы описания объектов медико-биологических исследований. Описываются методы первоначальной статистической обработки данных наблюдений, принципы корреляционного анализа для обнаружения статистической связи между параметром классификации и признаками. Освещаются методы проверки статистической различимости рассматриваемых выборок и использования результатов анализа различимости для построения системы информативных признаков. Предлагается использование с этой же целью методов теории информации: описан способ построения системы информативных признаков на основе показателей информативной ценности простых и сложных признаков для отдельных классов и обследования в целом, приводится способ решения задачи классификации с учетом информативной ценности признаков. Отдельные разделы этой главы посвящены использованию алгоритма распознавания по общей близости признаков для анализа обучающей статистической выборки и решения задачи классификации. Рассмотрены алгоритмы построения разделяющих метрик и методы их использования для решения задач построения систем информативных признаков и классификации. Предложен способ построения правила классификации на основе результатов таксономии. Описан метод использования с той же целью дискриминанткых функций. Показано, что для решения задачи классификации можно воспользоваться методом Байеса определения вероятности отнесения объекта исследований к каждому из возможных классов.
Анализ изложенных методов позволяет сделать вывод о том, что описанный математический аппарат является средством решения задач классификации и прогнозирования, часто встречающихся при обработке
результатов медико-биологических наблюдений. Некоторые из них известны широкому кругу исследователей, не обладающих глубокими познаниями в области математических методов обработки данных. Другие - являются специфическими методами и поэтому применяются только специалистами в области прикладной математики. Область применимости описанных методов также различна: одни из них применяются только к данным, описывающим количественные характеристики объектов наблюдений, другие подразумевают обработку соответствующим образом закодированной качественной информации. Следует также отметить, что применение большинства описанных методов классификации даёт положительные результаты только в том случае, когда рассматриваемые характеристики являются специфическими признаками параметра классификации. На практике же часто встречаются задачи обработки данных, которые не являются непосредственно связанными с исследуемым состоянием объекта и его поведением.
Применение этих методов требует использования компьютерной техники для проведения вычислений и численных экспериментов. Кроме того, они оперируют сложными математическими понятиями, что затрудняет их внедрение в исследовательскую деятельность медиков и биологов.
Вышеперечисленные факты свидетельствуют о необходимости создания программного продукта, реализующего описанный математический аппарат, обладающего дружественным пользователю интерфейсом и предполагающего возможность использования его специалистами, не имеющими специфических математических знаний. Программный комплекс должен предлагать пользователю алгоритм решения конкретной задачи, исходя из данных о её постановке. Кроме того, возможности программного комплекса должны позволять проведение экспериментов с использованием
не вошедших в предложенный алгоритм методов с целью сравнения полученных результатов.
В третьей главе изложено описание созданного программного комплекса "Прогноз". Приведен перечень предоставляемых пользователю возможностей его применения. Подробно рассмотрен интерфейс пользователя. Представлены основные процедуры и функции, реализующие необходимый математический аппарат. Приведен пример использования программного комплекса для прогнозирования эффективности лечения онкологических больных, в котором прослеживаются основные этапы работы пользователя с программным комплексом, начиная от подключения созданных на базе другого программного продукта баз данных и настройки параметров комплекса, до выбора параметра классификации, формализации постановки задачи, определения методов её решения, выделения системы информативных признаков и решения задачи классификации.
Для удобства работы пользователей разработан отвечающий современным стандартам интерфейс, позволяющий быстро и эффективно производить необходимые операции. Экранные формы достаточно просты и удобочитаемы, все инструменты снабжены всплывающими подсказками, что должно облегчить работу с пакетом. Диалог осуществляется на языке со словарным запасом из той предметной области, в которой работает пользователь.
Применение пакета не требует знаний в различных специфических областях математики. Перед пользователем не возникает проблема выбора того или иного метода. Напротив, ему предлагается выбрать из предложенного списка описание проблемы, которое соответствует решаемой им задаче. На основе сделанного выбора программа автоматически формирует набор и порядок действий, которые необходимо осуществить для успешного решения задачи. Дальнейшая работа может осуществляться как в
автоматическом режиме, так и в режиме диалога с пользователем с целью демонстрации промежуточных результатов и определения дальнейшей тактики решения.
Программный комплекс предоставляет возможность создания описания проведенных исследований, сопровождаемого набором таблиц и отчетов, содержащих собранные данные и полученные результаты.
Данные наблюдений, описания исследований, результаты вычислений объединяются в программном комплексе в единую структуру, называемую проектом. Файлы, содержащие всю перечисленную информацию, находятся в одной директории на одном из логических устройств компьютера (дискете или жёстком диске).
Созданный программный комплекс состоит из нескольких модулей, каждый из которых выполняет одну из вышеперечисленных функций. Обращение к модулям производится посредством выбора соответствующих альтернатив главного меню комплекса.
Главное меню программного комплекса состоит из пяти пунктов. Первый пункт меню "Проект" включает в себя возможность открытия, подключения, создания, сохранения и закрытия проектов. На начальном этапе работы с программой пользователю доступны только три первых подпункта этого пункта меню. Выбрав одну из перечисленных возможностей, пользователь определяет, будет ли он продолжать исследования с ранее сформированным проектом, объединит ли заранее собранные данные в новый проект или создаст новый на основе пустого шаблона. После определения материала исследований пользователь получает доступ к данным наблюдений. Один из подпунктов этого пункта меню позволяет завершить работу с программным комплексом с сохранением всех сформированных на момент закрытия данных.
С помощью пункта главного меню "Наблюдения" предоставляется возможность просмотра и редактирования собранной информации в виде таблиц и электронных анкет наблюдений. Данные медико-биологических исследований имеют общую структуру, поэтому задача создания анкеты достаточно просто разрешается путем выбора предлагаемых пакетом вопросов и дополнением стандартного списка новыми пунктами, а также определением числа этапов обследования.
Следующий пункт главного меню "Постановка" связан с определением постановки задачи классификации и прогнозирования. Выбирая различные подпункты этого пункта пользователь определяет, какой из признаков, входящих в описание объектов исследований, является параметром классификации, выделяет систему признаков, на основе которой проводится классификация, выбирает алгоритм решения задачи. Если пользователь не может самостоятельно выделить систему информативных признаков, он включает в рассмотрение все признаки, часть из которых будет отброшена на следующем этапе исследования. При выборе алгоритма исследований пользователю предлагается описание типичных задач классификации и прогнозирования. Ему необходимо выбрать одно из описаний, соответствующее его конкретной задаче. Выбор описания определяет набор методов и последовательность их применения для решения поставленной задачи. Пользователь может отклониться от предложенного алгоритма и провести полный набор исследований, самостоятельно интерпретируя полученные результаты. В программном комплексе содержатся описания всех используемых методов и возможная интерпретация получаемых с их помощью результатов.
В пункте главного меню "Исследования" перечислены методы решения задачи классификации и прогнозирования, описанные в главе 2 диссертации. Выбор подпунктов этого пункта активизирует модули программного
комплекса, содержащие реализации этих методов. Активизация предлагаемых альтернатив позволяет проводить необходимые вычисления на основе использования определенного параметра классификации и системы признаков, составляющих описание объекта наблюдений.
Пункт главного меню "Помощь" предусматривает получение сведений об используемом программном комплексе, а в условиях работы над проектом, описания проводимых исследований, сформированных создателем проекта.
Диалог между пользователем и программным комплексом, результатом которого является построение правила классификации, осуществляется посредством активизации последовательности экранных форм диалога.
Программный комплекс реализован средствами системы Delphi под Windows 95.
В четвертой главе рассмотрены результаты применения программного комплекса "Прогноз" для обработки конкретных данных медицинских наблюдений. Рассмотрены наборы данных, связанных с оценкой состояния здоровья людей. В условиях ухудшающейся экологической обстановки создание инструментов, позволяющих решать задачи оценки состояния здоровья людей, а также прогнозирования его динамики, является важной задачей. Программный комплекс "Прогноз" использовался для решения задачи прогнозирования состояния здоровья детей, рожденных в семьях участников ликвидации последствий аварии на Чернобыльской АЭС. С его помощью было построено правило оценки риска возникновения ВПР и НЗ у детей, рожденных в данной категории семей. Решение этих задач в настоящее время является актуальной проблемой дня врачей-педиатров, а вместе с ними прикладных математиков, по той причине, что в ликвидации последствий экологической катастрофы принимали участие большое количество мужчин репродуктивного возраста, в том числе проживающих в
Ростовской области. Возможность прогнозирования состояния здоровья их потомства позволяет оценить воздействие фактора радиации в комплексе с рядом общепризнанных неблагоприятных воздействий на организм человека, включая экологическую обстановку в регионе. Указанное актуально не только в связи с необходимостью прогноза ВПР и НЗ, но и с ростом числа онкологических заболеваний, осложненных другими хроническими болезнями внутренних органов. Эффективность методов лечения онкологических больных зависит от состояния организма пациента на момент начала лечения, наличия и степени сопутствующих поражений внутренних органов. В этих условиях актуальным является вопрос оценки эффективности применения некоторого метода лечения для каждого конкретного больного по результатам обследования, проведенного до начала лечения. Показателем качества лечения в онкологии наряду с регрессией опухоли является продолжительность жизни пациентов после его прекращения. Поэтому возникла необходимость прогнозирования выживаемости больных по данным обследования на момент начала и окончания лечения.
В первой задаче в основу исследований были положены данные, состоящие из сведений о наблюдениях за детьми, проходившими обследование в клинике Ростовского НИИ Акушерства и Педиатрии, в возрасте от года до десяти лет и включающие в себя данные анамнеза, а также результатов объективного, клинического и инструментального обследований. Для определения оценки состояния здоровья использовались поставленные специалистами института диагнозы. В основу характеристики состояния здоровья положены традиционные группы здоровья, которые были детализированы в сочетании с данными дополнительных методов обследования. Предметом изучения служили три класса: дети, имеющие ряд функциональных нарушений (класс 2), дети, страдающие хроническими
заболеваниями ( класс 3 ), и дети-инвалиды ( класс 4 ). Класс здоровых детей ( класс 1 ) не рассматривался, так как в обследованной группе не было выявлено подобных пациентов. Была использована балльная оценка каждого диагноза пациента. Рассматривалось пространство признаков, соответствующих группам диагнозов. Состояние здоровья каждого ребенка в этом пространстве представлялось точкой. Изучаемые классы объектов -облаками точек. Задача оценки состояния здоровья детей решалась как задача классификации, то есть рассматривался вопрос об отнесении точки, представляющей состояние здоровья ребенка, к одному из описанных классов. Классификация строилось на основе количественных специфических характеристик, поэтому в качестве возможного метода решения был предложен метод таксономии Боге1. Правило классификации строилось на основании изучения свойств точек, составляющих образ обучающей выборки. На первом этапе проводилось разбиение образа на кластеры, путем смещения центров тяжести сгустков и изменения радиусов сфер, ограничивающих получаемые сгустки точек. Если оказывалось, что сгустков больше, чем число классов, которые следовало получить, то предпринималась попытка увеличения радиуса сферы без изменения цетра ее тяжести. В некоторых; случаях, это приводило к тому, что внутрь сферы попадали точки, отнесенные экспертом к разным классам. В этом случае, принималась версия о том, что к одному классу относятся несколько сгустков одного фиксированного радиуса. На втором этапе проводилась классификация всех объектов наблюдения на основе следующего правила. Точка, описывающая объект наблюдений, считалась отнесенной к тому сгустку, внутри которого она оказывалась. При добавлении новых точек к сгустку не производился пересчет координат центра тяжести. Если точка лежала на примерно одинаковом расстоянии от центров нескольких сгустков, то объект считался отнесенным к тому классу, который характеризовался наиболее тяжелым
состоянием здоровья пациентов. После проведения описанной процедуры в выборке оставались точки, которые нельзя было отнести ни к одному сгустку. Часть из них включалась в обучающую выборку и процесс построения правила классификации и классификация объектов повторялись. Выбор начального центра сгустка производился произвольно в каждом случае, что позволяло выявлять устойчивые и неустойчивые сгустки точек. При проведении вычислительных экспериментов было получено несколько устойчивых сфер, часть из которых состояли из точек второго класса, а остальные - из точек третьего класса. Расстояние между точками, описывающими состояние здоровья инвалидов было столь велико, что не удавалось объединить их во внутреннем пространстве сферы приемлемого для этой задачи радиуса. В результате проведения численных экспериментов было сформулировано правило классификации. Проверка правила классификации на объектах обучающей выборки полностью совпадала с определенным экспертом классом. Полученное правило не могло получить интерпретацию с точки зрения изучаемой предметной области. Но изучение результатов экспериментов позволило врачам скорректировать балльные оценки диагнозов и сформулировать новое правило классификации: объект относился к первому классу, если суммарные баллы диагнозов, составляющие все группы, кроме, может быть, первой, равнялись нулю; если состояние объекта характеризовалось диагнозами только второй и первой групп, то он считался отнесенным ко второй группе здоровья; если в описании присутствовали диагнозы из третьей группы, то он классифицировался как объект третьей группы здоровья; если суммарный балл диагнозов объекта наблюдений, отнесенных к четвертой группе, был больше нуля, то объект относился к четвертой группе здоровья. Описанное правило могло быть корректно интерпретировано в соответствии с общепринятой в медицине методологией. Применение сформулированных
критериев позволило определить группы здоровья детей, рожденных в семьях участников ликвидации последствий аварии на Чернобыльской АЭС, а также группы здоровья детей, составляющих контрольную группу.
На следующем этапе исследований был поставлен вопрос о возможности прогнозирования состояния здоровья детей в обследованных группах. Задача прогнозирования состояния здоровья решалась как для детей основной группы, так и для контрольной группы, для того, чтобы сравнить влияние различных показателей при наличии и отсутствии воздействия радиационного поражения отцов. С целью всесторонней оценки состояния здоровья детей были выделены потенциальные факторы риска, действовавших в различные периоды онтогенеза, начиная с внутриутробного. Рассматривалась задача прогнозирования состояния здоровья детей в возрасте от года до трех лет, на основании данных о родителях ребенка, ходе беременности и родов, а также состоянии его здоровья на первом году жизни.
При решении задачи прогнозирования состояния здоровья детей в возрасте от года до трех лет рассматривались факторы, которые не являлись специфическими причинами ухудшения состояния здоровья детей, но могли косвенно способствовать возникновению различных заболеваний. Задача прогнозирования рассматривалась как задача классификации. Предполагалось, что, если точка, описывающая в пространстве признаков набор факторов риска, имеющихся у ребенка к концу первого года жизни, окажется внутренней точкой одного из изучаемых облаков, то можно предполагать, что его состояние здоровья к трем годам можно будет оценить соответствующим этому облаку показателем. В ходе исследований была предпринята попытка оценить эффективность различных методов для решения поставленной задачи. Необходимость такого исследования была вызвана тем, что изучаемые факторы не являлись специфическим для
возникновения заболевания, а следовательно и оценки состояния здоровья, в тоже время большинство этих факторов имело качественный характер. Данные корреляционного анализа не позволили выделить систему информативных для прогнозирования состояния здоровья признаков, так как величины коэффициентов корреляции между прогнозом и признаками были слишком малыми, что не позволяло рассматривать вопрос о функциональной зависимости между состоянием здоровья ребенка и изучаемыми факторами риска. Попытка применения алгоритма распознавания по общей близости признаков также не позволила получить положительных результатов. Построение раздвигающей метрики не увеличило расстояния между облаками, описывавшими возможные состояния организма детей. В тоже время при проведении вычислений, больший вес по сравнению с другими признаками получали факторы, которые впоследствии были включены в систему информативных признаков на основе результатов исследования информативной ценности признаков. Выделение системы информативных признаков позволило существенно сократить план обследования ребенка и размерность изучаемого пространства признаков. Для решения поставленной задачи использовался вероятностный подход, основанный на критерии Байеса. Рассматривался набор значений всех признаков, составлявших информативную систему, характеризовавший объект наблюдений. Вычислялись вероятности отнесения объекта к каждому из трех возможных классов состояний. Объект считался элементом того класса, вероятность отнесения к которому была наибольшей.
Построенное правило позволяло прогнозировать состояние здоровья ребенка в возрасте от года до трех лет, опираясь на сведения, описывающие характер радиационного поражения отца, социальное положение матери, данные акушерско-гинекологического анамнеза и оценку состояния здоровья ребенка на первом году жизни. Правило прогнозирования позволяло
получить 78% правильных ответов, что свидетельствует о достаточно высоком уровне достоверности полученных результатов. Следует отметить, что в ходе исследований аналогичным способом было получены прогностическое правило, основанное на полной системе рассматриваемых признаков. Достоверность этого правила оценивалась 77%. Следовательно, построенное правило прогнозирования, использующее сокращенную систему информативных признаков, позволяет существенно сократить как процесс обследования ребенка, так и объем необходимых вычислений, без потери точности результата. Предпринимались попытки дальнейшего сокращения системы информативных признаков, что приводило к потери точности результатов. Дополнение этой системы малоинформативными признаками не улучшало, а в некоторых случаях ухудшало качество прогнозирования.
Аналогичным способом было построено правило оценки риска возникновения ВПР и НЗ у детей изучаемой категории. Риск возникновения у ребенка ВПР и НЗ считался высоким,-если вероятность отнесения точки, соответствующей результатам анкетирования семьи, к классу, характеризующему больных детей более чем в полтора раза
превосходила вероятность отнесения точки к классу, характеризующему здоровых детей. Риск возникновения ВПР и НЗ считался низким, если вероятность отнесения точки к классу, соответствующему здоровым детям, более чем в полтора раза превосходила вероятность отнесения к классу, описывающему детей с врожденными пороками развития. В противном случае риск считался средним. Описанное правило оценивания риска позволило получить правильный результат в 77 % случаев, что позволило судить о достоверности сформулированного решения. Рассмотрение более широкого набора признаков или введение в систему малоинформативных интервалов значений сложных признаков не позволило повысить достоверность результатов оценки риска возникновения пороков.
Исследование с помощью программного комплекса «Прогноз» решения задач оценки эффективности лечения и прогнозирования выживаемости онкологических больных после проведенного иммуно-лучевого лечения позволяет сделать следующие выводы. Для решения этих задач были использованы различные подходы. Собранного статистического материала оказалось недостаточно для применения алгоритма распознавания по общей близости признаков и алгоритма таксономии. Возможность решения задачи подтверждалась статистической неоднородностью рассматриваемых классов по целому ряду признаков. Прогностические правила строились с использованием результатов дискриминантного анализа. Полученные правила требуют небольшого количества информации об объекте наблюдений. Их использование возможно без применения сложной вычислительной техники, что облегчает их внедрение в практическую деятельность врачей.
В заключении диссертации перечислены основные результаты работы. В приложения вынесены договоры о научно-техническом сотрудничестве, в соответствии с которыми выполнялась диссертация, акт внедрения научных результатов диссертационной работы, таблица, отражающая содержание практических задач, решенных с помощью программного комплекса "Прогноз".
Выводы по диссертации. На защиту выносятся следующие результаты проведенных исследований:
системный подход к решению задач оценки состояния и прогнозирования динамики состояния организма в медико-биологических исследованиях, основанный на математической теории классификации;
инструментальные средства сбора и анализа данных медико-биологических исследований, реализующие разработанный подход и
предназначенные для пользователей, не обладающих специальными математическими знаниями;
результаты практического применения инструментальных средств для решения конкретных задач оценки и прогнозирования состояния здоровья людей.
В настоящее время созданный программный комплекс используется в ходе исследований, посвященных прогнозированию состояния здоровья детей старшего дошкольного и младшего школьного возраста, рожденных в указанной категории семей, а также для обработки данных лабораторных наблюдений, проводимых сотрудниками Ростовского НИИ Онкологии, связанных с изучением воздействия электромагнитных излучений различной частоты и напряженности на организм крыс, с целью повышения уровня резистентности организма и увеличения противоопухолевого эффекта традиционных методов лечения онкологических заболеваний.
Практическое использование программного комплекса "Прогноз" показало целесообразность его применения для проведения исследований в области медицины и биологии, связанных с прогнозированием состояния живых организмов в условиях ухудшающейся экологической обстановки. Он может быть также использован в качестве инструмента для изучения различных математических методов, связанных решением задач классификации и прогнозирования, а также для исследования эффективности того или иного метода решения описанных задач.
Автор выражает свою глубокую признательность научным руководителям профессору Горстко А.Б. и профессору Ерусалимскому Я.М. за постановку задач, помощь и постоянное внимание к работе.
Автор благодарит сотрудников Ростовского НИИ Акушерства и Педиатрии Бережанскую С.Б., Крыночкину М.Ю., Амелину С.С., а также сотрудников Ростовского НИИ Онкологии Розенко Л.Я. и Шихлярову А.И. за
многолетнее сотрудничество, предоставление материалов исследований и подробное обсуждение полученных результатов.
Список работ, опубликованных по теме диссертации
[1] Бережанская С.Б., Галкина ГЛ., Спивак И.Г. и др. Состояние гемодинамики у детей раннего возраста, рожденных в семьях участников ликвидации аварии на Чернобыльской АЭС. // Актуальные вопросы патологии, репродукции и онтогенеза: Сб. научных трудов, РНИИАП. -Ростов - на - Дону, 1996,- С. 76 - 77.
[2] Sophia В. Bereganskaia, Svetlana S. Amelina, Marina Yu. Krinochkina, Yevgeni P. Guskov, Inna G. Spivak The Influence Of Paternal Risk Factors On The Development Of Congenital Malformations And Hereditary Diseases In Families Of Liquidators Of Chernobyl Power Plant Accident Aftereffects. // International Ecological Congress: - Voronezh State Academy of Technology.-Voronezh, Russia, 1996-P. 15.
[3] Спивак И.Г. Система прогнозирования эффективности лечения и выживаемости онкологических больных.// Всероссийской научно-технической конференции студентов, молодых ученых и специалистов "Биотехнические, медицинские и экологические системы и комплексы": Тез. Доклада. - Рязань, 1997,- С. 90 - 92.
[4] Бережанская С.Б., Крыночкина М.Ю., Амелина С.С., Спивак И.Г. Состояние нервно-психического здоровья детей из семей участников ликвидации аварии на Чернобыльской АЭС. // VI Международная научно-практическая конференция "Традиционные и нетрадиционные методы оздоровления детей": Тез. доклада. - Смоленск, 1997,- С. 22 - 23.
[5] Е.Р. Guskov, S.B. Berezhanskaya, S.S. Amelina, M. Yu. Krynochkina, I.G. Spivak The Congenital Developments In Descendants Of Liqudators After 10 Years Chernobyl Accident. // International Conference "Low doses of
ionizing radiation: biological effects and regulatory control": Contributed papers.- Seville, Spain, 1997,-P. 165 - 167.
[6] Спивак И.Г. Программный комплекс для решения задач классификации и прогнозирования в медико-биологических исследованиях. // II Всероссийский Симпозиум "Математическое моделирование и компьютерные технологии": Тез. доклада. - Кисловодск, 1998.- Т. 3,-
[7] Спивак И.Г. Некоторые методы оценки эффективности лечения и выживаемости онкологических больных. - Деп. В ВИНИТИ 08.01.98, № 11 -В 98.
[8] Бережанская С.Б., Крыночкина М.Ю., Спивак И.Г. и др. Критерии риска врожденных пороков развития и наследственных заболеваний в семьях мужчин - участников ликвидации последствий аварии на ЧАЭС И 1 Всероссийская научно-практическая'конференция "Информатизация в педиатрической науке и практике": Тез. доклада. - Екатеринбург, 1998. -С. 100-102.
С. 57-58.
-
Похожие работы
- Математические модели прогнозирования индекса моторики на основе многомерного статистического анализа
- Прогнозирование и алгоритмизация управления медицинской ситуацией региона на основе медико-экологического мониторинга с применением геоинформационных технологий
- Оценка и прогнозирование уровней медико-биологического благополучия регионов в системе управления здравоохранением Республики Башкортостан
- Автоматизированная система количественной оценки операционного риска
- Модели поиска закономерностей и синтеза знаний в медико-биологических базах данных человека-оператора
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность