автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Анализ и синтез медицинских систем поддержки принятия решений на основе технологий статистического моделирования

доктора технических наук
Халафян, Алексан Альбертович
город
Краснодар
год
2010
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Анализ и синтез медицинских систем поддержки принятия решений на основе технологий статистического моделирования»

Автореферат диссертации по теме "Анализ и синтез медицинских систем поддержки принятия решений на основе технологий статистического моделирования"

004698487

На правах рукописи

Халафян Алексан Альбертович

АНАЛИЗ И СИНТЕЗ МЕДИЦИНСКИХ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ НА ОСНОВЕ ТЕХНОЛОГИЙ СТАТИСТИЧЕСКОГО МОДЕЛИРОВАНИЯ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (информационные и технические системы)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора технических наук

2 3 СЕН 2010

Краснодар 2010

004608487

Работа выполнена в Кубанском государственном технологическом университете

Научный консультант: доктор технических наук, профессор

Владимир Сергеевич Симанков

Официальные оппоненты: доктор технических наук, профессор

Ломко Валерий Иванович

доктор физико-математических наук, профессор Мнков Александр Иванович

доктор медицинских наук, доцент Жижин Константин Сергеевич

Ведущая организация: ФГУП КБ «Селена»

Защита состоится «20» октября 2010 года в 14.00 на заседании диссертационного совета Д 212.100.04 в Кубанском государственном технологическом университете по адресу: 350072, г. Краснодар, ул. Московская, 2, ауд. Г-251.

С диссертацией можно ознакомиться в библиотеке Кубанского государственного технологического университета.

Автореферат разослан « $ » 2010 г.

Ученый секретарь диссертационного совета, канд. техн. наук, доцент

А.В. Власенко

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность. В настоящее время информатизация охватывает всё более широкие сферы человеческой деятельности. При этом темпы роста цифровой информации значительно опережают темпы роста информации на бумажных носителях. Медицинская информация имеет свою специфику, и увеличение ее объемов сопровождается определенными проблемами, которые обосновывают необходимость создания медицинских информационных систем (МИС). Они отличаются от экономических или технических информационных систем, что создает дополнительные сложности при их разработке и внедрении. Отличие проявляется в специфике объектов информатизации, например, системы диагностического кодирования становятся в настоящее время более универсальными, но детальная номенклатура признаков и симптомов, форматы для регистрации данных, а также организация записей определяются индивидуально; отсутствует стандартизация в терминологии, формате, шкалах измерения медицинских данных и т. д.

К сожалению, отечественная медицина и здравоохранение не в полной степени соответствуют требуемому уровню информатизации. Несмотря на указанные сложности, информатизация - объективный процесс, поэтому МИС все же медленно, но эволюционируют.

Очень часто для принятия медицинских решений характерны недостаточность знаний, ограниченность временных ресурсов, отсутствие возможности привлечения компетентных экспертов, неполнота информации о состоянии больного. Указанные факторы являются причинами врачебных ошибок, которые могут привести к дальнейшей потере здоровья пациента. Поэтому наряду с разработкой МИС важной является задача создания медицинских систем поддержки принятия решений (СППР), которые являются информационными системами, функционирующими автономно либо в составе МИС.

В отличие от разработки информационных систем, автоматизирующих определенные виды человеческой деятельности по хранению и обработке данных, СППР являются наукоемкими, так как предполагают использование определенных научных направлений и методов анализа данных. Некоторые существующие СПГ1Р обладают рядом недостатков, например, отсутствует оценка достоверности полученного решения, не в полной степени используются возможности статистического моделирования в анализе данных и выявлении новых медицинских знаний, принятие решений сопровождается потерей информации из-за перевода клинико-лабораторных показателей, измеренных в шкале интервалов или отношений, в более бедную - балльную.

При внедрении информационных систем и СППР актуальной является проблема их функциональности и пригодности, которая выражается в том, что чем функциональнее система, тем она более сложна, а значит и менее пригодна для практического применения. Для снижения остроты проблемы необходимо подойти к разработке, внедрению информационных систем и СППР с позиций системного анализа, одним из этапов которого является математическое моделирование, включающее построение и анализ детерминированных и вероятностно-статистических моделей.

Особую актуальность для вероятностно-статистического моделирования приобретают методы многомерного статистического анализа, при помощи которых можно строить не только оптимальные планы сбора, систематизации и обработки данных, но и выявлять характер и структуру взаимосвязей между компонентами исследуемого многомерного признака. Статистические пакеты прикладных программ (ППП) позволяют успешно использовать достаточно трудоемкие в реализации многомерные статистические методы и более сложные углубленные методы анализа данных для формализации слабоструктурированных проблем. Поэтому современные технологии статистического анализа делают вероятностно-статистические

методы эффективным инструментарием поиска и выявления скрытых знаний, которые могут и должны быть использованы при создании СППР в слабоформализуемых областях человеческой деятельности, в том числе и в медицине.

Существующие системы управления базами данных (СУБД) позволяют хранить, обрабатывать и предоставлять пользователю информацию в удобном для него виде. Применительно к медицине в СУБД может храниться вся информация о больном в виде электронной истории болезни (ЭИБ).

Поэтому диссертационная работа, направленная на построение методологии создания СППР на основе современных технологий статистического моделирования, хранения и представления данных, является актуальной.

Цель. Разработка методологии анализа и синтеза медицинских СППР с возможностью получения и использования скрытых знаний.

Задачи исследования.

1. Исследовать теоретические и прикладные аспекты системного анализа в построении информационных систем и СППР, состояние и уровень развития отечественных МИС и СППР.

2. Посредством анализа и синтеза процессов принятия управленческих решений формализовать принятие решений и построение СППР применительно к медицине.

3. Разработать методологические принципы использования современных технологий вероятностно-статистического моделирования в выявлении новых знаний. Предложить технологию решения задачи классификации объектов по группам однородности и применить для формализации слабоструктурированных медицинских проблем идентификации тяжести состояния больных.

4. На примере медицины показать состоятельность методологии анализа и синтеза систем принятия решений при создании эффективных СППР в различных сферах практической, исследовательской и образовательной деятельности человека, построив СППР для идентификации тяжести состояния больных.

5. Оценить эффективность разработанной С.ППР, применив ее для идентификации тяжести состояния больных, страдающих хронической сердечной недостаточностью.

Методы исследования. В диссертационной работе использованы методы системного анализа, теории принятия решений, теории вероятностей и математической статистики, многомерного и углубленного анализа данных в среде ППП STATISTICA, обработки и хранения данных в СУБД MS ACCESS, создания запросов STATISTICA QUERY, программирования в STATISTICA VISUAL BASIC(SVB).

Объект исследования: медицинские информационные системы и системы поддержки принятия решений.

Предмет исследования: методология построения медицинских систем поддержки принятия решений.

Научная новизна. В диссертации получены следующие основные результаты, характеризующиеся научной новизной:

1. Проведен анализ информационных систем и особенностей процессов принятия решений в медицине на основе системного подхода.

2. Разработаны теоретические положения анализа и синтеза СППР медицинского назначения с использованием современных и классических направлений анализа данных с целью извлечения скрытых знаний.

3. Разработаны методологические положения применения современных технологий вероятностно-статистического моделирования, представления и хранения данных для выявления скрытых знаний и построения эффективных медицинских СППР.

4. На основе широкого спектра методов многомерного и углубленного анализа данных предложена технология формализации слабоструктурированных проблем классификации больных на группы однородности. Для ряда заболеваний получены новые медицинские знания, которые были использованы при создании СППР.

5. На основе рассмотренных в работе теоретических и методологических положений разработан алгоритм и построена эффективная СППР для идентификации степени тяжести состояния больных.

Достоверность и обоснованность научных положений подтверждается:

- использованием системного подхода, вероятностно-статистических методов и современных информационных технологий к решению задач диссертации;

- сведениями из медицинской литературы;

- признанием результатов исследований научным сообществом;

- сравнительным анализом результатов, проведенных в диссертации исследований с известными медицинскими знаниями и практическим медицинским опытом;

- апробацией и результатами внедрения разработанной СППР - программы СИТСБ в лечебные учреждения и учебные заведения г. Краснодара.

Практическая значимость и внедрение. На основе принципов системного анализа предложена методология построения эффективных СППР, которая может быть использована для создания СППР в различных областях практической деятельности человека.

В среде ППП ЗТАЛБ'ПСА на основе различных методов классификационного анализа разработаны программные модули, диагностирующие степень тяжести состояния больных. Модули зарегистрированы в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам, в Отраслевом фонде алгоритмов и программ.

На основе разработанного алгоритма, выявленных новых медицинских знаний, разработанных программных модулей построена медицинская СППР - компьютерная программа СИТСБ для определения степени тяжести состояния больных, страдающих такими заболеваниями, как хроническая сердечная недостаточность, лептоспироз, цефроптоз.

Программа СИТСБ может быть адаптирована для определения тяжести состояния больных, страдающих различными заболеваниями, выявления группы однородности больных, например по виду заболевания, диагнозу. Имеет простой и максимально дружественный интерфейс для пользователя, не требуется специальных знаний в области математики, статистического анализа или информационных технологий.

Программа СИТСБ зарегистрирована в Федеральной службе по интеллектуальной собственности, внедрена в диагностический процесс кардиологического отделения Краснодарской клинической городской больницы № 2, в диагностический процесс Специализированной клинической инфекционной больницы департамента здравоохранения Краснодарского края, в учебный процесс Кубанского государственного медицинского университета.

Основные положения, выносимые па защиту:

1. Результаты анализа и синтеза процессов, происходящих при принятии медицинских решений:

- общая функциональная схема СППР;

- последовательность этапов создания СППР.

2. Методология построения СППР, состоящая в применении технологий статистического анализа для выявления новых скрытых знаний; интеграции современных технологий статистического моделирования, хранения и представления данных.

3. Алгоритм СППР применительно к задаче идентификации степени тяжести состояния больных.

4. Технология решения задачи классификации больных. Результаты применения методов вероятностно-статистического моделирования для формализации слабоструктурированных медицинских проблем идентификации тяжести состояния больных. Выявленные новые медицинские знания, которые были использованы при построении СППР.

5. Компьютерная программа СИТСБ как пример СППР, построенной на основе предложенной в работе методологии. Оценка эффективности ее применения.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и представлялись на различных всероссийских и международных конференциях: III Всероссийском конгрессе «Профессия и здоровье» (Москва, 2004 г.), Международном конгрессе «Социальная психология XXI столетия (Ярославль, 2004 г.), Всероссийских научных конференциях «Современное состояние и приоритеты развития фундаментальных наук в регионах» (Краснодар, 2004-2005 гг.), Международной научно-практической конференци «Образование, наука и экономика в вузах. Интеграция в международное образовательное пространство» (г. Плоцк (Польша), 2006 г.), XIII школе-коллоквиуме по стохастическим методам и VII Всероссийском симпозиуме по прикладной и промышленной математике (Йошкар-Ола, 2007 г.), XXVII Российской школе по проблемам науки и технологий, посвященной 150-летию К.Э. Циолковского, 100-летию С.П. Королева и 60-летию Государственного ракетного центра «КБ им. В.П. Макеева» (Миасс, 2007 г.), III Международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» (СПб, 2007 г.), XII Международной конференции «Экологическая и экономическая безопасность, Проблемы и пути решения» (пос. Шепси, 2007 г.), на кафедре прикладной математики факультета компьютерных технологий и прикладной математики Кубанского государственного университета (сентябрь, 2009 г.),

на кафедре компьютерных технологий и информационной безопасности Кубанского государственного технологического университета (апрель 2010 г.).

Публикации. Основные результаты диссертационной работы опубликованы в 41 печатном издании, включая: 2 монографии, 3 учебника, 12 статей. Ряд статей (10) входят в перечень ведущих научных журналов, рекомендуемых ВАК для опубликования основных научных результатов докторских диссертаций. Имеется 11 свидетельств о регистрации программ в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам, а также в отраслевом фонде алгоритмов и программ.

Структура и объем работы. Диссертационная работа состоит из введения, шести глав, заключения, библиографического списка, содержащего 271 наименование. Она изложена на 377 страницах машинописного текста, включая 223 рисунка, 6 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована проблема исследования и актуальность темы диссертации, сформулированы цель и задачи исследования, изложены основные научные и практические результаты проведенных исследований, показана их научная новизна и практическая значимость, указаны основные положения, выносимые на защиту, приводятся сведения об общей ее структуре, дается краткая характеристика содержания по главам.

В первой главе определены ключевые проблемы информатизация в медицине.

Изложены основные положения, обосновывающие необходимость разработки и внедрения медицинских информационных систем-.

- существование и появление большого объёма научной информации на бумажных носителях в виде статей, монографий и сборников, с которой

врачи не в состоянии справиться (ежегодно публикуется около 2 млн. статей в 40 тыс. биомедицинских журналах, словарь международных клинических классификаций насчитывает около 30 ООО основных терминов);

- использование для лечения больных значительного количества лекарственных препаратов, имеющих противопоказания, побочные действия, сложные взаимодействия с другими препаратами, определенные дозиропки и схемы применения (В настоящее время в медицине известно более 105 лекарственных препаратов и симптомов заболеваний, свыше 104 болезней, помнить эту информацию не представляется возможным);

- внедрение в лечебно-профилактические учреждения (ЛПУ) современных компьютеризованных медицинских приборов и следящих систем, а также средств передачи и хранения потоков информации, что приводит к необходимости обработки и хранения большого количества цифровой информации;

- необходимость составления и дублирования в медицине огромного потока различного рода бумажной документации;

- создание и функционирование различных электронных ресурсов: специализированных сайтов для врачей, электронных каталогов, журналов, также содержащих большие объемы информации;

- существование немалого процента врачебных ошибок, сопровождаемого дальнейшей потерей здоровья больного или летальным исходом из-за неточности в оценке его состояния (Проблема заключается в том, что на состояние больного могут оказывать влияние определенные факторы не только по отдельности, но и в определенных сочетаниях значений. Естественно, обработать такое количество информации и выявить определенные закономерности только под силу вычислительной технике с соответствующим программным обеспечением);

- усложнение процесса принятия верных решений ввиду множественности факторов и признаков заболеваний, их взаимодействий.

Определенную помощь в принятии решения может оказать врачу компьютерное моделирование состояния больного в зависимости от выбора той или иной тактики или стратегии лечения.

Приведен аналитический обзор информационных систем и методов обработки информации В медицинских учреждениях.

Рассмотрены основные ряп, уровней компьютеризации для МИС.

Первый уровень характеризуется тем, что только около 50 % информации о пациенте вносится в компьютерную систему, и в различном виде выдается ее пользователям в виде отчетов. Иными словами, такая компьютерная система является неким автоматизированным окружением вокруг «бумажной» технологии ведения пациента.

Па втором уровне развития МИС те медицинские документы, которые ранее не вносились в электронную память, прежде всего речь идет об информации с диагностических приборов, получаемой в виде различного рода распечаток, сканограмм, топограмм и пр., индексируются, сканируются и запоминаются в системах электронного хранения изображений.

Третий уровень соответствует внедрению в МИС электронных медицинских записей.

Четвертый уровень означает внедрение в МИС не одной электронной записи о пациенте, а систему электронных медицинских записей, которые представляют записи о пациенте, имеющие гораздо больше источников информации. В них содержится вся соответствующая медицинская информация о конкретном пациенте, источниками которой может являться как одно, гак и несколько медицинских учреждений.

Пятый уровень соответствует наличию в МИС электронной записи о здоровье человека (не обязательно больного!). Она отличается от системы электронных записей о пациенте существованием практически неограниченных источников информации о здоровье человека. Появляются сведе-

ния из областей нетрадиционной медицины, его поведенческой деятельности (курение, занятия спортом, использование диет и т. д.).

Обосновано мнение специалистов, что в России на сегодня может быть реализован первый, либо второй из перечисленных уровней развития МНС. Назовем некоторые особенности, препятствующие разработке и внедрению МИС в отечественное здравоохранение:

- не существует программы информатизации ЛПУ, четкой политики в сфере информационно-коммуникационных технологий, а, следовательно, и отсутствует соответствующее финансирование; например, в США затраты на создание и модернизацию медицинских информационных систем составляют в год около 8,5 млрд. дол. В то же время, стоимость отечественного рынка медицинских информационных систем составляет всего 20 млн. дол. США;

- имеется слабая техническая и образовательная база ЛПУ; невозможно применять современные информационные технологии там, где отсутствуют компьютеры или персонал не владеет необходимыми навыками их использования;

- отсутствует методическая литература; не разработаны нормативы, стандарты по обработке и передаче медицинских данных, применению компьютерных систем в ЛПУ;

- наблюдается недостаточная информированность врачей и руководителей медицинских учреждений о МИС и результатах их использования в медицине;

- неготовность медицинского сообщества в своем подавляющем большинстве ни профессионально, ни психологически к использованию МИС в полной мере.

Несмотря на указанные проблемы МИС все равно создаются, внедряются, так как информатизация всех сфер человеческой деятельности носит объективный характер.

Проведен аналитический обзор литературы, посвященной медицинским информационным технологиям (монографии, учебные издания, периодические бумажные и электронные издания). Рассмотрены медицинские специализированные сайты для врачей и пациентов, международные серверы по телемедицине и другим направлениям современной медицины.

Приведены примеры внедрения медицинских информационных технологий и МИС в ЛПУ. Сделан анализ состояния отечественного рынка МИС. Рассмотрены наиболее популярные МИС, их функциональные возможности, архитектура, программная платформа, принципы проектирования и т.д.

Вторая глава посвящена особенностям применения методов системного анализа при построении МИС.

Обоснована необходимость рассмотрения человека как достаточно сложной, функциональной и еще далеко неизученной биологической системы. Показано преимущество системного подхода к пониманию функций целого организма перед классической физиологией органов, традиционно следующей анатомическим принципам. Обосновано применение системного подхода перед традиционными комплексными методами лечения заболеваний, который предполагает сбор и обработку всесторонней информации о состоянии здоровья больного в виде клинико-лабораториых показателей, многие из которых взаимосвязаны друг с другом, некоторые из них наиболее информативны в описании состояния больного, другие менее значимы. В большинстве случаев о состоянии больного можно судить не по значениям отдельных показателей, а по комбинации значений небольшой совокупности показателей. Выявить такие показатели и по сочетанию их значений «распознать образ» заболевания или идентифицировать тяжесть состояния больного можно только с использованием методов системного анализа, в частности статистического анализа данных.

Рассмотрен системный подход к разработке и внедрению медицинских информационных систем. После внедрения большинства МИС в ЛПУ появляются проблемы в процессе их эксплуатации, так как некоторые из них достаточно сложны в реализации, неудобны для врачей - неискушен--пых в информатике пользователей. Поэтому несмотря на то, что система внедрена, она не работают в родной степени и не выполняет возложенные на нее при разработке функции. Основная причина в том, что функциональная полнота системы значительно усложняет ее эксплуатационные свойства, делая непригодным для практической работы. В разделе проанализированы причины этого явления, заключающиеся в специфических особенностях, присущих именно МИС.

Проведен анализ зависимости сложности и пригодности системы от ее функциональности. Показано, что с увеличением функциональности системы ее сложность растет, а пригодность уменьшается. Предлагается для снятия проблемы, или, по крайней мере, снижения ее остроты подойти к разработке и внедрению МИС с позиций системного анализа, который предполагает реализацию определенных его этапов.

С точки зрения системного анализа рассмотрена модель состава и структуры лечебно-профилактического учреждения. Предложена упрощенная модель лечебного учреждения - клинической больницы, состоящей из подсистем: управления, медперсонала, технического персонала, делопроизводства, больных, диагностики, справочной информации для врачей, поддержки принятия врачебных решений, анализа эффективности лечения больных. Каждая из указанных подсистем состоит из элементов. При более детальном описании системы некоторые элементы могут быть представлены в виде подсистем. Так как модель состава не предоставляет достаточной полной информации о функционировании лечебного учреждения, то дополнительно рассмотрена модель структуры, в которой указаны взаимодействия между подсистемами.

Предлагаются два направления в создании МИС, наиболее целесообразные с точки зрения системного подхода:

- первое направление предполагает разработку МИС ГГ-персоналом лечебного учреждения совместно с медицинским персоналом;

- второе направление предполагает поэтапное внедрение коммерческой МИС к ЛПУ; по мере ее адаптации и освоения медперсоналом, а также появления потребности в наращивании функциональности системы, производится дальнейшая ее модификация и усложнение за счет последующих этапов внедрения.

В третьей главе медицинские СППР представлены как значимый фактор в повышении эффективности медицины. Обоснована необходимость создания медицинских СППР.

Очень часто при принятии медицинских решений характерны ограниченность временных ресурсов, отсутствие возможности привлечения большого числа компетентных экспертов, неполнота информации о состоянии больного, высокая динамика течения заболеваний, изменчивость заболеваний и появление новых. Поэтому с развитием и совершенствованием информационных технологий актуальной является проблема обеспечения компьютерной поддержки принятия решений в медицине. Одним из основных подходов к решению данной проблемы считаем создание Decision Support System (DSS) - систем поддержки принятия решений (СППР).

Поддержка принятия решений в различных сферах профессиональной деятельности становится одной из перспективных и быстро развивающихся областей приложения современных интеллектуальных и информационных технологий. В настоящее время в России ведутся теоретические и прикладные исследования по проблемам создания СППР. Некоторые работы выполняются в рамках программ фундаментальных исследований президиума РАН - «Фундаментальные проблемы информатики и информационных технологий» и Отделения ианотехнологий и информа-

ционных технологий РАН - «Фундаментальные основы информационных технологий и систем», а также проектов Российского фонда фундаментальных исследований. Построение СППР связано с понятием нечеткости информации или структурированности проблемы (задачи). Медицинские задачи, как правило, относятся к слабоструктурированным или неструктурированным проблемам.

При создании медицинских СППР могут быть использованы как самостоятельно, так и в комбинации друг с другом современные направления обработки и анализа данных; прикладная статистика, Data Warehouse -хранилище данных, O/a/7-миогомсрный анализ данных, Knowledge Discovery in Databases - обнаружение знаний в базах данных, Data Mining - добыча данных. Например, в состав Knowledge Discovery in Databases в качестве подсистемы обработки и хранения данных входит Data Warehouse и Data Mining - как подсистема интеллектуального анализа данных. В состав Data Mining могут быть включены в различной комбинации современные методы анализа данных - предметно-ориентированные аналитические системы, статистические пакеты, нейронные сети, системы рассуждений на основе аналогичных случаев, деревья решений, эволюционное программирование, генетические алгоритмы, алгоритмы ограниченного перебора, методы нечеткой логики, когнитивные карты, экспертные методы.

Следует заметить, что в указанных методах анализа данных, за исключением статистических, отсутствует возможность оценивания достоверности полученного решения.

Анализ данных - это процесс движения по спирали от простых методов к более сложным. И если простая модель позволяет решать практические задачи, то нет смысла искать и использовать более сложные методы. Здесь уместно вспомнить методологический принцип, который называют законом достаточного основания, или законом экономии, - «не изобретать сущностей сверх необходимого». Поэтому медицинские СППР в зависи-

мости от сложности решаемой медицинской проблемы могут создаваться как на базе перечисленных выше современных направлений и методов анализа данных, так и на основе классических методов анализа данных, в частности, - экспертных методов, математического и вероятностно-статистического моделирования.

Рассмотрены медицинские экспертные системы. Существенным стимулом в развитии экспертных систем послужило современное направление медицины - телемедицима. Современные системы лабораторного и радиологического оборудования - томографы, УЗИ, магнитный резонанс, цифровая флюорография, компьютерная радиография снабжены процессорами, что позволяет объединять их в информационные системы. Информационные системы по телемедицине создаются в соответствии с государственными программами по телемедицине, которые охватывают создание общеевропейских баз данных. Экспертные системы могут быть завершающим этапом в медицинских системах поддержки принятия решений, предполагающих коллективное принятие решений.

Как было замечено ранее, в основу СППР могут быть положены математические модели процессов, протекающих в человеческом организме. Существует мнение, что основным аналитическим инструментом системного анализа, в том числе и в медицине, являются детерминированные математические модели. Проведен аналитический обзор некоторых современных работ по детерминированному математическому моделированию в медицинских исследованиях. Недостатком детерминированных моделей является жесткая и однозначная зависимость каждого параметра модели от других её параметров.

Невозможно говорить об абсолютно одинаковых, реальных объектах и абсолютно одинаковых воздействиях на них, а потому и об абсолютной детерминированности окружающего нас мира. По-видимому, все реальные объекты и явления имеют черты как детерминированного, так и случайно-

го, которые могут проявляться в большей или меньшей степени. Однако математические модели могут быть либо детерминированными, либо стохастическими, т.е. они включают случайные факторы, подчиняющиеся с определенной точностью законам математической статистики.

Применение вероятностно-статистических моделей в медицинских исследованиях актуально и во многих случаях единственно возможно. Выполнен аналитический обзор работ, посвященных применению статистических методов в медицинских исследованиях. Это монографии, сборники научных трудов, учебные пособия, научные статьи, а также изобретения, в основе которых лежат статистические методы.

В четвертой главе исследованы теоретические основы анализа и синтеза в построении СППР. В общем случае СППР может быть представлена в виде кортежа

где Р - математическая проблема; 5 - определение системы; 2 - определение целей системы; К - множество критериев эффективности системы; 8Н - множество шкал измерений критериев; О - способ исследования системы; М - методы моделирования системы; А - множество альтернатив; Г - отображение множества альтернатив на множестве критериев; С - система предпочтений лица, принимающего решение (ЛПР); и - вид целевой функции; V - универсальное множество; IV - решающее правило, отображающее систему предпочтений. Приведена общая функциональная схема СППР (рис. 1).

Естественно, было бы ошибочным механически переносить принципы системного подхода к разработке технических СППР на создание медицинских СППР, большинство подсистем которых являются биологическими объектами, принципиально отличающимися от технических систем по ряду признаков.

Экспорт no

lipidlMIIIIO решений If niKI.'Iintfll'CKOMy

планированию

Системный анл.чмтмк

Иссле/ionaiivni

Опрел елейне II формулирование проблемы

Определенно проблема шкн

Aiuimvi структуры проблематики

Иолсносмп илентнфн-кшши (мтт tvpnuin) состояния срсям

II Л01.СК1Л

уирли.юния

Вит

моделей

ЗКП110МИ-

данпм* ■ЧССК»*»

и fía «а ')кспсрт-Ш.1Й модуль техни-

-ftiaMM íí <>г. oñi.ükit? О i» ческих. Vl>llllî|/llr Ill.fX.

уПрЯП-ЛСНИЯ ТСХПОЛГ)- гичсскич

Рис. \. Общая функциональная схема СППР

При построении медицинских СППР необходимо учитывать следующие специфические особенности:

- человеческий организм в высшей степени сложная функциональная система, о которой мы все же знаем мало. Из-за недостатка информации медицинские знания обладают весьма сложной структурой, что затрудняет их форматизацию;

- болезни подвержены естественной изменчивости и, как правило, медицинские задачи являются слабоструктурированными или неструктурированными проблемами;

- не разработаны гибкие и легко используемые компьютерные методы машинного представления медицинских знаний, а также отсутствует формализация процедуры принятия решений;

- системы диагностического кодирования становятся в настоящее время более универсальными, но детальная номенклатура признаков и симптомов, форматы для регистрации данных, а также организация записей определяются индивидуально;

- отсутствует стандартизация в терминологии, формате, шкалах измерения медицинских данных;

- между больными, страдающими одним заболеванием, много общего, но каждый из них глубоко индивидуален;

- принятие решений в медицине непосредственно связано со здоровьем человека, поэтому решения, полученные в медицинской СППР, должны быть максимально достоверными.

По-видимому, в медицинских системах принятия решений должны преобладать вероятностно-статистические методы, позволяющие посредством доверительных интервалов, уровней значимости статистических гипотез, апостериорных вероятностей оценивать достоверность полученных решений.

Процесс принятия медицинских решений можно представить в виде цикла, состоящего из последовательных, следующих друг за другом про-

цедур. Первые три процедуры реализуют сбор, обработку и анализ медицинской информации. Четвертая процедура — это поддержка принятия решения, включающая концептуальное или математическое моделирование, выработку альтернатив и выбор тех, которые в наибольшей степени удовлетворяют поставленным целям, что применительно к медицине означает выбор в конечном итоге оптимального пути лечения больного. Пятая и шестая процедуры включают выбор совокупности наиболее эффективных медицинских мероприятий и их реализацию. После чего цикл замыкается и начинается вновь сбор информации и т. д. Вторая и третья процедуры появились, по-видимому, с зарождением медицины как науки. Можно лишь говорить о совершенствовании этих процедур.

Современные информационные средства сбора и обработки информации позволяют хранить и за считанные секунды обрабатывать данные практически любого объема. Алгоритмизация с последующей компьютеризацией третьей процедуры - анализа уже накопленной медицинской информации и лежит в основе разработки и создания СППР.

На примере системы для идентификации степени тяжести состояния больных или вида заболевания построение медицинских СППР представлено как многошаговый процесс, изображенный «а рис. 2 в виде ГОЕРО-диаграммы.

Первый этап - анализ проблемы - включает осмысливание медицинской проблемы, связанной с некоторым заболеванием, ее структуризацию, изучение взаимосвязи с другими болезнями, оценку полноты и достоверности информации по данной проблеме, создание базы данных информационных ресурсов.

Второй этап - выявление скрытых медицинских знании посредством современных технологий анализа данных. На данном этапе предполагается поиск и выявление определенных закономерностей в хаосе случайных данных, выделение установившихся связей в них. Многие известные знания окружающего мира получены путем анализа накопленных человечеством данных. После статистического обнаружения зависимостей в данных

определяется рациональное объяснение в форме знаний об окружающем мире. Данный этап наиболее важный для медицины, гак как в процессе лечебной деятельности накапливаются огромные массивы данных, в которых содержится скрытая информация.

Рис. 2. Функциональная диаграмма создаиия СППР

Третий этап - формулирование целей и задач — предполагает определение глобальной цели - излечение больного от конкретного заболевания или совокупности заболеваний, выработку целей и задач предполагаемых медицинских мероприятий для достижения глобальной цели. Например, определение принципиальной возможности полного или частичного излечения больного, концептуальная разработка способа лечения данного заболевания, оценка других вариантов лечения больного и т. д.

Четвертый этап - определение критериев - формирует условия, в соответствии с которыми можно произвести разделение больных на группы однородности по тяжести состояния.

Пятый этап - формирование множества альтернатив - групп однородности больных по степени тяжести заболевания, диагнозу, видам заболевания и т. д.

Шестой этап - анализ альтернатив - определяет принадлежность больного к той или иной группе однородности. Данный этап является наиболее важным, так как он является завершающим в процедуре поддержки принятия врачебных решений и состоит в оптимизации вариантов решений (альтернатив) с выбором наилучшей из множества сгенерированных.

Ряд положений показывают целесообразность использования вероятностно-статистических методов в медицинских исследованиях:

- медицинские данные в большинстве случаев не являются точными, поэтому мы вправе считать их случайными величинами, подчиненными определенным законам распределения;

- на состояние больного воздействует большое количество факторов, имеющих случайный характер;

- прогноз состояния больного может быть только вероятностным или неопределенным.

До настоящего времени существенным недостатком вероятностно-статистических методов была чрезвычайно высокая трудоемкость и громоздкость вычислений при их практической реализации. С появлением мощных статистических пакетов, способных анализировать данные, строить сложные вероятностно-статистические модели для формализации слабоструктурированных медицинских проблем и выявления новых медицинских знаний значительно возросла их пригодность при решении прикладных медицинских задач, в том числе и при создании СППР. В то же время существующие СУБД позволяют хранить, структурировать и представлять в удобном для пользователя виде данные практически любой размерности.

Предлагаемая в работе методология заключается в применении методов системного анализа, современных технологий статистического моделирования, хранения и представления данных при построении СППР. Перспективное направление создания СППР - интеграция двух информационных систем - статистических ППП и СУБД. Интеграция обеспечит автома-

тизацию передачи данных по команде пользователя из СУБД (например, из ЭИБ) в ППП для проведения необходимых расчетов, и обратно из ППП в СУБД, но уже с дополнительной информацией, полученной в процессе проведенного статистического анализа. Объединение ППП и баз данных; в единую систему приведет к существенному возрастанию эффективности их совместной деятельности.

При построении СППР придерживались следующих положений:

- СУБД должна быть связана с ППП таким образом, чтобы импорт и экспорт данных осуществлялся с наименьшими трудозатратами и в максимально короткий промежуток времени;

- СППР должна быть простой и иметь интуитивно понятный интерфейс для врача - неискушенного пользователя ПК;

- СППР должна функционировать на базе доступного программного обеспечения.

При разработке СППР в качестве статистического пакета использовали ППП STA TISTICA, а базы данных - СУБД MS Access.

Функциональная модель СППР состоит из подсистемы данных, подсистемы свят, подсистемы обновления базы данных, подсистемы файла макроса.

Подсистема данных предназначена для хранения таблиц данных в ППП STATISTICA, СУБД и проведения требуемых расчетов для решения задачи идентификации тяжести состояния больного. Изначальные таблицы данных - до начала работы системы, представляют собой обучающие выборки, по которым решается задача классификации «нового» больного относительно его принадлежности к той или иной группе по степени тяжести состояния. По мере проведения расчетов и идентификации степени тяжести состояния больных, таблицы по желанию пользователя, могут расширяться за счет добавления новых строк, соответствующих новым больным, степень тяжести состояния которых, установили.

Подсистема связи с помощью файлов запросов обеспечивает импорт данных, характеризующих состояние больного, из СУБД в Г1ПП ЗТАТ1Я-

TICA для идентификации степени тяжести его состояния и экспорт этих же данных обратно в СУБД, но уже с результатом идентификации.

Подсистема обновления базы данных предназначена для автоматизации передачи данных из таблицы СУБД в таблицу ПГ1Г1 STATISTICA для проведения расчетов.

Подсистема файла макроса посредством модулей ППГ1 STATISTICA решает задачу классификационного анализа - идентификацию степени тяжести состояния больного.

По методам классификационного анализа - дискримннантного анализа, общих моделей дискриминатного анализа, деревьев классификации были разработаны программные продукты для идентификации степени тяжести состояния больных, страдающих хронической сердечной недостаточностью, нефроптозом, лептоспирозом. Разработанные программные продукты были объединены в модули, соответствующие заболеваниям, и вошли в состав блока программного обеспечения (БПО). Схема алгоритма СГ1ПР приведена на рис. 3 (см. с.26)

В пятой главе на примере некоторых заболеваний изложена технология решения задачи классификации объектов посредством современных методов вероятностно-статистического моделирования (рис. 4). Применяя широкий спектр многомерных и углубленных методов анализа данных в среде статистических пакетов можно решить задачу классификации объектов любой природы. Применительно к медицине в качестве объектов могут быть сами больные, виды заболеваний, медицинский персонал и т. д. Предлагаемая технология состоит в последовательном применении методов статистического анализа данных для изучения вероятностной природы данных, методов логико-алгебро-геометрического направления для исследования геометрической природы данных - выявления новых закономерностей, скрытых знаний.

Определетаи- 1р)тты однородности объектов

1. Классический дискриминангный анализ.

2. Об1Ще модели р^скримиштното анализа.

3. Деревья классификации.

Р.пделегагс объектов т гр \ипы одидеодгогти

1. Кластерный анализ

Рис. 4. Технология решения задачи классификации объектов

Выявленные знания при помощи методов классификационного анализа позволят решить задачу разделения объектов на группы однородности по совокупности наиболее значимых признаков с последующей классификацией новых объектов - определением их принадлежности к той или иной группе однородности. По-существу данная технология предполагает использование современных статистических методов анализа данных в качестве инструментария поиска и выявления новых знаний, которые могут быть использованы для построения СППР.

Посредством указанной технологии формализованы слабоструктурированные проблемы идентификации тяжести состояния больных, страдающих хронической сердечной недостаточностью, нефроптозом, лептос-пирозом.

Анализ медицинских данных указанных заболеваний методами многомерного и углубленного анализа данных позволил выявить новые медицинские знания, которые были использованы при построении СППР.

Для больных лептослирозом факторным анализом клинико-лабораторных показателей для первых трех недель заболевания выделено по три латентных фактора, достаточно полно описывающих состояние больных:

- на 1-й неделе заболевания: фактор I - синдром интоксикации, фактор 2 - синдром органной дисфункции, фактор 3 - синдром неспецифической адаптационной реакции;

- на 2-й неделе заболевания: фактор I - синдром эндогенной интоксикации и органной дисфункции, фактор 2 - синдром воспалительной реакции периферической крови, фактор 3 - синдром водно-электролитных нарушений;

- на 3-й неделе заболевания: фактор I - синдром органных и метаболических нарушений, фактор 2 - синдром диспротеинемии, фактор 3 -синдром воспалительной реакции периферической крови.

Количественно оценены вклады факторов в описании состояния больных. Построены модели факторов как линейные функции от наиболее информативных клинико-лабораторных показателей. Это - лимфоциты (X]), лейкоцитарный индекс (Х2), кровяно-клеточный показатель (X;), крещу пиши плазмы (Х4), кчубочтвая фильтрация (ЛУ, концентрационный индекс (Хб), канальцевая реабсорбция (Х7), среднемолекулярные пептиды (Х^, индекс интоксикации Грннепа (Ху), эффективная концентрация альбумина (Хм), глобулины альфа (Хц), глобулины бета (Хц), глобулины гамма (Хц).

Коэффициенты модели определяют величину и направление вклада показателей в факторы.

Для первой, наиболее важной недели заболевания, модели факторов имеют вид:

Фактор,, = р, X, + р2 Л 2 + Р3 Л'.« + Ра Х4 + А А'., + Д, Л'Л + р7Х7 + р„ X* + р,Х9 + р,0 Х,„ + р„ Хц + р,2 Хц + рп Хп. (1)

где значения коэффициентов Д. для каждого фактора принимают определенные значения (табл. 1).

Значения коэффициентов линейной модели Таблица 1

/ В, в2 Вз В, В} В« В 7 в» В, Вт ВЦ В12 Вц ~о7оТ

I 0,06 0,04 0.01 0.38 -0,1 -0,24 -0,18 0,1 0,07 -0,06 -0,00 0,02

2 0.12 -0,03 0,02 0,08 0,02 0,04 0,021 -0,004 -0,01 -0,02 0,26 0,45 0,31

3 -1,1 0,05 0,02 -0,18 0,01 0,05 0,03 -0,01 0,0 0,03 0,03 -0,13 -0,00

Каноническим анализом выявлена сильная зависимость между показателями синдрома интоксикации и показателями гематологического синдрома. Синдром интоксикации включает показатели, характеризующие степень интоксикации организма больного: креатинин плазмы, клубочковая фильтрация, концентрационный индекс, канальцевая реабсорбция, средне-молекулярные пептиды, индекс интоксикации Гринева, эффективная концентрация альбумина. Гематологический синдром включает показатели,

характеризующие изменение состава крови: эритроциты (У/), ге-моглобнн(У2), тромбоциты (У3), лейкоциты (У4), лейкоцитарная формула -миелоциты (Уц), оозинофилы (Уг,), юные (Уу), палочкоядерные нейтрофилы (Ун), сегментоядерные нейтрофилы (У9), лимфоциты (Ущ), моноциты (Уи), плазматические клетки (Уп), СОЭ (У,3)- Построены модели канонических переменных (Корень /.., Корень /„) для указанных синдромов:

Корень I, = 0,0334,\; - 0,2882Л'Л - 0,015Х6-0,497Х7 + 0,0406Л'Л + 0,42Л'Р + 0,2152Х,0 (2)

Корень /„= -0,0732^ + 0,1008^- 0,2601 У3 + 0,1868^.-0,1658У,-0,1263 У6 - 0,0053^7 + 0,1959 Гл.-0,3288^ - 0,448Г;„-0,117К„ + 0,053Уп + 0,2334 У,3 (3)

Каноническая корреляция Л - корреляция между каноническими переменными (Корень /„ и Корень /.,) равна 0,786, что характеризует степень взаимосвязи между показателями синдромов как сильную.

Методом моделирование структурными уравнениями построена причинная модель и выявлена взаимосвязь между тяжестью заболевания (У) и факторами макроорганизма (X/) и микроорганизмов (X}) больных лептос-пирозом. При этом факторы макроорганизма и микроорганизма, тяжесть течения заболевания являются латентными переменными, значения которых неизвестны. Переменная тяжесть заболевания характеризует состояние больного. Переменная фактор микроорганизма, включает в себя все свойства, позволяющие лептоспирам уклоняться от защитных сил человеческого организма. Переменная фактор макроорганизм, включает в себя все свойства организма заболевшего, способствующие развитию заболевания, -нарушения иммунного статуса организма, наличие сопутствующих заболеваний, вредных привычек, возраст и т. д.

Регрессионные модели, связывающие между собой латентные переменные тяжесть заболевания, фактор микроорганизма, фактор макроорганизма имеют следующий вид:

Из приведенных уравнений следует, что факторы макроорганизма в значительно большей степени влияют на состояние больного, чем факторы микроорганизма (активность, проникающая способность лептоспир и т. д.). Полученный результат не противоречит данным практической медицины -больные, инфицированные лептоспирами в одно и то же время, в одном и том же месте, имеют различные степени тяжести заболевания.

Для больных пефроптозом посредством моделей кластерного анализа по клинико-лабораторным показателям [отношению максимумов накопления радиофармпрепарата (Лом), времени полувыведет/я радиофармпрепарата Т¡/¡у анакроты ( ), катакроты (/ ), реографического коэффициента (РК), дикротического индекса (ЛИ), диастолосистолическго индекса (ДСП)) проведено успешное разделение больных нефроптозом на кластеры - группы однородности. Причем эти кластеры в большей степени соответствуют разделению больных на группы по степени вращения почек, чем по традиционному делению больных на группы по степени опущения почек.

Дисперсионным анализом подтверждены результаты исследований, полученных кластерным анализом для больных нефроптозом. Установлено различие средних значений клинико-лабораторных показателей в трех группах по степени опущения - Ст.ОП.1, Ст.ОП.2, Ст.ОП.З и ротации -Ст.УР. 1, Ст.УР.2, Ст.УР.З почек. Причем в группах по степени ротации почек это различие более выражено, т. е., установлена зависимость между величинами указанных показателей и степенью опущения и ротации почек.

У = 1,351-X,- 0,009. V = 40-Хг - 0.68.

(4)

(5)

Анализ соответствии данных больных нефролтозом выявил определенные закономерности взаимосвязи между опущением и ротацией почек, а именно между степенью опущения и ротацией существует тесная взаимосвязь, но эта взаимосвязь не носит характер прямой зависимости, т. е. большей степени опущения не соответствует большая стецець ротации-Ачтщ соответствии позволил группы больных представить 0 РИДР точек на плоскости (рис. 5), где максимально точно воспроизведено сходство и различие между этими группами.

0.015

К ®

X

5 0,010 £

а

§ 0,005 ю

8

0

•Г 0.000 у

(О X

§ -0.005

N Ф

1 -0,010 а

£

-°'015,,0 -0,8 -0,6 -0,4 -0.2 0,0 ОД 0,4 0,6 0,8 1,0 °

13 коорд.стп.

Измерение 1; Соб. знач.: ,49129 (99,99 % инерции) Рис. 5. График двумерной диаграммы групп больных

Сходство между одноименными группами больных тем больше, чем меньше расстояние между ними на диаграмме. Так, например, больше сходства между группами больных со 2-й (Ст.ОП.2) и 3-й (Ст.ОП.З) степенью опущения, чем между группами с 1-й (Ст.ОП.1) и 2-й степенью опущения. Сходство между разноименными группами определяется по величине угла между прямыми, проведенными из центра тяжести (0,0) к точкам на диаграмме, обозначающим группы больных. Острый и тупой угол означают соответственно сходство и различие между группами.

2М график координатстрок и столбцов; измерения: 1x2 Таблица ввода (Стр,х Столб.): 3x3 Стандартизация: Профили строк и столбцов

Ст.ОП.З о

Ст.УР.1 о Ст.УР.З п

Ст.ОП.1 о, Ст.УР.2 а Ст.ОП.2 о

Из диаграммы следует, что больным из подгруппы Ст.ОП.1 соответствует больший процент больных, принадлежащих подгруппе Ст.УР.1 (сходство), а больным из подгруппы Ст.ОП.2 соответствует значительно больший процент больных, принадлежащих подгруппе Ст.УР.З (сходство), чем процент больрых, принадлежащих к подгруппе Ст-УР.2 (различие).

Таким образом, мы получили важный для медицины вывод, что наибольшей ротации почек в большей степени способствует 2-я степень опущения, чем 3-я. Применительно к разделению больных на группы однородности по тяжести состояния приведенные результаты говорят о необходимости использования в качестве критерия степень ротации почек, а не традиционно используемое опущение почек.

Приведены результаты использования методов классификационного анализа для определения степени тяжести состояния больных указанных заболеваний.

Для больных хронической сердечной недостаточностью (ХСН) применение моделей дискриминаштюго и кластерного анализа позволило:

- выделить наиболее информативные клинико-лабораторные показатели, по которым можно классифицировать больных на группы по степени тяжести заболевания - функциональные классы хронической сердечной недостаточности (ФКХСИ)', это слабость (Х:), одышка (Х2), конечный систолический размер левого желудочка (X}), конечный дпастолнческнй размер левого желудочка (Х4), конечный днастолический размер левого предсердия (А'(), диастолическое артериальное давление (Х6);

- уточнить границы 6-мин. теста для оценки степени тяжести состояния больных;

- построить линейные модели классификационных функций, позволяющих определять ФКХСН больных по выделенным клинико-лабораторным показателям:

Класс, = В„+Р,Х, + р2ХТ+ Рз А'., + р4 Х4 + Р,Х, + Ре ХЙ (6)

где параметры Д принимают определенные значения для каждого функционального класса (табл. 2).

Значения коэффициентов классификационных уравнений Таблица 2

/■ В, Р> А Д. % Р> Ра

/ -276,62 4,33 23,174 -2,49 53,86 40,07 1,58

2 -341,9 5,34 28,36 -1,97 59,954 43,85 1,75

3 -409,36 6.55 34,39 1,37 63,75 46,67 1,99

4 -481,84 7,69 39,35 -1,23 69,69 50,99 2,05

5 -583,57 8,81 44,49 1,13 73,73 57,98 2,19

Решена задача определения степени тяжести больных хронической сердечной недостаточностью непараметрическим методом классификационного анализа - общие модели дискримииатного анализа.

Для больных нефроптозом днекриминантный анализ позволил:

- показать преимущества классификации больных по степени ротации почек перед традиционной классификацией по величине опущения почек;

- выделить статистически значимые параметры, определяющие принадлежность больных к группам; это показатели накопления и времени по-лувыведепия роднофармпрепарата в обеих почках, реографический коэффициент, диастолосистолический индекс:

- по выделенным клинико-лабораторным показателям классифицировать больных на три группы по степени гемодинамических нарушений почки: группа 1 - сумма углов ротации меньше 40°, группа 2 - от 40° до 70° и группа 3 - от 70° и выше;

- построить линейные модели классификационных функций, позволяющих определить степень тяжести состояния больных.

Для больных лептоспирозом дискриминаитным анализом определены наиболее информативные в описании состояния больных показатели,

оценен их вклад в идентификацию состояния больных для первых трех недель заболевания. Для первой недели заболевания - каналы/евая реабсорб-ция, лактатдегидродеиаза, аспартатаминатраисфераза, гематокрнт, хлориды, диастаза, креатинии мочи, клубочковая фильтрация, глюкоза крови. Для второй недели заболевания - клубочковая фильтрация, каиаль-цевая реабсорбция, креатинии мочи, минутный диурез, гематокрнт. Для третьей недели - триглицериды, хлориды, Ь-ттротеиды. Выявленные закономерности позволили построить систему классификационных уравнений и решить задачу определения степени тяжести состояния больных для каждой из первых трех недель заболевания.

Методом деревья классификации построены адекватные модели и решающие правила для идентификации состояния больных, страдающих нефроптозом, лептоспирозом, хронической сердечной недостаточностью. Критериями качества бинарного дерева классификации являются: количество ошибок классификации на обучающей выборке, соотношение и значение цен кросс-проверки и глобальной кросс-проверки, количество терминальных вершин. Например, для больных нефроптозом «наилучшее» дерево удалось построить при следующих установках: метод ветвления - полный перебор вариантов для одномерных ветвлений по методу C&RT, критерий согласия - мера Джини; априорные вероятности - оцениваемые; цепы ошибок классификации - равные; правило остановки - прямая остановка (Fací); условия остановки - доля неклассифицированных - не более чем 0,03. Приведен граф структуры дерева классификации (рис.6). По значимости в процедуре классификации клинико-лабораторные показатели распределились следующим образом - время накопления радиофармпрепарата, дчастолосистолический индекс, реографическнй коэффициент, время полувыведения радиофармпрепарата. Решающие правила представлены в виде неравенств.

Рис. 6. Граф дерева классификации

В шестой главе описана разработанная СППР, которая представляет компьютерную программу СИТСБ, написанную в соответствии с алгоритмом на рис. 3 в STATISTIC A VISUAL BASIC (SVB) и в среде программирования СУБД MS ACCESS.

Описан блок программного обеспечения СПЛР, состоящий из программных модулей (DIXCH, ODAXCH, DITREEAN, SIAR, TREENEF, DI-LEPTS, TREELEPTS), в которых реализованы методы классификационного анализа.

Работа программы начинается с Главной формы, которая загружается при открытии БД. Гчавкая форма является связующей и из нее, по нажатию соответствующих кнопок, открываются остальные формы. Интерфейс прост и не требует особых усилий со стороны пользователя, чтобы приобрести навыки работы. Для идентификации состояния больного, кли-нико-лабораторные показатели которого предварительно введены в базу

данных, по команде пользователя данные импортируются в ППП ЯТЛТ/З-Т1С.А. Далее при помощи макроса решается задача классификационного анализа методами, указанными пользователем. После завершения работы макроса результат классификации по желанию пользователя может быть сохранен п соответствующем файле 6'ТАТ18Т1СА и подготовлен для выгрузки в файл внешнего приложения для последующего экспорта Р базу данных. Система экспортирует и сохранит результат идентификации степени тяжести состояния больного в соответствующей данному заболеванию таблице СУБД.

СППР построена таким образом, что идентификация степени тяжести состояния больных может быть проведена для любого заболевания, если предварительно выполнена статистическая обработка данных, построена обучающая выборка, созданы макросы методов классификации. Приведен пример реализации разработанной медицинской СППР - программы СИТСБ для определения степени тяжести состояния больной, страдающей хронической сердечной недостаточностью.

По тестовой выборке больных, страдающих хронической сердечной недостаточностью, проведена сравнительная оценка эффективности методов классификационного анализа, использованных в разработанной СППР, -дискриминантного анализа, общих моделей дискриминантного анализа, деревьев классификации и врачебной оценки тяжести заболевания. Результаты классификации сравнивали с оценкой тяжести состояния по б-мин. тесту. Проценты совпадений классификации указанными методами с классификацией по б-мин. тесту соответственно составили 85 %, 85 %, 45 %, 75 %. Время, затраченное врачом на оценку тяжести состояния больного, составило не менее 30 мин., а время на идентификацию тяжести состояния программой СИТСБ всеми тремя методами классификационного анализа - не более двух мин. Таким образом, показано, что наиболее точными являются оба метода дискриминантного анализа, далее врачебная оценка и наименее точным - деревья классификации.

В заключении приведены основные результаты и выводы диссертационной работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Определены ключевые проблемы информатизации в медицине. Исследованы прикладные и теоретические аспекты системного анализа в построении современных медицинских информационных систем. Обоснована необходимость в разработке и внедрении медицинских СППР. Рассмотрены различные направления в создании СППР.

2. Разработанные методологические положения использования современных технологий вероятностно-статистического моделирования, представления и хранения данных для построения эффективных медицинских СППР позволили формализовать процедуру разработки СППР для оценки тяжести состояния больных. Основные этапы построения СППР представлены в виде ГОЕРО-диаграммы. Построен алгоритм СППР.

3. Предложена технология решения задачи классификации объектов посредством современных технологий статистического анализа данных. Методами многомерного анализа формализованы слабоструктурированные проблемы идентификации тяжести состояния больных, страдающих хронической сердечной недостаточностью, лептоспирозом, нефроптозом. Выявлены новые закономерности в течении данных заболеваний. Определены наиболее информативные клинико-лабораторные показатели в оценке состояния больных, исследован характер взаимосвязи между ними, проведен анализ групп однородности больных, построены процедуры классификации больных по группам однородности и т. д. Полученные новые медицинские знания использованы при создании СППР.

4. На основе рассмотренных в работе теоретических и методологических положений разработана эффективная СППР для идентификации степени тяжести состояния больных в виде компьютерной программы

СИТСБ. В среде пакета STATISTICA разработан блок математического обеспечения программы СИТСБ, состоящий из макросов модулей классификационного анализа: классического дискриминантного анализа, общих моделей дискриминантного анализа, деревьев классификации.

5. СППР - программа СИТСБ предназначена для идентификации тяжести состояния больных, страдающих хронической сердечной недостаточностью, нефроптозом, лептоспирозом. Показана эффективность построенной СППР на примере группы больных, страдающих хронической сердечной недостаточностью. Возможна адаптация системы для диагностирования видов заболеваний, идентификации тяжести состояния больных, страдающих различными заболеваниями. СППР может функционировать автономно, при наличии электронной базы данных больных, также может быть встроена в МИС как подсистема, имеет простой и удобный интерфейс и практически не требует от пользователя знаний современных информационных технологий.

6. На примере медицины, как предметной области, показана состоятельность предложенной в работе методологии анализа и синтеза СППР с возможностью получения и использования новых скрытых знаний в построении эффективных систем поддержки принятия решений в различных сферах практической, исследовательской, образовательной деятельности человека.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Монографии и учебники

1. Халафяи A.A. STATISTICA 6. Статистический анализ данных: Учебник,- М:. Бином, 2007. 512 с.

2. Халафяи A.A. Современные статистические методы медицинских исследований. Монография. - М.: ЖИ (URSS). 2008. 320 с.

3. Халафян A.A. STATISTICA 6. Статистический анализ данных: Учебник. Второе издание. - М.: Бином, 2009. 528 с.

4. Сштиков B.C., Халафян A.A. Системный анализ и современные информационные технологии в медицинских системах поддержки принятия решений. Монография, - М.: Бином, 2009,362 с.

5. Халафян A.A. STATISTICA 6. Математическая статистика с элементами теории вероятностей: Учебник. - М.: Бином, 2010. 496 с.

Издания, входящие в перечень, рекомендованный ВАК для опубликования основных научных результатов диссертаций

1. Лгаджанян Н.И., Архипеяко Ю.В., Степанов O.P. и др. Статистический анализ защитного эффекта гиперкапнии на повреждающее действие слизистой желудка, вызываемое острой гипоксией / И.И. Лгаджанян, Ю.В. Лрхипенко, О.Г. Степанов, A.A. Халафян, КМ. Горшкова // Экологический вестник научных центров Черноморского экономического сотрудничества. 2004. № 2. С. 32-37.

2. Татевосян A.C., Тоняи А.Г., Халафян A.A. и др. Патогенетические критерии подвижной почки // Урология. 2004. № 6. С. 9-15.

3. Елисеева J1.H., Халафян A.A., Сафонова С.Г. Применение методов классификационного анализа для определения функционального класса хронической сердечной недостаточности больных, страдающих ишемиче-ской болезнью сердца // Экологический вестник научных центров Черноморского экономического сотрудничества. 2005. № 3. С. 79-83.

4. Татевосян A.C., Тоняи А.Г, Халафян A.A. и др. Классификационный анализ в способе лечения нефроптоза / A.C. Татевосян, А.Г. Тонян, A.A. Халафян, А. Б. Ополъский, M.IT. Щербина, A.A. Татевосян, В.А. Ульянов, К.Г., Султанов // Кубанский научный медицинский вестник. 2005. № 5-6. С. 121-124.

5. Татевосян A.C., Тонян А.Г., Халафян A.A. и др. Статистический анализ критериев оценки патологически подвижной почки / A.C. Татевосян, А.Г. Тонян, A.A. Халафян, М.В. Шарпан // Экологический вестник научных центров Черноморского экономического сотрудничества. 2005. № 1.С. 85-91,

6. Халафян A.A., Грродин Ii.II,, СавенкаД.В. Идентификация состояния больных лептоспирозом посредством факторного и дискриминантного анализов // Известия высших учебных заведений. Северокавказский регион. Естественные науки. 2008. № КС. 127-129.

7. Халафян A.A., Городии В.Н. Моделирование и анализ времени жизни больных лептоспирозом // Известия высших учебных заведений. Северокавказский регион. Естественные науки. 2008. № 2. С. 123-126.

8. Халафян A.A., Тонян Л.Г. Анализ соответствий углов ротации и степени опущения почек у больных нефроптозом // Известия высших учебных заведений. Севсрокавказский регион. Естественные науки. 2008. № 3. С. 103-105.

9. Симанков B.C. Халафян A.A. С.авенко Д.В. Система поддержки принятия решений - как результат интеграции статистических пакетов и баз данных // Вестник компьютерных и информационных технологий. 2009. № 6. С. 38-44.

10. Симанков B.C. Халафян A.A. Системный подход к разработке медицинских систем поддержки принятия решений // Известия высших учебных заведений. Северокавказский регион. Технические науки. 2010. № 1. С. 29-36.

Другие издания и материалы научных конференции

1. Акопова C.B., Халафян A.A., Шарпан М.В. Дискриминантный анализ психофизиологического подхода в рассмотрении функциональных состояний здоровья // Современное состояние и приоритеты развития

фундаментальных наук в регионах: тез. докл. Всерос. науч. конф. молодых ученых и студентов. - Краснодар, 2004. С. 144-145.

2. Лызь E.H., Елисеева Л. Н„ Онищенко H.H. и др. Особенности поражения сердечно-сосудистой системы у ликвидаторов аварии на ЧАЭС / E.H. Лызь, Л.Н. Елисеева, НИ. Оишцеико, Г.А. Пиховкина, A.A. Халафян // Профессия и здоровье: матер. III Всерос. конгресса. - M., 2004. С. 514-515.

3. Акопова C.B., Халафян A.A., Шарпан М.В. Классификационный анализ функциональных состояний человека // Социальная психология XXI столетия: матер, междунар. конгресса. Т. 1. - Ярославль, 2004. С. 38-44.

4. Халаф>яи A.A., Татевосян A.C., Тоняи А.Г. и др. Использование классификационного анализа для определения стратегии лечения урологических больных / A.A. Халафян, A.C. Татевосян, А.Г. Тоняи, М.В. Шарпан: материалы П-й школы-семинара. - Краснодар. Экологический вестник научных центров Черноморского экономического сотрудничества. Приложение. Математическое моделирование, вычислительная механика и геофизика. 2004. С. 172-174.

5. Елисеева Л.Н., Халафян A.A., Сафонова С.Г. Статистическое моделирование функционального состояния при хронической сердечной недостаточности у больных ишемической болезнью сердца // Успехи современного естествознания. 2005. № 9. С. 20-23.

6. Халафян A.A., Савенко Д.В., Городин В.И. Применение методов классификационного анализа для оценки состояния больных лептоспирозом: тез. докл. XIII школы-коллоквиума по стохастическим методам и VII Всероссийского симпозиума по прикладной и промышленной математике. - Йошкар-Ола. Обозрение прикл. и пром. мат. 2006. 14. № 2. С. 359-360.

7. Халафян A.A., Савенко Д.В., Елисеева Л.Н. и др. Линейная регрессионная модель оценки тяжести хронической сердечной недостаточности / А.А Халафян, Д.В. Савенко, Л.Н. Елисеева, С.Г. Сафюнова: тез. докл. XIII

школы-коллоквиума по стохастическим методам и VII Всероссийского симпозиума по прикладной и промышленной математике. - Йошкар-Ола. Обозрение прикл. и пром. мат. 2006. 14. № 2. С. 360.

8. Кпнсее/ia JI.H., Халафян Л.Л., Сафонова С.Г. Классификация больных, страдающих хронической сердечной недостаточностью, методом «Деревья классификации» // Успехи современного естествознания. 2006. № П. С. 16-18.

9. Халафян A.A., Кольцов A.A. Пакеты прикладных программ как средство повышения эффективности и качества образовательного процесса в высшей школе // Образование, наука и экономика в вузах. Интеграция в международное образовательное пространство: мат. междунар. науч.-практ. конф. - Плоцк (Польша), 2006. С. 200-202.

10. Халафян A.A. О возможности создания программ, диагностирующих состояние больных в среде ППП STATISTICA: тез. докл. III Международной научно-практической конференции «Высокие технологии, фундаментальные и прикладные исследования, образование». - СПб, 2007. С. 39.

11. Халафян A.A., Городин H.H. Структурное моделирование в исследовании лептоспироза // Экологическая и экономическая безопасность. Проблемы и пути решения: матер. XII Международной конференции. -Шепси, 2007. С. 226-228.

12.Халафян A.A., Городин В.Н. Модели прогнозирования заболеваемости лептоспирозом в г. Краснодаре // Экологическая и экономическая безопасность. Проблемы и пути решения: матер, докл. XII Международной конференции. - Шепси, 2007. С. 228-230.

13.Халафян A.A. Современные статистические методы анализа медицинских данных: тез. докл. XXVII Российской школы по проблемам науки и технологий, посвященной 150-летию К.Э. Циолковского, 100-летию С.П. Королева и 60-летию Государственного ракетного центра «КБ им. Академика В.П. Макеева», - Миасс, 2007. С. 126.

14. Городип H.H., Хшшфян A.A. Анализ времен жизни больных леп-тоспирозом // Актуальные вопросы инфекционной патологии Юга России: мат. докл. Ill Южиороссийской научно-практической конференции с международным участием. - Ростов-на-Дону-Краснодар-Сочи, 2008. С. 43-44.

15, Халафяп A.A., Городип В,И, Возможности системного анализа в медицине // Актуальные вопросы инфекционной пзто-логин Юга России: мат. докл. III Южнороссийской научно-практической конференции с международным участием. - Рос-тов-на-Дону-Краснодар-Сочи, 2008. С. 189-190.

Свидетельства о регистрации программ

1. Елисеева Л.Н., Халафяп A.A., Сафонова С.Г. Определение функционального класса хронической сердечной недостаточности у больных, страдающих ишемической болезнью сердца: свидетельство об официальной регистрации программы для ЭВМ № 20066101235.ФИПС. Зарегистрировано 10.01.06.

2. Халафяп A.A., Попова М.В. Определение степени гемодинамиче-ских нарушений патологически подвижной почки (SIAR): свидетельство об официальной регистрации программы для ЭВМ № 2006612737. ФИПС. Зарегистрировано 3.08.06.

3. Халафяп A.A., Саеенко Д.В., Елисеева Л.Н., Сафонова С.Г. Прогнозирование значения 6-минутного теста (DIREAN): свидетельство об официальной регистрации программы для ЭВМ № 2007610038. ФИПС. Зарегистрировано 9.01.07.

4. Халафяп A.A., Савенко Д.В., Елисеева Л.Н., Сафонова С.Г. Идентификация состояния больных хронической сердечной недостаточностью (ODAXCH): свидетельство об официальной регистрации программы для ЭВМ №. 2007612781. ФИПС. Зарегистрировано 28.06.07.

5. Халафян A.A., С.авеико Д.В.. Елисеева Л.N.. Сафонова С.Г. Определение степени тяжести хронической сердечной недостаточности (DITREEAN): свидетельство об официальной регистрации программы для ЭВМ № 2007610039, ФИГ1С. Зарегистрировано 9.01.07.

6. Халафян A.A., Савенко Д. В., Городи и II Н. Верификация состояния больных лептосцирозом (DILEPTS): свидетельство об официальной регистрации программы для ЭВМ № 2007610599. ФИПС. Зарегистрировано 7.02.07.

7. Халафян A.A., Савенко Д.В., Городин В.П. Программа для верификации состояния больных лептоспирозом // Инновации в науке и образовании (Телеграф отраслевого фонда алгоритмов и программ). 2007. № 3 (26). Март. С.38

8. Халафян A.A., Савенко Д.В., Городин H.H. Идентификация состояния больных лептоспирозом (TREELEPTS): свидетельство об официальной регистрации программы для ЭВМ №. 2007612782. ФИПС. Зарегистрировано 28.06.07.

9. Халафян A.A., Савенко Д.В., Тоняч А.Г. Определение степени ротации патологически подвижной почки (TRENEF): свидетельство об официальной регистрации программы для ЭВМ №. 2007612783. ФИПС. Зарегистрировано 28.06.07.

10.Халафян A.A., Савенко Д.В. Елисеева Л.П., Сафонова С.Г., Городин В.Н., Тонян А.Г. Идентификации состояния больных в кардиологии, урологии и инфекционных заболеваниях (ComProg): свидетельство об официальной регистрации программы для ЭВМ №. 2007614315. ФИПС.

11. Халафян A.A., Савенко Д. В., Симапков B.C. и др. Система идентификации тяжести состояния больных (СИТСБ): свидетельство об официальной регистрации программы для ЭВМ №. 2009615237. ФИПС. Зарегистрировано 22.09.09.

Подписано в печать 24.08.2010. Печать трафаретная. Формат 60x84 '/ц. Усл. печ. л. 2,7. Тираж 100 экз. Заказ № 340. Отечатано и ООО «Издательский Дом-Юг» 350072, г. Краснодар, ул. Московская 2, корп. «13», оф. В-120, тел. 8-918-41-50-571

Оглавление автор диссертации — доктора технических наук Халафян, Алексан Альбертович

ВВЕДЕНИЕ.:.L.::.:.

1. ПРОБЛЕМЫ И1 1ФОРМАТИЗАЦИИ В МЕДИЦИНЕ.

1.1. Практические аспекты разработкой внедрения^МИС

К2: Уровни и перспективы развития МИС.

1.3. рынок отечественных МИС.

Выводы по главе I4.

2'. ОСОБЕННОСТИ ПРИМЕНЕНИЯ МЕТОДОВ СИСТЕМНОГО АНАЛИЗА ПРИ ПОСТРОЕНИИ МИС.

2.1. Человеческий организм - как биологическая система.

2.2. Системный анализ в построении МИС.

2.3. Модель состава и структуры лечебного учреждения.

Выводы по главе 2.

3. СППР В МЕДИЦИНЕ КАК ВАЖНЫЙ ФАКТОР ПОВЫШЕНИЯ ЕЕ ЭФФЕКТИВНОСТИ.

3.1. Практические и теоретические предпосылки создания СППР.

3.2. Экспертные СППР.

3.3. Математическое моделирование в СППР.

3.4. Вероятностно-статистическое моделирование в СППР.

Выводы по главе 3.

4. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АНАЛИЗА И СИНТЕЗА В ПОСТРОЕНИИ СППР.

4.1. Этапы системного анализа в СППР.

4.2. Методология системного анализа в медицинских СППР.

4.3. СППР как синтез пакетов прикладных программ и баз данных.

4.4. Алгоритм СППР.

Выводы по главе 4.

5. ТЕХНОЛОГИЯ ФОРМАЛИЗАЦИИ СЛАБОСТРУКТУРИРОВАННЫХ МЕДИЦИНСКИХ ПРОБЛЕМ КЛАССИФИКАЦИИ БОЛЬНЫХ.

5.1. Методы сжатия данных.

5.1.1. Факторный анализ.

5.2. Методы исследования и построения зависимостей.

5.2.1. Канонический анализ.

5.2.2. Моделирование структурными уравнениями.

5.2.3. Дисперсионный анализ.

5.2.4. Анализ соответствий.

5.3. Методы классификационного анализа.

5.3.1. Кластерный анализ.

5.3.2. Дискриминантный анализ.

5.3.3. Общие модели дискриминантного анализа.

5.3.4. Деревья классификации.

Выводы по главе 5.

6. ПОСТРОЕНИЕ И РЕАЛИЗАЦИЯ МЕДИЦИНСКОЙ СППР.

6.1. Описание СППР.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Халафян, Алексан Альбертович

Актуальность., В^некоторых случаях при! принятии, решений мы допускаем г ошибки;. имеющие последствия различной- степени значимости. Поэтому одним, из несомненных условий успешной, деятельности^ независимо от характера или специфики, труда, является искусство принятия, правильных решений. Ошибаемся, как правило, из-за неполноты, информации об объекте управления, ограниченности временных ресурсов, или объект достаточно> сложен и нет возможности просчитать и выбрать наилучшее решение. Для принятия верных решений необходимо получить недостающую информацию, т.е. извлечь нужные знания или, использовать математические методы для выбора оптимального решения.

В настоящее время одной из основных тенденций развития общества является ее тотальная информатизация: Стремительно развиваются компьютерные технологии, способные накапливать, обрабатывать и передавать на расстояния большие объемы цифровой информации. Зачастую в массивах данных содержатся недостающие для принятия успешных решений скрытые знания, извлечь которые можно при помощи современных направлений или методов анализа данных. В более сложных случаях, целесообразно построить математическую модель и принимать решения в соответствии с результатами произведенных по модели расчетов.

Для решения этих задач и создаются специализированные информационные системы - системы поддержки принятия решений (СППР) (Decision Support System - DSS), основное предназначение которых - в формализации слабоструктурированных и неструктурированных задач планирования, прогнозирования и управления.

В отличие от разработки информационных систем, автоматизирующих хранение и обработку числовой информации, СППР являются наукоемкими, так как предполагают использование определенных научных направлений и методов анализа данных. Некоторые существующие СППР обладают рядом недостатков, например, отсутствует оценка достоверности полученного решения, принятие решений сопровождается потерей информации из-за4 перевода величин; измеренных в. шкале интервалов.или отношений, в более бедную - балльную.

Так как величины, содержащиеся' в массивах данных, в. большинстве случаев* являются» случайными, наиболее адекватны! для построения1 СППР' стохастические модели*. Особую актуальность для таких моделей приобретают методы многомерного статистического анализа, при помощи которых можно установить характер и структуру взаимосвязей между признаками исследуемого объекта. Статистические пакеты прикладных программ (ППП) существенно расширили горизонты применения вероятностно-статистических моделей, так как позволяют успешно использовать достаточно трудоемкие в реализации многомерные статистические методы и более сложные углубленные методы анализа данных для формализации, слабоструктурированных проблем. Поэтому современные технологии» статистического анализа - ППП делают вероятностно-статистические методы эффективным инструментарием как для поиска и выявления скрытых знаний, так и для создания математических моделей, которые могут быть использованы при построении СППР в.различных слабоформализуемых областях человеческой деятельности.

При внедрении информационных систем и СППР актуальной является проблема их функциональности и пригодности, которая выражается в том, что чем функциональнее система, тем она более сложна, а значит, и менее пригодна для практического применения. Для снижения остроты проблемы необходимо подойти к разработке, внедрению информационных систем и СППР с позиций системного анализа.

Существующие системы управления базами данных (СУБД) позволяют хранить, обрабатывать и предоставлять пользователю информацию в удобном для него виде. Интеграция статистических пакетов и баз данных на принципах системного анализа позволит создавать эффективные системы поддержки принятия решений различного предназначения.

Поэтому диссертационная работа, направленная на построение методологии создания СППР, которая состоит в применении технологий статистического* анализа для выявления новых скрытых знаний, интеграции современных технологий статистического моделирования, хранения.и представления данных, является актуальной.

В4диссертационной работе предпринята попытка показать состоятельность предложенной методологии на примере медицины, так. как многие статистические методы! возникли; и получили дальнейшее развитие благодаря задачам, поставленным медиками и биологами, и в медицине наиболее остро стоит проблема создания* СППР' для минимизации количества допускаемых врачебных ошибок.

Медицинская информация* имеет свою/ специфику, и увеличение ее объемов сопровождается определенными проблемами, которые обосновывают необходимость создания медицинских информационных систем (МИС). Они отличаются от экономических или технических информационных систем, что создает дополнительные сложности при их разработке и внедрении. Отличие проявляется в специфике объектов информатизации, например; системы диагностического кодирования становятся в настоящее время более универсальными, но детальная номенклатура признаков и симптомов, форматы для регистрации данных, а также организация записей определяются индивидуально; отсутствует стандартизация в терминологии, формате, шкалах измерения медицинских данных и т. д. К сожалению, отечественная медицина и здравоохранение не в полной степени соответствуют требуемому уровню информатизации. Президент РФ Дмитрий Медведев 8 июля 2010 г на заседании президентского совета по развитию информационного общества выразил озабоченность невысокими темпами внедрения электронных услуг в сферу здравоохранения. Несмотря на указанные сложности, информатизация - объективный процесс, поэтому МИС все же медленно, но эволюционируют.

Очень часто для принятия медицинских решений характерны недостаточность знаний, ограниченность временных ресурсов, отсутствие возможности привлечения компетентных экспертов, неполнота информации о состоянии больного. Указанные факторы являются причинами врачебных ошибок, которые могут привести к дальнейшей потере здоровья пациента. Поэтому наряду с разработкой МИС важной является задача создания медицинских систем-поддержки принятия решений (СППР), которые являются информационными f системами, функционирующими автономно либо» в составе МИС.

Цель. Разработка методологии анализа и синтеза медицинских СППР с возможностью получения и использования скрытых знаний.

Задачи исследования.

1. Исследовать теоретические и прикладные аспекты системного« анализа в построении информационных систем и СППР, состояние и уровень развития отечественных МИС и СППР.

2. Посредством анализа и синтеза процессов принятия управленческих решений формализовать принятие решений и построение СППР применительно к медицине.

3. Разработать методологические принципы использования современных технологий вероятностно-статистического моделирования в выявлении новых знаний. Предложить технологию решения задачи классификации объектов по группам однородности и применить для формализации слабоструктурированных медицинских проблем идентификации тяжести состояния больных.

4. На примере медицины^ показать состоятельность методологии анализа и синтеза систем принятия решений при создании эффективных СППР в различных сферах практической, исследовательской и образовательной деятельности человека, построив СППР для идентификации тяжести состояния больных.

5. Оценить эффективность разработанной СППР, применив ее для идентификации тяжести состояния больных, страдающих хронической сердечной недостаточностью.

Методы исследования. В диссертационной работе использованы методы системного анализа, теории принятия решений, теории вероятностей и математической статистики, многомерного и углубленного анализа данных в среде ППП STATISTIC А, обработки и хранения данных в СУБД MS ACCESS, создания запросов STATISTICA QUERY, программирования в STATISTICA VISUAL BASIC (SVB).

Объект исследования: медицинские информационные системы и системы поддержки принятия решений.

Предмет исследования: методология построения медицинских систем поддержки принятия решений.

Научная* новизна. В диссертацииI получены следующие основные результаты, характеризующиеся научной новизной:

1. Проведен анализ информационных систем и особенностей процессов принятия решений в медицине на основе системного подхода.

2. Разработаны теоретические положения анализа и синтеза СППР медицинского назначения с использованием современных и классических направлений анализа данных с целью извлечения скрытых знаний.

3. Разработаны методологические положения применения современных технологий вероятностно-статистического моделирования, представления и хранения данных для выявления скрытых знаний и построения эффективных медицинских СППР.

4. На основе широкого спектра методов многомерного и углубленного анализа данных предложена технология формализации слабоструктурированных проблем классификации больных на группы однородности. Для ряда заболеваний получены новые медицинские знания, которые были использованы при создании СППР.

5. На основе рассмотренных в работе теоретических и методологических положений разработан алгоритм и построена эффективная СППР для идентификации степени тяжести состояния больных.

Достоверность и обоснованность научных положений подтверждается:

- использованием системного подхода, вероятностно-статистических методов и современных информационных технологий к решению задач диссертации; сведениями из медицинской литературы; признанием результатов исследований научным сообществом;

- сравнительным анализом результатов, проведенных в диссертации исследований с известными медицинскими знаниями и практическим медицинским опытом; апробацией, и,'результатами) внедрения, разработанной-СППР'— программы СИТСБв лечебные учреждения и учебные заведения г. Краснодара.

Практическая значимость и» внедрение. На основе принципов системного анализа предложена методологияшостроения эффективных СППР, которая может быть использована, для* создания-. СППР' в различных областях практической деятельности человека.

В среде ППП БТАТШПСА на,основе различных методов5 классификационного анализа разработаны программные модули; диагностирующие степень тяжести состояния^ больных. Модули'зарегистрированы в Федеральной службе по интеллектуальной» собственности, патентам и товарным, знакам, в Отраслевом фонде алгоритмов и программ.

На основе разработанного алгоритма, выявленных новых медицинских знаний, разработанных программных модулей.построена медицинская СППР - компьютерная программа СИТСБ для определения степени тяжести состояния больных, страдающих такими заболеваниями, как хроническая» сердечная недостаточность, лептоспироз, нефроптоз.

Программа СИТСБ может быть адаптирована, для определения тяжести состояния больных, страдающих различными заболеваниями, выявления группы однородности больных, например по виду заболевания, диагнозу. Имеет простой и максимально дружественный интерфейс для пользователя, не требуется специальных знаний в области математики, статистического анализа или информационных технологий.

Программа СИТСБ зарегистрирована в Федеральной службе по интеллектуальной собственности, внедрена в диагностический процесс кардиологического отделения Краснодарской клинической городской больницы № 2, в диагностический процесс Специализированной клинической инфекционной больницы департамента здравоохранения Краснодарского края, в учебный процесс Кубанского государственного медицинского университета.

Основные положения, выносимые на защиту:

1. Результаты анализа и синтеза процессов, происходящих при принятии медицинских решений:

- общая функциональная схема СППР;

- последовательность этапов создания СППР.

2. Методология, построения; СППР, состоящая в. применении» технологий статистического - анализа для выявления- новых скрытых знаний; интеграции современных технологий статистического моделирования; хранения-и представления данных.

3. Алгоритм СППР применительно к задаче идентификации, степени тяжести состояния больных.

4. Технология решения- задачи классификации больных. Результаты-применения методов- вероятностно-статистического моделирования для- формализации слабоструктурированных медицинских проблем идентификации тяжести состояния больных. Выявленные новые медицинские знания, которые были использованы при построении1 СППР.

5. Компьютерная программа СИТСБ как пример СППР, построенной на основе предложенной в работе методологии. Оценка эффективности ее применения.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и представлялись на различных всероссийских и международных конференциях: Щ Всероссийском конгрессе «Профессия и здоровье» (Москва, 2004 г.), Международном конгрессе «Социальная психология XXI столетия (Ярославль, 2004 г.), Всероссийских научных конференциях «Современное состояние и приоритеты развития фундаментальных наук в регионах» (Краснодар, 2004-2005 гг.), Международной научно-практической конференци «Образование, наука и экономика в вузах. Интеграция в международное образовательное пространство» (г. Плоцк (Польша), 2006 г.), ХШ школе-коллоквиуме по стохастическим методам и VII Всероссийском симпозиуме по прикладной и промышленной математике (Йошкар-Ола, 2007 г.), XXVII Российской школе по проблемам науки и технологий, посвященной 150-летию

К. Э. Циолковского, 100-летию С.П. Королева и 60-летию Государственного ракетного центра «КБ им. В.П. Макеева» (Миасс, 2007 г.), III Международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» (СПб, 2007 г.), ХП Международной конференции «Экологическая и экономическая' безопасность. Проблемы. и пути решения» (пос. Шепси, 2007 г.), на кафедре прикладной математики • факультета; компьютерных технологий и прикладной математики Кубанского государственного университета (сентябрь, 2009 г.), на кафедре компьютерных технологий ш информационной/ безопасности Кубанского государственного технологического университета (апрель 2010т.).

Публикации. Основные результаты диссертационной работы опубликованы в 41' печатном, издании, включая: 2 монографии, 3 учебника, 12'статей: Ряд. статей (10) входят в перечень ведущих научных журналов, рекомендуемых ВАК для опубликования основных научных результатов1 докторских диссертаций. Имеется 11 свидетельств о регистрации программ в Федеральной службе по интеллектуальной' собственности, патентам и товарным знакам, а также в отраслевом фонде алгоритмов и программ.

Структура и объем работы. Диссертационная работа состоит из введения, шести глав, заключения, библиографического списка, содержащего 271 наименование. Она изложена на 377 страницах машинописного текста, включая 223 рисунка, 6 таблиц, 2 приложения.

Заключение диссертация на тему "Анализ и синтез медицинских систем поддержки принятия решений на основе технологий статистического моделирования"

Выводы по главе 6.

Естественно непосредственное применение медперсоналом вероятностно-статистических методов, реализованных в пакетах прикладных программ для идентификации состояния больных, не представляется возможным, даже если будут написаны подробные инструкции, когда и какую кнопку следует нажать, так как использование пакетов в практической медицине сопряжено с определенными сложностями: трудоемкостью »методов,- так как, класс больного определяют в? многошаговых процедурах классификационного анализа; необходимостью в обучении медицинского» персонала основам классификационного анализа и работе с ППГГ STA TISTICA; невозможностью оперативного получения* информации о состоянии больного с минимальными затратами интеллектуальных и временных ресурсов.

Поэтому на основе макросов методов >классификационного анализа были разработаны программные модули, которые могут быть использованы, как самостоятельные приложения для идентификации состояния больных, страдающих хронической сердечной недостаточностью, лептоспирозом, нефроп-тозом. При разработке СППР модули были объединены в единый блок математического обеспечения.

На примере системы идентификации тяжести состояния больных показана принципиальная возможность построения медицинских СППР на основе синтеза статистического пакета STATISTICA и базы данных MS" Access. При этом: система может работать автономно, как самостоятельное приложение, но может быть встроена в качестве подсистемы в медицинскую информационную систему; при работе системы данные пациента вводятся один раз в таблицу базы данных, дальнейшая их обработка; включая импорт в ППП STATISTICA, проведение расчетов для идентификации степени тяжести состояния больного и экспорт в базу данных полностью автоматизированы и выполняются по командам пользователя; обучающиеся выборки, на основании которых решается задача классификации состояния больного, по желанию пользователя могут расширяться, что увеличит достоверность результатов идентификации.

Проведен сравнительный анализ методов идентификации тяжести состояния больных, который показал, что наиболее эффективными являются оба метода дискриминантного анализа — классический дискриминантный анализ и общие модели дискриминантного анализа.

331