автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости
Автореферат диссертации по теме "Поддержка принятия решений в здравоохранении с использованием показателя популяционного риска заболеваемости"
На правах рукописи
Сташевский Павел Сергеевич
ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ В ЗДРАВООХРАНЕНИИ С ИСПОЛЬЗОВАНИЕМ ПОКАЗАТЕЛЯ ПОПУЛЯЦИОННОГО РИСКА ЗАБОЛЕВАЕМОСТИ
Специальность: 05.13.10 - Управление в социальных и
экономических системах.
Автореферат
диссертации на соискание ученой степени кандидата технических наук
Новосибирск - 2014
005557775
005557775
Работа выполнена на кафедре вычислительной техники ФГБОУ ВПО Новосибирский государственный технический университет.
Научный руководитель:
Официальные оппоненты:
Ведущая организация:
доктор технических наук, профессор,
Губарев Василий Васильевич.
Ехлаков Юрий Поликарпович, доктор технических наук, профессор, заведующий кафедрой автоматизации обработки информации ФГБОУ ВПО «Томский государственный университет систем управления и радиоэлектроники».
Щеглов Юрий Александрович, доктор технических наук, профессор, декан информационно-технического факультета ФГБОУ ВПО «Новосибирский государственный университет экономики и управления».
ФГАОУ ВПО «Новосибирский национальный исследовательский государственный университет.
Защита диссертации состоится "19" декабря 2014 г. в 13.00 на заседании дис -сертационного совета Д 219.005.03 в Сибирском государственном университете телекоммуникаций и информатики (СибГУТИ) по адресу: 630102, г. Новоси -бирск, ул. Кирова, 86.
С диссертацией можно ознакомиться в библиотеке ФГОБУ ВПО «Сибирский государственный университет телекоммуникаций и информатики», а также на сайте http://www.sibsutis.ru/science/postgraduate/dis_sovets/.
Автореферат разослан " "_2014 г.
Ученый секретарь
диссертационного совета Д 219.005.03
к.т.н., доцент унцев Иван Александрович
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
В последние десятилетия в системе здравоохранения Российской Федерации по мнению многих исследователей [Багненко С.Ф., Беркутов A.M., Дэлиева Г.Х., Ямщиков A.C.] наблюдается две тенденции: переход на рыночные методы регулирования сферы и децентрализация, формирующаяся под воздействием экономического и социально-политического развития территорий. В связи с этим встают вопросы совершенствования существующих методов управления в здравоохранении и подготовки своевременных и актуальных управленческих решений, определяющих функционирование всей системы здравоохранения в целом.
На фоне этого процесса в системе здравоохранения, как и во многих сферах человеческой деятельности, быстрыми темпами идет информатизация, что приводит к накоплению больших объемов данных о лечебно-диагностическом процессе и административно-хозяйственной деятельности лечебно-профилактических учреждений, которые являются источником информации для подготовки управленческих решений [Венедиктов Д.Д., Гублер В.В., Киселев A.C., Ростовцев В.Н., Чеченин Г.И.]. При этом на фоне возрастающих объемов информации отмечается дефицит специального математического, технологического и программного обеспечения, позволяющего осуществлять поддержку принятия управленческих решений на всех уровнях системы здравоохранения. Это отмечается и в Стратегии развития отрасли информационных технологий Российской Федерации на 2014-2020 года и на перспективу до 2025 года, утвержденной распоряжением Правительства РФ от 1.11.2013 №2036-р, - внедрение информационных технологий, в частности, систем поддержки принятия решений, позволит повысить качество предоставляемых услуг и поднять систему здравоохранения на новый уровень.
Этими факторами обусловлена актуальность работы и необходимость разработки математического, технологического и программного обеспечения для поддержки принятия управленческих решений в здравоохранении.
Объектом исследования является система поддержки (подготовки) принятия управленческих решений (СППР) в здравоохранении.
Предметом исследования является модельное и алгоритмическое обеспечение процесса подготовки управленческих решений в здравоохранении.
Цель работы: разработка структуры, математического, программного и технологического обеспечения системы поддержки принятия управленческих решений в здравоохранении на базе данных о заболеваемости населения региона.
Задачи исследования. Для достижения поставленной цели в рамках работы необходимо решить следующие задачи:
1. Исследовать процесс подготовки управленческих решений в среде информационных систем в здравоохранении;
2. Ввести показатель популяционного риска заболеваемости и осуществить формальную постановку задачи поддержки принятия управленческих решений в здравоохранении с его использованием;
3. Разработать структуру системы и ее модельное, алгоритмическое, технологическое обеспечение, позволяющее автоматизировать поддержку принятия решений на базе введенного показателя популяционного риска заболеваемости;
4. Реализовать в виде программного обеспечения сегмент системы поддержки принятия решений, позволяющий применять разработанное модельное, алгоритмическое и технологическое обеспечение;
5. Апробировать разработанное модельное и алгоритмическое обеспечение на различных задачах управления в здравоохранении.
Методы исследования. Основные результаты в работе получены с помощью системного подхода, методов и средств системного анализа, теории принятия решений, аппарата математической статистики, ОЬАР-технологии и методов интеллектуального анализа данных.
Результаты, выносимые на защиту и их научная новизна заключается в том, что разработаны:
1. Многомерный показатель популяционного риска заболеваемости, отличающийся наличием факторов риска с оценками их значимости, степенью уверенности в риске и набором прогнозируемых показателей популяционной заболеваемости. Соответствует 5 пункту паспорта специальности: разработка специального математического и программного обеспечения систем управления и механизмов принятия решений в социальных и экономических системах.
2. Оригинальная вектор-модель популяционного риска заболеваемости в виде набора параметров и их значений, полученных различными методами интеллектуального анализа данных, ориентированная на применение в системе поддержки принятия решений. Соответствует 10 пункту паспорта специальности: разработка методов и алгоритмов интеллектуальной поддержки принятия управленческих решений в экономических и социальных системах.
3. Способ организации хранения модельного обеспечения и алгоритм формирования вектор-модели популяционного риска заболеваемости, основанные на разработанной параметризации описания моделей в виде набора индексов, и облегчающих автоматизацию процедур выбора модельного обеспечения. Соответствует 10 пункту паспорта специальности: Разработка методов и алгоритмов интеллектуальной поддержки принятия управленческих решений в экономических и социальных системах.
4. Семиэтапный технологический процесс подготовки вариантов управленческих решений, отличающийся введением двух этапов: оценки результатов анализа данных и генерации множества возможных вариантов решений для последующего их анализа лицом, принимающим решения. Соответствует 5 пункту паспорта специальности: разработка специального математического и программного обеспечения систем управления и механизмов принятия решений в социальных и экономических системах.
Теоретическую значимость представляют следующие результаты работы:
1. Системное представление и вектор-модель популяционного риска заболеваемости в виде набора параметров являются объектом дальнейшего исследования и средством решения сходных задач в других областях;
2. Способ систематизации, хранения и выбора моделей, основанный на методе моделетеки, как теоретический и практический инструментарий создания и поддержки баз знаний интеллектуальных систем;
3. Структура и компоненты системы поддержки принятия решений, реализующие разработанное математическое обеспечение как инструмент для упрощения разработки аналогичных СППР в здравоохранении.
Практическая значимость результатов работы. Разработанное алгоритмическое, модельное и технологическое обеспечение позволило создать систему поддержки принятия управленческих решений в здравоохранении, которая может стать стартовой основой для создания систем подобного класса. Созданная система, используя подход риск-менеджмента, позволяет системно оценивать риск популяционной заболеваемости с помощью набора показателей и на их основе обоснованно предлагать варианты управленческих решений, минимизируя субъективное влияние ЛПР и ускоряя за счет ее автоматизации процедуру подготовки решений.
Разработанное математическое, технологическое и программное обеспечение прошло апробацию и внедрено в работу:
1. Медицинского регистра хронической почечной недостаточности республики Бурятия в виде алгоритмического и модельного обеспечения, использованного при анализе структуры заболеваемости ХПН и подготовки управленческих решений по оценки обеспеченностью медицинским оборудованием;
2. Новосибирского областного кардиологического диспансера в виде технологического процесса подготовки управленческих решений;
3. Министерства здравоохранения Новосибирской области в формате модельного и технологического обеспечения при проектировании информационной системы Единый медицинский регистр пациентов Новосибирской области,
4. Учебного процесса кафедры «Вычислительной техники» в виде практикума из 3 лабораторных работ по дисциплине «Интеллектуальные системы» магистерской подготовки по направлению «Информатика и вычислительная техника».
5. Результаты исследований частично были получены в рамках проекта МНТЦ № 3796 «Создание центра по анализу данных и моделированию для оценки связи между погодными условиями и передающимися водным путем инфекциями, и оценки вероятных воздействий прогнозируемых изменений климата на эти инфекции в России» (2008-2012 годы).
Достоверность полученных результатов и выводов подтверждается обоснованной постановкой задач, положительными результатами исследований, статистическая часть которых проводилась на сотнях, тысячах и десятках тысяч записей исходных данных, апробацией и внедрением разработанного обеспечения в реальных условиях, о чем свидетельствуют акты о внедрении.
Результаты работы были получены при участии специалистов Министерства здравоохранения Новосибирской области, Новосибирского областного кардиологического диспансера и Регистра хронической почечной недостаточности республики Бурятия с использованием данных медицинских регистров хронических патологий, базы данных CliWaDinl.O (Климат.Вода.Инфекции.Болезни), разработанной на кафедре вычислительной техники Новосибирского Государственного Технического Университета и общедоступного сервера «Погода России» (http://info.meteospace.ru/).
Апробация работы. Основные научные и практические результаты работы докладывались и обсуждались на 14 международных и всероссийских научных конференциях и симпозиумах, в частности, на:
- восьмом международном форуме по стратегическим технологиям «The International Forum on Strategic Technology» IFOST-2012, г. Томск (включен в базу Scopus);
- международной научно-технической конференции «Актуальные проблемы электронного приборостроения» АПЭП-2010, АПЭП-2012, г. Новосибирск (включен в базу Scopus);
- четвертом международном научном конгрессе Нейробиотелеком-2010, г. Санкт-Петербург (включен в базу РИНЦ);
- всероссийской научной конференции молодых ученых «Наука. Техника. Инновации» НТИ-2011, НТИ-2012, НТИ-2013, г. Новосибирск.
Личный вклад автора. Основные выносимые на защиту результаты работы были получены автором лично. Экспериментальные исследования и сбор материалов проводились с определяющем участием автора. В работах, опубликованных в соавторстве, автором предложена постановка задач и проведены основные исследования.
Публикации. По теме диссертации опубликовано 21 научная работа, из них - 4 статьи, 3 из которых опубликованы в ведущих рецензируемых научных журналах и изданиях, рекомендованных ВАК, 17 работ - в трудах и материалах научных конференций, из них 5 без соавторов.
Структура и объем диссертации. Диссертационная работа состоит из введения, 5 глав с выводами по каждой, заключения и списка литературы из 102 источников и приложения. Общий объем работы - 127 страниц, включает 28 рисунков и 41 таблицу.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность исследования, определены цели и задачи работы, объект и предмет исследования, сформулированы научные положения, выносимые на защиту, указаны их научная новизна, практическая значимость, достоверность, обоснованность и апробированность.
В первой главе проведен анализ особенностей процесса подготовки управленческих решений в среде информационных систем в здравоохранении с точки зрения процедур сбора, обработки, анализа данных и используемых программных средств.
Процесс поддержки принятия решений в здравоохранении ориентирован на решение задач сохранения и улучшения общего уровня здоровья населения с учетом изменяющихся экологических, экономических, эпидемиологических и других условий. При рассмотрении управленческого цикла как системы с обратной связью были выделены следующие важные для рассмотрения этапы управления (рис. 1):
1) фиксация сведений о влияющих и учитываемых Ху факторов на население Н, часть из которых аккумулируется в медицинских и других, не связанных с здравоохранением (экологическая, экономическая ситуация, климатический фон и др.), информационных системах,
2) подготовка управленческих решений К=(Я1,...Дк) субъектом на основе учитываемых факторов^ и информативных индикаторов У'=(Т'/,...,У'/), характеризующих состояние здоровья населения,
3) оценивание результатов применения управленческого решения Я по индикаторам У и корректировка последующих решений.
Рис. 1. Укрупненная схема информационных потоков управления в системе здравоохранения
При этом, субъект управления 5 представляет собой сложную 3-х уровне-вую иерархическую систему, где на разных уровнях управления различными учреждениями системы здравоохранения готовятся и принимаются решения, оказывающие как прямое, так и косвенное воздействие на состояние здоровья население через организационную структуру субъекта управления. При исследовании иерархии субъекта управления был выявлен круг информационных задач, решаемых при подготовке управленческих решений верхними уровнями субъекта управления на примере учреждений здравоохранения районного, областного и регионального уровней (ЛПУ различных уровней, регионального Министерства здравоохранения).
С целью выявления обеспеченности управленческого цикла инструментальными средствами в работе было проанализировано 156 программных разработок каталога АРМИТ (http://armit.ru). Для анализа были выделено три группы критериев: основные группы пользователей системы, решаемые задачи и предоставляемый функционал. В результате проведенной оценки рассматри-
ваемые системы были разделены на четыре группы: телемедицинские системы и шеЬ-системы для удаленного мониторинга, комплексные информационные системы для медицинских учреждений (КМИС), интеллектуальные системы в медицине и аналитические системы оценки здоровья и системы поддержки принятия решений (СППР). (Под информационной в работе понимается программно-аппаратная система, предназначенная для автоматизации целенаправленной деятельности конечных пользователей и обеспечивающая, в соответствии с заложенной в неё логикой принятия решений, возможность получения, модификации и хранения необходимых данных и знаний.) Исследование существующего программного обеспечения показало, что большое количество систем (свыше 85%) ориентировано на лечебно-диагностический и хозяйственный процесс в медицинских учреждениях и являются поставщиками данных для задачи подготовки управленческих решений в здравоохранении (КМИС, телемедицинские системы, интеллектуальные системы). При этом ощущается недостаток в информационных системах, обеспечивающих процесс поддержки принятия управленческих решений на разных уровнях системы здравоохранения. Для этого в первой главе вводится и конкретизируется понятие полнофункциональной системы поддержки принятия управленческих решений в здравоохранении и требования к ней.
Во второй главе дана формализованная постановка задачи Ъ поддержки принятия управленческих решений Л в информационных системах в здравоохранении на базе популяционного риска заболеваемости /.
В работе первоначально был проанализирован набор задач в здравоохранении, решаемых на различных уровнях субъекта управления, которые должны быть охвачены в системе поддержки управленческих решений. По результатам анализа был предложен набор Р71, ■■■,Р:/. параметров решаемой задачи, описывающих требования к результатам решения. В табл. 1 приведены примеры некоторых задач и их параметров.
Таблица 1. Примеры управленческих задач и их параметров
Задачи Параметры задачи
Обозн. Вид (содержание) задачи Тип задачи Рг1 Срочность решения Частота решения ъз Вид решения Рг4 Приоритет решения Рг5 Объект воздействия решения Ргб
21 Оценка эпидемиологической ситуации оценивание 1) оперативное 2) краткосрочное по мере необходимости 1) лечебные, 2) администр. высокий ЛПУ всех уровней, население
22 Анализ структуры заболеваемости анализ долгосрочное циклическое 1)лечебные 2) диагност. высокий ЛПУ всех уровней
2з Прогноз заболеваемости определенной ситуации прогнозирование долгосрочное циклическое 1)лечебн. 2) диагност. 3) админ. высокий ЛПУ всех уровней, население
Для описания управленческих решений в здравоохранении в работе предложено использовать подмножество параметров задачи Ъ, поскольку решаемая задача и принимаемые решения ЛПР семантически связаны друг с другом. Управленческие решения Я=(Е1,...,Як) есть результат выбора из имеющихся ва-
риантов действий, сокращающих разрыв между настоящим и будущим желательным состоянием здоровья населения, например: Я.1 = разработка новой профилактической программы, Я2 = закупка оборудования, Яз = внедрение новой процедуры диагностики и т.д.
Анализ управленческих процессов в здравоохранении в современных условиях позволил выявить следующие важные аспекты:
1) подход риск-менеджмента, основанный на минимизации рисков, становится одним из ключевых методов управления в рыночной экономике;
2) управленческие решения в здравоохранении, как правило основываются на популяционных характеристиках состояния здоровья всего населения или его группы;
3) заболеваемость является одним из основных показателей, используемых для характеристики состояния здоровья населения и подготовки управленческих решений в здравоохранении.
Анализ методов, используемых для оценивания степени риска, показал, что в различных сферах здравоохранения, как правило, используют одномерные точечные оценки, которые в итоге дают неполную картину о величине, причинах и возможном прогнозе популяционного риска заболевания. В связи с этим работе вводится новый показатель популяционного риска заболеваемости I, который предложено рассматривать в виде системы их трех компонент 1=(и,1г,1Р)\
1) факторы риска /и. - вектор пар (ЕО), где Р={Г1,...,Гг} - факторы риска, а (2={()1,...,()г} - индикаторы значимости факторов;
2) степень устойчивости значения риска 1г - величина, характеризующая меру доверия результату прогноза риска 1р, измеряемая в диапазоне от 0 до 1;
3) прогнозные значения риска 1р - вектор прогнозируемых показателей популя-ционной заболеваемости в абсолютных и относительных единицах, нормированных к рассматриваемой численности популяции и характеризующих количество событий (например, первичная заболеваемость, рецессии, эпидемии и т.д.), которые могут произойти в рассматриваемой популяции при воздействии факторов риска в определенный временной период.
Эмпирические категорийные и количественные значения показателей 1к,1г,1р получаются по имеющимся в системе данным в принятой для их измерения шкале. При формировании показателя риска I могут быть получены как полное множество его компонент 1к,1г,1р, так и отдельные компоненты риска или их составные части. Значения интерпретируются следующим образом: при воздействии на население факторов Л,(со значимостью Ql,...,Qr) с уверенностью возникновения популяционной заболеваемости, равной /г, количество определенных событий в 1р составит некоторое прогнозное значение.
Для расчета различных компонент риска заболеваемости используются сведения об (см. рис. 1):
1) информативных индикаторах о состоянии населения У;
2) учитываемых факторах Ху, которые с различной степенью влияют на состояние здоровья населения и, как следствие, на значения информативных индикаторов У.
В предложенной формализации управленческих задач выделены четыре этапа решения задачи, представленные на рис. 2. Подготовка управленческого решения представляет собой процесс, в котором на первом этапе происходит определение параметров Рг1, ...,Р1б задачи 2. На втором этапе отбираются необходимые исходные данные В=(Ху,У'). На третьем в соответствии с параметрами задачи и собранными данными рассчитываются значения компонентов популяционного риска заболеваемости 1=(1ю,1г,1р), а на четвертом по условиям задачи и полученным значениям показателей риска, происходит генерация возможных вариантов управленческих решений Я,, ...,Як с помощью методов и средств, рассматриваемых в следующих главах.
Рис. 2. - Этапы решения задачи подготовки вариантов управленческих решений
В третьей и четвертой главах приводятся результаты разработки модельного, алгоритмического обеспечения, элементов технологии и программного обеспечения подготовки управленческих решений на базе введенного показателя популяционного риска заболеваемости.
Для формирования управленческого решения в среде информационной системы в здравоохранении с участием лица принимающего решение предложено выделять семь этапов технологического процесса (рис. 3).
Первый этап (постановка конкретной задачи подготовки управленческих решений Z и определение ее параметров Р21, ...,Р2б) осуществляется ЛПР. В информационной системе помимо параметров для каждой рассматриваемой задачи обязательно определяются необходимые, характеризующие задачу, требования к данным и сопутствующие им дополнительные сведения (метаданные). Например:
1) требования к исходным данным Тс1, их объему, структуре и качеству;
2) требования к получаемому результату Тг, определяющие перечень и критические значения параметров, влияющих на процедуру выбора моделей в процессе подготовки управленческих решений таких, например, как Я, = провести вакцинацию населения, Я2 = разработать профилактические программы, Я, = перераспределить потоки пациентов и т.п.
Второй этап технологического процесса (выбор исходных данных) осуществляется в соответствии с параметрами задачи Рг1,...,Р!би требованиями Та. В результате формируется массив исходных данных 1У~(Ху\ У), включающий в себя значения учитываемых параметров Ху и информативных индикато-
рыов состояния населения У. На этом этапе предусмотрено проведение вали-дационных процедур для множества исходных данных В с целью оценки достаточности объема и качества исходного массива для процедур обработки и анализа данных, которые подробнее описаны в диссертационной работе. В случае несоответствия массива данных валидационным критериям происходит возврат на предыдущий шаг и ЛПР переопределяет параметры и требования задачи.
Рис. 3. Технологический процесс подготовки управленческого решения ЛПР на основе оценки риска На третьем этапе технологического процесса (предобработка исходных данных), см. рис. 3, выбираются и применяются методы предобработки данных, (например, такие как: нормирование заболеваемости, вычисление среднесуточных значений заболеваемости или температуры и др.), в результате чего получается преобразованный массив 0'=(Ху,У), который используется на четвертом этапе в процедурах обработки и анализа данных для вычисления значений компонент популяционного риска заболеваемости. Поскольку показатель популяционного риска является многомерным, для оценки значений каждой его компоненты может быть использован широкий спектр методов и моделей. Поэтому на четвертом этапе технологического процесса предложено использовать подход вариативного моделирования - одновременного использования для решения задачи нескольких моделей. Его предлагаемая конкретизация заключается в том, что для оценивания значений компонент риска используется вектор-модель (ВМ) М=(М1, ...,М/) как система родственных по назначению и близких по сложности моделей, которые в совокупности отражают все компоненты риска I и обеспечивают появление системного свойства эмерджентности при их совместном применении. Такой подход позволяет наиболее полно пред-
ставить информацию об оценке риска заболеваемости для ЛПР, обеспечив его сведениями для разработки как оперативных, так и долгосрочных мероприятий по отношению к уровню здоровья населения.
В связи с использованием вариативного моделирования возникает необходимость систематизации, хранения и автоматизации выбора модельного обеспечения. Для этого разработана модификация метода моделетеки. Моделе-тека есть упорядоченное множество моделей, удовлетворяющих требованию простоты, полноты, минимальной избыточности, уровня описания и исследо-ванности для применения в приложении к конкретной предметной области. Суть модификации заключается в использовании в качестве идентификаторов моделей индексного описания модели Бм. которое представляет собой вектор индексов для семантического представления модели в контексте решаемой задачи. В качестве примера в табл. 2 приведены группы индексов, используемые для структурированного представления моделей в моделетеке.
Таблица 2. Индексное представление модели в моделетеке Бт
Группа индексов Описание группы индексов Примеры частных индексов
Индексы данных Индексы, относящиеся к характеристикам данных 1)объем данных, N 2)учитываемые патологии и другие характеристики (пол, возраст и т.д.), А=(А1, 3)процент наличия пропусков в данных, В
Индексы методов Индексы, описывающие пригодность модели к использованию метода 1)назначение модели (оценка, прогнозирование, классификация и т.д, С 2)наличие экспертной информации и знаний о модели, Ь 3)возможность работы с пропущенными данными, в
Индексы качества модели 5к=(и,ЕЛ...) Индексы, описывающие апостериорную адекватность моделей и достоверность получаемых с их помощью результатов 1)среднее значение эмпирических показателей адекватности модели на классах задач, {/ 2)экспертная оценка показателей, Е 3)специфические показатели качества моделей J (например: диагностическая точность, чувствительность, специфичность)
Для решаемой задачи по аналогии вводится индексное описание задачи 5г = (5г/, получаемое путем преобразования параметров задачи А/,и
требований Ты и Тг в набор индексов Яг. Суть преобразования - отбор тех параметров и требований, которые релевантны (нужны, полезны) для моделирования. Индексное описание задачи можно представить в многомерном пространстве Ят, координатами которого являются Бг!, называемым пространством отображения задачи 2. Пространство отображения Кт вводится как промежуточный инструмент, который позволяет автоматизировать процедуру выбора моделей для оценки риска заболеваемости. Пространство отображения, включающее в себя весь набор индексов задачи, называется основным. Если в основном пространстве не найдено моделей для решения задачи, то в процедуре выбора происходит (с участием ЛПР) сокращение размерности пространства путем исключения незначимых индексов из описания задачи и повтор поиска по новому подпространству. Подробное описание процедуры выбора моделей приведено в четвертой главе диссертации.
Для формирования ВМ показателя риска в работе исследована приме-
12
нимость различных методов интеллектуального анализа данных (ИАД). В табл. 3 приведено описание экспериментальных исследований, в которых осуществляется расчет компонент популяционного риска заболеваемости различными методами ИАД. В качестве исходных данных были использованы данные по заболеваемости инфекционными патологиями, передающимися водным путем, различных городов России (источник - база данных СН\УаБ1п 1.0), данные о заболеваемости хронической почечной недостаточности жителей Республики Бурятия и Новосибирской области, а также ретроспективные погодные данные для разработки моделей, учитывающих климатический фон. Эксперименты проводились на тысячах (регистр ХПН) и десятках тысяч (СН\УаБ1п 1.0) записей. При этом, в зависимости от назначения метода, с его помощью рассчитывалась степень значимости фактора риска /«. (корреляционный анализ факторов риска и заболеваемости), либо прогноз риска 1Р (другие методы).
Таблица 3. Схема экспериментов исследования применимости методов ИАД
№ Параметры экспериментов ДР НС МГУА КА РА НБК МОВ
Задача прогноз заболеваемости + + + + + +
оценка факторов риска +
общая инфекц. заболеваемость + + + + + + +
2 Патология сальмонелл ез +
ХПН + +
Барнаул + + + + + +
Челябинск + + + + + + +
3 Города Екатеринбург + + + + + +
Новосибирская обл. + +
Республика Бурятия + +
температура воздуха + + + + + + +
атмосферное давление + + + + + + +
4 Факторы относит, влажность + + + + + + +
пол +
возраст +
национальность +
Количество экспериментов 42 36 24 20 32 8 30
Пояснение: ДР - деревья решений, НС - нейронные сети (многослойный персептрон), МГУА - метод группового учета аргументов, КА - корелляциоиный анализ, РА - регрессионный анализ, НБК - наивный байесовский классификатор, МОВ - метод опорных векторов.
В качестве степени уверенности в возникновении риска 1Г были использованы нормированные характеритики качества прогнозных моделей (относительные СКО и погрешность прогноза) как степень доверия к результату, получаемому с помощью выбранных моделей.
В таблице 4 приведены результаты экспериментов, полученные для деревьев
решений и регрессионных моделей, которые показывают возможность адаптации и применения некоторых методов ИАД в контексте решаемых задач, а также обоснованность применения подхода вариативного моделирования, позволяющего улучшить качество расчета многомерного показателя риска за счет применения различных моделей. Для оценки качества моделй, построенных с применением методов ИАД, использовались как стандартные характеристики качества (СКО и др.), так и специфичные, применимые для конкретных методов.
Таблица 4. Результаты исследования применимости различных деревьев ре-
шений и регрессионных моделей
Патология Город Деревья решений Регрессионный анализ
Кол-во экспери ментов Диапазон относит, погрешно стей Глубина деревьев Ширина деревьев Кол-во эксперим ентов Диапазон относит, погрешно стей Коэф-т детерме- ннпии
Общая инфекционная заболеваемость Барнаул 14 22-66% 12-18 702-1009 8 63-72% 0,12-0,28
Челябинск 14 21-58% 15-20 832-1242 8 58-69% 0,16-0,32
Екатеринбург 14 26-66% 12-14 702-834 8 46-62% 0,17-0,38
ОКИ нсо - - - - 4 8-26% 0,74-0,94
Республика Бурятия - - - - 4 9-21% 0,79-0,87
На пятом этапе технологического процесса происходит анализ полученных результатов (см. рис. 3), в процессе которого используется процедура формирования итогового решения. Она является аналогом врачебного консилиума, где совместно специалистами выполняется постановка диагноза. В нашем случае обеспечивается совместное применение результатов, полученных по различным моделям для вычисления итоговых значений компонент риска. Для формирование итогового решения предложено три способа:
1) усреднение полученных количественных значений оценок риска I, если неизвестны показатели качества используемых моделей;
2) выбор в качестве итогового результата, полученного по модели, которая обеспечивает максимальные значения показателей качества, если известны характеристики качества только некоторых моделей;
3) взвешиванием результатов, полученных по разным методам, моделей с учетом их показателей качества, если известны характеристики качества для всех моделей.
На шестом этапе технологического процесса (генерация вариантов управленческих решений), см. рис. 3, на основе полученной оценки риска I, параметров и требований задачи 2 выполняется генерация множества вариантов решения Я1,...,Як\
ДЩ->(Я1.....Як).
Все множество возможных управленческих решений хранится в базе знаний СППР в виде шаблонов для конкретных типов задач и патологий, выбор
актуального подмножества которых происходит на основании матрицы смежности, а расчет важности решения происходит с помощью процедуры нечеткого вывода в зависимости от итоговых значений показателей риска I. В работе используется модель нечеткого вывода Мамдани с фиксированными способами импликации и дефаззификации, которые показали хорошие результаты в экспериментах.
Полученные на пятом этапе итоговые оценки риска I и набор вариантов управленческих решений (Д/, сформированный на шестом, используются на седьмом этапе ЛПР для выбора актуального множества управленческих решений.
В четвертой главе также приводится описание разработанной системы, которая позволяет получать вектор-модель оценки риска заболеваемости с использованием разработанного модельного и алгоритмического обеспечения. При проектировании подсистемы были сформулированы основные требования к архитектуре, позволяющие обеспечить модульность, гибкость и расширяемость при росте объемов хранимых данных и количества решаемых задач:
1) возможность расширения источников данных для подсистемы: различных открытых и закрытых систем, содержащих информацию об информативных индикаторах о состоянии населения (заболеваемость, смертность и т.д.) и учитываемых факторов (погодных, экологические и др. данные);
2) возможность масштабирования системы при увеличении объема и изменении структуры хранимых данных;
3) простота добавления новых моделей, а также модификации существующих для улучшения качества поддержки принятия решений и адаптации имеющегося модельного обеспечения под изменяющиеся условия задач.
Упрощенная структура программной системы показана на рис. 4 и включает в себя следующие четыре уровня организации:
- уровень данных, позволяющий организовать импорт, синхронизацию и масштабирование данных из различных источников;
- уровень метаданных, используемый для хранения способов предобработки, моделей оценки риска и их качества, правил продукции для управленческих воздействий в базе знаний подсистемы;
- уровень бизнес-логики, используемой для организации этапов технологического процесса: операции выбора в моделетеке, доступа к данным и управления этапами решения задачи Ъ\
- пользовательский интерфейс для работы ЛПР с параметрами задачи, исходными данными и отчетами по результатам решения.
В пятой главе приводятся результаты исследования применимости отдельных методов ИАД для расчета компонент показателя риска, рассматривается пример использования разработанного модельного и алгоритмического обеспечения для прогнозирования инфекционной заболеваемости, а также описывается процедура генерации вариантов управленческих решений и расчета их важности на основе механизма нечеткого вывода.
Пользоват. уровень
Интерфейс приложения
Рис. 4. Структура системы
Рассмотрим пример применения разработанного обеспечения на задаче подготовки мероприятий в системе здравоохранения на основе прогноза инфекционной заболеваемости (для инфекций передающихся водным путем) в г. Челябинске, сентябрь 2011 г., с учетом погодных факторов (температуры, давления и относительной влажности). В качестве массива исходных данных были использованы данные CliWaDIn 1.0, содержащие ежедневные показатели погоды и случаев инфекционной заболеваемости.
Для рассматриваемой задачи определены параметры Pzi,...,Pz6, требования к данным Td, результату Тг и метаданные ц на основании которых было сформировано следующее индексное описание задачи Sz = (Pz,Td,Tr), необходимое для формирования вектор-модели. Параметры задачи: Pzi = прогнозирование (тип задачи) Метаданные ц. jidi = общая инфекционная заболеваемость, ца2 = температура воздуха, цл = данные могут содержать выбросы, ßd4 - в данных могут присутствовать пропуски, Требования к данным (Td): Tas = данным требуется предобработка, Td6 = срок прогноза - один месяц; Требования к результату (Тг): Tri = обязательное наличие компоненты 1Р в результате, Т,2 = погрешность прогноза не больше 20%.
На основе индексного описания задачи Sz была сформирована вектор-модель и получены результаты моделирования, представленные в таблице 5, показывающие отличающиеся прогнозные значения для разных моделей и разную уверенность в возникновения этих событий (как степень доверия результату модели). Для расчета итоговых значений риска в работе используются три различных варианта. В данном случае в связи с наличием модели, имеющей максимальную точность, будет выбрана модель М2, полученная на основе метода группового учета аргументов, для генерации варинтов управленческих решений. В связи с тем, что для расчета показателей значимости факторов риска
было использовано менее 2-х моделей, они не будет включены в итоговые значения компонент. Таким образом, итоговая структура популяционного риска для рассматриваемой задачи: /= (/, = 0,85; (1'Р1 = 896, ГР2 = 0,000821).
Таблица 5. Результаты вектор-моделирования
Вид модели Описание модели Компоненты риска /
/и> 1г абсолютн. прогноз нормир. на 100 000 ч.
М1: регрессионная модель полиномиальная модель 3 порядка, построенная по ретроспективным данным общей инфекционной заболеваемости. 0,57 1059 0,000963
М2: модель на основе МГУА полиномиальная модель второго порядка, полученная на базе опорных функций, представленных полиномом Колмогорова-Габора. 0,85 896 0,000821
М4: нейронная сеть Семислойный персептрон, учитывающий температуру и ретроспективные значения заболеваемости 0,63 943 0,000857
М5: корреляционный анализ Коэффициент корреляции Пирсона (Р1=температура, Р2=давление, РЗ=отн. влажность) <>1=0,41 (>2=0,21 (>з=0,17
На этапе генерации вариантов управленческих решений выбор конкретных мероприятий происходит с помощью двух параметров: тип задачи (прогноз заболеваемости) и патология (общая инфекционная заболеваемость). Для того, чтобы ранжировать мероприятия по степени значимости, в работе используется нечеткая процедура, основанная на механизме нечеткого вывода Мамдани, которая позволяет по итоговым значениям компонент популяционного риска / получить важность Рг5 для каждого предлагаемого мероприятия.
Так, для рассматриваемого примера на рис. 5 приведен пример нечеткого вывода важности для одного из предлагаемых мероприятий, а в таблице 6 - итоговый список управленческих решений, ранжированный для ЛПР относительно важности.
Рис. 5. Нечеткий вывод для варианта решения «проведение профилактических мероприятий» Для того, чтобы предоставлять ЛПР только релевантные для рассматриваемой задачи варианты решений, полученные на предыдущем шаге важности решений сравниваются со значением 0,2 и выбираются только те, которые превышают это значения (Я/,Я2,Яз в табл. 6).
Таблица 6. Результаты нечеткого вывода для всех решений
Идентификатор решения Название решения Важность решения
Проведение санитарно-гигиенических мероприятии 0,38
Я2 Увеличение коечного фонда 0,34
Яз Проведение профилакг. мероприятий 0,41
Я4 Вакцинация населения 0,18
Я; Введение карантина 0,11
На основании результатов моделирования показателя популяционного риска I, вариантов решений К, ранжированных по их важности ЛПР выполняет выбор актуального множества управленческих решений.
ЗАКЛЮЧЕНИЕ
В результате проведенных исследований были получены следующие основные результаты:
1. Предложен многомерный показатель популяционного риска заболеваемости в виде набора характеристик, позволяющий выполнять комплексную оценку и содержащий набор факторов риска с величинами их значимости, степень уверенности в возникновении риска и набор прогнозных значений числа случаев заболеваемости.
2. Разработана оригинальная вектор-модель многомерного показателя популяционного риска, позволяющая рассчитывать характеристики риска с использованием модельного обеспечения, полученного с помощью методов ИАД.
3. Разработан метод организации базы знаний моделей СППР, основанный на модификации метода моделетеки, отличающийся введением набора индексов для параметризации модели, позволяющий автоматизировать процедуру выбора моделей из базы знаний.
4. Разработан семиэтапный технологический процесс поддержки принятия управленческих решений, включающий в себя этапы анализа результатов расчета показателей риска и генерации вариантов решений.
5. Разработана структура и программное обеспечение для системы поддержки принятия решений в здравоохранении, реализующее предложенное математическое и технологическое обеспечение.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в изданиях, рекомендованные ВАК:
1. Сташевекий П.С. Формализация процесса сбора, обработки и анализа данных в системах поддержки принятия решений / И. Н. Швайкова, П. С. Сташевекий // Перспективы науки. - 2013.- № 10, С. 180-184.
2. Сташевекий П.С. Оперативный анализ данных в едином медицинском регистре пациентов Новосибирской области / И. Н. Швайкова, П. С. Сташевекий // Журнал "Вопросы радиоэлектроники", Выпуск 1. Москва 2012, с. 175-184.
3. Сташевекий П.С. Особенности применения OLAP-технологии в едином медицинском регистре пациентов Новосибирской области / П. С. Сташевекий, И. Н. Швайкова // Журнал "Вопросы радиоэлектроники", 2012, Выпуск 1, С. 185-195.
Публикации в прочих изданиях:
1. Сташевекий П.С. Использование климатического и инфекционного профилей для оценки изменений климата и инфекционной заболеваемости. / В. В. Губарев, И. Н. Яковина, П. С. Сташевекий // Проблемы организации гетерогенных распределенных данных и анализа моделей типа "Окружающая среда - Инфекции". "ОСИ-2013" Материалы всероссийской конференции молодых ученых. 18-19 ноября 2013 г. - Новосибирск, НГТУ. С. 20-22.
2. Сташевекий П. С. The study of climatic factors influence on the seasonal dynamics of infectious pathologies / П. С. Сташевекий, И. H. Швайкова // Proceedings of IFOST2012. The 7th International Forum on Strategic Technology IFOST2012. Volume 1. - Tomsk Polytechnic University, September 17-21, 2012, p. 628-631
3. Сташевекий П.С. Особенности применения метода моделетеки в медицинских информационных системах / И. Н. Швайкова, П. С. Сташевекий // Материалы XI международной конференции "Актуальные проблемы электронного приборостроения" АПЭП-2012 в 7 томах. Том 5. - С.77-80
4. Сташевекий П.С. Алгоритмы формирования диагностических решений / И. Н. Швайкова, П. С. Сташевекий // Материалы X международной конференции «Актуальные проблемы электронного приборостроения» АПЭП-2010 в 7 т., Новосибирск, 22-24 сентября, 2010. - Новосибирск: Изд-во НГТУ, 2010. -Т.5.-С. 122-127.
5. Сташевекий П. С. Новый подход к анализу и оценке медицинских интеллектуальных диагностических систем / П. С. Сташевекий, И. Н. Швайкова // Современные проблемы науки: Сборник материалов международной конференции. - Тамбов: изд-во Першина Р.В., 2010 - С. 79-84.
6. Сташевекий П. С. Применение климатического профиля для исследования сезонной динамики климата / П. С. Сташевекий, И. Н. Швайкова // Десятое сибирское совещание по климато-экологическому мониторингу : тез. Рос. конф., 14-17 окт. 2013 г. - Томск : Аграф-Пресс, 2013. - С. 145-146.
19
№
7. Сташевский П. С. Исследование взаимосвязи геоклиматических факторов и динамики развития патологий / П. С. Сташевский // Материалы всероссий -ской научной конференции молодых ученых в 7-ми частях. Новосибирск: Изд-во НГТУ, 2011. Часть 2, С. 79-80
8. Сташевский П. С. Подход к анализу влияния климатических факторов на динамику инфекционной заболеваемости / П. С. Сташевский, И. H. Швай -кова // Наука. Технологии. Инновации : материалы Всерос. науч. конф. мо -лодых учёных :в 7 ч. , Новосибирск, 29 нояб. - 2 дек. 2012 г. -Новосибирск : Изд-во НГТУ, 2012. - 4. 2. - С. 133-137.
9. Сташевский П. С. Automation of Decision Support in Medical Information Systems / П. С. Сташевский, И. H. Швайкова // Proc of the 2-nd Indo-Russian Joint Workshop on Computational Intellegense and Modern Henristics in Automation and Robotics. 10-13 September, 2011, Novosibirsk, - Novosibirsk: NSTU, 2011 - P. 256-258.
10. Сташевский П. С. Интеграция медицинских регистров в единую информа -ционную систему / П. С. Сташевский // Системный анализ и информацион -ные технологии: Сборник тезисов докладов. - Новосибирск: изд-во «КАНТ», 2011-С. 79-81.
11. Application of Fuzzy Logic for Modeling the Effects of Seasonal, Social and Environmental Events on the Incidence of Acute Gastrointestinal Infections of Unknown Etiology / В. В. Губарев, И. Г. Кондратьева, В. Б. Локтев, П. С. Сташевский, И. Н. Швайкова, П. У. Яковина // Environmental Challenges Facing Developed and Developing Countries in a Globalized World: Quantitative Approaches to Comprehensive Solutions / The International Environmetrics Society 22nd Annual Conference. January 1 - 6, 2012, Hyderabad, INDIA. TIES 2012 BOOK OF ABSTRACTS - Hyderabad: University of Hyderabad, CR Rao AIMSCS, 2012,-P. 131.
12. Сташевский П. С. Исследование влияния климатических факторов на ин фекционную заболеваемость / П. С. Сташевский, И. Н. Швайкова ; науч. рук. В. В. Губарев // Современные проблемы технических наук : сб. тез. докл. Новосиб. межвуз. науч. студен, конф. «Интеллектуальный потенциал Сибири», Новосибирск, 22-23 мая 2013 г. - Новосибирск : НГАСУ. 2013. -С. 64.
Отпечатано в типографии Новосибирского государственного технического университета 630073, г. Новосибирск, пр. К. Маркса, 20, тел./факс: (383) 346-08-57 формат 60x84 1\16, объем 1.5 пл., тираж 150 экз. заказ № 2316 подписано в печать 31.10.14 г.
-
Похожие работы
- Управление специализированной службой региона на основе информационных технологий
- Рационализация специализированной помощи больным с сердечнососудистыми заболеваниями с использованием информационных технологий
- Инновационные технологии в управлении качеством медицинской помощи больным со злокачественными новообразованиями
- Анализ состояния инфекционных заболеваний в территориально распределенной системе региона по риску заболеваемости и комфортности проживания на основе ГИС-технологий
- Моделирование и оптимизация управления системой медицинского обслуживания населения сельского административного района на основе геоинформационного мониторинга и прогнозирования
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность