автореферат диссертации по приборостроению, метрологии и информационно-измерительным приборам и системам, 05.11.17, диссертация на тему:Синтез коллективов решающих правил прогнозирования и диагностики патологии студентов с использованием латентных переменных и моделей г. Раша
Автореферат диссертации по теме "Синтез коллективов решающих правил прогнозирования и диагностики патологии студентов с использованием латентных переменных и моделей г. Раша"
Бойцов Антон Владимирович
СИНТЕЗ КОЛЛЕКТИВОВ РЕШАЮЩИХ ПРАВИЛ ПРОГНОЗИРОВАНИЯ И ДИАГНОСТИКИ ПАТОЛОГИИ СТУДЕНТОВ С ИСПОЛЬЗОВАНИЕМ ЛАТЕНТНЫХ ПЕРЕМЕННЫХ И МОДЕЛЕЙ Г. РАША
Специальность 05.11.17- Приборы, системы и изделия медицинского
назначения
Автореферат диссертации на соискание учёной степени кандидата технических наук
005560982
Курск 2014
005560982
Работа выполнена в Юго-Западном государственном университете на кафедре биомедицинской инженерии
Научный руководитель: Заслуженный деятель науки РФ, доктор
технических наук, профессор Кореневский Николай Алексеевич
Официальные оппоненты: Маслак Анатолий Андреевич
доктор технических наук, профессор, Кубанский государственный университет, профессор кафедры математики, информатики и методики их преподавания
Баранов Роман Леонидович кандидат технических наук, доцент, Воронежский государственный технический университет, доцент кафедры системного анализа и управления в медицинских системах
Ведущая организация: ФГБОУ ВПО «Тверской государственный
технический университет» (г. Тверь)
Защита диссертации состоится «20» февраля 2015 года в 15:00 часов на заседании диссертационного совета Д 212.105.08 при Юго-Западном государственном университете по адресу: 305040, г. Курск, ул. 50 лет Октября, 94 (конференц-зал).
С диссертацией можно ознакомиться в библиотеке Юго-Западного государственного университета и на сайте Юго-Западного государственного университета www.swsu.ru.
Автореферат разослан »^2
2014 г.
Ученный секретарь диссертационного совета Д 212.105.08
Снопков В.Н.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Первоочередной задачей сохранения общественного здоровья является обеспечение гармонического развития молодого поколения. Индикатором здоровья, а вместе с тем и социально-экономического благополучия государства, является здоровье подрастающего поколения, в частности студенческой молодёжи. Конкуренции на рынке труда по-новому ставит вопросы о необходимости значительного повышения качества подготовки современных специалистов в области техники, технологии, экономики. Меняется характер труда, в котором всё большую долю приобретает интеллектуальный труд. Происходят колоссальные изменения в области информации и новейших технологий. Все эти процессы предъявляют повышенные требования к уровню подготовки студентов высших учебных заведений, которые являются резервом высококвалифицированных специалистов для различных отраслей промышленности и экономики нашей страны, определяющим трудовой и оборонительный её потенциал. Однако, в силу своих возрастных особенностей, находясь в периоде формирования физиологической и психологической зрелости, именно эта группа подвержена высокому риску нарушений в состоянии здоровья. Постоянное умственное и психоэмоциональное напряжение, информационный стресс, недостаточная материальная обеспеченность, необходимость совмещать учёбу с работой, нарушения режима труда, питания, отдыха приводят к истощению адаптационных резервов нервной, иммунной и эндокринной системы растущего организма, формированию функциональных расстройств, а затем и хронической патологии.
С учетом сказанного разработка методов и средств, обеспечивающих своевременное выявление факторов риска, оценку возможности появления и развития психосоматических заболеваний студентов с одновременным проведением мероприятий, улучшающих состояние их здоровья, является актуальной задачей.
Степень разработанности темы исследования. На сегодняшний день разработано достаточно много методов и алгоритмов управления состоянием здоровья студентов. Многие из них основаны на соответствующих системах поддержки принятия решений с использованием современных информационных технологий. Большинство существующих методов и алгоритмов анализа и управления состоянием здоровья студентов, как показал проведённый нами анализ, используют традиционную для медицинских исследований информацию, в то время как психофизиологические, функциональные и соматические затраты резервов организма в процессе обучения, способствующие развитию новых и не имеющих ещё клинических проявлений заболеваний, учитываются в недостаточной степени, что снижает потенциально достижимое качество профилактики и диагностики.
Дополнительные сложности решения поставленных в работе задач связаны с тем, что прогнозирование и ранняя диагностика психосоматических заболеваний с учетом реальных медико-технических ограничений относятся к . классу плохо формализуемых задач. Это затрудняет использование
традиционного математического аппарата, включая раздельное использование такого мощного инструментария, как теория измерения латентных переменных, распознавание образов и нечеткая логика принятия решений. Для повышения качества и оперативности решения выбранного класса задач предлагается использовать методы математического моделирования, реализующие гибридные технологии моделирования, объединяющие как методы теории измерения латентных переменных, распознавания образов и разведочного анализа, так и методы мягких вычислений, основанные на нечеткой логике Заде и Шортлифа. Такое объединение различных подходов к решению задач оценки и управления состоянием здоровья студентов позволяет получить новое качество в решении сложных системных задач и является инновационным.
Работа выполнена в рамках Федеральной целевой программы «Научные и научно-педагогические кадры инновационной России на 2009-2013 годы и в соответствии с научным направлением Юго-Западного государственного университета «Медико-экологические информационные технологии».
Цель работы: разработка методов и средств прогнозирования и диагностики заболеваний студентов, подвергающихся воздействию психоэмоциональных перегрузок и индивидуальных факторов риска, основывающихся на использовании моделей Г. Раша и гибридных нечетких технологий, обеспечивающих повышение качества медицинского обслуживания студенческой молодежи.
Для достижения поставленной цели необходимо решить следующие задачи:
- сформировать пространство информативных признаков, оценить его информативность и выбрать адекватный математический аппарат исследования;
- предложить метод определения информативных показателей для оценки функциональных состояний человека на основе моделей Г. Раша;
- разработать метод синтеза решающих правил классификации и оценки уровня утомления и психоэмоционального напряжения, вызываемых процессом обучения;
- предложить информационно-аналитическую модель прогнозирования и ранней диагностики заболеваний, провоцируемых интенсивным процессом обучения;
- произвести модификацию модели Г. Раша для решения задач оценки эффективности лечебно-профилактических мероприятий;
- изучить структуру заболеваний студентов многопрофильного вуза и получить систему гибридных нечетких моделей для оценки уровней психоэмоционального напряжения и утомления, прогнозирования и ранней диагностики ведущих психосоматических заболеваний (для ЮЗГУ - заболевания желудка);
- предложить алгоритм управления и структуру интеллектуальной системы поддержки принятия решений по оценке и управлению состоянием здоровья студентов;
- провести апробацию предложенных методов и средств на репрезентативных контрольных выборках.
Научная новизна исследовании. В диссертации получены следующие результаты, характеризующиеся научной новизной:
- метод формирования пространства информативных признаков для классификации и оценки уровней психоэмоционального напряжения и утомления, развивающихся в процессе обучения, отличающийся использованием теории измерения латентных переменных на основе математической модели Г. Раша, позволяющий учитывать скрытую и нечеткую природу исследуемого класса функциональных состояний человека, через систему четко измеряемых признаков;
- метод синтеза решающих правил классификации и оценки уровня утомления и психоэмоционального напряжения, основанный на использовании линейного многомерного анализа, интерактивных методов двумерной классификации и латентных переменных с нечеткой логикой принятия решений о результатах классификации с учетом пространственно-временных параметров, позволяющий синтезировать соответствующие математические модели, работающие в условиях плохой формализации исследуемых функциональных состояний человека;
- информационно-аналитическая модель прогнозирования и ранней диагностики заболеваний, провоцируемых процессом обучения, отличающаяся использованием коллективного нечеткого агрегатора, объединяющего гетерогенные нечеткие правила оценки уровней психоэмоционального напряжения и утомления совместно с прогностическими и диагностическими математическими моделями, использующими индивидуальные факторы риска, позволяющие решать искомые классы задач с достаточной для медицинской практики точностью, в условиях латентного, неполного и нечеткого описания исходных данных, причем количество входных моделей принятия решений коллективного нечеткого агрегатора оптимизируется при использовании теории измерений латентных переменных с моделью Г. Раша;
- метод оценки эффективности лечебно-профилактических мероприятий, отличающийся использованием теории измерения латентных переменных на основе модели Г. Раша, позволяющий производить выбор рациональных схем лечения с количественным и качественным анализом каждой из составляющих исследуемых процедур лечения и профилактики;
- коллектив гибридных нечетких моделей для оценки уровней психоэмоционального напряжения, утомления, прогнозирования и ранней диагностики заболеваний желудка, вызванных интенсивным процессом обучения, основанный на использовании модифицированных правил нечеткого вывода Л.Заде, теории уверенностей Е. Шортлифа в сочетании с логистической моделью Г.Раша, позволяющий обеспечивать уверенность в прогнозе исследуемых заболеваний на уровне 0,87, а в раннем диагнозе - на уровне 0,93;
- алгоритм прогнозирования, оценки и управления состоянием здоровья студентов в условиях воздействия на их организм длительных психоэмоциональных перегрузок, отличающийся возможностью гибкой смены тактики оценки состояния и управления в зависимости от структуры факторов
риска и индивидуальных особенностей организма, что позволяет обеспечивать требуемое для практики качество работы интеллектуальной системы поддержки принятия решений.
Теоретическая и практическая значимость работы состоит в том, что разработаны методы формирования пространства информативных признаков на основе моделей Г. Раша, синтеза коллективов нечетких решающих правил для классификации и оценки уровней психоэмоционального напряжения и утомления, прогнозирования и ранней диагностики психосоматических заболеваний! связанных с интенсивным учебным процессом. При использовании предложенных методов получены математические модели прогнозирования и ранней диагностики заболеваний желудка, появлению и развитию которых способствует интенсивный процесс обучения.
Применение предложенных в диссертации методов и средств позволяет улучшить качество медицинского обслуживания студентов, находящихся под воздействием психоэмоциональных перегрузок, вызываемых процессом обучения.
Методы исследований. Для решения поставленных в работе задач использовались методы синтеза биотехнических систем, системного анализа, моделирования, теории проектирования сложных информационных систем^ теории распознавания образов, теории нечетких множеств, теории измерения латентных переменных, теории уверенности, прикладной математической статистики, экспертного оценивания. При разработке интеллектуальной системы в качестве инструментария использовалась среда Matlab 7.10 (R210a) со встроенным пакетом Fuzzy Logic Toolbox, диалоговый пакет RUMM 2020.
Положения, выносимые на защиту:
1. Методы формирования пространства информативных признаков и синтеза решающих правил классификации и оценки уровней психоэмоционального напряжения и утомления, основанные на использовании интерактивных методов классификации, многомерного анализа и моделей Г.Раша, позволяющие решать задачи синтеза, соответствующих нечетких математических моделей принятия решений, работающих с плохоформализуемой структурой данных.
2. Информационно-аналитическая модель прогнозирования и ранней диагностики заболеваний, провоцируемых процессом обучения, использующая коллектив гибридных нечетких решающих правил, построенных на основе теории измерения латентных переменных с моделью Г. Раша, нечеткой логики Л. Заде, теории уверенности Е. Шортлифа и интерактивных классификационных моделей' позволяющая решать задачи прогнозирования и ранней диагностики заболеваний,' появляющихся и развивающихся под воздействием длительного интенсивного процесса обучения и индивидуальных факторов риска.
3. Математические модели прогнозирования и ранней диагностики заболеваний желудка, вызываемых интенсивным процессом обучения в многопрофильном вузе (Юго-Западный государственный университет, г. Курск), обеспечивающие уверенность в правильной классификации не ниже 0,87.
4. Алгоритм прогнозирования, оценки и управления состоянием здоровья студентов обеспечивает функционирование соответствующей интеллектуальной системы поддержки принятия решений и ее взаимодействие с лицом, принимающим решения.
Степень достоверности и апробации результатов. Результаты исследования показали их воспроизводимость в различных условиях, непротиворечивость концепциям системного анализа и теории синтеза биотехнических систем, а также аналогичным результатам, полученным другими исследователями. Методы и алгоритмы прогнозирования и оценки состояния здоровья студентов построены на теории распознавания образов и согласуются с ранее опубликованными экспериментальными данными по теме диссертации.
Предложенные в работе методы, модели и алгоритмы переданы и используются в учебном процессе кафедры биомедицинской инженерии Юго-Западного государственного университета при обучении студентов специальностей: 200401 «Биотехнические и медицинские аппараты и системы» и 200402 «Инженерное дело в медико-биологической практике», в медицинской практике ОБУЗ «Курская городская больница №2» и БМУ «Курская областная клиническая больница» Комитета здравоохранения Курской области.
Основные положения и результаты диссертационной работы докладывались на всероссийских и международных конференциях и семинарах. Основные из них: II Международная научно-практической конференция студентов и аспирантов «Математика и её приложения в современной науке и практике» (Курск, 2012); X Международная научно-техническая конференция «Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации «Распознавание - 2012» (Курск, 2012); IV Международная молодежная научная конференция «Молодежь и XXI век -2012» (Курск, 2012); Международная научно-практическая конференция «Интерактивные процессы в науке-2013» (Москва, 2013); III студенческая региональная научно-техническая конференция «Биомедицинские и технические системы: анализ, проектирование, управление» (Курск, 2013); XVII Международная научно-техническая конференция «Медико-экологические информационные технологии-2014» (Курск, 2014); X Russian-German conference on biomedical engineering (Saint Petersburg, 2014); Международная научно-практическая конференция «Наука и образование: проблемы и перспективы развития» (Тамбов, 2014); Всероссийская научно-практическая конференция «Научный взгляд на современный этап развития общественных, технических, гуманитарных и естественных наук. Актуальные проблемы» (С. Петербург, 2014), а также на научно-технических семинарах кафедры биомедицинской инженерии ЮЗГУ (Курск - 2013, 2014).
Структура и объем работы. Диссертация состоит из введения, четырех разделов, заключения, библиографического списка, включающего 128 отечественных и 62 зарубежных наименований, и приложения. Работа изложена на 176 листах машинописного текста, содержит 46 рисунков и 36 таблиц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы, определяются цели и задачи исследования, научная новизна и практическая значимость работы.
Первый раздел посвящен анализу современных подходов к решению задач прогнозирования и ранней диагностики состояния здоровья студенческой молодежи, находящейся под воздействием психоэмоционального напряжения и утомления, связанных с интенсивностью учебного процесса. Определяются пути по улучшению качества управления состоянием здоровья учащейся молодёжи. Обосновывается использование методов системного анализа, включая теорию нечеткой логики принятия решений, теорию измерения латентных переменных на основе модели Г. Раша и информационных технологий.
В заключении первого раздела формулируются цель и задачи исследования.
Во втором разделе разрабатываются методы синтеза коллективов нечётких решающих правил прогнозирования и диагностики патологии студентов с использованием теории измерения латентных переменных на основе моделей Г.Раша.
Одним из первых этапов при решении классификационных задач является задача формирования пространства информативных признаков, характеризующих затраты физиологических и психических ресурсов человека в ходе реализации учебного процесса (умственное утомление (УУ) и психоэмоциональное напряжение (ПЭН)) .
В свою очередь психоэмоциональное напряжение и утомление являются интегральными показателями, неподдающимися непосредственному измерению. Эти показатели являются латентными (скрытыми) переменными, которые нельзя измерить непосредственно, эти переменные проявляются посредством некоторого набора измеряемых информативных признаков (индикаторов). Работами многочисленных исследователей было показано, что для изучения латентных переменных целесообразно использовать аппарат теории измерения латентных переменных на основе моделей Г. Раша, который хорошо зарекомендовал себя при решении поставленных в работе задач.
С учётом сказанного в работе предлагается метод определения информативных показателей для оценки функциональных состояний человека на основе моделей Г. Раша, состоящий из следующих основных этапов.
1. На экспертном уровне определяется состав информативных признаков (индикаторных переменных), характеризующих латентные переменные: уровень утомления (YU) и психоэмоционального напряжения (YP).
2. Количественные шкалы индикаторных переменных X¡ переводятся в качественные шкалы K¡, в результате чего все индикаторы изменяются в одном диапазоне.
3. С использованием интерактивного пакета RUMM 2020 теоретические зависимости моделей Г. Раша по каждой из индикаторных переменных сравниваются со средними значениями результатов экспериментальных измерений по критерию Хи-квадрат (¿ритич Ргоб).
4. Если находятся индикаторные переменные, для которых Скрипт.Рго6<0,05, то они исключаются из списка информативных признаков, после чего повторяется пункт 3.
5. На заключительном этапе выбора списка информативных признаков реализуется контрольная проверка соответствия между уровнем интегрального показателя латентной переменной и значимостью информативных признаков (индикаторов). Считается, что средняя значимость информативных признаков (индикаторов) не должна отличаться от среднего уровня интегрального показателя более чем на 0,5 логит (Г. Раш). Если это условие выполняется, то можно сделать вывод о том, что система информативных признаков (индикаторов) соответствует измеряемой латентной переменной и набор используемых информативных признаков (индикаторов) является эффективным для целей измерения обобщенной латентной переменной.
Используя теорию измерения латентных переменных с моделью Г. Раша, можно не только получить число, обозначающее информативность того или иного признака, но и дать развёрнутое описание ряда его качественных свойств: способность дифференцировать уровни функциональных состояний; способность признака дифференцировать исследуемую латентную переменную в противоположность ожидаемой ситуации; определять признаки со сверхвысокой и сверхнизкой дискриминирующей способностью, признаки с «неупорядоченным» ответом и т. д.
Такая гибкость анализа системы информативных признаков на основе модели Г. Раша позволяет рекомендовать её как один из основных механизмов проведения разведочного анализа при решении общих задач синтеза моделей вычисления латентной переменной в прогностических и диагностических решающих правилах.
В результате проведённых исследований было показано, что существующие методы и средства классификации и оценки уровня психоэмоционального напряжения и утомления не обеспечивают требуемого качества принятия решений, удовлетворяющих поставленным в работе целям и задачам. Поэтому, с целью повышения точности количественной оценки исследуемых параметров в работе предлагается метод синтеза решающих правил классификации и оценки уровня утомления и психоэмоционального напряжения на основе использования линейного многомерного анализа, интерактивных методов двумерной классификации, теоретических аспектов измерения латентных переменных на основе модели Г. Раша и нечёткой логики принятия решений, реализуемый следующей последовательностью действий.
1. Если в ходе проведения разведочного анализа по репрезентативной обучающей выборке с известными уровнями ПЭН и утомления программа 1ШММ 2020 строит адекватные модели взаимосвязей латентных переменных уровней ПЭН (УР) и утомления (Уи) с информативными признаками Х^ переведёнными в качественные шкалы Кр то соответствующие уровни функциональных состояний определяются выражениями:
где и - функционалы связей индикаторных и латентных переменных; I - количество индикаторных переменных.
2. При отсутствии репрезентативных обучающих выборок и при условии наличия экспертов, готовых строить нечеткие функции принадлежности к понятиям уровней ПЭН и утомления с базовыми переменными, на исходных шкалах информативных признаков Х1 синтезируются нечеткие решающие правила типа:
^ = ™ = (2) где цР{Х,) и //„(X,)
- функции принадлежности к понятиям уровень ПЭН и утомления соответственно; и Р^у - соответствующие функции агрегации.
Вид и
параметры функций принадлежности и функций агрегации выбираются в соответствии с общими рекомендациями по синтезу гибридных нечётких моделей, разработанных на кафедре биомедицинской инженерии (БМИ) Юго-Западного государственного университета (ЮЗГУ).
3. Если в ходе разведочного анализа с анализом структуры многомерных данных с использованием двумерных отображающих пространств Ф = ^хГ2 в этих пространствах получается приемлемое для практики качество классификации исследуемых функциональных состояний, то, используя двумерное классификационное пространство Ф, на обучающей выборке определяются границы классов состояний а1(£ = Р,и) и семейства плоскостей с
функциями отклика Ъ (третья координата), соответствующие уровням ПЭН и утомления 2Ри2(/:
2Р=Р, (¥,,¥,), 21]=Р{](Ух,Гг), (3)
где У1 =<р1(А,Х); Г2 =р2(П,Х); р,; <р2 - функции отображения; А и В - вектора настраиваемых параметров; Х- вектор индикаторных переменных.
Искомое семейство плоскостей определяется пакетом МаШсаё при решении уравнений вида 6<Л(ихУх1У) = 0, где и, V, IV - вектора пространства {}; х Г2 х г}.
С классификационной точки зрения, если объект удовлетворяет выражению 2г=рг(у„У2), то он относится к классу сор (ПЭН), если выражению 2и то-к классу а>и (утомление).
Уровни ПЭН и утомления определяются выражениями:
ГР = гр.КУ{ир.Т„р/, ги = 2и.куаи.таиг. (4)
В выражениях (4) КУШр и КУЩ] - коэффициенты уверенности в принадлежности объекта к классам соР и сои , определяемые в соответствии с выражениями „ = где и
функции принадлежности к классам о)Р и ыя с базовыми переменными, определяемыми как расстояния от объектов исследования до плоскостей класса £ (£ = Р,1/) с номером д.
Временные поправки и в выражениях (4) позволяют учитывать тот
факт, что различные психосоматические заболевания с идентификатором г возникают и развиваются при достаточно длительном воздействии исследуемых факторов риска.
4. При выполнении всех или части условий п.1, п.2, п.З, с целью повышения точности оценки уровня ПЭН и утомления, все полученные модели агрегируются в коллектив решающих правил вида:
уР - а'ГР< + а2ГР-> + агЩ . ги ДШ, + АГО, + ДГО,
«,+а2+а3 ' р{ + рг + /Зъ ' ( >
где а, и Р} - весовые коэффициенты, определяющие вклад каждого из решающих правил, использующих различные подходы к обработке данных, в коллективные решения.
Кроме длительного психоэмоционального напряжения и утомления, существенным фактором риска появления и развития заболеваний является образ жизни, в сочетании с индивидуальными особенностями организма. Учитывая особенности пространства информативных признаков, а также сложность формализованного описания исследуемого класса состояний, для решения поставленных в работе задач предлагается концептуальная информационно-аналитическая модель принятия решений о состоянии здоровья обучающихся, приведенная на рисунке 1.
В этой модели оценки уровней ПЭН и утомления синтезируются в соответствии с описанными выше методами. Для них в качестве информативных признаков используются показатели внимания, измеряемые аппаратурой, разработанной на кафедре БМИ ЮЗГУ. Модели принятия решений о состоянии здоровья обучающихся по индивидуальным факторам риска (ИФР) и экологическим факторам риска (ЭФР) с учётом поправок на защитные свойства организма (Ш) синтезируются по общим правилам синтеза гибридных нечётких моделей (работы кафедры БМИ ЮЗГУ). По этим же правилам синтезируется коллективный, нечёткий агрегатор, использующий следующую систему элементарных нечётких решающих правил:
иоуг=Маг(дку, исог = ^{ог)- иок=МаФкг).
(6)
£л®г(?+1) = £/05г(9)+лу;(г,)[1-£/е5,(?)], (8)
где 1ЮУГ - уверенность в классификации с использованием последовательной процедуры Вальда; ДК - диагностический коэффициент по Вальду; ца (0 -функция принадлежности к классу сог с базовой переменной С>; <3= ДК, Д., Оь, Хр Угу, иСВ, -уверенность в классификации а>г по границам классов в двумерном отображающем пространстве; Бг - расстояние от объекта исследования до
Рисунок 1 — Информационно-аналитическая модель принятия решений о состоянии
здоровья обучающихся
отображений границ класса сог; 1Ю11Г - уверенность в классификации со, относительно разделяющих поверхностей в многомерном пространстве признаков; Дг - расстояние от объекта исследования до элемента границы к класса сог; 11СБГ - уверенность в классификации с использованием нечётких классификационных операций по Л.Заде; ^ - функция агрегации; Уь -комплексные показатели, вычисляемые по группам исходных признаков X};
иОБг(д) - уверенность в классификации, вычисляемая по Е. Шортлифу; КУг{2р) - уверенность в гипотезе сог от свидетельства (информативного
признака Хр интегрального показателя У[) 2Р;
Кроме традиционных способов агрегации, в случае доказанной адекватности моделям Г. Раша целесообразно использовать агрегационную модель вида:
и(} _ а, • ЦОБг +а2 -1ЮУГ + аъ ■ 1ЮРГ + ал ■ ЦС2Г + а5 • С/СД, '■ а, + а2 + аз + а4 + а5
Рассматривая результаты работы коллективного решающего правила как латентные переменные, а результаты работы частных решающих правил ийНг, и О Уг, СЮОг ,1Ю8Г, иа1г - как индикаторные переменные, и, используя логистические модели Г. Раша, определяем целесообразность включения частных моделей в коллективные выражения (9) и значений весовых коэффициентов а}
(/=1.....5).
Наряду с классификационными свойствами модели Г. Раша в работе исследована возможность её использования для оптимизации лечебно-оздоровительных мероприятий. Для решения этой задачи предложен метод оценки эффективности лечебно-профилактических мероприятий, отличающийся использованием теории измерения латентных переменных на основе модели Г. Раша с использованием диалоговой программы 1ШММ 2020, позволяющий производить выбор рациональных схем лечения с количественным и качественным анализом каждой из составляющих исследуемых процедур лечения или профилактики. Наиболее эффективная индикаторная переменная (процедура проведения лечебно-профилактических мероприятий) определяется максимальным значением логита по шкале индикаторных переменных.
Третий раздел посвящен вопросам разработки основных элементов интеллектуальной системы поддержки принятия решений по прогнозированию и ранней диагностике заболеваний.
Центральным блоком интеллектуальной системы поддержки принятия решений является база знаний, формируемая из коллективов нечетких решающих правил для прогнозирования и ранней диагностики заболеваний студентов, вызываемых комплексным действием психоэмоциональных перегрузок и утомления, возникающих в процессе обучения.
На этапе предварительного исследования из всего перечня заболеваний нами были отобраны заболевания желудочно-кишечного тракта, а именно гастрит и язва желудка, которые по данным статистики служб здравоохранения г. Курска наиболее распространены среди учащейся молодежи ЮЗГУ.
В ходе исследований в рамках данной работы было установлено, что одним из основных факторов риска в появлении и развитии выбранного класса заболеваний являются длительные нервно-психические перенапряжения и утомление, возникающие в процессе обучения, которые могут усиливаться бытовыми, социальными и индивидуальными условиями.
Для решения поставленной задачи было сформировано пространство признаков для классификации и оценки уровней психоэмоционального напряжения и утомления. С использованием модели Г. Раша и диалоговой программы RUMM 2020. было установлено, что наиболее информативными показателями являются концентрированность, переключаемость и устойчивость внимания, что хорошо согласуется с проверкой информативности по Кульбаку и с полученными ранее результатами. В связи с этим, было принято решение провести разведочный анализ структуры данных в трехмерном пространстве признаков по отношению к их классификационным возможностям.
С учётом результатов анализа и в соответствии с разработанным во второй главе методом синтеза решающих правил классификации и оценки уровня утомления и ПЭН было получено двумерное отображающее классификационное пространство вида: Ф = 71x72, где Y\ = Хп + Хк\ У2 = Х ; X =Х3-Х •
^к ~Х20; Xy=X4-Xi0; Х20, Х30 и Xi0 - показатели переюпочаемости,
концентрированное™, устойчивости, измеряемые в состоянии спокойного бодрствования.
Для формирования объектов обучающей выборки и значений функций отклика по уровню ПЭН и утомления использовались внешние критерии дающие достаточно точные оценки исследуемых показателей. На объектах обучающей выборки методами векторного анализа были получены кусочно-линейные трехмерные плоскости, принадлежность к которым позволяет судить об уровне ПЭН (УРТ) и утомления (YUT) (выражения 3), которые в силу нечёткой природы решаемой задачи уточняются с помощью соответствующих функций принадлежности и временных поправок (выражения 4).
Проведённые исследования показали, что для надёжного прогнозирования и ранней диагностики исследуемых классов заболеваний показателей уровней ПЭН и утомления недостаточно. Для достижения достаточной практической надежности эксперты предложили расширить список информативных признаков Для класса прогнозирования заболеваний желудка (гастрит и язва (класс а>пяд) дополнительно вводятся следующие признаки: прием лекарственных средств раздражающих слизистую оболочку желудка (глюкокортикоиды, нестероидные противовоспалительные средства и др.) G!; употребление алкоголя Al; курение Кг-заболевания желудочно-кишечного тракта у близких родственников (матери' отца, тети, дяди, брата, сестры) Вг; разбаланс энергетических характеристик
ГсГ™Н"Х,б"ГГИЧеСКИ активных точек- связанных с заболеваниями желудка (Ь21, Ь36, V21, V43, и VB24). По каждому из выделенных классов риска включая уровни ПЭН и утомления в соответствии с методом синтеза, описанным во второй главе, были получены функции прогностической уверенности которые агрегируются в финальные решающие прогностические правила типа (8):
VFnX{q + *) = UF[m(q) + UF'Im{q + W-UFn>K{q)}, (Ю)
где q - номер итерации; UFnx{X) = {/^(1); UF*nx{q)- частные составляющие уверенности в прогнозе возникновения исследуемых заболеваний желудка по
данным опроса, уровням ПЭН и утомления, энергетической реакции биологически активных точек.
Для задачи ранней диагностики заболеваний желудка (класс сорж) эксперты сформировали следующий список информативных признаков:
- адаптационный потенциал (АП) организма, определяемый по Р.Баевскому через индекс функциональных изменений ИФИ;
- энергетический разбаланс (ЭР) общесистемных БАТ;
- наличие визуальных аномалий на БАТ ушной раковины;
- электрическое сопротивление БАТ, связанных с заболеванием желудка.
Для этого блока признаков было получено семейство функций уверенности
в ранней стадии заболеваний желудка, которые агрегируются решающим правилом типа (10) со «своими» составляющими UFPJK.
Математическое моделирование UFPJK показало, что для наиболее распространённых значений информативных признаков уверенность в правильной классификации достигает значения 0,92.
Результаты математического моделирования и их экспертная оценка позволили сделать вывод о том, что в задаче прогнозирования (выражение 10) наблюдается широкая зона неопределённости при относительно низком качестве принятия решений на уровне 0,84. В связи с этим было принято решение продолжить синтез решающих правил с применением модели Г. Раша, и в качестве латентной переменной выбрана величина уверенности в прогнозе заболеваний ЖКТ - UFFn>K. В качестве индикаторных переменных выбраны факторы риска: Gl, Al, Тк, Вг, энергетический разбаланс точек (£21, £36, F21, К43, VB24), YP, YU.
Гистограмма распределения факторов с различным риском заболевания желудка, построенная пакетом RUMM 2020, приведена на рисунке 2.
Person Frequency Distribution
i i (Grouping Set to Inter«! Leogth of 0.20 making 60 Groups)
Рисунок 2 — Распределение интегрального показателя «прогноз возникновения заболеваний ЖКТ» и функция принадлежности к классу со•пж с базовой переменной
и^пж (сплошная линия)
Анализ гистограммы, представленной на рисунке 2, показывает, что .данные группируются в три блока, которые с учётом данных разведочного анализа и
экспертных заключений легко интерпретируются как: обследуемые, не заболевшие исследуемым классом заболеваний (левый блок данных - 1-я группа); обследуемые с индикаторными переменными, составляющими «зону неопределённости» (средний блок данных - 2-я группа); обследуемые, которые в процессе обучения получили заболевания ЖКТ (правый блок данных - 3-я группа). Применяя методы дисперсионного анализа, определили, что различия между 1-ой и 3-ей группами (Ррасч=7,227>Рта6=2,35) и между 1-ой и 2-ой группами (Ррас,=3,285> Рта6=2,35) статистически значимы, а различия между 2-ой и 3-ей группами (РраСч=2,12 < ртаб=2,35) статистически не значимы, что подтверждает нечёткую природу класса «высокий риск заболевания желудка» и является «подсказкой» экспертам о выборе формы и параметров функции уверенности улж(иРРпж) к классу аш с базовой переменной иРР*пж, полученной на модели Г. Раша (сплошная линия на рисунке 2).
Полученный результат работы пакета 1ШММ 2020 показывает, что модель Г. Раша может быть использована для решения задач прогнозирования заболеваний с уверенностью в искомом прогнозе, определяемом по формуле
^пж^УщА^пж)- (11)
Разведочный анализ, проведённый по исходным данным, образующим зоны неопределённости для правил (10) и (11), показал, что эти зоны в значительной степени формируются различными объектами обучающей выборки, что позволило в качестве агрегирующего коллективного прогностического правила выбрать выражение
и1Ш=тах(иРпж, 0,9-иР11пж). (12)
Коэффициент 0,9 перед иРЯпж определили эксперты, как коэффициент доверия к решающему правилу, полученному с помощью модели Г. Раша.
Результат математического моделирования показал, что для наиболее распространённых значений фактора риска уверенность в принимаемых решениях по модели (12) составляет 0,88.
В четвертом разделе разрабатываются алгоритм управления процессом принятия решений, основные элементы интеллектуальной системы поддержки принятия решений (ИСППР) и обсуждаются результаты проверки полученных решающих правил на репрезентативных контрольных выборках.
Алгоритм управления процессом принятия решений (АУППР) решает задачи управления взаимодействием между различными программными модулями ИСППР и с лицом, принимающим решение (ЛПР) и внешней технической аппаратурой.
Укрупнённо алгоритм управления системой состоит из следующих основных блоков:
Блок обучения решает задачи синтеза решающих правил для оценки уровней ПЭН и утомления и математических моделей прогнозирования, ранней и дифференциальной диагностики исследуемых классов заболеваний. Результатом
работы этого блока является наполнение базы знаний ИСППР.
Блок прогнозирования решает задачу оценки уверенности в прогнозе появления исследуемых классов заболеваний с использованием различных типов факторов риска.
Блок ранней диагностики - задачу наличия ранней стадии исследуемой болезни.
Блок профилактики и лечения ориентирован на формирование рекомендаций по выбору схем управления состоянием здоровья человека.
Предлагаемая ИСППР (рисунок 3) решает задачи управления процессами прогнозирования, ранней и дифференциальной диагностики, профилактики и лечения больных, страдающих заболеваниями желудка, с учетом индивидуальных особенностей организма пациента.
Обследуемый
Подсистема обучения
Пакет 1ШММ 2020
Пакет ДКДКП
Пакет Ма1ЬСАО
Пакет синтеза НРП
I_____________
СУБД
Ж
Поде »стен а тринятю решений (БЗ)
Модуль расчета УР,
уи, уг
Модуль оденки ЭХ БАТ
Пакет 1ШММ 2020
Модуль прогнозирвоаии*
Модуль диагностики
Модуль формирования схем
профилактики и _лечения_
Ж
Рисунок 3- Структурная схема ИСППР
В этой схеме регистрация электрических сопротивлений БАТ и показателей внимания, используемых в прогностических и диагностических решающих правилах, обеспечивается блоком регистрации психофизиологической информации (БРПФИ), данные с которого через драйвер связи (ДС) передаются системой управления базой данных (СУБД) в соответствующую базу (БД). Для синтеза необходимого набора решающих правил используются: блок разведочного анализа (БРА), пакет диалогового конструирования двумерных классификационных пространств (ДКДКП) и пакет синтеза нечётких решающих правил (НРП) кафедры БМИ ЮЗГУ. Кроме того, в процессе обучения используются стандартные пакеты 1ШММ 2020 и МаЙ1са<1. Последовательность использования и взаимодействия этих пакетов описана во втором разделе. Взаимодействие ЛПР и ИСППР обеспечивается через интерфейс пользователя (ИП), работающий в многооконном режиме. Принятие решений о состоянии обследуемых осуществляется с помощью набора соответствующих программных модулей и пакетов, включая: модуль расчёта уровней ПЭН (УР), утомления (УСТ) и защиты (У2); модуль оценки энергетических характеристик БАТ (ЭХБАТ); пакет ЯиММ 2020; модуль прогнозирования, реализующий нечёткую модель (12); модуль диагностики, реализующий модифицированную модель (10); модуль формирования схем профилактики и лечения. Порядок синтеза и работы перечисленных модулей приведён в третьем разделе. Управление взаимодействием всех элементов и подсистем ИСППР обеспечивается алгоритмом управления АУППР.
Полученные нечёткие решающие правила формировались на основе субъективных представлений экспертов о решаемом классе задач. Для объективизации полученных результатов проводились статистические испытания нечётких решающих правил на репрезентативных контрольных выборках.
Объёмы выборок определялись в соответствии с рекомендациями принятыми в теории распознавания образов и отбирались таким образом, чтобы число незаболевших и заболевших студентов оставалось постоянным и составляло 100 человек на каждый класс. Это позволяло на каждом этапе исследований не нарушать выбранной за эталон оценки вероятности правильной классификации на уровне 0,95.
Качество классификации определяется по таким показателям, как диагностическая чувствительность (ДЧ), диагностическая специфичность (ДС), прогностическая значимость (положительных П3+, и отрицательных П3~) результатов и диагностическая эффективность (ДЭ).
Наблюдения за студентами проводились четыре года. В начале каждого года наблюдения осуществлялось измерение всех показателей, отобранных для оценки прогноза появления заболевания с расчётом иРпж (Ю) и Шв. (12). В качестве порога дефазиффикации (разделение на незаболевших и заболевших) эксперты назвали уровень 0,5. Результаты сопоставления показателей по годам наблюдения для моделей иРпж и 1ЛШ приведены в таблице 1.
Таблица 1 - Сопоставление моделей Шпж и 1ЛЮ по показателям качества и годам наблюдений
----соднабл. 1 2 3 4
ДЧ иРпж 0,6 0,75 0,8 0,85
шо 0,65 0,79 0,89 0,93
ДС иРпж 0,95 0,93 0,93 0,92
ияэ 0,96 0,94 0,92 0,91
П3+ иРпж 0,92 0,91 0,91 0,91
ияа 0,94 0,93 0,91 0,91
ПЗ" иРпж 0,7 0,79 0,82 0,86
1ЛЮ 0,73 0,82 0,89 0,93
ДЭ иРпж 0,77 0,84 0,86 0,88
ияа 0,81 0,86 0,95 0,92
Анализ данных таблицы 1 показывает, что показатели ДЧ, ПЗ", ДЭ растут от года к году у обоих решающих правил, причём математическая модель 1ЛШ «работает» лучше модели иРпж по всем годам наблюдения.
К третьему году обучения качество прогнозирования достигает приемлемых для медицинской практики значений, особенно для математической модели (12) (уверенность в прогнозе ШЮ). С учётом этого эксперты выбрали трёхлетний срок как надёжное время прогноза заболеваний желудочно-кишечного тракта.
Показатели ДС и П3+ остаются высокими для всех периодов наблюдения. Это говорит о том, что полученные решающие правила «мало ошибаются» по классу здоровых людей. Основная ошибка полученных решающих правил приходится на класс сопж.
В ходе организации экспериментальной проверки качества работы решающего правила ранней диагностики заболеваний желудка ежегодно отбирались по 100 человек, не приобретших исследуемые заболевания желудка, и 100 человек с подтверждённой ранней стадией. В отличие от прогностических правил расчёт производится по таким показателям, как ДЧ, ДС, ДЭ. Анализ тенденции изменения показателей качества классификации по значениям ДЧ, ДС, ДЭ показывает, что все анализируемые показатели качества достаточно стабильно держатся на приемлемом для медицинской практики уровне.
В заключении сформулированы основные результаты, полученные в диссертационной работе.
В приложении приведены результаты экспериментальных данных.
Основные результаты, полученные в диссертации:
1. Сформировано пространство информативных признаков для решения задач классификации и оценки уровня психоэмоционального напряжения и утомления, информативность которого проверена с использованием теории измерения латентных переменных на основе модели Г. Раша, что позволило уточнить соответствующие модели принятия решений и выбрать математический аппарат исследования.
2. Предложен метод определения информативных показателей для классификации и оценки уровней психоэмоционального напряжения и утомления, развивающихся в процессе обучения, позволяющий учитывать скрытую и нечёткую природу исследуемого класса комплексных психофизиологических свойств человека через систему четко измеряемых признаков.
3. Разработан метод синтеза решающих правил классификации и оценки уровня утомления и психоэмоционального напряжения, позволяющий получить систему математических моделей, решающих задачи нечёткой классификации и оценки уровня искомых психофизиологических показателей в условиях неполного и нечёткого представления исходных данных с пересекающейся структурой классов.
4. Предложена информационно-аналитическая модель прогнозирования и ранней диагностики заболеваний, провоцируемых процессом обучения, использующая коллектив гибридных нечетких решающих правил, построенных на основе теории измерения латентных переменных с моделью Г. Раша, нечеткой логики Л. Заде, теории уверенности Е. Шортлифа и интерактивных классификационных моделей, позволяющая решать задачи прогнозирования и ранней диагностики заболеваний, появляющихся и развивающихся под воздействием длительного интенсивного процесса обучения и индивидуальных факторов риска.
5. Предложен метод оценки эффективности лечебно-профилактических мероприятий, отличающийся использованием теории измерения латентных переменных на основе модели Г. Раша, позволяющей производить выбор рациональных схем лечения с количественным и качественным анализом каждой из составляющих исследуемых процедур лечения или профилактики.
6. Изучена структура заболеваемости студентов многопрофильного вуза и получен коллектив правил прогнозирования и ранней диагностики заболеваний желудочно-кишечного тракта, основанный на использовании модифицированных правил нечёткого вывода Л. Заде, теории уверенности Е. Шортлифа в сочетании с логистической моделью Г. Раша, позволяющий обеспечивать уверенность в прогнозе искомых заболеваний на уровне 0,87, а в раннем диагнозе - на уровне 0,93.
7. Предложены алгоритм управления и структура интеллектуальной системы поддержки принятия решений, обеспечивающие решение задач прогнозирования, диагностики, рационального выбора схем профилактики и лечения заболеваний, вызываемых индивидуальными факторами риска и длительным, интенсивным процессом обучения с требуемым для медицинской практики качеством и удобным пользовательским интерфейсом.
8. Проанализирована эффективность предложенных методов, моделей, алгоритмов и программных средств на репрезентативных контрольных выборках. Доказана эффективность их использования на примере студентов, обучающихся в Юго-Западном государственном университете, и разработаны рекомендации по их применению.
Список научных работ, опубликованных по теме диссертации
Публикации в рецензируемых научных журналах и изданиях
1. Бойцов, A.B. Оценка риска заболеваемости студентов на основе комбинированных нечетких моделей / A.B. Бойцов, JI.B. Стародубцева, В.Н. Гадалов // Системный анализ и управление в биомедицинских системах. - 2012.-Т.11.-№1,-С. 188-195.
2. Бойцов, A.B. Нечеткая оценка уровня функционального резерва человека / С.Ф. Яцун, A.B. Бойцов // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение- 2012. №2. ч. 3. - С. 271-275.
3. Бойцов, A.B. Синтез решающих правил для оценки уровня психоэмоционального напряжения и утомления с использованием двумерных классификационных пространств и векторной алгебры / В.И. Серебровский, A.B. Бойцов, А.Н. Шуткин, С.Н. Кореневская // Известия Юго-Западного государственного университета. 2014. №5(56).-С. 58-63.
4. Бойцов, A.B. Синтез решающих правил для прогнозирования заболеваний желудка на основе моделей Г. Раша / H.A. Кореневский, A.B. Бойцов, В.Г. Никитаев, А.Н. Шуткин // Известия Юго-Западного государственного университета. 2014. №5(56).-С. 69-76.
Статьи и материалы конференций
5. Бойцов, А.В. Применение математических методов для прогнозирования и диагностики в медицине / A.B. Бойцов, С.Н. Кореневская // Математика и её приложения в современной науке и практике: матер. II Междунар. науч.-практ. конф. студентов и аспирантов. Курск, 2012. С.149-154.
6. Бойцов, A.B. Классификация функциональных состояний человека с использованием правил нечеткого принятия решений /A.B. Бойцов, О.И. Филатова, С.Н. Кореневская // Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание - 2012: сб. материалов X Междунар. науч.-техн. конф. Курск, 2012. С.311-313.
7. Бойцов, A.B. Построение нечетких классификаторов для медицинских и экологических приложений /A.B. Бойцов //Молодежь и XXI век - 2012: сб. матер. IV Междунар. молодежной научн. конф. Курск, 2012. - 4.2. С. 26-27.
8. Бойцов, A.B. Мозг человека и искусственный интеллект / В.К. Харитоненко, A.B. Бойцов // Интегративные процессы в науке-2013: матер. Междунар. науч.- практ. конф. - М., 2013 - С. 88-93.
9. Бойцов, A.B. Основные принципы ситуационного управления большими системами / Т.Н. Говорухина, A.B. . Бойцов // Биомедицинские и технические системы: анализ, проектирование, управление: сб. матер. III студенческой региональной науч.-техн. конф. Курск, 2013. - С. 27-30.
10. Бойцов, A.B. Использование латентных переменных для оценки усталости человека / В.А. Бойцов // Медико-экологические информационные технологии-2014: сб. матер. XVII Междунар. науч.-техн. конф. / Юго-Зап. гос. ун-т,-Курск, 2014.-С. 116-122.
11. Интеллектуальные медицинские системы с нечеткими коллективами решающих правил / А. Г.Устинов, С.Н. Кореневская, И.И. Хрипина, А.В. Бойцов // X Russian-German conference on biomedical engineering. Saint Petersburg 2014-C. 90-92. 6'
12. Оценка состояния сложных систем нечеткими коллективами гибридных решающих правил / И.А. Ключиков, М.И. Лукашов, Л.В. Стародубцева, А.В. Бойцов // Наука и образование: проблемы и перспективы развития: сб. науч. тр. по матер. Междунар. науч.-практ. конф. - Тамбов, 2014,- С. 81-85.
13. Использование теории измерений латентных переменных с моделью Г. Раша для оптимизации схем лечебно-оздоровительных мероприятий / Н.А. Кореневский, М.И. Лукашов, И.А. Ключиков, А.В. Бойцов // Научный взгляд на современный этап развития общественных, технических, гуманитарных и естественных наук. Актуальные проблемы: сб. науч. статей по итогам всероссийской науч.-практ. конф. - СПб., 2014. - С. 70-72.
14. Синтез коллективов нечетких решающих правил для решения классификационных задач в социотехнических системах / Н.А. Кореневский, Л.В. Стародубцева, А.В. Бойцов, И.И. Хрипина // Научный взгляд на современный этап развития общественных, технических, гуманитарных и естественных наук. Актуальные проблемы: сб. науч. статей по итогам всероссийской науч-практ конф. - СПб., 2014. - С. 72-76.
Подписано в печать 10.12.2014 г. Формат 60x84 1/16. Печатных листов 1,37. Тираж 100 экз. Заказ № 75 Юго-Западный государственный университет, 305040, г. Курск, ул. 50 лет Октября, 94 Отпечатано в ЮЗГУ
-
Похожие работы
- Разработка и реализация моделей измерения латентных переменных с нечеткими множествами данных
- Математические модели и комплексы программ для автоматизированной оценки результатов обучения с использованием латентных переменных
- Метод и алгоритмы измерения латентных переменных при управлении в образовательных системах
- Разработка системы измерения латентных переменных на основе модели Раша для контроля уровня знаний обучаемых
- Прогнозирование, донозологическая и дифференциальная диагностика мочекаменной болезни
-
- Приборы и методы измерения по видам измерений
- Приборы и методы измерения времени
- Приборы навигации
- Приборы и методы измерения тепловых величин
- Приборы и методы измерения электрических и магнитных величин
- Акустические приборы и системы
- Оптические и оптико-электронные приборы и комплексы
- Радиоизмерительные приборы
- Электронно-оптические и ионно-оптические аналитические и структурно-аналитические приборы
- Приборы и методы для измерения ионизирующих излучений и рентгеновские приборы
- Хроматография и хроматографические приборы
- Электрохимические приборы
- Приборы и методы контроля природной среды, веществ, материалов и изделий
- Технология приборостроения
- Метрология и метрологическое обеспечение
- Информационно-измерительные и управляющие системы (по отраслям)
- Приборы, системы и изделия медицинского назначения
- Приборы и методы преобразования изображений и звука