автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Информационная система классификации нозологических показателей

кандидата технических наук
Токмурзин, Павел Владимирович
город
Ижевск
год
2007
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Информационная система классификации нозологических показателей»

Автореферат диссертации по теме "Информационная система классификации нозологических показателей"

На правах рукописи

ТОКМУРЗИН Павел Владимирович

УДК 61 681 3+616-036 8

ИНФОРМАЦИОННАЯ СИСТЕМА КЛАССИФИКАЦИИ НОЗОЛОГИЧЕСКИХ ПОКАЗАТЕЛЕЙ (на примере Удмуртской Республики)

Специальности

05 13 18 - Математическое моделирование, численные методы и комплексы программ 05 13 01 - Системный анализ, управление и обработка информации (в машиностроении и вычислительной технике) ,

Автореферат на соискание ученой степени кандидата технических наук

ООЗОб135Э

Ижевск 2007

003061359

Работа выполнена в ГОУ ВПО «Ижевский государственный технический университет» (ИжГТУ)

Научные руководители

заслуженный изобретатель Российской Федерации, доктор технических наук, профессор Лялин В.Е.

кандидат физико-математических наук, доцент Ицков А.Г. Официальные оппоненты

доктор технических наук, профессор Куликов В.А. (ИжГТУ)

доктор физико-математических наук, профессор Летчиков А В (ГОУ ВПО «Удмуртский государственный университет»)

Ведущая организация

ОАО «НИИ супер ЭВМ» (г. Москва)

Защита состоится 22 августа 2007 г. в 16 00 часов

на заседании диссертационного совета Д 212 065 04

в ИжГТУ по адресу 426069, г Ижевск, ул Студенческая, 7, ауд 1 -4

Отзыв на автореферат, заверенный гербовой печатью, просим выслать по указанному адресу

С диссертацией можно ознакомиться в библиотеке ИжГТУ

Автореферат разослан 13 июля 2007 г

Ученый секретарь диссертационного совета, доктор технических наук, профессор

Б.Я. Бендерский

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящий момент все больше внимания уделяется вопросам развития и совершенствования методов анализа и учета данных для медицины Необходимость развития и совершенствования определяется расширением круга задач, который ставятся перед медицинскими учреждениями в связи с растущим количеством заболеваний и регрессу здоровья нации. Основным критерием состояния здоровья населения страны является комплекс нозологических показателей, определяемых учреждениями системы здравоохранения

Традиционно под нозологией понимается раздел патологии, включающий общее учение о болезни, а также изучение причин (этиология), механизмов развития (патогенез) и клинических особенностей отдельных болезней, классификацию и номенклатуру болезней

Совокупность внешних признаков (симптомов) составляет клиническую картину нозологической формы У конкретного больного могут наблюдаться вариации того или иного признака, не меняющие, однако, «лица болезни» и определяющиеся условиями развития патологического процесса (особенности возбудителя и реакции организма, обусловленной наследственными и приобретенными его свойствами) Важны данные так называемых параклинических методов исследования лабораторных, инструментальных - как функциональных, например, электрокардиография при инфаркте миокарда, так и морфологических В ряде случаев именно морфологический критерий определяет нозологическую форму например, для диагностики злокачественных опухолей обязательны гистологическое доказательство появления ненормальных клеточных структур и определение места (органа) их первичного возникновения, разнообразные внешние признаки, сопровождающие опухолевый рост, имеют меньшее диагностическое значение

Однако эффективность применения нозологического подхода многие годы была невысокой вследствие того, что современной медицине известно более 5000 нозологических форм, а высокопроизводительных автоматизированных средств обработки и системного их анализа, доступных российским клиникам и больницам, не было

Проектирование и разработка комплексной медицинской информационной системы (МИС) представляет собой чрезвычайно сложную задачу, требующую для своего решения больших материальных затрат и затрат труда квалифицированных специалистов Это объясняется тем, что проектирование системы такого класса ведет к совершенствованию и оптимизации процессов внутри медучреждения

Большинство современных МИС, в которых реализованы функции, присущие учетным системам, не обеспечены средствами data-mining анализа, такими как прогнозирование и классификация, и не обладают достаточной гибкостью для адаптации к решению конкретных задач. В связи с этим при необходимости проведения анализа данных необходимо или использовать дополнительно статистические пакеты или модифицировать существующую систему, что ведет как к дополнительным финансовым тратам (покупка программного продукта, обучение специалистов), так и к усложнению процесса анализа, обу-

словленному универсальностью статистического пакета

По данным ежегодного бюллетеня Technology Review, 6 из 10 перспективных технологий, которые в ближайшее время будут оказывать влияние на человеческое общество, так или иначе связаны с медициной Большинство из перечисленных! технологий или методик базируются на достижениях информационных технологий Одно из направлений развития информационного комплекса медицины заключается в применении современных математических методов и технических средств, таких, как математическое моделирование, прогнозирование, классификация

Проблемы' прогнозирования и классификации нозологических показателей в настоящее время являются весьма актуальными, поскольку ускорение анализа данных и повышение его точности ведет к оперативному и адекватному принятию управленческих решений

Объектом исследования является МИС с методологией анализа нозологических показателей и данные нозологических показателей по социальным группам населения

Предметом исследования является программное, информационное обеспечение анализа нозологических показателей, методы построения бинарных моделей классификации разнородных данных, математическое описание алгоритмов решения систем нелинейных уравнений

Цель работы состоит в проведении комплексных исследований для получения научно-обоснованных решений, направленных на разработку проблемно-ориентированной МИС, наделенной программно-инструментальными средствами для решения задач учета и анализа нозологических показателей, что будет способствовать автоматизации обработки больших массивов данных о состоянии здоровья населения УР, получению теоретически обоснованных оценок уровня медицинского обеспечения в регионе и принятию адекватных управленческих мер для устранения негативных тенденций в здравоохранении УР

В ходе работы решались следующие научные и практические задачи:

- выработка научно-обоснованных решений для создания логистических моделей классификации социальных групп,

- выбор и обоснование методики построения логистической модели,

- проектирование и разработка МИС учета и анализа нозологических показателей,

- разработка алгоритма численного расчета параметров модели для оценки степени риска и классификации социальных групп населения,

- исследование влияния факторов на такой нозологический показатель как смертность населения от случаев суицида на территории УР

Методы исследования. В работе применялись теоретические методы исследования и вычислительный эксперимент

Бинарные модели классификации построены на основе логистической функции, для определения коэффициентов модели использовался метод Ньютона-Канторовича, классификация нозологических факторов основывается на применении методов теории вероятности и математической статистики

МИС построена по типу реляционной базы данных «клиент-сервер», со-

держащей метаданные о комплексе нозологических факторов и показателей, включенных в реестр государственной статистики Универсальная система диалога позволяет вводить и контролировать данные, используя имеющиеся априорные сведения

Программное обеспечение системы реализовано на алгоритмическом языке высокого уровня - Object Pascal, интерфейс пользователя разработан в интегрированной среде Borland Delphi 7 0, база данных работает под управлением СУБД Microsoft SQL Server 2005 Для проверки достоверности полученных решения использовался пакет MATLAB

Достоверность и обоснованность полученных в работе результатов и выводов подтверждена сопоставительным анализом разработанных и существующих математических моделей и методов, а также итогами проведения вычислительного эксперимента

Математические модели, алгоритмы и прикладные программы, используемые в работе, основаны на положениях теории вероятности и математической статистики, методах вычислительной математики Приведенные в работе математические модели построены с использованием результатов научных трудов по вопросам математического моделирования логистической регрессии таких ученых как С А Айвазян, И.С Енюков, Д Бендат, Д В Хосмер, С Лемешов, П Мак-Куллаг, Д А. Нелдер

Достоверность экспериментальных результатов обеспечена большим объемом экспериментального материала, статистическими методами обработки данных и хорошей воспроизводимостью результатов

На защиту выносятся результаты исследования и разработки МИС, обеспечивающей повышение уровня автоматизации обработки больших массивов данных о состоянии здоровья населения УР и получению теоретически обоснованных оценок уровня медицинского обеспечения в регионе, в том числе

- проектирование и реализация МИС, разработка концептуальной структуры объектно-ориентированной системы, принципов построения программного, информационного и математического обеспечения системы,

- результаты разработки и исследований алгоритмов и методов анализа данных нозологических показателей, определяющих реперные характеристики мониторинга здоровья населения региона,

- обоснование выбора критерия классификации степени риска приобретения того или иного заболевания индивидами из различных социальных групп населения,

- обработка больших объемов информации об индивидуальных нозологических показателях больных, прошедших медицинское обследование в учреждениях здравоохранения, систематизация результатов обработки и построение информационных карт, свидетельствующих о вероятности возникновения того или иного заболевания у конкретного больного,

- системный анализ для выявления социально-опасных тенденций в развитии тяжелых, трудноизлечимых заболеваний, например, суицида

Научная новизна полученных результатов определяется впервые проведенными комплексными исследованиями, направленными на разработку алгоритмов и программных средств для обработки и системного анализа уровня за-

болеваемости населения УР, в ходе которых

- разработана структура МИС, которая может использоваться в повседневной практике медицинских организаций и учреждений, обладающих большим объемом нозологической информации;

- программно-аппаратно реализован нозологический подход, позволяющий клиницистам и представителям теоретической медицины с помощью средств вычислительной техники выделять нозологические формы, для которых характерны определенные причины, однозначный патогенез, типичные внешние проявления и специфические структурные нарушения в органах и тканях,

- определены принципы построения алгоритмов и программных средств, предназначенных на ранней стадии обработки информации выявлять ошибочные данные с механизмом их автоматического исправления,

- разработаны научно обоснованные программные решения, направленные на повышение уровня достоверности нозологических данных,

- разработанная система контроля достоверности информации обладает высокой степенью совместимости и мобильности, вследствие чего может быть интегрирована в уже существующие хранилища данных, а также портироваться на сервера различных медицинских учреждений, поддерживающих реляционную модель данных;

- впервые при проектировании МИС анализа медицинских показателей применен предметно-ориентированный подход, применяемый при разработках промышленных систем класса Enterprise Resource Planning, который позволяет оперировать набором метаданных для настройки системы под нужды системы здравоохранения,

- предложены и обоснованы различные стратегии построения обучающих выборок для построения регрессионных моделей классификации нозологических показателей

Практическая ценность работы. Разработанная и реализованная в виде МИС методика классификации социальных групп по нозологическим показателям предназначена для использования различными медицинскими учреждениями как для регистрации значений нозологических показателей на основании первичных документов и получения стандартизированных отчетов, так и для проведения анализа нозологических показателей в разрезе социальных групп населения

Данная МИС построена на основе теории диалогики, базирующейся на логике распознавания образов нозологических форм Она способствует развитию клинической нозологии, представляющей собой специфическое преломление общей нозологии в индивидуально-личностном преломлении МИС, построенная на диалогике, требует от врача совершенствования ума и таланта, интуиции и знаний нозологии, этиологии, патогенеза, клиники, лечения, поскольку в основе клинической патологии лежат законы саморегуляции (пато-кинеза), законы адаптивного реагирования.

Выделение нозологических форм важно для развития клинических дисциплин, т к способствует единому подходу к каждой болезни, в частности разработке методор специфической патогенетической терапии

Реализация и внедрение работы. Полученные результаты использованы

и апробированы для опытно-методической эксплуатации системы анализа нозологических показателей в НИИ Федеральной службы исполнения наказаний России Созданная информационная система позволила получить новые знания по составу социальных групп для различных видов смертности населения.

Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на российских и международных научно-технических конференциях и конгрессах- IV Международной научно-технической конференции «Информационные технологии в инновационных проектах» (Ижевск, 2003), VII Всероссийской НТК «Повышение эффективности средств обработки информации на базе математического моделирования» (Тамбов, 2004), VI Российская университетская академическая научно-практическая конференции (Ижевск, 2004), VI Международном конгрессе по математическому моделированию (Нижний Новгород, 2004); 33-й международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2006), XI Международная открытая конференция «Современные проблемы информатизации в прикладных задачах» (Воронеж, 2006), Международная научная конференция «75 лет высшему образованию в Удмуртии» (Ижевск, 2006), VI Всероссийская научно-техническая конференция «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2006), Всероссийской НТК «Компьютерные и информационные технологии в науке, инженерии и управлении» (Таганрог, 2006)

Публикации. Основные научные результаты по теме диссертации опубликованы в 8 научных работах, в том числе 2 тезиса докладов, 6 статьей в журналах и сборниках Автор имеет 1 научный труд в издании, выпускаемых в РФ и рекомендуемых ВАКом для публикации основных результатов диссертаций

Структура и объем работы. Объем диссертационной работы составляет 161 страницу, включая 47 рисунков и 50 таблиц Работа состоит из введения, четырех глав, заключения и списка литературы, включающего 108 наименований

СОДЕРЖАНИЕ РАБОТЫ Введение содержит обоснование актуальности темы, формулировку цели и задач исследования, основные положения, выносимые на защиту, определяет практическую значимость, содержание и методы выполнения работы.

В первой главе приведен обзор современных медицинских информационных систем, выделены их достоинства и недостатки На основании проведенного системного анализа сформулированы функциональные требования к предмету исследовании Результатом системного анализа явился состав модулей разрабатываемой медицинской информационной системы, структура метаданных системы и ЕЯ-схема классов проектируемого продукта

Вторая глава посвящена разработке математических моделей классификации социальных групп для такого класса медицинских показателей, как показатели смертности. Формулируются задачи классификации социальных групп по риску смертности с использованием математических моделей бинарного выбора и прогнозирования абсолютного показателя суицида при помощи авторегрессионных математических моделей Представлены алгоритмы, методы и ре-

зультаты решения поставленных задач.

Предположим, что некоторый показатель у, «поведение» которого существенно зависит от количественных или качественных объясняющих переменных х = (1, я,,. ,хт)Т, то есть факторов, является качественной переменной, определяющей одно из двух возможных состояний характеризуемого ею объекта В подобных ситуациях вектор У = (уг. .,у„)Т исходных статистических данных зависимой переменной будет содержать только дихотомические (бинарные) признаки, то есть его компоненты у, могут принимать только два значения «О» или «1».

Для исследования статистической связи между у и х строят некоторую специальную регрессионную модель зависимости вероятности Р^у = 11 от линейной формы В7*. Для моделирования значений Р{у~ 1|*| подбирают функции, область значений которых определяется отрезком [0,1], а линейная форма Вг х играет роль аргумента этой функции, то есть

/>|>; = 1|х| = ^(в7'х) О)

Одной из таких функций является логистическая функция

*Р) = *в7(1 + евГ*) (2)

Важную роль при построении модели играет логит-преобразование логистической функции, которое определяется как

(3)

Важность данного преобразования в том, что функция #(■*) обладает многими полезными свойствами линейной регрессионной модели. Функция

линейна по х, может быть непрерывной и принимать значения от -со до

+оо в зависимости от х

Предположим, что исследуется выборка из п независимых наблюдений пар , ), / = 1,2, .,и, где у, - результирующее значение бинарной (дихотомической) переменной, а х* - набор уровней факторов для / -го объекта Набор уровней факторов х, =(х{,х2, ., состоит из р объясняющих переменных, которые могут быть измерены как в количественной, так и в порядковой шкалах Предполагаем также, что результирующая переменная принимает значения 0 или 1, и сигнализирует о наличии или отсутствии определенной характеристики (здесь и далее будет использоваться именно такое кодирование результирующей бинарной переменной) Для построения модели, описываемой уравнением (2) необходимо определить вектор коэффициентов В.

Если часть объясняющих переменных принимают номинальные значения (такие как пол, национальность и т.п.), то необходимо их включить в модель

так же, как если бы они были непрерывными Числа, используемые для кодирования уровней объясняющих переменных, являются их идентификаторами и не несут в себе какой-либо количественной информации, то есть не являются мерой какой-либо из характеристик В данной ситуации, как правило, дополнительно используется набор временных переменных

В общем случае если номинальная переменная может принимать к возможных значений, то потребуется к -1 временная переменная Если ./ -ая переменная х) имеет к уровней, тогда в модель вводится к/ -1 временная переменная и соответственно коэффициенты для этих переменных , / = 1,2,.. ,к}—1 Таким образом, если модель включает р переменных и у -ая переменная является номинальной, то логит-преобразование #(•*) будет иметь вид

*(*) = Д> + + • + Е № +Ррхе (4)

ы

Метод построения (нахождения коэффициентов) логистической модели в целом аналогичен методу наименьших квадратов для линейной регрессии. Этот метод для логистических моделей - метод максимального правдоподобия Основной смысл этого метода состоит в том, чтобы максимизировать вероятность получения исходного набора данных при помощи модели То есть значение функции для каждого набора факторов для каждого объекта должно быть как можно ближе к результирующему значению Оптимальные значения коэффициентов носят название оценок максимального правдоподобия

Оценка коэффициентов производится при помощи функции максимального правдоподобия'

^ (а)=р ^ Г С1 - ^ )]'"" - <5)

Однако, с математической точки зрения проще работать с натуральным логарифмом от выражения (5)"

Для нахождения коэффициентов модели необходимо решить систему нелинейных уравнений:

' "1 _ (7)

.1=1

Для решения системы (7) в работе используется метод Ньютона-Канторовича

1 Выбор начального приближения В(0).

2. Вычисление матрицы У(в(0)),

где J = д(f0>fl,. /р)/э(Д,,Д,.../?,) -якобиан системы (7) Элементы матрицы. J|J =

м

3. Решение системы J(вm}¿; + /(б<0)) = 0 дает новое приближение согласно формуле В0> = Вт + ¿т, для которого процесс повторяют до тех пор, пока изменение не окажется в пределах ошибки

На практике, моделирование набора данных, намного более сложный процесс, чем просто построение и оценка

Один из подходов для проверки значимости коэффициента при переменной в любой модели опирается на следующий вопрос Дает ли модель, включающая данную переменную, больше информации о результирующей переменной (или отклике модели), чем модель без этой переменной? Ответ на этот вопрос - в сравнении значений результирующей переменной, полученных при помощи модели с включенной переменной и модели без нее Если значение, предсказанное моделью с включенной переменной лучше, или точнее в некотором смысле, чем значение, полученное при помощи модели без этой переменной, то можно сказать, что переменная, фигурирующая в этом случае, является «значимой»

Основной принцип для оценки модели- сравнить наблюдаемое и прогнозируемое значения, полученные при помощи модели с данной переменной и без нее В логистической регрессии сравнение наблюдаемой и предсказанной величин основано на логарифме функции правдоподобия (6) В данном случае наблюдаемое значение расценивается как прогноз, полученный при помощи насыщенной модели Такая модель содержит столько же параметров, сколько объектов в выборке

Сравнение наблюдаемого и предсказанного значений производится при помощи функции правдоподобия и основывается на следующем выражении (правдоподобие построенной модели) (правдоподобие насыщенной модели)

Величина, заключенная в квадратные скобки - коэффициент подобия Величина В (девиация) с известным распределением будет использована для проверки гипотез, связанных со значимостью коэффициентов модели

О = -21п £ [у, 1п (я, /у,) ■+ (1 ■- у,) 1п ((1 - я,)/(1 - у,))], (9)

ы\

где Л, =

Поскольку для данной задачи

/(насыщенной модели) = х(1-у))(1"Л'=1, (Ю)

1=1

то девиация

й = -2 !п [правдоподобие построенной модели] (11)

В целях проверки значимости объясняющих переменных требуется сравнить статистику Б с объясняющей переменной и без объясняющей переменной

С = -21п

(8)

С=-21п

(13)

в выражении Изменение £>, относящееся к включению объясняющей переменной в модель, рассчитывается как

О = £)(модель без переменной)- О (модель с переменной). (12)

Поскольку правдоподобие для насыщенной модели одинаково в обоих случаях, то величина О может быть определена как:

(правдоподобие для модели без переменной) (правдоподобие для модели с переменной) В случае построения модели с р переменными для гипотезы, что коэффициенты модели Д равны, нулю статистика О имеет хи-квадрат распределение с р степенями свободы

Таким образом, для построения модели можно использовать две стратегии Стратегия А.

1 Построение модели, содержащей только константу

2 Построение модели с р переменными

3 Нахождение значения статистики С.

4 Сравнение значения статистики О с табличным значением Хтабл(Р'а)

5 Если в > х1юб, (/?, я), то нулевая гипотеза отклоняется, а значит несколько, а возможно и все коэффициенты Д отличны от нуля (то есть, интерпретация аналогична случаю множественной линейной регрессии)

Очевидный недостаток стратегии А состоит в том, что после того, как гипотеза о равенстве нулю коэффициентов модели отвергается, остается открытым вопрос какие именно факторы являются значимыми7 Таким образом, в данном случае для построения модели оптимальным решением будет использование альтернативной стратегии

Стратегия В (пошаговая логистическая регрессия). Стратегия основана на постепенном уточнении модели, то есть на поочередном введении в нее новых переменных В качестве критерия включения параметра используется значение вероятности а, вычисляемое по таблице квантилей %г -распределения для статистики й

Обозначим множество переменных входящих с модель на к -ом шаге итерации как Х^. Тот факт, что построение модели заключается в определении вектора коэффициентов В для компактности записи алгоритма не указывается, но подразумевается Так в записи значения логарифма функции правдоподобия для модели с включенной на к -ом шаге переменной х - подразумевается

ее зависимость от вектора коэффициентов

Порядок построения модели с р объясняющими переменными

0. Начало работы алгоритма, к — 0, построение модели, содержащей только константу ^ = {1} и нахождение логарифма логистической функции ¿(0>.

1. Добавление параметра в модель. Увеличение номера итерации к = к + \ Для каждой переменной х., не входящей во множество строится мо-

дель с набором переменных Х^ = A''*"''(т0 есть в модель включается параметр xt) и определяется значение логарифма функции правдоподобия По статистике G, которая находится из формулы (13) с учетом приведенных обозначений как G = - определяется значение вероятности cSp Из всех полученных таким образом значений вероятности выбирается минимальное = mm [orf ] Если значение не превышает порогового значения а,,, то параметр х, включается в модель

2 Удаление параметра из модели. Увеличение номера итерации к = к+1 Для каждой переменной xJy входящей во множество строится модель

с набором переменных Х^ = Х^'1^ \ (то есть из модели исключается параметр Xj) и определяется значение логарифма функции правдоподобия Lf

. По статистике G, которая находится из формулы (13) с учетом приведенных обозначений как G = -2^6t'<) - определяется значение вероятности aj*' Из всех полученных таким образом значений вероятности выбирается максимальное а,'*' = max J. Если значение а,'*' превышает пороговое значения аК, то параметр x,t исключается из модели

и z« = 4*>.

3. Процесс добавления и удаления переменных модели производится до тех пор, пока на шаге 1 в модель не будет добавлен ни один параметр, а на шаге 2 параметр не будет удален

Использование порогового значения а,, (от англ «entry» - вхождение) регламентируется тем соображением, что добавление в модель переменной с более высокой вероятностью «незначимости» скорее всего, приведет к уменьшению точности прогноза, получаемого с ее помощью. И наоборот, использование ак (от англ «remove» - удаление) основано на том, что удалять переменную с низкой вероятностью «незначимости» из модели нецелесообразно

Таким образом, можно говорить о следующих преимуществах использования стратегии В.

- все параметры, входящие в итоговую модель будут значимыми, то есть соответствующие коэффициенты будут отличны от 0 (стратегия А гарантирует лишь то, что не все коэффициенты отличны 0),

- при построении модели по полному множеству переменных доступных в

выборке, включая все временные переменные для всех уровней факторов, в результирующую модель будут включены только временные переменные для значимых уровней

Второе свойство стратегии было использовано как дополнительное подтверждение выводов об отсутствии статистических связей между факторами

Разработанная модель была применена к исследованию показателя суицида на территории УР Перед построением модели была проведена оценка значимости связей между факторами при помощи статистики к Гудмана-Крускала

, ^ , ( 1 \\

Л =

I

^.Лт Хвт I Т./, УтО /(^Уоо УтО Уош)> (14)

/ ))/ где

I — количество строк таблицы сопряженности,

J - количество столбцов таблицы сопряженности,

/1т - наибольший вход в ; -ой строке таблицы сопряженности,

/ - наибольший вход в ] -ом столбце таблицы сопряженности,

/0)„ - наибольший из итогов по столбцам,

/то ~ наибольший из итогов по строкам,

/00 - общее число наблюдений.

Коэффициенты построенной модели приведены в таблице 1 Построенная математическая модель обладает хорошими показателями адекватности (таблица 2) и может быть использована для классификации социальных групп

Для решения задачи прогнозирования абсолютного показателя суицида использовался такой класс математических моделей, как регрессионные модели

Временным рядом (в качестве индекса члена ряда принимается номер временного интервала) в задаче прогнозирования является значение абсолютного показателя суицида

{*,},* = !,2..........(15)

который представляет собой количество случаев самоубийств, совершенных за некоторый временной интервал Поскольку исходные данные представляют собой динамику смертности от суицидов на протяжении 4 лет (2000 — 2003 гг.), то в данном случае наиболее разумным решением будет в качестве интервала принять месяц Более мелкое разбиение, например по неделям, не позволит сделать сколько-нибудь точный прогноз из-за сравнительного небольшого количества суицидов в неделю

Общий вид авторегрессионной модели с р параметрами АР(р)

% = 9\К\ + <Ргг,-г+ — + <Рр%-р +£„ (16)

где г, = г, - ц отклонение от среднего, а случайный процесс в, - белый шум Поскольку в данной ситуации авторегрессионная модель используется для прогнозирования, то величина £•, может рассматриваться как ошибка прогнозирования

Таблица 1

Коэффициенты модели классификации социальных групп по риску совершения суи-__цида_

Фактор Переменная Значение Уровень фактора

Константа Const -1 987 Константа

Пол Sex -0141 Женский

Национальность N1 0 083 Русский

N2 0 078 Татарин

N3 0 195 Удмурт

Образование ЕЗ -0 033 Среднее специальное

Семейное положение F1 -0 052 Никогда не состоял(а) в браке

Дискретный возраст DA2 1 109 10-19

DA3 0 147 100-109

DA4 1 096 20-29

DA5 0 637 30-39

DA6 0 371 40-49

DA7 0 155 50-59

DA8 0 038 60-69

Категория района RT1 0 171 Степень риска 0

RT2 0 077 Степень риска 1

Таблица 2

Таблица классификации___

Наблюдаемое значение Прогнозируемое значение Всего

Суицид Не суицид

Суицид 3 509 (77.4%) 1 026 (22 6%) 4 535

Не суицид 26 770 (28 2%) 68 249 (71.8%) 95 019

Коэффициенты щ находятся как решение системы

1 = Щ + т + +<Р/,,-1 г2 = ад + + +<рргр_2

Гр = Ч>/РЛ + ПГр-2 + ■ +<РР Система (17) р уравнений - система Юла-Уокера, где

(17)

(18)

- оценка нормированной автокорреляционной функции, Ик - оценка автокорреляционной функции, также называемая автоковариацией

В статистике имеется несколько формул для оценки корреляционной функции для выборки объемом N отсчетов В работе использовалась следующая формула для оценки

В работе были построены несколько моделей прогнозирования абсолютного показателя суицида

-модель прогнозирования суммарного абсолютного показателя суицида; -модель прогнозирования абсолютного показателя суицида среди мужчин, -модель прогнозирования абсолютного показателя суицида среди женщин; -модель прогнозирования абсолютного показателя суицида среди мужчин работоспособного возраста

Например, модель прогнозирования абсолютного показателя суицида среди мужчин Л/>(3) имеет вид

г, = 0 9837 • £м - 0 2065 г,_г + 0 1714 1,.3. (20)

В третьей главе приводится системный анализ МИС классификации нозологических показателей, архитектура системы, структура базы данных системы Также в главе приведен состав и описание компонентов МИС

МИС классификации нозологических показателей должна решать следующие задачи

1 Обеспечивать возможность регистрации случаев смерти, как в оперативном режиме (АРМ оператора), так и в режиме загрузки архивных данных (например, из архивной базы данных или старого программного обеспечения) в том числе и в режиме массовой вставки

2 Строить математические модели классификации социальных групп по нозологическим показателям в разрезе произвольного количества и набора факторов

3 Обладать механизмом настройки состава справочной информации МИС

4 Обеспечивать вывод, как статистической информации, так и результатов построенных математических моделей классификации

Если условно разделить требования к МИС классификации нозологических показателей на два модуля, модуль учета данных и модуль их анализа, то схема процессов работы МИС может быть представлена в виде, приведенном на рисунке 1

Первичные документы заносятся при помощи специального набора форм приложения, организуется их хранение в БД. Отчеты, как и в системах учета данных, строятся на основании первичных данных и, что является важным отличием, прогноз и построение моделей производится без промежуточной подготовки данных. Таким образом, обеспечивается оперативность анализа данных и сохранение их конфиденциальности

При этом разнесение задач системы по двум модулям не нарушает комплексности системы (система функционирует в едином информационном пространстве), позволяя разграничить функции пользователей, а значит и ответственность по разным АРМ1

- АРМ оператора - выполнение функций ввода данных и построение сводных отчетов (задачи 1, 4);

- АРМ аналитика - построение моделей, их интерпретация и построение отчетов (задачи 2,4); " - ■

- АРМ разработчика - выполнение функций ко настройке условно-постоянной (справочной) информации (задача 3);

- АРМ администратора - управление пользователями и историей работы с объектами МИС.

Модуль учета данных

41

I , кадссифмлации

I НОЭОЛОГ ЙЧССяИ* ^

показателей ^тмвгы

I Регистрация ^ '

'|1Я

п

X

П«!НКЧНЬЛС ¡Ц]!,

МйТСМ#Т№1ССп*1С ЫШвЛЯ

Модуль анализа данных „М1„з

Рис. I. Схема модулей МИС классификаций нозологических показа ¡слей

Каждому рабочему месту в МИС соответствует один из типов пользователей «Оператор» (доступ только к журналам регистрации и справочникам системы), «Разработчик» (доступ к метаданным системы, настройке отчетов), «Аналитик» (построение отчетов и проведение классификации нозологических показателей на основании построенных моделей), «Администратор» (полный доступ ко всем данным системы).

В четвертой главе приведен анализ динамики показателя смертности и результате самоубийств на территории УР.

В качестве исходных данных был использован региональный медицинский регистр смертности, с детализированными данными по суицидам. Случаи суицидов были отобраны из общего регистра смертности по коду, указанному в поле «Основная причина смерти» свидетельства о смерти, соответствующему случаям самоповреждения на основании справочника МКЬ-10,

Для каждого суицидента в регистре смертности населения указаны детализирующие характеристики, далее называемые реквизитами. Состав реквизитов для каждого случая самоубийства:

- пол;

- дата рождения;

- дата совершения суицида;

- район/область, где суицидент был зарегистрирован (район/область прописки);

- район УР, где был совершен суицид;

- национальность;

- образование;

- семейное положение;

- болезнь или состояние, непосредственно приведшее к смерти по классификатору МКБ-10,

- патологические состояния, которые привели к возникновению причины смерти по классификатору МКБ-10,

- основная причина смерти по классификатору МКБ-10,

- внешние причины при травмах и отравлениях по классификатору МКБ-10,

- прочие важные состояния, способствовавшие смерти, не связанные с болезнью или патологическим состояниям, приведшим к ней по классификатору МКБ-10

На основании значений имеющихся реквизитов регистра естественным образом можно получить дополнительные разрезы для проведения анализа, такие как

- день недели совершения суицида,

- месяц совершения суицида,

- категория района по величине относительного показателя суицида (ОПС),

- дискретный возраст.

Таким образом, абсолютный показатель суицида может быть рассчитан в разрезе каждого из приведенных реквизитов как количество фактов смерти в регистре смертности Если обладать данными по численности различных социальных групп населения в разные годы, то можно естественным образом также получить значение и ОПС на 100 ООО населения Результаты проведенного анализа сравнивались с результатами региональных статистических исследований

В таблице 3 приведено распределение количества случаев суицида по национальному признаку

Таблица 3

Распределение АПС по национальному признаку_

Национальность АПС

Мужчины Женщины Все

Русские 1662 335 1997

Удмурты 1669 288 1957

1 атары 199 38 237

Марийцы 18 7 25

Прочие 50 10 60

Не указана 225 34 259

Тот факт, что примерно в 6% случаев национальность не указана, говорит о том, что исходные данные являются не полными

Гистограмма, построенная по данным таблицы 3, приведена на рисунке 2 На основании приведенных данных можно сделать следующие выводы - практически по всем национальностям индекс сверхсуицидальности для мужчин равен среднему по УР 6'1 Исключение составляют марийцы, но ввиду отсутствия дополнительных данных (таких как, информация по другим регионам, где данная национальность преобладает, например, Марий-Эл) причин этого назвать нельзя.

- абсолютное количество суицидов среди русских и удмуртов, как для мужчин, так и женщин практически одинаковое, но относительный показатель на 100 ООО населения для удмуртского населения выше в 2 раза.

Русские Удиурты Татары Мврим^ Прочие Не указана

Национальность

□ Мужские суициды □ Женские суициды Рис. 2. Значения ЛИС в разрезе национальности и поля су и ни лептой

ЗАКЛЮЧЕНИЕ

1. В результате проделанных комплексных исследований получены научно-обоснованные методический и технические решения, направленные на разработку проблемно-ориентированной МИС, наделенной программно-иистру-ментальными средствами, для решения задач учета Й анализа нозологических показателей, что будет способствовать автоматизации обработки больших массивов данных о состоянии здоровья населения УР, получению теоретически обоснованных оценок уровня медицинского обеспечения в регионе и принятию адекватных управленческих мер для устранения негативных тенденций в здравоохранении УР,

2. Разработана структура МИС, которая может использоваться в повседневной практике медицинских организаций и учреждений, обладающих большим объемом нозологической информации. Программ но-аппаратно реализован нозологический подход, позволяющий клиницистам Н представителям теоретической медицины с помощью средств вычислительной техники выделять нозологические формы, для которых характерны определенные причины, однозначный патогенез, типичные внешние проявления и специфические структурные нарушения в органах и тканях;

3. Определены принципы построения алгоритмов и программных средств, предназначенных на ранней стадии обработки информации выявлять ошибочные данные с механизмом их автоматического исправления. Разработаны научно обоснованные программные решения, направленные на повышение уровня достоверности нозологических данных. Разработанная система контро-

ля достоверности информации обладает высокой степенью совместимости и мобильности, вследствие чего может быть интегрирована в уже существующие хранилища данных, а также портироваться на сервера различных медицинских учреждений, поддерживающих реляционную модель данных

4 Впервые при проектировании МИС анализа медицинских показателей применен предметно-ориентированный подход, применяемый при разработках промышленных систем класса Enterprise Resource Planning, который позволяет оперировать набором метаданных для настройки системы под нужды системы здравоохранения Предложены и обоснованы различные стратегии построения обучающих выборок для построения регрессионных моделей классификации нозологических показателей

5 Проведена обработка больших объемов информации об индивидуальных нозологических показателях больных, прошедших медицинское обследование в учреждениях здравоохранения Осуществлена систематизация результатов обработки и построение информационных карт, свидетельствующих о вероятности возникновения того или иного заболевания у конкретного больного, системный анализ для выявления социально-опасных тенденций в развитии тяжелых, трудноизлечимых заболеваний, например, суицида

6 Созданная МИС построена на основе теории диалогики, базирующейся на логике распознавания образов нозологических форм Она способствует развитию клинической нозологии, представляющей собой специфическое преломление общей нозологии в индивидуально-личностном преломлении. МИС, построенная на диалогике, требует от врача совершенствования ума и таланта, интуиции и знаний нозологии, этиологии, патогенеза, клиники, лечения, поскольку в основе клинической патологии лежат законы саморегуляции (пато-кинеза), законы адаптивного реагирования Выделение нозологических форм важно для развития клинических дисциплин, т к способствует единому подходу к каждой болезни, в частности разработке методов специфической патогенетической терапии

7 Сформулированная математическая постановка задачи классификации социальных групп по риску смертности от различных причин и алгоритм ее численной реализации дают возможность повысить точность классификации в сочетании с высокой оперативностью по сравнению с существующими математическими моделями Приведенный метод позволит существенно ускорить принятие управленческих решений.

8 Создана модель, основанная на полной выборке регистра смертности населения Адекватность моделей показана при помощи таблиц классификации на объектах контрольной выборки Для модели классификации социальных групп по риску смертности в результате суицида общий процент правильной классификации составил 72 1%

НАУЧНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1 Токмурзин П В Логистическая модель анализа и прогнозирования суицидов // Материалы к VI Российской университетской академической научно-

20

OA/

практической конференции - 2004 - 112 - 113 с

2 Токмурзин П В Логистическая модель анализа риска для показателя суицида на территории Удмуртской Республики // Вестник Удмуртского Университета -2006 -№1, 161 -168 с

3 Токмурзин П В , Ицков А Г Особенности реализации медицинских информационных систем на примере подсистемы «Анализ показателей смертности» // Интеллектуальные системы в производстве - 2006 - №1, 200 - 206 с

4 Токмурзин П В Структура и возможности МИС анализа показателей смертности // Вестник Ижевского Государственного Технического Университета -

. 2006 -№4,76-79 с

5. Токмурзин П В , Ицков А Г Применение авторегрессионных моделей для анализа показателя суицида на территории Удмуртской Республики // Мате* риалы международной научной конференции «75 лет высшему образованию в Удмуртии» Материалы конференции- Ч 2 Естественные науки Ижевск 2006 - 9- 12 с

6 Ицков А Г, Токмурзин П В Методы отбора параметров для построения бинарных математических моделей классификации // Вестник Удмуртского Университета -2007 -№1,215-222 с

7 Токмурзин П.В Построение логистических моделей классификации медицинских показателей - Ижевск, 2007 - 19 с - Деп в ВИНИТИ 10 04 2007, № 406-В2007

8 Токмурзин П В Построение медицинской информационной системы анализа показателей смертности - Ижевск, 2007. - 14 с - Деп в ВИНИТИ 10 04 2007, № 407-В2007

П В Токмурзин

Подписано в печать 12 07 07 Формат 60x84/16 Бумага офсетная Услпечл 1,2 Тираж 100 экз Заказ 200 Отпечатано в типографии Издательства ИжГТУ

Издательство Ижевского государственного технического университета 426069, г Ижевск, Студенческая, 7

Оглавление автор диссертации — кандидата технических наук Токмурзин, Павел Владимирович

ВВЕДЕНИЕ.

ГЛАВА 1. ПРОЕКТИРОВАНИЕ МЕДИЦИНСКИХ ИНФОРМАЦИОННЫХ СИСТЕМ.

1.1. Анализ возможностей современных медицинских информационных систем.

1.2. Схема работы связки медицинской информационной системы учета и анализа данных.

1.3. Требования к построению медицинской информационной системы.

1.4. Организация процесса разработки медицинской информационной системы.

ГЛАВА 2. ПОСТРОЕНИЕ ПРИКЛАДНЫХ

МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ АНАЛИЗА.

2.1. Регрессионные модели прогноза.

2.2. Определение статистических связей между факторами.

2.3. Логистическая модель классификации социальных групп.

ГЛАВА 3. МЕДИЦИНСКАЯ ИНФОРМАЦИОННАЯ СИСТЕМА КЛАССИФИКАЦИИ НОЗОЛОГИЧЕСКИХ ПОКАЗАТЕЛЕЙ.

3.1. Построение медицинской информационной системы классификации нозологических показателей.

3.2. Описание состава компонент медицинской информационной системы.

ГЛАВА 4. АНАЛИЗ ДИНАМИКИ ИЗМЕНЕНИЯ ПОКАЗАТЕЛЯ СУИЦИДА НА ТЕРРИТОРИИ УДМУРТСКОЙ РЕСПУБЛИКИ В 2000 -2003 ГОДАХ.

4.1. Исходные данные и методы исследования.

4.2. Динамика показателя суицида за период с 2000 по 2003 год.

4.3. Величина показателя суицида в зависимости от пола.

4.4. Величина показателя суицида в зависимости от возраста.

4.5. Величина показателя суицида в зависимости от национальности

4.6. Величина показателя суицида в зависимости от экономико-социального положения суицидентов.

4.7. Величина показателя суицида в зависимости от времени совершения суицида.

4.8. Величина показателя суицида в зависимости от района проживания суицидента.

4.9. Величина показателя суицида в зависимости от состояний, сопутствовавших суициду.

4.10. Величина показателя суицида в зависимости от места и способа совершения суицида.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Токмурзин, Павел Владимирович

Актуальность темы. В настоящий момент все больше внимания уделяется вопросам развития и совершенствования методов анализа и учета данных для медицины. Необходимость развития и совершенствования определяется расширением круга задач, который ставятся перед медицинскими учреждениями в связи с растущим количеством заболеваний и регрессу здоровья нации. Основным критерием состояния здоровья населения страны является комплекс нозологических показателей, определяемых учреждениями системы здравоохранения.

Традиционно под нозологией понимается раздел патологии, включающий общее учение о болезни, а также изучение причин (этиология), механизмов развития (патогенез) и клинических особенностей отдельных болезней, классификацию и номенклатуру болезней.

Совокупность внешних признаков (симптомов) составляет клиническую картину нозологической формы. У конкретного больного могут наблюдаться вариации того или иного признака, не меняющие, однако, «лица болезни» и определяющиеся условиями развития патологического процесса (особенности возбудителя и реакции организма, обусловленной наследственными и приобретёнными его свойствами). Важны данные так называемых параклинических методов исследования: лабораторных, инструментальных - как функциональных, например, электрокардиография при инфаркте миокарда, так и морфологических. В ряде случаев именно морфологический критерий определяет нозологическую форму: например, для диагностики злокачественных опухолей обязательны гистологическое доказательство появления ненормальных клеточных структур и определение места (органа) их первичного возникновения; разнообразные внешние признаки, сопровождающие опухолевый рост, имеют меньшее диагностическое значение.

Однако эффективность применения нозологического подхода многие годы была невысокой вследствие того, что современной медицине известно более 5000 нозологических форм, а высокопроизводительных автоматизированных средств обработки и системного их анализа, доступных российским клиникам и больницам, не было.

Проектирование и разработка комплексной медицинской информационной системы (МИС) представляет собой чрезвычайно сложную задачу, требующую для своего решения больших материальных затрат и затрат труда квалифицированных специалистов. Это объясняется тем, что проектирование системы такого класса ведет к совершенствованию и оптимизации процессов внутри медучреждения.

Большинство современных МИС, в которых реализованы функции, присущие учетным системам, не обеспечены средствами data-mining анализа, такими как прогнозирование и классификация, и не обладают достаточной гибкостью для адаптации к решению конкретных задач. В связи с этим при необходимости проведения анализа данных необходимо или использовать дополнительно статистические пакеты или модифицировать существующую систему, что ведет как к дополнительным финансовым тратам (покупка программного продукта, обучение специалистов), так и к усложнению процесса анализа, обусловленному универсальностью статистического пакета.

По данным ежегодного бюллетеня Technology Review, 6 из 10 перспективных технологий, которые в ближайшее время будут оказывать влияние на человеческое общество, так или иначе связаны с медициной. Большинство из перечисленных технологий или методик базируются на достижениях информационных технологий. Одно из направлений развития информационного комплекса медицины заключается в применении современных математических методов и технических средств, таких, как математическое моделирование, прогнозирование, классификация.

Проблемы прогнозирования и классификации нозологических показателей в настоящее время являются весьма актуальными, поскольку ускорение анализа данных и повышение его точности ведет к оперативному и адекватному принятию управленческих решений.

Объектом исследования является МИС с методологией анализа нозологических показателей и данные нозологических показателей по социальным группам населения.

Предметом исследования является программное, информационное обеспечение анализа нозологических показателей; методы построения бинарных моделей классификации разнородных данных; математическое описание алгоритмов решения систем нелинейных уравнений.

Цель работы состоит в проведении комплексных исследований для получения научно-обоснованных решений, направленных на разработку проблемно-ориентированной МИС, наделенной программно-инструментальными средствами, для решения задач учета и анализа нозологических показателей, что будет способствовать автоматизации обработки больших массивов данных о состоянии здоровья населения УР, получению теоретически обоснованных оценок уровня медицинского обеспечения в регионе и принятию адекватных управленческих мер для устранения негативных тенденций в здравоохранении УР.

В ходе работы решались следующие научные и практические задачи:

- выработка научно-обоснованных решений для создания логистических моделей классификации социальных групп;

- выбор и обоснование методики построения логистической модели;

- проектирование и разработка МИС учета и анализа нозологических показателей;

- разработка алгоритма численного расчета параметров модели для оценки степени риска и классификации социальных групп населения;

- исследование влияния факторов на такой нозологический показатель как смертность населения от случаев суицида на территории УР.

Методы исследования. В работе применялись теоретические методы исследования и вычислительный эксперимент.

Бинарные модели классификации построены на основе логистической функции, для определения коэффициентов модели использовался метод Ньютона-Канторовича, классификация нозологических факторов основывается на применении методов теории вероятности и математической статистики.

МИС построена по типу реляционной базы данных «клиент-сервер», содержащей метаданные о комплексе нозологических факторов и показателей, включенных в реестр государственной статистики. Универсальная система диалога позволяет вводить и контролировать данные, используя имеющиеся априорные сведения.

Программное обеспечение системы реализовано на алгоритмическом языке высокого уровня - Object Pascal, интерфейс пользователя разработан в интегрированной среде Borland Delphi 7.0, база данных работает под управлением СУБД Microsoft SQL Server 2005. Для проверки достоверности полученных решения использовался пакет MATLAB.

Достоверность и обоснованность полученных в работе результатов и выводов подтверждена сопоставительным анализом разработанных и существующих математических моделей и методов, а также итогами проведения вычислительного эксперимента.

Математические модели, алгоритмы и прикладные программы, используемые в работе, основаны на положениях теории вероятности и математической статистики, методах вычислительной математики. Приведенные в работе математические модели построены с использованием результатов научных трудов по вопросам математического моделирования логистической регрессии таких ученых как С.А. Айвазян, И.С. Енюков, Д. Бендат, Д.В. Хосмер, С. Лемешов, П. Мак-Куллаг, Д.А. Нелдер.

Достоверность экспериментальных результатов обеспечена большим объемом экспериментального материала, статистическими методами обработки данных и хорошей воспроизводимостью результатов.

На защиту выносятся результаты исследования и разработки МИС, обеспечивающей повышение уровня автоматизации обработки больших массивов данных о состоянии здоровья населения УР и получению теоретически обоснованных оценок уровня медицинского обеспечения в регионе, в том числе:

- проектирование и реализация МИС, разработка концептуальной структуры объектно-ориентированной системы, принципов построения программного, информационного и математического обеспечения системы;

- результаты разработки и исследований алгоритмов и методов анализа данных нозологических показателей, определяющих реперные характеристики мониторинга здоровья населения региона;

- обоснование выбора критерия классификации степени риска приобретения того или иного заболевания индивидами из различных социальных групп населения;

- обработка больших объемов информации об индивидуальных нозологических показателях больных, прошедших медицинское обследование в учреждениях здравоохранения, систематизация результатов обработки и построение информационных карт, свидетельствующих о вероятности возникновения того или иного заболевания у конкретного больного;

- системный анализ для выявления социально-опасных тенденций в развитии тяжелых, трудноизлечимых заболеваний, например, суицида.

Научная новизна полученных результатов определяется впервые проведенными комплексными исследованиями, направленными на разработку алгоритмов и программных средств для обработки и системного анализа уровня заболеваемости населения УР, в ходе которых:

- разработана структура МИС, которая может использоваться в повседневной практике медицинских организаций и учреждений, обладающих большим объемом нозологической информации;

- программно-аппаратно реализован нозологический подход, позволяющий клиницистам и представителям теоретической медицины с помощью средств вычислительной техники выделять нозологические формы, для которых характерны определенные причины, однозначный патогенез, типичные внешние проявления и специфические структурные нарушения в органах и тканях;

- определены принципы построения алгоритмов и программных средств, предназначенных на ранней стадии обработки информации выявлять ошибочные данные с механизмом их автоматического исправления;

- разработаны научно обоснованные программные решения, направленные на повышение уровня достоверности нозологических данных;

- разработанная система контроля достоверности информации обладает высокой степенью совместимости и мобильности, вследствие чего может быть интегрирована в уже существующие хранилища данных, а также портиро-ваться на сервера различных медицинских учреждений, поддерживающих реляционную модель данных;

- впервые при проектировании МИС анализа нозологических показателей применен предметно-ориентированный подход, применяемый при разработках промышленных систем класса Enterprise Resource Planning, который позволяет оперировать набором метаданных для настройки системы под нужды системы здравоохранения;

- предложены и обоснованы различные стратегии построения обучающих выборок для построения регрессионных моделей классификации нозологических показателей.

Практическая ценность работы. Разработанная и реализованная в виде МИС методика классификации социальных групп по нозологическим показателям предназначена для использования различными медицинскими учреждениями как для регистрации значений нозологических показателей на основании первичных документов и получения стандартизированных отчетов, так и для проведения анализа нозологических показателей в разрезе социальных групп населения.

Данная МИС построена на основе теории диалогики, базирующейся на логике распознавания образов нозологических форм. Она способствует развитию клинической нозологии, представляющей собой специфическое преломление общей нозологии в индивидуально-личностном преломлении. МИС, построенная на диалогике, требует от врача совершенствования ума и таланта, интуиции и знаний нозологии, этиологии, патогенеза, клиники, лечения, поскольку в основе клинической патологии лежат законы саморегуляции (пато-кинеза), законы адаптивного реагирования.

Выделение нозологических форм важно для развития клинических дисциплин, т.к. способствует единому подходу к каждой болезни, в частности разработке методов специфической патогенетической терапии.

Реализация и внедрение работы. Полученные результаты использованы и апробированы для опытно-методической эксплуатации системы анализа нозологических показателей в НИИ Федеральной службы исполнения наказаний России. Созданная информационная система позволила получить новые знания по составу социальных групп для различных видов смертности населения.

Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на российских и международных научно-технических конференциях и конгрессах: IV Международной научно-технической конференции «Информационные технологии в инновационных проектах» (Ижевск, 2003); VII Всероссийской НТК «Повышение эффективности средств обработки информации на базе математического моделирования» (Тамбов, 2004); VI Российская университетская академическая научно-практическая конференции. (Ижевск, 2004); VI Международном конгрессе по математическому моделированию (Нижний Новгород, 2004); 33-й международной конференции «Информационные технологии в науке, социологии, экономике и бизнесе» (Украина, Крым, Ялта-Гурзуф, 2006); XI Международная открытая конференция «Современные проблемы информатизации в прикладных задачах» (Воронеж, 2006); Международная научная конференция «75 лет высшему образованию в Удмуртии». (Ижевск, 2006); VI Всероссийская научно-техническая конференция «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2006); Всероссийской НТК «Компьютерные и информационные технологии в науке, инженерии и управлении» (Таганрог, 2006).

Публикации. Основные научные результаты по теме диссертации опубликованы в 8 научных работах, в том числе: 2 тезиса докладов, 6 статьей в журналах и сборниках. Автор имеет 1 научный труд в издании, выпускаемых в РФ и рекомендуемых ВАКом для публикации основных результатов диссертаций.

Структура и объем работы. Объем диссертационной работы составляет 161 страницу, включая 47 рисунков и 50 таблиц. Работа состоит из введения, четырех глав, заключения и списка литературы, включающего 108 наименований.

Заключение диссертация на тему "Информационная система классификации нозологических показателей"

Основные выводы по работе:

1. В результате проделанных комплексных исследований получены научно-обоснованные методические и технические решения, направленные на разработку проблемно-ориентированной МИС, наделенной программно-инструментальными средствами, для решения задач учета и анализа нозологических показателей, что будет способствовать автоматизации обработки больших массивов данных о состоянии здоровья населения УР, получению теоретически обоснованных оценок уровня медицинского обеспечения в регионе и принятию адекватных управленческих мер для устранения негативных тенденций в здравоохранении УР.

2. Разработана структура МИС, которая может использоваться в повседневной практике медицинских организаций и учреждений, обладающих большим объемом нозологической информации. Программно-аппаратно реализован нозологический подход, позволяющий клиницистам и представителям теоретической медицины с помощью средств вычислительной техники выделять нозологические формы, для которых характерны определенные причины, однозначный патогенез, типичные внешние проявления и специфические структурные нарушения в органах и тканях;

3. Определены принципы построения алгоритмов и программных средств, предназначенных на ранней стадии обработки информации выявлять ошибочные данные с механизмом их автоматического исправления. Разработаны научно обоснованные программные решения, направленные на повышение уровня достоверности нозологических данных. Разработанная система контроля достоверности информации обладает высокой степенью совместимости и мобильности, вследствие чего может быть интегрирована в уже существующие хранилища данных, а также портироваться на сервера различных медицинских учреждений, поддерживающих реляционную модель данных.

4. Впервые при проектировании МИС анализа медицинских показателей применен предметно-ориентированный подход, применяемый при разработках промышленных систем класса Enterprise Resource Planning , который позволяет оперировать набором метаданных для настройки системы под нужды системы здравоохранения. Предложены и обоснованы различные стратегии построения обучающих выборок для построения регрессионных моделей классификации нозологических показателей.

5. Проведена обработка больших объемов информации об индивидуальных нозологических показателях больных, прошедших медицинское обследование в учреждениях здравоохранения. Осуществлена систематизация результатов обработки и построение информационных карт, свидетельствующих о вероятности возникновения того или иного заболевания у конкретного больного; системный анализ для выявления социально-опасных тенденций в развитии тяжелых, трудноизлечимых заболеваний, например, суицида.

6. Созданная МИС построена на основе теории диалогики, базирующейся на логике распознавания образов нозологических форм. Она способствует развитию клинической нозологии, представляющей собой специфическое преломление общей нозологии в индивидуально-личностном преломлении. МИС, построенная на диалогике, требует от врача совершенствования ума и таланта, интуиции и знаний нозологии, этиологии, патогенеза, клиники, лечения, поскольку в основе клинической патологии лежат законы саморегуляции (патокинеза), законы адаптивного реагирования. Выделение нозологических форм важно для развития клинических дисциплин, т.к. способствует единому подходу к каждой болезни, в частности разработке методов специфической патогенетической терапии.

7. Сформулированная математическая постановка задачи классификации социальных групп по риску смертности от различных причин и алгоритм ее численной реализации дает возможность повысить точность классификации в сочетании с высокой оперативностью по сравнению с существующими математическими моделями. Приведенный метод позволит существенно ускорить принятие управленческих решений.

8. Созданная модель, основанная на полной выборке регистра смертности населения. Адекватность моделей показана при помощи таблиц классификации на объектах контрольной выборки. Для модели классификации социальных групп по риску смертности в результате суицида общий процент правильной классификации составил 72.1%.

ЗАКЛЮЧЕНИЕ

Библиография Токмурзин, Павел Владимирович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Токмурзин П.В. Логистическая модель анализа и прогнозирования суицидов // Материалы к V1.Российской университетской академической научно-практической конференции - 2004. - 112 - 113 с.

2. Токмурзин П.В. Логистическая модель анализа риска для показателя суицида на территории Удмуртской Республики // Вестник Удмуртского Университета. -2006. -№1,161 168 с.

3. Токмурзин П.В., Ицков А.Г. Особенности реализации медицинских информационных систем на примере подсистемы «Анализ показателей смертности» // Интеллектуальные системы в производстве 2006. - №1, 200 -206 с.

4. Токмурзин П.В. Структура и возможности МИС анализа показателей смертности // Вестник Ижевского Государственного Технического Университета 2006. - №4, 76 - 79 с.

5. Токмурзин П.В., Ицков А.Г. Методы отбора параметров для построения бинарных математических моделей классификации // Вестник Удмуртского Университета. 2007. - № 1, 215 - 222 с.

6. Токмурзин П.В. Построение логистических моделей классификации медицинских показателей. Ижевск, 2007. - 19 с. - Деп. В ВИНИТИ 10.04.2007, № 406-В2007.

7. Токмурзин П.В. Построение медицинской информационной системы анализа показателей смертности. Ижевск, 2007. - 14 с. - Деп. В ВИНИТИ 10.04.2007, №407-В2007.

8. CNews: Интернет издание о высоких технологиях http://www.cnews.ru/ reviews/free/national2006/int/podhod/.

9. Ю.Ульянов М.М. Обзор ситуации на рынке современных медицинских компьютерных систем // Здравоохранение. 2002. - №3. - С. 169-172.

10. Столяр B.JI. Медицинские информационные системы // Медикал маркет. -1997.-№4.-С. 6-9.

11. Селезнев В.П. Проблемные вопросы построения инфор-мационно-программных комплексов обеспечения работ профильных и административно-хозяйственных подразделений лечебно-профилактических учреждений // Экономика здравоохранения. 2001. - №1. - С. 32-34.

12. Столяр B.JL, Москвичев А.Л., Винокуров Д.К. //Анн. хир. 1997. - №2.

13. Комаров Ю.М. Проблемы создания АСУ в здравоохранении // Здравоохранение Рос. Федерации. 1988. - №5. - С. 18-22.

14. АСПОН-90 путь к полной компьютеризации здравоохранения СССР // Сов. культура. - 1989. - 8 апреля. - С. 12.

15. И.М. Воронцов, В.В. Шаповалов, А.Е. Иориш, Т.И. Иванова, Л.И. Миронова, М.Д. Рожнов. Значение компьютерных технологий в профилактической педиатрии http://nature.web.ru/db/msg.html?mid=l 174324.

16. П.Богомолов Б. Медицинская энциклопедия. М.:АСТ, 2006. - 734 с.

17. Щеглов В.Н. Алгебраические модели конструктивной логики для управления и оптимизации химико-алгебраических систем // Автореферат кандидата технических наук Л.: Технологический институт им. Ленсовета, 1983 -20 с.

18. Драгалин А.Г. Математический интуиционизм. Введение в теорию доказательств. М.: Наука, 1979. - 256 с.

19. Кафаров В.В., Щеглов В.Н. Моделирование сложных химико-технологических процессов на основе методов алгебры логики // Доклад АН СССР, 1976.-Т. 231.-№6.

20. Международная классификация болезней МКБ-10. Электронная версия -http ://www.mkb 10.ru/.

21. Какорина Е.П. Развитие медицинских информационно-аналитических центров в Российской Федерации // Здравоохранение. 2002. - №7. -С. 163-173.

22. CNews: Интернет издание о высоких технологиях http://www.cnews.ru/ reviews/free/national2006/articles/itperspekt/.

23. Bearman М., McPhee W„ Cesnik В. // MEDINFO 95 Proceeding, IMIA. -1995.-P. 785.

24. FHer F.J., Hirs W.M. // MEDINFO 95 Proceeding, IMIA. 1995. - P. 121.

25. Калянов Г.Н. CASE-технологии. Консалтинг в автоматизации бизнес-процессов. М.: Горячая линия, 2003. - 320 с.

26. Бендат Дж., Пирсол А. Измерение и анализ случайных процессов. -М.: Мир, 1971.-408 с.

27. Bendat J.S. Interpretation And Application of Statistical For Random Physical Phenomena. 1962.-120 p.

28. Гренандер У. Случайные процессы и статистические выводы. М.: Букинист, 1951.- 168 с.

29. Крамер Г. Математические методы статистики. М.: Букинист, 1975. -648 с.

30. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия. М.: Финансы и статистика, 1982.-317 с.

31. Тейл Г. Экономические прогнозы и принятие решений. М.: Статистика, 1971.-490 с.

32. Кендалл М. Дж., Стьюдент А. Статистические выводы и связи. М.: Наука, 1973.-892 с.

33. Дейвид Г. Порядковые статистики. М.: Наука, 1979. - 336 с.

34. Енюков И.С., Кулакова Е.П. Числовые метки для качественных признаков в дискриминантом анализе. М.: Наука, 1978. - 112 с.

35. Kendall rank correlation. In N.J. Salkind (Ed.): Encyclopedia of Measurement and Statistics. Thousand Oaks (CA): Sage, 2006.

36. KendalI M. Rank Correlation Methods. London: Griffin, 1948. - 160 p.

37. KendaII M. A New Measure of Rank Correlation. Biometrica. 1938. - №30. -P. 81-93.

38. Goodman L.A., Kruskal W.H. Measures of association for cross classifications // Journal of the American Statistical Association, 1972. Vol. 67 . -No 338.-PP. 415-421.

39. Castellan N. The analysis of behavior sequences. NJ: Lawrence Erlbaum Associates, 1979.-364 p.

40. Cohen J., Cohen P., West S.G., Aiken L.S. Applied multiple regression/correlation analysis for the behavioral sciences. NJ: Lawrence Erlbaum Associates, 2003. - 736 p.

41. Fisher R. A. Combining independent tests of significance // Journal of the American Statistical Association, 1954. Vol. 49 . - No 267. - PP. 559-574.

42. Айвазян C.A., Енюков И.С., Мешалкин Н.Д. Прикладная статистика: Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983.-471 с.

43. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. М.: Статистика, 1974. - 200 с.

44. Демиденко Е.З. Линейная и нелинейная регрессия. М.: Финансы и статистика, 1981.-302 с.

45. Hosmer D.W., Lemeshow S. Applied logistic regression. John Wiley & Sons Inc, 2000.-376 p.

46. Lemeshow S., Hosmer, D.W. The use of goodness-of-fit statistics in the development of logistic regression models // American Journal of Epidemiology. -1982.-No 115.-PP. 92-106.

47. Lemeshow S., Hosmer D.W. Estimation of odds ratios with categorical scaled covariates in multiple logistic regression analysis // American Journal of Epidemiology.- 1983.-No 119.-P. 147-151.

48. Lemeshow S., Hosmer D.W., Klar J., Lwanga S.K. Adequacy of Sample Size in Health Studies. John Wiley & Sons Inc, 1990. - 239 p.

49. Lemeshow S., Teres D., Avrunin J. S., Pastides H. Predicting the outcome of intensive care unit patients // Journal of the American Statistical Association, 1988. Vol. 83 . - No 402. - PP. 348-356.

50. Rao C.R. Linear Statistical inference and Its Application, Second Edition. -Wiley-Interscience, 1973. 642 p.

51. Бронштейн И.Н., Семендяев К.А. Справочник по математике для инженеров и учащихся ВТУЗов. М.: Наука, 1980. - 976 с.

52. McCulIagh, P., Nelder, J. A. Generalized Linear Models, Second Edition. -Chapman & Hall, 1989. 532 p.

53. SAS Institute Inc.SAS Guide for Personal Computers, Version 8.0. SAS Institute Inc., 2000.

54. Bendel, R.B., Afifi, A.A. Comparison of stopping rules in forward regression // Journal of the American Statistical. 1977. - No 72. - PP. 46-53.

55. Costanza, M.C, Afifi, A.A. Comparison of stopping rules in forward stepwise discriminant analysis // Journal of the American Statistical Association. 1979. -Vol. 74. - No 368. - PP. 777-785.

56. McFadden. Management of Data in Clinical Trials. Wiley-Interscience, 1984. -232 p.

57. FIeiss J. The Design and Analysis of Clinical Experiments. New York: Wiley, Inc., 1986.-448 p.

58. Wooding W.M. Planning Pharmaceutical Clinical Trials: Basic Statistical Principles. John Wiley & Sons, 1993. - 560 p.

59. Lemeshow S., Teres D., Avrunin, J.S., Pastides H. Predicting the outcome of intensive care unit patients // Journal of the American Statistical Association, 1988. Vol. 83 . - No 402. - PP. 348-356.

60. McCusker, J., Bigelow C., Vickers-Lahti M., Spotts D., Garfield F., Frost R. Planned duration of residential drug abuse treatment: efficacy versus treatment//Addiction, 1977.-Vol. 92.-No 11.-p. 1467-1478.

61. Efron B. The efficiency of logistic regression compared to normal discriminant function analysis // Journal of the American Statistical Association, 1975. -Vol. 70 . No 352. - PP. 892-898.

62. Официальный сайт кустового медицинского информационно-аналитического центра г. Новокузнецка http://www.ivcgzo.nkz.ru.

63. Джефри Д. Шэнк Технология клиент-сервер и ее приложения. М.: Лори, 1995.-418 с.

64. Проектирование и реализация баз данных Microsoft SQL Server 2000. Учебный курс MCSE. М.: Русская редакция, 2001. - 704 с.

65. Microsoft SQL Server 7.0. СПб.: БХВ Санкт-Петербург, 1999 - 720 с.

66. Microsoft Corporation http://www.microsoft.com/learning/mcp/mcdba/.71 .Microsoft Corporation http://www.microsoft.com/rus/general/press/1999/.

67. Проект Глоссарий.ру http://www.glossary.ru.

68. Амбрумова А.Г. Суицидальное поведение, как объект комплексного изучения // Комплексные исследования в суицидологи. Сборник научных трудов. М.: НИИ Психиатрии МЗ СССР, 1986. - С. 7-25.

69. Хэзлем М.Т. Психиатрия. М.: ACT, 1998. - 624 с.

70. Stengel Erwin. Suicide & Attempted Suicide. Harmondsworth: Penguin Books Ltd., 1966.-312 p.

71. Шнейдман Эдвин. Душа самоубийцы. М.: Смысл, 2001.-316 с.

72. Бородин С.В., Михлин А.С. Мотивы и причины самоубийств // Актуальные про-блемы суицидологии. Труды Московского НИИ психиатрии. М., 1978.

73. Дюркгейм Э. Самоубийство Социологический этюд. Спб.: Союз, 1998. -495 с.

74. Государственный доклад о состоянии здоровья населения Удмуртской Республики за 1993 год. МЗ УР: 1994 - 57 с.

75. Государственный доклад о состоянии здоровья населения Удмуртской Республики за 1994 год. МЗ УР: 1995 - 63 с.

76. Государственный доклад о состоянии здоровья населения Удмуртской Республики за 1995 год. МЗ УР: 1996 - 61 с.

77. Государственный доклад о состоянии здоровья населения Удмуртской Республики за 1996 год. МЗ УР: 1997 - 68 с.

78. Интернет портал DELFI http://rus.delfi.ee/.

79. Круг Э.Г. и др. Насилие и его влияние на здоровье. Доклад о ситуации в мире. М.: Весь мир, 2003. - 349 с.

80. Суицидология: Прошлое и настоящее. -М.: Когито-центр, 2001. 566 с.

81. Давыдов А.А. Самоубийства, пол и золотое сечение // Социс. 1991. -№ 5.

82. Ллойд. Э., Ледерман У. Справочник по прикладной статистике. Том 2. М.: Финансы и статистика, 1990. - 526 с.

83. Холлендер М., Вулф Д. Непараметрические методы статистики. М.: Финансы и статистика, 1983. - 518 с.

84. Сравнительно-возрастные исследования в суицидологи. М.: Московский НИИ психиатрии, 1989.

85. Kondrichin Т. Suicide among Finno-Ugrians // Lancet. 1995. -№ 346.

86. Удмурты. Картографические исследования. Киров: Слово Истины, 2000. -42 с.

87. Кондрашенко В.Т. Девиантное поведение у подростков. Диагностика. Профилактика. Коррекция. Учебное пособие. М.: Аверсэв, 2006. - 365.

88. Синельников-Мурылев С.Г. Законодательные и политические аспекты бюджетной политики в постсоветской России http://www.IET.ru.

89. Questions About Suicide. Centre For Suicide Prevention, 2006.

90. Wikipedia. The Free Encyclopedia http://en.wikipedia.org/wiki/Suicide.

91. Википедия Самоубийство - http://ru.wikipedia.org/wiki/CyH4Hfl. 97.0фициальное представительство Удмуртской Республикиhttp://www.udmurt.ru/ru/official/goroda/kez/titul.php.

92. Яскевич Е.А. Клинический анализ истинных запоев // Клиника, диагностика и лечение алкогольных заболеваний. М., 1983.

93. Немцов А.В. Алкогольный урон регионов России. М.: NALEX, 2003. -136 с.

94. Смертность населения Российской Федерации. МЗ РФ, М.: 2000. - 98 с.

95. Школьников В.М., Червяков В.В. Политика по контролю кризисной смертности в России в переходный период. М,: 2000 - 123 с.

96. Известия Удмуртской Республики. Ижевск., 2002. - № 43.

97. Chapter 6 in Funding a Revolution: Government Support for Computing Research, National Academy Press, Washington DC, USA, 1999.

98. Nemtsov A.V. Estimation of total alcohol consumption in Russia, 1980-1994. Drug and Alcohol Dependence. 2000, 8

99. SUICIDE STATISTICS "Prevent Suicide Now" http://www.preventsuicidenow.com/suicide-statistics.html.

100. Международная статистическая классификация болезней и проблем, связанных со здоровьем. X пересмотр. ВОЗ Женева: 1995. - 877 с.

101. Прошутин B.JL, Артамонова О.В. Медико-социальный анализ завершенных суицидов на территории Удмуртии // Актуальные аспекты судебной медицины. 2-й выпуск. Ижевск, 1992. - 117 с.

102. Веселовский К.С. Опыты нравственной статистики в России. СПб., 1847.- 117 с.