автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Разработка информационно-аналитической системы поддержки принятия решений в сфере муниципального здравоохранения

кандидата технических наук
Целиков, Александр Васильевич
город
Москва
год
2010
специальность ВАК РФ
05.13.10
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка информационно-аналитической системы поддержки принятия решений в сфере муниципального здравоохранения»

Автореферат диссертации по теме "Разработка информационно-аналитической системы поддержки принятия решений в сфере муниципального здравоохранения"

003494646

На правах рукописи

ЦЕЛИКОВ АЛЕКСАНДР ВАСИЛЬЕВИЧ

РАЗРАБОТКА ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ

СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В СФЕРЕ МУНИЦИПАЛЬНОГО ЗДРАВООХРАНЕНИЯ

Специальность 05.13.10 - Управление в социальных и экономических системах

АВТОРЕФЕРАТ

диссертации на соискание учёной степени кандидата технических наук

9 Г МАО ?ПЧП

Москва-2010

003494646

Работа выполнена в Филиале ГОУ ВПО Московского государственного индустриального университета в г. Сергиевом Посаде Московской области (СПФ ГОУ МГИУ).

Научный руководитель:

Кандидат технических наук, доцент Ткаченко Людмила Андреевна, доцент кафедры ПМИ СПФ ГОУ МГИУ

Официальные оппоненты:

Доктор физико-математических наук, профессор

Клименко Игорь Семенович,

профессор кафедры ИТиЕНД НОУ ВПО РосНОУ

Доктор технических наук, доцент Остроух Андрей Владимирович, профессор кафедры АСУ МАДГТУ (МАДИ)

Ведущая организация:

ГОУ ВПО Московский Физико-Технический Институт (Государственный Университет)

Защита состоится « 21 » апреля 2010 года в 1600 часов на заседании диссертационного совета ДМ 521.019.01 при Российском новом университете (НОУ ВПО РосНОУ) по адресу: г. Москва, ул. Радио, д. 22.

С диссертацией можно ознакомиться в библиотеке Российского нового университета.

Текст автореферата размещён на сайте Российского нового университета (НОУ ВПО РосНОУ): http://diss.rosnou.ru/

Автореферат разослан « 19 » марта 2010 г.

Ученый секретарь диссертационного совета кандидат физико-математических наук, доцент

Растягаев Д.В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы диссертации

В настоящее время в здравоохранении Российской Федерации используется технология сбора государственной медицинской статистической отчетности разработанная в СССР. Она обеспечивает учет данных о состоянии здоровья населения, количестве и типах заболеваний, уровне медицинского обслуживания и т.п. Эти сведения являются основой для анализа заболеваемости населения и планируемой медицинской помощи. Несомненным преимуществом существующей технологии сбора медицинской статистики является наличие большого числа показателей, отражающих самые разные аспекты области здравоохранения. Однако растущий объем, разнородность и многомерность данных, а также увеличение сложности задач обработки сведений создают существенные барьеры в ходе анализа. Кроме того, в последнее время у работников области здравоохранения формируется критический взгляд на качество информации, содержащейся в этой системе, а также мнение о том, что их анализу обязательно должны предшествовать дополнительные процедуры оценки непротиворечивости, полноты и достоверности материалов. Главной причиной этого является наличие пропусков и некорректностей исходных данных, а также неудовлетворительные результаты оценок достоверности сведений, проводящихся последнее время средствами автоматического контроля. Кроме того, общепризнанным мнением сотрудников в данной области является то, что система государственной медицинской отчетности способна оказывать ещё большее содействие в управлении здравоохранением при условии использования новых методов обработки данных.

Современные технологии учета информации, такие как хранилища и интеллектуальный анализ данных, а также оперативная аналитическая обработка сведений созданы для обработки, хранения и анализа больших объёмов сложно структурированных данных. Применение указанных походов в обработке статистической информации о заболеваемости обеспечит подготовку качественно нового информационного слоя с целью оказания помощи лицу принимающему решение (ЛПР).

Проведенный обзор литературы, а также анализ существующих программных продуктов показал актуальность тематики настоящей работы по проектированию информационно-аналитической системы поддержки принятия решений для учета и обработки данных медико-статистической отчетности.

Целью работы является разработка информационно-аналитической системы в сфере муниципального здравоохранения для обеспечения качественного учета, хранения, обработки и анализа данных медико-статистической отчетности, повышения обоснованности принимаемых решений.

Для достижения поставленной цели решаются следующие задачи.

1. Анализ существующих технологий обработки статистической информации о заболеваемости, а также современных методов анализа данных.

2. Математическая постановка и разработка методов решения задач нахождения некорректных значений медико-статистических данных, заполнения пропусков, а также поиска ассоциативных правил в сведениях области здравоохранения.

3. Разработка комплекса алгоритмов для корректировки и анализа исходных данных, а также представления результатов в удобном для восприятия виде.

4. Разработка схемы функционирования информационно-аналитической системы в области обработки медико-статистических данных, поддерживающей существующую технологию учета показателей заболеваемости.

5. Программная реализация пользовательского интерфейса информационно-аналитической системы поддержки принятия решений в области обработки медико-статистических данных.

Методы исследования: Полученные результаты исследования базируются на использовании методов и средств системного анализа, теории реляционных баз данных, теории построения автоматизированных информационных систем, теории хранилищ данных, статистического и кластерного анализа, теории принятия решений, технологии оперативной аналитической обработки OLAP (On-Line Analytical Processing), интеллектуального анализа данных.

Научная новизна работы

1. Впервые разработаны OLАР-модели построения сводов (агрегации) медико-статистических форм, а также расчета основной отчетной формы сети медицинских лечебно-профилактических учреждений «Сведения о сети и деятельности медицинских учреждений».

2. Разработаны новые методы обнаружения некорректных значений показателей, а также оптимизационный алгоритм заполнения пропусков в

данных медико-статистической отчетности, обеспечивающие повышение достоверности проводимого анализа.

3. Предложен подход и разработан соответствующий метод для численно обоснованного поиска ассоциативных правил с учетом сведений различных отчетных периодов в анализе статистической информации о заболеваемости.

Основные результаты, выносимые на защиту

1. Комплекс OLAP-моделей построения сводов (агрегации) форм медико-статистической отчетности, а также расчета основной отчетной формы сети медицинских учреждений «Сведения о сети и деятельности медицинских учреждений».

2. Методы определения некорректных значений и заполнения пропусков в данных медико-статистической отчетности, обеспечивающие повышение достоверности проводимого анализа.

3. Подход к численно обоснованному поиску ассоциаций с учетом сведений различных отчетных периодов в анализе статистической информации о заболеваемости.

4. Структура СПГ1Р на основе использования технологий OLAP и хранилищ данных, обеспечивающая эффективное преобразование и представление информации, а также позволяющая автоматизировать процесс анализа сведений современными методами и моделями принятия решений.

5. Программная реализация информационно-аналитической системы, обеспечивающая поддержку принятия решений на основе применения разработанных методов и моделей.

Практическая ценность работы

Разработанная в диссертации информационно-аналитическая система поддержки принятия решений позволяет осуществлять сбор, контроль и предобработку сведений по используемым в настоящее время формам медико-статистического мониторинга; обеспечивать процедуру расчета основной отчетной формы сети медицинских учреждений «Сведения о сети и деятельности медицинских учреждений» (формы №47) и формировать агрегированные (сводные) отчеты остальных форм; проводить комплексный контроль правдоподобности и исправление некорректных значений показателей; находить обоснованные по нескольким отчетным периодам численные ассоциации между различными заболеваниями; представлять информацию в удобном для пользователя виде.

Внедрение результатов

1. Результаты диссертационной работы официально зарегистрированы в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам в виде программы для ЭВМ (№ 2008614296 Система сбора и анализа медицинских данных «СИАМЕД» от 8 сентября 2008 г.) и базы данных (№2008620336 База данных системы сбора и анализа медицинских данных «БД СИАМЕД» от 8 сентября 2008 г.).

2. Разработанная в рамках диссертационного исследования система «СИАМЕД» внедрена в аналитико-статистическом отделе Управления здравоохранения администрации Сергиево-Посадского муниципального района Московской области, что подтверждено актом о внедрении.

Апробация работы

Основные положения и результаты работы представлены на научно-теоретической конференции «Право, общество, власть и современность» (Сергиев Посад, СПФ ГОУ МГИУ, 2005 г.), международной молодежной конференции «XXXIII Гагаринские чтения» (Москва, МАТИ, 2007 г.), на V Международной научно-практической конференции «Проблемы демографии, медицины и здоровья населения России: история и современность» (Пенза, МНИЦ, 2007 г.), второй научно-практической конференции «Виртуальные и интеллектуальные системы 2007» (Барнаул, АГТУ, 2007 г.), 50-й юбилейной научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» (Москва, МФТИ, 2007 г.), юбилейной XX всероссийской научно-технической конференции «Биомедсистемы-2007» (Рязань, РГРУ, 2007 г.), всероссийской научно-практической конференции «Математика, информатика, естествознание в экономике и обществе» (Москва, МФЮА, 2009 г.), 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» (Москва, МФТИ, 2009 г.).

Публикации

По материалам диссертации опубликовано 15 работ, в том числе одна статья в журнале, входящем в список рекомендованных изданий ВАК для публикации основных результатов диссертационных исследований [1]. Получены 2 свидетельства РОСПАТЕНТ об официальной регистрации базы данных и программы для ЭВМ.

Структура и объем работы

Диссертационная работа состоит из введения, трёх глав, заключения и списка литературы из 140 наименований, содержит 148 страниц текста.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы, формулируются цель диссертации, представляются результаты, выносимые на защиту, а также определяется научная новизна и дается общая характеристика работы.

В первой главе представлено краткое описание предметной области учета показателей в сфере здравоохранения РФ. Показано, что данные медико-статистической отчетности характеризуются разнородностью и многомерностью, а также имеют древовидную структуру характеристик. Объем сведений на муниципальном (районном) уровне ежегодно составляет свыше 20000 регистрируемых значений показателей. При этом, по данным 70 ЛПУ Московской области, процент пропусков в сведениях о населении зарегистрирован на уровне 3,89%, что соответствует 12,56% от всего населения области.

В настоящий момент на российском рынке присутствует немало программных продуктов для области здравоохранения, однако, проведенный в рамках первой главы аналитический обзор не позволил выявить систем, соответствующих всем современным требованиям хранения, учета и обработки сведений государственной медицинской статистической отчетности.

Кроме того, в главе приведен обзор современных подходов к анализу информации, таких как оперативная аналитическая обработка и методология интеллектуального анализа данных (ИАД). Эти технологии рассмотрены с целью их дальнейшего использования в процессе проектирования и разработки информационно-аналитической системы, что позволит получать информацию, способствующую принятию обоснованных управленческих решений в области управления здравоохранением.

Во второй главе разрабатываются методологические подходы к проектированию информациоино-аналитической системы поддержки принятия решений, анализируются вопросы реализации её структуры, математического и алгоритмического обеспечения.

Основными задачами информационно-аналитических систем являются: сбор, хранение, обработка, анализ и представление данных. Решение этих задач при проектировании системы целесообразно рассматривать комплексно.

Появление дополнительных источников информации в области статистики заболеваемости (сведения о населении, регионе проживания, о самих лечебно-профилактических учреждениях, данные рождаемости, смертности и т.н.), ведет к разнотипности и неоднородности информации, что

усложняет задачу хранения и обработки данных. С целью адаптации систем поддержки принятия решений к таким особенностям, используются специальные структуры хранения информации - хранилища данных (ХД), основной задачей которых является обработка сведений, собранных изо всех возможных источников, обеспечение их доступности и полезности для специалистов и аналитиков.

Помимо этого, дополнительные возможности обработки даёт технология оперативного анализа OLAP. Её использование предполагает предоставление пользователю агрегированной информации из исходного набора данных в удобном для восприятия и обработки виде многомерного представления сведений, называемого гиперкубом. По измерениям (осям) такого гиперкуба расположены параметры агрегации, а ячейки (меры) содержат сгруппированные данные.

На базе технологий OLAP и ХД в системе разработаны модели формирования сводов (агрегации) форм медико-статистической отчетности, а также модели расчета таблиц основной отчетной формы сети медицинских лечебно-профилактических учреждений «Сведения о сети и деятельности мелининских учреждений». При использовании методологии OLAP создание сводов медико-статистических форм из плоскости динамического агрегирования данных переходит в область проектирования аналитически-ориентированных объектов - OLAP-кубов. Указанные структуры хранения сведений являются основными источниками информации разрабатываемой системы поддержки принятия решений и будут использоваться как основа для последующего анализа.

Такой подход также позволит сохранить хронологию данных, повысить наглядность их представления, подготовит информационную базу для проведения прогнозов и применения методов анализа. Благодаря реализации свода по указанным технологиям уменьшится загруженность машинных ресурсов, снизится время обработки сведений при сложных запросах.

Кроме того, такая процедура позволит провести выравнивание размерности данных от абсолютного количества заболеваний до относительного (на 1000 человек населения), что обеспечит возможность проведения сравнительного анализа для различных регионов.

На рис. 1. представлена схема расчета ячеек куба основной отчетной формы сети медицинских лечебно профилактических учреждений «Сведения о сети и деятельности медицинских учреждений».

Рис. 1. Схема расчета ячеек куба основной отчетной формы

сети медицинских лечебно профилактических учреждений «Сведения о сети и деятельности медицинских учреждений»

Методы определения и исправления некорректных значений показателей. Для повышения достоверности и обоснованности принимаемых решений в системе разработаны специализированные методы, позволяющие обеспечивать корректность исходных данных. Обнаружение характеристик, имеющих неправдоподобные значения, производится на базе алгоритма кластеризации среди всего множества анализируемых объектов I = {¡/, ¡2, /з, 'У, где каждый объект (в данном случае - лечебно-профилактическое учреждение) обладает набором параметров Здесь т - общее число характеристик

объектов (в данном случае - число типов заболеваний, регистрируемых в рамках данного ЛПУ).

В результате проведения кластеризации формируется множество С-{с1,с2..£1), где с к - кластер, включающий объекты из Г. ск = {¡р,1ч 11р,1д £ /;с?(/р,/?) <е], где е - мера близости, отвечающая за объединение объектов в кластер, а я?(/р,г'5) - расстояние между объектами.

В качестве метода разбиения множества векторов указанного вида на кластеры, используется алгоритм самообучающихся карт Кохонена, применение которого способствует наглядности восприятия результата благодаря понижению размерности исходного признакового пространства, а также упорядоченности векторов на итоговой карте относительно совокупной характеристики их отдаления. Обучение нейронной сети происходит путём последовательной корректировкой весовых коэффициентов нейронов: м>1(1 + 1) = \у1(() + у({)-11ы(()-(а({)-ц>1(1)), где / - номер эпохи, а(1) - вектор входов, - функция соседства нейронов, которая является

невозрастающей зависимостью от времени и расстояния между нейроном-победителем и соседними нейронами в сетке. При этом, нейрон-победитель мь определяется как наименее отдалённый от случайного вектора исходных

данныха(1)\ Ца-и^ ||=шт{||а-и', ||}.

[

Исключительным свойством сетей Кохонена является возможность модифицировать весовые коэффициенты не только нейрона-победителя, но и соседних с ним нейронов. Благодаря этому в процессе обучения формируется гладкая нейронная сеть, восприимчивая к появлению объектов с сильно отличающимися значениями характеристик. По итоговой карте Кохонена, в зависимости от совокупных расстояний между объектами, объект с неправдоподобными значениями характеристик может быть легко определен

исходя из визуального рассмотрения результата расчета, и передан ЛПР для последующего анализа.

В качестве способа заполнения отсутствующих, либо определенных как некорректные, значений медико-статистических показателей разработан следующий оптимизационный метод. Исходя из особенностей предметной области, таких как отсутствие нормального распределения, наличие истории данных, структурное различие информации в рамках используемых типов лечебных учреждений, за основу подхода к заполнению пропусков примем регрессионный алгоритм.

Требуется построить оценки х у множества пустых значений X' - {х^ | х,' е!1;=0',] < к] для заданного периода времени где X' = {хУ | х'и е = 7..т;/ - /..«;] = 1..т) исходное множество данных. Здесь

г - общее число отчетных периодов; п — число объектов (ЛПУ); т - число характеристик.

Ограничим исходный набор объектов по типу лечебно-профилактических учреждений (амбулатории, районные больницы и т.п.), а также по степени близости к объекту с пропущенными значениями характеристик, для чего применим алгоритм определения ¿-ближайших соседей, в котором для снижения влияния выбросов в качестве базовой меры расстояний выбрана метрика по Хеммингу:

и .

р

При этом максимально допустимое расстояние <Л'Н для включения объектов в дальнейшие расчеты конкретной модели будем определять по следующей формуле:

"Н =-а- 5

" 10

где СЬ - уровень соответствия - является параметром каждой модели, иллюстрирующим мощность выборки объектов ближайших соседей, СЬ < 10;

— максимальное расстояние между всеми возможными объектами

выборки.

Таким образом, при СЬ = 10 в выборку попадут все рассматриваемые объекты, независимо от степени удаления, так как максимально допустимое

расстояние йп фактически будет соответствовать максимальному расстоянию по всей рассматриваемой выборке. При снижении значения параметра СЬ (9, 8, 7...) число ближайших соседей будет также уменьшаться.

Будем формировать ряд регрессионных моделей с использованием всех возможных комбинаций наборов входных признаков {*,_,■} и различных значений СЛ. Такой подход к выбору параметров регрессии в условиях небольшого числа характеристик может считаться оптимальным с точки зрения исключения незначащих и избыточных переменных.

Для оценки качества результата и выбора конкретных моделей регрессии по заполнению пропусков будем использовать оптимизационный подход, основанный на проверке модели по данным других отчетных периодов. Наилучшие оценки будут формироваться моделями, дающими наименьшую ошибку для сведений других отчетных периодов, где значение рассматриваемого признака заполнено и является корректным:

тш-^Е - I, (1)

где к- число независимых признаков модели;

I - идентификатор отчетного периода;

х у - непустое значение показателя для периода

—ч х у - оценка значения х ; ■ .

Отметим, что знаменатель в условии (1) введен с целью компенсации величины ошибки для моделей с разным числом переменных, т.к. исходя из условия суммирования ошибки для всех характеристик, модель с большим числом переменных будет иметь большее число слагаемых для её вычисления, то есть иметь заведомо большую ошибку.

Вид знаменателя (квадратный корень из числа независимых признаков модели) выбран по результатам тестирования работы алгоритма для формирования оценок заполненных значений характеристик населения для лечебных учреждений.

За итоговую оценку пропуска примем арифметическое среднее пяти лучших оценок полученных по моделям с наименьшими ошибками. В третьей главе диссертации на практических примерах показано, что такой выбор даёт наиболее правдоподобные оценки искомых значений параметров, а ошибка в определении характеристик на заполненных данных составляет менее 6% от реального значения показателя.

Общая схема оптимизациоиного метода заполнения пропущенных значений медико-статистических характеристик будет иметь следующий вид (рис. 2.):

Начало

Ограничение выборки рассматриваемых объектов по типу ЛПУ

Рис. 2. Схема заполнения пропусков

Подход к поиску ассоциативных численных правил, обоснованных по данным различных отчетных периодов. Для обнаружения взаимосвязей между

заболеваниями, регистрируемыми в различных ЛПУ, в системе разработан метод поиска правил следующего вида (на примере правила, условие и следствие которого содержат по одному заболеванию): «Если числовая характеристика заболевания 1 находится в диапазоне [ац-Ьц\, то числовая характеристика заболевания 2 будет находиться в диапазоне [a2i..b2i] ».

Для этого численные атрибуты cj (сведения о числе заболеваний различных типов) исследуемых объектов (лечебно-профилактических учреждений) исходного набора Т ~{{ij,cJ)\ij е I;Cj е Л'}, представляется в виде

диапазона [ajlc,bjk],k £ N, где к- идентификатор разбиения атрибута Cj.

Таким образом, первоначальная таблица численных данных преобразуется к булевой таблице, где вместо каждого исходного значения в результате разбиения формируется несколько логических областей. Значение переменной в соответствующей логической области будет 1, если первоначальная величина атрибута находится в границах интервала области, и О, в противном случае. Такой подход позволяет применить к сведениям о заболеваемости, обладающим численными значениями характеристик, базовый алгоритм расчета ассоциативных правил - Apriori, работающий только на множестве булевых данных.

При этом, для сохранения соответствия количественной семантической информации исходных значений и диапазонов в результирующих правилах, предложен следующий подход к формированию логических диапазонов на основе метода кластеризации: с целью снижения влияния выбросов в качестве базовой меры расстояний используется метрика по Хеммингу:

¡=1

Пересчет расстояния между кластерами происходит по формуле: dk=apdps+aqdv+ pdpq + y\dps-dqs\, где кластеры р и q объединяются в

кластер / и требуется рассчитать расстояние от получившегося кластера до кластера л. При этом используется подход с учетом расстояний внутри кластеров ("within group linkage"): ар = кр/(кр+kq); aq= kq/(kp +kq);

/? = 0; у = 0, в результате применения которого расстояния между всеми объектами пары кластеров вычисляются с учетом расстояний внутри кластеров, а также количества элементов в них, что позволит в должной мере учитывать одинаковые значения показателей разных ЛПУ.

Общая схема процесса кластеризации представлена на рис. 3, где

М'тОШапсе - минимальный элемент в матрице расстояний на текущем шаге, СсоиШ - число кластеров, Е - заданная пользователем точность и минимально возможное число кластеров МтСсоигй.

\ Начало )

; Первоначальное разбиение по кластерам, | инициализация матрицы расстояний

I___,__

Рис. 3. Схема процесса кластеризации

В качестве решения проблемы большого числа результирующих правил и повышения их обоснованности разработан алгоритм последовательного расчета ассоциаций для нескольких временных периодов с последующим отбором

К') и (К2^>К2)

правил, соответствующих всем периодам. Правила « * » > и будут считаться схожими на множестве импликаций вида

К^й Ю\{>и>У <= Л'} для различных промежутков времени /7 и <2, если

выполняются следующие условия:

1:4 I _ / ¡12 | ;12

¿У + Л

'2 \

\о,'к-аЧЛ<

а ¡к + Дд

Д

а% + а^

(2)

(3)

(4)

(5)

Коэффициент g задаётся пользователем и определяет уровень допустимого отклонения для границ интервалов. На рис. 4. приведена иллюстрация работы условий (4) и (5) в зависимости от величины параметра g.

100 133 166 200 233 266 300 Величина границы диапазона

333 386 400

Рис. 4. Определение допустимого отклонения Общая схема поиска ассоциативных правил представлена на рис. 5.

Начало

| Загрузка проверенных на непротиворечивость исходных данных \

Рис. 5. Общая схема поиска ассоциативных правил

Значение коэффициента g является также определяющим для числа результирующих правил. Чем больше величина g тем строже задано соответствие между границами диапазонов для объединения правил и тем меньше правил будет отобрано алгоритмом.

В третьей главе рассматривается применение разработанных методов и моделей в системе «СИАМЕД» для анализа данных сферы муниципального здравоохранения, представлена программная реализация системы, а также описание настроек, функционирования и взаимодействия рабочих модулей и подсистем. Информационно-аналитическая система поддержки и принятия решений спроектирована как совокупность подсистем, отвечающих за различные этапы работы с данными медико-статистической отчетности (рис. 6.):

■ Подсистема ввода и загрузки данных;

■ Подсистема агрегации данных:

• Модуль формирования сводов и расчета формы №47;

• Модуль построения аналитических отчетов;

• Модуль формирования ОЬАР-кубов;

" Подсистема анализа данных:

• Модуль аналитического контроля данных и кластеризации;

• Модуль поиска ассоциаций;

• Модуль извлечения данных;

• Механизмы логического вывода;

" Подсистема представления результатов.

Загружаемые данные о заболеваемости в абсолютном исчислении подвергаются процедуре проверки в модуле медико-статистического контроля сведений. После этого, информация, в случае её корректности, приводится к относительному виду с учетом обслуживаемого лечебно-профилактическими учреждениями населения. Сведения такого рода проходят процедуру контроля правдоподобности данных с последующим заполнением пропусков, исправлением найденных некорректных значений показателей населения.

В главе представлены примеры практического использования разработанных методов и алгоритмов для обработки данных о заболеваемости. Описано применение ОЬАР-моделей для создания сводов форм медико-статистической отчетности, использование методов обнаружения и корректировки неправдоподобных значений показателей на примере анализа отчетных данных лечебно-профилактических учреждений Московской области.

Медико-статистический контроль данных

Подсистема анализа данных

Аналитический контроль данных, кластеризация

Поиск ассоциаций

Извлечение данных

Механизмы логического вывода

1......[

База данных

Хранилище данных

.........

Поиск и редактирование информации

Подсистема агрегации данных

Формирование сводов и расчет форм ы №47

Построение аналитических отчетов

Формирование ОЬАР-кубов

Подсистема представления результатов

Рис. б. Обобщенная структура СППР

Также в главе показано, что разработанный подход к поиску взаимосвязей между характеристиками объектов (в данном случае -заболеваний) позволяет значительно уменьшить число правил, формируемых стандартным алгоритмом Арпоп, повышая при этом их обоснованность, что существенно облегчает задачу аналитика. Необходимо отметить, что получаемые с его помощью правила позволяют находить статистически подтвержденные ассоциации, которые, тем не менее, требуют последующего детального анализа и подтверждения специалистами предметной области.

В заключении описываются основные результаты работы.

Приложение содержит документы об использовании результатов работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. На основании проведенного аналитического обзора технологий и программных продуктов учета статистической информации о заболеваемости показана актуальность разработки специализированной системы поддержки принятия решений. Выявлен ряд проблем, которые могут быть решены путём автоматизации подготовки данных для принятия решений в сфере здравоохранения. Показано, что такие факторы как недостоверность и разнородность данных, низкая производительность процесса обработки могут быть устранены применением современных технологий хранения и методов анализа данных.

2. Впервые разработаны ОЬАР-модсли формирования агрегированных отчетов (сводов) форм медико-статистической отчетности, а также расчета основной отчетной формы сети медицинских лечебно-профилактических учреждений «Сведения о сети и деятельности медицинских учреждений».

3. Разработаны новые методы определения некорректных значений и заполнения пропусков, обеспечивающие повышение достоверности проводимого анализа данных.

4. Предложен подход и разработан соответствующий метод численно обоснованного поиска ассоциативных правил по данным различных отчетных периодов в анализе медико-статистических сведений.

5. Разработана модель системы поддержки принятия решений, поддерживающая существующую схему функционирования процессов документооборота в органах учета статистической информации здравоохранения РФ.

6. Спроектирована структура информационно-аналитической системы, оптимизированная для хранения, обработки и последующего анализа имеющейся информации.

7. Выполнена программная реализация системы, обеспечивающей возможность поддержки принятия решений в области обработки медико-статистических данных.

8. В ходе внедрения и использования спроектированной системы поддержки принятия решений подтверждена состоятельность разработанных методов и моделей.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

I. Публикации в изданиях, включенных в перечень ВАК РФ

1. Целиков, A.B. Аналитическая система информационного обеспечения процесса управления показателями здравоохранения на муниципальном уровне / A.B. Целиков // Проблемы управления. - 2008. -№ 1. - С. 68-72.

//. Публикации в других изданиях

2. Целиков A.B. Система сбора и анализа медицинских данных «СИАМЕД». Свидетельство об официальной регистрации программы для ЭВМ №2008614296 от 08 сентября 2008 г.

3. Целиков A.B. База данных системы сбора и анализа медицинских данных «СИАМЕД». Свидетельство об официальной регистрации базы данных №2008620336 от 08 сентября 2008 г.

4. Целиков, A.B. Автоматизированная обработка медико-статистической отчетности в анализе заболеваемости населения и влияния состояния окружающей среды / A.B. Целиков, Л.А. Ткаченко // Техника, технологии и перспективные материалы: межвуз. сб. науч. тр. ГОУ МГИУ. - М., 2005. -С. 300-304.

5. Целиков, A.B. Информационные системы обработки экологических данных и медико-статистической отчетности на муниципальном уровне / A.B. Целиков, Л.А. Ткаченко // Техника, технологии и перспективные материалы: межвуз. сб. науч. тр. ГОУ МГИУ. - М., 2005 - С. 304-308.

6. Целиков A.B. Информационно-аналитическая система сбора и анализа медико-статистических данных / A.B. Целиков // Научные труды XXXIII международной молодежной конференции «Гагаринские чтения» 3-7 апреля 2007 г. Том 6. - М.: МАТИ, 2007. - С. 263-264.

7. Целиков A.B. Обработка данных о статистики заболеваний аналитическими методами / A.B. Целиков // Сборник статей V международной научно-практической конференции «Проблемы демографии, медицины и здоровья населения России: история и современность». - Пенза: МНИЦ ПГСХА, 2007. - С. 108-111.

8. Целиков A.B. Современные информационно-аналитические системы в организации здравоохранения / A.B. Целиков // Сборник статей V международной научно-практической конференции «Проблемы демографии, медицины и здоровья населения России: история и современность». - Пенза: МНИЦ ПГСХА, 2007. - С. 111-114.

9. Целиков, A.B. Принципы разработки современной интеллектуальной системы обработки медицинской информации / A.B. Целиков // Ползуновский альманах. - 2007. - №3. - С. 185-186.

10. Целиков A.B. Автоматизированная модель классификации объектов в системе анализа медико-статистических данных / A.B. Целиков // Труды 50-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук»: Часть 7. Управление и прикладная математика. Т. 2. - М.: МФТИ, 2007.-С. 87-88.

11. Целиков A.B. Система поддержки принятия решений в области здравоохранения на основе анализа данных медицинской статистики / A.B. Целиков // Материалы конференции «Биомедсистемы-2007». - Рязань: РГРУ, 2007. - С. 161-162.

12. Целиков A.B. Прогнозирование уровня заболеваемости в информационно-аналитической системе / A.B. Целиков // Сборник статей VII международной научно-технической конференции «Математическое моделирование, обратные задачи, информационно-вычислительные технологии». - Пенза: МНИЦ ПГСХА, 2007. - С. 171-173.

13. Целиков A.B. Методы интегральной оценки и кластерного анализа в обработке медико-статистических данных / A.B. Целиков, O.A. Марова // Право, общество, власть, современность: Тезисы докладов и выступлений студентов, аспирантов и преподавателей. - М.: МГИУ, 2008. - С. 234-240.

14. Целиков A.B. О подходе к повышению достоверности численных ассоциативных правил / A.B. Целиков, JI.A. Ткаченко // Труды международной научно-практической конференции «Математика, информатика, естествознание в экономике и обществе». Т. 2. - М.: МФЮА, 2009. - С. 162-165.

15. Целиков A.B. Методика обработки пропусков и некорректных данных в области анализа сведений о заболеваемости / A.B. Целиков // Труды 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук»: Часть 7. Управление и прикладная математика. Т. 1. -М.: МФТИ, 2009. - С. 180-182.

В работах с соавторами лично соискателем выполнено следующее: в [4,5] - выбор, обоснование и проектирование структур хранения данных; [13] -разработка специализированных методов кластеризации объектов; [14] -разработка подхода к поиску численных ассоциированных правил с учетом данных различных отчетных периодов.

Подписано в печать:

12.03.2010

Заказ № 3375 Тираж -100 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru

Оглавление автор диссертации — кандидата технических наук Целиков, Александр Васильевич

ВВЕДЕНИЕ.

1. АНАЛИЗ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ В ОБЛАСТИ ОБРАБОТКИ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ О ЗАБОЛЕВАЕМОСТИ.

1.1. Организация и проблемы учета медико-статистических сведений.

1.2. Анализ информационных систем обработки статистических данных в здравоохранении.

1.3. Современные методы и средства поддержки принятия решений.

1.3.1. Технология оперативной аналитической обработки данных.

1.3.2. Методы интеллектуального анализа данных.

1.3.3. Методы восстановления пропусков в данных.

1.4. Актуальные задачи анализа данных медицинской статистики.

1.5. Выводы.

2. РАЗРАБОТКА МЕТОДОЛОГИЧЕСКИХ ПОДХОДОВ К ПРОЕКТИРОВАНИЮ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ «СИАМЕД» В СФЕРЕ МУНИЦИПАЛЬНОГО ЗДРАВООХРАНЕНИЯ.

2.1. Организация структуры учета сведений на основе технологий

OLAP и хранилищ данных ^.

2.1.1. Преимущества использования хранилищ данных в аналитических системах.

2.1.2. Агрегация (формирование сводов) медико-статистической отчетности с использованием механизма OLAP.

2.1.3.Формирование основной отчетной формы сети медицинских лечебно-профилактических учреждений «Сведения о сети и деятельности медицинских учреждений» (формы №47) с использованием технологии OLAP.

2.2. Анализ пропусков и некорректных значений медико-статистических данных с использованием кластерного и оптимизационного подходов.

2.2.1. Постановка задачи кластеризации.:.

2.2.2. Математический аппарат самообучающихся карт Кохонена.

2.2.3. Оптимизационный подход к заполнению пропусков в медико-статистических данных.

2.3. Анализ статистических данных о заболеваемости на основе поиска ассоциативных правил.

2.3.1. Постановка задачи поиска ассоциаций.

2.3.2. Алгоритмы поиска ассоциативных правил.

2.3.3. Разбиение исходных значений показателей на диапазоны.

2.3.4. Поддержка истории данных при расчете ассоциаций.

2.4. Выводы.

3. ПРИМЕНЕНИЕ РАЗРАБОТАННЫХ МЕТОДОВ И МОДЕЛЕЙ В СИСТЕМЕ «СИАМЕД» ДЛЯ АНАЛИЗА ДАННЫХ СФЕРЫ МУНИЦИПАЛЬНОГО ЗДРАВООХРАНЕНИЯ.

3.1. Структура системы «СИАМЕД».

3.2. Загрузка, редактирование и медико-статистический контроль данных.

3.3. Формирование сводов и расчет основной отчетной формы сети медицинских лечебно-профилактических учреждений (формы №47) с применением методов оперативной аналитической обработки.

3.4. Поиск и исправление некорректных значений.

3.4.1. Настройка модуля аналитического контроля данных и кластеризации.

3.4.2. Выявление дублирующих записей о ЛПУ.

3.4.3. Нахождение ЛПУ с некорректными значениями сведений об обслуживаемом населении.

3.4.4. Заполнение пропусков и некорректных значений в данных об обслуживаемом ЛПУ населении.

3.5. Формирование статистически обоснованных ассоциативных правил в анализе статистических данных о заболеваемости.

3.5.1. Настройка модуля поиска ассоциаций.

3.5.2. Разбиение числовых значений показателей на интервалы.

3.5.3. Поиск численных ассоциативных правил с учетом сведений нескольких отчетных периодов.

3.6. Выводы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Целиков, Александр Васильевич

В настоящее время в здравоохранении Российской Федерации используется технология сбора государственной медицинской статистической отчетности разработанная в СССР. Она обеспечивает учет данных о состоянии здоровья населения, количестве и типах заболеваний, уровне медицинского обслуживания и т.п. Эти сведения являются основой для анализа заболеваемости населения и планируемой медицинской помощи. Несомненным преимуществом существующей технологии сбора медицинской статистики является наличие большого числа показателей, отражающих самые разные аспекты области здравоохранения. Однако растущий объем, разнородность и многомерность данных, а также увеличение сложности задач обработки сведений создают существенные барьеры в ходе анализа. Кроме того, в последнее время у работников области здравоохранения формируется критический взгляд на качество информации, содержащейся в этой системе, а также мнение о том, что их анализу обязательно должны предшествовать дополнительные процедуры оценки непротиворечивости, полноты и достоверности материалов. Главной причиной этого является наличие пропусков и некорректностей исходных данных, а также неудовлетворительные результаты оценок достоверности сведений, проводящихся последнее время средствами автоматического контроля. Кроме того, общепризнанным мнением сотрудников в данной области является то, что система государственной медицинской отчетности способна оказывать ещё большее содействие в управлении здравоохранением при условии использования новых методов обработки данных.

Современные технологии учета информации, такие как хранилища и интеллектуальный анализ данных, а также оперативная аналитическая обработка сведений созданы для обработки, хранения и анализа больших объёмов сложно структурированных данных. Применение указанных походов в обработке статистической информации о заболеваемости обеспечит подготовку качественно нового информационного слоя с целью оказания помощи лицу принимающему решение (ЛПР).

Проведенный обзор литературы, а также анализ существующих программных продуктов показал актуальность тематики настоящей работы по проектированию информационно-аналитической системы поддержки принятия решений для учета и обработки данных медико-статистической отчетности.

Целью работы является разработка информационно-аналитической системы в сфере муниципального здравоохранения для обеспечения качественного учета, хранения, обработки и анализа данных медико-статистической отчетности, повышения обоснованности принимаемых решений.

Для достижения поставленной цели решаются следующие задачи.

1. Анализ существующих технологий обработки статистической информации о заболеваемости, а также современных методов анализа данных.

2. Математическая постановка и разработка методов решения задач нахождения некорректных значений медико-статистических данных, заполнения пропусков, а также поиска ассоциативных правил в сведениях области здравоохранения.

3. Разработка комплекса алгоритмов для корректировки и анализа исходных данных, а также представления результатов в удобном для восприятия виде.

4. Разработка схемы функционирования информационно-аналитической системы в области обработки медико-статистических данных, поддерживающей существующую технологию учета показателей заболеваемости.

5. Программная реализация пользовательского интерфейса информационно-аналитической системы поддержки принятия решений в области обработки медико-статистических данных.

Методы исследования: Полученные результаты исследования базируются на использовании методов и средств системного анализа, теории реляционных баз данных, теории построения автоматизированных информационных систем, теории хранилищ данных, статистического и кластерного анализа, теории принятия решений, технологии оперативной аналитической обработки OLAP (On-Line Analytical Processing), интеллектуального анализа данных.

Научная новизна работы

1. Впервые разработаны OLAP-модели построения сводов (агрегации) медико-статистических форм, а также расчета основной отчетной формы сети медицинских лечебно-профилактических учреждений «Сведения о сети и деятельности медицинских учреждений».

2. Разработаны новые методы обнаружения некорректных значений показателей, а также оптимизационный алгоритм заполнения пропусков в данных медико-статистической отчетности, обеспечивающие повышение достоверности проводимого анализа.

3. Предложен подход и разработан соответствующий метод для численно обоснованного поиска ассоциативных правил с учетом сведений различных отчетных периодов в анализе статистической информации о заболеваемости.

Основные результаты, выносимые на защиту

1. Комплекс OLAP-моделей построения сводов (агрегации) форм медико-статистической отчетности, а также расчета основной отчетной формы сети медицинских учреждений «Сведения о сети и деятельности медицинских учреждений».

2. Методы определения некорректных значений и заполнения пропусков в данных медико-статистической отчетности, обеспечивающие повышение достоверности проводимого анализа.

3. Подход к численно обоснованному поиску ассоциаций с учетом сведений различных отчетных периодов в анализе статистической информации о заболеваемости.

4. Структура СППР на основе использования технологий OLAP и хранилищ данных, обеспечивающая эффективное преобразование и представление информации, а также позволяющая автоматизировать процесс анализа сведений современными методами и моделями принятия решений.

5. Программная реализация информационно-аналитической системы, обеспечивающая поддержку принятия решений на основе применения разработанных методов и моделей.

Практическая ценность работы

Разработанная в диссертации информационно-аналитическая система поддержки принятия решений позволяет осуществлять сбор, контроль и предобработку сведений по используемым в настоящее время формам медико-статистического мониторинга; обеспечивать процедуру расчета основной отчетной формы сети медицинских учреждений «Сведения о сети и деятельности медицинских учреждений» (формы №47) и формировать агрегированные (сводные) отчеты остальных форм; проводить комплексный контроль правдоподобности и исправление некорректных значений показателей; находить обоснованные по нескольким отчетным периодам численные ассоциации между различными заболеваниями; представлять информацию в удобном для пользователя виде.

Внедрение результатов

1. Результаты диссертационной работы официально зарегистрированы в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам в виде программы для ЭВМ (№ 2008614296 Система сбора и анализа медицинских данных «СИАМЕД» от 8 сентября 2008 г.) и базы данных (№2008620336 База данных системы сбора и анализа медицинских данных «БД СИАМЕД» от 8 сентября 2008 г.).

2. Разработанная в рамках диссертационного исследования система «СИАМЕД» внедрена в аналитико-статистическом отделе Управления здравоохранения администрации Сергиево-Посадского муниципального района Московской области, что подтверждено актом о внедрении.

Апробация работы

Основные положения и результаты работы представлены на научно-теоретической конференции «Право, общество, власть и современность» (Сергиев Посад, СПФ ГОУ МГИУ, 2005 г.), международной молодежной конференции «XXXIII Гагаринские чтения» (Москва, МАТИ, 2007 г.), на V Международной научно-практической конференции «Проблемы демографии, медицины и здоровья населения России: история и современность» (Пенза, МНИЦ, 2007 г.), второй научно-практической конференции «Виртуальные и интеллектуальные системы 2007» (Барнаул, АГТУ, 2007 г.), 50-й юбилейной научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» (Москва, МФТИ, 2007 г.), юбилейной XX всероссийской научно-технической конференции «Биомедсистемы-2007» (Рязань, РГРУ, 2007 г.), всероссийской научно-практической конференции «Математика, информатика, естествознание в экономике и обществе» (Москва, МФЮА, 2009 г.), 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук» (Москва, МФТИ, 2009 г.).

Публикации

По материалам диссертации опубликовано 15 работ, в том числе одна статья в журнале, входящем в список рекомендованных изданий ВАК для публикации основных результатов диссертационных исследований [13]. В работах с соавторами лично соискателем выполнено следующее: в [3, 10] -выбор, обоснование и проектирование структур хранения данных; [7] - разработка специализированных методов кластеризации объектов; [15] - разработка подхода к поиску численных ассоциированных правил с учетом данных различных отчетных периодов.

Получены 2 свидетельства РОСПАТЕНТ об официальной регистрации базы данных и программы для ЭВМ.

Структура и объем работы

Диссертационная работа состоит из введения, трёх глав, заключения и списка литературы из 140 наименований, содержит 148 страниц текста.

Заключение диссертация на тему "Разработка информационно-аналитической системы поддержки принятия решений в сфере муниципального здравоохранения"

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

1. На основании проведённого аналитического обзора технологий и программных продуктов учета статистической информации о заболеваемости показана актуальность разработки специализированной системы поддержки принятия решений. Выявлен ряд проблем, решение которых позволит автоматизировать подготовку данных для принятия решений в сфере здравоохранения. Показано, что такие факторы как недостоверность и разнородность данных, низкая производительность процесса обработки могут быть устранены применением современных технологий хранения и методов анализа данных.

2. Впервые разработаны OLAP-модели формирования агрегированных отчетов (сводов) форм медико-статистической отчетности, а также расчета основной отчетной формы сети медицинских лечебно-профилактических учреждений «Сведения о сети и деятельности медицинских учреждений».

3. Разработаны новые методы определения некорректных значений и заполнения пропусков, обеспечивающие повышение достоверности проводимого анализа данных.

4. Предложен подход и разработан соответствующий метод численно обоснованного поиска ассоциативных правил по данным различных отчетных периодов в анализе медико-статистических сведений.

5. Разработана модель системы поддержки принятия решений, поддерживающая существующую схему функционирования процессов документооборота в органах учета статистической информации здравоохранения РФ.

6. Спроектирована структура информационно-аналитической системы, оптимизированная для хранения, обработки и последующего анализа имеющейся информации.

7. Выполнена программная реализация системы, обеспечивающей возможность поддержки принятия решений в области обработки медико-статистических данных.

8. В ходе внедрения и использования спроектированной системы поддержки принятия решений подтверждена состоятельность разработанных методов и моделей.

Библиография Целиков, Александр Васильевич, диссертация по теме Управление в социальных и экономических системах

1. Целиков, А.В. Свидетельство об официальной регистрации программы для ЭВМ №2008614296. Система сбора и анализа медицинских данных «СИАМЕД». М. : РОСПАТЕНТ, 2008. 1 с.

2. Целиков, А.В. Свидетельство об официальной регистрации базы данных №2008620336. База данных системы сбора и анализа медицинских данных «СИАМЕД». М. : РОСПАТЕНТ, 2008. 1 с.

3. Целиков, А.В. Информационно-аналитическая система сбора и анализа медико-статистических данных / А.В. Целиков // Научные труды XXXIII международной молодежной конференции «Гагаринские чтения» 3-7 апреля 2007 г. Том 6.-М.: МАТИ, 2007. С. 263-264.

4. Целиков, А.В. Система поддержки принятия решений в области здравоохранения на основе анализа данных медицинской статистики / А.В. Целиков // Материалы конференции «Биомедсистемы-2007». — Рязань: РГРУ, 2007. С. 161-162.

5. Целиков, А.В. Принципы разработки современной интеллектуальной системы обработки медицинской информации / А.В. Целиков // Ползу-новский альманах. — 2007. — №3. — С. 185-186.

6. Целиков, А.В. Аналитическая система информационного обеспечения процесса управления показателями здравоохранения на муниципальном уровне / А.В. Целиков // Проблемы управления. 2008. - № 1. - С. 68-72.

7. Информационные технологии в практическом здравоохранении и общественное здоровье / В. М. Шевелев и др.. Томск : Сибирский ГМУ, 2001.- 102 с.

8. Современное состояние и пути развития отечественной медицинской статистики / В. Г. Утка и др. // Специальное приложение к сборнику научных трудов «Новые технологии в современном здравоохранении». М. : ФГУ ЦНИИОИЗ, 2007. - 36 с.

9. Утка, В.Г. Состояние здоровья населения и информационное обеспечение системы здравоохранения на региональном уровне : дис. . канд. мед. наук / В.Г. Утка М. : ФГУ ЦНИИОИЗ, 2008. - 166 с.

10. О мерах по повышению эффективности использования ресурсов в здравоохранении : Решение коллегии Минздрава РФ от 28.11.2001 №19. Сайт «Правовая Россия». URL: http://lawru.info/base62/part7/d62ru7664.htm (дата обращения: 18.12.2009).

11. Герцев, К. Электронный помощник здравоохранения : о состоянии и перспективах развития информационных систем в области / К. Герцев // Журнал «Медицинская газета». 2008. - № 65. - С. 8.

12. Информатизация клинической медицины: все течет — ничего не меняется? / В. А. Лищук и др. // Информационные технологии в здравоохранении. 2002. - № 1-2. - С. 4-11.

13. Тюков, Ю. А. Официальная медицинская статистика как основа управления здоровьем населения: возможности и ограничения / Ю. А. Тюков, Е. В. Ползик // Экономика здравоохранения. Медицинская Статистика. -2000,-№7.-С. 36-38.

14. Варштейн, Ю. В. Разработка методов построения комплексов многомерных моделей для задач здравоохранения на базе OLAP-технологии : дис. . канд. техн. наук. / Ю. В. Варштейн. — Красноярск : КГТУ, 2004. — 142 с.

15. Юрьев, В. К., Куценко Г. И. Общественное здоровье и организация здравоохранения / В. К. Юрьев, Г. И. Куценко СПб. : Питер, 2000. - 914 с.

16. Гаспарян, С.А., Пашкина Е.С. Страницы истории информатизации здравоохранения России / С.А. Гаспарян, Е.С. Пашкина. М. : Медицина, 2002. - 304с.

17. Случанко, И.С. Статистическая информация в управлении учреждениями здравоохранения / И.С. Случанко, Г.В. Церковный. М. : Медицина, 1983.-192 с.

18. Решетников, А.В. Медико-социологический мониторинг / А.В. Решетников. М. : Медицина, 2003. - 1048 с.

19. Технология управления учреждениями здравоохранения / Н. К. Гусева и др.. Нижний Новгород : НГМА, 2006. - 272с.

20. Медик, В.А. Общественное здоровье и здравоохранение / В.А. Медик, В.К. Юрьев. М. : ФГОУ ВУН МЦ, 2008. - 223с.

21. Лисицин, Ю.П. Общественное здоровье и здравоохранение / Ю.П. Лисицин. М. : ГОЭТАР, 2002. - 520с.

22. Автоматизированная информационная система для ПЭВМ типа IBM PC (АС «МЕДСТАТ» версия 6.1). Описание применения. Новосибирск : НСО МИАЦ, 2001. - 13 с.

23. Дуданов, И.П. Информационная система в организации работы учреждений здравоохранения: Практическое руководство / И.П. Дуданов, Ф.А. Романов, А.В. Гусев. Петрозаводск : ПетрГУ, 2005. - 238 с.

24. Гельман, В.Я. Медицинская информатика. Практикум / В .Я. Гельман. СПб. : Питер, 2001. - 468 с.

25. Огрызко, Е.В. Основные замечания к годовым отчетам по медицинской статистике / Е.В. Огрызко // Социальные аспекты здоровья : сетевойжурн. 2007. № 3. URL: http://vestnik mednet.ru/content/view/37/30 (дата обращения: 13.12.2009)

26. Гладков, Н.В. Обзор систем распределённого сбора медицинской статистики / Н.В. Гладков, Э.Ф. Тавлыбаев // Тр. междунар. конф. «Программные системы: теория и приложения». — М. : Физматлит, 2006. — Т. 1. — С. 93-105.

27. Программный комплекс «МЕДИНФО» Электронный ресурс. // Министерство здравоохранения Иркутской области : [сайт]. [2009]. URL: http://www.guzio.ru/index.php?option=comcontent&view=section&id=13&Itemi d=87 (дата обращения: 11.12.2009).

28. Медицинская статистика РАМН // сайт. / МИАД РАМН [Москва, 2009]. URL: http://old.mcramn.ru/stat.htm (дата обращения: 13.12.09).

29. Программный комплекс «МедИнфо» // сайт. [Санкт-Петербург, 2009]. URL: http://www.fortmiecity.coni/skyscraper/raytrace/348/medinfo.htm (дата обращения: 13.12.09).

30. Программное обеспечение для заполнения статистических форм // сайт. / ФГУ ЦНИИОИЗ Минздравсоцразвития РФ [Москва, 2009]. URL: http://www.mednet.ru/index.php?option=comcontent&view=article&id=400&Ite mid=l 98&lang=ru

31. Ноженкова, Л.Ф. Средства OLAP-моделирования и их применение в задачах здравоохранения / Л.Ф. Ноженкова // Математические методы распознавания образов. М. : МАКС Пресс, 2007. - С. 609-612.

32. Система сбора и анализа отчетно-статистических данных «Стат-Экспресс» Электронный ресурс. // Институт вычислительного моделирования СО РАН : [сайт]. [2009]. URL:http://icm.krasn.ru/sectionprj .php?id=20&p=statexpress (дата обращения: 11.12.2009).

33. Автоматизированная система «МЕДСТАТ 2001» Электронный ресурс. // Департамент здравоохранения Архангельской области : [сайт]. [2005]. URL: Http://www.msa.ru/statistics/medstat-2001/dok/medstat.op.html (дата обращения: 12.08.2006).

34. Назаренко, Г.И. Медицинские информационные системы: теория и практика / Г.И. Назаренко, Я.И. Гулиев, Д.Е. Ермаков. М. : ФИЗМАТЛИТ, 2005.-320 с.

35. Реброва, О.Ю. Статистический анализ медицинских данных. Применение пакета прикладных программ STATISTICA / О.Ю. Реброва. М. : Медиа Сфера, 2002. - 312 с.

36. Янг, М. Эффективная работа с Microsoft Office System 2003 / М. Янг, М. Хэлворсон. СПб. : Питер, 2004. - 1232 с.

37. Халафян, А.А. Statistica 6. Статистический анализ данных / А.А. Халафян М. : Бином-Пресс, 2007. - 512 с.

38. Концепция единой информационно-аналитической системы Сибирского окружного медицинского центра / В. И. Стародубов и др.. // Экономика здравоохранения. 2004. - № 5-6 (84). - С. 5-9.

39. Codd, E.F. Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Mandate / E.F. Codd, S.B. Codd, C.T. Salley. San Jose : Codd & Date, Inc., 1993.-31 p.

40. Волков, И.Ю. Архитектура современной информационно-аналитической системы / И.Ю. Волков, И.В. Галахов // Директор информационной службы. 2002. - № 3. - С. 15-24.

41. Методы и модели анализа данных: OLAP и Data Mining / А.А. Бар-сегян и др.. СПб. : БХВ-Петербург, 2004. - 336 с.

42. Федоров, А. Введение в OLAP-технологии Microsoft / А. Федоров, Н. Елманова. М. : Диалог-МИФИ, 2002. - 272 с.

43. Технологии анализа данных. Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян и др.. СПб. : БХВ-Петербург, 2007. - 384 с.

44. Слотер, Э.Х. Архитектуры OLAP / пер. Intersoft Lab Электронный ресурс. URL: http://wvvwjso.ru/cgi-bm/main/joumal.cgi?dowhat=details&id=70 (дата обращения: 11.12.2009).

45. Некрасов, В. Введение в OLAP на практическом примере Электронный ресурс. // PC Week. 2001. № 16. URL: http://www.pcweek.rn/themes/detail .php?ID=57795 (дата обращения: 12.12.2009).

46. Parsaye, К. New Realms of Analysis: Surveying Decision Support / K. Parsaye // Database Programming & Design. 1996. Vol. 4. P. 26-33.

47. Wrembel, R. Data Warehouses and OLAP: Concepts, Architectures and Solutions / R. Wrembel, C. Koncilia. IRM Press, 2006. 332 p.

48. Заботнев, M.C. Разработка методов и средств анализа многомерных баз данных с неполной информацией: дис. . канд. техн. Наук / М.С. Заботнев. М. : Госинформобр, 2006. - 140 с.

49. Оперативная обработка данных дистанционного зондирования в целях прогнозирования / А.С. Бирюков и др. // Матем. методы распознавания образов. -М. : АЛЕВ-В, 2001. С. 169-172.

50. Дюк, В.А. Data Mining: учебный курс / В.А. Дюк, А.П. Самойленко. СПб. : Питер, 2001. - 368 с.

51. Чубукова, И.А. Data Mining / И.А. Чубукова. М. : Бином, 2006.384 с.

52. Eric, A.K. How to Buy Data Mining: A Framework for Avoiding Costly Project Pitfalls in Predictive Analytics / A.K. Eric // DM Review Magazine, 2005 Vol. 10. URL: http://www.dmreview.com/articlesub.cfin?articleld=1038094 (дата обращения: 13.12.2009).

53. Арсеньев, С.Б. Использование технологии анализа данных в интеллектуальных информационных системах / С.Б. Арсеньев, В.Г. Бритков, Н.А. Маленкова // Управление информационными потоками. Сборник трудов ИСА РАН. М. : УРСС, 2002. - С. 46-68.

54. Брянцев, И.Н. Data Mining. Теория и практика / И.Н. Брянцев. М. : БДЦ-Пресс, 2006. - 208 с.

55. Wong, M.L. Data Mining Using Grammar Based Genetic Programming and Applications / M.L. Wong, K.S. Leung // Springer, 2000. 232 p.

56. Olson, D.L. Advanced Data Mining Techniques / D.L. Olson, D. Delen. Softcover, 2008. 180 p.

57. Злоба, E. Статистические методы восстановления пропущенных данных / Е. Злоба, И. Яцкив // Computer Modeling & New Technologies. — 2002.-№l.-p. 51-61.

58. Горбань, A.H. Итерационное моделирование неполных данных с помощью многообразий малой размерности / А.Н. Горбань, А.А. Россиев // Нейрокомпьютеры. 2002. - № 4. - С. 40-44.

59. Снитюк, В.Е. Эволюционный метод восстановления пропусков в данных / В.Е. Снитюк // Сборник трудов VI-й международной конференции «Интеллектуальный анализ информации» — Киев : КПИ, 2006. С. 262—271.

60. Загоруйко, Н.Г. Алгоритмы обнаружения эмпирических закономерностей / Н.Г. Загоруйко, В.Н. Ёлкина, Г.С. Лбов. — Новосибирск : Наука, 1985.-110 с.

61. Джарратано, Д. Экспертные системы: принципы разработки и программирование: Пер. с англ. / Д. Джарратано, Г. Райли — М. : Вильяме, 2006. -1152 с.

62. Ручкин, В.Н. Универсальный искусственный интеллект и экспертные системы / В.Н. Ручкин, В.А. Фулин. СПб. : БХВ-Петербург, 2009. -240 с.

63. Сараев, А.Д. Системный анализ и современные информационные технологии / А.Д. Сараев, О.А. Щербина // Труды Крымской Академии наук.- Симферополь : СОНАТ, 2006. - С. 47-59.

64. Катулев, А.Н. Математические методы в системах поддержки принятия решений / А.Н. Катулев, Н.А. Северцев. М. : Высшая школа, 2005. — 312 с.

65. Бирюков, А. Системы принятия решений и хранилища данных / А. Бирюков // СУБД, 1997. - № 4. - С. 37-41.

66. Berner Eta, S. Clinical Decision Support Systems. Theory and Practice / S. Berner Eta. Springer, 2007. 274 p.

67. Inmon, W.H. Building the Data Warehouse / W.H. Inmon. Wiley, 2005.543 p.

68. Архипенков, С.Я. Хранилища данных / С.Я. Архипенков, Д.В. Голубев, О.Б. Максименко. М. : Диалог-МИФИ, 2002. - 528 с.

69. Chaudhuri, S. An Overview of Data Warehousing and OLAP Technology / S. Chaudhuri, U. Dayal // In ACM SIGMOD Record, 1997. pp. 65-74.

70. Пржиялковский, В.В. Сложный анализ данных большого объема: новые перспективы компьютеризации / В.В. Пржиялковский // — СУБД, 1996.- № 4. С. 71-83.

71. Миронов, Е.П. Методическое пособие к статистическому анализу деятельности лечебно-профилактических учреждений / Е.П. Миронов, З.Г. Иванова. -М. : ФГУ МОНИКИ, 1993. 26 с.

72. Гланц, С. Медико-биологическая статистика / С. Гланц. — М. : Практика, 1998. 459 с.

73. Медик, В.А. Руководство по статистике здоровья и здравоохранения / В.А. Медик, М.С. Токмачев. М. : Медицина, 2006. - 528 с.

74. Мальковец, М.В. Вычисление и оценка показателей деятельности ЛПУ : Методическая разработка / М.В. Мальковец, Г.А. Зелезинская, Л.П. Плахотя. Мн. : МГМИ, 1996. - 36 с.

75. Калинина, Т.В. Методика анализа деятельности поликлиники для взрослых. Учебно-методическое пособие / Т.В. Калинина, Л.П. Плахотя, М.В. Щавелева. Мн. : БелМАПО, 2003. - 36 с.

76. Нейский И.М. Классификация и сравнение методов кластеризации / И.М. Нейский // Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Выпуск 8. М. : ООО "Элике +", 2008. - С. 111-122.

77. Wettschereck, D. A Review and Empirical Evaluation of Feature Weighting Methods for a Class of Lazy Learning Algorithms / D. Wettschereck, D.W. Aha, T. Mohri // Artificial Intelligence Review. Vol. 11. P. 273-314.

78. Лочмеле, P.P. Современные количественные методы экономического анализа: самоорганизующиеся карты Кохонена (СОК) / P.P. Лочмеле // Государственное управление. 2003. - № 1. — С. 1-5.

79. Никишина, Ю.В. Сегментирование рынка с использованием самоорганизующихся карт // marketing.spb.ru : Энциклопедия маркетинга. 2003. URL: http://www.marketing.spb.ru/lib-research/segment/selforder.htm (дата обращения: 13.12.2009).

80. Каллан, Р. Основные концепции нейронных сетей. : Пер. с англ. / Р. Каллан М. : Вильяме, 2001. - 287 с.

81. Осовский С. Нейронные сети для обработки информации / С. Осовский. М.: Финансы и статистика, 2004. - 344 с.

82. Круглов В.В. Искусственные нейронные сети. Теория и практика / В.В. Круглов, В.В. Борисов. — М. : Горячая линия Телеком, 2001. — 382 с.

83. Хайкин, С. Нейронные сети. Полный курс / С. Хайкин. М. : Вильяме, 2006. - 1104 с.

84. Головко, В.А. Нейронные сети: обучение, организация и применение / В.А. Головко. М. : ИПРЖР, 2002. - 256 с.

85. Нейроинформатика / А.Н. Горбань и др.. — Новосибирск : Наука, 1998.-296 с.

86. Кохонен Т. Самоорганизующиеся карты / Т. Кохонен М. : БИНОМ, 2008.-655с.

87. Дебок, Г. Анализ финансовых данных с помощью самоорганизующихся карт / Г. Дебок, Т. Кохонен. М. : Альпина, 2001. — 317 с.

88. Сенин, А. Методы отбора переменных в регрессионные модели / А. Сенин // BaseGroup Labs : Разработка решений в области анализа данных. 2007. URL: http://www.basegroup.ru/library/analysis/regression/featureselection/ (дата обращения: 13.12.2009).

89. Roddick, J.F. Exploratory medical knowledge discovery: experiences and issues / J.F. Roddick, P. Fule, W.J. Graco // ACM SIGKDD Explorations Newsletter. 2003. Vol.5. Issue 1. P. 94-99.

90. Hipp, J. Algorithms for Association Rule Mining — A General Survey and Comparison / J. Hipp, U. Guntzer, G. Nakaeizadeh // In Proc. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2000. Vol.2. Issue l.P. 58-64.

91. Шахиди, А. Введение в анализ ассоциативных правил / А. Шахиди // BaseGroup Labs : Разработка решений в области анализа данных. 2004. URL: http://www.basegroup.ru/rules/intro.htm (дата обращения: 13.12.2009).

92. Шахиди, A. Apriori масштабируемый алгоритм поиска ассоциативных правил / А. Шахиди // BaseGroup Labs : Разработка решений в области анализа данных. 2007. URL: http://basegroup.ru/library/analysis/associationrules/apriori/ (дата обращения: 13.12.2009).

93. Monroy, V.O.B. Neural Networks as Artificial Memories for Association Rule Mining / V.O.B. Monroy. Springer-Verlag, 2006. 230 p.

94. Okoniewski, M. The use of quantitative association rules in cellular network planning / M. Okoniewski // Journal of Telecommunications and Information Technology 2003. Vol. 3. P. 121-124.

95. Andruszkiewicz, P. Optimization for MASK scheme in privacy preserving data mining for association rules / P. Andruszkiewicz // Lecture Notes in Artificial Intelligence 2007. z. LNAI4585. P. 465-474.

96. Mining Quantitative Association Rules in Protein Sequences / G. Nitin etc. // Data mining : theory, methodology, techniques, and applications. Springer,2006. vol. 3755. P. 273-281.

97. Chen, Y.L. A data mining approach for retail knowledge discovery with consideration of the effect of shelf-space adjacency on sales / Y.L. Chen, J.M. Chen, C.W. Tung //Decision support systems, 2006. vol. 42. №3. P. 1503-1520.

98. Ruckert, U. Quantitative association rules based on half-spaces: an optimization approach / U. Ruckert, L. Richter, S. Kramer // Data Mining, 2004. P. 207-210.

99. Analyzing microarray data using quantitative association rules / E. Georgii etc. // Bioinformatics. Oxford University Press, 2005. Vol.21. Supp.l. P. 123-129.

100. Lam, S.N. Discovering Association Rules in Data Mining / S.N. Lam // Department of Computer Science, University of Illinois at Urbana-Champaign.2007. URL: http://www.raymond-lam.com/CS411.doc. (дата обращения: 13.12.2009).

101. Pavon, J. Matrix apriori: speeding up the search for frequent patterns / J. Pavon, S. Viana, S. Gomez // Proceedings of the 24th IASTED international conference on Database and applications. Innsbruck, Austria, 2006. P. 75-82.

102. Ye, Y. A Parallel Apriori Algorithm for Frequent Itemsets Mining / Y. Ye, Ch. Chiang // Proceedings of the Fourth International Conference on Software Engineering Research, Management and Applications. IEEE Computer Society, 2006. P. 87-94.

103. Bodon, F. A fast АРМОМ implementation / F. Bodon // IEEE ICDM Workshop on Frequent Itemset Mining Implementations (ТТМГ03). Florida, 2003. 10 p.

104. Agrawal, R. Mining Association Rules between Sets of Items in Large Databases / R. Agrawal, T. Imielinski, A. Swami // Proceedings of the 1993 ACM SIGMOD international conference on Management of data. Washington, 1993. P. 207-216.

105. Гудков, A.C. Использование префиксных деревьев при построении систем анализа данных : автореф. дис. . канд. ф.-м. наук / А.С. Гудков. -М. :МФТИ, 2006.-23 с.

106. MPSQAR: Mining Quantitative Association Rules Preserving Semantics / C. Zeng etc. // Proceedings of the 4th International Conference ADMA 2008, Chengdu, 2008. P. 572-580.

107. Miller, R.J. Association Rules over Interval Data / RJ. Miller, Y. Yang // Proceedings of the 1997 ACM SIGMOD international conference on Management of data. Washington, 1997. P. 452-461.

108. Ke, Y. An Information-Theoretic Approach to Quantitative Association Rule / Y. Ke, J. Cheng, Ng. Wilfred // Knowledge and Information Systems. New York : Springer, 2008. Vol.16. Issue 2. P. 213-244.

109. Aumann, Y. A Statistic Theory for Quantitative Association Rules / Y. Aumann, Y. Lindell // Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining. New York : ACM, 1999. P. 225-283.

110. Agrawal, R. Mining Association Rules between Sets of Items in Large Databases / R. Agrawal, T. Imielinski, A.Swami // Proceedings of the 1993 ACM

111. SIGMOD international conference on Management of data. Washington, 1993, P. 207-216. P. 1-12.

112. Ale, J.M. An approach to discovering temporal association rules / J.M. Ale, G.H. Rossi // Proceedings of the 2000 ACM symposium on Applied computing. New York : ACM, 2000. Vol.1. P. 294-300.

113. Ковязин, A.H. Мир InterBase. Архитектура, администрирование и разработка приложений баз данных в InterBase/Firebird/Yaffil. Издание 4-е / А.Н. Ковязин, С.М. Востриков -М. : КУДИЦ-ОБРАЗ, 2005. -496 с.

114. Бондарь, А.Г. InterBase и Firebird / А.Г. Бондарь. СПб. : BHV, 2007.-592 с.

115. Борн, X. Firebird : руководство разработчика баз данных / X. Борн. СПб. : БХВ-Петербург, 2007. -1104 с.

116. Архангельский, А.Я. Программирование в Delphi / А.Я. Архангельский. -М. : Бином-Пресс, 2008. 816 с.

117. Архангельский, А.Я. Delphi 7 / А.Я. Архангельский. -М. : Бином-Пресс, 2004.-1024 с.

118. Архангельский, А.Я. Приемы программирования в Delphi на основе VCL / А.Я. Архангельский. М. : БИНОМ, 2006. - 944 с.

119. SOMBase библиотека компонентов для Delphi // BaseGroup Labs : Разработка решений в области анализа данных. 2007. URL: http://www.basegroup.ru/download/fi-eecomponents/sombase/ (дата обращения: 13.12.2009).

120. Тархов, Д.А. Нейронные сети. Модели и алгоритмы / Д.А. Тар-хов. — М. : Радиотехника, 2005. 256 с.