автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Программное обеспечение хранилищ данных для формирования информационных ресурсов в региональном здравоохранении
Автореферат диссертации по теме "Программное обеспечение хранилищ данных для формирования информационных ресурсов в региональном здравоохранении"
На правахрукописи
Жучков Дмитрий Викторович
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ХРАНИЛИЩ ДАННЫХ ДЛЯ ФОРМИРОВАНИЯ ИНФОРМАЦИОННЫХ РЕСУРСОВ В РЕГИОНАЛЬНОМ ЗДРАВООХРАНЕНИИ
05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Красноярск - 2004
Работа выполнена
в Институте вычислительного моделирования СО РАН
Научный руководитель:
доктор технических наук Ноженкова Людмила Фёдоровна
Официальные оппоненты: доктор технических наук, профессор
Ченцов Сергей Васильевич
кандидат технических наук, доцент Цибульский Геннадий Михайлович
Ведущая организация:
Красноярский государственный университет
Защита диссертации состоится 14 октября 2004 г. в 14:00 на заседании Диссертационного совета Д 212.098.03 при Красноярском государственном техническом университете по адресу: 660074, г. Красноярск, ул. Киренского, 26, ауд. Г-417.
С диссертацией можно ознакомиться в научной библиотеке Красноярского государственного технического университета.
Отзывы на автореферат в двух экземплярах, заверенные печатью организации, просим направлять в адрес диссертационного совета.
Автореферат разослан 14 сентября 2004 г.
Ученый секретарь Диссертационного С01 кандидат технических наук
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. Формирование централизованных информационных ресурсов в системе регионального здравоохранения является актуальной задачей, требующей применения новых информационных технологий. Рост мощности информационных потоков внутри медицинских корпоративных систем требует создания нового математического и программного обеспечения, реализующего эффективные методы хранения и обработки информации с учетом специфики предметной области.
Сравнительно молодая, но активно развивающаяся технология хранилищ данных («Data Warehouse») предоставляет технологические и методологические основы для формирования крупных специализированных баз данных, предназначенных для поддержки принятия управленческих решений (W.Inmon, 1992; R.Kimball, 1996; Э.Спирли, 2001). Использование хранилищ данных позволяет решать задачи планирования и управления с применением эффективных методов OLAP-анализа (OnLine Analytical Processing - оперативная аналитическая обработка).
Исторически сложилось так, что наибольшее применение хранилища данных получили в финансово-промышленной сфере, и существующие тиражируемые программные решения мало приспособлены к структуре системы здравоохранения и её информационным потребностям. Особенности предметной области управления здравоохранением делают актуальной задачу адаптации и развития инструментария хранилищ данных для решения аналитических задач, специфических для данной отрасли. Основными направлениями работ при этом являются поддержка свойственных здравоохранению многошаговых аналитических расчётов и организация взаимодействия с действующими информационными системами.
Важным системообразующим элементом построения отраслевого хранилища медицинской информации является унификация форм представления классификационно--справочных данных. Для успешного построения хранилища требуется преодолеть различия в структуре и форматах данных, поставляемых в него из существующих программных систем. Также необходимо учесть специфику работы органов управления здравоохранением в период перехода к системе обязательного медицинского страхования, поскольку структура классификационно-справочной и нормативной информации очень чувствительна к организационным изменениям. Поэтому является актуальной задача создания и использования в хранилище единой, стандартизованной, но в то же время достаточно гиб модели справочников и кла а т о р о в .
РОС. ..;чокальиля
SMi.,1 »ОТЕКА
CUW4 .660
Цель диссертационной работы состоит в разработке алгоритмического и программного обеспечения централизованных информационных ресурсов регионального здравоохранения в виде хранилища данных, основанного на унифицированных формах представления спра-вочно-классификационных данных и содержащего технологические компоненты, реализующие поддержку многошаговых аналитических расчётов.
Методы исследований, применяемые в работе, основаны на методологии структурного анализа и проектирования (SADT - Structured Analysis & Design Technique), теории реляционных баз данных, технологии хранилищ данных и объектно-ориентированных методах построения программных систем. При определении структур хранения и представления информации учтены требования, предъявляемые к системам оперативной аналитической обработки данных.
Основная идея работы заключается в адаптации технологии хранилищ данных к задачам управления здравоохранением и её развитии в сторону тесной интеграции с аналитическим OLAP-инструментом, системами сбора статистической отчётности и ведения справочников.
В работе расширен состав и функции традиционных хранилищ данных. Введены новые конструктивные элементы, выполняющие функции поддержки связных многошаговых аналитических расчётов: аналитическая OLAP-модель, сложное иерархическое измерение, таблица расчетных значений (агрегатов) и группа отчётных форм. В инструментарий хранилища введены функции прямого доступа к базе данных системы сбора статистической отчётности и средства работы со структурами унифицированных отраслевых справочников.
Реализована идея унификации справочников и классификаторов на основе предложенной обобщенной модели представления классификационно-справочной информации. Модель справочника содержит описание форм хранения справочной информации, дополнительных атрибутивных признаков справочных объектов, а также представляет механизмы поддержания временной целостности данных и многопризначной классификации с использованием сложных иерархических оглавлений.
Предложенные модели и алгоритмы реализованы в виде программного и информационного обеспечения централизованного хранилища медицинской информации и отраслевой системы ведения справочников.
Новые научные результаты: 1. Впервые для формирования централизованных информационных ресурсов регионального здравоохранения применена технология хранилищ данных. Разработаны информационные модели, алгорит-
мические средства и программное обеспечение для построения централизованного хранилища медицинской информации.
2. Предложены новые технологические компоненты хранилища данных, обеспечивающие поддержку связных многошаговых аналитических расчётов и учитывающие особенности аналитических задач в здравоохранении: аналитическая OLAP-модель, сложное иерархическое измерение, таблица агрегатов и группа отчётных форм.
3. Разработана обобщённая модель унифицированного справочника, поддерживающая сложную иерархическую классификацию и временную целостность справочных данных в корпоративных системах здравоохранения.
4. Создано оригинальное алгоритмическое и программное обеспечение, реализующее многопризначный анализ данных хранилища в соответствии с организацией системы здравоохранения на региональном уровне.
Практическая ценность. Практическими результатами диссертационной работы являются методические и программные средства, которые могут быть применены в территориальных органах управления здравоохранением и обязательным медицинским страхованием для централизации информационных ресурсов в виде отраслевого хранилища данных и организации ведения единых справочников.
Программное обеспечение хранилища данных применяется в Красноярском медицинском информационно-аналитическом центре (КМИ-АЦ), а также в Красноярском краевом фонде обязательного медицинского страхования (КФОМС). Сформированы структуры данных, используемые для решения ряда актуальных аналитических задач управления здравоохранением - анализа состояния здоровья населения, анализа ресурсов системы здравоохранения, формирования тарифов на медицинские услуги, создания автоматизированных рабочих мест для ведущих специалистов и руководителей отрасли.
Программное обеспечение системы ведения справочников функционирует в Красноярском и Санкт-Петербургском медицинских информационно-аналитических центрах, а также в информационном отделе КФОМС. С помощью системы специалистами КМИАЦ созданы и поддерживаются в актуальном состоянии более 70 справочников, в том числе таких крупных, как справочник сети медицинских учреждений Красноярского края, международный классификатор болезней, справочник лекарственных средств, справочник адресов и другие.
Дополнительную практическую ценность результатам диссертационной работы придаёт возможность их применения в других отраслях,
имеющих сходную структуру управления, например, в системе образования и системе социальной защиты населения. На защиту выносятся:
1. Функционально-информационная модель централизованного хранилища медицинской информации, основанная на унифицированных формах представления справочно-классификационных данных и включающая технологические компоненты для поддержки многошаговых аналитических расчётов.
2. Обобщённая модель унифицированного справочника корпоративной информационной системы, включающая форму организации справочной информации, схему поддержания временной целостности и средства представления сложных иерархических отношений между элементами справочников.
3. Программное обеспечение управления централизованным хранилищем «Менеджер хранилища данных», а также «Система ведения справочников», предназначенная для создания и актуализации отраслевых справочников.
Достоверность и обоснованность результатов подтверждаются:
1. Результатами исследования современного состояния проблемы хранения и обработки информации для задач информационной поддержки принятия управленческих решений в здравоохранении.
2. Результатами анализа существующего технологического и программного обеспечения построения хранилищ данных и систем оперативной обработки информации.
3. Теоретическим обоснованием построенных моделей системы управления хранилищем данных и системы ведения справочников, выполненным с применением методологии структурного анализа и проектирования.
4. Успешным практическим использованием программных продуктов «Менеджер хранилища данных» и «Система ведения справочников» в органах управления здравоохранением в течение 3-х лет.
5. Признанием достижений автора на многочисленных конференциях и присуждением наград на выставках, в том числе присуждением автору серебряной медали Всероссийского выставочного центра. Апробация работы. Основные теоретические результаты работы
представлялись на: Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000); Всероссийской конференции «Проблемы информатизации региона» (Красноярск, 2001, 2003); конференции молодых учёных ИВМ СО РАН (Красноярск, 2002 - 2004); IV Всероссийской конфе-
ренции с международным участием «Новые информационные технологии в исследовании сложных структур» (Томск, 2002); Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002); Всероссийской конференции «EL-Pub 2003» (Новосибирск, 2003); IV Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (Красноярск, 2003); III Всесибирском конгрессе женщин-математиков (Красноярск, 2004); рабочих семинарах ИВМ СО РАН (2000-2004).
Программные продукты, созданные в ходе исследований, демонстрировались на ряде выставок в Красноярске, Новосибирске, Ханты-Мансийске, а также на III специализированной выставке и конференции «Информационные технологии в медицине - 2002» (г. Москва, ВВЦ).
Публикации и личный вклад автора. Основные результаты, представленные в работе, получены непосредственно автором, а именно: функционально-информационная модель хранилища данных регионального здравоохранения, обобщённая модель унифицированного справочника, технологическое и программное обеспечение «Система ведения справочников» и «Менеджер хранилища данных».
При создании системы «Менеджер хранилища данных» использованы отдельные модули систем «АНАЛИТИК» и «СтатЭкспресс», разработанные специалистами лаборатории интеллектуальных информационных систем Института вычислительного моделирования СО РАН.
По основным результатам диссертационной работы сделано 8 публикаций, в том числе 2 статьи в центральной печати и рецензируемых изданиях. Список работ приводится в конце автореферата.
Структура и объем работы. Диссертация состоит из введения, 4 разделов, заключения, списка использованных источников и 2-х приложений. Основное содержание работы изложено на 143 страницах текста, содержит 35 рисунков, 9 таблиц. Список используемых источников включает 73 наименования.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Введение представляет цели и задачи диссертационной работы, раскрывает ее актуальность, научную новизну, достоверность и обоснованность, практическую значимость и апробированность полученных результатов, методологию исследований.
В первом разделе представлены результаты исследования задачи интеграции информационных ресурсов регионального здравоохранения, определены основные требования предметной области и сформулированы задачи диссертационного исследования.
Актуальность задачи формирования централизованных информационных ресурсов регионального здравоохранения на основе технологии хранилищ данных следует из сложившейся в отрасли ситуации. Увеличение объёма и расширение состава обрабатываемых данных требует создания нового программного обеспечения, реализующего эффективные методы накопления и обработки информации.
Общее направление информатизации органов управления региональным здравоохранением можно охарактеризовать как переход от небольших разрозненных систем к единой корпоративной информационной системе (С.А. Гаспарян, 2001; В.И. Калиниченко, 2001; Л.Ф. Но-женкова, 2000). В центре данной системы должен находиться отраслевой центр хранения информации, объединяющий все сведения о состоянии здоровья населения региона и о работе сети медицинских учреждений (рис. 1).
Естественным выбором для решения задачи создания базы данных такого уровня является использование технологии хранилищ данных («Data Warehouse»), которая активно развивается и распространяется в последнее время. Но специфика порядка сбора информации и аналитических расчётов, выполняемых в органах управления здравоохранением, делают актуальной задачу адаптации и развития инструментария хранилища данных для удовлетворения потребностей предметной области.
Рисунок 1 - Место централизованного хранилища в единой информационной системе здравоохранения и ОМС
На основе анализа предметной области в работе сформулированы требования, которым должен удовлетворять инструментарий управления централизованным хранилищем данных для эффективного решения задач здравоохранения. Основные требования к программному обеспечению хранилища связаны со спецификой отрасли и особенностями сбора и обработки отчётной статистической информации, поступающей от медучреждений. Обзор программных средств построения хранилищ данных показал, что существующие системы не поддерживают многошаговые аналитические расчёты и не обеспечивают сопряжение с аналитическим OLAP-инструментом, системами сбора статистической информации и ведения справочников, используемыми в здравоохранении.
Особое внимание в работе уделено задаче унификации классификационно-справочной информации, используемой в хранилище. Актуальность этой задачи следует из потребности в обобщённом анализе данных, поступающих в хранилище из различных информационных систем. Необходимо осуществить стандартизацию информации на основе единых форм представления классификационно-справочных данных во всех территориально-отраслевых информационных системах. В работе приведено описание основных форм организации отраслевых систем ведения справочников и обосновано использование централизованной схемы создания и распространения классификаторов. Сформулирован ряд требований, накладываемых задачами предметной области на структуры справочников и классификаторов. В заключение первого раздела сформулированы задачи диссертационной работы.
Во втором разделе работы рассмотрены технологические и методические подходы к созданию системы управления централизованным хранилищем данных и обобщённой модели справочника.
Хранилище данных (Data Warehouse) в работе определено как предметно-ориентированный, интегрированный, имеющий привязку ко времени, неразрушаемый набор данных, предназначенный для поддержки процесса принятия управляющих решений (W.Inmon, 1992). В основе OLAP-анализа, для нужд которого строятся хранилища, лежит использование таблиц фактов (Fact table), содержащих фактологическую информацию об анализируемой области, и таблиц измерений (Dimension), содержащих значения некоторых шкал, по которым оцениваются факты.
В работе представлены результаты структурного анализа и проектирования централизованного хранилища данных, выполненные в технологии SADT (Structured Analysis & Design Technique), с использованием нотации функционального проектирования IDEF0.
Целевой функцией модели хранилища является формирование информационных ресурсов регионального здравоохранения. Для этого осуществляется преобразование данных из оперативных систем обработки информации в специализированные OLAP-ориентированные структуры, а также обеспечивается взаимодействие с аналитическим инструментарием и отраслевыми системами сбора статотчётности и ве-
дения справочников. Результаты функционального проектирования хранилища представлены в виде IDEFO-диаграмм, описывающих функции системы: создание и наполнение системных таблиц (репозитария); формирование пользовательских структур данных; поступление информации в хранилище; поддержку отраслевых систем. На рис.2 приведена диаграмма верхнего уровня
Представляемая в работе информационная модель хранилища основана на делении всех сведений на ряд категорий (рис. 3):
- метаданные: служебная информация, составляющая репозита-рий, включая информацию о правах доступа;
- детальная пользовательская информация: таблицы фактов, измерения (в том числе, сложные иерархические оглавления), составляющие область длительного хранения;
- данные, относящиеся к процессу импорта информации в хранилище: источники данных, процедуры загрузки и временные таблицы, которые образуют буфер предзагрузочной обработки;
- данные аналитического OLAP-инструмента - аналитические модели, группы отчётных форм, таблицы промежуточных вычислений.
Рисунок 2 - Общая структура хранилища данных
Структура и функции первых трёх составляющих информационной модели соответствуют классическим положениям технологии хранилищ данных (R. Kimball, 1996).
Раздел «данные аналитического инструмента» содержит оригинальные составляющие представляемой модели хранилища. В работе впервые введены два новых технологических компонента. Таблица агрегатов - модифицируемый промежуточный результат сложных аналитических расчетов, выполняемых с помощью OLAP-инструмента. Для классических хранилищ не свойственна модификация данных, но для сложных, многошаговых аналитических задач потребовалось обеспечение записи промежуточных результатов и их исправления. Группа отчётных форм - записанные в репозитарии хранилища сведения о готовых отчётных документах, поступающих извне. Реализация дополнительных функций позволила расширить возможности OLAP-инструмента и отображать готовые отчёты при работе с анализируемыми данными.
В данной работе также расширено содержание понятий ((витрина данных» и «измерение». Витрина данных определяется как выделенное подмножество данных хранилища, предназначенное для решения некоторой аналитической задачи. В предложенной модели хранилища витрина данных представляет не только таблицы и их взаимосвязи, но также и аналитические показатели, сценарии расчетов и порядок визуального отображения показателей. Перечисленная совокупность элементов
получила название аналитической OLAP-модели. Понятие измерения модифицировано за счёт использования в этом качестве унифицированных справочников и их иерархических оглавлений. Важной отличительной особенностью представляемой модели хранилища данных является возможность использования в качестве аналитического измерения комплексных иерархических классификаторов, определяемых сложными оглавлениями справочников.
Применение оригинальных технологических компонентов позволило выполнять сложные многошаговые аналитические расчёты, необходимость которых диктуется требованиями предметной области. Общая схема такого расчета представлена на рис. 4. На первом шаге на вход аналитического инструмента поступают исходные обрабатываемые данные. Далее идёт последовательное выполнение шагов расчёта, параметры которых записаны в репозитарии хранилища в виде аналитических моделей. Взаимодействие аналитических моделей между собой происходит путём передачи через хранилище информации в виде таблиц агрегатов и данных репозитария.
Выполнение многошагового расчёта сопровождается так называемым интерактивным аналитическим экспериментом, т.е. возможно вмешательство пользователя в выполнение расчёта для модификации параметров и настройки модели. Процесс формирования каждой из аналитических моделей также сопровождается взаимодействием пользователя со средствами управления хранилищем (рис. 5). На любом из четырёх этапов построения модели возможен возврат к более ранним этапам. Таким образом, предложенная модель централизованного хранилища данных обеспечивает расчёт сложных аналитических методик, свойственных задачам управления здравоохранением.
В соответствии с задачами диссертационного исследования в работе предложена оригинальная обобщённая модель унифицированного справочника корпоративной информационной системы (рис. 6). Основная идея модели справочника состоит в делении информации на две категории: собственно справочные данные и дополнительная сервисная информация. Справочные данные составляют так называемые линейные таблицы справочников, а атрибутивная информация хранится в дополнительных таблицах: таблицах свойств, таблицах связей и оглавлениях.
Линейные таблицы обладают унифицированной структурой, включающей основную информацию о справочных объектах: ключ, наименование, дату создания и период действия.
Временная целостность данных поддерживается за счёт механизма так называемых идентифицирующих полей. По определению идентифицирующее поле - это поле справочника, изменение которого является причиной для отмены действия текущей записи и создания новой записи, наследующей информацию. Наследование записей происходит с помощью таблицы истории преобразований, в которой фиксируются ключи записей, дата и основание наследования. Для каждого справочника строится журнал изменений, в котором фиксируются изменения записей в таблицах.
Для хранения атрибутивной информации, свойственной части записей справочника, создаются специализированные таблицы свойств, обладающие структурой, сходной со структурой линейных таблиц. Для каждого справочника может создаваться несколько таблиц свойств. Например, для справочника «Медицинские учреждений и подразделения» (рис. 7) создано 6 таблиц свойств: юридические реквизиты, контактные телефоны и пр.
Для установления между двумя справочниками (или внутри одного) связи типа «многие-ко-многим» создаётся таблица связи, имеющая в своей структуре ссылки на две линейные таблицы.
Рисунок 6 - Структура справочника медицинских учреждений
Для хранения иерархических взаимосвязей между записями линейной таблицы справочника предусмотрено так называемое оглавление, которое реализуется в виде отдельной таблицы. У каждого справочника может быть несколько оглавлений, представляющих варианты иерархической зависимости элементов. Для формирования сложной иерархической классификации элементов нескольких различных справочников используются сложные оглавления. Сложное оглавление представляется как иерархия ссылок на линейные таблицы нескольких справочников.
Применение справочников со сложными оглавлениями в качестве измерений хранилища позволяет осуществлять многопризначный анализ данных в соответствии со структурой предметной области.
Третий раздел содержит описание программного обеспечения, созданного на базе моделей, представленных в работе.
Для управления ресурсами централизованного хранилища данных создана система «Менеджер хранилища данных» (рис. 8). Основными функциями системы являются создание и модификация базовых объек-
тов хранилища, их информационное наполнение, формирование витрин данных для решения отдельных задач, ведение репозитария, обеспечение возможности удобной навигации по таблицам и быстрого поиска информации, разделение прав доступа к данным хранилища.
Мгаеджгр хр,1»и>и>ц» длины*- р пи. <ш лодкп»«ч»«м (ЦХМИ (чгцуччыЖА^ц/Ш ЛИ»»»»»»« НИЕЗ1
¿§д«йл Ордака 2>мо Цмошь * х|
В ЕЭ Список поаключений ! Развел Тоещарствеимя снптистическая вгчетноси
Э АРМы^МеЛКМОВАИРл1) 1 Й Рабочая база Й- § иХМЙ |ИМ1@ИМ1 В 0) Область длнте/ьного хранежя I 3 С] Таблицы Фактов 1 | В СЗ Расчёт подушевого норматгеа 1 . - П Коэффициент гредьедщих расходов и во/ Ей С) Реестры пролечен»*« больиьк Название
О По отчетным Формам Р1 Штаты и кадры медицинских учреэде»** Г"1 Сведения о бо/ънэк туберкулезом 2) Сведения о заболеваниях, передаваемых пре~ £3 Сведегоя о бодоъп злокачествен**« ново Сведения о бо/ъных психиатрическими забо» Сведения о больш) ВИЧ -инфекцией ' П Сведения о травмах, отравлениях и некогорь 21 Сведения о прерыеанш беременности в , ;□ Сведения о числе заболеваний медицинско«.» „ С] Сведения о причжах временной нетрдослос ■ Сведения о работе сдобно-психиатрической ^ £1 Сведения о работе станции (ощеления). боль Н «Г — Ь - -
1 , Э-Сэ Отчетность ККФОМС ] 1 | Ш С] Формирован« ПГТ 1 Э- Ей Таблицы измерений I © Анатгмеские объекты в Предзагрчзочная обработка данных <1 - ■ - - I ' т
• - - ' ' - " ', 1 -
Рисунок 7 - Главное окно системы «Менеджер хранилища данных»
Основное назначение системы управления хранилищем данных -создание и поддержка структур хранения информации, предназначенных для OLAP-анализа. Для выполнения этой задачи разработаны средства создания и модификации таблиц разных типов. Интерфейс задания свойств новых таблиц учитывает особенности каждого типа. Существует набор общих для всех таблиц параметров, таких как идентификатор и наименование таблицы, расширенное описание, список полей, список ограничений и индексов. Для каждого типа также задаются дополнительные параметры, свойственные только таблицам данного типа.
Между системой «Менеджер хранилища» и отраслевой информационно-аналитической OLAP-системой «АНАЛИТИК» реализована глубокая интеграция на уровне прямого использования функций доступа к элементам хранилища данных и его репозитарию. Хранилище данных позволяет наиболее полно реализовать возможности аналитической системы. Для этого реализован ряд интегрирующих функций:
- использование информации репозитария хранилища,
- сохранение в хранилище аналитических моделей данных,
- прямой доступ к разделу таблиц агрегатов,
- хранение в репозитарии информации о группах отчётных форм.
Создание в хранилище таблиц агрегатов позволяет реализовать сложные, многошаговые схемы аналитической обработки информации. В состав аналитической системы введены части системы «Менеджер хранилища», отвечающие за создание таблиц и наполнение их данными. Для таблиц агрегатов средствами хранилища разрешено выполнение операций редактирования, удаления и вставки данных. Эти и другие возможности являются оригинальным расширением технологии построения хранилищ данных, т.к. классические положения данной технологии не предусматривают столь тесной интеграции средств хранилища и аналитического OLAP-инструмента.
Система определения прав доступа для хранилища данных является самостоятельным модулем. «Менеджер безопасности» предоставляет возможности определения прав на пользовательские таблицы, а также на системные привилегии Oracle и таблицы репозитария хранилища.
Важной составляющей средств управления хранилищем является так называемая ETL-подсистема, которая обеспечивает предзагрузоч-ную обработку и импорт данных в хранилище. Аббревиатурой ETL (от англ. «extract, transform, load») обозначается процесс извлечения, преобразования и загрузки данных из оперативных баз данных в системы долговременного хранения. Основными функциями ETL-подсистемы являются: извлечение данных из внешних источников; проверка логической целостности импортируемых данных; очистка данных, устранение лишней и/или служебной информации; преобразование типов данных согласно системным соглашениям хранилища; необходимое агрегирование данных; размещение данных в таблицах хранилища.
Процесс информационного наполнения хранилища данных организован посредством выполнения процедур обработки. Для наполнения и преобразования данных во временных таблицах используется несколько типов процедур, обеспечивающих извлечение данных из внешних источников, преобразование и фильтрацию данных, обработку ошибочных значений, выполнение SQL-скриптов и внешних исполняемых модулей. Для выполнения групп процедур используются так называемые ETL-пакеты, которые содержат описание порядка выполнения процедур и имеют расписание запуска. Автоматизированное выполнение пакетов осуществляется с помощью специального сервисного приложения «Менеджер загрузки данных», отслеживающего активность ETL-пакетов.
На основе разработанной обобщённой модели унифицированных справочников создано программное обеспечение «Системы ведения справочников» (рис. 9).
{ЦЦ Дерево справочников | _ 0|х|
У Q а И ß* у ® 1 !Н X ф j е5 ф Iv
S Сеть медицинских учреждений d
Е> В Виаы подчиненности медицинских учреждений
] К £) Зоны и территории Красноярского края
(+} Щ) Названия разделов справочника медицинских учреждений
Fi Щ| Справочник медицинских учреждений
0|| Линейная таблица для "Справочник медицина их учреждений" I 1
'£- (в] Таблицы свойств
££ ßfc] Оглавления
Оглавление справочника медицинских учреждений
Па МУ И СМО <
Ж' Фильтры
; S Q Таблицы связи —J
[+• U] Главные справочники
X ÖÖ Зависимые справочники
; (*• Ц] Справочник СМО
' - В Справочник типов медицинских учреждений zi
.Линейная таблица для "Справочник медицинских учреждений" | д -; j.
Рисунок 8 - Окно «Дерево справочников» системы ведения справочников
Основные функции системы ведения справочников:
- Создание и модификация элементов справочной системы (справочников, оглавлений и т.д.);
- Формирование и актуализация содержимого справочников;
- Импорт-экспорт данных - обмен информацией между экземплярами системы и предоставление копий справочников пользователям системы.
К особенностям реализации программного обеспечения относятся:
- оригинальная схема взаимодействия многооконного интерфейса, позволяющая определять множественные условия на просматриваемый справочник,
- эффективный механизм отображения древовидных структур, позволяющий оперировать значительными объёмами данных,
- возможность изменения внешнего вида таблиц (ширины столбцов, их видимости, порядка сортировки, замещения ссылок наименованиями, автоматического определения высоты ячеек таблиц) и обеспечение автоматической фиксации настроек,
- сохранение параметров запуска программы, параметров экспорта/импорта данных, размеров и положения форм справочников при открытии,
- реализация средств разделения доступа на основе внутренних механизмов СУБД.
Четвёртый раздел посвящен вопросам применения результатов диссертационной работы. На основе предложенных моделей, технологических решений и программного обеспечения построено Централизованное хранилище медицинской информации Красноярского края.
,' ' В-О Общероссийские данные по смертности
В □ Государственная статистическая отчетность МУ
• (3* Сеть медицинских учреждений и СМ 0 Красноярского крал
- Оглавление классификатора адресов
Рисунок 9 - Структура основных разделов хранилища
На рис. 10 представлена информационной структура основных разделов хранилища. Ядром структуры являются региональные справочники и классификаторы, поступающие из единой системы ведения справочников. Справочники, классификаторы и их иерархические оглавления, созданные на основе предложенной обобщённой модели унифицированного справочника, используются в качестве аналитических измерений хранилища.
Г- Таблицы промежуточных вычислений В-© Таблицы технологических карг
; О Расходные мэтериалы и изделия медицинского назначения • 0 Технологические карты гростых медицинских услуг г О Нормируемая трудоемкость для основных исполнителей
: - О Применяемое технологическое оборудование 3 СИ Т К сложных и комплексных услуг
Рисунок 10 - Структура разделов хранилища для задачи расчёта тарифов на медицинские услуги
Фактологические данные для хранилища стекаются из множества информационных систем, работающих в учреждениях здравоохранения и ОМС. Состав информации в хранилище данных направлен на анализ эффективности деятельности медучреждений в системе здравоохранения и ОМС региона и оказывает существенную помощь в решении задач оперативного управления и планирования.
В работе описан порядок использования централизованного хранилища медицинской информации для решения ряда актуальных задач управления региональным здравоохранением.
С использованием системы «Менеджер хранилища» построены структуры данных для следующих задач:
- анализ ресурсов системы здравоохранения и обязательного медицинского страхования,
- формирование Территориальной программы государственных гарантий оказания населению бесплатной медицинской помощи,
- создание автоматизированных рабочих мест специалиста по медико-демографических процессам и руководителя отдела охраны материнства и детства,
- формирование тарифов на медицинские услуги (рис. 11). Таким образом, результаты диссертационной работы позволили
реализовать структуру специализированного хранилища данных, предназначенного для информационной поддержки решения актуальных задачи управления здравоохранением.
В заключении перечислены основные научно-практические результаты работы:
1. В результате анализа предметной области показана актуальность задачи построения отраслевого центра накопления медицинской информации на основе технологии хранилищ данных. Выявлены недостатки существующего инструментария, связанные с особенностями области управления здравоохранением. Обоснована необходимость разработки оригинального программного обеспечения для управления централизованным хранилищем медицинской информации. Выделена актуальная задача унификации представления классификационно-справочной информации в хранилище.
2. Предложена оригинальная функционально-информационная модель централизованного хранилища медицинской информации. Модель описывает структуру служебных метаразделов, определяющих общий порядок распределения информации, а также определяет список пользовательских разделов хранилища, реализующих деление данных по конкретным аналитическим задачам.
3. Предложено развитие технологии хранилищ данных путём введения в структуру хранилища новых технологических компонентов. Для поддержки работы аналитического OLAP-инструмента предложены следующие оригинальные объекты хранилища:
- Аналитические модели (витрины) - обеспечивают описание связных многошаговых аналитических расчетов;
- Таблицы агрегатов - обеспечивают хранение результатов промежуточных вычислений;
- Группы отчетных форм - содержат отчётную информацию об анализируемых данных.
4. На основе предложенной функционально-информационной модели выполнены проектирование, разработка и внедрение программной системы управления централизованным хранилищем данных «Менеджер хранилища данных». В составе программного обеспечения разработаны оригинальные средства извлечения данных из различ-
ных внешних источников, а также реализованы методы автоматизированной предзагрузочной обработки информации, поступающей в централизованное хранилище.
5. Предложена новая обобщённая модель унифицированного справочника, поддерживающая сложные иерархические отношения между элементами справочников и обеспечивающая временную целостность справочных данных.
6. Разработаны оригинальные алгоритмические и программные средства, реализующие многопризначные иерархические измерения хранилища на основе унифицированных справочников и их оглавлений.
7. Выполнены проектирование, разработка и внедрение программного обеспечения «Системы ведения справочников», предназначенной для выполнения функций создания и актуализации отраслевых справочников. В системе реализована структура пользовательского интерфейса, позволяющего работать со справочниками произвольной структуры.
8. В ходе практического применения разработанных методов и средств реализована и внедрена структура ряда крупных справочников и классификаторов, в том числе группы справочников «Сеть медицинских учреждений и страховых медицинских организаций Красноярского края»
9. Разработанный программный инструментарий, а также технологические подходы применены для формирования и информационного наполнения централизованного хранилища медицинской информации и использованы для решения ряда актуальных информационно-аналитических задач в органах управления здравоохранением. Технологические решения и программное обеспечение, являющиеся результатами данной работы, могут быть использованы в различных отраслях народного хозяйства, имеющих структуру управления, сходную со структурой органов управления здравоохранением.
Внедрение результатов диссертации подтверждено актами. В Приложении 1 приведено описание структуры информационного наполнения Централизованного хранилища медицинской информации.
В Приложении 2 приведено положение по группе справочников «Сеть медицинских учреждений».
Основные результаты исследований по теме диссертации опубликованы в следующих работах:
1. Александровская Т.Г., Жучков Д.В., Корчагин Е.Е. и др. Единая система ведения справочников медицинской информации // Труды
межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС».- Красноярск: ИВМ СО РАН, 2000.-С. 161-169.
2. Жучков Д.В., Кардашов Д.В., Никитина М.И. Структура и функции территориального хранилища медицинских данных // Вестник Томского государственного университета. — № 1(11), 2002. - С206-211.
3. Жучков Д.В., Кардашов Д.В. Программные средства поддержки централизованного хранилища медицинской информации // Труды Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС». - Красноярск: КМИАЦ, 2002. - С. 237-245.
4. Жучков Д.В. Интеграция систем сбора, хранения и анализа информации // Материалы Конференции молодых учёных ИВМ СО РАН. -Красноярск: ИВМ СО РАН, 2003. - С. 18-22.
5. Жучков Д.В., Никитина М.И. Организация и поддержка репозита-рия в централизованном хранилище медицинской информации // Труды VIII Международной конференции по электронным публикациям <^-РиЪ 2003». - Новосибирск: ИВТ СО РАН, 2003. -www.ict.nsc.ru/ws/elpub2003/6104.
6. Жучков Д.В. Применение технологии хранилищ данных в территориальных органах управления здравоохранением // Материалы IV Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям. -Красноярск: ИВМ СО РАН, 2003. - www.ict.nsc.ru/ws/YM2003/6333.
7. Жучков Д.В. О проблемах очистки и загрузки данных в централизованное хранилище медицинской информации // Материалы Всероссийской конференции «Проблемы информатизации региона». -Красноярск: ИВМ СО РАН, 2003. - С.201-205.
8. Виноградов К.А., Жучков Д.В., Никитина М.И. Система ведения базы данных нормативно-справочной информации // Врач и информационные технологии. - М.: Менеджер здравоохранения, 2004. — №03.-С.21-27.
Соискатель
Д.В. Жучков
»1647»
Подписано в печать 06.09.2004 г. Формат 60x84/20 Усл. печ. л. 1. Тицрж 100 экз.
Отпечатано на ризографе ИВМ СО РАН 660036, Красноярск, Академгородок
Оглавление автор диссертации — кандидата технических наук Жучков, Дмитрий Викторович
ВВЕДЕНИЕ.
1. ИНФОРМАЦИОННАЯ ИНТЕГРАЦИЯ ДЛЯ ПОДДЕРЖКИ УПРАВЛЕНИЯ РЕГИОНАЛЬНЫМ ЗДРАВООХРАНЕНИЕМ.
1.1. Задача построения отраслевого центра хранения медицинской информации.
1.2. Требования к средствам управления хранилищем данных.
1.3. Обзор технологических подходов и программных решений для хранилищ данных.
1.4. Унификация справочных данных как системообразующий элемент отраслевого информационного пространства.
1.5. Задачи диссертационной работы.
Выводы к разделу 1.
2. ПРОЕКТИРОВАНИЕ И ТЕХНОЛОГИЧЕСКИЕ ПОДХОДЫ К ПОСТРОЕНИЮ ЦЕНТРАЛИЗОВАННЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ.
2.1. Основные понятия и положения используемых технологий.
2.1.1. Терминология хранилищ данных.
2.1.2. Технология структурного анализа и проектирования.
2.2. Проектирование централизованного хранилища медицинской информации.
2.2.1. Функциональная модель хранилища данных.
2.2.2. Информационная модель централизованного хранилища данных.
2.2.3. ОЬАР-ориентированные особенности представления информации в хранилище.
2.3. Проектирование средств ведения справочников.
2.3.1. Функциональная модель системы ведения справочников.
2.3.2. Обобщенная модель справочника.
2.3.3. Иерархическая классификация справочных объектов
Выводы к разделу 2.
3. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ РЕШЕНИЙ.
3.1. Менеджер хранилища данных.
3.1.1. Описание программы.
3.1.2. Создание пользовательских структур данных.
3.1.3. Поддержка аналитических OLAP-операций.
3.1.4. Обеспечение разделения доступа.
3.2. ETL-подсистема менеджера хранилища.
3.2.1. Основные понятия и типы ETL-процедур.
3.2.2. Пакеты процедур.
3.2.3. Использование встроенного языка программирования.
3.2.4. Диспетчер автоматической загрузки.
3.3. Система ведения справочников.
3.3.1. Описание программы.
3.3.2. Основные функции системы.
3.3.3. Схема поддержания временной целостности.
3.3.4. Особенности реализации.
Выводы к разделу 3.
4. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ ХРАНИЛИЩА ДАННЫХ И РЕШЕНИЕ АНАЛИТИЧЕСКИХ ЗАДАЧ.
4.1. Применение системы ведения справочников в территориальном здравоохранении.
4.1.1. Основные результаты применения.
4.1.2. Группа справочников «Сеть медицинских учреждений Красноярского края».
4.2. Применение централизованного хранилища данных для задач поддержки управления здравоохранением.
4.2.1. Состав информации в хранилище.
4.1.2. Задача формирования территориальной программы обеспечения населения медицинской помощью.
4.2.3. Расчет тарифов на медицинские услуги по законченному случаю лечения.
4.2.4. Разработка рабочих мест специалистов и руководителей регионального здравоохранения.
Выводы к разделу 4.
Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Жучков, Дмитрий Викторович
Актуальность темы
Формирование централизованных информационных ресурсов в системе регионального здравоохранения является актуальной задачей, требующей применения новых информационных технологий. Рост мощности информационных потоков внутри медицинских корпоративных систем требует создания нового математического и программного обеспечения, реализующего эффективные методы хранения и обработки информации с учетом специфики предметной области.
Сравнительно молодая, но активно развивающаяся технология хранилищ данных («Data Warehouse») предоставляет технологические и методологические основы для формирования крупных специализированных баз данных, предназначенных для поддержки принятия управленческих решений [50,62,66]. Использование хранилищ данных позволяет решать задачи планирования и управления с применением эффективных методов OLАР-анализа (OnLine Analytical Processing - оперативная аналитическая обработка).
Исторически сложилось так, что наибольшее применение хранилища данных получили в финансово-промышленной сфере, и существующие тиражируемые программные решения мало приспособлены к структуре системы здравоохранения и её информационным потребностям. Особенности предметной области управления здравоохранением делают актуальной задачу адаптации и развития инструментария хранилищ данных для решения аналитических задач, специфических для данной отрасли. Основными направлениями работ при этом являются поддержка свойственных здравоохранению многошаговых аналитических расчётов и организация взаимодействия с действующими информационными системами.
Важным системообразующим элементом построения отраслевого хранилища медицинской информации является унификация форм представления классификационно-справочных данных. Для успешного построения хранилища требуется преодолеть различия в структуре и форматах данных, поставляемых в него из существующих программных систем. Также необходимо учесть специфику работы органов управления здравоохранением в период перехода к системе обязательного медицинского страхования, поскольку структура классификационно-справочной и нормативной информации очень чувствительна к организационным изменениям. Поэтому является актуальной задача создания и использования в хранилище единой, стандартизованной, но в то же время достаточно гибкой модели справочников и классификаторов.
Цель диссертационной работы
Цель диссертационной работы состоит в разработке алгоритмического и программного обеспечения централизованных информационных ресурсов регионального здравоохранения в виде хранилища данных, основанного на унифицированных формах представления справочно-классификационных данных и содержащего технологические компоненты, реализующие поддержку многошаговых аналитических расчётов.
Методы исследования
Методы исследования, применяемые в работе, основаны на методологии структурного анализа и проектирования (SADT - Structured Analysis & Design Technique), теории реляционных баз данных, технологии хранилищ данных и объектно-ориентированных методах построения программных систем. При определении структур хранения и представления информации учтены требования, предъявляемые к системам оперативной аналитической обработки данных.
Основная идея работы
Основная идея работы заключается в адаптации технологии хранилищ данных к задачам управления здравоохранением и её развитии в сторону тесной интеграции с аналитическим OLAP-инструментом, системами сбора статистической отчётности и ведения справочников.
В работе расширен состав и функции традиционных хранилищ данных. Введены новые конструктивные элементы, выполняющие функции поддержки связных многошаговых аналитических расчётов: аналитическая ОЬАР-модель, сложное иерархическое измерение, таблица расчетных значений (агрегатов) и группа отчётных форм. В инструментарий хранилища введены функции прямого доступа к базе данных системы сбора статистической отчётности и средства работы со структурами унифицированных отраслевых справочников.
Реализована идея унификации справочников и классификаторов на основе предложенной обобщенной модели представления классификационно-справочной информации. Модель справочника содержит описание форм хранения справочной информации, дополнительных атрибутивных признаков справочных объектов, а также представляет механизмы поддержания временной целостности данных и многопризначной классификации с использованием сложных иерархических оглавлений.
Предложенные модели и алгоритмы реализованы в виде программного и информационного обеспечения централизованного хранилища медицинской информации и отраслевой системы ведения справочников. Новые научные результаты:
1. Впервые для формирования централизованных информационных ресурсов регионального здравоохранения применена технология хранилищ данных. Разработаны информационные модели, алгоритмические средства и программное обеспечение для построения централизованного хранилища медицинской информации.
2. Предложены новые технологические компоненты хранилища данных, обеспечивающие поддержку связных многошаговых аналитических расчётов и учитывающие особенности аналитических задач в здравоохранении: аналитическая ОЬАР-модель, сложное иерархическое измерение, таблица агрегатов и группа отчётных форм.
3. Разработана обобщённая модель унифицированного справочника, поддерживающая сложную иерархическую классификацию и временную целостность справочных данных в корпоративных системах здравоохранения.
4. Создано оригинальное алгоритмическое и программное обеспечение, реализующее многопризначный анализ данных хранилища в соответствии с организацией системы здравоохранения на региональном уровне. Практическая значимость работы
Практическими результатами диссертационной работы являются методические и программные средства, которые могут быть применены в территориальных органах управления здравоохранением и обязательным медицинским страхованием для централизации информационных ресурсов в виде отраслевого хранилища данных и организации ведения единых справочников.
Программное обеспечение хранилища данных применяется в Красноярском медицинском информационно-аналитическом центре (КМИАЦ), а также в Красноярском краевом фонде обязательного медицинского страхования (КФОМС). Сформированы структуры данных, используемые для решения ряда актуальных аналитических задач управления здравоохранением - анализа состояния здоровья населения, анализа ресурсов системы здравоохранения, формирования тарифов на медицинские услуги, создания автоматизированных рабочих мест для ведущих специалистов и руководителей отрасли.
Программное обеспечение системы ведения справочников функционирует в Красноярском и Санкт-Петербургском медицинских информационно-аналитических центрах, а также в информационном отделе КФОМС. С помощью системы специалистами КМИАЦ созданы и поддерживаются в актуальном состоянии более 70 справочников, в том числе таких крупных, как справочник сети медицинских учреждений Красноярского края, международный классификатор болезней, справочник лекарственных средств, справочник адресов и другие.
Дополнительную практическую ценность результатам диссертационной работы придаёт возможность их применения в других отраслях, имеющих сходную структуру управления, например, в системе образования и системе социальной защиты населения. На защиту выносятся:
1. Функционально-информационная модель централизованного хранилища медицинской информации, основанная на унифицированных формах представления справочно-классификационных данных и включающая технологические компоненты для поддержки многошаговых аналитических расчётов.
2. Обобщённая модель унифицированного справочника корпоративной информационной системы, включающая форму организации справочной информации, схему поддержания временной целостности и средства представления сложных иерархических отношений между элементами справочников.
3. Программное обеспечение управления централизованным хранилищем «Менеджер хранилища данных», а также «Система ведения справочников», предназначенная для создания и актуализации отраслевых справочников.
Достоверность и обоснованность результатов
Достоверность и обоснованность результатов диссертационной работы подтверждаются:
1. Результатами исследования современного состояния проблемы хранения и обработки информации для задач информационной поддержки принятия управленческих решений в здравоохранении.
2. Результатами анализа существующего технологического и программного обеспечения построения хранилищ данных и систем оперативной обработки информации.
3. Теоретическим обоснованием построенных моделей системы управления хранилищем данных и системы ведения справочников, выполненным с применением методологии структурного анализа и проектирования.
4. Успешным практическим использованием программных продуктов «Менеджер хранилища данных» и «Система ведения справочников» в органах управления здравоохранением в течение 3-х лет.
5. Признанием достижений автора на многочисленных конференциях и присуждением наград на выставках, в том числе присуждением автору серебряной медали Всероссийского выставочного центра.
Личный вклад автора
Основные результаты, представленные в работе, получены непосредственно автором, а именно: функционально-информационная модель хранилища данных регионального здравоохранения, обобщённая модель унифицированного справочника, технологическое и программное обеспечение «Система ведения справочников» и «Менеджер хранилища данных».
При создании системы «Менеджер хранилища данных» использованы отдельные модули систем «АНАЛИТИК» и «СтатЭкспресс», разработанные специалистами лаборатории интеллектуальных информационных систем Института вычислительного моделирования СО РАН. В частности были использованы модули доступа к внешним источникам данных, средства построения витрин данных и библиотека внутреннего языка программирования. Апробация работы
Основные теоретические результаты работы представлялись на: Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000); Всероссийской конференции «Проблемы информатизации региона» (Красноярск, 2001,
2003); конференции молодых учёных ИВМ СО РАН (Красноярск, 2002
2004); IV Всероссийской конференции с международным участием «Новые информационные технологии в исследовании сложных структур» (Томск, 2002); Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002); Всероссийской конференции «EL-Pub 2003» (Новосибирск, 2003); IV Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (Красноярск, 2003); III Всесибирском конгрессе женщин-математиков (Красноярск, 2004); рабочих семинарах ИВМ СО РАН (20002004).
Программные продукты, созданные в ходе исследований, демонстрировались на:
- Выставке в рамках Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000);
- II Объединенной научной сессии Сибирских отделений РАН и РАМН «Новые технологии в медицине» (Новосибирск, 2002);
- Выставке в рамках Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002);
- Первом региональном форуме «Сибирская индустрия информационных систем» (Новосибирск, 2002);
- Выставке в рамках Научно-практической конференции «Общественное здоровье: стратегия развития в регионах Сибири» (Новосибирск, 2002);
- III специализированной выставке и конференции «Информационные технологии в медицине - 2002». (Москва, Всероссийский выставочный центр, 2002).
- V специализированной выставке и конференции «Информационные технологии в медицине - 2004». (Москва, Всероссийский выставочный центр, 2004).
Методические и практические результаты, полученные в работе, нашли применение при разработке информационно-аналитической системы «АНАЛИТИК», за участие в разработке которой автор награжден серебряной медалью Всероссийского выставочного центра.
Публикации
По основным результатам диссертационной работы сделано 8 публикаций, в том числе 2 статьи в центральной печати и рецензируемых изданиях.
Структура и объем работы
Диссертация состоит из введения, 4 разделов, заключения, списка использованных источников и 2 приложений. Основное содержание работы изложено на 143 страницах текста, содержит 35 рисунков, 9 таблиц. Список используемых источников включает 73 наименования.
Заключение диссертация на тему "Программное обеспечение хранилищ данных для формирования информационных ресурсов в региональном здравоохранении"
Выводы к разделу 4
1. На основе разработанных подходов и программного обеспечения созданы и внедрены в эксплуатацию две системы: Централизованное хранилище медицинской информации и Единая система ведения справочников медицинской информации (ЕСВС).
2. Обе системы внедрены в промышленную эксплуатацию в Красноярском медицинском информационно-аналитическом центре и в информационном отделе Красноярского краевого фонда ОМС. Программное обеспечение СВ С также используется в Санкт-Петербургском медицинском информационно-аналитическом центре.
3. ЕСВС - это программный комплекс, позволяющий поддерживать в актуальном состоянии все справочники и классификаторы, используемые в информационных системах органов управления здравоохранения и ОМС. С помощью ЕСВС специалистами КМИАЦ ведется более 70 отраслевых справочников и классификаторов.
4. Средствами «Менеджера хранилища данных» реализовано централизованное хранилище медицинской информации, с помощью которого решаются актуальные проблемы обработки и анализа информации в органах управления здравоохранения: анализ состояния здоровья, анализ ресурсов системы здравоохранения, формирование тарифов на медицинские услуги, создание автоматизированных рабочих мест для ведущих специалистов и руководителей отрасли.
ЗАКЛЮЧЕНИЕ
В ходе проведенных работ и исследований автором получены следующие научно-практические результаты:
1. В результате анализа предметной области показана актуальность задачи построения отраслевого центра накопления медицинской информации на основе технологии хранилищ данных. Выявлены недостатки существующего инструментария, связанные с особенностями области управления здравоохранением. Обоснована необходимость разработки оригинального программного обеспечения для управления централизованным хранилищем медицинской информации. Выделена актуальная задача унификации представления классификационно-справочной информации в хранилище.
2. Предложена оригинальная функционально-информационная модель централизованного хранилища медицинской информации. Модель описывает структуру служебных метаразделов, определяющих общий порядок распределения информации, а также определяет список пользовательских разделов хранилища, реализующих деление данных по конкретным аналитическим задачам.
3. Предложено развитие технологии хранилищ данных путём введения в структуру хранилища новых технологических компонентов. Для поддержки работы аналитического ОЬАР-инструмента предложены следующие оригинальные объекты хранилища:
- Аналитические модели (витрины) - обеспечивают описание связных многошаговых аналитических расчетов;
- Таблицы агрегатов - обеспечивают хранение результатов промежуточных вычислений;
- Группы отчетных форм - содержат отчётную информацию об анализируемых данных.
На основе предложенной функционально-информационной модели выполнены проектирование, разработка и внедрение программной системы управления централизованным хранилищем данных «Менеджер хранилища данных». В составе программного обеспечения разработаны оригинальные средства извлечения данных из различных внешних источников, а также реализованы методы автоматизированной предзагру-зочной обработки информации, поступающей в централизованное хранилище.
Предложена новая обобщённая модель унифицированного справочника, поддерживающая сложные иерархические отношения между элементами справочников и обеспечивающая временную целостность справочных данных.
Разработаны оригинальные алгоритмические и программные средства, реализующие многопризначные иерархические измерения хранилища на основе унифицированных справочников и их оглавлений. Выполнены проектирование, разработка и внедрение программного обеспечения «Системы ведения справочников», предназначенной для выполнения функций создания и актуализации отраслевых справочников. В системе реализована структура пользовательского интерфейса, позволяющего работать со справочниками произвольной структуры. В ходе практического применения разработанных методов и средств реализована и внедрена структура ряда крупных справочников и классификаторов, в том числе группы справочников «Сеть медицинских учреждений и страховых медицинских организаций Красноярского края» Разработанный программный инструментарий, а также технологические подходы применены для формирования и информационного наполнения централизованного хранилища медицинской информации и использованы для решения ряда актуальных информационно-аналитических задач в органах управления здравоохранением.
Таким образом, выполнена научно-практическая работа, главным содержанием которой является проектирование и разработка программного обеспечения централизованного хранилища данных и системы ведения справочников для задач региональных органов управления здравоохранения.
Практическим результатом является внедренное программное обеспечение, которой предоставляет возможность эффективного выполнения функций формирования хранилища данных, и обеспечивает все операции по ведению отраслевых справочников.
Централизованное хранилище медицинской информации с 2002 года эксплуатируется в Красноярском краевом медицинском информационно-аналитическом центре и в Красноярском краевом фонде ОМС. Информационное наполнение хранилища включает справочные данные и фактологическую информацию, касающуюся состояния отрасли здравоохранения в крае. С помощью «Менеджера хранилища данных» сформированы структуры данных, используемые для решения ряда актуальных задач из области информационной поддержки управления здравоохранения.
Программное обеспечение системы ведения справочников функционирует в Красноярском и Санкт-Петербургском медицинских информационно-аналитических центрах, а также в информационном отделе Красноярского краевого фонда ОМС. В рамках созданной Единой системы ведения справочников (ECB С) специалистами КМИАЦ ведется более 70 различных справочников и классификаторов, в том числе такие крупные справочники как справочник сети медицинских учреждений Красноярского края, справочник МКБ-10 и справочник лекарственных препаратов. В ходе опытной и промышленной эксплуатации систем показали свою состоятельность подходы и решения, заложенные в созданное программное обеспечение.
Автор предполагает дальнейшее развитие системы управления хранилищем данных по таким направлениям как наращивание функциональности системы в части поддержки аналитического инструмента, средств интеллектуальной предзагрузочной обработки данных и мониторинга загрузки данных в хранилище.
Перспектива развития системы ведения справочников видится в реализации многоплатформенной версии программного продукта, которая позволит выполнять операции по ведению справочников на базе различных СУБД. В планах на ближайшее время обозначена работа по созданию СВС на платформе промышленной СУБД Oracle и бесплатно распространяемой СУБД Interbase/Firebird.
Таким образом, задачи диссертационной работы, поставленные в первом разделе, выполнены полностью. Полученные результаты хорошо согласуются с современным состоянием программных средств в рассматриваемой области. Методики и программные решения, являющиеся результатами данной работы, могут быть использованы в различных отраслях народного хозяйства, имеющих централизованную структуру управления, сходную со структурой органов управления здравоохранения.
Внедрение результатов диссертационной работы подтверждено актами.
Библиография Жучков, Дмитрий Викторович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. Александровский А.Д. Delphi 5.0. Разработка корпоративных приложений ДМК, 2000, 512 стр.,
2. Здоровье населения и здравоохранение Красноярского края на рубеже веков / Агаханова Г.А., Виноградов К.А, Корчагин Е.Е., Ноженкова Л.Ф., Шнайдер И.А. Красноярск: ГУП ПИК «ОФСЕТ», 2001 - 192 с.
3. Архипов В.В., Красильников И.А. Концепция информатизации здравоохранения Санкт-Петербурга на 1998-2003 гг. СПб, 1998.
4. Бегг К., Коннолли Т. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. 3-е изд. М.: Вильяме, 2003 - 1436 с.
5. Буч Г. Объектно-ориентированный анализ и проектирование с примерами на С++, 2-е изд. Пер. с англ. М.: «Издательство Бином», 199 г. - 560 е., ил.
6. Вайнштейн Ю.В. Реализация алгоритма расчета программы государственных гарантий в форме цепочки аналитических моделей // Тезисы докладов III Всесибирского конгресса женщин-математиков Красноярск: ПФК «Торра», 2004. - С. 141-142.
7. Вендров A.M. CASE-технологии. Современные методы и средства проектирования информационных систем // Центр Информационных Технологий www.citforum.ru/database/case
8. Виноградов К.А., Корчагин Е.Е. Планирование медицинской помощи при формировании программы государственных гарантий оказания бесплатной медицинской помощи (методические рекомендации). Красноярск: КМИАЦ, 2002,- 29 с.
9. Волков И., Галахов И. Архитектура современной информационно-аналитической системы Директор ИС, 2002, №3.
10. Волкова В. Н., Денисов А. А. Основы теории систем и системного анализа: Учебник для студентов вузов. СПб.: СПбГТУ, 2-е изд. - 1999. -512 с.
11. Гайсарян С.С. Объектно-ориентированные технологии проектирования прикладных программных систем // Центр Информационных Технологий www.citforum.ru/programming/ooprsis
12. Гаспарян С.А. Проблемы информатизации здравоохранения России на современном этапе // Тезисы докладов международного форума «Информатизация процессов охраны здоровья населения 2001». - М.: Издательство «Учеба» МИСиС, 2001. - С. 9-16
13. Глушаков C.B., Ломотько Д.В. Базы данных: Учебный курс М.: ООО «Издательство ACT», 2000. - 504с.
14. Гольдберг Ю., Угрына В. Особенности применения в российских кредитных учреждениях технологий Хранилищ данных Банковские технологии, 2003, №7-8, С.51-55.
15. Горохова A.B., Ишенин П.П., Никитина М.И. OLAP-средства системы АНАЛИТИК // Труды всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС». -Красноярск: КМИАЦ, 2002. С.220-228.
16. Елманова Н., Федоров А. Введение в OLAP. Часть 2. Хранилища данных КомпьютерПресс, 2001, №5.
17. Жихарев А.П. О введении в действие общемосковской системы ведения справочников и классификаторов // www.mrg-portal.mos.ru/addin32.htm
18. Здоровье населения Красноярского края и деятельность учреждений здравоохранения за 1997-1999 годы (статистические материалы). Красноярск: КМИАЦ, 2000. 160 с.
19. Зыятдинов К.Ш., Рыбкин Л.И. и др. Здоровье населения Республики Татарстан на пороге третьего тысячелетия. Под ред. И.Г. Низамова. Казань: Медицина, 1999. - 256 с.
20. Калиниченко В.И. Управление медицинской помощью с использованием интегрированных систем: Монография Краснодар: КубГУ, 2001. -376 с.
21. Калянов Г.Н. CASE структурный системный анализ (автоматизация и применение) М.: «ЛОРИ», 1996. - 242 с.
22. Кириллов П., Шабаев И. Загрузка и согласование данных при построении хранилищ данных Открытые Системы, 2000, №11.
23. Кнут Д. Искусство программирования, том 1. Основные алгоритмы, 3-е изд. -М.: "Вильяме", 2000.
24. Когаловский М.Р. Энциклопедия технологий баз данных М.: Финансы и статистика, 2002. - 800 с.
25. Компьютерные технологии информатизации здравоохранения (региональный и учрежденческий уровень). Справочно-методическое пособие. Ижевск, 1995 г.
26. Концепция информатизации системы обязательного медицинского страхования в Российской Федерации на 2000-2005 годы.
27. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации М.: "Нолидж", 2000. - 352 с.
28. Кравченко Н.А., Поляков И.В. Научное обоснование методологии прогнозирования ресурсного обеспечения здравоохранения России (история и современность) М.: Федеральный фонд ОМС, 1998. - 392 с.
29. Кудрина В.Г. Медицинская Информатика: Учебное пособие М.: РМА-ПО, 1999. - 100 с.
30. Кузнецов С., Артемьев В. Обзор возможностей применения ведущих СУБД для построения хранилищ данных (DataWarehouse) / Центр Информационных Технологий МГУ, ГЦИ ЦБ РФ.
31. Легалов А.И. Основы разработки трансляторов // www.softcraft.ru/translat/lect
32. Липаев В.В. ¡Системное проектирование сложных программных средств для информационных систем М.: СИНТЕГ, 2002. - 268с.
33. Мамаев Е.В. MS SQL Server 7.0 проектирование и реализация баз данных СПб.: БХВ - Санкт-Петербург, 2000. - 416 е.: ил.
34. Марка Дэвид А., МакГоуэн Клемент Л. Методология структурного анализа и проектирования SADT М.: 1993.
35. Мартынчик С.А., Жуковский Г.С., Потемкин E.JI., Худяков М.Б. Унификация подходов к стандартизации медицинской помощи условиях медицинского страхования Здравоохранение, 2000, №6, стр. 31-47.
36. Методы разработки финансовых планов в сфере здравоохранения: Учебное руководство / Под.ред. Р.М.Зельковича. Кемерово: Сибформс, 2000.- 178 с.
37. Панащук С.А. Разработка информационных систем с использованием CASE-системы Silverrun // СУБД, 1995, №3. С. 61-64.
38. Приказ Минздрава РФ и Федерального Фонда ОМС от 19 января 1998 г. N12/2 "Об организации работ по стандартизации в здравоохранении".
39. Разработка методического обеспечения принятия решений с применением OLAP-технологий: Отчет по НИР. Красноярск: 2001 - 60 с.
40. Сельцовский А.П. Информатизация здравоохранения Москвы // Информационные технологии в здравоохранении, 2000, № 2. - С. 2-3.
41. Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. Том. 1: Пер. с англ. -М.: "Вильяме", 2001.
42. Стулов, А. Особенности построения информационных хранилищ // Открытые системы. 2003, №4.
43. С. Орлов Технологии разработки программного обеспечения: Учебник -СПб.: Питер, 2002. 464 с.
44. Тяпухина Т.В., Малыпин Ю.А., Тяпухин П.В. Информатизация здравоохранения Самарской области // Информационные технологии в здравоохранении. 2000. № 2. - С. 18-19
45. Электронная документация к СУБД Microsoft SQL Server 2000 «SQL Server Book Online».
46. Якобсон А., Буч Г., Рамбо Дж. Унифицированный процесс разработки программного обеспечения СПб.: Питер, 2002. -496с.
47. Almeida Maria Sueli, Ishikawa Missao, Reinschmidt Joerg, Roeber Torsten. Getting Started with Data Warehouse and Business Intelligence IBM Red Books.
48. Barquin Ramon, Edelstein Herbert A. Building, Using, and Managing the Data Warehouse Prentice Hall, 1997, 316 p.
49. Celko J. Trees in SQL Intelligent Enterprise, 2000, October 20.
50. Codd E. F., Codd S.B. Providing OLAP. On-line Analytical Processing to User-Analists: An IT Mandate С. T. Salley, E. F. Codd & Associates, 1993.
51. Greenfield L. A Definition of Data Warehouse -www.dwinfocenter.org/defined.html
52. Inmon W. Building the Data Warehouse John Willey & Sons, New York,
53. Inmon W. H., Welch J. D., Glassey Katherine L. Managing the Data Warehouse, 1996, 386 p.
54. Kimball R. Help for Hierarchies DBMS, 1998.
55. Kimball R. Slowly Changing Dimensions DBMS, 1996.
56. Kimball R. The Data Warehouse Toolkit: Practical Techniques for Building Dimensional Data Warehouses John Willey & Sons, New York, 1996.
57. Oracle 8 i Concepts. Release 2 (8.1.6), Part No. A76965-01, 1999.
58. Oracle8 i Data Warehousing Guide. Release 2 (8.1.6), Part No. A76994-01, 1999.
59. Pendse N. OLAP Architectures: The OLAP Report -www.olapreport.com/Architectures.htm.
60. Pendse N. What is OLAP? — www.olapreport.com/FASMI.htm
61. Rahm Erhard, Do Hong Hai. Data Cleaning: Problems and Current Approaches. IEEE Data Engineering Bulletin 23(4): 3-13 (2000);
62. RawData Analyzer. Описание // www.basegroup.ru/deductor/rawdata.htm
63. SofTech, Inc.: "Introduction to IDEFO", SofTech Deliverable no. 7500-14, September 1979.1992
-
Похожие работы
- Методика адаптивного управления процессом проектирования и развития специализированных хранилищ данных
- Методы и средства автоматизации проектирования и эксплуатации хранилищ данных
- Автоматизация управления процессами реинжиниринга машиностроительного предприятия на базе информационных моделей
- Объектно-ориентированная система создания и управления хранилищем данных промышленного предприятия
- Методика и инструментальные средства построения хранилища данных и знаний для поддержки исследований в энергетике
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность