автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Инструментальные средства построения комплексов моделей и аналитических приложений в OLAP-технологии
Автореферат диссертации по теме "Инструментальные средства построения комплексов моделей и аналитических приложений в OLAP-технологии"
На правах рукописи
Ишенин Павел Петрович
ИНСТРУМЕНТАЛЬНЫЕ СРЕДСТВА ПОСТРОЕНИЯ КОМПЛЕКСОВ МОДЕЛЕЙ И АНАЛИТИЧЕСКИХ ПРИЛОЖЕНИЙ В ОЬАР-ТЕХНОЛОГИИ
05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Красноярск - 2006
Работа выполнена
в Институте вычислительного моделирования СО РАН
Научный руководитель:
доктор технических наук, профессор Ноженкова Людмила Федоровна
Официальные оппоненты: доктор технических наук, профессор
Доррер Георгий Алексеевич
доктор технических наук Легалов Александр Иванович
Ведущая организация:
Институт динамики систем и теории управления СО РАН (г. Иркутск)
Защита диссертации состоится 23 марта 2006 г. в 14:00 на заседании Диссертационного совета Д 212.098.03 при Красноярском государственном техническом университете по адресу: 660074, г. Красноярск, ул. Киренского, 26, ауд. 417.
С диссертацией можно ознакомиться в научной библиотеке Красноярского государственного технического университета.
Отзывы на автореферат в двух экземплярах, заверенные печатью организации, просим направлять в адрес диссертационного совета.
Автореферат разослан 20 февраля 2006 г.
Ученый секретарь Диссертационного кандидат технических наук
2,006 А
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Технология оперативной аналитической обработки данных OLAP (OnLine Analytical Processing) - одно из наиболее быстро развивающихся направлений информатики. В основе OLAP-анализа лежит многомерная модель данных (E.F. Codd, 1993). Многомерная модель позволяет адекватно представить процесс работы с информационными объектами, наглядно описать основные аналитические операции, оптимальным образом построить физическую модель данных для хранения и обработки запросов. OLAP обеспечивает высокую скорость работы с данными при выполнении аналитических операций, наглядное представление результатов и оперативное построение отчетов (E.F. Codd, N. Pendse, J. Luedtke).
Аналитические OLAP-модули все чаще появляются в составе отечественных и зарубежных продуктов и финансово-производственных приложений. Наибольшее применение технология OLAP получила в бизнес-среде, где, как правило, решение конкретной аналитической задачи укладывается в рамки одного информационного куба. При этом классические OLAP-решения мало пригодны к использованию в прикладных областях, где необходим комплексный анализ данных, связанный с реализацией сложных аналитических алгоритмов. Примерами прикладных областей, в которых указанные проблемы не позволяют эффективно применять традиционные средства OLAP-технологии, являются здравоохранение, образование, социальная защита населения и множество других. Методы расчета аналитических показателей и решения задач планирования в этих прикладных областях представляют собой сложные многошаговые процессы анализа многомерных данных.
Поскольку классические средства OLAP-технологии не эффективны для комплексного анализа данных и реализации сложных аналитических алгоритмов, а существующие аналитические приложения имеют универсальный характер и, как следствие, сложны для прикладных специалистов, расширение сферы применения OLAP-технологии требует развития новых возможностей. Актуальна проблема создания алгоритмических и программных средств, обеспечивающих выполнение комплексных аналитических расчетов на основе множества взаимосвязанных OLAP-моделей, а также средств построения OLAP-приложений с адаптированным пользовательским интерфейсом.
РОС НАЦИОНАЛЬМАЯ ' БИБЛИОТЕКА I
Цель диссертационной работы состоит в разработке алгоритмического и программного обеспечения для реализации новых функциональных элементов OLAP-технологии, расширяющих возможности оперативной аналитической обработки данных за счет выполнения комплексных аналитических расчетов и средств построения специализированных OLAP-ориентированных приложений.
Методы исследования, применяемые в работе, основаны на методологии структурного анализа и проектирования (SADT - Structured Analysis & Design Technique), технологии оперативной аналитической обработки данных, теории реляционных баз данных и объектно-ориентированных методах построения программных систем.
Основная идея работы заключается в создании новых элементов технологии оперативной аналитической обработки: средств выполнения комплексных аналитических расчетов и средств создания специализированных OLAP-приложений.
В работе расширен функциональный состав традиционной OLAP-технологии. Разработаны алгоритмические и языковые средства построения и выполнения связных многошаговых аналитических расчетов: алгоритмы создания OLAP-моделей и комплексов OLAP-моделей, язык программирования высокого уровня. Разработаны алгоритмические и программные средства для автоматизации создания OLAP-приложений: специализированный набор компонент, взаимодействующих с витринами данных, аналитическими моделями и другими элементами OLAP-машины, среда визуального проектирования форм пользовательского интерфейса и мастер создания типового приложения.
Предложенные модели и алгоритмы реализованы в виде настольной OLAP-системы «Аналитик», которая представляет собой инструментальный комплекс для оперативной аналитической обработки информации и создания аналитических приложений. В инструментарий системы введены также функции прямого доступа к базам данных систем статистического наблюдения, хранения данных и ведения справочников.
Новые научные результаты:
1. Разработана оригинальная OLAP-машина, включающая средства построения витрин данных, средства выполнения произвольных аналитических запросов, средства представления и обработки многомерных данных (многомерный куб, кросс-таблицу, кросс-диаграмму), обладающие уникальными функциями: в качестве
измерений могут использоваться составные иерархии со сложными оглавлениями. ОЬАР-машина может встраиваться в разные приложения и работать с базами данных разных форматов.
2. Разработаны языковые, алгоритмические и программные средства, обеспечивающие реализацию сложных многошаговых аналитических расчетов путем создания комплексов ОЬАР-моделей, наследующих данные. Для реализации поставленной задачи предложен и реализован оригинальный подход к анализу информации, позволяющий использовать в рамках одного расчета несколько многомерных информационных кубов.
3. Впервые разработаны программные средства для автоматизации создания ОЬАР-приложений: инструментальное ядро в виде набора компонент, связанных с ОЬАР-машиной, среда проектирования экранных форм пользовательского интерфейса, мастер быстрого создания приложении.
4. Разработана настольная ОЬАР-система «Аналитик», которая представляет собой инструментальную программную среду, включающую перечисленное оригинальное программное обеспечение, и позволяет выполнять комплексный ОЬАР-анализ и построение прикладных ОЬАР-систем.
Практическая значимость работы
Практическими результатами диссертационной работы являются алгоритмические, языковые и программные средства, которые могут быть применены в разных прикладных областях для решения задач анализа данных с применением сложных аналитических алгоритмов, а также для построения прикладных ОЬАР-систем со специализированных интерфейсом пользователя.
Разработанное программное обеспечение применяется в Красноярском медицинском информационно-аналитическом центре, в Красноярском краевом фонде обязательного медицинского страхования, а также в органах управления здравоохранением Красноярского края. На основе созданного инструментария разработаны ОЬАР-приложения для решения ряда актуальных аналитических задач управления здравоохранением: анализа состояния здоровья населения, анализа и планирования ресурсов системы здравоохранения, формирования тарифов на медицинские услуги, а также автоматизированные рабочие места для ведущих специалистов и руководителей отрасли.
Высокую практическую ценность результатам диссертационной работы придает возможность их применения для решения аналитических
задач в разных прикладных областях, включая задачи анализа показателей социально-экономического развития, экологического состояния территорий, планирования социальных услуг и многие другие.
На защиту выносятся:
1. OLAP-машина как совокупность инструментальных средств, реализующих построение витрин данных, выполнение произвольных аналитических запросов, представление и обработку многомерных данных, функции использования составных иерархий со сложными оглавлениями в качестве аналитических измерений.
2. Языковые, алгоритмические и программные средства, обеспечивающие реализацию сложных многошаговых аналитических расчётов путем создания комплексов OLAP-моделей, наследующих данные.
3. Программные средства для автоматизации создания OLAP-приложений: инструментальное ядро в виде набора компонент, связанных с OLAP-машиной, среда проектирования экранных форм пользовательского интерфейса, мастер быстрого создания приложений.
4. Настольная OLAP-система «Аналитик» как инструментальная программная среда, позволяющая выполнять комплексный анализ данных и построение прикладных OLAP-систем.
Достоверность и обоснованность результатов диссертационной работы подтверждаются:
1. Результатами исследования проблемы оперативной аналитической обработки данных в разных предметных областях.
2. Результатами анализа и корректного использования существующих технологических решений оперативной аналитической обработки информации OLAP.
3. Успешным практическим использованием OLAP-системы «Аналитик» в органах управления здравоохранением и в системе обязательного медицинского страхования.
4. Признанием достижений автора на многочисленных конференциях и присуждением наград на выставках, в том числе присуждением автору золотой медали лауреата Всероссийского выставочного центра.
Личный вклад автора
Основные результаты, представленные в работе, получены непосредственно автором, а именно: OLAP-машина, языковые, алгоритмические и программные средства создания и выполнения связных многошаговых аналитических расчётов, программные средства автоматизации создания специализированных OLAP-приложений, а также настольная OLAP-система «Аналитик».
При создании системы «Аналитик» использованы отдельные модули систем «Менеджер хранилища данных» и «СтатЭкспресс», а также модули построения отчетов и формульный интерфейс создания витрин данных, разработанные специалистами лаборатории интеллектуальных информационных систем Института вычислительного моделирования СО РАН. В частности, были использованы модули доступа к репозита-риям систем и средства создания таблиц для сохранения аналитических результатов (таблиц агрегатов) в хранилище данных.
Комплексы моделей для решения прикладных задач, а также OLAP-приложения, упомянутые в работе, построены с применением системы «Аналитик» специалистами здравоохранения, обязательного медицинского страхования, с участием сотрудников ИВМ СО РАН, в том числе автора.
Апробация работы
Основные теоретические результаты работы представлялись на следующих конференциях: на Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000); на Всероссийской конференции «Проблемы информатизации региона» (Красноярск, 2001, 2003,2005); на конференции молодых ученых ИВМ СО РАН (Красноярск, 2002 - 2005); на IV Всероссийской конференции с международным участием «Новые информационные технологии в исследовании сложных структур» (Томск, 2002); на Всероссийской конференции «Информационные технологии в медицине - 2002» (Москва, 2002, 2004); на Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002); на Всероссийской конференции «EL-Pub 2003» (Новосибирск, 2003); на ГУ Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (Красноярск, 2003); на III Всесибирском конгрессе женщин-математиков (Красноярск, 2004); на V всероссийской научно-технической конференции «Теоретические и прикладные вопросы со-
временных информационных технологий» (Улан-Удэ, 2004), а также на рабочих семинарах отдела прикладной информатики ИВМ СО РАН (2000-2005).
ОЬАР-система «Аналитик», созданная в ходе исследований, демонстрировалась на многочисленных выставках: на Выставке в рамках Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000); на II Объединенной научной сессии Сибирских отделений РАН и РАМН «Новые технологии в медицине» (Новосибирск, 2002); на Выставке в рамках Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002); на Региональном форуме «Сибирская индустрия информационных систем» (Новосибирск, 2002, 2004); на Выставке в рамках Научно-практической конференции «Общественное здоровье: стратегия развития в регионах Сибири» (Новосибирск, 2002); на III специализированной выставке «Информационные технологии в медицине -2002» (Москва, Всероссийский выставочный центр, 2002); V специализированной выставке «Информационные технологии в медицине - 2004» (Москва, Всероссийский выставочный центр, 2004).
Методические и практические результаты, полученные в работе, нашли применение при разработке программных систем «Менеджер хранилища данных» и «СтатЭкспресс».
Публикации
По основным результатам диссертационной работы сделано 15 публикаций, в том числе 1 статья в центральной печати, 3 свидетельства о государственной регистрации программного обеспечения.
Структура и объем работы
Диссертация состоит из введения, 4 разделов, заключения, списка использованных источников и 2 приложений. Основное содержание работы изложено на 142 страницах текста, содержит 40 рисунков, 3 таблицы. Список используемых источников включает 82 наименования.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Введение представляет цели и задачи диссертационной работы, раскрывает ее актуальность, научную новизну, достоверность и обоснован-
ность, практическую значимость и апробированность полученных результатов, методологию исследований.
В первом разделе представлены результаты исследования проблем оперативного анализа данных в разных предметных областях, предложены принципы расширения класса задач, решаемых с применением OLAP-технологии, сформулированы задачи диссертационного исследования.
Исследование проблемы применения OLAP-технологии как инструмента оперативной аналитической обработки данных в разных предметных областях показало необходимость расширения класса решаемых задач за счет создания новых технологических элементов. Существующие технологические средства и OLAP-продукты ориентированы на довольно узкий класс задач оперативной аналитической обработки многомерных данных, которые решаются на основе одного запроса к источнику данных и соответственно одного многомерного информационного куба. Существо аналитической обработки сводится к автоматизированной поддержке формирования аналитического запроса, агрегированию данных, операциям над кубом с использованием плоских представлений многомерного куба (кросс-таблиц). Попытки применить инструментарий OLAP для решения сложных многошаговых задач, таких, например, как построение комплексов аналитических показателей здравоохранения, планирование медицинской помощи, планирование социальных услуг и многих других, показали, что принципиальная возможность сведения такой задачи к единому многомерному кубу приводит к большому количеству измерений и соответственно потере главных преимуществ технологии OLAP - наглядности и быстродействия.
Выполнено исследование существующих программных продуктов и информационных систем, предназначенных для OLAP-анализа данных. Отмечены недостатки существующих решений, основные из которых -недостаточное внимание задачам комплексного анализа данных, а также задаче создания инструментария для построения прикладных OLAP-систем со специализированным интерфейсом пользователя.
В соответствии с результатами исследования перечисленных актуальных проблем сформулированы задачи диссертационной работы. Основные из них:
1. Реализация нового подхода в OLAP-технологии, ориентированного на решение сложных аналитических задач, использующих связные многошаговые расчеты с множеством информационных объектов, представленных многомерными кубами данных. Разра-
ботка языковых, алгоритмических и программных средств, обеспечивающих реализацию сложных аналитических расчётов путем создания комплексов ОЬАР-моделей, наследующих данные.
2. Разработка ОЬ АР-машины, включая средства построения витрин данных, средства выполнения произвольных аналитических запросов, средства представления и обработки многомерных данных (многомерный куб, кросс-таблицу, кросс-диаграмму), обладающих функциями работы с комплексными иерархическими структурами данных в качестве измерений. ОЬАР-машина должна быть разработана как совокупность инструментальных средств, которые могут встраиваться в разные приложения и работать с базами данных разных форматов.
3. Разработка программных средств автоматизации создания ОЬАР-приложений: инструментального ядра, среды проектирования экранных форм пользовательского интерфейса и мастера быстрого создания приложений.
4. Разработка инструментальной программной среды в виде настольной ОЬАР-системы, позволяющей выполнять комплексную оперативную аналитическую обработку данных и построение прикладных ОЬАР-приложений. Основные функции системы:
- поддержка построения витрин данных, комплексов ОЬАР-моделей, сценариев аналитических расчетов, специализированных приложений и отчетных форм;
- выполнение сложных алгоритмов оперативной аналитической обработки данных на основе комплексов ОЬАР-моделей и сценариев аналитических расчетов с элементами аналитического эксперимента;
- выполнение ОЬАР-приложений со специализированным интерфейсом;
- прямой доступ к репозитариям баз данных систем статистического наблюдения и хранения данных.
5. Апробирование созданного программного обеспечения, а также методологических и технологических подходов в решении информационно-аналитических задач здравоохранения и обязательного медицинского страхования.
6. Разработка средств взаимодействия инструментальной ОЬАР-системы и приложений, создаваемых на ее основе, с базами и хранилищами данных, а также с другими информационными системами, осуществляющими сбор, систематизацию и хранение данных.
Во втором разделе работы рассмотрены технологические и методические подходы к созданию информационно-аналитических систем на основе технологии OLAP.
Архитектура OLAP-машины
Ядром системы оперативной аналитической обработки данных является OLAP-машина, которая представляет собой механизм выполнения запросов пользователя на выбор многомерной информации и ее представления. От архитектуры OLAP-машины зависит и сложность решаемых аналитическим инструментом задач, и возможности пользователя при решении этих задач.
В работе предложена и реализована оригинальная архитектура OLAP-машины (рисунок 1), отличительными особенностями которой являются формирование и выполнение нерегламентированных запросов пользователя, применение встроенного языка программирования для расчета значений аналитических объектов и возможность использования составных иерархий со сложными оглавлениями в качестве измерений. Выполнение нерегламентированных запросов осуществляется за счет применения собственного генератора SQL-запросов, адекватных используемой СУБД.
Рассмотрено функционирование OLAP-компонент, выполняющих различные операции над многомерным массивом данных. Предложены структуры данных и алгоритмы, позволяющие совместить умеренное потребление памяти и хорошую скорость выполнения операций.
Рассмотрены различные модели хранения иерархий и иерархических измерений. Предложены структура данных и алгоритм, позволяющие использовать в OLAP-машине разные виды иерархий, в том числе составную иерархию со сложным оглавлением. Понятие такой иерархии предложено в работах Жучкова Д.В. для упорядочения справочной информации одновременно по нескольким признакам и в настоящее время успешно применяется в информационных системах здравоохранения.
Средства выполнения многошаговых аналитических расчетов
В работе предложен новый подход к решению задач аналитической обработки данных с применением OLAP-технологии, основанный на построении комплексов OLAP-моделей.
Уровень описаний
^_.
Аналитический запрос
Формирование аналитического запроса
Офаниченная запросом модель гиперкуба, и схема исходных данных
Наложение запрос« на схему данных
Уровень данных
Формирование адаптированного к СУБД во Ц-за проса
вСИ. запрос
Реляционная
СУБД
Выборка данных
Транслятор языка
Дополнение еыборм расчетными полями
Рассчитанная выборка
Уровень 01.АР-компонент
Многомерные данные
Плоские данные
Многомерное представление
Формирование плоского представлений адекватного многомерному аагфосу
Уровень представлений
\\\\ч
1
к
Представление данных а «росс-таблице
Многомерный запрос
Представление данных на алекгронней орта
Рисунок 1. Архитектура ОЬАР-машины
ОЬАР-модель строится пользователем и несет в себе описательную информацию о решении некоторой аналитической задачи.
ОЬАР-модель М можно представить как М=<Х, в, Ч>(Х О), 0(0), Р, О(0)>. Здесь Х- дискретное множество входных данных; -
гиперкуб - модель логического многомерного представления данных, характеризующаяся двумя наборами параметров: показателями и измерениями; 2-<г[, 22, ...,гт> - показатели гиперкуба: каждый показатель представляет собой множество значений, количественно характеризующих анализируемый процесс; /г=</¡,/2, .../„>- измерения гиперкуба: каждое измерение представляет собой упорядоченное множество значений определенного типа. Измерения могут быть организованы в виде упорядоченной иерархической структуры. Множество измерений образует оси гиперкуба. Ф(Х, О) - функции, описывающие построение элементов гиперкуба О из множества входных данных X. Q(G) - операции над гиперкубом, включая агрегирование гиперкуба по иерархии атрибутов выбранного измерения, срезы гиперкуба по одному или нескольким измерениям, повороты гиперкуба. Р - модель логического представления результатов вычисления ОЬАР-модели, включая таблицы, кросс-таблицы, диаграммы, картограммы и операции над ними. 0(0) - операции сохранения гиперкуба в таблицу агрегатов.
Таким образом, ОЬАР-модель состоит из информации, описывающей исходные данные и их взаимосвязи, измерения и показатели (меры) информационного куба, операции над кубом, способы представления результатов вычислений и способы сохранения результатов для последующего использования. Введение в модель операций сохранения результатов расчета в источник данных позволило реализовать поэтапный анализ данных путем создания комплексов ОЬАР-моделей.
Комплекс представляет собой совокупность ОЬАР-моделей, связанных по данным. В рамках одного расчета модели образуют последовательно выполняемую цепочку операций, при этом данные, рассчитанные одной моделью, в дальнейшем используются другими моделями. Таким образом, ОЬАР-модели образуют комплекс, а их взаимосвязи реализуются через наследование информации. Пример комплекса ОЬАР-моделей представлен на рисунке 2. Комплекс состоит из пяти моделей. Взаимодействие моделей осуществляется за счет сохранения результатов расчета в таблицы агрегатов и использования этих таблиц в расчете последующих моделей.
ОЬАР-моделей
Реализация механизма объединения ОЬАР-моделей в комплексы осуществлена в работе за счет применения встроенного языка программирования. Каждая ОЬАР-модель (а точнее, действия пользователя по ее созданию) автоматически записывается в виде процедуры, а алгоритм выполнения комплекса представляет собой цепочку вызовов процедур моделей. Кроме объединения ОЬАР-моделей в единый расчет, применение языка программирования обеспечивает возможности для организации интерактивных расчетов, а также применения ветвлений, циклов, вызовов внешних программ (например, для особой обработки данных) и др.
В примере, приведенном на рисунке 2, продемонстрирована возможность осуществления диалога с пользователем и последующей организации ветвления в зависимости от результата. Это позволяет реализовать
разные сценарии расчета в случаях, если имеется несколько алгоритмов, а также если в зависимости от некоторых обстоятельств, либо просто для сравнения результатов, необходимо выбрать ту, или иную схему расчета.
Перед созданием комплекса OLAP-моделей задача должна быть декомпозирована на составляющие таким образом, чтобы каждая подзадача могла быть представлена OLAP-моделью (Вайнштейн Ю.В., 2004).
Средства создания специализированных OLAP-приложений
Следующим результатом, представленным в работе, являются средства создания OLAP-приложений с адаптированным для специалистов предметной области интерфейсом. Инструментарий создания адаптированных интерфейсов позволяет разрабатывать ориентированные на конкретную задачу OLAP-приложения на базе существующей аналитической платформы, полностью ограждая пользователя от ее сложной внутренней организации и сохраняя при этом весь функционал системы. Важным требованием к разрабатываемым приложениям является отражение специфики и традиций конкретной предметной области, в том числе использование соответствующей терминологии.
Для решения этой задачи выбрана хорошо зарекомендовавшая себя компонентная модель построения пользовательских интерфейсов (component-based design). Процесс формирования интерфейса в данной модели заключается в наполнении экранных форм функциональными элементами (компонентами) и определении для этих элементов сценариев обработки событий.
Разработка экранной формы производится при помощи средств визуального проектирования (рисунок 3), состоящих из шаблона формы, палитры компонент, инспектора объектов и редактора скрипта. Пустая форма заполняется интерфейсными и функциональными элементами из общего набора - палитры компонент. С помощью инспектора объектов для компонент задаются требуемые свойства и устанавливаются необходимые связи. Редактор скрипта позволяет сформировать программный код обработчиков событий компонент в виде отдельных процедур встроенного языка программирования.
Не
¡к? . " ^ ^
■шттж
{ЦпгяпеТие ШтмпеТгае3 Л(и<|» "«¿"Г-* ^ Л»* 4Ъ*
Свойстве
<•4 . Г 4
. 1 С/,-м,'^
Обметы В О ■Рун* дж построем а О Операции с Форм»'' 9- Сз Работа с объектам,^
□ 1 ..........~~
0 ПолцигьЭичя-З
- 0 Усг«иитьЭна*%: СЗ Работа со спискомй
Кнопка 1 По лучить ЗяачеюеСЕойства (тане ль, "Зе1ес«<1иеп"|; Дерево • ПояучитьОвмгтЮ, "Пп1тегаеТгее") ; Вот-рив^Сфорккроить (Дерево);
Витрина - ПолучитъЗкачениеСЕоястааЦйрево, "СиггепсПохуесзе"); ПаиельЗадач ■ Получить Объект (0, "ТмИаП");
Если КЮпха - 0 То Форма • ОтхрытьфориуГКросс-Таблкпа"); КроссТаЙяща ■ Получить Обмят (Форма, "Пп1уегаеСгоззТаЫ");
гшг
Рисунок 3. Разработанный дизайнер форм интерфейса пользователя
Основная сложность при разработке средств построения интерфейсов заключается в создании набора оригинальных компонент и библиотеки функций/процедур встроенного языка программирования, позволяющих реализовать специализированный ОЬАР-ориентированный интерфейс приложения на основе заранее подготовленных ОЬАР-моделей.
В ходе диссертационного исследования был разработан набор компонент и библиотека функций для построения прикладных ОЬАР-приложений со специализированным интерфейсом.
В третьем разделе представлено программное обеспечение, созданное на основе подходов, предложенных в работе.
В ходе выполнения диссертационной работы разработана настольная ОЬАР-система «Аналитик», которая представляет собой инструментальную программную среду.
Основные функции системы: извлечение данных из разных источников (в качестве источников могут использоваться базы и хранилища большинства популярных форматов), построение витрин данных, представление многомерных данных в виде таблиц, кросс-таблиц, диаграмм и картограмм, формирование одиночных ОЬАР-моделей и комплексов, создание специализированных аналитических приложений.
Компоненты ОЬАР-машины реализованы в программных блоках менеджера источников данных, управления витринами данных, ОЬАР-анализа и формирования ОЬАР-моделей. Блок управления витринами данных отвечает за создание и модификацию витрин данных. Витрины данных являются семантическим слоем между таблицами источника данных и аналитическими объектами, с которыми будет работать пользователь. Блок ОЬАР-анализа и формирования аналитических моделей предназначен для выполнения аналитических операций на базе подготовленных витрин данных и формирования ОЬАР-моделей по выполненным операциям. Блок комплексов ОЬАР-моделей обеспечивает их формирование и исполнение.
В системе «Аналитик» также имеются:
- подсистема управления конфигурацией,
- блок формирования отчетов,
- транслятор встроенного языка,
- подсистема обработки ошибок,
- подсистема контекстной помощи.
Взаимодействие основных подсистем схематично представлено на рисунке 4.
Подсистема управления конфигурацией обеспечивает создание и модификацию всех объектов, с которыми работает система: источников данных, витрин данных, отчетов, цепочек и форм. На рисунке 5 представлен пример дерева объектов для задачи анализа смертности населе-? ния. На первом уровне дерева расположены метаразделы, отвечающие
за основное деление объектов в системе. Каждый метараздел содержит объекты одного типа. В составе каждого из метаразделов может бьггь создано произвольное количество пользовательских тематических разделов, представляющих деление объектов по некоторым дополнительным признакам.
Вывод в файл
Рисунок 4. Структурно-функциональная схема системы «Аналитик»
" Аналитик - [Перечень Объектов <>:\ Конфигурации
Конфкгурация Вид Сер»« фсно Справка
Х|
-Я Э
Расчетная смертность & > раскоярок&м г рэе
В- Ш Анализ смертности Й- ^ ИсточникиДанных Й фл ВитриныДанных
В
' Ш- 03 Расчетная смертность в России ' В СЗ Данные по России
• В Таблицы дожития ' Й О Показатели смертности ■- 0т Показатели смертности - Средний возраст умерших
Структура смертности по причинам В- СЗ Исходные данные : В СЗ Доверительный интервал Отчеты (Щ* Цепочки В- 0 Формы ~ Ш АРМ
- П Кросс-Таблица
- 0 Диаграмма □ Анализ
•• 0 Отчет Щ 0 программе
Я
я
•К
Ч
. ' ' уУ л
Рисунок 5. Дерево объектов в системе «Аналитик»
*> Транслятор встроенного языка исполняет тексты программных моду-
лей, поступающих из смежных блоков системы. Скрипты формируются автоматически, либо с участием пользователя. В своей работе транслятор оперирует объектами витрин данных, ОЬАР-моделей, отчетов и интерфейсных форм.
Построение специализированных приложений осуществляет блок формирования адаптированных интерфейсов, который отвечает за формирование и исполнение пользовательских экранных форм. Подсистема позволяет задать порядок запуска форм, а также основные параметры для построенной конфигурации ОЬАР-приложения.
Четвёртый раздел представляет применение результатов диссертационной работы.
Разработанная настольная ОЬАР-система «Аналитик» нашла широкое применение в здравоохранении и обязательном медицинском страховании (ОМС). На ее основе выполнена автоматизация сложных отраслевых задач, разработаны специализированные ОЬАР-приложения для специалистов и руководителей.
Важнейшие прикладные задачи здравоохранения, решенные с применением системы «Аналитик»:
- формирование территориальной программы государственных гарантий оказания населению бесплатной медицинской помощи;
- расчет показателей здоровья населения и деятельности лечебно-профилактических учреждений.
На основе созданной инструментальной среды построены:
- рабочее место руководителя по охране материнства и детства;
- рабочее место специалиста по демографии.
Основные задачи, решаемые с применением системы «Аналитик» в системе ОМС:
- планирование медицинских услуг в системе ОМС;
- расчет объемных и стоимостных показателей стационарной, социально-значимой, стационарно-замещающей, амбулаторно-поли-клинической медицинской помощи;
- медико-экономический анализ льготного лекарственного обеспечения;
- расчет тарифов на медицинские услуги.
Таким образом, результаты диссертационной работы позволили реализовать аналитические конфигурации, предназначенные для информационной поддержки решения актуальных задач управления здравоохранением и ОМС. Следует отметить, что разработанный ОЬАР-инструментарий используется прикладными специалистами, в основном, без участия разработчика.
В заключении перечислены основные результаты диссертационной работы (см. выше). Полученные результаты хорошо согласуются с современным состоянием технологии оперативной аналитической обработки данных.
Внедрение результатов диссертации подтверждено актами.
Основные результаты исследований по теме диссертации опубликованы в следующих работах:
1. Жучков Д.В., Ишенин П.П., Никитина М.И. Применение встроенного языка программирования в системе управления хранилищем данных / Вестник Красноярского государственного университета, 2004, №3, стр. 35-39.
2. Dudina Yu.V., Ishenin Р.Р. Usage of OLAP-means of the System «Analytics» for the Problem of Health Protections / 9th International Scientific and Practical Conference of Students, Post-Graduates and Young Scientists «Modern Techniques and Technologies' 2003». - Tomsk, 2004. - pp. 151-152.
3. Горохова A.B., Ишенин ПЛ., Никитина М.И. OLAP-средства системы «Аналитик» / Труды Всероссийской конференции "Информационно-аналитические системы и технологии в здравоохранении и ОМС". - Красноярск: КМИАЦ, 2002. - С.220-228.
4. Дудина Ю.В., Ишенин П.П., Ноженкова Л.Ф. Технология реализации аналитических моделей средствами системы «Аналитик» для решения задач планирования / Труды Всероссийской конференции "Информационно-аналитические системы и технологии в здравоохранении и ОМС". - Красноярск: КМИАЦ, 2002. - С.246-254.
5. Жучков Д.В., Ишенин П.П., Никитина М.И. Система поддержки принятия решений для территориальных органов управления здравоохранением и системой ОМС // Информационные технологии и кибернетика на службе здравоохранения: Сборник докладов Международной научно-практической конференции. - Днепропетровск: ИПК ИнКомЦентра УГХТУ, 2003. - С.51-54.
6. Горохова A.B., Ишенин П.П., Кочетков С. Н. Формирование оперативных отчетов в OLAP-системе / Материалы восьмой всероссийской научно-практической конференции «Проблемы информатизации региона» ПИР-2003. В 2 т. Т.1. - Красноярск: ИПЦ КГТУ, 2003. -С. 196-201.
7. Дудина Ю.В., Ишенин П.П., Ноженкова Л.Ф. Аналитические модели для расчета подушевых нормативов финансирования медицинской помощи в Красноярском крае // Информационные технологии и кибернетика на службе здравоохранения: Сборник докладов Международной научно-практической конференции. - Днепропетровск: ИПК ИнКомЦентра УГХТУ, 2003. - С.33-36.
8. Вайнштейн Ю.В., Евдокимов Д.А., Ишенин П.П., Никитина М.И., Ноженков А.И.. Реализация расчета медико-демографических показателей в системе сбора отчетных данных «Статэкспресс» // Материалы восьмой всероссийской научно-практической конференции
«Проблемы информатизации региона» ПИР-2003. В 2 т. Т. 1. - Красноярск: ИПЦ КГТУ, 2003. - С.205-211.
9. Ишенин П.П. Создание готовых приложений на базе информационно-аналитической системы «АНАЛИТИК» // Информационно-аналитические системы и технологии в здравоохранении и обязательном медицинском страховании // Труды всероссийской конференции. - Красноярск: КМИАЦ, 2004. - С. 227-232.
Ю.Евдокимов Д.А., Ишенин П.П. Аналитические функции системы «СтатЭкспресс» // Материалы Конференции молодых ученых Института вычислительного моделирования СО АРН. - Красноярск: ИВМ СО РАН, 2004.-С. 20-24.
П.Евдокимов Д.А., Ишенин П.П., Кочетков С.Н. Формульный интерфейс для многошаговых расчетов в системе сбора и обработки статистических данных //Теоретические и прикладные вопросы современных информационных технологий. Материалы шестой Всероссийской научно-практической конференции - Улан-Удэ: Изд-во ВС! ТУ, 2005г. С. 105-109
12.Ишенин П.П. Применение языковых средств в оперативной аналитической обработке данных // Материалы девятой Всероссийской научно-практической конференции «Проблемы информатизации региона» ПИР-2005. В 2 т. Т. 1. - Красноярск: ИПЦ КГТУ, 2005. -С.137-142.
13.Ноженкова Л.Ф., Никитина М.И., Жучков Д.В., Ишенин П.П. Инструментальная система для построения хранилищ данных («Менеджер хранилища данных»). Свидетельство об официальной регистрации в Реестре программ для ЭВМ № 2005611690 от 11 июля 2005 года // Федеральная служба по интеллектуальной собственности, патентам и товарным знака. - 2005.
Н.Ноженкова Л.Ф., Никитина М.И., Ишенин П.П., Кочетков С.Н., Ко-робко A.B. Аналитическая OLAP-система («Аналитик»). Свидетельство об официальной регистрации в Реестре программ для ЭВМ № 2005611691 от 11 июля 2005 года // Федеральная служба по интеллектуальной собственности, патентам и товарным знака. - 2005.
15.Ноженкова Л.Ф., Никитина М.И., Евдокимов Д.А., Ишенин П.П., Ноженков А.И., Вайнштейн Ю.В., Барышникова О.В. Система автоматизации сбора и анализа статистической и отчетной информации («СтатЭкспресс»), Свидетельство об официальной регистрации в Реестре программ для ЭВМ № 2005611692 от 11 июля 2005 года // Федеральная служба по интеллектуальной собственности, патентам и товарным знака. - 2005.
Соискатель
П.П. Ишенин
Подписано в печать 15 февраля 2006 г. Формат 60 х 84/20 Усл. печ. л. ]. Тираж 100 экз.
Отпечатано на ризографе ИВМ СО РАН 660036, Красноярск, Академгородок
¿006ft 4Í57
Оглавление автор диссертации — кандидата технических наук Ишенин, Павел Петрович
ВВЕДЕНИЕ.
1. ПРОБЛЕМА РАЗВИТИЯ ТЕХНОЛОГИИ ОПЕРАТИВНОГО АНАЛИЗА ДАННЫХ.
1.1 Обзор задач оперативного анализа данных в организационном управлении.
1.2 Технология оперативной аналитической обработки данных.
1.3 Обзор технологических подходов и программных решений для оперативной аналитической обработки.
1.4 Задачи диссертационной работы. выводы к разделу 1.
2 ТЕХНОЛОГИЧЕСКИЕ СРЕДСТВА ОПЕРАТИВНОЙ АНАЛИТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ
2.1 Технология оперативной аналитической обработки данных.
2.1.1 Особенности предлагаемого подхода.
2.1.2 Принципы создания аналитической системы.
2.1.3 Архитектура и функционирование OLAP-машины.
2.1.4 Реализация OLAP-компонент.
2.1.5 Иерархии и измерения на основе иерархий.
2.1.6 OLAP-модели и операции над ними.
2.1.7 Комплексы OLAP-моделей.
2.2 Языковые средства в оперативной ai 1алитической обработке.
2.2.1 Основные принципы и определения.
2.2.2 Структура и синтаксис языка.
2.3 Средства построения специализированных интерфейсов.
Выводы к разделу 2.
3 ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ - НАСТОЛЬНАЯ ОЬАР-СИСТЕМА «АНАЛИТИК».
3.1 Описание системы.
3.2 Менеджер источников данных.!.
3.3 Блок управления витринами данных.
3.3.1 Базовые операции при построении витрины данных.
3.3.2 Использование языковых средств для расчета объектов витрины.
3.3.3 Работа со сложными структурами данных.
3.4 Блок OLAP-анализа и формирования OLAP-моделей.
3.4.1 Базовые аналитические операции.
3.4.2 Процентная диаграмма.
3.4.3 Операции над OLAP-моделями.
3.5 Блок формирования комплексов OLAP-моделей.
3.6 Блок формирования OLAP-приложений с адаптированным интерфейсом.
3.6.1 Механизм ручного построения форм.
3.6.2 Мастер построения интерфейса.
3.6.3 Создание готового приложения.
Выводы к разделу 3.
4 ПРИМЕНЕНИЕ СИСТЕМЫ «АНАЛИТИК».
4.1 Применение системы «Аналитик» в задачах здравоохранения.
4.1.1 Планирование медицинской помощи.
4.1.2 Аналитическая поддержка специалистов и руководителей регионального здравоохранения.
4.2 Применение системы «Аналитик» в системе обязательного медицинского страхования.
4.3 Взаимодействие системы «Аналитик» с другим программным обеспечением.
Выводы к разделу 4.
Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Ишенин, Павел Петрович
Актуальность темы # Технология оперативной аналитической обработки данных OLAP (Online
Analytical Processing) - одно из наиболее быстро развивающихся направлений информатики. В основе OLAP-анализа лежит многомерная модель данных. Многомерная модель позволяет адекватно представить процесс работы с информационными объектами, наглядно описать основные аналитические операции, оптимальным образом построить физическую модель данных для хранения и обработки запросов аналитических операций [26, 29]. OLAP значи-ф тельно улучшает возможности аналитических операций за счет повышения скорости работы с данными, наглядного представления результатов и оперативного построения аналитических отчетов [6, 14].
Аналитические OLAP-модули появляются в составе отечественных и зарубежных продуктов и финансово-производственных приложений [56,57,58]. Наибольшее применение технология OLAP получила в бизнес-среде, где решение конкретной аналитической задачи укладывается в рамки одного многомерного информационного куба. При этом классические OLAP-решения мало пригодны к использованию в прикладных областях, где необходим комплексный анализ данных, связанный с реализацией сложных аналитических алгоритмов. Примерами прикладных областей, в которых указанные проблемы не позволяют эффективно применять традиционные средства OLAP-технологии, являются здравоохранение, образование, социальная защита населения и множество других. Методы расчета аналитических показателей и решения задач планирования в этих областях представляют собой сложные многошаговые процессы анализа многомерных данных.
Поскольку классические средства OLAP-технологии не эффективны для комплексного анализа данных и реализации сложных аналитических алгорит-Ф мов, а существующие аналитические приложения имеют универсальный характер и, как следствие, сложны для прикладных специалистов, расширение сферы применения OLAP-технологии требует развития новых возможностей. Актуальна проблема создания алгоритмических и программных средств, 1 # обеспечивающих выполнение комплексных аналитических расчетов на основе множества взаимосвязанных OLAP-моделей, а также средств построения OLAP-приложений с адаптированным пользовательским интерфейсом.
Цель диссертационной работы
Цель диссертационной работы состоит в разработке алгоритмического и программного обеспечения для реализации новых функциональных элементов OLAP-технологии, расширяющих возможности оперативной аналитической ф обработки за счет выполнения комплексных аналитических расчетов и средств построения специализированных интерфейсов для OLAP-ориентированных приложений.
Методы исследования
Методы исследования, применяемые в работе, основаны на методологии структурного анализа и проектирования (SADT - Structured Analysis & Design Technique), технологии оперативной аналитической обработки данных, теории реляционных баз данных и объектно-ориентированных методах построения программных систем.
Основная идея работы ^ Основная идея работы заключается в создании новых элементов технологии оперативной аналитической обработки: средств выполнения комплексных аналитических расчетов, создания специализированных OLAP-приложений.
В работе расширен функциональный состав традиционной OLAP-технологии. Разработаны алгоритмические и языковые средства построения и выполнения связных многошаговых аналитических расчетов: алгоритмы создания OLAP-моделей и комплексов OLAP-моделей, язык программирования высокого уровня. Разработаны алгоритмические и программные средства для Ф автоматизации создания OLAP-приложений: специализированный набор компонент, взаимодействующих с витринами данных, аналитическими моделями и другими элементами OLAP-машины, среда визуального проектирования форм пользовательского интерфейса и мастер создания типового приложения.
Предложенные модели и алгоритмы реализованы в виде OLAP-системы «Аналитик», которая представляет собой инструментальный комплекс для оперативной аналитической обработки информации и создания аналитических приложений. В инструментарий системы введены также функции прямого доступа к базам данных систем статистического наблюдения, хранения данных и ведения справочников.
Новые научные результаты:
1. Предложена архитектура OLAP-машины обладающая уникальными функциями использования составных иерархий со сложными оглавлениями в качестве измерений и применение языка программирования для расчета значений измерений и показателей многомерного куба. Разработана оригинальная OLAP-машина, включающая средства построения витрин данных, средства выполнения произвольных аналитических запросов, средства представления и обработки многомерных данных (многомерный куб, кросс-таблицу, кросс-диаграмму). OLAP-машина может встраиваться в разные приложения и работать с базами данных разных форматов.
2. Разработаны языковые, алгоритмические и программные средства, обеспечивающие реализацию сложных многошаговых аналитических расчетов путем создания комплексов OLAP-моделей, наследующих данные. Для реализации поставленной задачи предложен оригинальный подход к анализу информации, позволяющий использовать в рамках одного расчета несколько многомерных информационных кубов.
3. Разработаны программные средства для автоматизации создания OLAP-приложений: инструментальное ядро в виде набора компонент, связанных с OLAP-машиной, среда проектирования экранных форм пользовательского интерфейса, мастер быстрого создания приложений.
4. Разработана настольная OLAP-система «Аналитик», которая представляет собой инструментальную программную среду, включающую перечисленное оригинальное программное обеспечение, и позволяет выполнять комплексный OLAP-анализ и построение прикладных OLAP-систем.
Практическая значимость работы
Практическими результатами диссертационной работы являются алгоритмические, языковые и программные средства, которые могут быть применены в разных прикладных областях для решения задач анализа данных с применением сложных аналитических алгоритмов, а также для построения прикладных OLAP-систем со специализированных интерфейсом пользователя.
Разработанное программное обеспечение применяется в Красноярском медицинском информационно-аналитическом центре (КМИАЦ), в Красноярском краевом фонде обязательного медицинского страхования (КФОМС), а также в органах управления здравоохранением Красноярского края. На основе созданного инструментария разработаны OLAP-приложения для решения ряда актуальных аналитических задач управления здравоохранением: анализа состояния здоровья населения, анализа и планирования ресурсов системы здравоохранения, формирования тарифов на медицинские услуги, а также автоматизированные рабочие места для ведущих специалистов и руководителей отрасли.
Высокую практическую ценность результатам диссертационной работы придает возможность их применения для решения аналитических задач в разных прикладных областях, включая задачи анализа показателей социально-экономического развития, экологического состояния территорий, планирования социальных услуг и многие другие.
На защиту выносятся:
1. OLAP-машина как совокупность инструментальных средств, реализующих построение витрин данных, выполнение произвольных аналитических запросов, представление и обработку многомерных данных, функции использования составных иерархий со сложными оглавлениями в качестве аналитических измерений.
2. Языковые, алгоритмические и программные средства, обеспечивающие реализацию сложных многошаговых аналитических расчётов путем создания комплексов OLAP-моделей, наследующих данные.
3. Программные средства для автоматизации создания OLAP-приложений: инструментальное ядро в виде набора компонент, связанных с OLAP-машиной, среда проектирования экранных форм пользовательского интерфейса, мастер быстрого создания приложений.
4. Настольная OLAP-система «Аналитик» как инструментальная программная среда, позволяющая выполнять комплексный анализ данных и построение прикладных OLAP-систем.
Достоверность и обоснованность результатов
Достоверность и обоснованность результатов диссертационной работы подтверждаются:
1. Результатами исследования проблемы оперативной аналитической обработки данных в разных предметных областях.
2. Результатами анализа существующих технологических решений оперативной аналитической обработки информации OLAP и их корректного использования.
3. Успешным практическим использованием OLАР-системы «Аналитик» в органах управления здравоохранением и в системе обязательного медицинского страхования.
Личный вклад автора
Основные результаты, представленные в работе, получены непосредственно автором, а именно: OLAP-машина, языковые, алгоритмические и про' ф граммные средства создания и выполнения связных многошаговых аналитических расчётов, программные средства автоматизации создания специализированных OLAP-приложений, а также настольная OLAP-система «Аналитик».
При создании системы «Аналитик» использованы отдельные модули систем «Менеджер хранилища данных» [53] и «СтатЭкспресс» [50], а также модули построения отчетов и формульный интерфейс создания витрин данных, разработанные специалистами лаборатории интеллектуальных информацион-ф ных систем Института вычислительного моделирования СО РАН. В частности, были использованы модули доступа к репозитариям систем и средства создания таблиц для сохранения аналитических результатов (таблиц агрегатов) в хранилище данных.
Комплексы моделей для решения прикладных задач, а также OLAP-приложения, упомянутые в работе, построены с применением системы «Аналитик» специалистами здравоохранения, обязательного медицинского страхования, с участием сотрудников ИВМ СО РАН, в том числе автора.
Апробация работы
Основные теоретические результаты работы представлялись на следующих конференциях: на Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000); на Всероссийской конференции «Проблемы информатизации региона» (Красноярск, 2001, 2003,2005); на конференции молодых ученых ИВМ СО РАН (Красноярск, 2002 - 2005); на IV Всероссийской конференции с международным участием «Новые информационные технологии в исследовании сложных структур» (Томск, 2002); на Всероссийской конференции «Информационные технологии в медицине - 2002» (Москва, 2002, 2004); на Всерос-£ сийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002); на Всероссийской конференции «EL-Pub 2003» (Новосибирск, 2003); на IV Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (Красноярск, 2003); на III Всесибирском конгрессе женщин-математиков (Красноярск, 2004); на V всероссийской научно-технической конференции «Теоретические и прикладные вопросы современных информационных технологий» (Улан-Удэ, 2004), а также на рабочих семинарах отдела прикладной информатики ИВМ СО РАН (2000-2005).
OLAP-система «Аналитик», созданная в ходе исследований, демонстрировалась на многочисленных выставках: на Выставке в рамках Межрегиональной конференции «Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС» (Красноярск, 2000); на II Объединенной научной сессии Сибирских отделений РАН и РАМН «Новые технологии в медицине» (Новосибирск, 2002); на Выставке в рамках Всероссийской конференции «Информационно-аналитические системы и технологии в здравоохранении и ОМС» (Красноярск, 2002); на Региональном форуме «Сибирская индустрия информационных систем» (Новосибирск, 2002, 2004); на Выставке в рамках Научно-практической конференции «Общественное здоровье: стратегия развития в регионах Сибири» (Новосибирск, 2002); на III специализированной выставке «Информационные технологии в медицине - 2002» (Москва, Всероссийский выставочный центр, 2002); V специализированной выставке «Информационные технологии в медицине - 2004». (Москва, Всероссийский выставочный центр, 2004).
Методические и практические результаты, полученные в работе, нашли применение при разработке программных систем «Менеджер хранилища данных» [53, 54] и «СтатЭкспресс» [49, 50].
Достижения автора были отмечены наградами на многочисленных выставках и конференциях, в том числе автору присуждена золотая медаль лауреата Всероссийского выставочного центра.
Публикации
По основным результатам диссертационной работы сделано 15 публикаций, в том числе 1 статья в центральной печати, 3 свидетельства о государственной регистрации программного обеспечения.
Структура и объем работы
Диссертация состоит из введения, 4 разделов, заключения, списка использованных источников и 2 приложений. Основное содержание работы изложено на 142 страницах текста, содержит 40 рисунков, 3 таблицы. Список используемых источников включает 82 наименования.
Заключение диссертация на тему "Инструментальные средства построения комплексов моделей и аналитических приложений в OLAP-технологии"
Выводы к разделу 4
Разработанная настольная OLAP-система «Аналитик» нашла широкое применение в здравоохранении и обязательном медицинском страховании (ОМС). На ее основе выполнена автоматизация сложных отраслевых задач, разработаны специализированные OLAP-приложения для специалистов и руководителей.
Важнейшие прикладные задачи здравоохранения, решенные с применением системы «Аналитик»:
- формирование территориальной программы государственных гарантий оказания населению бесплатной медицинской помощи;
- расчет показателей здоровья населения и деятельности лечебно-профилактических учреждений.
На основе созданной инструментальной среды построены:
- рабочее место руководителя по охране материнства и детства;
- рабочее место специалиста по демографии.
Основные задачи, решаемые с применением системы «Аналитик» в системе ОМС:
- планирование медицинских услуг в системе ОМС; ф - расчет объемных и стоимостных показателей стационарной, социально-значимой, стационарно-замещающей, амбулаторно-поликлинической медицинской помощи;
- медико-экономический анализ льготного лекарственного обеспечения;
- расчет тарифов на медицинские услуги.
Таким образом, результаты диссертационной работы позволили реализовать аналитические конфигурации, предназначенные для информационной ф поддержки решения актуальных задач управления здравоохранением и ОМС. Следует отметить, что разработанный OLAP-инструментарий используется прикладными специалистами, в основном, без участия разработчика.
ЗАКЛЮЧЕНИЕ
В ходе диссертационного исследования автором получены следующие научные результаты:
1. В результате обзора состояния проблемы оперативной аналитической обработки данных в разных прикладных областях показана актуальность развития OLAP-технологии для расширения круга решаемых задач. Выявлены недостатки существующих аналитических инструментов, связанные с недостаточным вниманием задачам комплексного анализа данных, и построения информационных систем со специализированным интерфейсом пользователя. Обоснована необходимость разработки оригинальных подходов, методов и программного обеспечения для оперативной аналитической обработки данных.
2. Предложена и реализована оригинальная архитектура OLAP-машины, отличительными особенностями которой являются выполнение нерег-ламентированных запросов пользователя, использование встроенного языка программирования для расчета значений аналитических объектов и возможность использования «сложных» иерархий в качестве измерений.
3. Предложен новый подход к реализации технологии оперативной аналитической обработки данных, позволяющий совмещать в рамках одного расчета несколько многомерных представлений. Подход заключается в предварительной декомпозиции задачи на элементарные составляющие, реализации подзадач в виде взаимосвязанных по информации OLAP-моделей и последующем объединении моделей в единый комплекс.
4. Предложен механизм создания OLAP-приложений с адаптированным пользовательским интерфейсом, основанный на двух взаимодополняющих инструментах: a. мастера автоматизированного проектирования интерфейса; b. дизайнера форм пользовательского интерфейса.
Разработан набор компонент, реализующих основные задачи, встающие при разработке прикладных приложений: определение информационного и функционального состава, а также настройку визуальных предпочтений пользователя.
5. На основе предложенных в работе подходов, методов, моделей, алгоритмов и языковых средств выполнено проектирование, разработка и внедрение настольной OLAP-системы «Аналитик». В составе программного обеспечения разработаны оригинальная OLAP-машина, средства создания витрин данных, OLAP-моделей и комплексов OLAP-моделей, средства создания специализированных OLАР-приложений.
Основными функциями системы является: извлечение данных из разных источников (в качестве источников могут использоваться базы и хранилища большинства популярных форматов), построение витрин данных, представление многомерных данных в виде таблиц, кросс-таблиц, диаграмм и картограмм, формирование одиночных OLAP-моделей и комплексов, создание специализированных аналитических приложений.
Практическими результатами являются: использование предложенных подходов и методов для реализации средств комплексного анализа информации на основе сложных аналитических алгоритмов и средств разработки прикладных приложений со специализированным интерфейсом пользователя и внедрение разработанного программного обеспечения.
Настольная OLAP-система «Аналитик» с 2002 года эксплуатируется в Красноярском краевом медицинском информационно-аналитическом центре и в Красноярском краевом фонде ОМС. На ее основе выполнена автоматизация сложных отраслевых задач, разработаны специализированные OLAP-приложения для специалистов и руководителей.
Важнейшие прикладные задачи здравоохранения, решенные с применением системы «Аналитик»: формирование территориальной программы государственных гарантий оказания населению бесплатной медицинской помощи; расчет показателей здоровья населения и деятельности лечебно-профилактических учреждений.
На основе созданной инструментальной среды построены: рабочее место руководителя по охране материнства и детства; рабочее место специалиста по демографии.
Основные задачи, решаемые с применением системы «Аналитик» в системе обязательного медицинского страхования (ОМС): планирование медицинских услуг в системе ОМС; расчет объемных и стоимостных показателей стационарной, социально-значимой, стационарно-замещающей, амбулаторно-поли-клинической медицинской помощи; медико-экономический анализ льготного лекарственного обеспечения; расчет тарифов на медицинские услуги.
Автор предполагает дальнейшее развитие разработанного методического и программного обеспечения оперативной аналитической обработки данных по таким направлениям, как поиск закономерностей в данных (технология Data Mining), визуальное проектирование комплексов OLAP-моделей.
Таким образом, задачи диссертационной работы выполнены полностью. Полученные результаты хорошо согласуются с современным состоянием программных средств в рассматриваемой области. Методики и программные решения, являющиеся результатами данной работы, могут быть использованы в различных прикладных областях.
Внедрение результатов диссертационной работы подтверждено актами.
Библиография Ишенин, Павел Петрович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
1. АРВ-1 OLAP Benchmark. Release И. // The OLAP Council, 1998. (http ://www. olapc ounc il. org/ research/bmarkly .htm).
2. Berton, A. Data Warehousing, Data Minig & OLAP / A. Berton, S.J. Smith. Computing Mcgraw-Hill, 1997. 640 c.
3. Celcos, J. A Look At SQL Trees / J. Celcos // DBMS online. 1996. - №3 (http://www.dbmsmag.com/9603d06.html).
4. Celcos, J. Hierarchical SQL / J. Celcos // O'Relly Databases. 08.05.2004. (http://www.onlamp.eom/pub/a/onlamp/2004/08/05/hierarchicalsql.html).
5. Celcos, J. Trees in SQL / J. Celcos // intelligententerprise.com. 2000 (http://www.intelligententeфrise.com/001020/celkoll.shtml).
6. Codd, E.F. Providing OLAP. On-line Analytical Processing to User-Analists: An IT Mandate / E.F. Codd, S.B. Codd. С. T. Salley, E. F. Codd & Associates, 1993.
7. Codd, E.F. The Relational Model For Database Management Version 2. Reading, Mass / E.F. Codd. Addison-Wesley, 1990.
8. Kondreddi, N.V. Working with hierarchical data in SQL Server databases / N.V. Kondreddi. Narayana Vyas Kondreddihttp://vyaskn.tripod.com/hierarchiesinsqlserverdatabases.htm).
9. Kotidis, Y. A Generalized Framework for Indexing OLAP Aggregates / K. Yannis // Mariland University Technical Reports: techical reports. (http://www.cs.umd.edu/Library/TRs/CS-TR-3841/CS-TR-3841.ps.zip).
10. Lepekhin, E. Trees in SQL databases / E. Lepekhin. The Code Project, 2004 (http://www.codeproject.com/cs/database/TreesinSQLdatabases.asp).
11. Mclnnis, K., An Overview of CBD/e // Castek, 1999http://vAvw.cbd-hq.com/articles/1999/991115kmoverviewcbde.asp).
12. Osier, D. Teach Yourself Delphi 3 in 14 days / D. Osier, S. Grobman, S. Bat-son. Indianapolis, Indiana, USA: SAMS publishing, 1997. 599 c.
13. Pendse, N. Multidimensional data structures / N. Pendse. Olap Report, 2001 (http://www.olapreport.com/MDStructures.htm).
14. Pendse, N. OLAP architectures / N. Pendse. Olap Report, 2005 (http://www.olapreport.com/Architectures.htm).
15. Thomsen, E. OLAP solutions: building multidimensional information systems. Second Edition. New York, USA: Willey & Sons inc., 2002. - 608 c.
16. Trees and hierarchies in SQL for smarties. / J. Celcos. San Francisco CA, USA: Morgan Kauffman, 2004. 225 c.
17. What is OLAP? Pendse N. (www.olapreport.com/FASMI.htm).
18. Автоматизированная информационная система для ПЭВМ типа IBM PC (АИС "МЕДИНФОРМ" версия 6.1) Описание применения. Новосибирск, 2000.-38 с.
19. Автоматизированная информационная система для ПЭВМ типа IBM PC (АИС "МЕДИНФОРМ" версия 6.1) Руководство пользователя. Новосибирск, 2000. -21 с.
20. Автоматизированная информационная система для ПЭВМ типа IBM PC (АС "МЕДСТАТ" версия 6.1) Описание применения. Новосибирск, 2000.- 13 с.
21. Автоматизированная информационная система для ПЭВМ типа IBM PC (АС "МЕДСТАТ" версия 6.1) Руководство пользователя. Новосибирск, 2000.-34 с.
22. Агаханова, Г.А. Здоровье населения и здравоохранение Красноярского края на рубеже веков / Г.А. Агаханова, К.А. Виноградов, Е.Е. Корчагин, Л.Ф. Ноженкова, И.А. Шнайдер. Красноярск: ГУП ПИК «ОФСЕТ», 2001-192 с.
23. Альперович, М. Введение в OLAP и многомерные базы данных / М. Альперович // PC Week. 1999. - №3. - С. 84-91.
24. Арсеньев, С. Извлечение знаний из медицинских баз данных. / С. Ар-сеньев (www.megaputer.ru/download/book.zip).
25. Арустамов, А Применение OLAP технологий при извлечении данных / А. Арустамов. Interface (http://www.interface.ru/misc/pot.htm).
26. Архипенков, С. Oracle Express Olap М: Диалог - МИФИ - 1999. - 320 с.
27. Ахо, А. Компиляторы: принципы, технологии и инструменты.: Пер. с англ. / Альфред Ахо, Равви Сети, Джеффри Ульман. М.: Издательский дом «Вильяме», 2003. - 768 с.
28. Барсегян, А.А. Методы и модели анализа данных: OLAP и Data Mining. / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. БХВ-Петербург, 2004 г., 336 с.
29. Быкова, В.В. Практикум на ЭВМ по дискретной математике (вводный курс): учеб. пособие, красноярс. гос. ун-т. Красноярск, 2005. - 214 с.
30. Вайнштейн, Ю.В. Разработка методов построения комплексов многомерных моделей для задач здравоохранения на базе OLAP-технологии: автореф. дисс. канд. технических наук: 05.13.01. / Ю.В. Дудина. Красноярск: Изд-во ИВМ СО РАН, 2004. - 24 с.
31. Венедиктов, Д.Д. Системный подход к проблемам национального здоровья // Вестник РАМН. 1998. - №2. - С.33-38.
32. Виноградов, К.А. Информационные технологии в управлении региональным здравоохранением / К.А. Виноградов, Е.Е. Корчагин, М.И. Никитина, Л.Ф. Ноженкова. Красноярск.: КМИАЦ, 2004. - 312 с.
33. Виноградов, К.А. Методологические подходы к планированию медицинской помощи с использованием информационных технологий / К.А.
34. Виноградов // Информационно-аналитические системы и технологии в здравоохранении и обязательном медицинском страховании: труды всероссийской конференции. Красноярск: Изд-во КМИАЦ, 2002. - С. 138-МУ.
35. Виноградов, С.А. Моделирование иерархических объектов / С.А. Виноградов. 2001 (http://rdbms.narod.ru/article/tree/index.html).
36. Виноградов, К.А. Управление здравоохранение региона и задачи информатизации / К.А. Виноградов // Проблемы разработки и внедрения информационных систем в здравоохранении и ОМС: труды межрегиональной конференции. Красноярск: ИВМ СО РАН, 2000 - С. 12-18.
37. Висков, А.В. Средства описания многомерных моделей данных / А.В. Висков, М.Б. Фомин // Вестник РУДН. Серия Прикладная и компьютерная математика, № 1. 2003.-Т.2 С. 128-139.
38. Гасников, В.К. Компьютерные технологии информатизации здравоохранения (региональный и учрежденческий уровень): справочно-методическое пособие / В.К. Гасников и др. Ижевск: Изд-во МЗ УР, ИГМА, 1995.-78с.
39. Голованов, М. Иерархические структуры данных в реляционных БД / М. Голованов // RSDN Magazine #0 (http://www.rsdn.ru/article/db/Hierarchy.xml).
40. Горохова, А.В. OLAP-средства системы «Аналитик». / А.В. Горохова, П.П. Ишенин, М.И. Никитина // Информационно-аналитические системы и технологии в здравоохранении и ОМС: труды всероссийской конференции. Красноярск: Изд-во КМИАЦ, 2002. - С.220-228.
41. Евдокимов, Д.А. Аналитические функции системы «СтатЭкспресс» / Д.А. Евдокимов, П.П. Ишенин // Конференция молодых ученых Института вычислительного моделирования СО АРН: материалы конференции. Красноярск: Изд-во ИВМ СО РАН, 2004. - С. 20-24.
42. Евдокимов, Д.А. Средства автоматизации сбора и обработки медицинской статистической информации: автореф. дисс. канд. технических наук: 05.13.01. / Д.А. Евдокимов. Красноярск: Изд-во ИВМ СО РАН, 2005.-24 с.
43. Жучков Д.В. Применение встроенного языка программирования в системе управления хранилищем данных / Д.В. Жучков, П.П. Ишенин, М.И. Никитина // Вестник Красноярского государственного университета. -2004. -№3. С. 35-39.
44. Жучков, Д.В. Программное обеспечение хранилищ данных для формирования информационных ресурсов в региональном здравоохранении: автореф. дисс. канд. технических наук: 05.13.11. / Д.В. Жучков. Красноярск: Изд-во ИВМ СО РАН, 2004. - 24 с.
45. Зелькович, P.M. Анализ и планирование финансов в здравоохранении: учебно-методическое пособие. / P.M. Зелькович, Э.М. Фрид Кемерово:1. Сибформс, 2000.- 130 с.
46. Интернет сайт фирмы «BusinessObjects». (http://www.businessobjects.com).
47. Интернет сайт фирмы «Intersoft Lab», (http://www.iso.ru).
48. Интернет сайт фирмы «Лаборатория BaseGroup». (http://www.basegroup.ru).
49. Информационные технологии в социальной сфере: монография. Для преподавателей, аспирантов и студентов направления 350500 очной и заочной форм обучения / С.П. Якимов, Л.Д. Якимова, И.И. Сапожков. -Красноярск: СибГТУ, 2005. 145 с.
50. Исакова, Л.Е. Введение в финансовый менеджмент в медицинском учреждении: учебно-методическое пособие. / Л.Е. Исакова, В.И. Шевский -Кемерово: Сибформс, 2000. 176 с.
51. Калиниченко, В.И. Интегрированная система «Планирование медицинской помощи». Краснодар: КМИВЦ, 2001. - 80 с.
52. Калиниченко, В.И. Управление медицинской помощью с использованием интегрированных систем: монография Краснодар: КубГУ, 2001. -376 с.
53. Когаловский, М.Р. Перспективные технологии информационных систем.- М.: ДМК Пресс; М.: Компания АйТи, 2003. 288 с.
54. Коннолли, Т. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. 3-е издание / Т. Коннолли, К. Бегг. С.П.: Издательский дом "Вильяме", 2004.- 1436 с.
55. Корнеев, В.В. Базы данных. Интеллектуальная обработка информации / В.В. Корнеев, А.Ф. Гарев, С.В. Васютин, В.В. Райх. М. Изд-во Нолидж, 2000. — 352 с.
56. Коробко, А.В. Задачи построения специализированных приложений на основе OLAP-инструментов // Материалы конференции молодых ученых СО РАН. Красноярск: ИВМ СО РАН, 2005. - С. 54-57.
57. Кузьменко, Д. Древовидные (иерархические) структуры данных в реляционных базах данных / Д. Кузьменко. iBase.ru, 1997 (http://ibase.ru/devinfo/treedb.htm).
58. Легалов, А.И. Общие сведения о трансляторах / А.И. Легалов. SoftCraft (http://www.softcraft.ru/translat/lect/t01-02.shtml).
59. Легалов, А.И. Организация лексического анализа / А.И. Легалов. Soft-Craft (http://www.softcraft.ru/translat/lect/t04-04.shtml).
60. Легалов, А.И. Основы теории языков и формальных грамматик / А.И. Легалов. SoftCraft (http://www.softcraft.ru/translat/lect/t02-04.shtml).
61. Маклаков, С. В. BPwin и ERwin. CASE-средства разработки информационных систем. М.: Диалог-МИФИ, 1999. - 295 с.
62. Манди, Д. К вопросу об OLAP / Д. Манди; под ред. Р. Кимбалла. // Intelligent Enterprise. 2003.- №18. (http://iemag.ru/?ID=473963).
63. Методические рекомендации по порядку формирования и экономического обоснования территориальных программ государственных гарантий обеспечения граждан Российской Федерации бесплатной медицинской помощью. М.: Минздрав, 2000. - 38 с.
64. Назаренко, Г.И. Медицинские информационные системы: теория и практика / Г.И. Назаренко, Я.И. Гулиев, Д.Е. Ермаков: под редакцией Г.И. Назаренко, Г.С. Осипова. М: ФИЗМАТЛИТ, 2005. - 320 с.
65. Некрасов, В. OLAP-клиент OLAP-сервер. Компромисс выбора / В. Некрасов, Н. Чемеркина. - Intersoft Lab (http://www.iso.ru/cgi-bin/main/public.cgi?id=135).
66. Разработка информационной системы для поддержки деятельности органов управления здравоохранения и системы обязательного медицинского страхования. Техническое задание. Красноярск, 2001. - 68 с.
67. Тишук Е.А. Информационно-аналитическое обеспечение здравоохранения // Экономика здравоохранения. 2001. - № 11-12. - С.31-33.
68. Трахтенгерц, Э.А. Компьютерная поддержка принятия решений. / Э.А. Трахтенгерц. М.: СИНТЕГ, 1998. - 347 с.
69. Федоров, А. Введение в OLAP часть 2. Хранилища данных / А. Федоров, Н. Елманова // КомпьютерПресс. 2001. - № 5. (http://lib.kbsu.ru/elib/disk/compress/2003/10Aitml/olap2/index.htm).
70. Хрусталев, Е.М. Агрегация данных в OLAP-кубах / Е.М. Хрусталев. Алеф Консалтинг & Софт. 2003 (http://www.interface.ru/misc/mut.htm).
-
Похожие работы
- Методика проектирования интегрированных программных систем многомерного анализа данных
- Информационно-аналитическая поддержка задач охраны здоровья матери и ребенка на основе построения OLAP-приложений
- Разработка методов построения комплексов многомерных моделей для задач здравоохранения на базе OLAP-технологии
- Формирование территориальных программ медицинской помощи на основе интеллектуальных средств управления OLAP-моделированием
- Средства оперативного геомоделирования в информационно-аналитических системах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность