автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Модельные представления и алгоритмы проверки правил в активных базах данных
Автореферат диссертации по теме "Модельные представления и алгоритмы проверки правил в активных базах данных"
На правах рукописи
ЗУДОВ Антон Борисович
МОДЕЛЬНЫЕ ПРЕДСТАВЛЕНИЯ И АЛГОРИТМЫ ПРОВЕРКИ ПРАВИЛ В АКТИВНЫХ БАЗАХ ДАННЫХ
Специальность 05.13.17 - Теоретические основы информатики
Автореферат диссертации на соискание ученой степени кандидата технических наук
005561643
ПЕНЗА 2015
005561643
Работа выполнена на кафедре «Математическое обеспечение и применение ЭВМ» ФГБОУ ВПО «Пензенский государственный университет».
Научный руководитель: доктор технических наук, профессор
Макарычев Петр Петрович
Официальные оппоненты: Сальников Игорь Иванович,
доктор технических наук, профессор, ФГБОУ ВПО «Пензенский государственный технологический университет», заведующий кафедрой «Вычислительные машины и системы»; Синев Михаил Петрович, кандидат технических наук, ЗАО «Научно-исследовательский институт физических измерений и вычислительной техники», главный специалист
Ведущая организация: ОАО «Научно-производственное предприятие "Рубин"» (г. Пенза)
Защита диссертации состоится 16 сентября 2015 г., в_часов,
на заседании диссертационного совета Д 212.186.01 при ФГБОУ ВПО «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40.
С диссертацией и авторефератом можно ознакомиться в библиотеке ФГБОУ ВПО «Пензенский государственный университет». Диссертация размещена на сайте: http://dissov.pnzgu.ru/ecspertiza/sydov
Автореферат разослан « О » УЪ 20/2 г.
Ученый секретарь
диссертационного совета Гурин Евгений Иванович
ОБЩАЯ ХАРАКТЕРИСТИКА РАБ ОТЫ
Актуальность темы. Обработка событий, возникающих в базах данных (БД) и соответствующих по уровню абстракции терминам предметной области, требует применения событийно-ориентированной системы, по отношению к которой БД является объектом мониторинга. В качестве средств построения систем обработки событий используются различные программные продукты и технологии, выбор которых зависит от специфики моделируемых бизнес-процессов, так как на сегодняшний день не существует единого стандарта обработки событий БД.
В некоторых случаях для решения данной задачи достаточно функциональности систем управления базами данных (СУБД) и механизмов триггеров. Логика обработки событий при этом должна быть относительно простой, ограниченной жесткими временными рамками и не предполагающей возникновения большого числа промежуточных событий. Если же промежуточных событий много, используются программные средства, в том числе системы обработки сложных событий, позволяющие описывать одни события как композицию других.
Во многих предметных областях существуют бизнес-процессы, подразумевающие обработку промежуточных событий. Однако эти процессы изменяются настолько динамично, что требуется постоянная проверка вносимых пользователем изменений. Системы обработки сложных событий и аналогичные им по функциональности имеют средства автоматической проверки обработчиков событий, позволяющие выявлять ошибки и защищать данные. Вместе с тем существующие средства не подразумевают проверку случаев, в которых промежуточное событие оказывается элементарным, так как подобные события выявляются с помощью СУБД.
Концепция активных баз данных (АБД) учитывает возможность наличия промежуточных элементарных событий, что означает принципиальную возможность полной проверки изменений, вносимых пользователями в логику обработки событий. В качестве обработчиков событий в АБД используются активные правила, хранимые наравне с традиционным наполнением БД и обеспечивающие реагирование на события без необходимости ожидания команд от внешнего приложения. Функциональность системы управления активной базой данных (СУАБД) включает проверку активных правил, позволяющую в том числе выявлять конфликты правил, связанные с промежуточными элементарными событиями.
Расширение интенсиональной части БД в соответствии с концепцией АБД отражено в нотациях БС^ЬЗ, 0++ и таких специализирован-
ных средствах обработки событий современных СУБД, как правила PostgreSQL и автономные транзакции Oracle.
Существенный вклад в развитие концепции АБД, в частности в разработку моделей представления и методов анализа взаимодействий обработчиков событий, внесли J. Widom, A. Aiken, Е. Baralis, С. В. Шибанов, С. Д. Кузнецов. Классификацию моделей, функций и прототипов СУ АБД предложили N. W. Patón и О. Diaz. Математические модели взаимодействия активных правил были разработаны J. Bailey, A. Couchot. Важные исследования, касающиеся рекурсии активных правил, содержащих параметры только вещественного типа, провели Timothy J. Hickey, Saumya К. Debray.
Однако вне внимания исследователей остались правила, в которых возможен рекурсивный запуск через промежуточное событие. В связи с этим существует проблема проверки активных правил в процессе их исполнения и проектирования. Первый аспект проблемы связан с отсутствием удовлетворительных способов безопасного выполнения рекурсивных активных правил. Второй аспект заключается в необходимости формального описания критериев проверки активных правил и способов выявления потенциальных сценариев взаимодействия. Третий аспект относится к составу компонент, необходимых для полной реализации функциональности систем обработки событий БД.
Цель диссертационной работы - теоретическое обоснование и исследование модельных представлений и алгоритмов проверки правил в активных базах данных, обеспечивающих расширение функциональных возможностей интенсиональной части базы данных, сокращение времени и количества ошибок при вводе данных.
Задачи исследования:
1) исследование областей применения и особенностей функциональности систем управления активными базами данных для формализации критериев проверки взаимодействия активных правил;
2) разработка модельных представлений статической и динамической проверки активных правил базы данных;
3) разработка математических, прагматических моделей функционирования и взаимодействия компонент системы управления активными базами данных;
4) разработка системы управления активными базами данных и экспериментальная оценка эффективности применения предложенных моделей.
Объектом исследования является система управления активными базами данных.
Предметом исследования являются математические модели описания событий и активных правил, алгоритмы обработки данных СУАБД и анализа взаимодействий активных правил.
Соответствие паспорту научной специальности. Область исследования соответствует п. 3 «Исследование методов и разработка средств кодирования информации в виде данных. Принципы создания языков описания данных, языков манипулирования данными, языков запросов. Разработка и исследование моделей данных и новых принципов их проектирования» и п. 4 «Исследование и разработка средств представления знаний. Принципы создания языков представления знаний, в том числе для плохо структурированных предметных областей и слабоструктурированных задач; разработка интегрированных средств представления знаний, средств представления знаний, отражающих динамику процессов, концептуальных и семиотических моделей предметных областей».
Методы исследования основаны на теоретических положениях интервального анализа, теории графов, конечных автоматов, механизма регулярных выражений и алгебры событий.
Научная новизна работы:
1. Разработано модельное представление динамической проверки активных правил в виде дерева, отличающееся заданием экземпляров событий вершинами графа, а активных правил - дугами, что позволяет снизить время ввода данных на 15 %.
2. Разработан алгоритм интервального оценивания областей значений активных правил, отличающийся использованием полученных ранее оценок в качестве критерия интервального метода дробления бруса, что позволяет расширить функциональные возможности интенсиональной части базы данных при обработке событий с вещественными атрибутами.
3. Предложено модельное представление активных правил, отличающееся заданием областей значений правил в виде конечного автомата, что позволяет расширить функциональные возможности интенсиональной части базы данных при обработке событий со строковыми атрибутами.
4. Предложено модельное представление статической проверки активных правил в виде деревьев, отличающееся заданием областей значений вершинами, а фактов инициируемое™ правил - дугами графа, что позволяет снизить количество ошибок при вводе данных об активных правилах приблизительно в 8 раз.
5. Предложена методика построения системы управления активными базами данных, отличающаяся разделением процесса исполне-
ния правил на стадию динамической проверки и стадию записи изменений в базу данных и вынесением функциональности по статической проверке в клиентское приложение, что позволяет моделировать бизнес-процессы, в которых возникают промежуточные элементарные события.
Практическая значимость исследований. Результаты исследования позволяют строить СУАБД, обеспечивающую выполнение проверки рекурсивного вызова активных правил, и могут применяться в областях, в которых возможны промежуточные элементарные события. Примерами таких областей являются геоинформационные системы, базы данных движущихся объектов, базы данных операторов мобильной связи, социальные сети, гетерогенные базы данных, системы электронной коммерции, облачные сервисы, системы обеспечения электронного взаимодействия.
Достоверность и обоснованность научных и практических результатов работы подтверждается использованием апробированного математического аппарата; экспериментальными данными тестовой эксплуатации разработанных программных средств; практическим применением полученных результатов, подтвержденных актами о внедрении; апробацией на научно-технических конференциях.
Основные результаты, выносимые на защиту:
1) модельное представление взаимодействующих активных правил в виде графа экземпляров событий и алгоритмы динамической проверки активных правил для выявления фактических и потенциальных шаблонов взаимодействия;
2) алгоритм оценивания областей значений в виде вещественных интервалов для выявления возможности опосредованного инициирования активных правил с вещественными параметрами;
3) модельное представление областей значений в виде конечных автоматов для выявления возможности опосредованного инициирования активных правил со строковыми параметрами;
4) модельное представление и алгоритм статической проверки активных правил для проверки терминальности и конфлюентности;
5) методика построения системы управления активными базами данных с поддержкой обработки промежуточных элементарных событий базы данных.
Реализация и внедрение результатов работы. Результаты диссертационного исследования использованы при разработке программных средств управления активными правилами в составе информационной системы электронной карты города Пензы, используемой МУП «ОГСАГиТИ» и Администрацией города Пензы, что подтверждается актами о внедрении.
Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях: «Надежность и качество» (2010), «Технологии Microsoft в теории и практике программирования» (2010), «Актуальные вопросы современной науки и образования» (2010), «Математическое и программное обеспечение систем в промышленной и социальной сферах» (2011), «Университетское образование» (2012).
Публикации. По теме диссертационного исследования опубликовано 13 печатных работ, из которых 3 статьи в журналах, входящих в перечень изданий, рекомендованных ВАК.
Личный вклад. Автором был выполнен основной объем исследований: сформулированы задачи анализа активных правил, предложены и обоснованы варианты их решения; определены основные характеристики, архитектура, а также разработан прототип СУАБД, используемый в составе электронной карты города Пензы. Поддержку электронной карты осуществляет МУП «ОГСАГиТИ».
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 112 наименований и пяти приложений. Объем работы — 168 страниц основного текста, включая 67 рисунков.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы, сформулированы цель и задачи исследования, показаны научная новизна и практическая значимость результатов диссертационного исследования, приведены сведения об апробации работы и публикациях.
Первая глава посвящена анализу моделей и средств, применяемых при построении СУАБД. Приведены результаты анализа существующих подходов к обработке событий БД. Проведено исследование особенностей концепции АБД. Выполнен анализ модельных представлений активных правил и оценок их областей значений, в частности, конечных автоматов. В качестве возможного способа оценивания приведено описание синтеза конечного автомата по поведению.
Обосновано применение событийно-ориентированных систем, в которых БД выступает в качестве объекта мониторинга. Показано, что реагирование на события БД может осуществляться с применением систем обработки сложных событий и систем управления бизнес-правилами. Недостатком такого подхода является невозможность полной верификации изменений, вносимых в обработчики событий.
В ходе анализа предметных областей, требующих обработки промежуточных событий, определена область применения АБД, для ко-
торых промежуточные события могут быть элементарными. Верификация активных правил (обработчиков событий) осуществляется на стадиях статической и динамической проверки. Исследование существующей концепции архитектуры СУАБД выявило невозможность динамической проверки в данной архитектуре.
Модельные представления активных правил требуются для описания непосредственно самих активных правил, их областей значений, а также АБД в целом. Вариантом задания активного правила с вещественными параметрами являются аналитически заданные вещественные функции. Активное правило со строковыми параметрами может быть описано в виде детерминированного конечного автомата. Область значений вещественных параметров может быть задана в виде замкнутых вещественных интервалов, область значений строковых параметров - в виде регулярных выражений. Поведение СУАБД при исполнении правил может быть описано с помощью недетерминированного конечного автомата. Последовательные взаимодействующие процессы позволяют описать свойства набора активных правил, проверяемые на стадии динамической и статической проверки.
Описание области значений активных правил в виде конечного автомата позволяет вычислять области значений инициированных правил. Синтез конечного автомата на основе серии экспериментов с активным правилом может быть использован в тех случаях, когда получение точной оценки области значений является невозможным.
Вторая глава посвящена разработке алгоритмов и математических моделей данных, необходимых для динамической и статической проверки активных правил. Выделены свойства набора правил и ситуации, возникающие при обработке событий, которые могут выявляться в ходе проверки. Предложены модельное представление взаимодействий активных правил при обработке экземпляра событий и способы выявления зацикливаний, состояния гонки и необязательных операций. Выделены классы активных правил по типам их параметров и предложены соответствующие им модели и подходы к оцениванию областей значений правил. Описаны модельное представление потенциальных взаимодействий и способы проверки терминальности и кон-флюентности.
В рамках динамической проверки предложено выявлять конфликтные ситуации зацикливания и состояния гонки, а также выполнение необязательных операции с БД. Под зацикливанием понимается бесконечный вызов правилом самого себя. Состоянием гонки в случае активных правил предложено называть попытку параллельного изменения свойств объекта БД несколькими исполняемыми правилами.
В рамках статической проверки предложено выявлять свойства терминалыюсти и конфлюентности, под которыми для заданного набора правил понимается невозможность возникновения зацикливания и состояния гонки соответственно. Для статической проверки выбран вариант с оцениванием областей значений правил.
Формальное описание введенных понятий может быть построено через описание триггеров и активных правил АБД как последовательных взаимодействующих процессов. Экземпляры событий АБД Е и элементарные события та в этом случае могут рассматриваться как события, в которых участвуют взаимодействующие процессы. Активное правило г, при обработке события может быть описано как процесс, который для каждого экземпляра события е генерирует некоторую последовательность событий, а затем останавливается, т.е. ведет себя как пустой процесс STOP:
г, =
I (ек^г,к)
, в котором r,k = (dn — (da ->...' (dj STOP))),
\к
где к - номер экземпляра события е е Е, г,к - правило при обработке экземпляра события ек\ d,]k е Л и Е - некоторое элементарное событие или экземпляр промежуточного события, генерируемый правилом напрямую, без триггера; / = 1, 2, 3... — номер активного правила; к = 1,2, 3... - номер экземпляра события.
Триггер, вызывающий процедуру генерации экземпляра события, может быть представлен как процесс, запускающийся элементарным событием и генерирующий экземпляр события:
(ы->(<>'-*8ТОР)), где е' - генерируемый триггером экземпляр события; к' - номер триггера.
Предложен описывающий целиком АБД процесс, в котором правила и триггеры обрабатывают соответствующие события параллельно:
АБВ = (||/-) || (|| 1гк,),1 = 1,2,3...,*'= 1,2,3...
С помощью понятия алфавита данного процесса описаны свойства набора правил, которые были предложены выше.
Зацикливание: 3 екваАйВ: (ек -* АИВ) с АБВ.
Состояние гонки: Зй^еагД Зс^еаг/: уДс1\, с1г)=\, где d\ и - некоторые операции с БД, а % - функция конфликтности отдельных операций.
Терминальность: VekeaABD: (ek-+ADB) aiADB.
Конфлюентность: если X/dgeaADB,\/dheaADB: ((ek —* ... (dg —*...)) 11 ((et — ... (dh -* ... )) с то %(dg, dh) = 0.
Как следует из определения терминальное™, набор правил, обладающий данным свойством, при обработке любого экземпляра события потребует конечного числа запусков правил. Поэтому активные правила, в отличие от триггеров, позволяют моделировать бизнес-процессы, в которых число запусков может быть большим. Как известно, в реляционных СУБД действует ограничение на количество запусков триггеров при обработке события. Например, в Oracle llg оно равно 32 и при желании может быть уменьшено через настройку числа одновременно открытых курсоров. Данный факт проиллюстрирован рисунком 1.
О 5 10 15 20 25 30 35 40
Количество элементарных событий
¡— Активные правила —Триггеры |
Рисунок 1 - Обработка промежуточных элементарных событий
Для выявления зацикливания и состояния гонки в рамках динамической проверки предложено модельное представление взаимодействий правил в виде графа экземпляров событий в котором указаны связи экземпляров событий друг с другом, возникающие при работе активных правил. Если при обработке одного экземпляра события некоторым правилом напрямую или посредством триггера генерируется другой экземпляр события, то в графе присутствует соответствующая дуга (е„ е7) между вершинами, обозначающими экземпляры событий:
Ся = ({е\...ет}, {(г,, е,)| 3г. еуеаге>},
где т - число экземпляров событий; е, - инициирующий экземпляр
события; е1 - промежуточный экземпляр события; ге' - активное правило г, обрабатывающее экземпляр события <?,.
Зацикливанию соответствует цикличный граф, состояние гонки может быть определено сравнением путей, начинающихся из одной вершины.
Для оценивания областей значений правил с вещественными параметрами в ходе статической проверки предложен алгоритм интервального оценивания правил. Суть алгоритма состоит в уменьшении эффекта связности, снижающего точность интервальных оценок, двумя стратегиями. Одна состоит в вычислении пересечения нескольких оценок, полученных разными интервальными методами. Вторая стратегия заключается в применении метода дробления бруса, где в качестве критерия дробления используются границы полученных ранее оценок области значений инициирующего правила и области определения инициируемого правила:
т N
= и П
где гм (Х^ - оценка области значений вещественной функции, соответствующей активному правилу г, полученная на интервальном векторе X интервальным методом М,\ т - количество доступных интервальных методов; Л'- количество интервальных векторов, полученных в результате применения метода дробления бруса.
Для оценивания областей значений правил со строковыми параметрами в ходе статической проверки предложено модельное представление областей значений правил в виде конечного автомата, полученного соединением конечных автоматов, синтезированных по регулярным выражениям, описывающим входные и выходные параметры активного правила, по схеме, представленной на рисунке 2.
Из рисунка следует, что по входящим в активное правило регулярным выражениям синтезируются конечные автоматы Т\.....Тц для
входных параметров правила и автоматы Аи ■■■,Ат для выходных параметров, которые затем соединяются друг с другом по схемам с последовательным и параллельным соединением с общим входом и раздельными выходами.
Схеме на рисунке 2 соответствует следующая система уравнений:
'д[х + 1] = П< 9л ОЦ.КШФс, (4суМ^М)Щн>с, (<7с,М.*М) >;
/ 1
' Ят] = Пфл, (ча,М,<ПФС, (ЯС; М,*М)).*М>).
I }
где х - квант времени (тик); ф - функция состояний; - функция переходов; Ai - автомат, построенный для /-го выходного параметра; С, - автомат, построенный для у-го входного параметра.
Рисунок 2 - Схема соединения конечных автоматов
Для проверки терминальности и конфлюентности набора правил в рамках статической проверки предложено модельное представление потенциальных взаимодействий правил в виде графа областей значений Ск. Вершины графа соответствуют оценкам областей значений правил. Если область значений одного правила пересекается с областью определений другого, то между вершинами, сопоставленными
с соответствующими оценками, в графе присутствует дуга
Ся = ({VI,..., М, {(V/, Уу)| у, = ф(г*| гкец1(у,),ч)}),
где V, - оценка области значений потенциально инициирующего правила; Vj - оценка области значений потенциально инициируемого правила; \|/(т-*, С) - область значений правила гк относительно области определения, входящей в С; у(у) - множество правил, инициируемых событиями из множества V.
По аналогии с графом экземпляров событий набор правил является терминальным в случае ацикличности графа областей значений, а для проверки конфлюентности необходимо сравнение путей, имеющих общую начальную вершину.
В третьей главе приведены результаты разработки моделей взаимодействия и функционирования компонент системы. Определен их состав и круг возможных программных средств их реализации. Представлены результаты проектирования подсистемы исполнения, репозитория и программных средств разработки активных правил.
В СУАБД в качестве необходимых компонент выделены минимум одна пассивная БД, подсистема исполнения, подсистема статической проверки и репозиторий правил (рисунок 3).
База данных
Программные средства разработки правил
Подсистема
Рисунок 3 - Концептуальная архитектура СУАБД
Для реализации репозитория может быть выбрана либо СУБД, используемая для пассивной БД, либо отдельная СУБД. Последний вариант целесообразно использовать в случае нескольких пассивных БД. В качестве основы взаимодействия компонент системы выбран механизм уведомлений, который может быть реализован с помощью как средств межпроцессного взаимодействия, так и системы обработки сложных событий, если она входит в одну из используемых СУБД.
Подсистема исполнения правил разделена на модуль динамической проверки, модуль агентов элементарных событий и модуль внесения изменений в пассивную БД, функционирующие как система взаимодействующих сервисов. Это позволяет обеспечить возможность обработки событий от удаленных источников и сделать систему масштабируемой. Поведение системы может быть описано с помощью недетерминированного конечного автомата, представленного на рисунке 4.
Л&)
I
А&)
М «,>
Рисунок 4 - Предлагаемая схема исполнения активных правил Данному автомату соответствует система уравнений:
5е(/ + 1) = *е(0; 5с(/ + 1) = 5е(0&*с(0;
БЕ (Г +1) = (/) & Х£ (/) V Бд (о & (0;
+1) = ^СО & дс^СО V & 4 С + 1) = ^ (/)&...&(г)
+1) = 4(0 & 5л (0 V яЕ(0 &
где хе - новое элементарное событие; хс - сигнал о том, что определен контекст события АБД; хЕ - сигнал о том, что сгенерирован экземпляр инициирующего события; хы - сигнал о том, что сгенерирован экземпляр промежуточного события; хк - сигнал об инициировании правила; х'а — сигнал о том, что определены выходные параметры /-го правила; начало обработки элементарного события; Бс - генерация экземпляра события; БЕ - начало обработки события АБД; ^ - запуск /-го правила; - помещение в результирующий
запросу'-й операции /-го правила; - завершение обработки /-го правила; Бе — завершение обработки события.
Представленный конечный автомат реализует схему исполнения правил, в которой обработка инициирующего события завершается только после окончания динамической проверки промежуточных событий: автомат после помещения в результирующий запрос очередной операции (состояние может начать обработку промежуточного события (состояние SE).
Репозиторий условно разделен на несколько частей: базовые метаданные, которые не зависят от типов правил, функции правил, которые загружаются агентами правил, когда нужно вычислить значения выходных параметров, и оценки областей значений правил. Это позволяет реализовать типы правил, описанные во второй главе, и обеспечить возможность добавления новых типов при необходимости.
В составе программных средств разработки выделены конструкторы правил для каждого типа и подсистема статической проверки, состоящая из построителя графа областей значений и библиотек оценивания, также соответствующих типам правил. Это позволяет проводить статическую проверку при создании правил, оценивать правила во время построения графа областей значений или по команде пользователя и конструировать их в соответствии с выбранным типом.
В четвертой главе представлены результаты практической реализации и исследования системы управления АБД. Приведены описание выбранной предметной области и особенности обработки возникающих в ней событий. Дано обоснование выбора программных средств и описаны особенности реализации СУАБД. Представлены результаты моделирования происходящих в предметной области бизнес-процессов с помощью активных правил, а также результаты реализации предложенных моделей и методов, полученные в ходе эксплуатации информационной системы.
В качестве предметной области для экспериментальной оценки эффективности предложенных моделей и методов выбрана электронная карта города Пензы, поддержка которой осуществляется МУП «ОГСАГиТИ». Были выделены бизнес-процессы, связанные с обработкой событий при ведении адресного реестра и подготовке таких документов, как градостроительный план земельного участка и исходные данные для проектирования инженерно-технического обеспечения.
Репозиторий правил реализован с помощью Oracle Database 11g. Для подсистемы исполнения и программных средств разработки активных правил использована Visual Studio Professional 2013. Взаимодействие базы данных в качестве источника событий с подсистемой исполнения реализовано с помощью механизма очередей Oracle
Streams, взаимодействие компонент подсистемы исполнения - с помощью именованных каналов.
С помощью активных правил реализована обработка событий, возникающих при создании земельного участка, подготовке градостроительного плана по нему, предоставлении участка правообладателю, добавлении или изменении адреса, подготовке исходных данных для проектирования инженерно-технического обеспечения и проведения технической инвентаризации.
Перед началом использования разработанных активных правил была проведена статическая проверка, включающая построение графа срабатываний и графа областей значений. Граф срабатываний позволил исключить из 29 правил два, гарантированно не взаимодействующие с другими. Поэтому граф областей значений был построен для 27 активных правил, среди которых было обнаружено две группы нетерминальных правил. После их исправления все правила были включены в обработку событий.
Активные правила, связанные с подготовкой градостроительных планов, были введены в конце 2011 г. Правила, отвечающие за подготовку документов по исходным данным на проектирование, - в январе 2013 г. По соответствующим заявкам была собрана статистика выполнения работ за период, начинающийся за год до начала использования активных правил и заканчивающийся через год после этого. Для заявок по градостроительным планам это период с января 2011 г. по декабрь 2012 г., для заявок по исходным данным на проектирование -с января 2012 г. по декабрь 2013 г. Статистика приведена на рисунке 5.
Градостроительные планы
Исходные данные на проектирование
до использования после создания активных правил активных правил -\/-
до использования активных правил
после создания активных правил
til
сч^ ^ civ* сч^ сч^* сС^ сч^" с^
srj*-.*' «к
-V" f -f
■
Рисунок 5 - Статистика среднего времени выполнения заявок
16
По представленным статистическим данным видно, что примерно на середину выбранных временных промежутков приходится рубеж, после которого исследуемые значения оказываются ниже. Среднее время подготовки градостроительного плана уменьшилось на один день. Среднее время подготовки исходных данных на проектирование уменьшилось на 17 %. Среднее время выполнения обоих видов работ снизилось на 15 %. Кроме того, количество ошибок при электронном взаимодействии в ходе присвоения адресов снизилось с 57 до 7 за год.
В заключении сформулированы основные результаты диссертационного исследования.
Приложения к диссертации содержат описание интерфейса и функциональности клиентского приложения разработки активных правил, перечень разработанных правил, описание информационной системы и акты внедрения.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Разработаны модельное представление и алгоритм динамической проверки активных правил, отличающиеся представлением переходов состояний базы данных в виде экземпляров событий, что позволяет выявлять последовательности вызовов правил, находить по ним зацикливание и состояние гонки и определять параметры последовательности событий, которые привели к данным ситуациям. Алгоритм проверки зацикливания имеет сложность 0(п2).
2. Разработан алгоритм интервального оценивания областей значений активных правил, отличающийся использованием полученных ранее оценок в качестве критерия интервального метода дробления бруса, что позволяет расширить функциональные возможности интенсиональной части базы данных при обработке событий с вещественными атрибутами.
3. Предложено модельное представление активных правил, отличающееся представлением областей значений правил в виде конечного автомата, что позволяет расширить функциональные возможности интенсиональной части базы данных при обработке событий со строковыми атрибутами.
4. Предложены модельное представление и алгоритм статической проверки активных правил, отличающиеся реализацией анализа параметров опосредованного инициирования, что позволяет выявлять изменения в поведении правил при многократном рекурсивном вызове. Алгоритм проверки терминальности имеет сложность 0{п) и позволяет обрабатывать последовательности промежуточных элементарных событий без ограничения количества каскадных вызовов.
5. Предложена методика построения системы управления активными базами данных, отличающаяся разделением процесса исполнения правил
на стадию динамической проверки и стадию записи изменений в базу данных и вынесением функциональности по статической проверке в клиентское приложение, что позволяет повысить точность моделирования бизнес-процессов, в которых возникают промежуточные элементарные события.
6. Разработан и реализован программный комплекс обработки возникающих в базе данных событий в составе электронной карты города Пензы. Проведено исследование эффективности использования данного программного комплекса в процессе его эксплуатации в МУП «ОГСАГиТИ», которое продемонстрировало улучшение показателей эффективности обработки заявок в среднем на 15 %, а для вида работ по подготовке исходных данных на инженерно-техническое проектирование - на 17 %. Количество ошибок при электронном взаимодействии в ходе присвоения адресов снизилось в 8 раз.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Публикации в изданиях, рекомендованных ВАК РФ
1. Зудов, А. Б. Моделирование потенциальных взаимодействий активных правил с помощью графа областей значений / А. Б. Зудов // Современные проблемы науки и образования. - 2015. - № 1. - URL: www.science-education. ru/12117745 (дата обращения: 25.03.2015).
2. Зудов, А. Б. Оценка области значений активных правил по регулярным выражениям / А. Б. Зудов // Фундаментальные исследования. - 2015. -№ 2. - С. 927-930.
3. Зудов, А. Б. Интегрированный подход к анализу активных правил на зацикливание / С. В. Шибанов, А. Б. Зудов // В мире научных открытий (Математика. Механика. Информатика). - Красноярск : Научно-инновационный центр, 2012.-№ 12.1 (36).-С. 62-73.
Публикации в других изданиях
4. Зудов, А. Б. Реализация абстрактной модели активных баз данных средствами современных СУБД / С. В. Шибанов, Э. В. Лысенко, А. А. Скоробогатько, А. Б. Зудов, П. В. Вишняков // Надежность и качество : тр. Междунар. симп. : в 2 т. - Пенза: Изд-во ПГУ, 2010. - Т. 1. - С. 306-313.
5. Зудов, А. Б. Ускорение разработки экспертных систем с помощью оболочек / А. Б. Зудов // В мире научных открытий. - Красноярск : Научно-инновационный центр, 2010. -№ 1.4. - С. 30-32.
6. Зудов, А. Б. Постановка эксперимента для оценки эффективности функционирования активной базы данных / П. В. Вишняков, А. Б. Зудов, А. А. Скоробогатько // Новые информационные технологии и системы : материалы X Междунар. науч.-практ. конф. - Пенза : Изд-во ПГУ, 2012. - С. 208-2011.
7. Зудов, А. Б. Интерфейсы на естественном языке как связь нейронных сетей с экспертными системами / А. К. Гришко, А. Б. Зудов, В. А. Ермолаев // Надежность и качество : тр. Междунар. симп. : в 2 т. - Пенза : Изд-во ПГУ, 2010. - Т. 1.-С. 283-285.
8. Зудов, А. Б. Алгоритм оценивания области значений активных правил / С. В. Шибанов, А. Б. Зудов // Проблемы автоматизации и управления в технических системах : материалы XXX Междунар. науч.-техн. конф. - Пенза : Изд-во ПГУ, 2013. - С. 16—17.
9. Зудов, А. Б. Зацикливание правил в активных базах данных / С. В. Шибанов, А. Б. Зудов // Университетское образование : материалы Междунар. науч.-метод. конф. - Пенза: Изд-во ПГУ, 2012. - С. 357-359.
10. Зудов, А. Б. Применение методологии активных баз данных в Oracle Database llg / С. В. Шибанов, А. Б. Зудов // Технологии Microsoft в теории и практике программирования : сб. тр. конф. - Н. Новгород : Изд-во Нижегород. гос. ун-та, 2010. - С. 270-272.
11. Зудов, А. Б. Проблемы построения правил в активных базах данных / С. В. Шибанов, А. Б. Зудов // Математическое и программное обеспечение систем в промышленной и социальной сферах : междунар. сб. науч. тр. - Магнитогорск : Изд-во Магнитогорск, гос. техн. ун-та им. Г. И. Носова, 2011. - Ч. I. — С. 36-41.
12. Зудов, А. Б. Платформа для разработки приложений активных баз данных/ П. В. Вишняков, А. Б. Зудов, А. А. Скоробогатько // Научный сервис в сети Интернет: Поиск новых решений : тр. Междунар. суперкомпьютерной конф., 2012.-С. 591-598.
13. Зудов, А. Б. Анализ подходов к реагированию на события в базах данных / А. Б. Зудов // Современные тенденции в образовании и науке : сб. науч. тр. по материалам Междунар. науч.-практ. конф. (31 октября 2013 г.) / М-во обр. и науки РФ. - Тамбов : Изд-во ТРОО «Бизнес-Наука-Общество», 2013. - Ч. 25. -С. 32-33.
Научное издание ЗУДОВ Антон Борисович
МОДЕЛЬНЫЕ ПРЕДСТАВЛЕНИЯ И АЛГОРИТМЫ ПРОВЕРКИ ПРАВИЛ В АКТИВНЫХ БАЗАХ ДАННЫХ
Специальность 05.13.17 - Теоретические основы информатики
Редактор Е. П. Мухина Технический редактор М. Б. Жучкова Компьютерная верстка М. Б. Жучковой
Распоряжение № 10/66-2015 от 08.07.2015.
Подписано в печать 09.07.15. Формат 60х84ш6.
Усл. печ. л. 1,16. Заказ Ха 638. Тираж 100.
Издательство ПГУ. 440026, Пенза, Красная, 40. Тел./факс: (8412) 56-47-33; e-mail: iic@pnzgu.ru
-
Похожие работы
- Обобщение, конкретизация и применение метода патурно-математического моделирования при автоматизации металлургических объектов
- Алгоритмы прогнозирования и оптимизации на базе натурно-модельных комплексов применительно к коксовому производству
- Метод обнаружения искусственных искажений данных дистанционного зондирования Земли
- Синтез оптимальной логической структуры распределенной базы данных с помощью параллельного нейросетевого алгоритма
- Распределенное имитационное моделирование на магистрально-модульных вычислительных системах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность