автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Метод и модели управления транзакциями в распределенных системах обработки информации

кандидата технических наук
Ндикумагенге Жереми
город
Санкт-Петербург
год
2010
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Метод и модели управления транзакциями в распределенных системах обработки информации»

Автореферат диссертации по теме "Метод и модели управления транзакциями в распределенных системах обработки информации"

084618783

Ндикумагенге Жереми

МЕТОД И МОДЕЛИ УПРАВЛЕНИЯ ТРАНЗАКЦИЯМИ В РАСПРЕДЕЛЕННЫХ СИСТЕМАХ ОБРАБОТКИ ИНФОРМАЦИИ

Специальность 05.13.01 - Системный анализ, управление и обработка информации (технические системы)

Автореферат диссертации на соискание ученой степени кандидата технических наук

2 3 ЛЕН 2010

Санкт-Петербург-2010

004618783

Работа выполнена в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» им. В.И.Ульянова (Ленина).

Научный руководитель - кандидат технических наук, доцент

Цехановский Владислав Владимирович

Официальные оппоненты: доктор технических наук, профессор

Водяхо Александр Иванович

кандидат технических наук, доцент Воронин Иван Викторович

Ведущая организация: Санкт-Петербургский государственный университет

аэрокосмического приборостроения

Защита диссертации состоится декабря 2010 г. в № часов на заседании совета по защите докторских и кандидатских диссертаций Д 212.238.07 Санкт-Петербургского государственного электротехнического университета «ЛЭТИ» им. В.И.Ульянова (Ленина) по адресу: 197376, г. Санкт-Петербург, ул. Проф.Попова, 5.

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан 2.6 ноября 2010 г.

Ученый секретарь совета

по защите докторских и

кандидатских диссертаций Д212.238.07

кандидат технических наук,

доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Системы распределенных баз данных, как основный компонент распределенной системы обработки информации играют важную роль в развитии современной экономики и бизнеса. Обеспечение интенсивной динамичности выполнения процессов таких систем - одна из самых трудоемких проблем эффективной реализации бизнес процессов при эксплуатации банков данных. Создание надежных, отказоустойчивых и эффективных средств обслуживания и управления требует наличия высококвалифицированных специалистов, больших финансовых и временных затрат, как для проектирования, разработки и развертывания, так и для сопровождения, эксплуатации и администрирования. Управление выполнением распределенных и параллельных вычислительных процессов, определенных на стадии детальной разработки средств сопровождения и эксплуатации распределенной системы обработки информации в целом и их оптимизация в частности, всегда было и остается сложной и актуальной задачей.

Качественная оценка свойств распределенной системы обработки информации и прогнозирование динамического поведения вычислительных процессов, бизнес-процессов и потоков данных на этапах детальной разработки логики обслуживания и эксплуатации с учетом, по возможности их физической реализации, существенно и значительно уменьшает вероятность, долю или частоту сбоев и, соответственно, банкротство информационных и финансово-банковских инфраструктур. Полученные навыки, изобретения и достижения, нуждаются не только в усовершенствовании, но и во внедрении и создании новых методов и моделей, то есть новых технологий разработки средств сопровождения, администрирования, управления и исследования. Своевременное обнаружение, фиксация и устранение конфликтных ситуаций и противоречий данных, способных выводить системы из строя с наименьшими,.

хх; •

финансовыми и временными затратами является одной из важных характеристик управляемости и полезности системы распределенных баз данных разного рода и назначения. Проблемы обслуживания и обеспечения работоспособности распределенных систем обработки информации (РСОИ), основанных на концепции распределенной системы баз данных (РБД), являются в настоящее время объектом все возрастающего интереса широкого круга специалистов в области обработки данных.

В связи с этими важным является создание и разработка методов и моделей управления выполнением транзакций, позволяющих системным администраторам отслеживать динамику обработки процессов, контролировать работоспособность системы и устранять сбои, которые могут возникать. Реализация процедур обслуживания должна предоставлять возможность конфигурации системы по нуждам и требованиям пользователей за счёт составления и генерации алгоритмов (протоколов) выполнения действий для решения конкретных задач в пределах поставленных целей. Поэтому, данное диссертационное исследование посвящено решению задачи разработки методов и моделей повышения управляемости обслуживанием и выполнением транзакций в РСОИ, на базе расширения результатов исследований современных ученых, таких как Кульба В.В., Ковалевский С.С., Косяченко С.А., Советов Б.Я., Чертовской В.Д., ПЛардин., G.Weikum., G. Vossen., P.A. Bernstein и др.

Объектом исследования является система распределенных баз данных, как основной компонент распределенной системе обработки данных.

Предметом исследования является средства обработки и обслуживания транзакций распределенных баз данных, предназначенные для повышения управляемости выполнением процессов в распределенной системы обработки информации.

Цель диссертационной работы заключается в разработке метода, алгоритмов и моделей управления выполнением транзакций, обеспечивающих анализ, обработку, исследование, прогнозирование

поведения и обслуживание транзакций РСОИ на базе аппарата сетей Петри и примитивов управления транзакциями СУБД. Задачи исследования.

1. Анализ структурных характеристик распределенных систем обработки информации и проблем управления выполнением транзакций в распределенных базах данных.

2. Разработка метода и модели выявления конфликтов в распределенной базе данных.

3. Разработка методов и моделей улучшения управляемости выполнения транзакций в распределенных системах обработки информации.

4. Разработка методов и моделей исследования множества транзакций Методы исследования.

При решении основной задачи диссертационной работы использовались методы балансировки древовидных структур, конечные автоматы; функции управления объектами СУРБД SQL Server 2000; элементы теории графов сетей Петри с их методами анализа и исследования.

Основные положения, выносимые на защиту:

1. Метод обнаружения потенциальных конфликтных ситуаций по функциональной структуре РБД в РСОИ.

2. Модель выбора допустимых путей выполнения транзакций на базе основных типов операций над данными для разрешения несогласованности реализаций транзакций.

3. Модели исследования множества транзакций, вовлеченных в процесс обработки и улучшения управляемости выполнения множества транзакций.

Научная новизна работы.

1. Разработанный метод обнаружения конфликтных ситуаций с учетом структуры РБД на основе методологии имитационного моделирования, отличается от существующих тем, что позволяет априори выявить и предсказать поведение транзакций.

2. Разработанная модель выбора допустимых путей выполнения транзакций отличается от известных использованием методов и математических моделей аппарата сетей Петри.

3. Предложенные модели исследования множества транзакций и улучшения управляемости выполнения множества транзакций, отличаются от известных использованием математической теории отношений над бинарным множеством примитивов операций. Достоверность научных результатов и выводов, полученных

автором диссертации, подтверждается корректностью использования математических аппаратов теории сетей Петри и графов, теории конечных автоматов, теории систем массового обслуживания, функций управления объектами СУРБД.

Научная и практическая ценность диссертационной работы Научная значимость заключается:

•в разработке и обосновании теоретической основы прогнозирования функционального поведения вычислительных процессов РСОИ за счёт использования современного математического аппарата;

•в развитии теории слияния и декомпозиции транзакций в виде деревьев по слоевой архитектуре серверов транзакций и теоретических методов оптимизации исследования транзакций, вовлеченных в обработку в транзакционных серверах.

Практическая ценность работы заключается в том, что результаты экспериментальных и теоретических исследований существования противоречий хранимых данных, функциональных конфликтов и обслуживания транзакций и запросов в распределенных системах обработки информации могут быть использованы для:

• своевременного предсказания системными администраторами конфликтных ситуаций при эксплуатации и обслуживании системы;

• декомпозиции, разбиения, слияния и отслеживания транзакций с целью оптимизации их выполнения и обработки;

• многоуровневого отображения сложных транзакций с целью упрощения их функциональной и структурной сложности для детального анализа и исследования;

• обслуживания множества транзакций и запросов в РБД.

Теоретические и практические результаты исследований внедрены в

курсе моделирования процессов систем реального времени и реализованы в виде ряда программных схем на различных продуктов инструментальных средств разработки, таких как, Visual Paradigm. Данные программные схемы используются для развертывания информационных управленческих систем и в качестве модулей системы анализа и исследования в системах поддержки принятия решений.

Апробация результатов работы. Основные положения и результаты докладывались и обсуждались на:

• Ежегодных научно-технических конференциях профессорско-преподавательского состава СПбГЭТУ «ЛЭТИ (2008- 2010 гг);

• XV и XVI Международных научно-методических конференциях «Современные технологии обучения» (2009- 2010 гг).

Публикации: По теме диссертации опубликовано 4 научных работы, из них - 2 статьи, среди которых 1 публикация в ведущих рецензируемых изданиях, рекомендованных в действующем перечне ВАК, 2 работы в материалах международных и всероссийских научно-технических конференций.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав с выводами и заключения. Она изложена на 131 страницах машинописного текста, включает 37 рисунков, 4 таблицы и содержит список литератур из 67 наименований, среди которых 51 отечественных и 16 иностранных авторов.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введение обоснована актуальность темы, приведены и выделены текущие положения и роль средств управления вычислительными процессами баз данных, поставлена цель исследований, сформулированы и обоснованы задачи исследования. Отмечена научная новизна, теоретическая и практическая ценность, приведены сведения об апробации работы.

В первой главе проведен обзор исследуемой предметной области. Приводится описание и анализ структуры распределенной системы обработки информации и распределенной базы данных, как, основного компонента распределенной обработки информации. Приведены. основные характеристики распределенных систем обработки информации и принципы РБД, сформулированные К. Дж. Дейтом. Описаны существующие методы, алгоритмы и модели управления выполнением и обработкой распределенных и параллельных транзакций, СУБД и СУРБД, выделены их достоинства и недостатки, исследованы средства СУРБД управления объектами.

Во второй главе исследован аппарат сетей Петри, методы анализа, которые позволяют создать методы и алгоритмы выявления и предсказания конфликтов по архитектурной структуре РСОИ и разработаны алгоритмы построения и анализа дерева достижимости сетей Петри, диаграммы, которые приведены на рисунках 1 .а, б.

Рисунок 1.а. Итеративный алгоритм построения дерева достижимости, б. Рекурсивный алгоритм построения дерево достижимости В третьей главе разработаны модели реализации запросов и транзакций, на базе основных типов операций, предложен метод анализа процессов обслуживания и выполнения транзакций и запросов на основе дерева достижимости сетей Петри и выявлено необходимое условие завершенности выполнения запросов и транзакций, при котором

исключаются системные тупики и конфликты при использовании разделяемых ресурсов.

Для завершения транзакции, представленной на рисунке 2, требуются операции последовательной выборки из БД записей И.!1® (операция Н20в (операция и 11зПВ (операция Гз). Результатом операции $ является формирование в рабочей области памяти транзакции искомых записей Д]0Р, результатом операции f2 - формирование искомых записей И20Р, с учетом результатов операции ^(т.е. К.1°р) и К20в, результатом операции Г3 -формирование искомых записей ККё°р, с учетом результатов операции f2(т.e. Я2°?) и Яз°в. Сами операции выборки при этом включают определенную последовательность процедур и операторов языка манипулирования данными СУРБД (рис.3).

Аналогичным образом, путем этапного последовательного подхода представления операции, начиная с модели операции в виде двухдольного графа, затем, построения по ней модели сетей Петри и, наконец, последовательной композиции взаимосвязанных фрагментов обработки, подвергающей только одну запись для реализации несколько операций того или иного типа, создаются остальные модели основных типов операций (вставки, обновлении и удаления), выполняемых над БД. Таким образом, рассмотренные модели типов операции над БД в виде фрагментов сетей Петри являются основой для формирования моделей транзакций и запросов.

Рисунок 2. Модель в виде двудольного графа основных типов операций, не изменяющих состав или структуру БД

ЯЭ1пр1ск

©—П—<>

-О-

О

Мю»(1,0,1,0)

Рисунок 3.Модель операции выборки в виде маркированной сети Петри

Исследование динамики выполнения транзакций реализуется путем перехода представления операций в виде двудольных графа к представлению в виде моделей сетей Петри. На рисунке 4 представлена модель последовательной реализации несколько операций выборки в виде маркированной сетей Петри.

—О-

Р1пР)ск

О-

К

1 1

О

-0-

1л2

О

«ю

Ммю01,О,1,О,1,О,1,О)

Рз" 1це Р"

о-чьо

■о

Рисунок 4. Модель последовательной реализации операции выборки в виде

сети Петри.

Выявлением и устранением системных тупиков и конфликтов при использовании разделенных информационных ресурсов БД осуществляются методам анализа и исследования дерева достижимости сетей Петри.

Пусть О = <\\ Т> - граф дерева достижимости для заданной сети Петри С, моделирующей процесс обслуживания множества транзакций; где V = {V,; 1= 171} - множество вершин дерева, V; - вершина ¡-ой маркировки сети; Т = ¿=1,1} - множество дуг, помеченных активными в данный момент времени переходами Граф в = <У, Т> описывается следующими известными характеристиками: п=1,М}, - множество путей, ведущих

из корневой вершины У0 в терминальные вершины V,, где ^ - п-й путь, состоящий из последовательности дуг ^ , ^...Л} активных переходов;

Ь={1„; п=1,Ь'} - множество длин путей, определяемых суммированием количества входящих в них дуг, где 1п - длина п-ого пути. Каждая транзакция, моделируемая в виде сети Петри, описывается и определяется следующими характеристиками: ук - число переходов к-ой транзакции; сок -частота реализации к-ой транзакции. Тогда, необходимым условием завершенности выполнения множества транзакций (запросов), при котором исключаются системные тупики и конфликты в использовании ими разделяемых ресурсов РСОИ, является наличие на графе в = <У,Т> таких путей длины которых равны величине:

1„ = X ук.сок, е Б, где к-индекс транзакции.

Данное утверждение вытекает из свойства га - безопасности моделей множества транзакций(запроса). Из данного свойства следует, что при последовательной реализации переходов отдельного к-ой транзакции, переход ^ еТ\ £Т будет срабатывать ровно со раз, т.е. 1„ = сок.ук. Следовательно, при последовательной реализации К транзакций (запросов) условием завершенности их выполнения ест наличие на графе достижимости в = <У,Т> путей длины:

1п=а>1 -У1 + со2 -У2 +• ■ •+•••+ ©ы -Ты + сок ,ук = £ е>к -Ук.

Сформулированное утверждение может быть использовано для выявления и устранения непротиворечивости и несогласованности хранимых данных, за счёт исследования моделей смен маркировок для каждой основной операции.

В четвертой, главе приведена стратегия описания структуры построения моделей транзакционных серверов, упрощающих доступ к страницам данных, за счёт абстрагирования базовых операций над данными, на основе концепции транзакции. Разработаны две

иерархически зависимые модели транзакционных серверов обслуживании и исследования транзакций.

Стратегия описания структуры и онтологического построения моделей транзакционных серверов включает:

1. Определение элементарных операций являющихся неделимыми, атомарными и изолированными от других операций, выполняемых над данными;

2. Формирование последовательности элементарных операций над данными, обеспечивающих свойства атомарности, согласованности, изолированности и долговечности;

3. Образование расписаний транзакций, как абстрактного понятия параллельного выполнения набора частичного порядка элементарных операций, за счёт формирования ряда познаваемых индивидуальных транзакций;

4. Выбор из синтаксических корректных расписаний тех, которые удовлетворяют атомарности, согласованности, изолированности и долговечности свойства;

5. Разработка протоколов создания корректных расписаний, которые по вызовам прикладных программ запускают и выполняют операции динамически.

Сервер данных представим в виде конечного множества D - {х, у, z, неделимых и идентифицируемых элементов с неделимыми операциями чтения и записи. Отношение полного порядка определяется моделью страницы транзакции в виде конечной последовательности действий типа г(х) или w(x): t -р,р2...рп, где л < со ; pä € (г(х), w(x)}; 1 < i < и; х е D\ х -элемент (с индексом и без него) из D; г: • операция чтение, а ж - операция записи. Данная формализация определяет некую семантику для отдельной транзакции, такой, что две разные транзакции имеют разные шаги но, возможные одни и те же типы шагов. Семантическая интерпретация транзакции на уровне модели страницы базируется на г(х) и w(x) операции.

Если Pj = х{х), то j-й шаг данной транзакции является чтением, текущее значение элемента х получает значение Vj: Vy= х. Если py=w(x), то j-й шаг данной транзакции является записью, текущее значение элемента х зависит от сочетания значений vjr, прочитанных до шаг/ х: = f/vji, vj2 ,—,vjij, где х: возвращаемое значение такое, что {y}i,yj2,...,vjb) = {Jr\Pjr> шаг чтение и jrp j. Все значения vj„ 1 < i < к , считанные до j-го шага транзакции t используются, как параметры в функции^.

Определим модель страницы транзакционных серверов: t = (Q, р ), где П конечное множество шагов вида х(х) или w(x)}, х е D, и pQQx Q есть отношение частичного порядка на множестве Q., такое что, если {р, q) £ Ü, где pnq имеют доступ к одному и тому же элементу данных и хотя бы одна из этих двух операций является операцией записи, тор р q V qpp.

Формализация модели объекта транзакции проводится следующем образом: транзакция f - конечное дерево помеченных вершин со следующими характеристиками:

• идентификацией транзакции, как метки корневого вершины дерева;

• именами и параметрами операций, как метки внутренних вершин;

• моделью страницы, как метки конечных вершин (листьев);

• отношением частичного порядка "р" на множестве С1 конечных вершин , такое что, для всех конечных вершин операции р и q, где р имеет вид w(x) и q имеет вид т(х) или w(x), или наоборот, т.е.рр qpp.

На рисунке 5 представлены структуры декомпозиции двух транзакций в виде дерева по модели объекта. Для изучения и исследования множественных транзакций, выполняемых параллельно, постановка задачи должна формироваться объединением вовлеченных операционных деревьев транзакций в «лес» транзакций - и просмотра частичного порядка выполнения операций конечных вершин и неявно полученного частичного порядка выполнения относительно высокоуровневых операций. Частичный

порядок выполнения операций определяется объединением конечных

вершин всех вызванных деревьев. а

Рисунок 5. Пример слияния и декомпозиции двух транзакций по модели объекта транзакционного сервера

Абстрактное основание данных моделей может использоваться для получения конкретных алгоритмов исследования параллельной обработки сложных конкурентных транзакций и фактически жизнеспособных, ориентированных системных решений.

В заключении формулируются основные и практические результаты, выполненные в диссертационной работе исследований.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

В рамках диссертационной работы проведено исследование и получено решение технической задачи разработки методов, алгоритмов и моделей улучшения управляемости выполнения транзакций в РСОИ.

Основные результаты работы:

1. Метод обнаружения потенциальных конфликтных ситуаций по функциональной структуре РБД в РСОИ.

2. Модель выбора допустимых путей выполнения транзакций на базе основных типов операций над данными для разрешения несогласованности реализаций транзакций.

3. Модели исследования множества транзакций, вовлеченных в процесс обработки и улучшения управляемости выполнения множества транзакций.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ: Публикации в изданиях, рекомендованные ВАК России:

1. Ндикумагенге Ж. Вычислительные модели параллельных транзакционных серверов [Текст] / Ж. Ндикумагенге // Информационно-управляющие системы; № 1.(44). 2010. — С. 25-29 Другие публикации, статьи и материалы конференции:

2. Ндикз'магенге Ж. Разработка методов и моделей управления транзакциями и параллельными вычислителями в распределенных системах баз данных [Текст] / Ж. Ндикумагенге // Сборник докладов, студентов, аспирантов и молодых ученых. Санкт Петербург, 27 января - 8 февраля 2009 г. 290 с,. С. 138-143

3. Ндикумагенге Ж. Методика проектирования многопользовательских баз данных для задач учебного процесса [Текст] // Современное образование: содержание, технологии, качество. ХУ Международная конференция, Санкт-Петербург, 2 апреля 2009. -СПб, 2009 . - Том 1. - С.229 - 230

4. Ндикумагенге Ж. Метод балансировки данных в распределенных системах баз данных для задач учебного процесса [Текст] / Ж. Ндикумагенге // Современное образование: содержание, технологии, качество. ХУ1 Международная конференция, Санкт-Петербург, 2122 Апреля 2010г..- Том 2, - С. 208

Подписано в печать 23.11.2010. Формат 60x84/16 Отпечатано с готового оригинал-макета в типографии ЗАО «КопиСервис». Печать ризографическая. Заказ № 2/1123. П. д. 1.0. Уч.-изд. л. 1.0. Тираж 100 экз.

ЗАО «КопиСервис» Адрес: 197376, Санкт-Петербург, ул. Проф. Попова, д. 3. тел.: (812) 327 5098

Оглавление автор диссертации — кандидата технических наук Ндикумагенге Жереми

ВВЕДЕНИЕ.

ГЛАВА 1. АНАЛИЗ СТРУКТУРНЫХ ХАРАКТЕРИСТИК РАСПРЕДЕЛЕННЫХ СИСТЕМ ОБРАБОТКИ ИНФОРМАЦИИ И ПРОБЛЕМ УПРАВЛЕНИЯ ВЫПОЛНЕНИЕМ

ТРАНЗАКЦИЙ В РАСПРЕДЕЛЕННЫХ БАЗАХ ДАННЫХ.

1.1 .Предметная область.

1.1.1 .Распределенная система.

1.1.2.Распределенная система обработки информации.

1.1.3 .Система распределенных баз данных.

1.2.Общая характеристика распределенной системы обработки информации.

1.2.1 .Описание распределенной системы обработки информации.

1.2.2.Структура распределенной системы обработки информации.

1.2.3 .Характеристика распределенной системы обработки информации.

1.2.4.Классификация распределенной системы обработки информации.

1.3.Проблемы и задачи управления процессами, возникающими при выполнении и обслуживании распределенной системы обработки информации.

1.3.1.Общая характеристика событий, возникающих при эксплуатации распределенной системы обработки информации.

1.3.2.Структура транзакций в распределенной системы обработки информации.

1.3.3.Общая характеристика проблем управления выполнением транзакций в распределенной системы обработки информации.

1.3.4.Классификация проблем управления выполнением транзакций

1.3.6.Постановка задачи.

1.4.0сновные результаты по главе 1.

ГЛАВА.2.РАЗРАБОТКА МЕТОДА И МОДЕЛИ ВЫЯВЛЕНИЯ КОНФЛИКТОВ В РАСПРЕДЕЛЕННОЙ БАЗЕ ДАННЫХ

2.1 .Средства и методы обработки и управления выполнением транзакций в РБД РСОИ.

2.1.1.Методы и модели управлением выполнением транзакций современными системами управления базами данных.л.

2.1.2,Обработка и оптимизация запросов.

2.1.3.Управление одновременным!доступом.

2.1.4.Управление выполнением транзакций методами блокировок.

2.1 ^.Распределенная и параллельная обработка запросов.

2.1.6.Распределенная и параллельная обработка транзакций.

2.2.Разработка моделей анализа процессов разработки, обработки и выполнения транзакций в РБД.

2.2.1.Инс1ументарные средства СУРБД управления транзакциями.

2.2.2.Анализ процессов обработки и обслуживания транзакций методами исследования сетей Петри.

2.3.Модели выявления конфликтных ситуаций на стадии разработки СРБД.

2.3.1.Модели разработки отказоустойчивой многоуровневой СРБД с учетом иерархии и подчиненности компонентов.

2.3.2.Модели анализа и исследования процессов разработки, оптимизации обработки и управления выполнением транзакций.

2.3.3.Разработка алгоритмических методов анализа процессов выполнения и обслуживания транзакций в РБД.

2.4.Основные результаты по главе 2.

ГЛАВА 3. РАЗРАБОТКА МОДЕЛИ ВЫБОРА ДОПУСТИМЫХ ПУТЕЙ ВЫПОЛНЕНИЯ ТРАНЗАКЦИЙ ДЛЯ УЛУЧШЕНИЯ УПРАВЛЯЕМОСТИ ИХ ВЫПОЛНЕНИЯ В РАСПРЕДЕЛЕННЫХ СИСТЕМАХ ОБРАБОТКИ ИНФОРМАЦИИ.

3.1.Роль теории и системы массового обслуживания в управление выполнением транзакций в РСОИ.

3.2.Разработка методов и моделей улучшения управляемости выполнением и обработки транзакций в распределенных системах обработки информации.

3.2.1. Разработка концептуальных моделей обслуживания транзакций.

3.2.2.Разработка моделей выполнения транзакций на языке сетей Петри.

3.2.3.Разработка моделей анализа и обслуживания транзакций на зыке сетей Петри.

3.3. Разработка методов и моделей анализа процессов обслуживания и оптимизации обработки транзакций.

ЗАОсновные результаты по главе 3.

ГЛАВА 4. РАЗРАБОТКА МЕТОДОВ И МОДЕЛЕЙ ИССЛЕДОВАНИЯ МНОЖЕСТВА ТРАНЗАКЦИЙ.

4.1.Средства исследования обработки и диспетчеризации распределенных и параллельных транзакций в СРБД.

4.2.Разработка алгоритмических методов обеспечения АСИД свойств

4.2.1.Методы обеспечения сериализации множества транзакций.

4.2.2.Исследование методов обеспечения атомарности транзакций.

4.3.Концептуальные модели транзакции.ИЗ

4.4.Разработка методов и моделей исследования транзакционных серверов.

4.4.1.Онтологическое основание модели страницы транзакционных серверов.

4.2.2.Модель объекта транзакционных серверов.

4.3.Основные результаты по главе 4.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.

Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Ндикумагенге Жереми

Системы распределенных баз данных, как основный компонент распределенной системы обработки информации играют важную роль в развитии современной экономики и бизнеса. Обеспечение интенсивной' динамичности выполнения ' процессов таких систем - одна из самых трудоемких проблем эффективной реализации бизнес процессов при эксплуатации банков данных. Создание надежных, отказоустойчивых и эффективных средств обслуживания и управления требует наличия высококвалифицированных специалистов, больших финансовых и временных затрат, как для проектирования, разработки и развертывания, так и для сопровождения, эксплуатации* и администрирования. Управление выполнением распределенных и параллельных вычислительных процессов, определенных на стадии детальной разработки средств сопровождения и эксплуатации распределенной системы обработки информации в целом и их оптимизация в частности, всегда было и остается сложной и актуальной задачей.

Качественная оценка свойств распределенной системы обработки информации и прогнозирование динамического поведения вычислительных процессов, бизнес-процессов и потоков данных на этапах детальной разработки логики обслуживания и эксплуатации с учетом, по возможности их физической реализации, существенно и значительно уменьшает вероятность, долю или частоту сбоев и, соответственно, банкротство информационных и финансово-банковских инфраструктур. Полученные навыки, изобретения и достижения, нуждаются не только в усовершенствовании, но и во внедрении и создании новых методов и моделей, то есть новых технологий разработки средств сопровождения, администрирования, управления и исследования. Своевременное обнаружение, фиксация и устранение конфликтных ситуаций и противоречий данных, способных выводить системы из строя с наименьшими финансовыми и временными затратами является одной из важных характеристик управляемости и полезности системы распределенных баз данных разного рода и назначения. Проблемы обслуживания и обеспечения работоспособности распределенных систем обработки информации (РСОИ), основанных на концепции распределенной системы баз данных (РБД), являются в настоящее время объектом все возрастающего интереса широкого круга специалистов в области обработки данных.

В связи с этими важным является создание и разработка методов и моделей управления выполнением транзакций, позволяющих системным администраторам отслеживать динамику обработки процессов, контролировать работоспособность системы и устранять сбои, которые могут возникать. Реализация процедур обслуживания должна предоставлять возможность конфигурации системы по нуждам и требованиям пользователей за счёт составления и генерации алгоритмов (протоколов) выполнения действий для: решения конкретных задач в пределах поставленных целей. Поэтому, данное диссертационное исследование посвящено решению задачи разработки методов и моделей повышения управляемости обслуживанием и выполнением транзакций в РСОИ, на базе расширения результатов исследований современных ученых, таких как Кульба В.В., Ковалевский С.С., Косяченко С.А., Советов Б.Я., Чертовской В.Д., П.Чардин., G.Weikum., G.Vossen., P.A. Bernstein и др.

Объектом исследования является система распределенных баз данных, как основной компонент распределенной системе обработки данных.

Предметом исследования является средства обработки и обслуживания транзакций распределенных баз данных, предназначенные для повышения управляемости выполнением процессов в распределенной системы обработки информации.

Цель диссертационной работы заключается в разработке метода, алгоритмов и моделей управления выполнением транзакций, обеспечивающих анализ, обработку, исследование, прогнозирование поведения и обслуживание транзакций РСОИ на базе аппарата сетей Петри и примитивов управления транзакциями СУБД.

Задачи исследования.

Для достижения поставленной цели необходимо решить следующие задачи исследования:

1. Анализ структурных характеристик распределенных систем обработки информации и проблем управления выполнением транзакций в распределенных базах данных.

2. Разработка метода и модели выявления конфликтов в распределенной базе данных.

3. Разработка методов и моделей улучшения управляемости выполнения транзакций в распределенных системах обработки информации.

4. Разработка методов и моделей исследования множества транзакций

Методологическое и теоретическое исследования.

При решении основных задач диссертационной работы использовались типовые иерархические, сетевые, клиент-серверные и многоуровневые архитектуры; методы балансировки и ротации древовидных структур, функции управления объектами СУРБД SQL Server 2000; элементы теории графов сетей Петри с их методами анализа и исследования, конечные автоматы, имитационное моделирование, теория систем массового обслуживания.

Научная новизна работы.

В диссертационной работе получены и предложены следующие научные результаты :

1. Разработанный метод обнаружения конфликтных ситуаций с учетом структуры РБД на основе методологии имитационного моделирования, отличается от существующих тем, что позволяет априори выявить и предсказать поведение транзакций.

2. Разработанная модель выбора допустимых путей выполнения транзакций отличается от известных использованием методов и математических моделей аппарата сетей Петри.

3. Предложенные модели исследования множества транзакций и улучшения управляемости выполнения множества- транзакций, отличаются от известных использованием математической теории; отношений над бинарным множеством примитивов операций.

Основные научные положения, выносимые на защиту.

1. Метод обнаружения потенциальных конфликтных ситуаций по функциональной структуре РБД в РСОИ.

2. Модель выбора допустимых путей выполнения транзакций на базе основных типов операций над данными для разрешения несогласованности реализаций транзакций.

3. Модели исследования множества транзакций, вовлеченных в процесс обработки и улучшения управляемости выполнения множества транзакций.

Достоверность научных результатов и выводов результатов исследований, полученных автором диссертации, подтверждается корректностью использования математических аппаратов теории сетей Петри и графов, теории конечных автоматов, теории систем ' массового обслуживания, функций управления объектами СУРБД.

Теоретическая значимость работы.

Научная значимость заключается:

•в разработке и обосновании теоретической основы прогнозирования функционального поведения вычислительных процессов РСОИ за счёт использования современного математического аппарата;

•в развитии теории слияния и декомпозиции транзакций в виде деревьев по слоевой архитектуре серверов транзакций и теоретических методов оптимизации исследования транзакций, вовлеченных в обработку в транзакционных серверах.

Практическая ценность работы заключается в том, что результаты экспериментальных и теоретических исследований существования противоречий хранимых данных, функциональных конфликтов и обслуживания транзакций и запросов в распределенных системах обработки информации могут быть использованы для:

• своевременного предсказания системными администраторами конфликтных ситуаций при эксплуатации и обслуживании системы;

• декомпозиции, разбиения, слияния и отслеживания транзакций с целью оптимизации их выполнения и обработки;

• многоуровневого отображения сложных транзакций с целью упрощения их функциональной и структурной сложности для детального анализа и исследования;

• обслуживания множества транзакций и запросов в РБД.

Теоретические и практические результаты исследований внедрены в курсе моделирования процессов систем реального времени и реализованы в виде ряда программных схем на различных продуктов инструментальных средств разработки, таких как, Visual Paradigm. Данные программные схемы используются для развертывания информационных управленческих систем и в качестве модулей системы анализа и исследования в системах поддержки принятия решений.

Апробация результатов работы.

Основные положения и результаты диссертации докладывались и обсуждались на двух международных конференциях и научно-технических конференциях профессорско-преподавательского состава СПбГЭТУ «ЛЭТИ» в 2007-2010 гг.

Внедрение и реализация результатов.

Полученные результаты исследований использованы в курсе «Управление данными» и реализованы в виде ряд программных схем на различных инструментальных средствах проектирования и разработки, таких как, Visual Paradigm. Данные программные схемы используются для развертывания информационных управленческих систем разных сфер применения и назначения.

Публикации.

Основные теоретические и практические результаты диссертации опубликованы в 4 научных работах, из них - 2 статьи, среди которых 1 публикация в ведущих рецензируемых изданиях, рекомендованных в действующем перечне ВАК, 2 работы в материалах международных и всероссийских научно-технических конференций.

Структура и объем работы.

Диссертация состоит из введения, четырех глав с выводами и заключения. Она изложена на 131 страницах машинописного текста, включает 37 рисунков, 4 таблиц и содержит список литератур из 67 наименований, среди которых 51 отечественных и 16 иностранных авторов.

Заключение диссертация на тему "Метод и модели управления транзакциями в распределенных системах обработки информации"

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

Целью исследования являлось разработка методов и моделей управления выполнением и обработкой транзакций, обеспечивающих анализ, обработку, исследование и оптимизацию распределенных и параллельных транзакций, их разбиение на элементарные единицы работы и диспетчеризацию полученных процессов за счёт обращение к средствам СУБД. На основании полученных методов и моделей нужно создать способы разработки, обработки, обслуживания и управления которые, помимо протоколов конфигурации, генерации и диспетчеризации транзакций, станут рекомендации по улучшению качества обслуживания и администрирования распределенной системы обработки информации в целом, и повышению функциональной эффективности системы. Для достижения поставленной цели исследования было выполнено:

1. Проведена и предложена математическая теория оценки функционального поведения и работоспособности системы обработки, отличающаяся от существующие тем, что по всему жизненному циклу функциональные характеристики системы обработки выводятся из сводимого к ней пространственных состояний класса сетей Петри, описываемыми строгими математическими законами и формулами.

2. Разработаны метод и алгоритмы обнаружения и устранения потенциальных конфликтных ситуаций на ранние стаде разработки архитектуры и структуры РБД на основе имитационного моделирования, отличающиеся от существующих тем, что предложенные методы позволяют до завершения детального разработки и развертывания выявить и предсказать аномалия функционального поведения системы и своевременно обеспечить корректировку функциональной архитектурной структуры работы системы, за счет применения прикладной теории и методы принятий решений.

3. Разработаны алгоритмы и модели правил выбор путей выполнения и обработки вычислительных процессов РБД, отличающиеся от существующих тем, что функциональная работоспособность системы утверждается применением методов и математических моделей анализа и исследования аппарата сетей Петри.

4. Разработаны модели генерации, запуска, сформирования, диспетчеризации, обработки и исследования вычислительных процессов транзакционных серверов для оптимизации выполнения и обработки пакетно-параллельных транзакций, отличающиеся от тем, что все оперативных вычислительных процессов над данными РБД (ресурсами РБД), находящихся в оперативной.памяти и или в внешних запоминающих устройствах абстрагируется концепцией математического раздела бинарного отношения на множество двух единичных примитивных элементарных неделимых операций —запись и чтение на базе, которых разбиваются и/или слияются по всей слоевой многоуровневой архитектуре транзакционных серверов базовые модели транзакций в виде древовидной классической структуры для упрощения изучения, исследования и администрирования множества транзакций.

В диссертационной работе поставлены и решены задачи повышения эффективности выполнения процессов РБД. Предложены методы управления сопровождением и развитием РБД на этапе их эксплуатации и администрирования, обеспечивающие решение задач различного рода конфликтов и противоречий при работе с РБД и обеспечения согласованного использования общих информационных ресурсов. Достоверность научных результатов и выводов результатов исследования, полученных автором диссертации, подтверждена строгостью применяемых математических методов и теоретических научных положений. Выдвинутые положения представляет научный и практический интерес для инженеров и научных работников, специализирующихся в области проектирования и управления РСОИ, разработчиков и системных администраторов корпоративных информационных систем, а также студентов вузов информационных и управленческих технических специальностей.

Библиография Ндикумагенге Жереми, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Агибалов Г .П., Беляев В.А. Технология решения комбинаторно-логических задач методом сокращенного обхода дерева поиска. Томск : изд. Том. Уни. 1981г., 125 с.

2. Берзтис А.Т. Структуры данных: пер. с англ. М.: Статистика, 1974г.,408 с.

3. Голицына О.Л., Максимов Н.В., Попов И.И. Базы данных . Уч. пособие. М.: ФОРУМ: ИНФРА- М, 2009г. , 400 с. (Профессиональное образование).

4. Гордеев A.B., Малчанов А.Ю. Системное программное обеспечение. Спб.: Питер, 2003г., 736 с.

5. Дейт К.Д. Введение в системы баз данных: пер. с англ. М.-СПб.-К.: "Вильяме", 2005г.

6. Дейт К.Д. Введение в системы баз данных: пер. с англ.:6-е изд. М.-СПб.-К.: "Вильяме", 2000г.

7. Кармайкл Э., Хейвуд Д. Быстрая и качественная разработка программного обеспечения: пер. с англ., 3-е изд., М.: издательский дом "Вильяме", 2003 г., 400 с.

8. Королев Л.Н., Миков А.И., Информатика. Введение в компьютерные науки, М.: высшая школа, 2003,431 с.

9. Котов В. Е., Васильев В.В., Кузьмук В.В., Сети Петри. М.: "Наука", 1984г., 160 с.

10. Крёнке Д. Теориа и практика построения Баз Данных: пер. с англ. 8-е изд., Спб.: Питер, 2003г., 800 с.

11. Кристофидес Н. Теория графов: алгоритмический подход: пер. с англ. М.: Мир, 1978г., 432 с.

12. Кульба В.В., Ковалевский С.С., Косяченко С.А. Теоретические основы проектирования оптимальных структур распределенных баз данных.

13. Серия "Информатизация России на пороге XXI В.". М.: СИНТЕГ, 1999 г., 660 с.

14. Куроуз Д.Ф., Росс К. В.Компьютерные сети: многоуровневая архитектура интернета: пер. с англ., 2-е изд. СПб.: Питер, 2004г., 765 с.

15. Ларман К. Применение ЦМЬ и шаблонов проектирования: пер. с англ.,3-е изд., М.: ООО "И.Д. Вильяме", 2007 г., 736 с.

16. Майника Э. Алгоритмы оптимизации на сетях и графах: пер. с англ. М.: Мир, 1981г., 323 с.

17. Мамиконов А.Г., Деметрович Я., Кульба В.В., и др. Использование сетей Петри при проектировании систем обработки данных. М.: Наука, 1988г., 103 с.

18. Мамиконов А.Г., Кульба В.В. Синтез оптимальных модульных систем обработки данных. М.: Наука, 1986г., 275с.

19. Мамиконов А.Г., Кульба В.В., Косяченко С.А., И.А.Ужастов. Оптимизация структур распределенных баз данных в АСУ. М.: "Наука", 1986. 275с.

20. Мартин Д. Вычислительные сети и распределенная обработка данных.Программное обеспечение, методы и архитектура Пер.с англ., В.С Штаркмана. -Вып. 1. —М.Финансы и статистика, 1985.

21. Мартин Д. Вычислительные сети и распределенная обработка данных.Программное обеспечение, методы и архитектура Пер.с англ., В.С Штаркмана. -Вып. 1. -М.Финансы и статистика, 1986.

22. Мартин Д. Вычислительные сети и распределенная обработка данных.Программное обеспечение, методы и архитектура Пер.с англ., В.С Штаркмана. -Вып. 1. —М.Финансы и статистика, 1985.

23. Мартин Д. Организация баз данных в вычислительных системах Пер.с англ., Стогния а. а., Щёрса А. Л., -Вып. 2. -М.:Финансы и статистика, 1980.

24. Мелихов А.М. Ориентированные графи и конечные автоматы. М.: Наука, 1971г., 416 с.

25. Нейбург Э. ДЖ., Максимчук Р. А., Проектирование баз данных с помащью UML: пер. с англ., изд."Вильямс", М., 2002г., ххх с.

26. Олифер В.Г., Олифер H.A. Компьютерные сети: принципы, технологии, протоколы., Спб.: Питер, 2001г., 672 с.

27. Орама Э., Уилсона Г. Идеальный код: пер. с англ., -Спб.: Питер, 2009 г., 624с.

28. Петров В.Н. Информационные системы. 2003г., Спб.: Питер, 2003г., 688 с.

29. Питерсон Дж. Теория сетей Петри и моделирование систем: пер. с англ., М.: Мир, 1984 г., 264с.

30. Риордан Р. М. Программирование в SQL Server 2000, Шаг за шаг: пер. с англ., М.: 2002г, 608 с.

31. Роб П., Корнел К. Системы баз данных: проектирование, реализациия и управление: пер. с англ., Спб.: Питер, изд. "БХВ" , 2004г., 880 с.

32. Советов Б. Я., Цехановский В. В., Чертовской В. Д., Базы данных Теория и практика. -М.: Высш., 2005. 463 е.: ил.

33. Таненбаум Э., ван СТЕЕН М. Распределенные системы Принцип и парадигмы: пер. с англ., Изд. "Питер", 2003г., 877с.

34. Тиори Т., Фрай ДЖ. Проектирование структуры базы данных; М.: изд. "Мир", 1985г., 287с., Т1.

35. Тиори Т., Фрай ДЖ. Проектирование структуры базы данных; М.: изд. " Мир ", 1985г., 320 е., Т2.

36. Топп У., Форд У. Структуры данных в С++: пер. с англ., М.: ООО "Бином-Пресс", 2006 г., 816 с.

37. Уилсон Р. Введение в теорию графов: пер. с англ. М.: Мир, 1977г.

38. Хассан Г. Проектирование систем реального времени, параллельных и распределенных приложений: пер. с англ., М.:ДМК Пресс, 2002 г., 704с.

39. Хокперофт Д.Ж., Ульман Д. Дж., Ахо. В. А. Структуры данных и алгоритмы: пер. с англ., Издательский дом ."Вильяме", М., 2003г., 384 с.

40. Хусаинов Б.С. Структуры и алгоритмы обработки данных . Примеры на языке Си : Уч. пособие. Финансы и статистика, 2004 г., 464 с.

41. Чардин П., Многоверсионность данных и управление параллельными транзакциями., Открытые системы., 2005. N1.

42. Черемных C.B., Семенов И.О., Ручкин B.C. Моделирование и анализ ситсем. IDEF-технологии: практикум. М.: Финансы и статистика, 2005г., 192 с.

43. Cerf V., Fernandez Е., Gostelow К., Volansky S., Formal Control Flow Properties of a Model of Computation, Report ENG-7178, Computer Science Department, University of California , Los Angeles, California, December 1971, pp. 81.

44. Date C.J. An introduction to Data Base Systems, 8th Edition, 2004, 1024 p.

45. Guerrero F.G., Rojas C.E. Microsoft SQL Server 2000 Programming by exemple, 2001, 704 p.

46. Holt A., Commoner F., Events and Conditions, Applied Data Research, New York, 1970; Record of the Project MAC Conference on Concurrent Systems and Parallel Computation, New York: ACM, 1970, p. 1-52.

47. Holt A., Saint H., Shapiro R., Warshall S., Final Report of the Information System Theory Project, Technical Report RADC-TR-68-305, Rome Air Development Center, Griffiss Air Force Base, New York, 1988, pp. 352.

48. Horton I. Ivor Horton's Beginning Java 2, JDK, 5 Edition,2005, 1501 p.

49. Kriegel E. Microsoft SQL Server 2000 weekend crash course, 2001, 409 p.

50. Misunas D., Petri nets and Speed Independent Design, Communications of the ACM,16, No. 8,1973, p. 474-481.

51. Murata T., Church R., Analysis of Marked Graphs, IEEE Transactions on Circuits and Systems,CAS-24, No. 7, 1977, p. 400-405.

52. Peterson L., Computation Sequence sets, Journal of Computer and System Sciences, 1, No. 1 August, p. 1-24.

53. Philip В., Newcomer E. Principles of Transactions processing for the systems professional; Morgan Kaufmann Publishers, Inc. San Francisco, California, 1997., 357 p.

54. Rahayu J. W., Taniar, D., Perdede E. Object -orientd Oracle. IRM. Press., Idea Group Inc., Hershey , USA., 2006, 345 p.

55. Richard H. C., Khuo-Chung T. Modem multithreading.Wiley interscience. A John Wiley&Sons, Inc., Publication, 2006, 481 p.

56. Weikum G., Vossen G. Transactional information systems, theory, , algorithms and practice of concurrency control' and, recovery. Kaufmann

57. Ндикумагенге Ж. Вычислительные модели параллельных транзакционных серверов Текст. / Ж. Ндикумагенге // Информационно-управляющие системы, № 1.(44). 2010. С. 25-29

58. Ндикумангенге Ж. Методика проектирования многопользовательских баз данных для задач учебного процесса Текст. / Ж. Ндикумагенге //