автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Модели и алгоритмы распределения реплицированных баз данных в информационных системах

кандидата технических наук
Кухарев, Вадим Николаевич
город
Новочеркасск
год
2007
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Модели и алгоритмы распределения реплицированных баз данных в информационных системах»

Автореферат диссертации по теме "Модели и алгоритмы распределения реплицированных баз данных в информационных системах"

На правах рукописи

Кухарев Вадим Николаевич

МОДЕЛИ И АЛГОРИТМЫ РАСПРЕДЕЛЕНИЯ РЕПЛИЦИРОВАННЫХ БАЗ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ

05.13 18 - "Математическое моделирование, численные методы и комплексы

программ"

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

□03064604

Новочеркасск - 2007

003064604

Работа выполнена на кафедре "Автоматизированные системы управления" государственного образовательного учреждения высшего профессионального образования "Южно-Российский государственный технический университет (Новочеркасский политехнический институт)"

Научные руководители

кандидат технических Haw, профессор Черноморов Г А

кандидат технических наук, доцент Сучков Г.В.

Официальные оппоненты доктор технических наук, профессор

Ковалев О.Ф.

кандидат технических наук, доцент Попов А Э

Ведущая организация. Южно-Российский региональный центр информатизации Южного федерального университета (г Ростов-на-Дону)

Защита диссертации состоится «28» сентября 2007 г в 10 часов на заседании диссертационного совета Д 212.304.02 при ГОУ ВПО "Южно-Российский государственный технический университет (Новочеркасский политехнический институт)" по адресу 346428, г Новочеркасск, Ростовской обл, ул. Просвещения, 132, (гл корпус, ауд 107)

С диссертацией можно ознакомиться в научно - технической библиотеке Южно-Российского государственного технического университета (Новочеркасского политехнического института). С текстом автореферата можно ознакомиться на сайте ЮРГТУ (НПИ) www npi-tu.ru

Автореферат разослан "18" августа 2007 г.

Ученый секретарь диссертационного совета канд техн наук, профессор

Иванченко А Н.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Моделирование современных информационных систем содержит задачу обеспечения качества обслуживания обработки запросов пользователей между различными компонентами системы Эта задача в числе ряда других проблем требует решения вопроса моделирования оптимальной схемы репликации баз данных, создавая, наряду с техническими ограничениями, требования к минимизации стоимости всей системы

Теоретической базой моделирования ИС являются работы ряда отечественных и зарубежных специалистов Среди отечественных к ним относятся работы Бржезов-ского А В, Вишневского В М, Воройского Ф С, Галахова И В., Гламаздина Б С, Новикова Д А, Цветкова А В, Зиндера Е 3, Клещева Н Т, Романова А А, Кузнецова Н А, Кульбы В В, Ковалевского С С, Косяченко С А, Тихоненко О М Среди зарубежных над данной тематикой работали Буч Г, Гейн К, Сарсон Т, Баркер Р, Лонг-ман Ц, Росс Т, Меллор, Гоуэн К, Марк Д, Йорден И и др

Эти работы создают методологическую базу разработки ИС на основе заданной предметной области и существующих в организации потоков данных При этом под моделью ИС понимается адекватная ей схема комплекса программно-технических средств, включающая схему потоков данных между компонентами системы Однако в настоящее время одним из ключевых факторов создания распределенных ИС в крупных организациях является разработка оптимальной модели репликационяой схемы распределенной базы данных. Технология репликации необходима для систем, использующихся в областях с высокими требованиями к гарантированной доставке, своевременности и целостности передаваемых данных, таких как системы международных безналичных банковских расчетов, системы обработки данных распределенных технологичзских процессов реального времени, биллинговые системы, а также для специализированных корпоративных систем

Использование технологии реплицированных баз данных предполагает дублирование данных в различных узлах сети для приближения их к месту активного использования, тем самым, сокращая трафик и повышая надежность и производительность системы в целом Это означает отказ от распределения данных и поддержку репликации, когда заданное хранимое отношение или заданный фрагмент могут быть представлены несколькими разными копиями (или репликами), хранимыми на разных узлах сети

Среди отечественных ученых работы по данной проблеме проводили Когалов-ский М Р, Филиппов В А, Цимбал А А, Аншина МЛ, Шрайберг Я Л, Мазов Н А, а среди зарубежных - Коннояли Т, Бегг К, Ролланд Ф, Спирли Э, Сголлингс В., Та-ненбаум Э, Стен М Ван, Шекхар Ш, Чаула С, Дейт К, Вальдерас П, Дидонета М, Стентона Дж, Туту С , Весмана М, Шипера А, Франка М, Червенак А, Кай М и др

Однако данная тематика до сих пор содержит множество нерешенных проблем, связанных с репликацией данных.

- отсутствие моделей распределения БД ИС, которые могли бы решить проблему разделения групп пользователей в рамках однородных потоков данных с учетом дифференцированных требований на скорость обслуживания,

- отсутствие методики оптимальной трансформации концептуальных моделей ИС при добавлении и удалении сервера с реплицированной БД,

- отсутствие алгоритмов распределения реплик БД и серверов для них в ИС, обеспечивающих заданное качество обслуживания запросов пользователей к репли-цированным БД при минимизации стоимости

Указанные проблемы, а также особенности учета качества обработки запросов пользователей в ИС, требующих обеспечения заданного времени обработки отдельных потоков, приводят к необходимости построения соответствующих моделей Таким образом, существует необходимость в развитии методов композиции и декомпозиции фрагментов ИС, которые бы позволяли учитывать дифференцированность требований пользователей к скорости обработки запросов в рамках однородных фрагментов, представляющих собой функционально взаимосвязанные множества клиентов, сервера и набора данных Для решения данной задачи, как основы выбора числа серверов с реплицированными БД и определения допустимых интенсивностей потоков запросов к ним, необходимо создание комплекса соответствующих моделей и оценка качества их функционирования

Таким образом, задача разработки моделей распределения реплик БД при моделировании ИС и эффективных алгоритмов их конструирования с учетом дифференцированных требований к скорости обработки различных запросов к реплицированным БД в условиях минимизации стоимости сетевого оборудования является актуальной

Диссертационная работа выполнялась в рамках федеральной целевой программы "Интеграция науки и высшего образования России на 2002-2006 годы", утвержденной постановлением Правительства РФ № 660 от 5 09 01, научно-технической программы "Научные исследования высшей школы по приоритетным направлениям науки и техники", а также в соответствии с научным направлением ЮжноРоссийского государственного технического университета (НПИ), раздел "Проблемы автоматизации обработки информации в тренажерно-обучакяцих, информационных и управляющих комплексах" по теме 7.05 «Разработка теоретических основ проектирования корпоративных информационных систем» (утверждено решениями ученого совета от 25 04 2001 и 15 05 2003)

Целью диссертационной работы является повышение эффективности функционирования ИС, включающих РБД, за счет разработки и использования математических моделей распределения реплик БД в ИС и алгоритмов построения данных моделей, позволяющих создавать РБД ИС с заданным временем обработки запросов к реплицированным данным

Для достижения этой цели в диссертационной работе решаются следующие задачи

- анализ процесса построения модели ИС с учетом моделирования РБД,

- создание аналитико-имитационных моделей для рационального распределения копий БД по узлам ИС с целью достижения заданного времени обращения пользователей к БД,

- определение временных характеристик РБД ИС на основе разработанных моделей,

- разработка алгоритма для распределения реплицированных БД в ИС,

- проведение апробаций и оценки эффективности разработанных моделей и алгоритмов на основе их программной реализации.

Методы исследований и достоверность результатов. Поставленные в диссертации задачи решаются на основе использования методов теории принятия решений, теории систем массового обслуживания, имитационного моделирования, методов исследования операций, а также методов теории вероятностей и генетических алгоритмов

Достоверность научных результатов и выводов, сформулированных в диссертации, подтверждается согласованием теоретических положений с результатами имитационных экспериментов, расхождение аналитических и имитационных данных не

превышало 7-10 %, адекватностью результатов моделирования реальным параметрам БД ИС, непротиворечивостью математических выкладок и преобразований

Предметом исследования являются модели распределения реплик баз данных в ИС и алгоритмы их конструирования, процесс влияния репликации БД на моделирование ИС

Научная новизна заключается в том, что сконструирована математическая модель распределения реплик БД в ИС, отражающая репликацио иную структуру РБД, отличающаяся от известных учетом роли серверов для реплицированной РБД, а также учетом наличия при создании структуры РБД территориально распределенных логически интегрированных клиентских и клиент-серверных множеств. Установлены аналитические зависимости выбора производительности серверов для реплицированных БД, отличающиеся от классических методов учетом законов поступления и обработки запросов, производительности серверов, полученной на основе международных тестов, наличием дифференцированных требований пользователей ко времени обработки запросов к реплицированным базам данных Разработан модифицированный генетический алгоритм распределения реплик БД в ИС, отличающийся учетом времени обработки запросов в логически интегрированных фрагментах ИС и особенностей построения реплицированной структуры РБД

Основные положения, выносимые на защиту:

1 Математическая модель распределения реплик БД в ИС, отражающая реп-ликационную структуру распределенной базы данных, позволяющая минимизировать затраты на создание информационной системы при рациональном размещении серверов с реплицированными данными.

2 Метод выбора сервера с реплицированной БД на основе данных по его производительности и требований пользователей ко времени обработки запросов,

3 Модифицированный генетический алгоритм распределения реплик БД и реплицированных серверов в ИС

Теоретическая ценность работы заключается в построении и исследовании концептуальных моделей распределения реплицированных БД в ИС и алгоритмов их конструирования с учетом требований по времени обработки запросов и стоимости систем, построении моделей композиции и декомпозиции фрагментов ИС

Практи«еская ценность работы состоит в возможности использования разработанных моделей и алгоритмов на разных этапах моделирования РБД ИС, а также для анализа процессов функционирования существующих ИС Данные модели и алгоритмы позволяют за счет модернизации структуры ИС повысить эффективность работы ИС в целом, что дает прямой экономический эффект

Разработанные модели и алгоритмы моделирования применены в процессе разработки РБД ИС в ФГНУ ВНИИ "Радуга" (г Коломна), перспективной системы документооборота ЮРГТУ (НПИ) и образовательного Интернет-портала профессиональной подготовки кадров Богословского алюминиевого завода Сибирско-уральской алюминиевой компании (г Краснотурьинск) Эти математические модели также используются в учебном процессе на кафедре «Автоматизированные системы управления» Южно-Российского государственного технического университета.

Апробация работы. Основные положения диссертации и отдельные ее результаты докладывались и получили одобрение на

• III международной научно-практической конференции "Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем" (Новочеркасск, 2003),

• научно-технической конференции студентов и аспирантов ЮРГТУ (НПИ) "Студенческая научная весна -2004", (Новочеркасск, 2004),

• IV всероссийской научно-практической конференции "Модернизация системы профессионального образования на основе регулируемого эволюционирования" (Челябинск, 2005),

• всероссийской научно-методической конференции "Открытое образование и информационные технологии", (Пенза, 2005),

• научно-технической конференции студентов и аспирантов ЮРГТУ (НПИ) "Студенческая научная весна -2005", (Новочеркасск, 2005);

• П международной Интернет-конференции "Информационные и коммуникационные технологии как инструмент повышения качества профессионального образования" (Екатеринбург, 2006),

• IV международной научно-практической конференции "Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем" (Новочеркасск, 2006)

Публикации. По результатам выполненных исследований опубликовано 30 научных работ, в том числе 2 свидетельства Роспатента об официальной регистрации баз данных и 3 свидетельства об официальной регистрации программ для ЭВМ

Структура диссертации. Работа состоит из введения, четырех глав, заключения, списка использованной литературы и приложений, содержащих основной код разработанного комплекса программ и акты о внедрении результатов диссертационной работы и содержит 159 страниц основного текста, 37 рисунков, 42 таблицы

В работе используются следующие сокращения и аббревиатуры ИС - информационная система, БД - база данных, РБД - распределенная база данных, СМО -система массового обслуживания, ГА - генетический алгоритм, G/G/1 - система массового обслуживания с произвольным законом распределения генерации и обработки запросов, FIFO - дисциплина очереди- первым пришел - первым обслужен

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность рассматриваемых задач, определена цель работы, рассмотрена структура работы, содержание основных разделов и основные положения, выносимые на защиту

В главе 1 "Анализ моделей и методов моделирования информационных систем и распределенных баз данных" приводится классификация современных методов моделирования ИС, методов репликации БД и рассматриваются понятия РБД. Также анализируются требования, предъявляемые к моделям и алгоритмам их создания

Рассматриваются различные варианты архитектур современных ИС - двухзвен-ная, трехзвенная и многозвенная На основе данных архитектур анализируются существующие модели ИС — объектная, структурная, концептуальная, а также модели ИС в новейших нотациях Анализируются организация обработки распределенных данных и принципы распределенного хранения информации Для рассмотрения преимуществ и недостатков создания РБД приведено описание технологии репликации данных

Приводятся синхронный и асинхронный способы репликации, их преимущества и недостатки, а также современные программные комплексы моделирования ИС Анализируются недостатки существующих методов моделирования ИС и формулируются требования к задаче моделирования ИС с учетом рационального размещения реплик данных Показано, что является актуальным решение задачи распределения реплици-

рованных БД на основе схемы расположения территориально распределенных интегрированных клиентских и клиент-серверных множеств Приведена обобщенная постановка задачи распределения реплик БД в ИС

В главе 2 ''Создание моделей распределения реплицированных баз данных" предлагается ряд моделей, детализирующих проблемы композиции и декомпозиции фрагментов ИС для установки в них серверов репликации с учетом индивидуальных потоков запросов пользователей, выбору рациональных параметров производительности серверов БД и дроблению потоков запросов к ним. Вводится ряд штрафных функций, позволяющих учесть дифференцированность требований пользователей к обработке данных, а также аддитивный и дифференцированный критерии дам оценки времени обработки запросов Данные критерии являются модифицированными аналогами времени пребывания заявки в системе Их преимуществом является комплексный дифференцированный учет качества обработки, который будет более точным, чем стандартный критерий среднего времени обработки запроса. Рассматриваются модели добавления нового сервера БД в систему и обратная ей задача удаления сервера из системы В качестве основной предлагается модель введения в систему дополнительного сервера для достижения заданного времени обработки запросов пользователей Рассматривается фрагмент ИС, содержащий множество клиентов = \,т, где дачиело клиентов в данном фрагменте системы Данный фрагмент представляется сетью массового обслуживания, приведенной на рис 1 Каждый из клиентов характеризуется своей интенсивностью запросов к серверу Xs,j = \,m Сервер-прибор Р обрабатывает заявки, которые поступают к нему с общей интенсивностью , через очередь В с дисциплиной обслуживания FIFO

Пщ*И4****пьныафряя—нт Фрмнмшт системы с Ммммш

системы с еЛним сервером сервере ауетрретшя

Прлоереввеенил системы

л,.'7*«,)

CZ

л» F.a.i

шн:

Ям

К ыкч

Рис 1 Добавление сервера с реплицированной БД Задача заключается в определении оценки качества функционирования данной сети и при необходимости ее разъединения на несколько подсетей с добавлением новых серверов В качестве функции оценки системы рассматривается среднее время обрабо- л запросов, размер очереди не ограничивается. Приводится аналитический метод решения для систем общего класса ОЛЗ/1 Среднее время между входными запросами составляет £(Д), дисперсия соответственно = Е((А{ - Е(А1)У ), акоэффи-

^"баз = дии Не*, Мао ^2)

циент вариации сл = аА Е(А,)~' Аналогично для сервера среднее время между обрабатываемыми запросами составляет £(£,), дисперсия <т| =£((5,-Е(В]))2), коэффициент вариации с^ = с^ Е(В,У' Коэффициент загрузки р = Е(В1) Е(А,у' <1 Среднее время в очереди составит IV, ^р (с\ +сД) Е(В1) (2 (1-р))"1 Исходя из среднего времени в очереди, среднее время в системе составит'

Ж = +£(£,) (I)

Для проверки адекватности представления модели обработки запросов к серверу БД как СМО, описываемой уравнением (1), при допущении, что время обработки запросов на уровне клиентов и сервера определяется на основе интенсивности поступления и обработки запросов, без ограничения на размер очереди, были рассмотрены наборы расчетного и экспериментального времени для сервера БД Интернет-Портала богословского алюминиевого завода Среднее расхождение расчетного и экспериментального времени обработки запросов составило 2,6%, что подтвердило адекватность моделирования Задача достижения допустимого времени обработки запросов сводится к решению неравенства

_£_ Е(В1) + Е(В,)<Таа

1 -р 2

Решая его, установим интенсивность запросов к базовому серверу на максимальном уровне (2% который бы обеспечивал заданное время обработки запроса-

Е(В,) (с\+с\) + 2 Гп„-2 Е(В,)

При этом коэффициенты вариации должны устанавливаться для каждого конкретного закона индивидуально, с соответствующей трансформацией уравнения На сервер с реплицированной БД перенаправляется оставшаяся часть потока запросов (в общем случае - разность исходной интенсивности Л и интенсивности, направляемой на базовый сервер Л^У = ^ С*-■*&>) Для практических задач можно считать, что всякий поток, образующийся из любых нескольких независимых ординарных потоков, является простейшим, причем интенсивности суммируются Соответственно разницу потоков (на основе свойства устойчивости) можно найти как - Л-Л^.

Найдем требуемую интенсивность обработки запросов (3) на сервере с реплицированной БД и установим ее на минимальном уровне (для экономической целесообразности), который бы обеспечивал заданное время обработки запроса

о <& +<4

Е(Вг)+Е{Вг)<Такг,

1 -р 2

_\ + Тяяг'Я^тт+^ + ТШ1г Л^У-2 Тшаг (2 Л^'-Л^ (с\ н^))

Мреая---^ V5/

При этом необходимо учесть время на синхронизацию данных как внутреннюю составляющую максимально допустимого времени обработки запросов Тта и Ттхг Можно отметить, что для конкретных законов генерации и обработки запросов, данные параметры трансформируются в более индивидуальные значения При этом для ряда законов (например, детерминированного и экспоненциального) эти зависимости имеют завершенный вид (поскольку их коэффициенты вариации равны соответственно 0 и 1), а для других являются промежуточными (необходимо индивидуально рассматривать каждый случай для каждого конкретного коэффициента вариации)

На основе данных соотношений, устанавливающих рациональные параметры дробления потока запросов и выбора производительности для сервера с реплициро-ванной БД в случае полной репликации, приводится алгоритм для варианта, когда БД состоит из элементарных реплик данных Для этого приведенные соотношения интегрируются в две модифицированные многомерные задачи о ранце, в которых предельные интенсивности являются значимостями предметов (реплик)

В главе рассматриваются основные законы распределения времени для генерации и обработки заявок - экспоненциальный, равномерный, детерминированный, их комбинации для множеств клиентов и серверов и модификации приведенных выше параметров для индивидуальных вариантов В процессе моделирования определяются ключевые характеристики систем, анализируется и подтверждается справедливость установленных аналитических зависимостей

В целом, непосредственная методика по выбору рационального сервера для ре-плицированной БД на основе данных по допустимому среднему времени ожидания обработки запросов при полной репликации включает следующие этапы

1 Разработчиком задается допустимое время обработки запроса Г„,х и Ттг д ля исходного и решшцированного серверов Разработчик также должен знать характеристики потока запросов, включая закон распределения и конкретный вклад отдельных клиентов в общую интенсивность

2 Определяется интенсивность Мая^чр обработки запросов на текущем сервере БД (в общем случае - величина, обратная среднему времени обработки одного запроса), при которой не происходит критической перегрузки соединений (на основе последовательного анализа динамично возрастающего потока запросов)

3 Определятся производительность базового сервера Р^с^р) определенная на основании тестов ТРС-С или Spec Java (тесты Spec Java (в частности, SPECjbb2005) предпочтительнее, поскольку ориентированы на анализ производительности на основе бизнес-операций)

4 Определяется требуемая интенсивность обработки на реплицированном сервере по приведенным формулам В общем случае можно использовать приведенную базовую формулу для системы G/G/1 для среднего времени обработки запросов, оставшаяся часть запросов =Fr(Я-А^«^) перенаправляется (путем соответствующей переадресации клиентских приложений) нареплицированный сервер БД

5 Определяется требуемая интенсивность обработки запросов на сервере с ре-плицированной БД (по формуле (3)).

6 Требуемая производительность реплицированного сервера устанавливается

раВНОИ ^рсцнсервера - ^репя сервер Мбах-сервер ^баз.мрвер

7 Анализируя производительности существующих серверов, для установки реплицированной БД выбирается тот, который характеризуется производительностью, не меньшей минимально допустимой

8 На каждый из серверов устанавливаются реплики БД Множество клиентских приложений дробится в соответствии с найденными интенсивностями и настраивается на обращение к выбранному серверу БД

В главе также приводится описание и структура разработанного программного комплекса, реализующего данные аналитико-имитационные модели Этот комплекс разработан применительно к условиям моделирования распределения серверов с реп-лицированными БД в ИС и реализован на базе сред Delphi, MS Access и GPSS

В главе 3 "Разработка алгоритма распределения реплицированных баз данных" предлагается новый метод распределения реплик данных и серверов с реп-лицированными данными в ИС Конструируется постановка задачи распределения реплик БД в ИС на основе математической модели, учитывающей начальное множество логически структурированных фрагментов ИС В качестве исходны* данных служат ф = {п>1. 'ГР,, ,гр<ц}> - множество элементарных реплик данные с индивидуаль-

ными размерами к = {»„ ,и„ ,ил), К8 = {К8У, ,КЗ„ ( = 1,2 - множество логиче-

ски интегрированных фрагментов клиент-серверной связки (с установленным сервером БД), характеризующиеся размерами предоставляемой памяти для размещения БД С®"!^"", .V®"™, индивидуальными интенсивности ми обращений поль-

зователей к элементарным репликам данных = {х^-1, Л'?', Д5"}> индивидуальными интенсивностями обработки запросов пользователей к элементным репликам данных на сервере цкз' = {и,*3'', .цЦ'}, и индивидуальными вероятностями мо-

дификации данных для одного запроса Р(КБ) - = 10Ь,

К = {К„ ,К1, 7 = 1,«/ - множество клиентов с неустановленным сервером БД,

характеризующиеся индивидуальными интенсивностями обращений пользователей к элементарным репликам данных л'-1 = ЛИь'}> где Л*'- интенсивность обра-

щений множества клиентов к, к реплике Л,, и индивидуальными вероятностями модификации данных для одного запроса = =

= (5",, ,5,}, / = 1,г - множество серверов уровня обслуживания (вакантные сервера БД, являющиеся фрагментами РБД), характеризующиеся индивидуальными интенсивностями обработки запросов пользователей к элементарным репликам данных ¡л' ~ (а,', где интенсивность обработки запроса на сервере к реплике Х}, и размерами доступной памяти для размещения БД 8и = ^и,, ,511,, ,51/,}, ( = 1^ - множество серверов уровня синтеза заявок (сервера БД, гарантирующие обработку любой транзакции и синхронизацию данных, являющиеся также издателями в схеме "издатель-подписчик", в равноправной схеме тиражирования эти сервера идентичны 5 серверам), характеризующиеся индивидуальными интенсивностями обработки запросов пользователей к элементарным репликам данных р' = {/¡¡, где ^ - интенсивность обработки запроса на сервере 5, к реплике А, и размерами предоставляемой памяти для размещения БД и ценой Сж ={с,ет, ,С?, ,с;и], где с® • стоимость вакантного сервера БД а = {а,}} - матрица взаимных соединений между фрагментами К,,1 = и ,г, а,} = 1 если фрагмент К1 подключен к фрагменту иначе аи = 0, р = {р, - матрица взаимных соединений между фрагментам]! АГ„/ = 1,с? и = 1,д; = 1 если фрагмент АГ, подключен к фрагменту Эи^ иначе Р, 1 = Ъ , <р = {Р, - матрица взаимных соединений между фрагментами К„г = 1,с1 и А3'/,у = 1,г, ¡ри = 1 если фрагмент К, подкшочен к фрагменту

иначе <р,} = 0 , а> = {ю,,} - матрица взаимных соединений между фрагментами ,г = 1,ги , у = 1, г, в>, у = 1 если фрагмент подключен к фрагменту , иначе

а>(у = 0 , у = } - матрица взаимных соединений между фрагментами К5,, > = 1, г и } = 1,9, у,, = 1 если фрагмент КЯ, подключен к фрагменту , иначе у, 1 = 0 , рз = - матрица пропускных способностей линий связи, отражающая сущест-

вующую топологию ИС, между узловыми фрагментами к, и ,»,./ = 1, ¡/ + г, /и, у -пропускные способностей линий связи между узловыми фрагментами к, и К,, I, ] = 1, с?, ,; - пропускные способностей линий связи между узловыми фрагментами К, и Х5У, 1 = \,с/^ = с1+\с1 + г, / - пропускные способностей линий связи между узловыми фрагментами КЗ, и кsJ, = + Г(АГ,,5у) = гз - среднее время обработки запроса фрагмента К,,1 = к фрагменту у = 1 ,г (соединение идентично подключению сервера БД к множеству клиентов, при этом в случае установки в общем случае необходимо заранее рассчитать производительность сервера для обеспечения заданного времени обработки запросов) Это время равно сумме времени обработки запроса на сервере (расчет производится на основе данных об индивидуальных законах распределения и интенсивностях генерации запросов и их обработки, согласно формулам теории СМО), и времени на распространение обновлений (в случае асинхронной репликации это время равно нулю) Если на сервере отсутствует реплика гр„ то последовательно рассчитывается множество времен обработки к серверам, на которых она размещена (с соответствующим перерасчетом интенсивностей обработки, аналогично представленным в главе 2 методам), и среди множества альтернатив выбирается сервер с наискорейшей обработкой запросов Время на распространение обновлений в общем случае рассчитывается на основе индивидуальных характеристик БД и зависит от топологии системы и характеристик линий связи 'оа, =тах у0&1( где - скорость передачи данных к ему серверу БД, У^, -

средний объем пересылаемых данных (это время зависит от выбранного способа распределенной синхронизации и поддержки данных в актуальном состоянии) При этом анализ топологии с целью расчета времени передачи производится на основе матриц взаимных соединений я', г и', /м , - среднее время обработки запроса фраг-

мента К„1 = 1,(1 к фрагменту = 1,д (соединение идентично подключению к множеству клиентов сервера-издателя БД и целесообразно, если позволит сохранить время рассылки обновлений на допустимом уровне) Это время рассчитывается согласно формулам теории СМО идентично Г(ЛГ„5^) = <, , - среднее время обра-

ботки запроса клиентов при объединении фрагментов К„1 = )~3 и * (соеди-

нение идентично включению множества клиентов к фрагменту с существующим сервером БД и целесообразно, если позволит сохранить время обработки запросов на допустимом уровне) Это время рассчитывается идентично времени Т{К„5^, с условием, что потоки запросов объединятся, соответственно, аддитивно изменяется интенсивность При этом оценка возможности объединения фрагментов производится на основе анализа матрицы пропускных способностей Т{КЗп8^) - среднее время обработки запроса клиентов при объединении фрагментов Щ.г = 1,г и ]=\,г (соединение идентично установке сервера с реплицированной БД в существующий фрагмент ИС, при этом необходимо заранее рассчитать производительность реплицированного сервера для обеспечения заданного времени обработки запросов) Это время рассчи-

тывается согласно формулам теории СМО, с условием, что первоначальный поток запросов дробится к основному и реплицированному серверу таким образом, чтобы обеспечить заданное качество обработки запросов, Т(К5,,Зи^ - среднее время обработки запросов клиентов фрагмента К5,,г = при его объединении с фрагментом $11 (соединение идентично подключению сервера-подписчика БД к серверу-

издателю) Это время рассчитывается согласно установленным принципам синхронизации данных и формулам теории СМО как среднее время обработки запроса и обновлений на основе анализа матрицы пропускных способностей.

В качестве критериев рассматриваются интегрированная функция суммарного времени обработки запросов между фрагментами (4) и стоимость внедряемых серверов (5)

(=1 1=1 у-1

+ £1>* ЦК1,8^±±т1/ Г(*5„5,)+;££г, тю (4)

/»1 у=1 1=1 1=1

Х*.-£с?+±С? -»тт. (5)

ы 1.1

Также рассматривается смешанный критерий (6), который образуется за счет пересечения множества альтернатив, полученных на основе первых двух критериев Решение принимается разработчиком, исходя из индивидуального анализа совокупности решений (карт Парето) Этот подход применяется в тех случаях, когда решение приходится принимать многократно, тогда возможно применение формальных правил на основе эвристических методов принятия компромиссных решений Формализация процедур принятия решения осуществляется на основе сведения двухкригериальной задачи к однокритериалькой, путем составления обобщенного критерия Ш, являющегося функцией двух критериев КЯС и Т(КЗ,К,5,яи)

№ = КЯс+ат Г^,/:, 5,5X7), (6)

где ас,ат - веса, отражающие важность критерия (в общем случае целесообразно рассматривать обобщенную функцию цены, установив ас= 1, а коэффициент ат определить как цену 1 секунды времени обработки запроса в системе)

В качестве ограничений служат

<р„ Т(К„КЗ;)&г = ы, у = ¡Я = =

Д, < Ьи^,,, г = Ы 7 = Мь Щ, Т(К8„Ь)) < Аз^,, г = й, у = й,

Г,3 Т(К8„8и,)<Ьзи^, г = и, 3 = С?,

<егр > Шр**1

где кЬ^^ - максимально допустимое время обработки запроса на уровне фрагментов 1,с1, К8],} - 1,2, ^^ - максимально допустимое время обработки запроса на уровне фрагментов К,,г-1,с1, = - максимально допустимое время

обработки запроса на уровне фрагментов К,, г = 1, (1, 5X7,, ] -1, д, Ья^^- максимально допустимое время обработки запроса на уровне фрагментов Х3,,г = 1,г, =

" максимально допустимое время обработки запроса на уровне фрагментов

= = грмножество индексов элементарных реплик, размещае-

мых на сервере SJ; гр*"' - множество индексов элементарных реплик, размещаемых на сервере SUJ, гр™' - множество индексов реплик, размещаемых на сервере фрагмента КЗ 1, е 15я- ограничения на идентичность потоков информации на

разных уровнях ИС и принадлежность их единым стандартам ИС, где /Л'„ •■ допустимое множество стандартов

Таким образом, задача распределения реплицированных БД в ИС сводится к минимизации суммарного времени обработки запросов клиентов на отдельных серверах, времени распространения обновлений для всех фрагментов ЙС и цены внедряемых серверов путем конструирования рациональной схемы взаимных подключений серверов и клиентских множеств, схемы размещения реплик данных, серверов и выбора рациональной производительности для них, при сохранении допустимого времени обработки запросов на уровне отдельных фрагментов выполнения ограничений стандартов ИС В г паве приводится проверка адекватности данной модели на основе сравнения ее характеристик с ИС документооборота ЮРТГУ, среднее расхождение расчетных и экспериментальных данных по критерию времени составило 2,46 %

Размерность чадачи зависит от количества исходных серверов, которые доступны для установки в качестве серверов БД, количества однородных по характеру генерации запросов фрагментов ИС и реплик данных Пространство состояний, определяющее решение, можно записать на основе пересечения осей, детализирующих исходные множества фрагментов ИС и множества неопределенных точек подключения серверов Задача заключается в создании модели, адекватной существующим в организации потокам данных, которая при этом предоставляла бы возможность манипулирования параметрами ее серверов с репликами данных и направлений альтернативных потоков информации на основе заданных требований к качеству обработки запросов Исходя из высокой размерности задачи, для решения предлагается использовать модифицированный генетический алгоритм

Структура хромосомы строится на основе бинарных матриц целевой функции и состоит из наборов генов а = (ах,а1, ,ахарактеризующих подключения фрагментов К к серверам 5, генов Д = (Д,/92, ,Д,), характеризующих подключения фрагментов К к серверам генов /р = (у>и)р2, характеризующих подключения фрагментов К к фрагментам КЗ, генов а = ,а>2), характеризующих подключения фрагмен-

тов к серверам генов г~(ух,уг, ,уг), характеризующих подключения фрагментов КЗ к серверам $и, генов гр*, грт, гр™, характеризующих размещения реплик на серверах фрагментов, полученных на основе преобразования множеств индексов элементарных реплик, размещаемых на серверах, гр, грт', гр 'ъ бинарные логические матрицы Таким образом, хромосома № с будет иметь следующий вид Ас =(•(<,.<2, ,аЦ(а;х,а12, ,<Д .<.» ><Д

(А'оА'*. ,Р'г„, ,Р1.,\ .(«„А*,, .К». >А%)>

(9>им2. МЛ(Ч>1л>Ч>1г, ><р1Л

> <»>%,. МЛ мим*, »<»> .<Д

(Ги ' У2 2» >Уг/н> >

{гр^.гр'А, ,п>1'1 М^Л'рЦ^грЦ, ,гр'/т, ,гР;:%1 чЯ.

,_u-.JL1 <JiU tSU r.SU \ i < St _i с У J ■, _,. .v-^- .,, . ... .Л - v

(Tu .ТУг .....iPii i.m.i rPi.t .■■ .'Pi,« - ■ 1T1.1 J.-,CP.J > Рг.} ,-,rp!m ,-..гр,л ))•

В ходе выполнения алгоритма сравнение хромосом производится следующим образом: из анализируемой популяция Р = (Л,,^,...,.4,), лучшей считается хромосома А, с наименьшей величиной нарушения ограничений, а среди хромосом с равными нарушениями ограничений выбирается хромосома с меньшим значением целевой функции Величина нарушения ограничений Ч^Л,) определяется следующим образом: £(4) = е, + е, + + е, + е,-, +е1 + + где е, - число неравенств, несоответствующих множеству ограничений исходной задачи. При этом возможно введение внутренних весовых коэффициентов для отдельных нарушений е,, которые отражают значимость ограничений.

Таким образом, сформирована структура хромосомы, которая представляет собой закодированный вариант схемы распределения реплик и серверов с реплициро-вэнными БД в ИС- При этом каждая ш хромосом характеризуется собственными значениями целевой функции и собственной интегральной функцией штрафа. Для реализации ГА определены операторы случайных изменений, в качестве которых выбраны двухролительекий кроссинговер, многорояительский кроссинговер, генный кроссинговер и мутация, а также предложен новый оператор - метаморфоза, который изменяет не значения генов в хромосоме, а сам состав генов, на основе синтеза фрагментов ИС с проверкой целесообразности по аналитическим соотношениям главы 2. С целью анализа эффективности приведенного алгоритма была разработана его реализация в средах Delphi я Visual С++ 6.0, по результатам экспериментов была продемонстрирована эффективность сконструированной структуры хромосомы и разработанных операторов случайных изменений. Также эффективность разработанного алгоритма была подтверждена сравнением его сходимости с методом ветвей и Гранин.

В главе 4 "Практическая реализация моделей распределении реплициро-ванных баз данных" рассматривается применение результатов диссертационной работы при моделировании существующих ИС и выработке рекомендации по размещению серверов с репликами БД. Представлено решение по внедрению реплицированного сервера для образовательного Интернет-портала Богословского алюминиевого завода Сибирско-урапьской алюминиевой компании. По экспериментальным данным, исходя из интенсивности обработки базового сервера и данных по его суммарной загрузке {аналогично представленным в главе 2 методам), определена производительность и время обработки запросов на реплицированном сервере (рис.2).

Исходный сс)№р эеп/шцнрэаачный момр

| □ Др пусгкцоз ipsup О брем я имигад но* НОР ч цдд/м ш Эдсперимвремя |

Рис, 2. Параметры серверов Интернет-портал а

Рассмотрена и решена задача моделирования перспективной системы документооборота корпоративной вычислительной сети ЮРГТУ (НПИ) Анализируется процесс выбора серверов с реплицированными БД для децентрализованной схемы тиражирования Приведен процесс выбора параметров серверов таким образом, чтобы при функционировании единой ИС документооборота, на всех серверах обеспечивалось заданное время обработки запросов

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1 Разработана математическая модель распределения реплицированных БД в ИС, отличающаяся от известных учетом роли серверов для реплицированной РБД, а также учетом наличия при создании структур РБД территориально распределенных интегрированных клиентских и клиент-серверных множеств, и позволяющая минимизировать затраты на создание РБД ИС при рациональном размещении серверов с реплицированными данными Среднее расхождение расчетных и экспериментальных данных при проверке адекватности модели по критерию времени составило 2,46 %.

2 Установлены аналитические зависимости выбора производительности серверов для реплицированных БД отличающиеся от классических методов учетом законов поступления и обработки запросов, производительности серверов, полученной на основе международных тестов и обеспечивающие заданное время обработки запросов пользователей

3 Разработан пакет программ для реализации моделей ИС на основе реплицированных серверов в средах GPSS, Delphi и Visual С++, отличающиеся от известных учетом репликационной структуры РБД, и позволяющие рассчитывать интенсивности и число реплицированных серверов для обеспечения заданного времени обработки запросов пользователей

4. Проведены экспериментальные исследования влияния характеристик реплицированных серверов на время обработки запроса, расхождение аналитических и имитационных данных не превышало 7-10 %

5 Создан генетический алгоритм распределения реплицированных БД в ИС, отличающийся учетом времени обработки запросов в логически интегрированных фрагментах ИС и позволяющий минимизировать время обработки запросов к серверам с реплицированными БД

6 Испытания разработанных аналитических зависимостей в существующих серверах баз данных показали функциональную работоспособность предложенных методов

Основные положения диссертационной работы изложены в следующих публикациях автора:

1 Кухарев, В Н Моделирование репликации данных в корпоративной информационной системе / В Н Кухарев // Изв вузов Сев -Кавк Регион. Техн. науки - 2006 -№4 - С 8-12

2 Кухарев, В Н Алгоритм дифференцированной синхронизации данных для оптимальной по качеству репликации / В Н Кухарев // Изв вузов Сев -Кавк. регион Техн науки 2006, Приложение № 8 - С 5-10

3 Кухарев, В Н Конструирование генетического алгоритма для задачи синтеза потоков данных в информационной системе / В Н Кухарев, А А Стребуляев, А Г Черноморов, Г А Черноморов // "Открытое образование и информационные техноло-

гии" материалы Всероссийской научно-методической конференции "Открытое образование и информационные технологии", 17-20 октября 2005 г // Приложение к журналу "Открытое образование" - Пенза. Информационно-издательский центр ПТУ, 2005 -С 361-364

4 Кухарев, В Н. Анализ существующих методов и алгоритмов проектирования информационных систем и их потоков данных / В H Кухарев // Юж -Рос гос техн ун-т -Новочеркасск, 2005 -31с Деп в ВИНИТИ 16 11 05, №1480-В2005

5 Кухарев, В H Процессно-ориентированная система дистанционного обучения / В H Кухарев, А А Стребуляев, А Г Черноморов // Научные исс тедования в области экономики, образования и информационных технологий Межвуз сб науч тр / ЮРГТУ, Институт открытого образования Новочеркасск ЮРГТУ, 2003 -С 45-49

6 Кухарев, В H Технические решения для процессно-ориентированной системы дистанционного обучения / В H Кухарев, А А Стребуляев, А Г Черноморов // Студенческая научная весна -2004 Материалы 53-й науч -техн конф студентов и аспирантов ЮРГТУ (НПИ) / Юж -Рос гос техн ун-т -Новочеркасск ООО НПО "ТЕМП",

2004 -С242-245

7 Кухарев, В H Архитектура и системные решения для образовательного портала / В H Кухарев, А И Попов, А А Стребуляев, А Г Черноморов // Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем Материалы III Междунар науч -практ конф, г Новочеркасск, 20 мая

2005 г /Юж -Рос гос техн ун-т (НПИ) -Новочеркасск ЮРГТУ, 2005 -С 61-66

8 Кухарев, В H Технические аспекты повышения производительности веб-приложения за счет использования пула соединений / В H Кухарев, А А Стребуляев, А Г Черноморов, Г.А Черноморов // Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем Материалы III Междунар науч -практ конф, г Новочеркасск, 20 мая 2005 г / Юж -Рос гос техн ун-т (НПИ) -Новочеркасск ЮРГТУ,2005 -С 90-93

9 Кухарев, В H Информационная система вуза как суперпозиция множества подсистем / В H Кухарев // Модернизация системы профессионального образования на основе регулируемого эволюционирования Материалы IV Всероссийской научно-практической конференции В 6 ч 4 1/ Южно-Уральск гос ун-т, Ин-т доп проф -пед образ, отв ред. ДФ Ильясов —Челябинск Изд-во "Образование", 2005 - С 168170

10 Кухарев, В H Моделирование процесса оптимизации структуры информационной системы вуза на основе метода ветвей и границ / В H Кухарев // Модернизация системы профессионального образования на основе регулируемого эволюционирования Материалы IV Всероссийской научно-практической конференции В 6 ч 4 1/ Южно-Уральск гос ун-т, Ин-т доп проф -пед образ , отв ред Д Ф Ильясов — Челябинск Изд-во "Образование", 2005 -С 155-158

11 Кухарев, В H Моделирование потоков данных в информационной системе филиала вуза. / В.Н Кухарев // Модернизация системы профессионального образования на основе регулируемого эволюционирования Материалы IV Всероссийской научно-практической конференции В 6 ч 4 2/ Южно-Уральск. гос ун-т, Ин-т доп проф -пед образ , отв ред. Д Ф Ильясов - Челябинск Изд-во "Образование", 2005 - С 170173

12 Кухарев, В H Концептуальная модель информационной системы с распределенной базой данных и выделенным хранилищем данных / В H Кухарев, А А Стребуляев, А Г Черноморов, ГА Черноморов // Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем Материа-

лы III Междунар науч -практ конф, г. Новочеркасск, 20 мая 2005 г / Юж -Рос гос техн ун-т (НПИ) - Новочеркасск ЮРГТУ, 2005 - С 127-128

13 Кухарев В H Модель документооборота в корпоративной информационной системе вуза / В H Кухарев, Г А Черноморов // Теория, методы проектирования, про-граммно-техническав платформа корпоративных информационных систем. Материалы III Междунар науч -практ конф, г Новочеркасск, 20 мая 2005 г / Юж -Рос гос техн ун-т (НПИ) -Новочеркасск ЮРГТУ, 2005 - С 129-133

14 Кухарев, В.Н Анализ моделей информационных систем / В H Кухарев, Г А Черноморов II Студенческая научная весна - 2005 Сборник научных трудов аспирантов и студентов ЮРГТУ (НПИ) / Юж -Рос гос техн ун-т - Новочеркасск ЮРГТУ (НПИ), 2005 - С 179-180

15 Кухарев В H Марковская модель информационной системы вуза / В H Кухарев, А А Стребуляев, А Г Черноморов, Г А Черноморов // "Открытое образование и информационные технологии" материалы Всероссийской научно-методической конференции "Открытое образование и информационные технологии", 17-20 октября

2005 г // Приложение к журналу "Открытое образование" - Пенза Информационно-издательский центр ПГУ, 2005 - С. 365-367

16 Кухарев, В H Марковская модель системы документооборота в вузе / В H Кухарев, Г. А Черноморов Н Региональный вестник молодых ученых Сборник статей молодых ученых и аспирантов M, 2005 - №5 - С 14-18.

17 Кухарев, В Н. Моделирование рационального дублирования серверов информационной системы / В H Кухарев, А А Стребуляев, А Г Черноморов, Г А Черноморов // Региональный вестник молодых ученых Сборник статей молодых ученых и аспирантов M , 2005 - №5 - С 18-20

18 Кухарев, В H Моделирование потоков данных между серверами информационной системы / В H Кухарев, А А Стребуляев, А Г Черноморов, Г А Черноморов // II Международная Интернет-конференция "Информационные и коммуникационные технологии как инструмент повышения качества профессионального образования" сборник статей участников конференции - Екатеринбург Рос гос проф -пед Ун-т,

2006 -С 122-126

19 Кухарев, В H Моделирование потоков данных в системе документооборота вуза / В H Кухарев А А Стребуляев, А Г Черноморов, Г А Черноморов // II Международная Интернет-конференция "Информационные и коммуникационные технологии как инструмент повышения качества профессионального образования" сборник статей участников конференции - Екатеринбург Рос гос проф -пед ун-т, 2006 -С 133-139

20 Кухарев, В H Оптимальное распределение информации о хозяйствующих субъектах в неравномерных системах / В H Кухарев, H А Кухарев // Изв вузов Сев -Кавк. регион. Техн науки 2006, Приложение к № 4 - С 172-174

21 Кухарев, В H Экономическая целесообразность построения распределенных систем в вертикально интегрированных компаниях / В H Кухарев, H А Кухарев // Изв вузов Сев-Кавк регион Техн науки 2006, Приложение к № 4 - С. 191-193

22 Кухарев, В H Модификация образовательного портала с внедрением системы аттестации персонапа / В H Кухарев, А А Стребуляев, А Г Черноморов, Г А Черноморов // Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем Материалы IV Междунар науч -практ конф, г Новочеркасск, 26 мая 2006 г / Юж -Рос гос техн ун-т (НПИ) - Новочеркасск ЮРГТУ, 2006 -С 49-51

23 Кухарев, В H Оптимизация потока запросов к репликационному серверу / В H Кухарев, А А Стребуляев, Г А Черноморов // Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем Материалы IV Междунар науч -практ конф , г Новочеркасск, 26 мая 2006 г / Юж -Рос roc техн. ун-т (НИИ) - Новочеркасск: ЮРГТУ, 2006 - С 128-131

24 Кухарев, В H О возможности применения ЕМ-алгоритма для кластеризации путей навигации пользователя в Интернет-портале / В H Кухарев, А А Стребуляев, Г А Черноморов, А Г Черноморов // Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем Материалы IV Междунар науч -практ конф, г Новочеркасск, 26 мая 2006 г / Юж -Рос гос техн ун-т (НПИ) - Новочеркасск ЮРГТУ,2006 -С 131-134

25. Кухарев, В H Моделирование конфликтов при репликации данных в распределенных системах с иерархической архитектурой / В H Кухарев // Изв вузов Сев -Кавк. регион Техн науки. - 2007. - №1. - С 3-7

26 Свидетельство Роспатента № 2004620222 об официальной регистрации базы данных «Процессно-ориентированная система дистанционного обучения» / В H Кухарев, А.А Стребуляев, Г А Черноморов, А Г Черноморов Зарегистрировано в реестре 16 сентября 2004 г

27 Свидетельство Роспатента № 2006620116 об официальной регистрации базы данных «Образовательный Интернет-портал для профессиональной подготовки персонала» / В H Кухарев, А А Стребуляев, Г А Черноморов, А Г Черноморов Зарегистрировано в реестре 26 апреля 2006 г

28. Свидетельство Роспатента № 2006613695 об официальной регистрации программы для ЭВМ «Образовательный Интернет-портал для профессиональной подготовки персонала» í В.Н. Кухарев, А.А Стребуляев, Г А Черноморов, А Г Черноморов Зарегистрировано в реестре 24 октября 2006 г

29 Свидетельство Роспатента № 2007610167 об официальной регистрации программы для ЭВМ «Комплекс программ решения детерменированных задач теории принятия решений на основе метода динамического программирования» / ВН. Кухарев, А.А. Стребуляев, Г А Черноморов, и др Зарегистрировано в реестре 9 января 2007 г.

30 Свидетельство Роспатента № 2007610168 об официальной регистрации программы для ЭВМ «Комплекс программ решения детерменированных задач теории принятия решений на основе метода ветвей и границ» / В H Кухарев, А А Стребуляев, ГА Черноморов, и др Зарегистрировано в реестре 9 января 2007 г

Личный вклад автора в опубликованных в соавторстве работах [3,12] - постановка задачи и ,численное моделирование, [13-17] построение моделей их программная реализация, [5-8] - разработка структур баз данных, [18-24] - разработка принципов функционирования

Статьи [1, 2, 3, 15, 20, 21, 25] опубликованы в рецензируемых журналах, рекомендованных ВАК РФ для публикации работ соискателей ученой степени кандидата и доктора наук

Кухарев Вадим Николаевич

МОДЕЛИ И АЛГОРИТМЫ РАСПРЕДЕЛЕНИЯ РЕПЛИЦИРОВАННЫХ БАЗ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ

Автореферат

Подписано в печать 16 08 2007 Формат 60x84 ]/16 Бумага офсетная Ризография Уел печ л 1,0 Уч-изд л 1,41 Тираж 100 экз Заказ 776

Типография ЮРГТУ (НПИ) 346428, г Новочеркасск, ул Просвещения, 132 Тел, факс (863-52) 5-53-03

Оглавление автор диссертации — кандидата технических наук Кухарев, Вадим Николаевич

Введение.

ГЛАВА 1. АНАЛИЗ МОДЕЛЕЙ И МЕТОДОВ МОДЕЛИРОВАНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ И РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ.

1.1 Методы моделирования и архитектура информационных систем.

1.2 Организация обработки распределенных данных.

1.3 Технологии моделирования и анализа для оптимизации производительности информационной системы.

1.4 Средства моделирования информационных систем.

1.5 Анализ существующих алгоритмов распределения баз данных в информационных системах.

1.6 Обобщенная постановка задачи распределения реплицированных баз данных в информационной системе.

Выводы по главе 1.

ГЛАВА 2. СОЗДАНИЕ МОДЕЛЕЙ РАСПРЕДЕЛЕНИЯ РЕПЛИЦИРОВАННЫХ БАЗ ДАННЫХ.

2.1 Моделирование репликации данных в системах с дублирующими серверами.

2.2 Анализ моделей информационных систем с избыточными репликами данных.

2.3 Комплекс программ моделирования рационального размещения реплик баз данных.

Выводы по главе 2.

ГЛАВА 3. РАЗРАБОТКА АЛГОРИТМА РАСПРЕДЕЛЕНИЯ РЕПЛИЦИРОВАННЫХ БАЗ ДАННЫХ.

3.1 Постановка задачи распределения реплицированных баз данных в информационной системе.

3.2 Генетический алгоритм распределения реплицированных баз данных в информационной системе.

3.3 Проведение экспериментальных исследований.

Выводы по главе 3.

ГЛАВА 4. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ МОДЕЛЕЙ РАСПРЕДЕЛЕНИЯ РЕПЛИЦИРОВАННЫХ БАЗ ДАННЫХ.

4.1 Реализация репликации данных в образовательном Интернет-портале Богословского алюминиевого завода.

4.2 Реализация репликации данных в системе документооборота корпоративной вычислительной сети ЮРГТУ (НПИ).

Выводы по главе 4.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Кухарев, Вадим Николаевич

Моделирование современных информационных систем в качестве одной из ключевых проблем содержит задачу обеспечения качества обслуживания обработке запросов пользователей между различными компонентами системы. При этом под моделью информационной системы понимается адекватная ей схема комплекса программно-технических средств, включающая схему потоков данных между компонентами системы. Эта задача требует создания оптимальной схемы репликации данных, создавая наряду с техническими ограничениями, требования к минимизации стоимости всей системы.

Теоретической базой моделирования информационных систем являются работы ряда отечественных и зарубежных специалистов. Среди отечественных к ним относятся работы Бржезовского А.В., Вишневского В.М., Во-ройского Ф.С., Галахова И.В., Гламаздина Е.С., Новикова Д.А., Цветкова

A.В, Зиндера Е.З., Клещева Н.Т., Романова А.А., Кузнецова Н.А., Кульбы

B.В., Ковалевского С.С., Косяченко С.А., Тихоненко О.М. Среди зарубежных над данной тематикой работали Буч Г., Гейн К., Сарсон Т., Баркер Р., Лонг-ман Ц., Росс Т., Меллор, Гоуэн К., Марк Д., Йорден И.

Эти работы создают методологическую базу разработки информационных систем на основе заданной предметной области и существующих в организации потоков данных. Однако в настоящее время одним из ключевых факторов создания информационной системы в крупных организациях является разработка оптимальной модели репликационной схемы распределенной базы данных, поскольку крупные компании требуют поддержки высокой актуальности информации в своих филиалах, которые географически удалены друг от друга. Технология репликации необходима для систем, использующихся в областях с высокими требованиями к гарантированной доставке, своевременности и целостности передаваемых данных, таких как системы международных безналичных банковских расчетов, системы обработки данных распределенных технологических процессов реального времени, билин-говые системы, а также для специализированных корпоративных систем.

Среди отечественных ученых работы по данной проблеме проводили Когаловский М.Р., Филиппов В.А., Цимбал А.А., Аншина М.Л., Шрайберг Я.Л., Мазов Н.А., а среди зарубежных - Коннолли Т., Бегг К., Ролланд Ф., Спирли Э., Столлингс В., Таненбаум Э., Стен М. Ван., Шекхар Ш., Чаула С., Дейт К., Вальдерас П. Однако данная тематика, несмотря на множество разработок моделей тиражирования данных, до сих пор содержит множество нерешенных проблем:

- отсутствие моделей распределения баз данных в информационных системах, которые могли бы решить проблему разделения логически интегрированных групп пользователей в рамках однородных потоков данных с учетом дифференцированных требований на скорость обслуживания;

- отсутствие методики оптимальной трансформации моделей при добавлении и удалении сервера с реплицированной базой данных;

- отсутствие алгоритмов распределения реплик БД и серверов для них в информационных системах, обеспечивающие заданное качество обслуживания запросов пользователей к реплицированным базам данных при минимизации стоимости.

Данные проблемы, а также особенности учета качества обработки запросов пользователей в информационных системах, требующих обеспечения заданного времени обработки отдельных потоков, приводят к необходимости построения соответствующих моделей. Таким образом, существует необходимость в развитии методов композиции и декомпозиции фрагментов информационных систем, которые позволяли учитывать дифференцирован-ность требований пользователей к скорости обработки запросов в рамках однородных фрагментов. Для решения данной задачи, как основы выбора степени репликации распределенной базы данных, необходимо создание комплекса соответствующих моделей и оценка качества их функционировании.

Таким образом, задача разработки моделей распределения реплик БД при моделировании ИС и эффективных алгоритмов их конструирования с учетом дифференцированных требований к скорости обработки различных запросов к реплицированным БД в условиях минимизации стоимости сетевого оборудования является актуальной.

Диссертационная работа выполнена в рамках Федеральной целевой программы "Интеграция науки и высшего образования России на 2002-2006 годы", утвержденной постановлением Правительства РФ № 660 от 5.09.01, научно-технической программы "Научные исследования высшей школы по приоритетным направлениям науки и техники", а также в соответствии с научным направлением Южно-Российского государственного технического университета (НПИ), раздел "Проблемы автоматизации обработки информации в тренажерно-обучающих, информационных и управляющих комплексах" по теме 7.05 «Разработка теоретических основ проектирования корпоративных информационных систем» (утверждено решениями ученого совета ЮРГТУ от 25.04.2001 и 21.03.2006).

Целью диссертационной работы является повышение эффективности функционирования информационных систем, включающих распределенные базы данных, за счет разработки и использования математических моделей распределенных баз данных информационных систем и алгоритмов построения данных моделей, позволяющих создавать информационные системы с заданным временем обработки запросов к реплицированным данным.

Для достижения этой цели в диссертационной работе решаются следующие задачи:

- анализ процесса построения модели информационной системы с учетом моделирования распределенной базы данных;

- создание аналитико-имитационных моделей для рационального распределения копий баз данных по узлам информационной системы с целью достижения заданного времени обращения пользователей к базам данных;

- определение временных характеристик распределенных баз данных информационных систем на основе разработанных моделей;

- разработка алгоритма для распределения реплицированных баз данных в информационной системе;

- проведение апробаций и оценки эффективности разработанных моделей и алгоритмов на основе их программной реализации.

Предметом исследования являются модели распределения реплик баз данных в информационных системах и алгоритмы их конструирования, влияние процесса репликации баз данных на моделирование информационной системы.

Методы исследования и достоверность результатов. В работе использованы методы теории принятия решений, теории систем массового обслуживания, имитационного моделирования, исследования операций, а также методы теории вероятностей и теории генетических алгоритмов.

Достоверность научных результатов и выводов, сформулированных в диссертации, подтверждается согласованием теоретических положений с результатами имитационных экспериментов, расхождение аналитических и имитационных данных не превышало 7-10%, адекватностью результатов моделирования реальным параметрам БД ИС, непротиворечивостью математических выкладок и преобразований.

На защиту выносятся следующие положения:

1. Математическая модель распределения реплик БД в ИС, отражающая репликационную структуру распределенной базы данных, позволяющая минимизировать затраты на создание информационной системы при рациональном размещении серверов с реплицированными данными.

2. Метод выбора сервера с реплицированной базой данных на основе данных по его производительности.

3. Модифицированный генетический алгоритм распределения реплицированных баз данных в информационной системе.

Научная новизна диссертационной работы заключается в том, что сконструирована математическая модель распределения реплик баз данных в информационной системе, отражающая репликационную структуру распределенной базы данных, отличающаяся от известных учетом роли серверов для реплицированной распределенной базы данных, а также учетом наличия территориально распределенных интегрированных клиентских и клиент-серверных множеств. Установлены аналитические зависимости выбора производительности серверов для реплицированных баз данных, отличающиеся от классических методов учетом законов поступления и обработки запросов, производительности серверов, полученной на основе международных тестов, наличием дифференцированных требований пользователей ко времени обработки запросов к реплицированным базам данных. Предложен модифицированный генетический алгоритм конструирования репликационной структуры информационной системы, отличающийся учетом времени обработки запросов в логически интегрированных фрагментах информационной системы и особенностей построения реплицированной структуры распределенной базы данных.

Теоретическая ценность работы заключается в построении и исследовании концептуальных моделей распределения реплицированных БД в ИС и алгоритмов их конструирования с учетом требований по времени обработки запросов и стоимости систем, построении моделей композиции и декомпозиции фрагментов ИС.

Практическая ценность работы состоит в возможности использования разработанных моделей и алгоритмов на разных этапах моделирования распределенных баз данных информационных систем, а также для анализа процессов функционирования существующих информационных систем. Данные модели и алгоритмы позволяют за счет модернизации структуры информационной системы повысить эффективность работы информационных систем в целом, что дает прямой экономический эффект.

Разработанные модели и алгоритмы моделирования применены в процессе разработки информационных систем в ФГНУ ВНИИ "Радуга" (г. Коломна), перспективной системы документооборота ЮРГТУ (НПИ) и образовательного Интернет-портала профессиональной подготовки кадров Богословского алюминиевого завода Сибирско-уральской алюминиевой компании (г. Краснотурьинск). Эти математические модели также используются в учебном процессе на кафедре «Автоматизированные системы управления» Южно-Российского государственного технического университета.

Апробация работы. Основные положения диссертации и отдельные ее результаты докладывались и получили подтверждение на:

• III международной научно-практической конференции "Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем" (Новочеркасск, 2003);

• научно-технической конференции студентов и аспирантов ЮРГТУ (НПИ) "Студенческая научная весна -2004" (Новочеркасск, 2004);

• IV всероссийской научно-практической конференции: "Модернизация системы профессионального образования на основе регулируемого эволюционирования" (Челябинск, 2005);

• всероссийской научно-методической конференции: "Открытое образование и информационные технологии" (Пенза, 2005);

• научно-технической конференции студентов и аспирантов ЮРГТУ (НПИ) "Студенческая научная весна -2005" (Новочеркасск, 2005);

• II международной Интернет-конференции "Информационные и коммуникационные технологии как инструмент повышения качества профессионального образования" (Екатеринбург, 2006);

• IV международной научно-практической конференции "Теория, методы проектирования, программно-техническая платформа корпоративных информационных систем" (Новочеркасск, 2006).

Предложенные математические модели и алгоритмы моделирования информационных систем использованы в процессе построения информационной системы ФГНУ ВНИИ "Радуга" (г.Коломна), корпоративной информационной системы ЮРГТУ(НПИ) и образовательного Интернет-портала профессиональной подготовки кадров Богословского алюминиевого завода (г. Краснотурьинск). Разработанные математические модели также внедрены в учебный процесс на кафедре «Автоматизированные системы управления» Южно-Российского Государственного Технического Университета.

Публикации. По результатам выполненных исследований опубликовано 30 научных работ, в том числе 2 свидетельства Роспатента об официальной регистрации баз данных - "Процессно-ориентированная система дистанционного обучения" и свидетельство "Образовательный Интернет-портал для профессиональной подготовки персонала" и 3 свидетельства об официальной регистрации программ для ЭВМ.

Структура и содержание диссертации. Работа содержит 159 страниц основного текста, 37 рисунков, 42 таблицы и состоит из введения, четырех глав, заключения, списка использованной литературы и приложений, содержащих основной код разработанного комплекса программ и акты о внедрении результатов диссертационной работы.

Заключение диссертация на тему "Модели и алгоритмы распределения реплицированных баз данных в информационных системах"

Выводы по главе 4

1. Проведена успешная апробация разработанных методик моделирования реплицированных серверов БД информационных систем, что позволило более эффективно использовать имеющиеся ресурсы ИС.

2. Проведена успешная апробация теоретических расчетов рациональных параметров репликационного сервера Интернет-Портале Богословского алюминиевого завода. Реализовано моделирование репликационной данной схемы на основе определения требований к репликационному серверу.

3. Предложена схема внедрения серверов с реплицированными БД в системе документооборота ЮРГТУ (НПИ), уточнены параметры передачи данных между центральным вузом и филиалами, выработаны рекомендации по выбору параметров серверов.

157

Заключение

Диссертационная работа направлена на повышение эффективности методов создания информационных систем, включающих распределенные реп-лицированные базы данных, путем разработки математических моделей информационных систем и алгоритмов построения данных моделей, позволяющих создавать информационные системы с заданным качеством обработки запросов к реплицированным данным.

В настоящее время данная задача является актуальной благодаря постоянно повышающимся объемам информации в современных системах, требующим обеспечить высокую скорость доступа к данным, находящимся в географически разделенных офисах. Несколько центров обработки данных, каждый из которых требует доступности одной и той же информации, являются ядром распределенной системы, для создания которой необходимо решить проблемы синхронизации и размещения данных.

Существующие модели информационных систем не предусматривают на концептуальном уровне моделирования требования к репликации и синхронизации баз данных, являющихся основой распределенных систем. Имеющиеся технологии репликации, разработанные различными компаниями-производителями СУБД, автоматизируют процесс поддержки целостности реплик данных на основе уже ранее созданных информационных систем. Это внедрение репликации происходит без учета характеристик потоков запросов от пользователей и их требований на время обслуживания, как правило, на основе простого включения в систему нового узла данных.

Данные проблемы постепенного повышения требований к доступности данных понижают эффективность использования имеющегося оборудования, увеличивая себестоимость всей системы в целом.

Основными результатами проведенных в диссертационной работе теоретических и экспериментальных исследований являются разработанные методы композиции и декомпозиции фрагментов информационных систем, основанные на дифференцированной оценке обработки запросов пользователей, а также алгоритм построения моделей информационных систем, ориентированных на репликацию данных и существующие схемы потоков данных.

Разработанные методы композиции и декомпозиции реплик баз данных, а также созданный на их основе алгоритм конструирования моделей информационных систем позволяют достичь выигрыша в качестве обработки запросов пользователей при увеличении использования ресурсов системы за счет более эффективного их распределения.

Для достижения этой цели в работе сделано следующее:

1. Разработана математическая модель распределения реплицированных БД в ИС, отличающаяся от известных учетом роли серверов для реплицированной РБД, а также учетом наличия при создании структур РБД территориально распределенных интегрированных клиентских и клиент-серверных множеств, и позволяющая минимизировать затраты на создание РБД ИС при рациональном размещении серверов с реплицированными данными. Среднее расхождение расчетных и экспериментальных данных при проверке адекватности модели по критерию времени составило 2,46 %.

2. Установлены аналитические зависимости выбора производительности серверов для реплицированных БД, отличающиеся от классических методов учетом законов поступления и обработки запросов, производительности серверов, полученной на основе международных тестов, и обеспечивающие заданное время ожидания обработки запросов пользователей.

3. Разработан пакет программ для реализации моделей ИС на основе реплицированных серверов в средах GPSS, Delphi и Visual С++, отличающиеся от известных учетом репликационной структуры РБД, и позволяющие рассчитывать интенсивности и число реплицированных серверов для обеспечения заданного времени обработки запросов пользователей.

4. Проведены экспериментальные исследования влияния характеристик реплицированных серверов на время обработки запроса, расхождение аналитических и имитационных данных не превышало 7-10 %.

5. Создан генетический алгоритм конструирования репликационной структуры РБД ИС, отличающийся учетом времени обработки запросов в логически интегрированных фрагментах ИС и позволяющий минимизировать время доступа к репликационным серверам БД.

6. Испытания разработанных аналитических зависимостей в существующих серверах баз данных показали функциональную работоспособность предложенных методов.

На основе разработанных моделей получены варианты внедрения серверов с реплицированными БД в системе документооборота ЮРГТУ (НПИ) и в Интернет-портале профессиональной подготовки кадров Богословского алюминиевого завода, Результаты анализа рекомендаций по репликации данных в информационных системах подтвердили эффективность и универсальность разработанных моделей поддержки тиражирования данных на основе минимизации среднего времени ожидания обработки запросов.

160

Библиография Кухарев, Вадим Николаевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Архипенков, С.Я. Аналитические системы на базе Oracle Express OLAP. Проектирование, создание, сопровождение. / С.Я. Архипенков. - М.: Диалог-МИФИ, 2000. - 320 с.

2. Богданов, Д.В. Модели и алгоритмы концептуального проектирования автоматизированных систем управления / Д.В. Богданов, Е.Б. Мазаков, О.Б. Неилко, С.Г. Чекинов; под. ред. С.Г. Чекинова. М.: Компания Спутник^ 2004. - 324 с.

3. Бржезовский, А.В. Обобщенная модель методов проектирования информационных систем. / А.В. Бржезовский // Вестник молодых ученых, №7, 2001. Серия: Технические науки. 2001. - №2. - С. 96-103.

4. Вишневский, В.М. Теоретические основы проектирования компьютерных сетей. / В.М. Вишневский. М.: Техносфера, 2003. - 512 с.

5. Клещев, Н.Т. Практическое руководство по организации и проектированию информационных систем. / Н.Т. Клещев, А.А. Романов. М.: Изд-во ООО "Научтехлитиздат", 2001. - 389 с.

6. Кудрявцев, Е.М. GPSS World. Основы имитационного моделирования различных систем. / Е.М. Кудрявцев М.: ДМК Пресс, 2004. - 320 с.

7. Paxson, V. Wide-Area Traffic: The Failure of Poisson Modeling / V. Pax-son, S. Floyd // IEEE Transactions on Networking. 1995. - №3. - P. 226-244.

8. Покровский, О.Ю. Анализ архитектур распределенных систем / О.Ю. Покровский // Перспективные информационные технологии и интеллектуальные системы. 2005. - №1. - С. 60-67.

9. Когаловский, М.Р. Энциклопедия технологий баз данных. / М.Р. Ко-галовский. М.: Финансы и статистика, 2002. - 800 с.

10. Ахтырченко, К.В. Моделирование транзакций на архитектурном уровне проектирования программных средств. / К.В. Ахтырченко // Вычислительные методы и программирование 2001. Т.2. - С. 49-69.

11. Меллинг, В.П. Корпоративные информационные архитектуры: и все-таки они меняются / В.П. Меллинг // СУБД. 1995. - №2 - С. 45-59.

12. Лившиц, Б.С. Теория телетрафика. / Б.С. Лившиц М.: Связь, 1979. -224 с.

13. Брюхов, Д. Интероперабельные информационные системы: архитектуры и технологии. /Д. Брюхов // СУБД. 1995. - №4. - http://www.osp.ru

14. Волков, И.Ю. Архитектура современной информационно-аналитической системы. / И.Ю. Волков // Директор ИС. 2002. - №3. - http://osp.ru

15. Воройский, Ф.С. Основы проектирования автоматизированных биб.-инф. систем / Ф.С. Воройский. М.: Физмалит, 2002. - 384 с.

16. Гейн, К. Структурный системный анализ. / К. Гейн, Т. Сарсон. -"Эйтекс", 1992.-234 с.

17. Черемных, С.В. Моделирование и анализ систем. IDEF технологии: практикум. / С.В. Черемных, И.О. Семенов, B.C. Ручкин. - М.: Финансы и статистика, 2005. - 192 с.

18. Буч, Г. Объектно-ориентированный анализ и проектирование. / Г. Буч. М.: Бином, 2000. - 560 с.

19. Пуха, Ю.А. Объектные технологии построения распределенных информационных систем / Ю.А. Пуха // СУБД. 1997. - №3 - С. 41-47.

20. Ярных А.В. Создание корпоративных информационных систем на базе модели теории автоматов // Перспективные информационные технологии и интеллектуальные системы. 2004. - №4. - С. 61-66.

21. Шуткин, Л.В. Паттерновые сети для моделирования информационных систем. /Л.В. Шуткин. М. НТИ, 2000. - С.3-21.

22. Волчков, С.А. Мировые стандарты управления промышленным предприятием в информационных системах (ERP-системы) / С.А. Волчков -http://www.interface.mfg.ru/

23. Барсегян, А.А. Методы и модели анализа данных: OLAP и Data Mining. / Барсегян, А.А., Куприянов М.С., Степаненко В.В., Холод И.И. СПб.: БХВ-Петербург, 2004. - 336 с.

24. Галахов, И.В. Проектирование корпоративной информационно-аналитической системы. / И.В. Галахов // Открытые системы. 2003. - №4. -http://www.osp.ru/os

25. Крохин, Н.В. Современные системы моделирования бизнеса и их применение в реинженеринге / Н.В. Крохин // Сети. 1996. - №3. - С.140-146.

26. Зиндер, Е.З. Новое системное проектирование: информационные технологии и бизнес-реинженеринг. // СУБД. 1995. - №4. - С. 37-49.

27. Зорин, В.Ю. Проблемы и перспективы развития средств проектирования корпоративных информационных систем / В.Ю. Зорин // Перспективные информационные технологии и интеллектуальные системы. 2004. - №4. -С. 66-69.

28. Васильев, М. Моделирование и анализ корпоративных информационных систем / М. Васильев. http://www.pcweek.ru/

29. Тамер, М. Распределенные и параллельные системы баз данных / М. Тамер, П. Валдуриз // СУБД. 1996. - №4. - С. 4-26.

30. Таненбаум, Э. Ван. Распределенные системы. Принципы и парадигмы. / Э. Таненбаум, М. Стен. СПб.: Питер, 2003. - 877 с.

31. Шекхар, Ш. Основы пространственных баз данных. / Ш. Шекхар, С. Чаула. М.: КУДИЦ-ОБРАЗ, 2004. - 336 с.

32. Ролланд, Ф. Основные концепции баз данных. / Ф. Роланд. М.: Издательский дом "Вильяме", 2002. - 256 с.

33. Коннолли, Т. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. 3-е издание. / Т. Коннолли, К. Бегг. М.: Издательский дом "Вильяме", 2003. - 1440 с.

34. Date, C.J. What is distributed database? / C.J. Date // InfoDB, 2:7, Relational Database Writings 1985-1989. Reading, Mass.: Addison-Wesley. -http://portal.acm.org

35. Date, C.J. An Introdution to Database Systems. / C.J. Date Reading, MA: Addison-Wesley, 2000. - 431 p.

36. Wiesmann, M. Comparison of Database Replication Techniques Based on Total Order Broadcast. / M. Wiesmann // IEEE transactions on knowledge and data engineering. 2005. - №4. - http://ieeexplore.ieee.org/

37. Taqqu, M. Proof of Fundamental Result in Self-Similar Traffic Modelling. / M. Taqqu, W. Willinger, R. Sherman // Computer Communications Review, n. 27. 1997. - P. 5-23.

38. Willinger, W. A Bibliographical Guide to Self-Similar Traffic and Performance Modeling for Modern High-Speed Networks. / W. Willinger, M. Taqqu,

39. A.A. Erramili // Stochastic Networks: Theory and Applications, Clarendon Press (Oxford University Press). Oxford. 1996. - P. 339-366.

40. Harrison, J.M. Note on Network of Infinity Server Queues / J.M. Harrison //J. Appl. Probab. 1981. №2. - P.779-793.

41. Kendall, D.G. Stochastic processes occurring in the theoiy of the queues and their analysis by the method of the imbedded Markov chains / D.G. Kendall // Ann. Math. Statist. 1953. V.24. - P.338-354.

42. Хинчин, А.Я. Работы по математической теории массового обслуживания / Под. ред Б.В. Гнеденко. М.: Эдиториал УРСС, 2004. - 240 с.

43. Тихоненко, О.М. Модели массового обслуживания в информационных системах / О.М. Тихоненко М. УП "Технопринт", 2003. - 327 с.

44. Советов, Б.Я. Моделирование систем. / Б.Я. Советов, С.А. Якоплев. -М.: Высш. шк., 2003. 295 с.

45. Клейнрок, JI. Теория массового обслуживания. / Л. Клейнрок. М: Машиностроение, - 432 с.

46. Павловский, Ю.Н. Имитационные модели и системы. / Ю.Н. Павловский. М.: ФАЗИС: ВЦ РАН, 2005. - 134 с.

47. Цимбал, А.А. Технологии создания распределенных систем. / А.А. Цимбал, МЛ. Аншина СПб.: Питер, 2003. - 576 с.

48. Томашевский, В.Н., Имитационное моделирование в среде GPSS. /

49. B.Н. Томашевский, Е.Г. Жданова. М.: Бестселлер, 2003. - 416 с.

50. Столингс, В. Передача данных. / В. Столингс. СПб.: Питер, 2004. -750 с.

51. Системы имитационного моделирования. http://www.gpss.ru/

52. Имитационные модели неопределенных систем / Под ред. А.В. Лап-ко. Новосибирск: ВО "Наука". 1993. - 112 с.

53. Рыжиков, Ю.И. Имитационное моделирование. Теория и технологии. / Ю.И. Рыжиков. М.: Альтекс-А, 2004. - 384 с.

54. Demers A. Analysis and simulation of a fair queueing algorithm. / A. Demers, S. Keshav, S. Shenker // Proc. ACM SIGCOMM Stanford, CA, 1998. P.l-12.

55. Кузнецов, H.A. Методы анализа и синтеза модульных информационно-управляющих систем. / Кузнецов Н.А., В.В. Кульба , С.С. Ковалевский, С.А. Косяченко М.: Физматлит, 2002. - 800 с.

56. Ceri, S. Distributed Database Design Methdologies. / S. Ceri, B. Pernici, G. Wiederhold. // Proc. IEEE, May 1987. №5. - P. 533-546.

57. Черноморов, Г.А. Теория принятия решений / Г.А. Черноморов -Юж.-Рос. гос. техн. ун-т. Новочеркасск: Ред. журн. "Изв. вузов Электромеханика ", 2006.-572 с.

58. Floyd, S. The Synchronization of Periodic Routing Messages. / S. Floyd, V. Jacobson // IEEE/ACM Transactions on Networking. 2(2). 1994. - P. 122-136.

59. International union of engineers. http://www.ieee.org

60. Chen, B. Traffic Modeling, Prediction, and Congestion Control for HighSpeed Networks / Chen, B. and other // IEEE Trans. On Fuzzy Systems Vol. 8. 2000. №5. - http://ieeexplore.ieee.org/iel5/91/18902/00873574.pdf

61. Carey, M.J. Conflict Detection Tradeoffs for Replicated Data / M.J. Carey, M. Livny // ACM Transactions on Database Systems. 1991. - №4. - P. 703-746.

62. Bernstein, P. Concurrency Control and Recovery in Database Systems. / P. Bernstein, V. Hadzilacos, N. Goodman: MA: Addison-Wesley, 1987. -http://portal.acm.org/

63. Спирли, Э. Корпоративные хранилища данных. Планирование, разработка, реализация. / Э. Спирли, М.: Издательский дом "Вильяме", 2001. -400 с.

64. Ezsu, М.Т. Principles of Distributed Database Systems. Englewood Cliffs, NJ: Prentice-Hall, 1991. -http://www.cs.ualberta.ca/~database/ddbook.html

65. Гламаздин, E.C. Управление корпоративными программами: информационные системы и математические модели. / Е.С. Гламаздин. М.: ИПУ РАН, 2003.- 159 с.

66. СУБД «Oracle». Статистические характеристики по быстродействию. http://www.oracIe.com/

67. Емельянов, В.В. Теория и практика эволюционного моделирования. / В.В. Емельянов, В.В. Курейчик, В.М. Курейчкик. М.: Физматлит, 2003. -432 с.

68. Гладков, В.М. Генетические алгоритмы: учебное пособие / В.М. Гладков, В.В. Курейчик, JI.A. Гладков М.: Физматлит, 2006. - 320 с.

69. Holland, J.H. Adaptation in natural and artificial systems. An introductory analysis with application to biology, control, and artificial intelligence. / J.H. Holland London: Bradford book edition, 1994 - 211 p.

70. Kureichik, V.M. Some New Features in Genetic Solution of the Traveling Salesman Problem / V.M. Kureichik and other // Proc. of the Second Intl. Conf. Adaptive Computing in Engineering, Design and Control.- Plymouth, UK, 1996.- P. 294-296.

71. Smith, J. Recombination strategy adaptation via evolution of gene linkage / J. Smith, T. Fogarty // Proceedings of the IEEE International Conference on Evolutionary Computation. Piscataway: IEEE Press, 1996. - P. 826-831.

72. Stanley, K.O. Evolving neural networks through augmenting topologies / K.O. Stanley, R. Miikkulainen // Evolutionaiy Computation. 2002. - Vol. 10, №2.-P. 99-127.

73. Редько, В.Г. Оценка эффективности эволюционных алгоритмов / В.Г. Редько, Ю.Р. Цой // Доклады АН. 2005. - №3. - С. 312-315.

74. Koucheryavy, Y. A novel approach for self-similar traffic prediction. / Y. Koucheryavy, J. Harju // Proceedings of the St. Petersburg Regional International Teletraffic Seminar, St. Petersburg, Russia, January 29 February 1. 2002. - P. 172 -179.

75. Fowler, H.J. Local Area Network Traffic Characteristics, with Implications for Broadband Network Congestion Management / H. J. Fowler, W. E. Leland // IEEE JSAC, 9(7). September 1991. P. 1139-1149.

76. Eswaran, K. The Notions of Consistency and Predicate Locks in a Database Systems / Eswaran K. and other // Commun. ACM. 1976. - №11 - P. 624633.

77. Ковалев, И.В. Оптимальное формирование избыточной структуры для отказоустойчивых информационных систем / И.В. Ковалев, С.В. Савин // Электронный журнал «Исследовано в России». http://zhurnal.ape.relarn.ru/ articles/2004103 .pdf

78. Агибалов, Г.П. Математическая модель и технология разработки безопасных корпоративных информационных систем / Г.П. Агибалов, А.А. Скутин // «Исследовано в России». http://zhurnal.ape.relarn.ru/articles/2001/

79. Цой, Ю.Р. Исследование генетического алгоритма с динамически изменяемым размером популяции / Ю.Р. Цой, В.Г. Спицын // Труды международных научно-технических конференций «Интеллектуальные системы

80. EE AIS'05)» и «Интеллектуальные САПР (CAD-2005)». М.: Физматлит, 2005.-С. 241-246.

81. Arabas, J. GAVAPS—a genetic algorithm with varying population size / J. Arabas, Z. Michalewicz, J. Mulawka // Proceedings of the First IEEE International Conference on Evolutionary Computation. New York: IEEE Press, 1994. -P. 73-78.

82. Baeck, T. Self-adaptation in genetic algorithms / T. Baeck // Towards a Practice of Autonomous Systems: Proceedings of the First European Conference on Artificial Life / eds. F.J. Varela, P. Bourgine. Cambridge, MA: MIT Press, 1992. -P.263-271.

83. Baeck, T. An empirical study on GAs "without parameters" / T. Baeck, A.E. Eiben, N.A.L. van der Vaart // Proceedings of the 6th Conference on Parallel Problem Solving from Nature. LNCS no.1917. Berlin: Springer, 2000. - P. 315324.

84. Beyer, H.-G. How to analyse evolutionary algorithms : Technical report no. CI-139/02 / H.-G. Beyer, H.-P. Schwefel, I. Wegener. University of Dortmund, Germany, 2002. - http://sfbci.cs.uni-dortmund.de

85. De Jong, K.A. An analysis of the behavior of a class of genetic adaptive systems : Unpublished PhD thesis / K. De Jong. University of Michigan, Ann Arbor, 1975. - Also University microfilms No. 76-9381 - http://www.cs.gmu.edu

86. Fullmer, B. Using marker-based genetic encoding of neural networks to evolve finite state behavior / B. Fullmer, R. Miikkulainen // Toward a Practice of

87. Autonomous Systems: Proceedings of the First European Conference on Artificial Life (ECAL-91). Paris, 1991. - P.255-262.

88. Whitley, D. Genetic Algorithms and Neural Networks: Optimizing Connections and Connectivity / D. Whitley, T. Starkweather, C. Bogart // Parallel Computing, 1990. №14. - P. 341-361.

89. Altenberg, L. The schema theorem and Price's theorem / L. Altenberg // Foundations of Genetic Algorithms, 1995. №3. - P. 23-50.

90. Altenberg, L. Evolutionary Computation Models from Population Genetics / L. Altenberg // Proceedings of Congress on Evolutionary Computation (CEC-2000). 2000. http://dynamics.org/~altenber

91. Barnett, L. Recombination and bistability in finite populations / L. Bar-nett // Technical report. School of Cognitive and Computing Sciences, University of Sussex, Brighton, UK, 1998. http://www.cogs.susx.ac.uk/users/lionelb/

92. Eiben, A.E. Theory of Evolutionary Algorithms: A Bird's Eye View / A.E. Eiben, G. Rudolph//Theoretical Computer Science. 1999. - №1. - P. 3-9.

93. Goldberg, D.E. Genetic algorithms, noise, and the sizing of populations / D.E. Goldberg, K. Deb, J.H. Clark // Complex Systems. 1992. - №6. - P. 333362.

94. Shapiro, J.L. Statistical Mechanics Theory of Genetic Algorithms. / J.L. Shapiro // Proceedings of 2nd EvoNet Summer School on Theoretical Aspects of Evolutionary Computing. Heidelberg: Springer, 2001 P. 87-108.

95. Vose, M. D. Punctuated equilibria in genetic search / M. D. Vose, G. E. Liepins // Complex Systems. -1991, №5. - P. 3 И4.

96. Nix A.E., Vose M.D. Modeling genetic algorithms with Markov chains // Annals of Mathematics and Artificial Intelligence. 1991. - №5. - P. 79-88.

97. Prugel-Bennett, A. Modelling Evolving Populations. / A.Prugel-Bennett // Journal of Theor. Biol. 1997. - №185. - P. 81-95.

98. Mitchell, M. An Introduction to Genetic Algorithms. / M. Mitchell // Cambridge, MA: The MITPress, 1999. http://qai.narod.ru/GA

99. Spears, W. The equilibrium and transient behavior of mutation and recombination. / W. Spears // Foundations of Genetic Algorithms. 2001. - №6. -P.241-260.

100. Thierens, D. Scalability problems of simple genetic algorithms. / D. Thierens // Evolutionary Computation, 1999. №4. - P. 331-352.

101. Wright, A.H. Markov Chain Models of Genetic Algorithms / A.H. Wright, Y. Zhao. http://www.cs.umt.edu/wright/

102. Ю2.Гуруге, А. Корпоративные порталы на основе XML и WEB-служб / А. Гуруге М.: КУДИЦ-ОБРАЗ, 2004. — 368 с.

103. Polgar, J. Building and Managing Enterprise-Wide Portals / J. Polgar, R.M. Bram, A. Polgar M.: NY, 2005. - 335 p.

104. Shilakes, C.C. Enterprise Information Portals / C.C. Shilakes J. Tylman. -http://coфsite.ru/Encyclopedia/CoфPortal/PortalDdefinition.aspx

105. Тихонов, A.H. Интернет-порталы: содержание и технологии / A.H. Тихонов // ГНИИ ИТТ "Информика". М.: Просвещение, 2003. - 720 с.

106. Результаты тестов ТРС-С. http://www.tpc.org.

107. Результаты тестов SPEC. http://www.spec.org.

108. Результаты тестов SAP. http://www.sap.com/solutions/benchmark.

109. Пашков, Д.В. Обзор современных систем автоматизации делопроизводства и документооборота. / Д.В. Пашков http://eos.ru/eos/104763

110. Российские системы электронного документооборота ждет большое будущее. http://www.cnews.ru/newcom/index.shtml72003/02/07/140582

111. Ш.Шеян И. Электронное развитие документооборота. / И. Шеян -http://eos.ru/eos/53945

112. Документооборот на предприятии / Под ред. А.В. Жеребенковой. -М.: ООО "Вершина", 2004. 384 с.

113. Смирнов, С.Н. Обработка документов средствами Oracle. Практикум по XML и JDBC / С.Н. Смирнов. М.: Гелиос АРВ, 2004. - 192 с.

114. Филиппов, В.А. Многомерные СУБД при создании корпоративных информационных систем. / В.А. Филиппов. М.: Эдиториал УРСС, 2001. -80 с.

115. Филиппов, В.А. Электронные хранилища информации и WEB-технологии / В.А. Филиппов. М.: Эдиториал УРСС, 2001. - 80 с.

116. Пб.Гайфуллин, Б. Внедрение ERP-системы: оценка окупаемости инвестиций / Б. Гайфуллин. http://www.interface.ru/

117. Саттон, М.Д. Корпоративный документооборот. Принципы, технологии, методология внедрения / М.Д. Саттон. Азбука 2002, - 448 с.

118. Арлазаров, B.JI. Документооборот. Прикладные аспекты. / B.JI. Арлазаров УРСС, 2005. — 184 с.

119. Шукаев, В. Документооборот бизнес-процессов в бюджетировании / В. Шукаев Спутник+, 2005г. - 135 с.

120. Hartmann, V. Evolving agent swarms for clustering and sorting. / V. Hartmann // In Proceedings of the Genetic and Evolutionary Computation Conference. ACM. 2005. - P. 217-224.

121. Holliday, J. Partial database replication using epidemic communication. / J. Holliday, D. Agrawal, A. E. Abbadi // In Proceedings of the 22nd International Conference on Distributed Computing Systems, IEEE Computer Society. 2002. -P. 485-493.

122. Loukopoulo, T. Static and adaptive distributed data replication using genetic algorithms. / T. Loukopoulo, I. Ahmad. // Journal of Parallel and Distributed Computing. 2004. - №11. - P. 1270-1285.

123. Peysakhov, M.D. Dynamic data replication: an approach to providing fault-tolerant shared memory clusters. / M. D. Peysakhov, W.C. Regli // In Proceedings of the Ninth Annual Symposium on High Performance Computer Architecture. 2003. - P. 203-214.

124. Saito, Y. Optimistic replication. / Y. Saito, M. Shapiro // ACM Computing Surveys. -2005. -№1.-P.42-81.

125. Система анализа пропускной способности линий связи http://www.visualroute.com

126. Отрытая база данных IP-адресов http://www.ipgeobase.ru