автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Модель и алгоритмы управления параметрами репликации в распределенной базе данных предприятия горнопромышленного комплекса

кандидата технических наук
Дунаев, Валерий Александрович
город
Орел
год
2014
специальность ВАК РФ
05.13.06
Диссертация по информатике, вычислительной технике и управлению на тему «Модель и алгоритмы управления параметрами репликации в распределенной базе данных предприятия горнопромышленного комплекса»

Автореферат диссертации по теме "Модель и алгоритмы управления параметрами репликации в распределенной базе данных предприятия горнопромышленного комплекса"

На правах рукописи

ДУНАЕВ ВАЛЕРИИ АЛЕКСАНДРОВИЧ

МОДЕЛЬ И АЛГОРИТМЫ УПРАВЛЕНИЯ ПАРАМЕТРАМИ РЕПЛИКАЦИИ В РАСПРЕДЕЛЕННОЙ БАЗЕ ДАННЫХ ПРЕДПРИЯТИЯ ГОРНОПРОМЫШЛЕННОГО КОМПЛЕКСА

Специальность 05.13.06 Автоматизация и управление технологическими процессами и производствами (промышленность)

АВТОРЕФЕРАТ на соискание ученой степени кандидата технических наук

1 5 КАП

Орел 2014

005548131

Работа выполнена в Государственном казённом образовательном учреждении высшего профессионального образования Академия Федеральной службы охраны Российской Федерации.

Научный руководитель: кандидат технических наук, доцент

Тараканов Олег Викторович,

Официальные оппоненты: Корсунов Николай Иванович,

доктор технических наук, профессор, ФГАОУ ВПО «Белгородский государственный национальный исследовательский университет», профессор кафедры математического и программного обеспечения информационных систем

Лунёв Роман Алексеевич, кандидат технических наук, доцент, ФГБОУ ВПО «Госуниверситет - УНПК», доцент кафедры «Информационные системы»

Ведущая организация: ФГБУН Институт программных систем

им. А.К. Айламазяна РАН (ИПС им. А.К. Айламазяна РАН),

Защита состоится « 24 » июня 2014 г. в 15 часов 30 минут на заседании диссертационного совета Д 212.182.01 при федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Государственный университет — учебно-научно-производственный комплекс» по адресу: 302020, РФ, г. Орел, Наугорское шоссе, д. 29., ауд. 212.

С диссертацией можно ознакомиться в библиотеке Госуниверситета - УНПК.

Материалы по защите диссертации размещены на официальном сайте Госуниверситета - УНПК по адресу: www.gu-unpk.ru

Автореферат разослан « 29 » апреля 2014 г. Ученый секретарь

диссертационного совета Д.212.182.01

кандидат технических наук, доцент а В.Н. Волков

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Горнопромышленные комплексы (ГПК) по добыче угля являются территориально распределенными большими организационно-техническими системами. Производственный процесс угледобычи относится к классу опасных производств, что обуславливает высокие требования к системе управления ГПК. Множество служб ГПК, отличающихся по уровню и выполняемым задачам, порождает высокую интенсивность потоков информации, передаваемых между различными объектами шахты. Эффективное управление сложным объектом обеспечивается за счет применения комплекса средств автоматизации, на основе которого построена АСУ предприятием ГПК. АСУ предприятием ГПК "ШахтИнвестКузбасс" сформирована по классическим принципам и территориально распределена по службам шахты.

Повышенные требования к безопасности в угольных шахтах делают необходимым применение оперативных и достоверных систем сбора и обработки информации. Необходима организация информационного обеспечения, при которой пользователи на различных участках ГПК могли бы оперативно получать актуальную информацию для принятия управленческих решений. В системе управления ГПК "ШахтИнвестКузбасс" информационное обеспечение построено на основе распределенной базы данных (РБД), интегрирующей на уровне информации функциональные подсистемы АСУ.

Существующие технологии РБД позволяют равномерно распределить нагрузку между удаленными серверами, собирающими и обрабатывающими данные от различных служб ГПК, повысить отказоустойчивость системы. Однако применение в рамках специализированного информационного обеспечения управления предприятием ГПК технологий РБД предполагает решение дополнительных задач по поддержанию копий данных в непротиворечивом состоянии, разрешению конфликтов при блокировках наборов записей, восстановлению при сбоях. Это достигается за счет репликации данных. Расчет значений её параметров, при которых достигается высокая эффективность функционирования системы, является сложной задачей, которая на настоящий момент, применительно к условиям функционирования ГПК, не имеет однозначного решения.

Так как основное назначение РБД состоит в удовлетворении информационных потребностей пользователей (приложений), то оценку эффективности её функционирования целесообразно производить с точки зрения эффективности выполнения запросов и транзакций, отражающих информационные потребности конечных пользователей, приложений и действий над РБД.

Вопросам управления репликацией в РБД посвящено множество работ зарубежных ученых: К. Луни, Б. Брила, С. Рига, X. Кросинга, С. Марча, Ж. Науманна и др. Среди отечественных исследователей необходимо отметить работы, посвященные вопросам разработки моделей и алгоритмов управления репликацией в РБД: А. Апанасевича, А. Ю. Иванова, В. Н. Кухарева, В. Е. Белоусова, С. Д. Кузнецова и др. Работа Л. И. Мейкшан посвящена разработке модели двухуровневой информационной системы с репликацией данных, доработка которой выполнена в диссертационном исследовании.

Так как АСУ предприятием ГПК функционирует в условиях большого количества случайных факторов: повышенная влажность, запыленность, сейсмоактивность, низкие и высокие температуры, вибрации, то используемое оборудование оснащается дополнительными элементами, снижающими влияние данных факторов. Так, в помещениях шахты с взрывоопасной средой используются понижающие разделительные трансформаторы, оборудование взрывозащищенного и искробезопасного исполнения. С другой стороны, наличие специализированного оборудования повышает стоимость и, как следствие,

требует эффективного распределения ресурсов при настройке специализированного информационного обеспечения. При этом нерациональный выбор параметров репликации данных влечет за собой превышение допустимых временных задержек на различных этапах обработки запросов и, как следствие, снижает оперативность отклика РБД.

В результате возникает противоречие, состоящее в том, что уменьшение количества реплицируемых данных порождает увеличение числа удаленных заявок на обслуживание. Как следствие, среднее время отклика РБД на запросы увеличивается за счет удаленного обслуживания запросов. С другой стороны, увеличение количества реплицируемых данных приводит к росту числа заявок на репликацию, что создает дефицит вычислительных и сетевых ресурсов. Среднее время отклика РБД на запросы увеличивается за счет роста временных задержек на различных этапах обслуживания запросов.

Исходя из данных положений тема, посвященная модели и алгоритмам управления параметрами репликации в распределенной базе данных предприятия горнопромышленного комплекса, является актуальной и обуславливает выбор объекта и предмета исследования.

Объект исследования: система управления репликацией в РБД предприятия ГПК.

Предмет исследования: способы, алгоритмы и методы управления репликацией в процессе обработки информации в РБД предприятия ГПК.

Цель исследования: уменьшение времени отклика РБД предприятия ГПК на запросы при заданных ограничениях на временные задержки путем управления параметрами репликации.

В диссертации поставлены следующие частные исследовательские задачи:

1. Провести сравнение известных моделей функционирования РБД при репликации, способов управления параметрами репликации, используемых в АСУ предприятием ГПК.

2. Разработать математическую модель отклика РБД на запросы при репликации, обеспечивающую управление совокупностью параметров репликации на уровне физической интерпретации при ограничениях на временные задержки обработки запросов в различных её элементах.

3. Разработать алгоритм вычисления оптимальной загруженности резервного узла РБД при репликации, позволяющий определять значения параметров репликации и обеспечивающий снижение среднего времени отклика РБД на запросы.

4. Разработать алгоритм выбора фрагментов данных для немедленной репликации, позв'оляющий по установленным значениям параметров репликации определять наборы фрагментов данных для немедленной репликации, при которых достигается снижение среднего времени отклика РБД на запросы.

5. Разработать алгоритм автоматизации процесса конфигурирования репликации в РБД предприятия ГПК, позволяющий вычислять параметры репликации в РБД предприятия ГПК и формировать решения для администратора по её конфигурированию.

Методы исследования, использованные в процессе выполнения диссертационной работы: теория вероятностей и математической статистики, теория массового обслуживания, дифференциального исчисления, теория эффективности целенаправленных процессов, статистического планирования экспериментов.

Диссертационная работа соответствует паспорту специальности 05.13.06 -«Автоматизация и управление технологическими процессами и производствами (промышленность)» по пункту №9: «Методы эффективной организации и ведения специализированного информационного и программного обеспечения АСУТП, АСУП, АСТПП и др., включая базы и банки данных и методы их оптимизации».

Научная новизна:

1. Математическая модель отклика РБД на запросы при репликации, базирующаяся на модели двухуровневой информационной системы с репликацией данных, отличающаяся учетом совокупности параметров: интенсивности запросов на обновление (Я'«) и интенсивности поисковых запросов (Л'д), обрабатываемых на резервных серверах, на уровне физической интерпретации.

2. Алгоритм вычисления оптимальной загруженности резервного узла при репликации в РБД, описываемой математической моделью отклика на запросы, основанный на модифицированном методе линейных комбинаций, отличающийся формированием ограничений, обеспечивающих режим функционирования РБД предприятия ГПК без блокировки.

3. Алгоритм выбора фрагментов данных для немедленной репликации, основанный на оптимизированном методе частично-целочисленного линейного программирования с аддитивным алгоритмом для задач с двоичными переменными, отличающийся процедурой принятия решения по критерию минимума объема пересылаемых реплик.

4. Способ управления репликацией в РБД, основанный на гибридном методе репликации, отличающийся автоматизацией подготовки принятия решения по управлению репликацией, защищенный патентом на изобретение.

Положения, выносимые на защиту:

1. Математическая модель отклика РБД на запросы при репликации.

2. Алгоритм вычисления оптимальной загруженности резервного узла РБД при репликации.

3. Алгоритм выбора фрагментов данных для немедленной репликации.

4. Способ управления репликацией в РБД.

Теоретическая значимость полученных решений заключается в разработке нового гибридного метода репликации, позволяющего за счет управления параметрами репликации в РБД предприятия ГПК подстраиваться под имеющиеся вычислительные и сетевые ресурсы с целью повышения её реактивности.

Практическая значимость заключается в разработке совокупности алгоритмов и доведении их до программной реализации, что подтверждается свидетельствами о государственной регистрации программ для ЭВМ № 2013611771 от 4 февраля 2013 года и № 2013616315 от 19 июня 2013 года, патентом на полезную модель № 126161 от 20 марта 2013 года и изобретением (положительное решение от 25.10.2013 о выдаче патента на изобретение "Способ репликации информации в распределенных базах данных с конкурентным распределением потоков" по заявке № 2012116021).

Полученные результаты могут использоваться на предприятиях ГПК с целью эффективной организации специализированного информационного обеспечения, создающей условия для снижения среднего времени отклика на запросы при заданных ограничениях на временные задержки обработки запросов в различных элементах РБД.

Публикации. По теме диссертационного исследования опубликовано 16 работ, в том числе 5 в изданиях, рекомендованных ВАК при Минобрнауки РФ.

Апробация. Основные положения и результаты работы были доложены и обсуждены на 17-ой Международной открытой научной конференции "Современные проблемы информатизации в моделировании и социальных технологиях" (г. Воронеж, 2012 г.), Международной молодежной научно-практической конференции СКФ МТУСИ "ИН-ФОКОМ-2012" (г. Ростов-на-Дону, 2012 г.), Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых "Научная сессия ТУСУР-2013" (г. Томск, 2013 г.), Международной молодежной научно-практической конференции СКФ

МТУСИ "ИНФОКОМ-2013" (г. Ростов-на-Дону, 2013 г.), Всероссийской научно-практической конференции "Многоядерные процессоры, параллельное программирование, ПЛИС, системы обработки сигналов" (г. Барнаул, Алтайский государственный университет, 2013 г.); 19-ой Международной открытой научной конференции "Современные проблемы информатизации" (г. Воронеж, 2014 г.)

Структура и объем работы. Диссертация состоит из введения, четырех глав и заключения. Диссертация содержит 142 страницы, 31 рисунок, 20 таблиц, 1 приложение. Список литературы содержит 111 наименований.

СОДЕРЖАНИЕ РАБОТЫ Во ВВЕДЕНИИ обоснована актуальность работы, описан объект и предмет исследования, сформулированы цель и задачи диссертационной работы, перечислены использованные в работе методы исследования, обоснована научная новизна, теоретическая и практическая значимость результатов работы.

В ПЕРВОЙ ГЛАВЕ выделены особенности РБД и технологии репликации данных, приведено общее описание информационного обеспечения управления предприятием ГПК, представлена структура РБД предприятия ГПК "ШахтИнвестКузбасс", приведены особенности репликации в ней, рассмотрены подходы к моделированию процессов, протекающих в РБД при репликации.

Информационное обеспечение управления предприятием ГПК представлено РБД с репликацией резервных серверов по расписанию, рисунок 1. Их взаимодействие строится на основе общего информационного фонда, обеспечивающего единый общесистемный подход на всех этапах сбора, обработки и выдачи информации. При этом к подсистеме информационного обеспечения выдвигается ряд требований со стороны других подсистем по обеспечению оптимальным объемом информации в требуемые сроки.

Информационное обеспечение управления предприятием ГПК предназначено для решения задач диспетчерского, производственно-технологического, организационно-экономического управления технологическими процессами шахты, а также повышения безопасности работ проводимых в шахте. При этом информационное обеспечение управления предприятием ГПК представляет собой многоуровневую систему сбора и обработки данных с определенным кругом задач, эффективная интеграция которых в автоматизированной системе достигается в результате правильной организации системы управления данными. При этом распределенный характер и нестабильность условий функционирования шахты обуславливает целесообразность использования для управления данными распределенные базы данных.

Применение технологий РБД для эффективной организации и ведения специализированного информационного обеспечения требует решения задач по конфигурированию репликации. При этом под репликацией понимают процесс копирования информации из одного хранилища данных в другое с последующей синхронизацией их содержимого, направленный на: поддержание узлов данных в актуальном состоянии; обеспечение резервирования данных; объединение информации из нескольких массивов данных; поддержание в работоспособном состоянии узлов с непостоянным соединением с ядром системы. Каждый раз при изменении копии она начинает отличаться от всех прочих. Соответственно, для сохранения непротиворечивости эти изменения должны быть перенесены и на остальные копии, причем как можно быстрее.

Однако в настоящее время в РБД предприятия ГПК "ШахтИнвестКузбасс" репликация проводится по расписанию, что порождает высокую интенсивность удаленных запросов. При этом нерациональная нагрузка на вычислительные и сетевые ресурсы нега-

тивно сказывается на временных задержках обслуживания запросов на различных этапах их обработки, что, в свою очередь, влечет за собой снижение реактивности РБД.

Рисунок 1 - План размещения главного и резервных серверов РБД предприятия ГПК

РБД предприятия ГПК "ШахтИнвестКузбасс", состоящая из одного главного сервера и множества резервных серверов, обрабатывает данные от служб: аэрогазового контроля; вентиляционного проветривания; теплоэнергетики шахты; пожарного водоснабжения; водоотлива; электроснабжения; конвейерного транспорта; технологического оборудования очистных и подготовительных участков шахты; геосейсмического мониторинга; мониторинга параметров шахтного пространства; виброакустического мониторинга горного массива; радиологического мониторинга горного массива; мониторинга и контроля гидрогеологической обстановки; радиозондирования горного массива; системы наблюдения и оповещения персонала.

Общая площадь ГПК "ШахтИнвестКузбасс" составляет более 30 квадратных километров, рисунок 1. Управление технологическими процессами производится на 10 угольных пластах: Выклинившийся, Надартельный 2, Артельный, Абрамовский, Лыжин-ский, Кумпановский, Верхний, Двойной-Промежуточный (1-ая пачка), Двойной-Промежуточный (2-ая пачка).

В диссертационном исследовании доработана модель двухуровневой информационной системы с репликацией данных, представленная в работе Л. И. Мейкшан, на предмет снятия ограничения по управляющим параметрам и детализации времени ожидания и передачи данных по телекоммуникационной подсистеме (ТКС).

ВТОРАЯ ГЛАВА посвящена разработке математической модели отклика РБД на запросы при репликации, базирующейся на модели двухуровневой информационной системы с репликацией данных, отличающейся учетом совокупности параметров: интенсивности запросов на обновление (Х'и) и интенсивности поисковых запросов (А'дХ обрабатываемых на резервных серверах, на уровне физической интерпретации. Новизна и возможность применения представленной модели подтверждается патентом на полезную модель № 126161 "Система децентрализованного управления структурой распределенной базы данных" и изобретением (положительное решение от 25.10.2013 по заявке № 2012116021 о выдаче патента на изобретение "Способ репликации информации в распределенных базах данных с конкурентным распределением потоков").

В работе показано, что закон распределения статистических данных поступления запросов на резервные узлы РБД предприятия ГПК "ШахтИнвестКузбасс" согласуется с

распределением Пуассона, что подтверждается результатами проверки на основе критерия согласия хг Пирсона. При этом закон распределения случайной величины времени обслуживания заявок в резервных узлах - произвольный.

Поступление запросов в соответствии с распределением Пуассона, а

их обслуживание по произвольному закону позволяет моделировать отдельные элементы рассматриваемой РБД с помощью одноканальных СМО типа 1/МАЗ/РСР8. Таким образом, в соответствии с теорией массового обслуживания модель отклика РБД на запросы при репликации можно представить в виде совокупности одноканальных СМО типа 1/МЛл/РСР8, описывающих обработку запросов на главном и резервном серверах, а также передачу данных по ТКС от главного сервера до резервных и обратно, рисунок 2.

Такие модели относятся к классу непрерывно-стохастических ((}-схемы). Имеет место многофазовая <3-схема с одноканальным оператором сопряжения:

0=<№,и,Н,г,К,АЬ>, (1)

где ¡V - подмножество входящих потоков, и - подмножество потоков обслуживания, Н - подмножество собственных параметров, Z - подмножество состояний системы, К - оператор сопряжения, АЬ - оператор алгоритма обслуживания заявок.

Доработка модели двухуровневой информационной системы с репликацией данных Л. И. Мейкшан в соответствии с особенностями РБД предприятия ГПК позволила получить математическую модель отклика на запросы при репликации, в рамках которой среднее время отклика РБД на запросы при репликации определяется как:

Рисунок 2 - Структура РБД предприятия ГПК при репликации

Т(А'с1,Л'и) = IV Лц ■ (Тг(Л^,Л'и) + М[гп?]) +

+ (1 - Л 'д / щ) • (7>(Я'д, Д'и) + Т^(Л^,Л'и) + Г^Л'д, Я'«) +, (2)

+ + М[т%гдо1к1] +

где М[т1ц] - математическое ожидание времени обработки поискового запроса на резервном сервере; математическое ожидание времени передачи запроса с ре-

зервного сервера на главный; Ли - общая интенсивность запросов на обновление; Лц - общая интенсивность поисковых запросов; Л'и - интенсивность запросов на обновление, обрабатываемых на резервном сервере; Я'д - интенсивность поисковых запросов, обрабатываемых на резервном сервере; 7>(Я'д,Я'г/) - среднее время ожидания обслуживания запроса на резервном сервере; Tg(Л'q,Л'u) - среднее время ожидания обслуживания запроса на главном сервере; 7>£(Я'д,Я'«) - среднее время ожидания обслуживания запроса при передаче с резервного сервера на главный; Т&-(Л^,Л'и) - среднее время ожидания обслуживания запроса при передаче с главного сервера на резервный.

Для расчета Гг(Я'д,Я'и), Т§(Л'д,Л'и), Т^(Л'д,Л'и), Т&-(Л^,Л'и) используется формула

Поллачека-Хинчина,

справедливая для СМО типа 1/ШЗ/РСР8.

На рисунке 3 графически представлено расхождение данных, полученных в условиях производства, и модельного среднего времени отклика РБД на запросы при изменении значений управляющих параметров модели. Модельные данные получены на основе программы "сйНерНс", зарегистрированной в Федеральной службе по интеллектуальной собственности (свидетельство о государственной регистрации программы для ЭВМ № 2013618670 от 13 сентября 2013 года).

Оценка чувствительности модели отклика РБД на запросы при репликации проводилась по каждому управляющему параметру в отдельности на основании приращений наблюдаемой переменной. Пары значений приращений оцениваемых параметров: для Я'д - (40%, 83%), для Л'и - (40%, 35%) позволили сформулировать вывод о достаточной чувствительности модели к изменению этих параметров.

Т,Т ,

С

0,55 0,5 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1

/

1 1

ч 1.....

N и

V > /

--------

-

1 5 10 15 20 25 30 35 40 45

10 50 100 150 200 250 300 350 400 450

'Л'и,

зап/мин

^зап/мин

Рисунок 3 - Графики в условиях производства (сплошная линия) и модельного (пунктирная линия) среднего времени отклика РБД на запросы при увлечении значений управляющих параметров

В ТРЕТЬЕЙ ГЛАВЕ представлены алгоритм вычисления оптимальной загруженности резервного узла распределенной базы данных при репликации и алгоритм выбора фрагментов данных для немедленной репликации, проведена оценка их свойств.

Целевой функционал задачи уменьшения среднего времени отклика распределенной базы данных на запросы при заданных ограничениях на временные задержки обработки запросов в различных её элементах за счет обоснованного выбора значений интен-сивностей обработки запросов на резервных серверах имеет вид:

ПА'ч({Х'},1уре),Л'и ({*'},С/*0)"

■ гсип

(Г) 'А \Т<Тд'

(3)

где "А" - совокупность ограничений по свойствам: результативность и ресурсоем-кость; Я'и - интенсивность запросов на обновление, обрабатываемых на резервном сервере; к'ц - интенсивность поисковых запросов, обрабатываемых на резервном сервере.

Алгоритм вычисления оптимальной загруженности резервного узла при репликации в РБД, описываемой математической моделью отклика на запросы, основанный на модифицированном методе линейных комбинаций, отличающийся формированием ограничений, обеспечивающих режим функционирования РБД предприятия ГПК без блокировки, позволяет определять значения параметров репликации, при которых достигается снижение среднего времени отклика РБД на запросы, рисунок 4.

Решение задачи аналитически сопряжено с нахождением корней системы уравнений шестого порядка. По этой причине алгоритм построен с использованием численных методов. В основе алгоритма вычисления оптимальной загруженности резервного узла РБД при репликации лежит градиентный метод наискорейшего спуска, модифицированный для применения при наличии линейных ограничений.

Отдельные этапы алгоритма реализуются на основе симплекс-метода и метода золотого сечения.

Рисунок 4 - Схема алгоритма вычисления оптимальной загруженности резервного узла РБД при репликации

ВВод исхобных Зонных

Алгоритм позволяет при заданных значениях характеристик обслуживания запросов на различных этапах их обработки в РБД вычислять с заданной точностью значения интенсивности запросов на обновление Я'и, обрабатываемых на резервном сервере, и интенсивности поисковых запросов Я'д, обрабатываемых на резервном сервере, при которых достигается минимум среднего времени отклика на запросы при репликации.

Оценка корректности алгоритма проведена согласно методике Бейбера. Корректность алгоритма гарантирована при заданной точности проверки условия равенства результатов его работы в смежных итерациях е&еЬ <10^ секунд и выполнении требований по загруженности РБД 0<йд.<1. Алгоритм обладает достаточной точностью и устойчивостью, относится к классу алгоритмов с полиномиальной сложностью.

Минимум среднего объема пересылаемой по сети информации достигается в том случае, если совокупный размер фрагментов РБД, задействованных в немедленной репликации, минимальный, при условии обслуживания этими фрагментами максимального числа поисковых запросов, обрабатываемых на резервных серверах.

Алгоритм выбора фрагментов данных для немедленной репликации, основанный на оптимизированном методе частично-целочисленного линейного программирования с аддитивным алгоритмом для задач с двоичными переменными, отличающийся процедурой принятия решения по критерию минимума объема пересылаемых реплик, представлен на рисунке 5.

Полученный алгоритм позволяет находить решения за полиномиальное время с учетом снижения точности вычислений менее 5 %.

Критической частью алгоритма является цикл 6-9 с выходом по условию. При этом условием корректного завершения цикла 6-9 является конечное число точек зондирования, определяемое степенью фрагментации данных и производительностью ЭВМ, с использованием которой будут проводиться вычисления.

Показано, что алгоритм выбора фрагментов данных для немедленной репликации корректен по Бейберу при соблюдении предусловия: п <1000, где п - количество обрабатываемых фрагментов данных. Определено, что вычислительная сложность представленного Рисунок 5-Схема алгоритма выбора фрагментов алгоритма соизмерима со сложностью данных для немедленной репликации 0(н4), алгоритм является устойчивым.

Преобразование коэффициентов иелебой функции

Формирование системы ограничений

Формирование начального решения

Целевой функционал задачи имеет вид:

Vq(xi,x2,...,x„) + Vu(x,,x2,...,xll) min(x,,x2,...,x„), (4)

при наличии ограничений:

х, ■ Ли, + х2 ■ Ли2 + ... + х„ - Ли,, < Ли°р' + S Ли01" -S < х, ■Ли, + х2 ■ Ли2 + ... + х„ ■Лип • х, ■ Лд, + х2 ■ Лд2 + ... + х„ Лс/П < Лу"1" +S . (5)

дq°i" - § < Xt . ^q, + х2 ■ Лд2 +... + х„ ■ Лц„ x1,x2,...,xll е {ОД}

При этом:

f/q(xl,x2,...,xll) = X, • Aqt ■ v, +х2 ■ Лд2 ■ v2 + ... + Х,, ■ Лцп ■ v„ , (6)

где Vq - средний объем информации, пересылаемой по сети за единицу времени в рамках удаленного обслуживания поисковых запросов к фрагментам РБД с репликацией по требованию (х( =0), а:

Vu(x1,x2,...,xn) = х, 'Ли, ■v, +х2 ■ Ли2 v2 +..- + х„ -Лип v„, (7)

где Vu - средний объем информации, пересылаемой по сети за единицу времени в рамках обновления фрагментов РБД с немедленной репликацией (х, =1).

В ЧЕТВЕРТОЙ ГЛАВЕ представлена реализация способа управления репликацией в РБД, защищенного патентом на изобретение, в виде алгоритма автоматизации процесса конфигурирования репликации в РБД предприятия ГПК с учетом минимума среднего времени её отклика на запросы (рисунок 6), проведена оценка свойств алгоритма. Получены графики зависимостей интенсивностей обработки поисковых и запросов на обновление на резервных узлах, значения которых соответствуют минимуму среднего времени отклика РБД на запросы.

Рисунок 6 - Схема алгоритма автоматизации процесса конфигурирования репликации в РБД

предприятия ГПК

Алгоритм отличается обеспечением условий функционирования РБД предприятия ГПК с пониженным средним временем отклика на запросы, позволяет вычислять значения параметров репликации в РБД предприятия ГПК и формировать решения для администратора по её конфигурированию.

Разработанный алгоритм автоматизирует процесс конфигурирования репликации в РБД предприятия ГПК за счет вычисления характеристик узлов РБД и ТКС, нахождения решений в соответствии с алгоритмом вычисления оптимальной загруженности резервного узла РБД при репликации и алгоритмом выбора фрагментов данных для немедленной репликации и формирования решений, позволяющих администратору РБД добиваться снижения среднего времени её отклика на запросы.

Вычисление характеристик узлов РБД и ТКС выполняется в рамках теории математической статистики путем корректного сведения средних значений к их математическим ожиданиям. Для нахождения минимального объема выборки, при котором среднее значение характеристики сводится к ее математическому ожиданию, с заданной точностью и надежностью используется выражение:

(8>

где > - коэффициент доверия, а - среднее квадратическое отклонение вариационного признака, 5 - предельная ошибка выборки.

Показано, что вычисление значений количественных признаков РБД предприятия на примере ГПК "ШахтИнвестКузбасс" с учетом обеспечения требуемой точности и надежности вычислений возможно за допустимое время. При этом в качестве значения надежности выбран наиболее трудоемкий вариант, применяемый на практике, / = 0,999.

На основе алгоритма получены значения интенсивностей поисковых и запросов на обновление при изменении одного из параметров во всем рабочем диапазоне значений, при которых среднее время отклика РБД на запросы минимально, рисунок 7, 8.

ГЧ,

00 150 200 250 300 350 400 450 А, тап/мин

Рисунок 7 - График зависимости интенсивности поисковых запросов от изменения интенсивности запросов на обновление во всем рабочем диапазоне значений, при которых среднее время отклика РБД на запросы минимально

Рисунок 8 - График зависимости интенсивности запросов на обновление от изменения интенсивности поисковых запросов во всем рабочем диапазоне значений, при которых среднее время отклика РБД на запросы минимально

В диссертационной работе представлены шаблоны БрЬ-запросов, позволяющие администратору применять полученные решения для настройки репликации в РБД предприятия на примере ГПК "ШахтИнвестКузбасс".

Результаты оценки свойств алгоритма автоматизации процесса конфигурирования репликации в РБД позволили сформулировать вывод, что алгоритм является корректным, устойчивым, обладает полиномиальной сложностью и достаточной точностью.

На основе представленного алгоритма получен вариант набора фрагментов данных для немедленной репликации в условиях допустимого отклонения 3 = 5% от оптимальных значений: = 214,31 запросов в минуту и Х'иор' = 2,07 запроса в минуту.

При данном варианте набора фрагментов данных для немедленной репликации на узлах РБД предприятия ГПК "ШахтИнвестКузбасс" среднее время оклика на один запрос составляет Г = 0,223 секунды, тогда как существующее среднее время отклика 7",,.„,„„„ = 0,239 секунды. Тем самым достигнут выигрыш по среднему времени отклика на запросы в 6,69% по сравнению со штатным режимом функционированием системы. При реагировании на аварийные ситуации функционирования предприятия ГПК, отличающимся значительным всплеском интенсивности поисковых запросов, данный выигрыш обеспечит запас времени для принятия обоснованных решений по оперативному управлению.

В ЗАКЛЮЧЕНИИ перечислены основные результаты диссертационной работы и сформулированы предложения по применению полученных результатов.

В ПРИЛОЖЕНИИ приведены характеристики фрагментов РБД предприятия ГПК "ШахтИнвестКузбасс".

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫ

В диссертационной работе решена актуальная научно-техническая задача разработки модели и алгоритмов управления параметрами репликации в РБД предприятия ГПК, позволяющих снизить время отклика РБД предприятия ГПК на запросы.

В рамках проведенных исследования получены следующие основные результаты:

1. Разработана математическая модель отклика РБД на запросы при репликации, базирующаяся на модели двухуровневой информационной системы с репликацией данных, отличающаяся учетом совокупности параметров: интенсивности запросов на обновление (А'м) и интенсивности поисковых запросов (А'д), обрабатываемых на резервных серверах, на уровне физической интерпретации. Проверка модели на основе сравнения модельного и времени обработки запросов, полученного в условиях производства, выявила достаточную адекватность и точность заявленной модели.

2. На основе математической модели разработаны алгоритмы вычисления оптимальной загруженности резервного узла распределенной-базы данных при репликации и выбора фрагментов данных для немедленной репликации.

Алгоритм вычисления оптимальной загруженности резервного узла при репликации в РБД, описываемой математической моделью отклика на запросы, основанный на модифицированном методе линейных комбинаций, отличающийся формированием ограничений, обеспечивающих режим функционирования РБД предприятия ГПК без блокировки, позволяет определять значения параметров репликации, при которых достигается снижение среднего времени отклика РБД на запросы. Алгоритм является корректным, обладает достаточной точностью, вычислительной устойчивостью и допустимой сложностью.

Алгоритм выбора фрагментов данных для немедленной репликации, основанный на оптимизированном методе частично-целочисленного линейного программирования с аддитивным алгоритмом для задач с двоичными переменными, отличающийся процедурой принятия решения по критерию минимума объема пересылаемых реплик, позволяет находить решения за полиномиальное время с учетом снижения точности вычислений не

более чем на 5 %, является корректным, вычислительно устойчивым и обладает допустимой сложностью.

3. Способ управления репликацией в РБД, защищенный патентом на изобретение, реализован в виде алгоритма автоматизации процесса конфигурирования репликации в РБД предприятия ГПК, отличающегося обеспечением условий функционирования РБД предприятия ГПК с пониженным средним временем отклика на запросы, позволяющего вычислять значения параметров репликации в РБД предприятия ГПК и формировать решения для администратора по её конфигурированию. Оценка свойств алгоритма установила его корректность, устойчивость, полиномиальную сложность и достаточную точность.

Установлено, что для применения представленного алгоритма необходимо ограничится числом фрагментов не превышающим 1000, так как последующая детализация выводит время реализации алгоритма за допустимые пределы в соответствии с современными требованиями к производительности рабочего мета администратора РБД предприятия ГПК "ШахтИнвестКузбасс".

5. Применение представленных алгоритмов на примере РБД предприятия ГПК "ШахтИнвестКузбасс" позволило получить выигрыш по среднему времени отклика на запросы в 6,69 % по сравнению со штатным функционированием системы.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

В ведущих рецензируемых научных изданиях, определенных Высшей аттестационной комиссией:

1. Дунаев, В. А. Разработка модели информационного обмена в распределенных базах данных в режиме репликации / В. А. Дунаев, О. В. Тараканов // Системы управления и информационные технологии. - 2012. - № 4.1(50). - С. 192-196 (доля участия автора - 50%, соответствует пункту 1 научной новизны)

2. Дунаев, В. А. Оценка времени реакции распределенной базы данных на запросы при гибридном механизме репликации / В. А. Дунаев // Информационные системы и технологии. -2013. - № 6 (80). - С. 103-113. (соответствует пунктам 1, 2, 3 научной новизны)

3. Дунаев, В. А. Выбор фрагментов данных для размещения по узлам распределенной базы данных с учетом минимума среднего времени её отклика на запросы / В. А. Дунаев / Системы управления и информационные технологии. - 2013. - № 4(54). - С. 57-60. (соответствует пункту 4 научной новизны)

4. Дунаев, В. А. Модифицированная модель обработки запросов в распределенных базах данных / В. А. Дунаев, О. В. Тараканов // Программные продукты и системы. - 2014. - № 1(105). - С. 70-76 (доля участия автора - 50%, соответствует пункту 1 научной новизны)

5. Дунаев, В. А. Особенности управления параметрами репликации распределенной базы данных предприятия горнопромышленного комплекса / В. А. Дунаев, О. В. Тараканов // Информационные системы и технологии. - 2014. - № 2. - С. 45-52. (доля участия автора - 50%, соответствует пунктам 2, 3, 4 научной новизны)

На научно-технических конференциях Всероссийского и межведомственного уровня:

6. Дунаев, В. А. Методика выбора рациональных значений параметров информационного обмена при репликации распределенной базы данных / В. А. Дунаев // Современные проблемы информатизации в моделировании и социальных технологиях : сборник статей 17-ой Международной открытой научной конференции. - Воронеж : Издательство "Научная книга", 2012. -Вып. 17.-С. 188-190.

7. Дунаев, В. А. Состояние и перспективы развития технологий управления распределенными базами данных / В. А. Дунаев // Труды Северо-Кавказского филиала Московского технического университета связи и информатики. - Ростов-на-Дону : ПЦ "Университет" СКФ МТУ-СИ, 2012.-С. 26-28.

8. Дунаев, В. А. Выбор режимов репликации в базах данных распределенного типа / В. А. Дунаев // Научная сессия ТУСУР-2013 : Материалы Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых. - Томск : В-Спектр, 2013. - Ч. 2. - С. 241243.

9. Дунаев, В. А. Информационный обмен в распределенных базах данных при репликации / В. А. Дунаев, О. В. Тараканов // Труды Северо-Кавказского филиала Московского технического университета связи и информатики. - Ростов-на-Дону : ПЦ "Университет" СКФ МТУ-СИ, 2013. - С. 92-94. (доля участия автора - 40%)

10. Дунаев, В. А. Анализ режимов репликации в базах данных распределенного типа / В. А. Дунаев // Многоядерные процессоры, параллельное программирование, ПЛИС, системы обработки сигналов : сборник статей всероссийской научно-практической конференции. - Барнаул : Барнаул, 2013.-С. 139-142.

11. Дунаев, В. А. Методика выбора фрагментов данных для размещения по узлам распределенной базы данных с учетом минимума среднего времени её отклика на запросы / В. А. Дунаев // Современные проблемы информатизации : сборник статей 19-ой Международной открытой научной конференции. - Yelm, WA, USA : Science Book Publishing House, 2014. - С. 166-169.

В других изданиях:

12. Дунаев, В. А. Математическое моделирование информационного обмена в распределенных базах данных в режиме репликации / В. А. Дунаев, О. В. Тараканов // Информационные технологии моделирования и управления. - 2012. - № 6(78). - С. 458-465 (доля участия автора -60%)

Свидетельства о государственной регистрации программ для ЭВМ:

13. Расчет функциональной живучести информационных систем с распределенной базой данных при репликации : свидетельство о государственной регистрации программ для ЭВМ № 2013611771 / В. А. Дунаев, О. Ю. Миронов, Н. В. Покусин, Д. О. Кривошея, заявка № 2012661052 от 13.12.2012. (доля участия автора - 25%, соответствует пунктам 2, 3 научной новизны)

14. ctrlReplic : свидетельство о государственной регистрации программ для ЭВМ № 2013618670 / В. А. Дунаев, А. А. Целышков, Ю. И. Федоров, А. Ю. Кузнецов, И. О. Ковыршин, О. А. Сенотрусов. заявка № 2013616315 от 19.07.2013. (доля участия автора - 30 %, соответствует пунктам 2, 3 научной новизны)

Изобретения и полезные модели:

15. Система децентрализованного управления структурой распределенной базы данных : пат. на полезную модель № 126161 Рос. Федерация : МПК8 G 06 F 12/00 / [В. А. Дунаев, Е. В. Лебеденко и др.] ; патентообладатель Гос. казенное образовательное учреждение высш. проф. образования Академия ФСО России. - №2012116023 ; заявл. 19.04.2012, опубл. 20.03.2013. (доля участия автора - 25 %, соответствует пунктам 2, 3 научной новизны)

16. Положительное решение от 25.10.2013 по заявке № 2012116021 о выдаче патента на изобретение "Способ репликации информации в распределенных базах данных с конкурентным распределением потоков". / В. А. Дунаев, О. В. Тараканов, С. В. Козлов, (доля участия автора -40 %, соответствует пункту 4 научной новизны)

ЛР ИД № 00670 от 05.01.2000 г.

Подписано к печати « 22 » апреля 2014 г.

Усл. печ. л.1 Тираж 100 экз.

Заказ № 179.

Полиграфический отдел «Госуниверситет-УНПК» 302035, г. Орел, ул. Московская, 65

Текст работы Дунаев, Валерий Александрович, диссертация по теме Автоматизация и управление технологическими процессами и производствами (по отраслям)

ФКОУ В ПО Академия ФСО России

На правах рукописи

04201455925

ДУНАЕВ ВАЛЕРИЙ АЛЕКСАНДРОВИЧ

МОДЕЛЬ И АЛГОРИТМЫ УПРАВЛЕНИЯ ПАРАМЕТРАМИ

РЕПЛИКАЦИИ В РАСПРЕДЕЛЕННОЙ БАЗЕ ДАННЫХ ПРЕДПРИЯТИЯ ГОРНОПРОМЫШЛЕННОГО КОМПЛЕКСА

Специальность 05.13.06 - "Автоматизация и управление технологическими процессами и производствами (промышленность)"

ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук

Научный руководитель: кандидат технических наук, доцент Тараканов О.В.

Орел 2014

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ..............................................................................................................7

ГЛАВА 1. ОБСЛЕДОВАНИЕ МОДЕЛЕЙ ОБРАБОТКИ ИНФОРМАЦИИ В РАСПРЕДЕЛЕННЫХ БАЗАХ ДАННЫХ ПРИ РЕПЛИКАЦИИ.....................18

1.1 Описание технологий репликации в распределенных баз данных.........18

1.2 Описание информационного обеспечения управления предприятием ГПК......................................................................................................................22

1.3 Описание подходов к моделированию процессов, протекающих в распределённых базах данных..........................................................................30

1.4 Описание процесса репликации в РБД предприятия ГПК "ШахтИнвестКузбасс".......................................................................................36

1.5 Постановка задачи исследования...............................................................37

ГЛАВА 2. РАЗРАБОТКА МОДЕЛИ ОТКЛИКА РБД НА ЗАПРОСЫ ПРИ РЕПЛИКАЦИИ......................................................................................................43

2.1 Выбор математического аппарата для разработки модели......................43

2.2 Модель отклика РБД на запросы при репликации...................................47

2.2.1 Обоснование выбора схемы владения данными.................................47

2.2.2 Проверка гипотезы о согласовании законов распределения потоков заявок с распределением Пуассона...............................................................50

2.2.3 Общий вид модели.................................................................................54

2.2.4 Модель обработки запросов на резервном сервере............................58

2.2.5 Модель обработки запросов па главном сервере................................58

2.2.6 Модель обработки запросов на участке сети от главного сервера до резервного........................................................................................................59

2.2.7 Модель обработки запросов на участке сети от резервного сервера до главного.......................................................................................................60

2.3 Проверка адекватности модели отклика РБД на запросы при репликации..........................................................................................................60

2.4 Проверка чувствительности модели отклика РБД на запросы при репликации..........................................................................................................62

ГЛАВА 3. РАЗРАБОТКА АЛГОРИТМОВ ВЫЧИСЛЕНИЯ ЗНАЧЕНИЙ ПАРАМЕТРОВ РБД ПРИ РЕПЛИКАЦИИ........................................................67

3.1 Задача минимизации среднего времени отклика РБД па запросы..........67

3.2 Обоснование математического метода решения задачи минимизации среднего времени отклика РБД на запросы.....................................................69

3.3 Алгоритм вычисления оптимальной загруженности резервного узла распределенной базы данных при репликации...............................................74

3.4 Свойства алгоритма вычисления оптимальной загруженности резервного узла распределенной базы данных при репликации...................82

3.4.1 Оценка корректности алгоритма..........................................................82

3.4.2 Оценка сложности алгоритма...............................................................84

3.4.3 Оценка точности алгоритма..................................................................85

3.4.4 Оценка вычислительной устойчивости алгоритма.............................86

3.5 Алгоритм выбора фрагментов данных для немедленной репликации...88

3.6 Свойства алгоритма выбора фрагментов данных для немедленной репликации..........................................................................................................95

3.6.1 Оценка корректности алгоритма..........................................................95

3.6.2 Оценка вычислительной сложности алгоритма..................................96

3.6.3 Оценка точности алгоритма..................................................................96

3.6.4 Оценка вычислительной устойчивости...............................................97

ГЛАВА 4. РАЗРАБОТКА АЛГОРИТМА АВТОМАТИЗАЦИИ ПРОЦЕССА КОНФИГУРИРОВАНИЯ РЕПЛИКАЦИИ В РБД ПРЕДПРИЯТИЯ ГПК.... 100

4.1. Алгоритм автоматизации процесса конфигурирования репликации в РБД предприятия ГПК.....................................................................................100

4.2. Этап вычисления значений характеристик РБД....................................101

4.2.1 Оценка применимости этапа вычисления значений характеристик РБД предприятия ГПК "ШахтИпвестКузбасс"..........................................105

4.3. Этап вычисления оптимальной загруженности резервного узла и выбора фрагментов данных для немедленной репликации.........................113

4.3.1 Пример выбора фрагментов данных для немедленной репликации .........................................................................................................................116

4.4 Этап формирования рекомендаций для администратора РБД

предприятия ГПК по репликации...................................................................119

ЗАКЛЮЧЕНИЕ....................................................................................................123

Список использованных источников.................................................................127

Приложение А. Характеристики фрагментов РБД предприятия ГПК "ШахтИнвестКузбасс".........................................................................................13 8

Определения, обозначения и сокращения

В настоящей работе применяют следующие термины с соответствующими определениями:

Область адекватности — некоторая окрестность значений показателей существенных свойств [54].

Репликация - процесс копирования информации из одного хранилища данных в другое с последующей синхронизацией их содержимого [16].

Фрагментация - процесс, посредством которого файлы (или эквивалентные объекты базы данных, такие как отношения) разбиваются на части и распределяются по нескольким локальным узлам [76].

База данных - совместно используемый набор логически связанных данных, предназначенный для удовлетворения информационных потребностей пользователей [48].

Параметр - количественное отражение некоторого свойства элемента системы [54].

БД - база данных.

РБД - распределенная база данных.

ГПК - горнопромышленный комплекс.

СМО — система массового обслуживания.

СеМО - сеть массового обслуживания.

МО - математическое ожидание.

FCFS - First-Come, First-Served.

СКО - среднее квадратическое отклонение.

Gflops - Billions of FLoating-point Operations Per Second.

СУБД - система управления базами данных.

SQL - Structured Query Language.

AC - автоматизированная система.

АСУ - автоматизированная система управления.

ТКС - телекоммуникационная подсистема.

СУ ГПК - система управления горнопромышленным комплексом. КИВС - корпоративная информационно-вычислительная сеть

ВВЕДЕНИЕ

Актуальность темы. Горнопромышленные комплексы (ГПК) по добыче угля являются территориально распределенными большими организационно-техническими системами. Производственный процесс угледобычи относится к классу опасных производств, что обуславливает высокие требования к системе управления ГПК [75, 38, 96].

Множество служб ГПК, отличающихся по уровню и выполняемым задачам, порождает высокую интенсивность потоков информации, передаваемых между различными объектами шахты. Эффективное управление сложным объектом обеспечивается за счет применения комплекса средств автоматизации, па основе которого построена АСУ предприятием ГПК [89]. АСУ предприятием ГПК "ШахтИпвестКузбасс" сформирована по классическим принципам и территориально распределена по службам шахты.

Повышенные требования к безопасности в угольных шахтах делают необходимым применение оперативных и достоверных систем сбора и обработки информации [71]. Необходима организация информационного обеспечения, при которой пользователи на различных участках ГПК могли бы оперативно получать актуальную информацию для принятия управленческих решений. В системе управления ГПК "ШахтИпвестКузбасс" информационное обеспечение построено па основе распределенной базы данных (РБД), интегрирующей на уровне информации функциональные подсистемы АСУ.

В общем случае СУ ГПК содержит следующие службы:

- аэрогазового контроля;

- вентиляционного проветривания;

- теплоэнергетики шахты;

- пожарного водоснабжения;

- водоотлива;

- электроснабжения;

- конвейерного транспорта;

-технологического оборудования очистных и подготовительных участков шахты;

- геосейсмического мониторинга;

- мониторинга параметров шахтного пространства;

- виброакустического мониторинга горного массива;

- радиологического мониторинга горного массива;

- мониторинга и контроля гидрогеологической обстановки;

- радиозондирования горного массива;

- системы наблюдения и оповещения персонала.

Так, например, система наблюдения и оповещения персонала обслуживает большое количество запросов по сбору и обработке данных о местоположении каждого персонального датчика, собирает данные о перемещениях и по запросу передает информацию горному диспетчеру. Современное оборудование позволяет устанавливать местонахождение рабочего персонала со средней точностью 0,34 метра, а при необходимости производить аварийное отключение угледобывающих установок. Территориальное распределение компонентов АСУ предприятием ГПК и высокие вычислительные нагрузки в купе с требованиями по отказоустойчивости компонентов АСУ предприятием ГПК создают предпосылки к эффективной организации распределенной обработки данных [61].

Построение распределенных систем обработки информации реализуется в рамках трех архитектур [85]:

1. Архитектура с разделением файлов, включающая несколько клиентов, связанных сетью с файловым сервером. При этом файловый сервер хранит все разделяемые клиентами файлы. Данная архитектура, самая простая с точки зрения построения. Однако при большом количестве запросов от клиентов и их территориальном удалении использование архитектуры с разделением файлов приводит к высоким нагрузкам на телекоммуникационную подсистему и файловый сервер. С другой стороны, при выходе из строя файлового сервера или перебое связи с ним происходит

отказ системы в целом. В условиях повышенных требований к безопасности в угольных шахтах, применение архитектуры с разделением файлов для эффективной организации информационного обеспечения АСУ предприятием ГПК недопустимо.

2. Сервер баз данных, передающий лишь ответы на запросы, тем самым уменьшает нагрузку на телекоммуникационную подсистему. Основной недостаток такой архитектуры заключается в ее низкой масштабируемости. Так, при увеличении количества клиентов и их территориальном удалении задержки, возникающие при обслуживании удаленных запросов, выходят за рамки допустимых пределов. Преодоление данного недостатка возможно построением АСУ на основе архитектуры РБД.

3. Распределенная база данных позволяет равномернее распределять нагрузку между удаленными серверами, собирающими и обрабатывающими данные от различных служб ГПК, повышать отказоустойчивость системы. При выходе из строя одного из серверов остальные продолжают работу. После восстановления вышедший из строя узел синхронизируется с остальными и продолжает работу в штатном режиме.

Применение в рамках специализированного информационного обеспечения управления предприятием ГПК технологий РБД предполагает решение дополнительных задач по поддержанию копий данных в непротиворечивом состоянии, разрешению конфликтов при блокировках наборов записей, восстановлению при сбоях. Это достигается за счет репликации данных. Расчет значений её параметров, при которых достигается высокая эффективность функционирования системы, является сложной задачей, которая на настоящий момент, применительно к условиям функционирования ГПК, не имеет однозначного решения.

Так как АСУ предприятием ГПК функционирует в условиях большого количества случайных факторов: повышенная влажность, запыленность, сейсмоактивность, низкие и высокие температуры, вибрации, то используемое оборудование оснащается дополнительными элементами, снижающими влияние данных факторов. Например, в помещениях шахты с

взрывоопасной средой используются понижающие разделительные трансформаторы, оборудование взрывозащищеиного и искробезопасного исполнения [77]. С другой стороны, наличие специализированного оборудования повышает стоимость и, как следствие, требует эффективного распределения ресурсов при настройке специализированного информационного обеспечения. При этом нерациональный выбор параметров репликации данных влечет за собой превышение допустимых временных задержек на различных этапах обработки запросов и, как следствие, снижает оперативность отклика РБД [6].

Так как основное назначение РБД - удовлетворение информационных потребностей пользователей (приложений), то оценка эффективности функционирования РБД должна производиться с точки зрения эффективности выполнения запросов и транзакций, отражающих информационные потребности конечных пользователей, приложений и действий над РБД [55].

Согласно теории эффективности целенаправленных процессов эффективность процесса выполнения запросов и транзакций оценивается по трем показателям: оперативности, результативности и ресурсоемкости. При этом под оперативностью выполнения запросов • и транзакций, в общем случае, понимают расход времени, потребного для отклика РБД па запросы. Результативность выполнения запросов и транзакций определяется получаемым целевым эффектом - результатом, ради которого функционирует система. Ресурсоемкость характеризуется ресурсами всех видов, используемыми для получения целевого эффекта [68, 54, 10].

На практике ограничиваются оценкой отклика РБД на запросы при репликации по частным показателям оперативности, а показатели результативности и ресурсоемкости вводят в ограничения. Это связанно с тем, что, как правило, вычислительные и сетевые ресурсы заданы априорио, а результативность характеризуется единственно возможным значением показателя - завершенностью операции отклика.

При синхронной репликации транзакции не фиксируются до тех пор, пока иа всех узлах, содержащих копии данных, не будут внесены изменения. Это позволяет добиться максимальной актуальности данных, но вносит дополнительные задержки, вызванные блокировкой обновляемых данных. Реализация синхронной репликации возможна только при наличии надежных высокоскоростных каналов связи.

При асинхронной репликации изменения в копии данных вносятся независимо, что позволяет избавиться от задержек блокировок. Однако при таком подходе снижается текущая актуальность данных в РБД. Режим асинхронной репликации предъявляет более гибкие требования к ресурсам сети.

Помимо выбора типа репликации для достижения высокой оперативности отклика па запросы необходим правильный выбор фрагментов немедленно реплицируемых данных на узлах РБД. Прииятие решения о выборе того или иного фрагмента для немедленной репликации должно производиться с точки зрения оценки интенсивности поисковых запросов и запросов на обновление к этому фрагменту, а также времени их обработки в соответствии с доступными вычислительными и сетевыми ресурсами.

В результате возникает противоречие, состоящее в том, что уменьшение количества реплицируемых данных порождает увеличение числа удаленных заявок па выборку данных и снижение числа заявок на выборку, обрабатываемых па резервных серверах.

Как следствие, среднее время отклика РБД на запросы увеличивается за счет удаленного обслуживания запросов, рисунок 1. Где Л'и — интенсивность потока заявок иа обновление; Л'ц - интенсивность потока заявок на выборку данных, обрабатываемых удаленно; Л'ц — интенсивность потока заявок па выборку, обрабатываемых локально; п - количество резервных серверов.

Гла&ный сер&ер

Рисунок 1 - Случай, когда доля реплицированных данных мала

С другой стороны, увеличение количества реплицируемых данных приводит к росту числа заявок на репликацию, что создает дефицит вычислительных и сетевых ресурсов. Так, среднее время отклика РБД на запросы увеличивается за счет роста временных задержек на различных этапах обработки запросов, рисунок 2.

Гла&ный серВер

Рисунок 2 - Случай, когда доля реплицированных данных велика

Таким образом, в условиях заданных ограничений на временные задержки обработки запросов в различных элементах РБД необоснованный выбор немедленно реплицируемых фрагментов данных на узлах РБД снижает оперативность отклика на запросы.

Вопросам управления репликацией в РБД посвящено множество работ зарубежных ученых: Э. Танепбаума, Т. Коннолли, К. Луни, Б. Брила, С. Рига, X. Кросипга, Ж. Йохансопа, С. Марча, Ж. Наумапна и др. [105, 48, 76, 85, 74, 57]. Среди отечественных исследователей вопросами, посвященными разработке моделей и алгоритмов управления репликацией в РБД, занимались: Д. А. Апанасевич, А. Ю. Иванов, В. П.,Кухарев, Л. И. Мейкшан, К. А. Карельская, И. В. Сергеев, В. Е. Белоусова, С. Д. Кузнецов, В. В. Кульба и др. [3, 8, 43, 56, 79, 41, 60, 45, 53, 55].

Несмотря на продолжительный период активного изучения данной тематики, вопрос ра�