автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Организационно-техническое обеспечение центров обработки данных железнодорожного транспорта

кандидата технических наук
Зотова, Марина Александровна
город
Москва
год
2015
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Организационно-техническое обеспечение центров обработки данных железнодорожного транспорта»

Автореферат диссертации по теме "Организационно-техническое обеспечение центров обработки данных железнодорожного транспорта"

На правах рукописи

/•7

С.

Зотова Марина Александровна

ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ЦЕНТРОВ ОБРАБОТКИ ДАННЫХ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

05.13.01 - Системный анализ, управление и обработка информации (транспорт)

Автореферат диссертации на соискание ученой степени кандидата технических наук

005567927

Москва-2015

005567927

Работа выполнена в федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Московский государственный университет путей сообщения» МГУПС (МИИТ) на кафедре «Вычислительная техника».

Научный руководитель - доктор технических наук, профессор,

Горелик Владимир Юдаевич Официальные оппоненты: Бубнов Владимир Петрович,

доктор технических наук, доцент, федеральное государственное бюджетное образовательное учреждение высшего

профессионального образования «Петербургский государственный университет путей сообщения Императора Александра I», профессор кафедры «Информационные и вычислительные системы»;

Новикова Мария Владимировна, кандидат технических наук,

открытое акционерное общество «Аэрофлот -российские авиалинии», Департамент

информационных систем, ГГ-специалист. Ведущая организация - Федеральное государственное бюджетное

образовательное учреждение высшего

профессионального образования «Ростовский государственный университет путей сообщения»

Защита состоится 09 апреля 2015 года, в 13 часов 30 минут на заседании диссертационного совета Д 218.005.07 на базе федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Московский государственный университет путей сообщения» по адресу: 127994, г. Москва, ул. Образцова, д. 9, стр. 9, ауд. 2505.

С диссертацией можно ознакомиться в библиотеке МГУПС (МИИТ) и на сайте www.miit.ru.

Автореферат разослан 10 февраля 2015 года.

Ученый секретарь

диссертационного совета Горелик Александр Владимирович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. В Российской Федерации функции управления железнодорожным транспортом принадлежат ОАО «Российские железные дороги» (ОАО «РЖД»). В настоящее время при передаче запросов в корпоративной вычислительной сети (КВС) ОАО «РЖД» основными средствами обработки запросов являются центры обработки данных (ЦОД).

Эффективность работы существующей в настоящее время корпоративной сети зависит от расположения ЦОД на различных информационно-вычислительных центрах (ИВЦ) железной дороги. Внедрение новых технологий обработки запросов в сети существенным образом влияет на эффективность работы всей корпоративной сети в целом: чем меньше среднее время формирования ответа на поступивший запрос, тем выше качество работы всей железнодорожной сети ОАО «РЖД».

Анализ существующих режимов работы ИВЦ в КВС показывает, что поступление запросов с рабочих станций и автоматических устройств съема информации происходит в случайные моменты времени, случайными являются и времена обработки запросов в ИВЦ и ЦОД.

В силу того, что на работу КВС влияют многочисленные случайные факторы, решать задачу размещения ЦОД следует с привлечением методов исследования сложных систем. Применительно к КВС это означает, что необходимо сформулировать обобщенный критерий эффективности работы сети, разработать методы решения задач эффективной работы КВС, дающие минимальные значения обобщенного критерия.

В этой связи вопросы разработки методов эффективного расположения центров обработки данных в корпоративной вычислительной сети ОАО «РЖД» на огромных расстояниях друг от друга и от мест возникновения запросов являются актуальными.

Степень разработанности проблемы. Различные способы обработки запросов в вычислительных сетях рассматривались в работах таких ученых как Янбых Г. Ф„ Этгингер Б. Я., Советов Б. Я., Яковлев С. А., Криницкий Н. А. и др. В

этих работах задача оптимального проектирования КВС ставилась как задача оптимизации некоторого обобщенного критерия, при этом использовались методы исследования и оптимизации сложных систем, а именно такой сложной системой и является КВС ОАО «РЖД». Задачи по оптимизации сложных систем ставились в трудах Бусленко Н.П., Березина Е.А., и для их решения предлагались различные критерии, при минимизации которых обеспечивается наибольшая эффективность работы сложной системы.

Современное состояние методов исследования и оптимизации таково, что, несмотря на наличие таких основополагающих монографий, как работа Вишневского В.М. «Теоретические основы проектирования компьютерных сетей», нельзя говорить о том, что существует единая методика решения задач, возникающих при проектировании КВС. Сеть ОАО «РЖД», несомненно, является сетью с потоками запросов, отличающимися от мультимедийных потоков запросов в общедоступных сетях, и нуждается в разработке методов оценки эффективности функционирования КВС.

Объект исследования — объектом исследований диссертационной работы являются корпоративная вычислительная сеть ОАО «РЖД» и способы размещения ЦОД сети в различных городах России.

Предметом исследования в диссертационной работе являются методы решения многокритериальной задачи размещения ЦОД в корпоративной сети ОАО «РЖД».

Цель работы и задачи исследования. Целью диссертационной работы является разработка методики размещения ЦОД на сети железных дорог России и перераспределения потоков запросов, возникающих в географически удаленных друг от друга районах, между ЦОД на основе разработанных аналитических и имитационных моделей КВС.

Для решения поставленной цели необходимо решить следующие задачи:

1. Исследовать случайные процессы поступления запросов в сети, выявить законы распределения таких случайных величин, как интервалы между моментами поступления запросов с рабочих мест сети.

2. Разработать методы моделирования работы ИВЦ и связывающих их каналов передачи данных (КПД), ориентированные на использование результатов математических моделей в алгоритмах решения задач проектирования КВС.

3. Разработать обобщенный критерий эффективности работы КВС как единого производственного процесса.

4. Разработать алгоритмы сравнения аналитических моделей КВС и статистических моделей, и обосновать эффективность полученных результатов проектирования мест расположения ЦОД.

Научная новизна диссертационной работы заключается в следующем:

- разработаны и исследованы аналитические и имитационные модели вычислительных сетей ЭВМ для многих потоков запросов и детерминированных маршрутов прохояедения запросами устройств сети;

- разработаны регрессионные модели стоимости мэйнфреймов ИВЦ;

- впервые разработаны аналитические и имитационные модели сети ИВЦ ОАО «РЖД» как сети с несколькими потоками запросов пользователей;

- полученные модели сетей для оценки их адекватности, исследованы средствами GPSS World, программной имитационного моделирования на основе Delphi ХЕ2;

- впервые решена задача размещения ЦОД в корпоративной сети ОАО «РЖД» при нескольких потоках запросов пользователей в сети;

- показано, что полученные результаты размещения ЦОД соответствуют настоящему состоянию корпоративной сети ОАО «РЖД».

Теоретическая значимость исследования выражается в дополнении существующих методов исследования при решении задач эффективного управления и обработки информации в корпоративных вычислительных сетях. Выработаны рекомендации для выбора наилучших способов построения корпоративной сети ОАО «РЖД» при заданной топологии сети и известных потоках запросов на обработку в ИВЦ и ЦОД на основе показателей

эффективности, вычисленных с помощью аналитических и имитационных моделей сети ОАО «РЖД».

Практическая значимость диссертационного исследования определяется тем, что разработанные на примере корпоративной вычислительной сети ОАО «РЖД» алгоритмы и программы концептуального формирования и проектирования КВС, включающей в себя ИВЦ и ЦОД и осуществляющей прием сообщений от десятков тысяч операторов, обработку и передачу ответных сообщений, а также программное обеспечение для разработки полиномиальных моделей, могут быть использованы в целях повышения эффективности функционирования ЦОД и проектирования их расположения в корпоративных вычислительных сетях предприятий различных отраслей.

Применительно к ОАО «РЖД», разработанные в диссертации методы и алгоритмы решения уже внедрены и используются в ГВЦ ОАО «РЖД» в управляющем комплексе обработки консолидированной информации уровня ЦОД в целях повышения качества работы всей железнодорожной сети ОАО «РЖД».

Методы исследования. Работа выполнена на основе методов анализа и синтеза сложных систем и базируется на использовании методов теории вероятностей, методов статистической обработки результатов натурных наблюдений (анализ входных потоков), методов теории массового обслуживания (построение аналитических моделей неустановившегося и установившегося режимов работы), методов построения аналитических и имитационных моделей сложных систем (а корпоративная сеть ОАО «РЖД», несомненно, является таковой), методов решения оптимизационных задач как задач целочисленного программирования. В качестве системы программирования использовалась лицензионная версия Delphi ХЕ2.

Область исследования соответствует направлению «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации» согласно паспорту специальности 05.13.01 - «Системный анализ, управление и обработка информации (транспорт)».

Положения выносимые на защиту:

- аналитические и имитационные модели корпоративной сети ОАО «РЖД»;

- методы решения размещения ЦОД в сети;

- методика формирования матрицы маршрутов в корпоративной сети;

результаты исследования сети ЭВМ, полученные с помощью разработанных моделей сети.

Достоверность результатов проведенного исследования диссертационной работы подтверждается соответствием результатов расчета по аналитическим моделям с результатами имитационного моделирования.

Апробация результатов исследования. Материалы диссертации докладывались и обсуждались на заседаниях кафедры «Вычислительна техника» «Российской открытой академии транспорта Московского государственного университета путей сообщения» (РОАТ МГУПС) в 2010 — 2014 г.г., а также на всероссийской научно-технической интернет-конференция с международным участием (14, 15 ноября 2013г.) «Надежность функционирования и информационная безопасность телекоммуникационных систем железнодорожного транспорта» Омский государственный университет путей сообщения.

Реализация результатов работы. Разработанные в диссертационной работе теоретические и практические решения по анализу эффективности обработки запросов сети использовались при разработке комплекса «Программные средства организации системной среды сетевой консолидированной базы данных АСОУП-2 для АС ЦУТР», введенного в эксплуатацию в ГВЦ ОАО «РЖД» в октябре 2013 г. Результаты внедрения подтверждены соответствующим актом.

Также по материалам диссертационной работы зарегистрировано программное обеспечение (две программы для ЭВМ) в Отраслевом фонде алгоритмов и программ ПКТБ ЦКИ ОАО «РЖД», что подтверждается соответствующим актом.

Публикации. По результатам проведенных исследований опубликовано б работ, из них 4 в изданиях, рекомендованных Высшей аттестационной комиссией Министерства образования и науки Российской Федерации, 1 статья в

межвузовском сборнике научных трудов, 1 доклад на научной конференции с международным участием. Программы для ЭВМ: МКЯА «Программа регрессионного анализа» / Зотова М.А. — Зарегистр. под № 797 в отраслевом фонде алгоритмов и программ ПКТБ ЦКИ ОАО «РЖД» 05.09.2013г.; Сеп Яапс! «Программа генерирования случайных величин» / Зотова М.А. — Зарегистр. под № 798 в отраслевом фонде алгоритмов и программ ПКТБ ЦКИ ОАО «РЖД» 05.09.2013г.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 70 наименований сгруппированных систематически (в порядке первого упоминания в тексте), 2-х приложений на 7 страницах, 27 рисунков, 32 таблиц. Таблицы и рисунки имеют сквозную нумерацию в пределах главы. Общий объем рукописи — 114 страниц, в том числе 107 страницы основного текста.

СОДЕРЖАНИЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

Во введении обоснованы актуальность темы исследования и степень ее разработанности; объект и предмет исследования; цели и задачи; научная новизна; теоретическая и практическая значимость работы; методы и область исследования; положения, выносимые на защиту; степень достоверности, апробация и реализация результатов; сведения о публикациях по теме диссертации; структура и объем работы.

В первой главе проводится анализ существующих методов исследования и оптимизации корпоративных вычислительных сетей.

Приведен обзор методов исследования сетей ЭВМ как сложных систем. Показано, что естественно применение аппарата теории массового обслуживания при построении аналитических моделей КВС в силу того, что из-за ограниченных ресурсов возможно возникновение очередей к различным устройствам сети. Отмечено, что ранее разработанные модели, в которых процесс облуживания запросов от пользователей сети описывается с помощью матрицы переходных вероятностей, должны быть развиты для случая, когда имеется несколько потоков

запросов, причем для каждого потока задаётся маршрут прохождения устройств сети.

Отмечено, что задача размещения ЦОД в сети с несколькими потоками запросов и заданными маршрутами прохождения сети запросов из различных источников ранее не ставилась и не решалась.

Во второй главе рассматриваются аналитические модели корпоративной сети ЭВМ.

Разработаны и обоснованы методы моделирования и формализации процесса пропуска запросов через корпоративную вычислительную сеть ОАО «РЖД». Данные методы позволяют с помощью единых аналитических средств оценивать эффективность различных способов размещения центров обработки данных на сети железных дорог.

На основе сравнительного анализа методов аналитического моделирования процессов передачи и обработки запросов в КВС установлено, что наибольшими возможностями описания и оценки качества функционирования ЦОД в сети обладает метод построения аналитических моделей сети ЦОД и ИВЦ, когда КВС представляется как сеть систем массового обслуживания (СМО) с несколькими потоками запросов, поступающих извне в сеть из бесконечных источников -рисунок 1. На рисунке 1 номера с 1-го по 8-ой присвоены ИВЦ, номера с 9 и 15 -КПД, передающим запросы в ИВЦ с номером 3, номера с 16 по 22 - КПД, передающим ответные сообщения от ИВЦ с номером 3 в другие ИВЦ. Номера с 23 по 30-тый присвоены коммутаторам. В сеть поступает 8 потоков запросов - в ИВЦ №1,2,. ..,8.

Разработанный метод представления процесса передачи и обработки запросов КВС является развитием известных моделей анализа вычислительных сетей (ВС), когда ВС представляется как стохастическая сеть систем массового обслуживания разомкнутого типа с несколькими источниками бесконечного типа запросов, поступающих в сеть, и случайными передачами запросов между отдельными устройствами, входящими в моделируемую сеть.

Э.Е*жтер1швург_СВРД

Рисунок 1 - фрагмент корпоративной вычислительной сети

В отличие от существующих моделей, предложено описывать процесс прохождения запросов из различных источников не матрицами вероятностей передач запросов от одного устройства к другому, а с помощью маршрутов прохождения устройств запросами из различных источников. Множество вершин графа рисунка 1 составляет маршрут следования по сети запросов потока. Например: для потока с номером 1 (ИВЦ № 1 Самара_КБШ) маршрут следования запросов по сети представляет: М,={1, 23,9,24,10,25,3,25,17,24,16,23/; маршрут следования по сети запросов потока 3 (ИВЦ № 3 Екатеринбург СВРД) прост -запросы поступают в СМО с номером 3, там обрабатываются и покидают систему: М3={3}. И так автоматически получена матрица маршрутов для 8 потоков запросов (ИВЦ 1,2,...,8).

Применение маршрутов прохождения обуславливает способ движения запросов от рабочих мест - возникновения запросов в сети до устройств обработки - ЦОД, через каналы передачи данных и коммутаторы. Данный метод позволяет количественно оценить обобщенные показатели эффективности передачи и обработки запросов в КВС. Для представления процесса передачи запросов в КВС производится декомпозиция сети с целью выявления различных устройств, таких

как мэйнфреймы ИВЦ, мэйнфреймы ЦОД, каналы передачи данных и коммутаторы.

Расчет основных характеристик функционирования всей сети в целом предполагает, что каждое из устройств модели представляется как независимо функционирующая система массового обслуживания, на вход которой поступает

суммарный поток запросов из различных источников с интенсивностью вычисляемый по формуле (1):

=4*)»1' = 1>2>—»ЛД = 1,2,...,Л1 (1)

Здесь: п - число СМО в сети, т - количество потоков запросов в сети из различных источников, / - номер СМО, к - индекс потока запросов, Мк - маршрут прохождения запросом из потока с номером к, который задаётся перечислением номеров СМО, проходимых запросом в процессе обработки в сети.

Условие суммирования У е & у = / означает, что у принимает значения, равные элементам множества Мк при условии, что индекс суммирования равен индексу СМО.

Декомпозиция КВС, представленной как разомкнутая сеть систем массового обслуживания, основывается на известной теореме Джексона, которая предполагает, что интервалы между моментами поступления запросов в сеть из различных источников имеют экспоненциальное распределение, а время обработки запросов во всех устройствах сети - случайное, имеющее также экспоненциальное распределение. Модель позволяет рассчитывать такие основные показатели эффективности работы КВС, как средние времена нахождения запросов в очередях на обслуживание к МР ИВЦ, МИ ЦОД, каналам передачи данных и коммутаторам. Эти характеристики рассчитываются для установившегося (стационарного) режима работы сети.

Для того, чтобы рассчитать время достижения стационарного режима работы всей сети в целом, в диссертационной работе построена модель работы

отдельно взятого устройства сети для неустановившегося режима работы, записаны дифференциальные уравнения Колмогорова и разработана программа их численного решения наиболее зарекомендовавшим себя методом Рунге — Кутта 4-го порядка. Расчет был выполнен, с использованием значений средних времен — времени интервалов во входном потоке и времени обслуживания, взятых из реальных измерений в корпоративной сети ОАО «РЖД». Результаты решения системы дифференциальных уравнений Колмогорова приведены на рисунке 2.

■ ОЮ Ч'Н/1. КшМмми игртш . 0 СП5П9О

Рисунок 2 - вероятности и А (О как функции времени

На рисунке 3 приведены значения среднего числа запросов в системе. Средняя численность запросов в ЦОД n(t) вычислялась по формуле (2) для среднего дискретной случайной величины. В установившемся (стационарном) режиме работы средняя численность запросов в системе вычисляется по формуле (3).

т=1>,(о (2)

_ А.! и. п =

i=i

1-Х! ц

(3)

13

; : ......1 :

i Г ----------Г............ 1...

\ • .....: i : : ; :

V : ; ' .......i...............Г............Г......"Г......

u \ 0.« 0Л ....... \ ' ;.....- ;------------:..

,3 . ! :

м 1.0 ч г. ** '9 3 s 4 0 4.S S0

Рисунок 3 - средняя численность запросов в системе как функция времени

На рисунке 3 прямая, параллельная оси х, представляет из себя установившееся значение средней численности запросов в системе, равное 0,0385,

к которому асимптотически стремится функция времени « (0 .

Результаты, приведенные на рисунках 2 и 3 показывают, что переходной процесс в ЦОД практически завершается уже после 1.5 секунд после начала интегрирования системы дифференциальных уравнений, описывающих процесс обработки запросов.

Также во второй главе рассматривается и аналитическая модель, предназначенная для получения связи между производительностью мейнфрейма и его стоимостью, эта модель представлена в виде регрессионных уравнений второго порядка (4).

У=К+ b\x\ + Ь2х2 + b3xf + Ь4х{х2 + Ъьх\ (4)

где у - расчетные значения зависимой переменной (стоимость мэйнфрейма).

Данные о стоимости мэйнфреймов, их производительности в MIPs Обыстродействие в миллион операций в секунду), количестве процессоров были взяты с Интернет-страницы с адресом: http://mvw.topgun-lech.com/resource-centcr/zscries-library. Так для IBM z800 (IBM 2066) данные в таблице 1.

Таблица 1 - матрица эксперимента IBM z800 (IBM 2066)

Быстродействие, MIPs () 41 80 115 143 160 192 259 350 499 600

Количество процессоров ( ) 1 1 1 1 2 1 2 2 3 4

Стоимость ( У ) в тысячах долларов 3500 2350 3300 3800 4450 4830 5700 7500 10000 12900

Статистическая значимость коэффициентов уравнения регрессии проверялась с помощью t-критерия. Статистически незначимые коэффициенты

были отброшены, то есть, приравнены 0 (это коэффициент ¿4 в выражении (1)), и уравнение регрессии приняло вид (5):

у - Ь0 + Ъххх + Ьгх\ л-Ъъхххг + Ъьх\ (5)

Значения коэффициентов уравнение регрессии (5) для стоимости IBM z800 (IBM 2066): ¿0=2080.26985462, Ы=9.86402536, 62=0.05175790, Ь3=-11.13505662, Ь4=0, ¿>5=800.45270024.

Ошибка аппроксимации табличных данных для данного уравнения составила 11.942%. Рассмотрение матриц парных и частных коэффициентов

корреляции показало, что переменная (количество процессоров) практически не влияет на переменную у, и сильно коррелированна с переменной ■^(быстродействие). Следовательно, достаточно построить зависимость у от

(6): У=Ьо + Vl + b2xl (6)

Значения коэффициентов уравнения регрессии (6) для стоимости IBM z800 (IBM 2066): Ь0=2379.53439603, Ы= 9.05380052,62=0.01379311.

Ошибка аппроксимации табличных данных для данного уравнения составила 13.77%.

На рисунке 4 представлены два графика: черного цвета кривая - для экспериментальных данных таблицы, и синего цвета - для расчетных данных, полученных с помощью уравнения (6).

Были произведены аналогичные расчеты для табличных данных, представленных на Интернет-странице, они сведены в таблице 2.

HIP»

Рисунок 4 - эмпирические и расчетные кривые по данным IBM z800 (IBM 2066) Таблица 2 - уравнения регрессии стоимости мэйнфреймов

Мэйнфрейм

IBM z800 (IBM 2066)

IBM z890 (IBM 2086)

IBM z900 (IBM 2064)

IBM z990 (IBM 2084)

2379.53439603

754.77483798

-1388.24486797

1892.51047531

9.05380052

18.56934287

26.80331795

15.65681733

0.01379311

-0.00286731

-0.00321113

-0.00080752

Ошибка, %

13.77

6.521

5.21

3.93

Данные таблицы 2 позволяют сделать вывод о том, что расчет стоимости мэйнфрейма заданной производительности может быть оформлен как несложная вычислительная процедура, требующая весьма малого времени процессора, что весьма важно при выработке стратегии о вводе критерия эффективности системы в многомерном пространстве варьируемых переменных.

Третья глава работы содержит описание имитационной модели КВС, представленной как совокупность систем массового обслуживания.

При построении аналитических моделей делается предположение об экспоненциальных распределениях времен обслуживания и интервалов между моментами поступления запросов. В принципе можно делать предположение о том, что законы распределения могут быть произвольными. Для установления законов распределения случайных величин, в частности интервалов между моментами поступления запросов, было проведено исследование потоков

запросов существующей КВС от рабочих мест, установленных на нескольких станциях Северной ж.д.

Так, для станции Лоста, с кодом единой сетевой разметки 300003, было установлено, что интервалы между моментами поступления сообщений об операциях с поездами имеют экспоненциальное распределение. Гипотеза о том, что полученное эмпирическое распределение может быть описано с помощью

экспоненциального распределения, проверялось с помощью критерия X квадрат Пирсона. Моменты, полученные при обработке выборки:

ВЫБОРОЧНОЕ СРЕДНЕЕ ЗНАЧЕНИЕ = 548.74243674 не ВЫБОРОЧНАЯ ДИСПЕРСИЯ = 295237.51048478 мс2

ВЫБОРОЧНОЕ СРЕДНЕ-КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ = 543.35762669 мс

Гистограмма и теоретическая кривая распределения представлены на рисунке 5.

Рисунок 5 — гистограмма и теоретическая плотность распределения вероятностей Вероятность принятия гипотезы об экспоненциальном распределении равна 0.621 при уровне значимости 0.05. Входной поток запросов характеризуется как: случайный; однородный; ординарный; поток без последствия. Кроме того, случайные величины - длительности интервалов между событиями во входном

потоке имеют экспоненциальное распределение. Это позволяет в дальнейшем при построении моделей считать входной поток запросов в ЦОД пуассоновским.

При построении аналитических моделей, основанных на теореме Джексона, делается предположение о случайных перераспределениях запросов с выхода устройства обслуживания на входы других устройств.

В модели, разработанной в предыдущей главе, предполагается, что запросы из различных источников проходят через сеть в соответствии с заданными маршрутами прохождения. Эти маршруты в целом выбираются также случайным образом, в силу того, что запросы из внешней среды (совокупность рабочих мест) поступают в случайные моменты времени. С помощью имитационного моделирования была получена статистика запросов для оценки интервалов между моментами поступления запросов на входы устройств сети. Было получено, что гипотеза о том, что интервалы имеют экспоненциальное распределение, может быть принята с высоким уровнем значимости.

Имитационная модель позволила также провести сравнение результатов, полученных на аналитической модели, с результатами моделирования. Сравнение показывает практическое совпадение аналитической и имитационной моделей.

В силу того, что данные, полученной имитационной модели являются выборочными средними, был рассмотрен вопрос о выборе необходимого числа реализаций имитационной модели для получения статистически достоверных результатов. Было показано, что достаточно пропуска 15-ти тысяч запросов через модель для получения таких характеристик, как средние времена нахождения запросов в устройствах (на обслуживании и в очереди), с точностью 1%.

Эффективность функционирования ЦОД в составе КВС оценивается также и средним временем формирования ответа на запрос, поступающий в сеть. Так как при построении аналитической модели имеется возможность декомпозиции сети на отдельные устройства представляемые как СМО, исследование этого вопроса было проведено на имитационной модели ЦОД как отдельно взятой базы обслуживания. Был исследован закон распределения случайной величины -времени пребывания запроса в ЦОД от момента поступления до момента

выбытия, т.е. формирование ответа, который посылается по КПД. Было проведено моделирование для различных коэффициентов загрузки ЦОД (0.1; 0.2). При высокой нагрузке 0.9 среднее время пребывания в системе составило 1578.7173 единиц модельного времени, среднеквадратическое отклонение 1451.0482 единиц модельного времени. График функции плотности распределения вероятностей времени реакции ЦОД при загрузке 0.9 представлен на рисунке 6.

Гистограмма и георе гическоя плотность распределения вероятностей.

0.000 1

! s i i

urn \ _________

ЮМ \ .......

- ХГ " Г i

OGOO Зз

0CU0 -------- В.

Рисунок 6 - загрузка 0.9. Гистограмма и гамма-распределение. Порядок

распределения 1.18370930, параметр 1 = 1333.70355714 единиц модельного

времени

Проверялась гипотеза о том, что случайная величина - время пребывания запроса в СМО имеет гамма - распределение с плотностью:

/0) = filter1 е-" / г(у - l),i > 0 (7)

где T(v) - гамма-функция.

Проведенные исследования для различных коэффициентов загрузки ЦОД (0.1; 0.2) и для высокой загрузки 0.9 показали, что в случае использования мэйнфрема с производительностью 5939 Mips время реакции ЦОД практически не превысит величины 0.64 секунды даже при очень большой загрузке 0.9.

В четвертой главе рассматриваются методы выбора эффективного размещения центров обработки данных в корпоративной вычислительной сети ОАО «РЖД». В 1-ом параграфе рассматривается расположение ЦОД на части КВС, при этом используется аналитическая модель КВС, в которой совокупность устройств сети представляется как сеть систем массового обслуживания с несколькими потоками запросов из различных источников бесконечного типа. Запросы из различных источников имеют одинаковые приоритеты, однако, каждый из типов запросов, поступающих из различных источников, имеет свой маршрут прохождения запроса в сети. Эффективность работы сети в целом оценивается с помощью обобщенного критерия эффективности, рассчитанного по формуле (8):

Р = (8) где: Г- обобщенный критерий эффективности;/, - суммарная загрузка КПД во всей сети, измеряемая как сумма интенсивностей потоков запросов в каждом из КПД, умноженная на длину канала связи; /2 - сумма времен реакции по всем ЦОД и ИВЦ в сети на запрос, поступивший в систему; коэффициент Л/ имеет

размерность сек * /си"', к2 имеет размерность сек', для приведения слагаемых к безразмерному виду.

Для решения задачи поиска способа расположения ЦОД в сети используется метод полного перебора, при этом, возможные способы размещения ЦОД в сети формируются с помощью специального счетчика, который обеспечивает полный перебор всех возможных способов размещения ЦОД в сети. Вводится в

рассмотрение вектор П = (?7,,/72,...,77я) , где 1 < 7, < П причцм 77, = / если обработка запроса идёт на том же ИВЦ, куда поступил запрос, и равно номеру того ИВЦ, представляющему из себя ЦОД, и в который пересылаются запросы для обработки, в противном случае. Перебрать все допустимые значения

_ позволяет программная организация

/1-разрядного счетчика в позиционной системе счисления с основанием п, к

последнему разряду, которого прибавляется 1, и в котором при возникновении единицы переноса в следующий разряд в данный разряд устанавливается в 1.

Т.к. метод полного перебора требует значительных расходов процессорного времени и позволяет решить задачу для ограниченного числа реализаций, задача была решена для сети содержащей 8 ИВЦ (города расположения ИВЦ - Самара, Екатеринбург, Челябинск, Новосибирск, Красноярск, Иркутск, Чита, Хабаровск) на основе реальных данных. Шаги поиска эффективного способа размещения ЦОД, в который перенаправляются запросы на обработку, показали, как стремительно уменьшается значение критерия эффективности, когда запросы перенаправляются на обработку в ИВЦ № 3:

- время перебора составило 61823 миллисекунд;

- минимальное значение критерия = 0.066404959;

- выбор останавливается на Екатеринбурге - ИВЦ с номером 3.

Для всей сети, состоящей из 16 ИВЦ (города расположения ИВЦ —

Калининград, Ростов, Воронеж, Санкт-Петербург, Москва, Саратов, Ярославль, Нижний Новгород, Самара, Челябинск, Екатеринбург, Новосибирск, Красноярск, Иркутск, Чита, Хабаровск), сеть была представлена как неориентированный граф. Результаты, полученные в параграфе 2.1, показали, что каналы передачи данных и коммутаторы практически не вносят какого-либо вклада во время пребывания запросов в вычислительной системе, что позволило представить сеть, как неориентированный граф.

Для неориентированного графа был реализован автоматический расчет всех кратчайших маршрутов из пункта / в пункт у. Произведено вычисление всех кратчайших расстояний в неориентированном графе с использованием алгоритма Флойда. Полученные данные позволили сформировать кратчайшие маршруты следования из пункта / в пункт у, как перечисление вершин графа, составляющих путь. Полученные маршруты могут быть использованы при вычислении интенсивностей потоков запросов - сообщений к мэйнфреймам ИВЦ при пересылке от станции г до станции у .

Для решение задачи эффективного размещения ЦОД всей сети, состоящей из 16 ИВЦ, в работе был применен метод случайного поиска. Эффективность

функционирования сети в целом по-прежнему оценивалась с помощью показателя эффективности обобщенного критерия эффеетивности (8). Задача была решена известным методом случайного поиска парной пробы.

Процесс формирования способа размещения ЦОД в сети для ПК с процессором быстродействия 3,20 GHz для всей КВС ОАО «РЖД» занял несколько минут машинного времени, результата показал, что при эффективном выборе расположения ЦОД на железнодорожном участке ИВЦ с номерами 4, 5 и 11 (Санкт-Петербург, Москва и Екатеринбург) должны работать как центры обработки данных.

ЗАКЛЮЧЕНИЕ

По результатам выполненных исследований, связанных с разработкой методов моделирования оценки эффективности функционирования корпоративной вычислительной сети ОАО «РЖД» при передаче запросов в сети, можно сформулировать следующие выводы:

1. Разработана аналитическая модель корпоративной сети как сети систем массового обслуживания (СМО) с несколькими потоками запросов из различных бесконечных источников. Продвижение запросов пользователей сети определяется маршрутами - последовательностью номеров СМО, проходимых запросами для каждого потока. Модель позволяет вычислить средние времена выполнения запросов в каждой из СМО, средние времена прохождения маршрутов для каждого потока запросов (средние времена ответа для каждого потока) и средние численности запросов в очередях и на обслуживании.

2. Разработаны аналитическая и имитационная модели работы ЦОД, позволяющие определить вероятность того, что время ответа превысит максимально допустимое время для различных интенсивностей потока запросов.

3. Сформулирована задача эффективного размещения ЦОД в сети ОАО «РЖД», при котором минимизируются суммарное время нахождения запросов в сети и расстояния, на которые передаются запросы от ИВЦ в ЦОД, как многокритериальная задача.

4. Решена многокритериальная задача для части сети ОАО «РЖД» методом полного перебора. Выработаны рекомендации по размещению ЦОД на участке Екатеринбург — Хабаровск.

5. Решена многокритериальная задача для сети ОАО «РЖД» методом случайного поиска. Выработаны рекомендации по размещению ЦОД на участке Санкт-Петербург — Хабаровск.

6. Разработана имитационная модель КВС на базе объектно -ориентированной системы Delphi ХЕ2. Показано, что применение детерминированных маршрутов для описания процессов передвижения запросов пользователей по сети не нарушает экспоненциальное распределение потоков запросов в КВС.

7. Разработана методика определения длительности достижения ЦОД установившегося режима работы путем численного решения дифференциальных уравнений Колмогорова. Выводы о длительности входа в установившийся режим работы подтверждены имитационным моделированием.

8. Разработана методика построения регрессионных моделей, позволяющих рассчитать стоимость мэйнфрема для заданной величины быстродействия в MIPs.

ОСНОВПЫЕ ПУБЛИКАЦИИ ПО ДИССЕРТАЦИИ

Публикации в изданиях, рекомендованных ВАК России:

1. Горелик, В. Ю. Оптимальное проектирование расположения ЦОД на железнодорожном участке / В. 10. Горелик, М. А. Зотова // Наука и техника транспорта. - 2013. - № 2. - С. 29-35.

2. Зотова, М. А. Регрессионные модели стоимости мэйнфреймов / М. А. Зотова // Наука и техника транспорта. - 2013. - № 3. - С. 30-34.

3. Зотова, М.А. Вычислительная сеть с многими потоками запросов как открытая сеть СМО / М. А. Зотова // Научно-аналитический журнал Инновации и инвестиции. - 2014. - № 5. - С. 187-190.

4. Зотова, М.А. О законе распределения вероятностей случайной величины / М. А. Зотова // Мир транспорта. - 2014. - № 4(53). - С. 24-31.

Публикации в других изданиях:

5. Горелик, В. Ю. Центры обработки данных на железнодорожном транспорте : межвузовский сборник научных трудов «Современные проблемы совершенствования работы железнодорожного транспорта» / В. Ю. Горелик, М. А. Зотова. - М.: РОАТ МГУПС, 2013. - С. 10-13.

6. Зотова, М. А. К вопросу о законе распределения вероятностей случайной величины — времени реакции ЦОД : всероссийская научно-техническая интернет-конференция с международным участием (14, 15 ноября 2013г.) «Надежность функционирования и информационная безопасность телекоммуникационных систем железнодорожного транспорта» / М. А. Зотова. - Омск : ОМГУПС, 2013. -С. 128-133.

7. Программа для ЭВМ — МКИА «Программа регрессионного анализа» / Зотова М.А. - Зарегнстр. под № 797 в отраслевом фонде алгоритмов и программ ГПСТБ ЦКИ ОАО «РЖД» 05.09.2013г.

8. Программа для ЭВМ - Сеп Яапс! «Программа генсриропапия случайных величин» / Зотова М.А. — Зарегнстр. под № 798 в отраслевом фонде алгоритмов и программ ГПСТБ ЦКИ ОАО «РЖД» 05.09.2013г.

Зотова Марина Александровна

ОРГАНИЗАЦИОННО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ЦЕНТРОВ ОБРАБОТКИ ДАННЫХ ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

05.13.01 - Системный анализ, управление и обработка информации (транспорт)

Автореферат диссертации на соискание ученой степени кандидата технических наук

Подписано к печати 1,301е? Формат 60x80 1/16

Заказ № /О У6 Объем 1,5 пл. Тираж 80 экз.

127994, Москва, ул. Образцова, д. 9, стр. 9, УПЦ ГИ МИИТ