автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Прогнозирование состояния сервера на основе регрессионно-нечетких моделей
Автореферат диссертации по теме "Прогнозирование состояния сервера на основе регрессионно-нечетких моделей"
На правах рукописи
Козлов Александр Олегович
ПРОГНОЗИРОВАНИЕ СОСТОЯНИЯ СЕРВЕРА НА ОСНОВЕ РЕГРЕССИОННО-НЕЧЕТКИХ МОДЕЛЕЙ
05.13.18 — Математическое моделирование, численные методы и комплексы программ
Автореферат
диссертации на соискание ученой степени кандидата технических наук
г г т ¿см
Ульяновск -2014
005548399
Работа выполнена на кафедре «Прикладная математика и информатика» в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Ульяновский государственный технический университет».
Научный руководитель:
Официальные оппоненты:
доктор технических наук, профессор Татьяна Васильевна Афанасьева
доктор технических наук, профессор, ФГБОУ ВПО «Ростовский государственный университет путей сообщения», профессор кафедры «Автоматика и телемеханика на железнодорожном транспорте»
Ковалев Сергей Михайлович
кандидат технических наук, доцент кафедры телекоммуникационных технологий и сетей ФГБОУ ВПО «Ульяновский государственный университет»
Липатова Светлана Валерьевна
Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования «Поволжский государственный университет телекоммуникаций и информатики»
Защита диссертации состоится 18 июня 2014 г. в 1430 часов на заседании диссертационного совета Д 212.278.02 при ФГБОУ ВПО «Ульяновский государственный университет», расположенном по адресу: г. Ульяновск, ул. Набережная р. Свияги, 106, корп. 1, ауд. 703.
С диссертацией можно ознакомиться в научной библиотеке Ульяновского государственного университета и на сайте ВУЗа http://ppo.ulsu.ru, с авторефератом — на сайте ВУЗа http://ppo.ulsu.ru и на сайте Высшей аттестационной комиссии при Министерстве образования и науки РФ — http://vak.ed.gov.ru.
Ведущая организация:
Отзывы на автореферат в двух экземплярах, заверенные печатью организации, просим направлять по адресу: 432017, г. Ульяновск, ул. Л. Толстого, д. 42, УлГУ, Отдел послевузовского профессионального образования.
Автореферат разослан «» Л4О0
20/4
г.
Ученый секретарь
диссертационного совета Д 212.278.02 кандидат физико-математических наук, доцент
М.А. Волков
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
В современных условиях интенсивного развития информационно-коммуникационных технологий задача обеспечения стабильного функционирования отдельного сервера, как элемента ИТ-структуры является актуальной. Особую важность эта задача приобретает для предприятий малого и среднего бизнеса, обладающих ограниченными ресурсами и находящимися на стадии развития.
В случае возникновения изменения нагрузки на отдельный сервер, приводящего к снижению или потере его работоспособности, в таких организациях требуется от нескольких часов до нескольких дней для восстановления его стабильного функционирования. Изменение нагрузки может возникнуть и в случае воздействия на сервер внешних трудно формализуемых факторов, а поэтому формулируемых экспертно лицами, принимающими решение, например, таких как увеличение объема решаемых задач, рост числа клиентов, изменение масштаба предприятия. Все это может привести к потере ценной информации, непредвиденным и значительным материальным затратам в условиях активного перехода к интернет-экономике. Чтобы обеспечить раннее предупреждение о возможных в будущем нарушениях функционирования отдельного сервера и учесть эти риски при планировании развития ИТ-ресурсов предприятия целесообразно применять методы анализа состояния сервера, ориентированные как на текущие, так и на прогнозные оценки тенденций изменения физических (числовых) параметров сервера с учетом внешних экспертных оценок тенденций развития предприятия.
Для решения проблемы обеспечения стабильного функционирования сервера применяются системы мониторинга и контроля работоспособности серверов по отдельным параметрам (например, «PWS ИТ-мониторинг»1, «NMS Aurora»2), однако, функции таких систем не предусматривают решение задачи прогнозирования, а также не позволяют идентифицировать опасные тенденции изменения состояния сервера как целостного объекта.
Достаточно часто используется подход к прогнозированию состояния сервера путем визуального анализа графиков временных рядов числовых параметров, однако при этом результаты прогноза в значительной степени зависят от квалификации и субъективного мнения администратора вычислительной сети.
Поэтому в ряде работ обоснована необходимость прогнозирования числовых параметров сервера, в частности в работе Терейковской (2011) предлагается применять статистические модели временных рядов для прогнозирова-
1 PWS ИТ-Мониторинг // PingWin Software [Электронный ресурс]. 2013. http://www.pingwinsoft.ru/pages/resheniya/resheniya/p\vsitmonitoriDg
2 Система управления сетью NMS Aurora // NMS [Электронный ресурс]. 2013. http://www.softm.tv/index.php/product-and-service-ru/nms-ru
ния числовых параметров интернет-серверов3. В работе Веркотрен и др. (2007)4 для прогнозирования нагрузки на веб-сервер предлагается иерархическая модель временного ряда, включающая в себя гармоническую и авторегрессионную составляющие. В работе Ярушкиной и др. (2007)5 предложена математическая имитационная модель числовых параметров терминал-сервера как элемента вычислительной сети на основе временных рядов их нечетких тенденций, позволяющая прогнозировать трафик сервера. Также разрабатываются подходы к прогнозированию отдельных характеристик сервера для це-
6 7
леи управления его ресурсами .
Можно констатировать, что существующие модели прогнозирования состояния сервера основаны на моделировании его внутренних числовых параметров по временным рядам и не учитывают внешние экспертные оценки тенденций развития предприятия.
Возникает научно-техническая проблема разработки метода прогнозирования работоспособности сервера путем интеграции статистических моделей прогнозирования его числовых параметров и нечетких моделей экспертного оценивания для обнаружения возможных проблем на ранних стадиях и получения о них информации, необходимой для принятия обоснованных и оперативных управленческих решений.
Объектом исследования является сложный технический объект — сервер предприятия.
Предметом исследования являются модели прогнозирования состояния сервера.
Цель работы — повышение эффективности прогнозирования состояния сервера на основе разработки метода, интегрирующего регрессионное и нечеткое моделирование его параметров.
Задачи исследования
Для достижения указанной цели в работе необходимо решить следующие задачи:
1. Выбор эффективного подхода к моделированию числовых временных рядов, обладающих различным поведением.
2. Разработка обобщенной модели прогнозирования состояния сервера, включающей числовые временные ряды и нечеткую экспертную оценку.
3. Разработка алгоритма получения комплексной оценки состояния сервера.
3 Терейковская JI.A. Перспективы использования методов теории вейвлет-преобразований для прогнозирования технического состояния intemet-cepBepoB // Управление развитием сложных систем. -Киев, 2010.-4.-С. 100-103.
4 Vercauteren Т., Aggarwal P., Wang X., Li Т.Н. Hierarchical Forecasting of Well Server Workload Using Sequential Monte Carlo Training II IEEE Transactions on Signal Processing. - 2007. - T. 55 вып. 4. - С. 1286-1297.
5 Ярушкина Н.Г., Юнусов Т.Р., Афанасьева Т.В. Моделирование трафика терминал-сервера на основе анализа нечетких тенденций временных рядов // Программные продукты и системы. - 2007. — №4. - С. 15-19.
6 Паяин С.В. Методика динамического управления загрузкой каната связи в корпоративных сетях с гарантированной доставкой данных: Дис. канд. техн. наук. - М., 2009. - 112 с.
Басараб М. А., Колесников А. В., Иванов И. П. Анализ сетевого трафика корпоративной сети университета методами нелинейной динамики// Наука и образование. -М., 2013. - 8. - С. 341-352.
4. Разработка метода регрессионно-нечеткого моделирования для прогнозирования состояния сервера, заданного набором гетерогенных данных.
5. Создание специализированной программной системы для моделирования и прогнозирования состояния сервера.
Научная новизна работы заключается в создании новых обобщенной регрессионно-нечеткой модели и метода регрессионно-нечеткого моделирования, позволяющих прогнозировать состояния сервера по временным рядам его числовых параметров и экспертной прогнозной оценкой его загрузки. Предложены новые алгоритмы, включая алгоритм вычисления комплексной нечеткой оценки состояния сервера. Разработан программный комплекс для прогнозирования состояния сервера.
Основные положения, выносимые на защиту
1. Обобщенная модель состояния сервера, состоящая из взаимосвязанных моделей: комплексной динамической регрессионной модели временных рядов внутренних числовых параметров сервера; модели нечеткой шкалы для получения нечетких оценок уровня и тенденций числовых параметров сервера; двухуровневой нечетко]! модели прогноза состояния сервера, учитывающей внешнюю экспертную оценку.
2. Метод регрессионно-нечеткого моделирования для прогнозирования состояния сервера, отличающийся интеграцией моделей различных типов, согласованных по времени и значению, обеспечивающий снижение временных и экономических затрат за счет включения в модель внешней экспертной оценки и модели нечеткой тенденции.
3. Вычислительный алгоритм нахождения нечеткой оценки числового параметра сервера в виде нечеткой оценки общей тенденции его развития.
4. Комплекс алгоритмов и программ регрессионно-нечеткого моделирования, позволяющий прогнозировать состояние сервера по временным рядам числовых параметров и экспертным оценкам.
Общетеоретическая значимость и практическая ценность
Теоретической значимостью обладает предложенный метод интеграции гетерогенных данных при прогнозировании состояния сложной технической системы, и открывает новые практические возможности повышения качества прогнозирования состояния таких систем.
Практическая ценность результатов работы заключается в том, что разработанные алгоритмы и программы могут быть использованы для исследования состояния ИТ-инфраструктуры малых и средних предприятий.
Проведенное диссертационное исследование было в значительной мере мотивировано и поддержано выполнением НИР для предприятий и организаций:
1. «Проектирование подсистемы раннего предупреждения о нарушении условий устойчивого функционирования серверного узла» для ООО «Фирма ВИА».
2. Заявка на грант РФФИ №14-07-0247 «Методология моделирования и прогнозирования локальных тенденций временных рядов в задачах анализа
больших данных».
3. Анализ состояния и автоматизация прогнозирования серверов в ЗАО Банк «Венец» и ООО «Симбирск-Ойл».
Достоверность результатов, представленных в диссертации, обеспечивается корректностью применения математического аппарата статистического и нечеткого моделирования, и подтверждается результатами экспериментов на реальном оборудовании.
Апробация работы
Основные результаты работы докладывались на 5-й Международной научно-практической конференции "Интегрированные модели и мягкие вычисления" (Коломна, 2009); Всероссийских научно-технических конференциях аспирантов, студентов и молодых ученых "Информатика и вычислительная техника" (Ульяновск, 2010, 2011, 2012); Всероссийской научной конференции «Современные проблемы математического моделирования, супервычислений и информационных технологий» (Таганрог, 2012); 7-й Всероссийской научной конференции «Математическое моделирование развивающейся экономики и экологии» (Киров, 2012); Российской школе-семинаре аспирантов, студентов и молодых ученых «Информатика, моделирование, автоматизация проектирования» (Ульяновск, 2012); XIII Международная конференция "Информатика: проблемы, методология, технологии" (Воронеж, 2013); на ежегодных научно-технических конференциях профессорско-преподавательского состава УлГТУ (2010-2012); XVII Российская научно-практическая конференция «Инжиниринг предприятий и управление знаниями» (Москва, 2014).
Публикации
По теме диссертации опубликовано 13 печатных работ, из которых 3 — в изданиях, входящих в перечень ВАК.
Личный вклад автора
Постановка задачи осуществлена совместно с научным руководителем. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к публикации полученных результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим. Все представленные в диссертации результаты получены лично автором.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения, библиографического списка литературы, включающего 94 наименования источников отечественных, зарубежных авторов и электронных ресурсов, списка сокращений и 1 приложения. Общий объем диссертации составляет 135 страниц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении рассмотрена актуальность темы диссертационной работы, определена ее цель и задачи, сформулированы положения, выносимые на за-
щиту, их научная новизна и практическая ценность, представлены сведения об использовании, реализации и апробации результатов работы, структуре диссертации.
В первой главе выполнен обзор систем контроля параметров сервера, а также математических моделей, методов и программного обеспечения, применяемых для обработки ВР.
Сервер представляет собой сложный объект, характеризующийся множеством показателей, постоянно изменяющихся во времени, значения которых образуют временные ряды (ВР), обладающие стационарным и нестационарным поведением, имеющими выраженные трендовые и периодические компоненты.
Для анализа ВР применяются подходы на основе статистических моделей прогнозирования числовых параметров, (Андерсон, Бокс-Дженкинс, Хольт-Уинтерс, Канторович, Лукашин, Носко). Достоинство указанных моделей состоит в ориентации на определенные классы динамических процессов. Этой проблеме применительно к прогнозированию числовых параметров сервера посвящены работы авторов Терейковская, Веркотрен.
Однако не учитывается проблема, что временные ряды числовых параметров сервера могут иметь различное поведение, это затрудняет подбор подходящей модели. Не в пэлной мере проводится идентификация и диагностическая проверка различных регулярностей, лежащих в основе структуры ВР, что в итоге приводит к снижению точности математического описания и прогнозирования динамики ВР.
Другая проблема может возникнуть на этапе оценивания параметров модели методом наименьших квадратов (МНК). Моделирование поведения временных рядов на классических схемах МНК не всегда осуществимо с достаточной точностью из-за нарушения условий их применения, таких как, например, высокая степень автокорреляционной зависимости остатков е, ненормальность их распределения из-за наличия систематического смещения и непостоянной дисперсии процесса. Для преодоления указанных ограничений Валеевым8 был предлоясен подход динамического регрессионного моделирования (ДРМ). Подход ДРМ позволяет строить адаптивные модели временных рядов9, в том числе при прогнозировании трафика сервера, точность которых в значительно превышает стандартные методики на основе моделей АРПСС.
Другой класс моделей ориентированный на применение экспертных оценок - класс нечетких временных рядов (Song-Ch¡ssom, Дегтярев, Ярушкина, Афанасьева) - недостаточно эффективен в плане точности для стационарных временных рядов. Однако, нечеткие модели, основанные на нечеткой импликации, реализованной системой нечетких правил «Если-То», имеют большой потенциал для прогнозирования состояния сервера по нечетким оценкам. В
8 Валеев С. Г. Регрессионное моделирование при обработке наблюдений. - М.: Наука, 1991. - 272 с. -(второе издание, дополненное и переработанное: Валеев С. Г. Регрессионное моделирование при обработке данных. - Казань: ФЭН, 2001. - 296 е.).
9 Валеев С. Г., Кузин С. П., Татевян С. К., Фасхутдинова В. А. Статистическое моделирование временных рядов изменений координат //Геодезия и картография. - 2010. - 10. - С. 9-14.
связи с этим в работе ставится и решается задача создания метода, интегрирующего достоинства статистических и нечетких моделей для прогнозирования состояния сервера по числовым параметрам и нечетким экспертным оценкам.
Во второй главе описывается обобщенная модель состояния сервера и разработанный метод регрессионно-нечеткого моделирования (РНМ) для прогнозирования поведения сервера предприятия.
В работе предложена интеграция статистических и нечетких моделей для прогнозирования состояния сервера по числовым параметрам {*;(t)} и нечетким экспертным оценкам. В качестве числовых параметров сервера использованы временные ряды максимальных суточных значений числовых параметров сервера: «Загрузка центрального процессора», «Загрузка оперативной памяти», «Загрузка сети». В качестве нечеткой внешней экспертной оценки выбран прогноз тенденции развития предприятия.
Модель состояния сервера, интегрирующую числовые параметры и экспертные оценки, рассмотрим в виде
s = F(x,z,E), (1)
где F — некоторый метод, генерирующий комплексную прогнозную оценку состояния сервера; X — вектор числовых параметров, характеризующих прогнозное техническое состояние сервера; Z = Y(.X, Nct) где Z — вектор внутренних экспертных оценок числовых параметров сервера X, например, «Недостаток загрузки», «Превышение загрузки», «Норма»; X — вектор экспертных оценок значений параметров X, например, «Очень низкий», «Низкий», «Ниже среднего», «Среднее», «Выше среднего», «Высокий», «Очень высокий»; Nct — вектор экспертных оценок тенденций изменения параметров X («Рост», «Падение», «Стабильность»); Y - некоторый метод определения внутренних экспертных оценок числовых параметров сервера Х;Ё - экспертная оценка, характеризующая внешние факторы изменения предприятия и выражаемая в виде набора нечетких термов тенденций «Уменьшение нагрузки», «Стабильность», «Увеличение нагрузки»; S - прогнозное состояние сервера, задаваемое нечетким термом из множества значений: «Недостаток загрузки», «Норма», «Превышение загрузки».
Модель числовых параметров X — {^¡(t)}, t — t1,..., tn представим в виде зависимостей, отражающих основные особенности их поведения:
Щ С О =fi(t) + ipt (t) + Vi it) + ei{t),t = tr.....tn, (2)
где t — время, f(t) — неслучайная функция полиномиального тренда, имеющая вид
Ж0 = А*+ ^
к=1
^¡(О — неслучайная периодическая функция
"МО = sin + ^>fcj, (4)
p¡(t) - случайная с элементами регулярности функция, которая может включать в себя процессы APCC(p,q)
р ч
= ^ - + + X ~ s)' (5)
к=1 s=l
а также процесс GARCH(p,q)
р я
= £ Yi,kai(t - + X Ó'^2(t " s)' (6)
fe==l s=l
e¡ (t) - нерегулярная случайная компонента.
Тогда модель прогноза каждого числового параметра сервера определим в виде
*t(t + p)= fi(t + p)+ipi(t + p)+pt(.t + p),p = l..P, (7)
где Р — горизонт прогноза.
Модель экспертной оценки числового параметра x¡ сервера представим в виде функций принадлежности хк — {^(О^^О^СО)} > x¡(t) £ X, хк £ X , к 6 [l,m], t = í1( ...,í„ , i - [l..n], терм-множества X - {«Очень низкий», «Низкий», «Ниже среднего», «Среднее», «Выше среднего», «Высокий», «Очень высокий»}.
(Xi(t) — хк_ i
d
О, иначе,
---,x¡(t) е [Xfc-i.Xit],
d
x(t)-xk r , (8)
1--^-6 iJ.
VO, иначе,
Xi(t~) — Xk
1--¿-,*¡(X) 6 [*m-l.*mJ.
О, иначе,
где к = 2,..., т - 1, а = (Хтах - ХтШ)/т, хк = хк_г + й. Модель экспертной оценки прогнозной нечеткой тенденции т/ад 6 изменения числового параметра на временном отрезке, состоящем из исходного и прогнозного ВР, определим в виде алгоритмически заданных операций АСЬ-шкалы.
Ъыл = СГепо' (хик(Ь), ^к(О, агл(0), t = Ь,... Ьп (9)
где
*;(£) = в Х,щ € X. (10)
т/;(£) = ТТепй(х& - 1),*;(£)), - 1) е Х.х^О ЕХ (11)
й;00 = ЯТепа(х- 1),х£(0), *г(£ - 1) е е ^ (12)
Тогда обобщенную модель прогноза отдельного параметра сервера, выразим в виде нечеткой модели логического вывода:
21 = Я{хиуси), (13)
где Z¿ € Z — прогнозная лингвистическая оценка состояния отдельного параметра сервера: «Недостаток загрузки», «Норма», «Превышение загрузки»; R — набор правил для определения прогноза состояния отдельного параметра сервера; vGt l 6 Nct — прогнозная лингвистическая оценка общей тенденции нечеткого временного ряда отдельного параметра сервера; xt £ X — это нечеткая оценка последнего спрогнозированного значения отдельного параметра сервера;
гЯг: Если x¡(t) есть Xi/L и vct l есть V¡ г, то z¡ есть Zx r = . R2-Если í¡(t) естьXi 2 и vGt i есть Vlz, то z¡ есть Z2 ^
Як". Если xt(t) естьXik и vctl есть Vik, то z¡ есть Zk Результаты, полученные по (13) служат входными данными для определения нечеткой оценки прогнозного состояния сервера, которую определим в виде
5 = A (2,Ё), (15)
где S — итоговая прогнозная лингвистическая оценка состояния сервера: «Недостаток загрузки», «Норма», «Превышение загрузки»; Ё - экспертная оценка, характеризующая внешние факторы изменения предприятия и выражаемая в виде набора нечетких термов тенденций «Уменьшение нагрузки», «Стабильность», «Увеличение нагрузки»; 2 — прогнозная лингвистическая оценка состояния отдельных характеристик сервера, получаемая по (13); А — набор правил определения прогнозной оценки стояния сервера:
ÍA^. Если Zj есть Zn и z2 есть Z12 и ... zn есть Zln и ёпр есть Ёъ то s есть 5t
Af. Если zx есть Zn и z2 есть Zj2 и ... zn есть Zjrt и ёпр есть Ё2. то 5 есть 52 (16)
Аш\ Если z, есть Zml и z2 есть Zm2 и ... zn есть Zmn и ёпр есть Ёт, то s есть Sm где zt:i = 1,2,...,п — лингвистический терм прогнозной оценки состояния отдельного параметра сервера, ёпр — лингвистический герм прогнозной оценки тенденции развития предприятия.
Обобщенная нечеткая модель состояния сервера интегрирует внутренние нечеткие оценки состояния отдельных числовых параметров сервера и внешнюю экспертную оценку тенденции развития предприятия, задаваемую ЛПР.
Для построения модели (15) разработан метод регрессионно-нечеткого моделирования, решать задачу прогнозирования параметров сервера в условиях, когда сервер описывается множеством числовых характеристик и, в то же время, существует экспертная оценка развития предприятия.
Идея метода заключается в построении модели состояния сервера, которое интегрирует математические модели временных рядов и нечеткие модели экспертного оценивания.
Для прогнозирования числовых параметров сервера, представляющих собой временные ряды, в результате анализа был выбран и адаптирован алгоритм ДРМ-моделирования.
ГНачало )
СЕРВЕР набор технических параметров сервера
ДРМ-моделиро8ание одновременных временных рядов значений характеристик сервера Построение АСХ-шкалы временных рядов значений характеристик сервера
1 1
Получение прогнозных значений характеристик сервера Фазэификация прогнозных значекий характеристик сервера
Определение тенденций характеристик сервера
/ оценка динамики / Определение общей
/ предприятия ! тенденции характеристик
сервера
1
Нечеткий прогноз
состояния сервера
Л
Применительно к задаче прогнозирования числовых параметров сервера, в соответствии с особенностями ВР, модель рассматривается в виде:
*;(£)= *Ггт(0 + а^), а,(0 = - Ю) + дМ, (17)
t = t1.....
где - составляющая модели в
виде алгебраического тренда, х¡агт(£) — гармоническая компонента, - составляющая АРСС, х^А*сн(ид1Ю) -(О)АЯСН-компонента, (О, 9г (О > еДг) - остатки от моделирования на соответствующих ступенях.
Оценивание параметров моделей (17) производится по схеме МНК. Для оценки параметров линейных моделей используется вычислительная схема Гаусса-Жордана, для модели АРСС используется алгоритм Марквардта для нелинейного МНК. Оценивание параметров (О)АЯСН-моделей производится методом максимального правдоподобия.
Для оценки точности модели используется критерий среднеквадратичного отклонения и коэффициент детерминации Я2. Оценивание адекватности модели производится по ^-критерию Фишера. Если < ^а6л, то принимается гипотеза об адекватности модели.
С целью проверки точности РНМ-метода был сгенерирован модельный временной ряд:
/2пЬ\
х(г) = 9 + 0,17 -С+7- БШ I — ) + Хг&) + е(0,
где = 0,83 • Х1(г - 1) + £(«:) - 0Д8(С - 1) - процесс АРСС(1,1).
В результате применения РНМ-метода была построена приближенная модель ВР:
Вывод прогноза состояния сервера
X
^ Конец )
Рисунок 1. Блок-схема метода РНМ
(2Ш
Х(Ь) =8,79 + 0,17^ + 7Д2-5т —+
V 18
о^ + ^со + еф,
где ^(0 = 0,81 ■ Х^ - 1) + - 0,150: - 1).
Оценки модели ^ест.модель — 205361, СКО а = 1,013, = 1,083 показывают ее адекватность и высокую точность.
Для реализации возможности интеграции числовых прогнозов и нечетких экспертных оценок в работе предложена вычислительная процедура, позволяющая на основе адаптации нечеткой ACL-шкалы10 по временным рядам каждого из числовых параметров получать их нечеткие оценки. Модель шкалы представим в виде:
C = {H,F_T,4'} (18)
где Н — рС X, V, А) — множество объектов шкалы: X - универсальное множество объектов х — область допустимых значений числового параметра сервера, X — терм-множество абсолютных лингвистических оценок значения временного ряда числового параметра сервера: X = (Очень низкий, Низкий, Ниже среднего, Средний, Выше среднего. Высокий, Очень высокий},
V — множество значений нечетких тенденций изменения состояния сервера
V = {Падение, Рост, Стабильность}, А — множество значений интенсивно-стей изменения состояния сервера А = (Нулевой, Очень малый, Малый, Средний, Больше среднего. Большой, Очень большой}
F_T — множество операций, определенных на множестве Н : F_T = {Fuzzy, DeFuzzy, TTend, RTend, GTend} (описаны ниже)
Ч* = (E, m, MF, xmln, xmax} — множество параметров настройки шкалы. При адаптации шкалы к решению задачи прогнозирования состояния сервера были определены ее параметры. Класс шкалы
Е = "Квазинтервальная и равномерная" . Макхимальное и минимальное значения xmin = 0 (%) и хтах = 100 (%) . Тип функций принадлежности MF = "треугольные". Определена мощность шкалы т = 7.
Функции принадлежности хк = (x^t),^^(x;(t))} , xL(t) EX, xk ё X , к e [1 ,m], t = tlt ...,tn, i = [l..n] вычисляются согласно (8).
Для получения нечетких оценок значений BP параметров сервера разработана процедура фаззификации — определения нечеткой оценки 5ct по значению оцениваемого объекта Xj. Для этого используется операция Fuzzy: X X ACL-шкалы.
X;(t) = Fuzzy(xl(t)),xi(t) 6 X,fi(t) e X. (19)
Алгоритм процедуры фаззификации представлен ниже.
1. С помощью операции Fuzzy: X -* X определяем рдя оцениваемого объекта xt £ X множество нечетких оценок хк = , ^¡(t) е X, хк 6 X, к = [1,т].
2. Среди полученного множества нечетких оценок xi вычисляем номер ктах оценки с максимальным значением функции принадлежности: ктах = argmaxf^^it))] при изменении к = [1, т]
3. Тогда, Xi(t) = Fuzzy{xl(t)) = хктах.
После применения алгоритма фаззификации ко всем значениям BP числовых параметров сервера xt и их прогнозным значениям xt получены нечет-
10Афанасьева Т.В. Нечеткое моделирование временных рядов и анализ нечетких тенденций / Т.В. Афанасьева, Н.Г. Ярушкина - Ульяновск: УлГТУ, 2009. - 299 с.
кие временные ряды (НВР) каждого из параметров сервера. Для получения комплексной интегральной оценки состояния сервера с учетом внешней экспертной оценки, сначала необходимо получить нечеткую оценку общей тенденции динамики функционирования отдельного параметра сервера.
Для этого предлагается пошаговая процедура оценивания нечеткой тенденции. На первом шаге определим элементарные тенденции на НВР на основе операций TTend, RTend и GTend, введенные построенной ACL-шкалой.
Нечеткая элементарная тенденция (НЭТ) нечеткого временного ряда - это нечеткая тенденция т¡(t) = (v£(t), at(t), Д£(с)>, выражающая качественный характер изменения на участке нечеткого временного ряда между двумя соседними нечеткими метками — 1) , xL(t) со степенью принадлежности /¿¡(С) = - 1)Д;(0).
v;(t) = TTend(xt(t - 1 )f*|(0), Xi(t - 1) е X,xt(t) е X (20)
Таблица 1 — Реализация операции TTend
Термы х?. Ж4 Xfi *7
стабильность рост рост рост рост Рост рост
падение стабильность рост рост рост Рост рост
падение падение стабильность рост рост Рост рост
падение падение падение стабильность рост Рост- рост
падение падение падение падение стабильность Рост рост
падение падение падение падение падение стабильность рост
Х7 падение падение падение падение падение Падение стабильность
a£(t) = RTend(xi(t - 1 ),xi(t)), xc(t - 1) e X,xt(t) eX (21)
Таблица 2 — Реализация операции RTend
Термы *4 х7
нулевой очень малый малый средний больше среднего большой очень большой
х2 очень малый нулевой очень малый малый средний больше среднего большой
*Э малый очень малый нулевой очень малый малый средний больше среднего
х4 средний малый очень малый нулевой очень малый малый средний
больше среднего средний малый очень малый нулевой очень малый малый
Х6 большой больше среднего средний малый очень малый нулевой очень малый
*7 очень большой большой больше среднего средний малый очень малый нулевой
На следующем шаге необходимо на основе НЭТ ВР вычислить параметры общей тенденции, наблюдаемого ВР. Для этих целей введем следующие формулы. Для дефаззификации типа нечеткой тенденции:
(0,если = "стабильность" ОеРиггу(у{) = ]—1, если = "падение" (22)
11, если VI — "рост" Для дефаззификации интенсивности нечеткой тенденции — по методу центра тяжести, используемому в моделях нечетких систем ([Хт1п, Хтах определяются через минимальные и максимальные приращения значений временного ряда числовых параметров сервера):
f*maxXi ■ a(x)dx
DeFuzzy(ai) = --(23)
f*m°*a(x)dx
В случае дискретного универсального множества дефаззификация нечеткого множества по методу центра тяжести осуществляется по формуле численного интегрирования по методу прямоугольников:
DeFuzzy^^l^^ff (24)
•¿■¡=1 Vxi)
Для идентификации комплексной оценки общей нечеткой тенденции числового параметра сервера введем операцию GTend.
vcw = GTend (xlM (t), vLk (£), aik (t)) ,t = t,...tn (25)
Алгоритм 1 — Вычисление значения общей нечеткой тенденции vGti.
1. Получение временного ряда нечетких элементарных тенденций т(t) = <v(t),a(t),/i(t)), t = 2,3, ...,п и дефаззификация интенсивностей нечетких элементарных тенденций согласно формуле (23) a(t) = deFuzzy{a(t)).
2. Вычисление суммарных интенсивностей однотипных нечетких элементарных тенденций по всему временному ряду r(t) = <v(t),a(t),£(t)) (t = 2,3, ...,n):
если v(t) = "Рост", то 5Трост = STpocr + a(t),np ост = max (/ipocT,/i(i)) если v(t) = "Падение", то 5Тпадение - 57пздение + а(0,/гпадение
= шах (/¿падение» м(о)
3. Если (STpocT = 0 и 5Гпадение = 0) или (5Трост = 5Гпадение), то тип основной нечеткой тенденции vct = "Стабильность" и после дефаззификации vct = 0, динамика временного ряда стационарна, иначе шаг 4.
4. На основе сравнительного анализа значений STpo„ и 5Гпадение определим тип основной нечеткой тенденции. Если STpoCT > 2 • 5Гпадение , то Vct = "Рост" и после дефаззификации vGt = 1, иначе тип основной нечеткой тенденции vGt = "Падение" и после дефаззификации vct = —1. Динамика временного ряда нестационарна.
5. Определение интенсивности основной тенденции G : act = |-STp0CT —
*^^падение|4
Решение модели прогноза отдельного параметра сервера (13) и модели состояния сервера (15) производится стандартным методом нечеткого вывода Мамдани.
Получаемые результаты представлены в лингвистической форме, основаны на математических моделях временных рядов и нечетких тенденций, а поэтому более достоверны по сравнению с экспертными оценками администраторов ИТ-ресурсов. С другой стороны, по сравнению с методиками прогнозирования на основе математических методов анализа числовых временных ря-
дов предлагаемый подход имеет преимущество, так как в нем прогноз уточняется за счет внешних экспертных оценок.
В третьей главе описан разработанный комплекс программ регрессионно-нечеткого анализа состояния сервера (HEPA), предназначенный для разра-
ого объекта с последующим использованием их для прогноза состояния объекта.
В программе используются методы построения оптимальных комплексных динамических моделей временных рядов характеристик сервера и прогнозирования их будущих состояний.
Также, в программе реализованы алгоритмы нечеткой логики, с помощью которого проводится фаззификация полученных прогнозных значений и построение нечеткой модели, позволяющей получить заключение о состоянии сервера с учетом мнения эксперта.
В четвертой главе приводятся результаты применения и анализ эффективности метода РНМ для прогнозирования состояния терминального сервера предприятия.
В качестве исследуемого объекта был рассмотрен сервер терминалов ЗАО Банк «Венец». С помощью модуля сбора значений характеристик сервера были получены временные ряды максимальных суточных значений следующих характеристик: «Загрузка ЦП», «Загрузка ОП» и «Трафик» за период с 17 июня 2013 года по 14 сентября 2013 года.
Для каждого параметра были построены: комплексная модель ВР и получены прогнозные оценки, вычислены значения СКО SA, характеризующие точность прогнозирования.
В качестве примера приведем полученную модель ВР «Загрузка сетевого интерфейса» xceTb(t), включающую трендовую и гармонические составляющие, а также компоненты АРСС(2,0) и ARCH(l):
*сеть(0 = 77,282 + 9,405 • t + sceTb (26)
ботки комплексных моделей ВР характеристик
Рисунок 1. Схема модулей программного комплекса HEPA
/2я ■ t \ /2п ■ t \ $сетъ = 0,637 ■ sin ---253,73J + 5,505 ■ sin (—--- 88,287J
t2п ■ t \ /2я ■ t \
+ 4,798 ■ sin (-j^p- + 242,24J + 2,948 ■ sin (—— + 124,24j + aceTb
асеть = 0,383 ■ aceTb(t - 1) - 0,215 • aceTb(t - 2) + gcerb
ffceTb = 0,022 • e3(t - 1) + e(t) + e(t) где e(t) — вычисляется по формуле
£2(í) = 58,787+ 0,0012-£2(t-1) (27)
sceTb — остатки модели после вычитания алгебраического тренда; асеть— остатки модели после вычитания гармонического тренда; дсеть- остатки модели после вычитания компоненты АРСС(2,0); e(t) - остатки модели.
Загрузка сети,%
60
»"Данные
"Прогноз
ó^ CN^ с^
N V
Рисунок 3. График наблюдений и прогноза для хсеть(0 (внешнее СКО = 3,71) Результаты диагностики остатков последнего шага: остатки распределены нормально; авторегрессия отсутствует; дисперсия остатков гомоскедастична. СКО прогнозирования сгДсеть = 3,71% , коэффициент детерминации Д|еть = 0,83, Б-критерий Фишера Рсеть = 386. Т.к. для уровня значимости а = 0,05 ^сеть < модель является адекватной.
По параметрам хцп (Г), хОП (£) также были построены соответствующие модели и проведено прогнозирование. Результат сравнения точности прогнозирования с другими моделями по внешним ошибкам показан в таблице 3.
•*-сетьэ *Щ1> % хоп, %
Предложенный подход 5л(АДР) 3,71 5,26 4.14
ARIMA (Statistica) 5д (STAT~) 7,26 6.83 7,03
Нечеткие BP (Q. Song) S& (HM) 16,35 18,37 14,78
Очевидно, что применение ДРМ-моделей дает существенное увеличение точности по сравнению с другими исследованными моделями.
С целью реализации нечеткого оценивания числовых значений прогнозов были сгенерированы АСЬ-шкалы по временным рядам каждого параметра сервера. Использовалась треугольная функция принадлежности.
Нечеткое множество Параметры ФП
минимум Среднее максимум
■*сеть Очень низкий -16,5 0 16,5
Низкий 0 16,5 33
-^гсть Нечеткое множества Параметры ФГ1
минимум Среднее максимум
Ниже среднего 16,5 33 50
Средний 33 50 66,5
Выше среднего 50 66,5 83
Высокий 66,5 83 100
Очень высокий 83 100 116,5
По полученным АСЬ-шкалам проведена фаззифнкация прогнозных значений характеристик сервера. В таблице 5 представлены результаты процедуры фаззификации параметра хсеть([) — загрузка сетевого интерфейса сервера. Таблица 5 — Результаты оценивания по нечеткой АСЬ-шкале для хсеть(0_
№ Значение Степень принадлежности Нечеткое значение Нечеткая тенденция Интенсивность
82 77,3 0,760 Выше среднего Рост Очень малый
83 54,71 0,791 Низкий Падение Средний
84 76,438 0,892 Выше среднего Рост Средний
85 68,159 0,844 Средний Падение Очень малый
86 64,029 0.786 Средний Стабильность Нулевой
87 73,36 0,638 Выше среднего Рост Малый
88 67,396 0,728 Средний Падение Очень малый
89 65,366 0,582 Средний Стабильность Нулевой
90 71,681 0,618 Выше среднего Рост Очень малый
После фаззификации прогнозных значений переменных определены нечеткие элементарные и общие тенденции согласно (25) и предложенному алгоритму 1.
Л- *оп ^-сетъ
82 Рост Стабильность Рост
83 Падение Стабильность Падение
84 Рост Стабильность Рост
85 Падение Падение Стабильность
86 Стабильность Стабильность Падение
87 Рост Стабильность Рост
88 Падение Рост Падение
89 Стабильность Падение Стабильность
90 Рост Стабильность Рост
ОТ Рост Рост Стабильность
Для всех параметров сервера по модели (13) построены правила нечеткого вывода. Согласно проведенному модулированию были идентифицированы следующие тенденции: уС(г цп = Рост, уС(0П = Рост, т7СГ ссть = Стабильность. Таблица 7 -
Нечеткое зпаче-нпе т+р) Нечеткая тенденция Прогноз состояния характеристики сервера г,
Входная переменная Входная переменная Выходная переменная
Низкий Падение Недостаток загрузки
Низкий Рост Норма
Средний Стабильность Норма
Высокий Рост Превышение загрузки
Затем произведено построение итогового прогноза состояния сервера по модели (15) в виде совокупности правил. В данной модели включено мнение эксперта, что позволяет учитывать внешние факторы, не связанные с техническими параметрами сервера.
Таблица 8 — Пример правил нечеткого вывода заключения о состоянии сервера
Загрузка ЦП ^цп Загрузка ОП ^ОП Загрузка сети 7 Экспертная оцепка изменения нагрузки Ё Состояние сервера 5
Входная переменная Входная переменная Входная переменная Входная переменная Выходная переменная
Норма Норма Норма Стабильность Норма
Превышение загрузки Превышение загрузки Норма Увеличение загрузки Превышение загрузки
Недостаток загрузки Превышение загрузки Недостаток загрузки Снижение загрузки Недостаток загрузки
Таблица 9 — Заключение о прогнозе состояния сервера
Загрузка ЦП Загрузка ОП Загрузка сети Экспертная оценка нагрузки Состояние сервера
Лингвистическая оценка Превышение загрузки Превышение загрузки Норма Увеличение загрузки Превышение загрузки
Степень принадлежности 0,925 0,729 0,618 1 0,618
Применение метода регрессионно-нечеткого моделирования для прогнозирования состояния сервера позволило получить прогноз состояния сервера предприятия — «Превышение загрузки», что послужило причиной принятия управленческого решения о закупке дополнительного сервера терминалов и разделением загрузки между существующим и новым серверами.
Оценка эффективности предложенного подхода к прогнозированию состояния сервера произведена по критериям точности распознавания ситуаций, которые могут привести к потере работоспособности сервера, информационному критерию по формуле Хартли, критериям достоверности и объективности, временному и экономическому критериям. Результат сравнения предложенного метода с традиционным подходом визуального контроля состояния сервера представлен в таблице 10.
Таблица 10 — Оценка эффективности метода
Точность распознавания увеличение с 7 до 18 ситуаций
Информационный критерий увеличение с 8,42 до 25,90
Достоверность увеличение с 0,83 до 1
Объективность увеличение с 0,17 до 0,25
Время сокращение с 8 до 5 дней
Для примера был рассчитан экономический эффект для организации с годовым доходом 379 864 тыс. руб., который составил при использовании предложенного подхода 8018 тыс. руб.
В заключении приведены основные результаты и выводы по работе. В диссертации разработаны модель состояния сервера и метод регрессионно-нечеткого моделирования состояния сервера, алгоритмы и программное обеспечение для решения поставленной задачи раннего обнаружения ситуаций потери работоспособности сервера. Применение данного ПО позволило провести испытания разработанного метода в условиях реального сервера и показать эффективность его применения.
Основными результатами работы являются следующие:
1. Проведен анализ существующих подходов к решению прикладной проблемы. Сделан вывод о целесообразности интеграции математических моделей BP и нечетких моделей на основе согласования по времени и по значениям.
2. Предложен способ интеграции регрессионного и нечеткого моделирования и на этой основе разработана обобщенная регрессионно-нечеткая модель, отличающаяся возможностью прогнозирования состояния сервера по временным рядам его числовых параметров и экспертной прогнозной оценке его загрузки.
3. Разработан метод регрессионно-нечеткого моделирования для прогнозирования состояния сервера, отличающийся интеграцией моделей различных типов, имеющий лучшие показатели эффективности по сравнению с традиционным подходом визуального контроля состояния сервера (увеличение достоверности на 20%, объективности на 47%, повышения точности в 2,5 раза, увеличения информативности в 3 раза и сокращения времени принятия решения в 1,6 раз).
4. Разработан комплекс алгоритмов моделирования состояния сервера, отличающийся применением ACL-шкалы для формализации экспертных оценок; вычислительный алгоритм нахождения нечеткой оценки числового параметра сервера в виде нечеткой оценки общей тенденции его развития.
5. Предложена и реализована архитектура комплекса программ, ориентированного на регрессионно-нечеткое моделирование состояния сервера.
СПИСОК ПУБЛИКАЦИЙ
Основные результаты диссертации изложены в следующих публикациях. В ведущих научных изданиях, включенных в перечень ВАК:
1. Афанасьева Т.В. Моделирование временных рядов в терминах нечетких тенденций / Т.В. Афанасьева, С.Г. Валеев, А.О. Козлов // Обозрение прикладной и промышленной математики. — 2009. — Т. 16. - № 6. — С. 1019-1020.
2. Валеев С.Г. Прогнозирование состояния СОЖ / С.Г. Валеев, А.Ю. Богданов, A.M. Великанов, А.О. Козлов // Справочник. Инженерный журнал. №1(178). -2012. - С. 45-51.
3. Козлов А.О. Методика обработки техногенных временных рядов на основе адаптивных динамических регрессий / А.О. Козлов, A.M. Великанов, С.Г. Валеев // Известия Южного федерального университета. Технические науки. - 2012. - № 6(131). - С. 82-87.
В других изданиях:
4. Афанасьева Т.В. Моделирование лингвистических оценок на основе ACL-шкалы / Т.В. Афанасьева, А.О. Козлов, A.A. Ивахина // Труды V-й Международной научно-практической конференции "Интегрированные модели и мягкие вычисления" (Коломна, 20-30 мая 2009 г.). — М.: Физматлит, 2009. - Т. 1. - С. 298-304.
5. Козлов А.О. Программа FATS и перспективы ее развития // Вузовская наука в современных условиях: тезисы докладов 44-й научно-технической конференции (Ульяновск, 1-7 февраля 2010 г.). — Ульяновск: УлГТУ, 2010. -С. 157.
6. Валеев С.Г. Формирование нечетких тенденций по результатам функционирования пакета АС ДРМ-Т / С.Г. Валеев, А.О. Козлов // Информатика и вычислительная техника: сборник научных трудов Российской конференции аспирантов, студентов и молодых ученых: ИВТ-2010 (Ульяновск, 25-26 мая 2010 г.). - Ульяновск: УлГТУ, 2010. - С. 7274.
7. Козлов А.О. Оптимальные динамические регрессии для описания характеристик технологического процесса // Вузовская наука в современных условиях: тезисы докладов 45-й научно-технической конференции (Ульяновск, 24-29 января 2011 г.). — Ульяновск: УлГТУ, 2011.-С. 190.
8. Козлов А.О. Вычислительные эксперименты по прогнозированию состояния смазочно-охлаждающей жидкости // Информатика и вычислительная техника: сборник научных трудов 3-й Всероссийской научно-технической конференции аспирантов, студентов и молодых ученых: ИВТ-2011 (Ульяновск, 24-25 мая 2011 г.). - Ульяновск: УлГТУ, 2011.-С. 292-294.
9. Козлов А.О. Экспертная оболочка для СРП: вопросы проектирования при синтезе АДР-моделей // Вузовская наука в современных условиях: сборник материалов 46-й научно-технической конференции (Ульяновск, 23-28 января 2012 г.). - Ульяновск: УлГТУ, 2012. - Т. 2. - С. 212-214.
10. Валеев С.Г. Методика совместной обработки временных рядов технологического процесса на основе адаптивных динамических регрессий / С.Г. Валеев, А.О. Козлов // Информатика и вычислительная техника: сборник научных трудов 4-й Всероссийской научно-технической конференции аспирантов, студентов и молодых ученых: ИВТ-2012
(Ульяновск, 21-23 мая 2012 г.). - Ульяновск: УлГТУ, 2012. - Т. 1. - С. 315-319.
11. Козлов А.О. Система раннего предупреждения для анализа поведения технологических процессов // VII Всероссийская научная конференция Математическое моделирование развивающейся экономики, экологии и биотехнологий: ЭКОМОД 2012 (Киров, 2-8 июля 2012 г.): материалы конференции. —Киров: ВятГУ, 2012. — С. 41.
12. Козлов А.О. Методика моделирования поведения сложной системы на примере серверного узла предприятия / А.О. Козлов, Т.В. Афанасьева // Информатика, моделирование, автоматизация проектирования: сборник научных трудов 4-й Всероссийской школы-семинара аспирантов, студентов и молодых ученых ИМАП-2012 (Ульяновск, 22-24 октября 2012 г.). - Ульяновск: УлГТУ, 2012. - С. 225-230.
13. Козлов А.О. Интеллектуальная система анализа и прогнозирования на основе регрессионно-нечеткого моделирования / А.О. Козлов, Т.В. Афанасьева // Информатика: проблемы, методология, технологии: материалы XIII Международной научно-методической конференции (Воронеж, 7-8 февраля 2013 г.). — Воронеж: Издательско-полиграфический центр Воронежского государственного университета, 2013. — Т. 2. — С. 274-278.
Козлов Александр Олегович Прогнозирование состояния сервера иа основе регрессионно-нечетких моделей
Автореферат Подписано в печать 14.04.2014. Формат 60x84 1/16 Усл. печ. л. 1,40. Тираж 120 экз. Заказ 493. ИПК «Венец» УлГТУ, 432027, Ульяновск, ул. Северный Венец, 32.
Текст работы Козлов, Александр Олегович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
УЛЬЯНОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ
Козлов Александр Олегович
ПРОГНОЗИРОВАНИЕ СОСТОЯНИЯ СЕРВЕРА НА ОСНОВЕ РЕГРЕССИОННО-НЕЧЕТКИХ МОДЕЛЕЙ
Специальность 05.13.18 - Математическое моделирование, численные методы и комплексы программ
Диссертация на соискание ученой степени кандидата технических наук
Научный руководитель доктор технических наук, профессор Афанасьева Т.В.
Ульяновск - 2014
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ.....................................................................................................................5
1. АНАЛИЗ СОСТОЯНИЯ СЕРВЕРА..................................................................11
1.1. Анализ состояния сервера...............................................................................11
1.2. Системы контроля параметров сервера.........................................................17
1.2.1. Аппаратные системы................................................................................17
1.2.2. Программные системы.............................................................................19
1.3. Наиболее адекватные числовые параметры для оценивания работоспособности сервера терминалов.................................................................22
1.4. Статистические методы прогнозирования состояния сервера....................27
1.4.1. Регрессионные модели...............................................................................28
1.4.2. Авторегрессионные модели.......................................................................33
1.4.3. Адаптивное прогнозирование...................................................................36
1.4.4. Подход динамического регрессионного моделирования........................39
1.5. Существующее программное обеспечение для моделирования временных рядов............................................................................................................................42
1.6. Нечеткие модели для формализации экспертных оценок работоспособности сервера.......................................................................................46
1.6.1. АСЬ-шкала...................................................................................................46
1.6.2. Механизм нечеткого вывода по Мамдани...............................................50
1.6.3. Модели нечетких временных рядов..........................................................55
1.6.4. Гибридные модели ВР................................................................................56
1.7. Выводы..............................................................................................................61
2. МЕТОД РЕГРЕССИОННО-НЕЧЕТКОГО МОДЕЛИРОВАНИЯ СЕРВЕРА......................................................................................................................63
2.1. Разработка обобщенной регрессионно-нечеткой модели состояния сервера.........................................................................................................................63
2.2. Метод регрессионно-нечеткого моделирования состояния сервера...........66
2.3. Алгоритмическое обеспечение метода регрессионно-нечеткого моделирования состояния сервера по набору параметров....................................75
2.3.1. Алгоритм решения задачи прогнозирования на основе динамического регрессионного моделирования.............................................................................. 75
2.3.2. Алгоритм решения задачи интерпретации параметров и их тенденций сервера на основе применения АСЬ-шкалы.......................................................... 77
2.3.3. Алгоритм вычисления комплексной оценки общей нечеткой тенденции числового параметра сервера............................................................................... 79
2.4. Выводы..............................................................................................................80
3. РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ РЕГРЕССИОННО-НЕЧЕТКОГО АНАЛИЗА СОСТОЯНИЯ СЕРВЕРА..........................................82
3.1. Обобщенная структура и функции ПО НЕРА...............................................82
3.2. Описание модулей и структур ПО НЕРА......................................................83
3.2.1. Подсистема сбора значений характеристик сервера...........................83
3.2.2. Подсистема адаптивного динамического регрессионного моделирования.........................................................................................................85
3.2.3. Подсистема автоматизации ДРМ-моделирования...............................87
3.2.4. Подсистема нечеткого моделирования и резюмирования характеристик сервера..........................................................................................89
3.3. Выводы..............................................................................................................90
4. ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ АНАЛИЗА ПОВЕДЕНИЯ СЕРВЕРА НА ОСНОВЕ РЕГРЕССИОННО-НЕЧЕТКОГО / МОДЕЛИРОВАНИЯ..................................................................................................91
4.1. Прогнозирование числовых параметров сервера..........................................92
4.2. Интерпретация параметров сервера и генерация экспертных оценок прогнозных значений и тенденций........................................................................100
4.3. Генерация итогового экспертного заключения...........................................105
4.4. Оценка эффективности метода.....................................................................111
4.4.1. Критерий точности распознавания......................................................111
4.4.2. Информационный критерий...................................................................113
4.4.3. Критерии достоверности и объективности. Временной критерий. 114
4.4.4. Экономический критерий........................................................................118
4.5. Выводы............................................................................................................119
ЗАКЛЮЧЕНИЕ.........................................................................................................121
СПИСОК СОКРАЩЕНИЙ.....................................................................................123
СПИСОК ЛИТЕРАТУРЫ.......................................................................................124
ПРИЛОЖЕНИЕ А.....................................................................................................133
ВВЕДЕНИЕ
Актуальность темы. В современных условиях интенсивного развития информационно-коммуникационных технологий задача обеспечения стабильного функционирования отдельного сервера, как элемента ИТ-структуры является актуальной. Особую важность эта задача приобретает для предприятий малого и среднего бизнеса, обладающих ограниченными ресурсами и находящимися на стадии развития.
В случае возникновения изменения нагрузки на отдельный сервер, приводящего к снижению или потере его работоспособности, в таких организациях требуется от нескольких часов до нескольких дней для восстановления его стабильного функционирования. Изменение нагрузки может возникнуть и в случае воздействия на сервер внешних трудно формализуемых факторов, а поэтому формулируемых экспертно лицами, принимающими решение, например, таких как увеличение объема решаемых задач, рост числа клиентов, изменение масштаба предприятия. Все это может привести к потере ценной информации, непредвиденным и значительным материальным затратам в условиях активного перехода к интернет-экономике. Чтобы обеспечить раннее предупреждение о возможных в будущем нарушениях функционирования отдельного сервера и учесть эти риски при планировании развития ИТ-ресурсов предприятия целесообразно применять методы анализа состояния сервера, ориентированные как на текущие, так и на прогнозные оценки тенденций изменения физических (числовых) параметров сервера с учетом внешних экспертных оценок тенденций развития предприятия.
Для решения проблемы обеспечения стабильного функционирования сервера применяются системы мониторинга и контроля работоспособности серверов по отдельным параметрам (например, «PWS ИТ-мониторинг» [1], «NMS Aurora» [2]), однако, функции таких систем не предусматривают решение задачи прогнозирования, а также не позволяют идентифицировать опасные тенденции изменения состояния сервера как целостного объекта.
Достаточно часто используется подход к прогнозированию состояния сервера путем визуального анализа графиков временных рядов числовых параметров, однако при этом результаты прогноза в значительной степени зависят от квалификации и субъективного мнения администратора вычислительной сети.
Поэтому в ряде работ обоснована необходимость прогнозирования числовых параметров сервера, в частности в работе Терейковской [3] предлагается применять статистические модели временных рядов для прогнозирования числовых параметров интернет-серверов. В работе Веркотрен и др. [4] для прогнозирования нагрузки на веб-сервер предлагается иерархическая модель временного ряда, включающая в себя гармоническую и авторегрессионную составляющие. Комплексная модель изменения трафика сервера на основе применения подхода динамического регрессионного моделирования предложена в работах С.Г. Валеева и Ю.Е. Кувайсковой [5]. Вычислительные эксперименты показали его эффективность в плане точности прогнозирования ВР трафика сервера по сравнению с моделями класса АРПСС. Методы интеллектуального анализа для прогнозирования трафика сервера активно развиваются в исследованиях научной группы, возглавляемой Н.Г. Ярушкиной. Так, например, в [6] предложена математическая имитационная модель числовых параметров терминал-сервера как элемента вычислительной сети на основе временных рядов их нечетких тенденций, позволяющая прогнозировать трафик сервера. Нечеткое моделирование показало свою продуктивность для прогнозирования и лингвистической интерпретации состояния и тенденций изменения поведения сервера. Также разрабатываются подходы к прогнозированию отдельных характеристик сервера для целей управления его ресурсами [7,8].
Можно констатировать, что существующие модели прогнозирования состояния сервера основаны на моделировании его внутренних числовых параметров по временным рядам и не учитывают внешние экспертные оценки тенденций развития предприятия.
Возникает научно-техническая проблема разработки метода прогнозирования работоспособности сервера путем интеграции статистических
6
моделей прогнозирования его числовых параметров и нечетких моделей экспертного оценивания для обнаружения возможных проблем на ранних стадиях и получения о них информации, необходимой для принятия обоснованных и оперативных управленческих решений.
Объектом исследования является сложный технический объект - сервер предприятия. Предметом исследования являются модели прогнозирования состояния сервера.
Целью диссертационной работы является повышение эффективности прогнозирования состояния сервера на основе разработки метода, интегрирующего регрессионное и нечеткое моделирование его параметров.
Для достижения указанной цели в работе необходимо решить следующие задачи:
1. Выбор эффективного подхода к моделированию числовых временных рядов, обладающих различным поведением.
2. Разработка обобщенной модели прогнозирования состояния сервера, включающей числовые временные ряды и нечеткую экспертную оценку.
3. Разработка алгоритма получения комплексной оценки состояния сервера.
4. Разработка метода регрессионно-нечеткого моделирования для прогнозирования состояния сервера, заданного набором гетерогенных данных.
5. Создание специализированной программной системы для моделирования и прогнозирования состояния сервера.
При решении поставленных задач в диссертационной работе использовались методы математического моделирования, прикладной математической статистики, анализа временных рядов, методы численного интегрирования, дифференцирования и решения систем линейных алгебраических уравнений; при разработке программного обеспечения применялись методы объектно-ориентированного программирования.
Достоверность результатов, представленных в диссертации, обеспечивается корректностью применения математического аппарата статистического и
7
нечеткого моделирования, и подтверждается результатами статистических экспериментов на реальном оборудовании.
Научная новизна результатов, выносимых на защиту:
1. Обобщенная регрессионно-нечеткая модель, отличается возможностью прогнозирования состояния сервера по временным рядам его числовых параметров и экспертной прогнозной оценкой его загрузки.
2. Метод регрессионно-нечеткого моделирования для прогнозирования состояния сервера, содержит новое совмещенное применение гетерогенных моделей, согласованных по времени и значению, обеспечивающий снижение временных и экономических затрат.
3. Новизна алгоритма вычисления комплексной нечеткой оценки состояния сервера, заключается в способности генерировать по временному ряду числового параметра лингвистическую интерпретацию в виде нечеткой оценки общей тенденции его развития.
4. Программная система, реализует алгоритмы метода регрессионно-нечетного моделирования для прогнозирования состояния сервера.
Теоретической значимостью обладает предложенный метод интеграции гетерогенных данных при прогнозировании состояния сложной технической системы, и открывает новые практические возможности повышения качества прогнозирования состояния таких систем.
Практическая ценность результатов работы заключается в том, что разработанные алгоритмы и программы могут быть использованы для исследования состояния ИТ-инфраструктуры малых и средних предприятий. Возможность прогнозирования состояния серверов предприятия с учетом мнения эксперта позволяет принимать более обоснованные решения об изменении конфигурации компьютерного парка предприятия.
Результаты работы были применены в научно-исследовательской работе «Проектирование подсистемы раннего предупреждения о нарушении условий устойчивого функционирования серверного узла» для ООО «Фирма ВИА»; использовались при формировании заявок на гранты РФФИ №13-01-00547 и 148
01-31428; применяются в НИР, выполняемой по гранту РФФИ 14-07-00247 «Методология моделирования и прогнозирования локальных тенденций временных рядов в задачах анализа больших данных»; использовались в учебном процессе УлГТУ. Также, результаты диссертации внедрены и используются в ЗАО Банк «Венец» и ООО «Симбирск-Ойл» для практического применения при анализе эффективности использования серверного парка предприятия.
Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях, семинарах и симпозиумах:
- 5-я Международная научно-практическая конференция "Интегрированные модели и мягкие вычисления" (Коломна, 2009);
- Всероссийская научно-техническая конференция аспирантов, студентов и молодых ученых "Информатика и вычислительная техника" (Ульяновск, 2010, 2011,2012);
- Всероссийская научная конференция «Современные проблемы математического моделирования, супервычислений и информационных технологий» (Таганрог, 2012);
- 7-я Всероссийская научная конференция «Математическое моделирование развивающейся экономики и экологии» (Киров, 2012)
- Российская школа-семинар аспирантов, студентов и молодых ученых «Информатика, моделирование, автоматизация проектирования» (Ульяновск, 2012);
- XIII Международная конференция "Информатика: проблемы, методология, технологии" (Воронеж, 2013)
- научно-техническая конференция профессорско-преподавательского состава УлГТУ (Ульяновск, 2010, 2011, 2012).
По теме диссертации опубликовано 13 печатных работ, из которых 3 - в изданиях, входящих в перечень ВАК.
Диссертационная работа состоит из введения, четырех глав, заключения, библиографического списка литературы, включающего 94 наименования на 9
страницах, списка сокращений и 1 приложения. Общий объем диссертации составляет 135 страниц.
В первой главе выполнен обзор видов серверов в организациях, существующего ПО для моделирования ВР, систем контроля параметров сервера. Также приводится обзор математических моделей, методов и программного обеспечения, применяемых для обработки ВР.
Во второй главе описан метод регрессионно-нечеткого моделирования, применение его к решению задач интерпретации, диагностики, прогноза и планирования. Описаны алгоритмы, решения задач с помощью предложенного метода.
В третьей главе представлено описание структуры комплекса программ регрессионно-нечеткого моделирования HEPA.
В четвертой главе описаны вычислительные эксперименты, на реальных данных показана эффективность предлагаемого метода.
В заключительной части сформулированы основные результаты и выводы, полученные при выполнении диссертационной работы.
1. АНАЛИЗ СОСТОЯНИЯ СЕРВЕРА
1.1. Анализ состояния сервера
В настоящее время на предприятиях используются различные по роду решаемых задач виды серверов, наиболее распространены из которых следующие:
1. Сервер авторизации - специализированный сервер, позволяющий идентифицировать пользователя для предоставления ему доступа и определенного набора прав в ЛВС.
2. Файловый сервер - сервер для хранения файлов в ЛВС предприятия и разграничения доступа к данным файлам различным пользователям. В ответ на запрос пользователя предоставляется доступ к файлу. Является самым распространенным типом серверов в организациях.
3. Сервер баз данных - сервер для хранения данных внутри ЛВС предприятия. В отличие от файлового сервера сервер БД предоставляет в ответ на запрос не целый файл, а его фрагмент в виде отдельных записей, затребованных в запросе. За счет такого подхода происходит уменьшение нагрузки на ЛВС и сокращение времени получения информации пользователем.
4. Почтовый сервер - сервер, занимающийся обработкой и управлением электронной почтой организации.
5. Веб-сервер - это сервер, принимающий НТТР-запросы от клиентов, обычно веб-браузеров, и выдающий им НТТР-ответы, как правило, вместе с НТМЬ-страницей, изображением, файлом, медиа-потоком или другими данными. Слу
-
Похожие работы
- Методология, модели и комплексы программ анализа временных рядов на основе нечетких тенденций
- Восстановление закономерностей на основе нечетких регрессионных моделей
- Автоматизированное проектирование сложных технических систем в условиях неопределенности
- Автоматизированное проектирование вычислительных сетей крупных проектных организаций
- Оценка достоверности устаревающих значений в диспетчерских системах
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность