автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математическое моделирование и комплекс программ анализа временных рядов на основе нечеткой модели

кандидата технических наук
Романов, Антон Алексеевич
город
Ульяновск
год
2013
специальность ВАК РФ
05.13.18
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Математическое моделирование и комплекс программ анализа временных рядов на основе нечеткой модели»

Автореферат диссертации по теме "Математическое моделирование и комплекс программ анализа временных рядов на основе нечеткой модели"

На правах рукописи Романов Антон Алексеевич

Математическое моделирование и комплекс программ анализа временных рядов на основе нечеткой модели

05.13.18 - Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

г 1 ноя гт

Ульяновск - 2013

005539114

Работа выполнена на кафедре «Информационные системы» в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Ульяновский государственный технический университет».

Научный руководитель: доктор технических наук, профессор

Ярушкина Надежда Глебовна

Официальные оппоненты: доктор технических наук, ФГБОУ ВПО «Ульяновский государственный университет», профессор кафедры -«Информационные технологии» Семушин Иннокентий Васильевич

доктор физико-математических наук, ФГБУН Санкт-Петербургский институт информатики и автоматизации Российской академии наук, доцент, заведующий лабораторией теоретических и междисциплинарных проблем информатики Тулупьев Александр Львович

Ведущая организация: ФГВОУ ВПО «Ростовский государственный универси-

тет путей сообщения»

Защита диссертации состоится «18» декабря 2013 г. в 12°° часов на заседании диссертационного совета Д 212.278.02 при ФГБОУ ВПО «Ульяновский государственный университет», расположенном по адресу: г. Ульяновск, ул. Набережная р. Свияги, 106, корп. 1, ауд. 703.

С диссертацией можно ознакомиться в научной библиотеке Ульяновского государственного университета, с авторефератом - на сайте ВУЗа http://ppo.ulsu.ru и на сайте Высшей аттестационной комиссии при Министерстве образования и науки РФ - http://vak.ed.gov.ru.

Отзывы на автореферат в двух экземплярах, заверенные печатью организации, просим направлять по адресу: 432017, г. Ульяновск, ул. Л. Толстого, д. 42, УлГУ, Отдел послевузовского профессионального образования.

Автореферат разослан «_»_2013 г.

Ученый секретарь

диссертационного совета Д 212.278.02 кандидат фюико-матсматичиских наук, Доцеиг / / Волков М.А.

Общая характеристика работы

Актуальность проблемы

Важнейшей частью экспресс-анализа предприятия является исследование изменения основных показателей деятельности и соотнесение их с развитием отрасли в целом. Проводя регулярный экспресс анализ, менеджер в первую очередь стремится выявить отклонения в критических моментах деятельности предприятия, а так же выяснить причину их появления и тенденцию движения этих изменений. При этом процессы обнаружения тенденций и их прогнозирования можно выделить в отдельную задачу анализа временных рядов (BP). В связи с ростом хранимых данных данная задача приобретает особую актуальность, поскольку так же важна оперативность проведения анализа, влияющая на качество принимаемых решений.

Статистические методы для решения поставленной задачи анализа тенденций и прогноза экономических показателей предприятий в рамках экспресс-анализа, не удовлетворяют новым требованиям, так как имеют существенные ограничения: они обладают высокой сложностью, ориентированы на длинные временные ряды (предпочтительно более 50 точек) 2> 3.

Объекты экспресс-анализа экономических показателей предприятия обладают объективной неопределенностью, которая может быть соотнесена с нечеткостью, поэтому для анализа тенденций и прогноза экономических показателей следует применять интеллектуальные методы и нечеткие модели 4i 5' 6

Развитие вычислительных сетей разного уровня (от локальных до глобальных сетей передачи данных) в последнее десятилетие вызвало рост интеграции сетей передачи данных с производственными процессами (коммерческой деятельностью). Работа предприятий все более зависит от качества обслуживания в сетях.

Актуальность обозначенной проблемы обусловлена и усложнением архитектуры вычислительных сетей, взаимодействием нескольких разнородных сетей при проведении регулярных испытаний. Так, тестирование производительности сетей сводится к измерению параметров качества обслуживания QoS (Quality of Service) или производительности сети NP (Network Performance) при различных значениях параметров поступающей нагрузки трафика сети.

Одной из задач моделирования является анализ пропускной способности вычисли-

1 Бокс, Дж. Анализ временных рядов, анализ и управление / Дж. Бокс, Г. Дженкинс. — 1974. —

405 с.

2 Лукашин, Ю.П. Адаптивные методы краткосрочного прогнозирования временных рядов / Ю.П. Лукашин. — М: Финансы и статистика, 2003.— 416 с.

3 Yao, J. and Herbert, J. P., 2009. Financial time-series analysis with rough sets. Applied Soft Computing, 9, 1000-1007

4 Q.Song. Forecasting enrollments with fuzzy time seriess - Part I / Q.Song, B.Chissom // Fuzzy Sets and Systems. — 1993. — №. 54. — C. 1-9.

5 Ярушкина H. Г. Основы теории нечетких и гибридных систем. М.: Финансы и статистика, 2004,

320 с.

6 Novak, V., Stepnicka, М., Dvorak, A., Perfilieva, I. and Pavliska, V. (2010). Analysis of seasonal time series using fuzzy approach. International Journal of General Systems, 39, pp. 305-328.

тельной сети (ВС) (трафик, нагрузка, задержка и т.д.). В этом случае узлы сети выступают в роли генераторов и обработчиков трафика. Если для коммутирующего оборудования существует достаточно много библиотек позволяющих выполнять имитационное моделирование, то для узлов-пользователей необходимо реализовывать модели в каждом конкретном случае моделирования.

Динамика временных рядов трафика вычислительных сетей зависит от временных интервалов наблюдения и может характеризоваться высокой степенью неопределенности, обусловленной неоднородностью поведения в виде комбинации нестационарного и стационарного поведения. Нестационарное поведение таких ВР также не однородно. Это создает определенные трудности в подборе статистических и нейросетевых моделей

Объектом исследования являются нестационарные временные ряды малой и средней длины, а так же стационарные временные ряды малой длины.

Предметом исследования выступают математические методы и модели анализа и прогнозирования временных рядов. Цель диссертационной работы

Целью диссертации является разработка математических моделей, методов, эффективных алгоритмов, средств анализа и прогнозирования нестационарных временных рядов малой и средней длины, а так же стационарных временных рядов малой длины.

В соответствии с целью работы актуальными будем считать следующие задачи исследования:

• Провести сравнительный анализ существующих методов и систем моделирования и прогнозирования временных рядов.

• Разработать методику моделирования и прогнозирования адаптированную для работы с короткими временными рядами на основе метода Р-преобразования.

• Разработать нечеткую модель временного ряда.

• Выбрать архитектуру нейронной сети и разработать ее топологию для прогнозирования компонент временного ряда.

• Адаптировать генетический алгоритм, обеспечивающий выбор оптимальных параметров адаптированного метода Е-преобразования.

• Разработать программный комплекс моделирования и прогнозирования коротких временных рядов.

• Провести вычислительные эксперименты по исследованию эффективности прогнозирования временных рядов предложенным методом, сравнить результаты с существующими аналогами.

1 Стецко, А. А. Принятие проектных решений на основе анализа нечетких тенденций временньЕХ рядов / А. А. Стецко // Программные продукты и системы. - 2008. - № 3

Методы исследования основываются на современной теории неопределенности, неточности и нечеткости; методах математической статистики; методах моделирования временных рядов.

Научная новизна. Научной новизной обладают разработанные автором нечеткая модель временного ряда, отличающаяся возможностью использования неравномерного нечеткого разбиения и обеспечивающая повышение точности аппроксимации; предложенная новая методика использования метода Г-пребразования для анализа и прогнозирования временных рядов, отличающаяся от прочих методов возможностью работы с временными рядами малой длины; разработанный новый алгоритм взаимодействия метода Г-преобразования и метода нечетких тенденций, позволяющий улучшить качество сглаживания временных рядов посредством построения неравномерного разбиения; разработанная программная система прогнозирования коротких временных рядов на основе метода Г-преобразования.

Основные положения, выносимые на защиту:

1. Нечеткая модель временного ряда, имеющая возможность задания неравномерного нечеткого разбиения.

2. Предлагаемая методика анализа и прогнозирования временных рядов малой длины, основанная на методе Г-преобразования, обеспечивающая выбор оптимального количества компонент. Методика использует новое приложение итерационного численного алгоритма решения системы линейных алгебраических уравнений для задачи прогнозирования остатков временного ряда.

3. Алгоритм интеграции метода Г-преобразования и метода нечетких тенденций, позволяющий производить неравномерное разбиение временных рядов.

4. Разработанный программный комплекс, позволяющий проводить сглаживание и прогнозирование временных рядов.

Теоретическая и практическая значимость. Теоретической значимостью обладают разработанные модели, алгоритмы для анализа и прогнозирования коротких временных рядов.

Созданная программная система прогнозирования коротких временных рядов на основе метода Г-преобразования используется на производстве и позволяет достичь улучшенных показателей прогнозирования.

Практическая ценность состоит в том, что разработанные модели и алгоритмы реализованы в форме программной системы и внедрены в деятельность ФНЦП ОАО «НПО Марс» (г. Ульяновск). Практическое использование результатов диссертационной работы подтверждено соответствующими документами о внедрении.

Достоверность результатов диссертационной работы

Достоверность научных положений, выводов и рекомендаций подтверждена результатами экспериментов, а так же результатами использования материалов диссертации и разработанной системы в проектной организации.

Апробация работы

Основные положения и результаты диссертации докладывались, обсуждались и получили одобрение на Всероссийской конференции с международным участием «Проведение научных исследований в области обработки, хранения, передачи и защиты информации» (г. Москва, SofTool, 2011 г.); на ICIT-2012 (г. Саратов, 2012 г.); на VI-й международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (г. Коломна, 2011 г.); на ежегодной конференции УлГТУ (г. Ульяновск, 2010 г.); ИННОВАТИКА-2010, Ульяновск, 2010; 9th Int. Conf. on Application of Frizzy Systems and Soft Computing (ICAFS 2010), Prague, 2010; Двенадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2010, Тверь, 2010; Seoul International Inventory Fair, Seoul, Korea, 2010 (SIIF 2010); 7-th Zittau Fuzzy Colloquium September 15 - 17, 2010 Zittau, Germany; 13-th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing, 26 - 28 June, 2011 Organized by Higher School of Economics (HSE), Moscow, Russia.

Публикации по теме диссертации. По материалам диссертации опубликовано 15 печатных работ, из них 5 статей - в журналах из списка рекомендованных ВАК, получено свидетельство о государственной регистрации программы для ЭВМ.

Личный вклад автора. Постановка задачи осуществлена совместно с научным руководителем. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к публикации полученных результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим. Все представленные в диссертации результаты получены лично автором.

Структура и объем диссертации

Диссертация состоит из введения, четырех глав, заключения, списка литературы из 104 наименований, трех приложений, содержит 145 страниц машинописного текста, 41 рисунок и 23 таблицы.

Основное содержание работы

Во введении рассмотрена актуальность работы, определена ее цель и задачи, сформулированы положения, выносимые на защиту, их научная новизна и практическая ценность. Представлены основания для выполнения работы, ее апробация и структура.

В первой главе рассмотрены методы и средства математического моделирования и анализа временных рядов. Приведен обзор характеристик временных рядов, составляющих их компонент, определен круг задач, решаемых над временным рядом. Рассмотрены ключевые моменты, выделены достоинства и недостатки методов анализа временных рядов, имеющих различный математический аппарат. Отдельно рассмотрены методы интеллектуального анализа данных.

Был произведен обзор сущности временного ряда, определены категории задач его моделирования. Задачи моделирования временных рядов решаются большим количеством методов. Эти методы имеют различный математический аппарат, подразделяются по возможностям применения (т.е. могут иметь частные условия применимости в зависимости

от типа решаемой задачи н характера временного ряда), могут требовать постоянного или временного задействования аналитика непосредственно в ходе процесса моделирования. Важным условием применения методов является нацеленность на получение краткосрочных прогнозов. Оно вытекает из возникающих в последнее время особенностей процессов, для которых применяются модели временных рядов.

В настоящее время использование методов в чистом виде пригодно лишь для решения тривиальных задач. Большими возможностями обладают различные сочетания методов. При их использовании происходит разбиение задачи на более простые части и применяют именно те методы, которые наиболее подходящи доя подзадач.

Приобретают популярность методы интеллектуального анализа данных, позволяющие использовать простоту и удобства статистических моделей, гибкость и унифицированность применения нейронных сетей и генетических алгоритмов, широкие возможности интерпретации и анализа полученных данных. Данный раздел методов использует и развивает возможности построения гибридных моделей с целью интенсификации обработки данных.

Новым методом, позволяющим повысить эффективность моделирования временных рядов, является метод F-преобразования. Его особенностью является построение кусочно-линейного тренда временного ряда. Представляет собой новый инструмент для декомпозиции временного ряда на тренд и остатки. Компоненты F-преобразования являются точками минимума функции, задающей критерий взвешенного среднеквадратичного отклонения

F-преобразование имеет также следующие свойства, важные для использования в качестве сглаживающего метода временных рядов: отличается высокими фильтрующими свойствами, простотой вычисления, стабильностью относительно выбора точек исходной функции.

Во второй главе описана новая методика применения метода F-преобразования к задаче декомпозиции коротких временных рядов п последующего их прогнозирования. Предложен алгоритм интеграции метода F-преобразования с методом нечетких тенденций для улучшения качества аппроксимации временного ряда посредством извлечения дополнительной информации о поведении локальных тенденций. Описано применение генетического алгоритма к задаче поиска оптимальных параметров предлагаемой методики. Рассмотрены процедуры получения прогнозных значений компонент временного ряда.

Объектом моделирования являются нестационарные временные ряды малой и средней длины, а так же стационарные временные ряды малой длины. За основу метода моделирования временного ряда был взят метод F-преобразования, относящийся к методам интеллектуального анализа данных, позволяющим проводить нечеткое сглаживание временных рядов. Данный метод позволяет строить модель временного ряда, выделяя при этом две составляющие сущности временного ряда: кусочно-линейный тренд и остатки от разности временного ряда и тренда.

1 Перфильева, И. Нечеткое преобразование / И. Перфильева // Нечеткая логика. — Амстердам, 2003. — 275 с.

Обозначим временной ряд как:

Т5= {«¿¡¡},г е N,

где tSi = [4,, - элемент временного ряда в момент времени ^ и значением равным ь^,

Vи е к.

Отличием от раннее применявшейся модели является возможность задания количества точек, которое покрывает каждая базисная функция. Пусть FT'_Л - множество базисных функций, необходимое для разбиения всего временного ряда.

РТ_А={А<,срис1<},

где Л4 - базисная функция, ср1 - количество точек, покрываемое базисной функцией А( с вершиной си в точке Определим функцию задания нечеткого разбиения:

ГГ : (Т5, РТ_А) -4

где ^ - компоненты Р-преобразования. Остатки временного ряда вычисляются как разность между компонентами Р-преобразования (точками кусочно-линейного тренда) и исходным временным рядом:

Я = (Т5 -Тогда нечеткая модель временного ряда

FГЯ = (Р + Я).

Для достижения цели исследования необходимо обеспечить возможность работы представленной модели с временными рядами, обозначенными в объекте исследования. Решение данной задачи предлагается следующее:

1. Обеспечить возможность изменения параметров как модели временного ряда, так и прогнозной модели с целью их настройки;

2. Привлекать сторонними инструментами (конкретно в данном исследовании используется метод нечетких тенденций) дополнительную информацию о поведении временного ряда на различных его участках.

Правильность установки значимых параметров при моделировании предлагается контролировать посредством построения прогноза временного ряда на участке известных значений, предназначенном для тестирования модели.

При проведении декомпозиции временного ряда необходимо определять ср,, от величины которым, в конечном итоге, определяется количество базисных функций нечеткого разбиения и, следовательно, количество получаемых компонент Р-преобразования. Количество компонент влияет на уровень сглаживания исходного временного ряда, тем самым позволяет переходить от частных к наиболее общей тенденции временного ряда.

В качестве прогнозной модели выступает авторегрессионная модель Бокса-Джен-кинса. Отдельно производится прогнозирование выделенных компонент временного ряда:

тренда и остатков. Прогноз компоненты тренда определяется как: Fk+l = -Ffc-lM-emZl + fk-ieueI+2^2 + ••• + Friend-

По заранее заданному порядку авторегрессин level (level « к) строится система линейных алгебраических уравнений (СЛАУ). Строим две матрицы: коэффициентов и свободных членов для нахождения неизвестных х\, ...х^ы- Вид матриц для к компонент тренда будет следующим:

Также для составления матриц предлагается использовать относительные изменения компонент.

Прогноз компоненты тренда: — = (^_ге„е1+1 — А_1е„е1)х1 +

-•Р*-/пк|+1)®2 + ... + (^ - .

Матрицы строятся аналогично вышеописанной, но с учетом относительных значений.

Для нахождения корней систем уравнений представленных выше используются следующие инструменты:

1. Метод простой итерации (для СЛАУ с абсолютными значениями);

2. Многослойный перцептрон (для СЛАУ с абсолютными значениями);

3. Сеть Кохонена с выходом Гроссберга (для СЛАУ с относительными значениями).

Применяется несколько методов, поскольку для различных временных рядов, ограниченных по длине, сложно сделать предположение о том, каким лучше строить прогноз. Зачастую, точные корни СЛАУ не могут быть найдены и тогда возникает задача о наиболее выгодном приближении к решению.

Решая данные системы, получаем значения Подставив значения компо-

нент в = + ^_|ет<г+2а;з + - + ^¡еи» получим модельное значение

Прогнозные значения остатков находятся аналогичным образом: построением авторегрессионной зависимости и нахождением прогнозных значений путем решения СЛАУ.

Для обеспечения возможности настройки прогнозной модели выделяются следующие параметры: порядок авторегрессии и метод, которым находятся прогнозные значения.

После получения прогнозных значений временного ряда на тестовом участке становится возможным сравнить их с известными значениями и сделать заключение об эффективности прогнозной модели по величине полученной ошибки.

Методика проведения моделирования и прогнозирования временного ряда на основе Р-преобразования в общем виде представлена на рис. 1.

В ходе проведения экспериментов работы предложенной методики на основе Р-пре-образований на различных временных рядах было установлено, что разбиение временного ряда базисными функциями, покрывающими равное количество точек не всегда эффективно отслеживает тенденции тренда временного ряда.

f Fllj F2X2 ■ ■ ■ FlevelXlevel \ {

F2Zi F3X2 ■■■ FlneH-lX level Fti

flevcl+1 Fuvel+2

\

^Fk-leve!xl Fk-leve 1+1X2 ■ • ' Fk-l^ieutl / \ Fk J

Рис. 1. Общий вид методики

Было предложено производить неравномерное разбиение временного ряда базисными функциями. На рис. 2 показан пример такого разбиения для временного ряда показателя «коэффициент абсолютной ликвидности».

Информация о том, какие части временного ряда нуждаются в более плотном разбиении, а какие наоборот - позволяют сократить количество базисных функций, берется из метода нечетких тенденций, который анализируя тот же временной ряд выделяет и группирует схожие тенденции. Тогда алгоритм работы двух систем будет выглядеть как показано на рис. 3.

Эксперименты показали, что ошибка прогноза сократилась с 20.35 % до 6.31 % МАРЕ.

01.01.03 30.07.03 01.01.04 27.10.04 29.04.05 30.09.05

дата

Рис. 2. Пример неравномерного разбиения временного ряда

Рис. 3. Алгоритм проведения неравномерного разбиения

В третьей главе приведено описание структурно-функциональных решений программной системы, реализующей методику моделирования и прогнозирования временного

ряда на основе метода F-преобразования, структуры входных и выходных данных, программное обеспечение и технологические средства.

В качестве СУБД используется MySQL Server 5.1, а языка программирования -JAVA. В качестве среды разработки приложений выбрана IDE Netbeans.

Предложенный метод реализован в виде web-сервиса, работающего по протоколу SOAP. Выбор такой архитектуры обусловлен компонентным подходом при разработке использующей данный сервис системе «Internet-сервис экспресс анализа финансового состояния предприятия».

Входными данными для системы являются параметры, идентифицирующие нужный временной ряд в БД, задающие настройки необходимые для моделирования, прогнозирования и параметры подключения к БД.

Система предусматривает два режима работы: ручной и автоматический, которые также задаются во входных параметрах. Ручной режим предполагает задание всех значений, которые необходимы для построения модели временного ряда (количество точек, покрываемое базисной функцией) и для прогнозирования (порядок авторегрессии, метод нахождения корней систем уравнений). Автоматический режим предполагает, что система будет использовать конкурирующие модели для построения оптимального прогноза, подбирая необходимые значения параметров моделирования и прогнозирования.

На выходе будут получены данные, представляющие ответ сервиса о результатах работы. Прогнозные значения и сопутствующие данные будут сохранены в соответствующих таблицах базы данных.

При реализации системы были использованы следующие сторонние библиотеки для реализации нейронных сетей: JOONE и encog.

| В четвертой главе показано применение методики для прогнозирования коротких временных рядов.

Описаны результаты следующих экспериментов: по влиянию количества точек, покрываемого базисной функцией, на качество прогнозирования; зависимости качества прогнозирования от длины временного ряда. Приведено исследование по сравнению качества прогнозирования предлагаемого подхода с аналогами.

Исследование зависимости качества прогнозирования от длины временного ряда.

Производится прогнозирование одной компоненты тренда и соответствующего ему количества точек, начиная с наименьшего количества точек, которые можно подать на вход программы.

Целью данного эксперимента является выявление ограничений, накладываемых на использование предлагаемой методики.

Так же приводится сравнение с методом ARIMA, производящим прогноз при одинаковых условиях с предложенной методикой: равном количестве точек временного ряда, участвующих в обучении, длине прогнозного участка. И для метода ARIMA и для предлагаемой методики выбираются такие параметры, которые обеспечивают наивысшее качество прогнозирования.

На графиках ошибок (за редким исключением) проявляется зависимость: чем больше длина ряда для обучения - тем точнее прогноз. Причем при движении от самой малой длины временного ряда (10-15 точек) наблюдается резкое снижение ошибки прогноза. Рассмотрим реальный временной ряд: «коммунальные услуги» длиной 43 точки, рис.

О *--------------- -----' - -Г--- ■.....г' -I-. — !---.----•.....-1-г—;--г---- 1..... ...--,--I--------г—,------;-т-г—,---,---,---

0102.06 01.06.0S 01.10.06 01.02.07 01.06.07 01.10.07 01.02.08 01.06.03 01.10.08 01.02.09 01.06.09

дата

Рис. 4. Временной ряд «коммунальные услуги» На рис. 5 показан критерий оценки МАРЕ для прогноза на тестовом участке.

5 150

5 50

К МАРЕ(ВР) МАРЕ(Вр) АР1МА

предложенного метода

10

20 25

кол-во точек ряда

35

Рис. 5. Зависимость % ошибок от длины временного ряда

По рисунку можно выделить область, когда ошибка стабилизируется. Это наступает после 25 точек ВР, используемых для обучения.

Для сравнения на рис. 5 приведена также ошибка прогнозирования методом АЫМА. График показывает схожие тенденции, однако по нему можно видеть что АШМА ненамного уступает (МАРЕ больше от 2 % до 10 %) предлагаемой методике по качеству прогнозирования и не сохраняет стабильность при изменении длины временного ряда.

Рассмотрим ряд «заработная плата» длиной 42 точки, рис. 6.

На рис. 7 видно, что ошибка практически не изменятся от длины ряда (МАРЕ изменяется от 29.4 % при самой малой длине временного ряда до минимального значения в 15.7 %). Только при переходе через смену тенденции временного ряда ошибка немного повышается - за счет того, что разность прогноза при обучении и реальной величины тренда имеет ббльшую величину, чем на всем остальном ВР. График ошибки прогнозирования методом АШМА ведет себя схожим образом.

Рис. 6. Временной ряд «заработная плата»

кол-во точек вр

Рис. 7. Зависимость % ошибок от длины временного ряда

Для подтверждения свойства предлагаемой методики эффективно прогнозировать короткие временные ряды был проведен эксперимент на экономических временных рядах малой длины, в среднем 13.6 точек. Были достигнуты следующие средние оценки ошибок на тестовом участке временного ряда: МАРЕ(тренда) = 16.9 %, МАРЕ(временного ряда) = 41.2 %. Для сравнения, метод ARIMA в среднем показывает на этих временных рядах ошибку МАРЕ(временного ряда) = 43.5 %. При этом ошибка прогноза предложенной методикой не всегда показывает более лучшие результаты по сравнению с методом ARIMA. Однако, общий результат позволяет говорить об адекватном результате прогнозирования предложенной методикой числового временного ряда.

Сравнительный анализ эффективности методов прогнозирования.

Сравнение эффективности работы предложенной методики с аналогами проводилось по результатам соревнований по прогнозированию NN3 бизнес-временных рядов. Были выбраны временные ряды, на которых известны оценки качества прогнозирования - описаны в статьях, представленных на сайте. Для оценки качества прогнозирования применяется критерий SMAPE. Для примера был выбран временной ряд из соревнований NN3 № 108 из датасета NN3_REDUCED.

Временной ряд имеет длину 115 точек. Производится прогноз 19 точек временного ряда и 5 точек тренда. При этом были получены следующие значения оценок ЗМАРЕ(тренда)

— 24.76 %, для временного ряда — 16.43 % . На рисунках представлен прогноз для тестовой части временного ряда для лучшей конфигурации методики. Прогноз временного ряда на рис. 8.

дата

Рис. 8. Прогноз временного ряда в тестовой части

Прогноз временного ряда методом ARIMA(3,0,7) SMAPE(BP)=16.61 % на рис. 9.

дата

Рис. 9. Прогноз временного ряда в тестовой части

В таблице 1 приведено сравнение результатов прогнозирования предложенной интегральной методики и методов, чьи результаты доступны на сайте соревнований NN3.

Видно, что предложенная методика в большинстве случаев показывает более высокие результаты по качеству прогнозирования.

Также приведено сравнение интегральной методики с методом ARIMA (таблица 2).

Эксперимент на 111 экономических временных рядах малой длины (средняя длина 13.6 точек) показал средние оценки: МАРЕ(тренда) = 16.9 %, МАРЕ(ВР) = 41.2 %, ARIMA МАРЕ (BP) = 43.5 %.

Таблица 1. Сравнение методов NN3

Л* временного ряда SMAPE прогноза временного ряда на тестовом участке

Интегральная методика 33 Phienthrakul, Kijsirikul (эволюционные алгоритмы) 25.69 % 35 Pucheta, Patino, Kuchen (нейронные сети) 27.39 % 44 Kuremoto, Obayashi, Kobayashi (нечеткая нейронная сеть) 38.45 %

102 22.92 35.28 18.61 41.90

104 25.32 39.09 22.91 107.40

108 16.43 23.34 106.40 11.13

Среднее значение 21.55 32.57 49.31 53.4

Таблица 2. Сравнение с ARIMA

№ временного ряда Длина Интегральная методика ARIMA

101 126 4.62 2.77

102 126 22.92 28.52

103 126 69.89 64.75

104 115 25.32 29.41

105 126 5.01 9.23

106 126 5.41 6.17

107 126 6.19 3.78

108 115 16.43 16.61

109 123 16.64 6.22

110 126 57.61 63.36

111 126 18.42 14.17

Среднее значение 123.7 22.58 22.27

Комплекс программ анализа и прогнозирования временных рядов малой длины и методика их анализа, основанная на методе Г-преобразования, использованы при проектировании вычислительной сети предприятия.

Эффективность использования научно-технических результатов подтверждена экспериментальными исследованиями, целью которых являлось определение количественной оценки качества прогнозирования временных рядов трафика в сравнении со статистическими методами класса АЫМА.

Полоса пропускания трафика

— временной ряд

Д-------------------- Д.............. прогноз

/ЧЛх V\Aa/\

-................................... ------------------\д Л /V \ЛЛ

1 43 85 127 169 211 253 295 337 379 421 463 505 547 589 631 673 715 757 время измерения, с

1600 т

3 «00

* 1200 Á 1000 а 800

| 600

§ 400

5 200

5 о

Загрузка порта сервера

13

— временной ряд

— прогноз

183 365 547 729 911 109312751457163918212003 2185 2367 2549 время измерения, с

Рис. 10. Прогноз временных рядов трафика вычислительных сетей.

При краткосрочном прогнозировании временных рядов телекоммуникационного трафика длиной 190 значений показан потенциал нечетких моделей (МАРЕ=83.7 %) по сравнению с результатами применения стохастической модели АШМА(1,0,1) - МАРЕ=190.7 %.

Приведенные результаты позволяют говорить о возможности применения предложенной методики для прогнозирования временных рядов малой длины. В сравнении с конкурентными интеллектуальными аналогами равно как и со статистическими методами (приведенным здесь методом АШМА) методика показывает сравнимые результаты. Учитывая же такую возможность метода Р-преобразования, как формирование кусочно-линейного тренда, можно говорить о дополнительной возможности предложенной методики в части возможной интерпретации результатов моделирования и прогнозирования временных рядов.

В заключении приведены основные результаты исследований, полученные в диссертационной работе:

1. Главным итогом диссертационной работы является создание ряда моделей, методов,

алгоритмов и средств анализа и прогнозирования коротких временных рядов.

2. Выполнен анализ современных работ по методам и средствам математического моделирования и анализа временных рядов.

3. Разработана новая методика для моделирования и прогнозирования коротких временных рядов на основе метода F-преобразования.

4. Разработан алгоритм взаимодействия предложенной методики и метода нечетких тенденций, позволяющий производить неравномерное разбиение временных рядов.

5. Адаптирован классический генетический алгоритм, обеспечивающий быструю сходимость поиска оптимальных параметров предложенной методики.

6. Разработана программная система прогнозирования коротких временных рядов на основе метода F-преобразования.

7. Проведены вычислительные эксперименты по исследованию эффективности предложенных методов и алгоритмов. Они показали что на временных рядах малой длины (13.6 точек) в половине случаев предложенный подход показывает улучшение качества прогнозирования по сравнению с моделями класса ARIMA по критерию МАРЕ. Средние оценки: МАРЕ(вр) = 41.2 %, ARIMA МАРЕ(вр) = 43.5 %.

Таким образом, в диссертации решена актуальная научно-техническая задача, имеющая важное значение для развития и применения средств математического моделирования, численных методов, а именно: разработка методов, эффективных алгоритмов, средств анализа и прогнозирования нестационарных временных рядов малой и средней длины, а так же стационарных временных рядов малой длины. Публикации по теме диссертации.

Статьи, опубликованные в журналах, рекомендованных ВАК РФ:

1. Романов A.A. Применение метода F-преобразования для прогноза компоненты векторного тренда и числового представления временного ряда / A.A. Романов // Известия Самарского научного центра РАН, 2010, - Т. 12, № 4(2). - С.492-497.

2. Романов A.A. Разработка INTERNET-сервиса, интегрирующего нечеткое моделирование и анализ нечетких тенденций временных рядов / Н.Г. Ярушкина, И.Г. Перфильева, А.Г. Игонин, A.A. Романов, Т.Р. Юнусов, В.В. Шишкина // Автоматизация процессов управления / НПО «Марс». - 2010, -№2 -С. 64-69.

3. Романов A.A. Применение метода F-преобразования для прогноза компоненты векторного тренда и числового представления временного ряда / A.A. Романов // Известия Самарского научного центра РАН. - 2012, - Т. 13, № 4(4). - С.1103-1109.

4. Романов A.A. Моделирование и прогнозирование временных рядов на основе метода F-преобразования/ A.A. Романов // Автоматизация процессов управления / НПО «Марс». - 2012, -Лг'2 -С. 28-31.

5. Романов А.А. Прогнозирование объема теллекоммуникационного трафика и его нечетких тенденций/ Т.В. Афанасьева, В.В. Воронина, А.А. Романов // Радиосистемы. -2012 -С. 6-10.

Публикации в прочих изданиях:

6. Романов А.А. Проект internet-сервиса интеллектуального экспресс анализа временных рядов экономических показателей. / Н.Г. Ярушкина, И.Г. Перфильева, Т.В. Афанасьева, А.Г. Игонин, А.А. Романов, В.В. Шишкина // Всероссийская конференция с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации» 1-5 декабря 2009г. Россия, Ульяновск : сборник научных трудов. В 4 т. Т. 2. - Ульяновск : УлГТУ, 2009 - 596 с. С 301-309

7. Романов А.А. Разработка программной системы использования метода F-преобразо-вания для прогнозирования компоненты векторного тренда // Всероссийская конференция с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации» 1-5 декабря 2009г. Россия, Ульяновск : сборник научных трудов. В 4 т.Т. 2. - Ульяновск : УлГТУ, 2009 - 596 с. С 381-384.

8. Romanov A. Soft computing tools for time series analysis and forecast / I. Perfileva, N. Yarushkina, T. Afanasieva, A. Igonin, A. Romanov, V. Shishkina // Processing of ICAFS-2010 / Ninth International Conference on Applications of Fuzzy Systems and Soft Computing 26-27 August. Prague, Czech Republic -2010.

9. Romanov A. Soft computing tools for time series analysis and forecast / A. Romanov, N. Yarushkina, I. Perfileva // 7-th Zittau Fuzzy Colloquium September 15 - 17, 2010 Zittau, Germany -2010.

10. Романов А.А. Использование метода F-преобразования да я прогнозирования компоненты векторного тренда и числового представления временного ряда. //Международная конференция «Инноватика-2010» 21 - 24 марта 2010 г.

11. Романов А.А. Применение метода F-преобразования для прогноза компоненты векторного тренда и числового представления временного ряда А.А. Романов // 12-я Национальная конференция по искусственному интеллекту с международным участием (КИИ-2010) -2010.

12. Yarushkina N., Afanasyeva Т., Romanov A.. Granular Time Series and Fuzzy TYends Forecasting. / N. Yarushkina, T. Afanasyeva, A. Romanov. // 13-th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing, 26 - 28 June, 2011 Organized by Higher School of Economics (HSE), Moscow, Russia

13. Романов А.А. Применение метода F-преобразования для прогноза тренда и числового представления временного ряда / А.А. Романов // VI Международная научно-практическая конференция «Интегрированные модели и мягкие вычисления в искусственном интеллекте» 16-19 мая 2011г. Россия, Коломна: сборник научных трудов. В 2-х т. Т1. - М. :, Физматлит, 2011 - 544 с. С 261-271.

14. Romanov А.А. Time Series Processing using Fuzzy tendency and Soft Computing / N.G. Yarushkina, T.V. Afanaseva, I.G. Perfilieva, A.A. Romanov // Сборник статей ICIT-2012/ СГТУ, Саратов. - 2012.

15. Perfilieva I., Yarushkina N., Afanasieva Т., Romanov A. Time series analysis using soft computing methods /1. Perfilieva, N. Yarushkina, T. Afanasieva, A. Romanov // International Journal of General Systems. DOI: 10.1080/03081079.2013.798911. - pp. 1-19

Свидетельства:

1. Романов А.А. и др. Интернет-сервис экспресс-анализа деятельности организации на основе анализа временных рядов. Свидетельство о государственной регистрации программ для ЭВМ .^2011614304, 2011 г.

Автореферат

РОМАНОВ Антон Алексеевич

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И КОМПЛЕКС ПРОГРАММ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ НА ОСНОВЕ НЕЧЕТКОЙ МОДЕЛИ

Подписано в печать 12.11.2013. Формат 60 x 84 1/16 Усл. печ. л. 1,16. Тираж 100 Экз. Заказ 1058. ИПК <Венец» УлГТУ, 432027, г.Ульяновск, ул. Сев. Венец, д. 32.

Текст работы Романов, Антон Алексеевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

Министерство образования и науки Российской Федерации Государственное образовательное учреждение высшего профессионального образования Ульяновский государственный технический университет

Математическое моделирование и комплекс программ анализа временных рядов на основе

нечеткой модели

05.13.18 - Математическое моделирование, численные методы и комплексы

программ

на соискание ученой степени кандидата технических наук

Научный руководитель д. т. н., проф. Ярушкина Н. Г.

Ульяновск - 2013

На правах рукописи

ПА7П1 I- сото А и ЧСЬ ! ЧЛ.С.ии

Романов Антон Алексеевич

ДИССЕРТАЦИЯ

Содержание

Введение ......................................................................6

Глава 1. Сравнительный обзор методов и средств математического моделирования и анализа временных рядов.......14

1.1. Основные определения временных рядов. Классификация задач моделирования и анализа временных рядов.........14

1.1.1. Определение и свойства временного ряда........14

1.1.2. Компоненты временного ряда...............16

1.2. Классификация задач моделирования и анализа временных рядов ..................................17

1.3. Статистические методы и средства анализа ВР. Ограничения

и преимущества...........................21

1.4. Нейросетевые методы и средства анализа ВР. Ограничения и преимущества............................25

1.5. Методы и средства интеллектуального анализа данных.....30

1.6. Методы анализа ВР на основе нечетких систем. Метод Р-пре-образования .............................39

1.6.1. Нечеткий временной ряд..................39

1.6.2. Метод Р-преобразования..................43

1.7. Выводы. Постановка задачи....................46

Глава 2. Математические модели процессов на основе нечеткой модели временных рядов.......................49

2.1. Нечеткая модель временного ряда.................49

2.2. Методика для анализа коротких временных рядов .......50

2.2.1. Параметризация моделей .................50

2.2.2. Прогнозирование тренда и ВР на основе решения системы уравнений методом простых итераций......51

2.2.3. Прогнозирование тренда и ВР на основе нейросетевого подхода............................52

2.3. Генетическая оптимизация метода Р-преобразований......57

2.3.1. Основная схема генетической оптимизации.......57

2.3.2. Функция оптимальности (фитнесс-функция) ......58

2.4. Взаимодействие метода Р-преобразований и метода нечетких

тенденций в рамках интегрального метода анализа.......60

2.4.1. Интеграция метода Р-преобразований и метода нечетких тенденций........................60

2.5. Выводы................................62

Глава 3. Комплекс программ анализа на основе нечеткой модели временных рядов.........................64

3.1. Архитектура программного сервиса анализа ВР.........64

3.1.1. Управляющая система...................64

3.1.2. \¥еЬ-сервис..........................67

3.2. Алгоритмы анализа на основе нечеткой модели временных рядов 71

3.3. Информационная база данных...................73

3.4. Особенности реализации......................75

3.5. Выводы................................78

Глава 4. Анализ адекватности моделей, описание внедрения 79

4.1. Постановка задачи анализа экономических временных рядов . 79

4.2. План экспериментов для временных рядов экономического характера ................................81

4.3. Исследование влияния параметров на качество прогноза .... 83

4.3.1. Влияние количества точек, покрываемых базисной функ-

цией, на качество прогноза тренда............83

4.3.2. Исследование эффективности применения нескольких типов нейронных сетей...................85

4.3.3. Исследование эффективности прогнозирования нескольких точек тренда......................86

4.4. Выбор библиотек для моделирования нейронных сетей.....89

4.5. Исследование зависимости эффективности методов от длины

ВР...................................94

4.6. Сравнительный анализ эффективности..............97

4.6.1. Влияние архитектуры нейронной сети на качество прогноза тренда и временного ряда..............101

4.7. Использование методов для анализа ВР экономических показателей ................................104

4.8. Использование методов для анализа ВР трафика вычислительной сети ФНПЦ ОАО НПО «МАРС»...............105

4.8.1. Данные для временных рядов...............108

4.9. Корреляция параметров генетического алгоритма и значения фитнесс-функции..........................112

4.10. Выводы................................116

Заключение..................................118

Литература..................................120

Список публикаций ............................131

Приложение А. Акт внедрения.....................135

Приложение Б. Свидетельство о регистрации программы. . . . 137

Приложение В. Классы приложения.................138

Приложение Г. Значения фитнесс-функции при различных значениях параметров...........................144

Приложение Д. Корреляция параметров генетического алгоритма для набора временных рядов..................149

Введение

Важнейшей частью экспресс-анализа предприятия является исследование изменения основных показателей деятельности и соотнесение их с развитием отрасли в целом. Проводя регулярный экспресс анализ, менеджер в первую очередь стремится выявить отклонения в критических моментах деятельности предприятия, а так же выяснить причину их появления и тенденцию движения этих изменений. При этом процессы обнаружения тенденций и их прогнозирования можно выделить в отдельную задачу анализа временных рядов (BP). В связи с ростом хранимых данных данная задача приобретает особую актуальность, поскольку так же важна оперативность проведения анализа, влияющая на качество принимаемых решений.

Статистические методы для решения поставленной задачи анализа тенденций и прогноза экономических показателей предприятий в рамках экспресс-анализа, не удовлетворяют новым требованиям, так как имеют существенные ограничения: они обладают высокой сложностью, ориентированы на длинные временные ряды (предпочтительно более 50 точек) [1] [2] [3].

Объекты экспресс-анализа экономических показателей предприятия обладают объективной неопределенностью, которая может быть соотнесена с нечеткостью, поэтому для анализа тенденций и прогноза экономических показателей следует применять интеллектуальные методы и нечеткие модели [4] [5] [6].

Так же в последнее время исследования экономических данных, методов их анализа сформировались в отдельное направление, называемого интеллектуальным анализом данных или Data Mining. В этом направлении анализ временных рядов получил название интеллектуального анализа временных рядов или Times-Series Data Mining.

Развитие вычислительных сетей разного уровня (от локальных до глобальных сетей передачи данных) в последнее десятилетие вызвало рост интеграции сетей передачи данных с производственными процессами (коммерческой деятельностью). Работа предприятий все более зависит от качества обслуживания в сетях.

Актуальность обозначенной проблемы обусловлена и усложнением архитектуры вычислительных сетей, взаимодействием нескольких разнородных сетей при проведении регулярных испытаний. Так, тестирование производительности сетей сводится к измерению параметров качества обслуживания QoS (Quality of Service) или производительности сети NP (Network Performance) при различных значениях параметров поступающей нагрузки трафика сети.

Одной из задач моделирования является анализ пропускной способности вычислительной сети (ВС) (трафик, нагрузка, задержка и т.д.). В этом случае узлы сети выступают в роли генераторов и обработчиков трафика. Если для коммутирующего оборудования существует достаточно много библиотек позволяющих выполнять имитационное моделирование, то для узлов-пользователей необходимо реализовывать модели в каждом конкретном случае моделирования.

Динамика временных рядов трафика вычислительных сетей зависит от временных интервалов наблюдения и может характеризоваться высокой степенью неопределенности, обусловленной неоднородностью поведения в виде комбинации нестационарного и стационарного поведения. Нестационарное поведение таких BP также не однородно. Это создает определенные трудности в подборе статистических и нейросетевых моделей [7].

Цель диссертационной работы

Целью диссертации является разработка математических моделей, методов, эффективных алгоритмов, средств анализа и прогнозирования нестационарных временных рядов малой и средней длины, а так же стационарных временных рядов малой длины.

Задачи исследования

В соответствии с целью работы актуальными будем считать следующие задачи исследования:

• Провести сравнительный анализ существующих методов и систем моделирования и прогнозирования временных рядов.

• Разработать методику моделирования и прогнозирования адаптированную для работы с короткими временными рядами на основе метода Р-преобразования.

• Разработать нечеткую модель временного ряда.

• Выбрать архитектуру нейронной сети и разработать ее топологию для прогнозирования компонент временного ряда.

Адаптировать генетический алгоритм, обеспечивающий выбор оптимальных параметров адаптированного метода Р-преобразования.

• Разработать программный комплекс моделирования и прогнозирования коротких временных рядов.

• Провести вычислительные эксперименты по исследованию эффективности прогнозирования временных рядов предложенным методом, сравнить результаты с существующими аналогами.

Методы исследования:

• современная теория неопределенности, неточности и нечеткости;

• методы математической статистики;

• методы моделирования временных рядов.

Научная значимость работы

Автор защищает: разработанные нечеткие модели временных рядов; результаты теоретических, экспериментальных и практических разработок, внедрение в промышленную и опытно-промышленную эксплуатацию.

Научная новизна. Впервые:

• Разработана нечеткая модель временного ряда, отличающаяся возможностью использования неравномерного нечеткого разбиения и обеспечивающая повышение точности аппроксимации.

• Предложена новая методика использования метода Р-пребразования для анализа и прогнозирования временных рядов, отличающаяся от прочих методов возможностью работы с временными рядами малой длины.

• Разработан новый алгоритм взаимодействия метода Р-преобразования и метода нечетких тенденций, позволяющий улучшить качество сглаживания временных рядов посредством построения неравномерного разбиения.

• Разработана программная система прогнозирования коротких временных рядов на основе метода Р-преобразования.

Практическая ценность и внедрение результатов

Созданная программная система прогнозирования коротких временных рядов на основе метода F-преобразования используется на производстве и позволяет достичь улучшенных показателей прогнозирования.

Практическая ценность состоит в том, что разработанные модели и алгоритмы реализованы в форме программной системы и внедрены в деятельность ФНЦП ОАО НПО «Марс» (г. Ульяновск). Практическое использование результатов диссертационной работы подтверждено соответствующими документами о внедрении.

Основания для выполнения работы

Данная научная работа выполнялась в рамках проекта «Разработка Internel сервиса, программного обеспечения и метода, интегрирующего нечеткое моделирование и анализ нечетких тенденций временных рядов», под руководством приглашенного ученого И. Перфильевой (Institute for Research and Applications of Fuzzy Modeling, University of Ostrava Czech Republic). Проект был выполнен в рамках ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг.

Достоверность результатов диссертационной работы

Достоверность научных положений, выводов и рекомендаций подтверждена результатами экспериментов, а так же результатами использования материалов диссертации и разработанной системы в проектной организации.

Основные положения, выносимые на защиту:

1. Нечеткая модель временного ряда, имеющая возможность задания неравномерного нечеткого разбиения.

2. Предлагаемая методика анализа и прогнозирования временных рядов малой длины, основанная на методе F-преобразования, обеспечивающая выбор оптимального количества компонент. Методика использует новое

приложение итерационного численного алгоритма решения системы линейных алгебраических уравнений для задачи прогнозирования остатков временного ряда.

3. Алгоритм интеграции метода F-преобразования и метода нечетких тенденций, позволяющий производить неравномерное разбиение временных рядов.

4. Разработанный программный комплекс, позволяющий проводить сглаживание и прогнозирование временных рядов.

Апробация работы

Основные положения и результаты диссертации докладывались, обсуждались и получили одобрение на Всероссийской конференции с международным участием «Проведение научных исследований в области обработки, хранения, передачи и защиты информации» (г. Москва, SofTool, 2011 г.); на ICIT-2012 (г. Саратов, 2012 г.); на VI-й международной научно-практической конференции «Интегрированные модели и мягкие вычисления в искусственном интеллекте» (г. Коломна, 2011 г.); на ежегодной конференции УлГТУ (г. Ульяновск, 2010 г.); ИННОВАТИКА-2010, Ульяновск, 2010; 9th Int. Conf. on Application of Fuzzy Systems and Soft Computing (ICAFS 2010), Prague, 2010; Двенадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2010, Тверь, 2010; Seoul International Inventory Fair, Seoul, Korea, 2010 (SIIF 2010); 7-th Zittau Fuzzy Colloquium September 15 - 17, 2010 Zittau, Germany; 13-th International Conference on Rough Sets, Fuzzy Sets, Data Mining and Granular Computing, 26 - 28 June, 2011 Organized by Higher School of Economics (HSE), Moscow, Russia.

Структура и объем диссертации

Диссертация состоит из введения, четырех глав, заключения, списка ли-

тературы из 105 наименований, трех приложений, содержит 150 страниц машинописного текста, 41 рисунок и 23 таблицы.

Во введении рассмотрена актуальность работы, определена ее цель и задачи, сформулированы положения, выносимые на защиту, их научная новизна и практическая ценность. Представлены основания для выполнения работы, ее апробация и структура.

В первой главе рассмотрены методы и средства математического моделирования и анализа временных рядов. Приведена характеристика временных рядов, составляющих их компонент, определен круг задач, решаемых над временным рядом. Рассмотрены ключевые моменты, выделены достоинства и недостатки методов анализа временных рядов, имеющих различный математический аппарат. Отдельно рассмотрены методы интеллектуального анализа данных.

Во второй главе описана новая методика применения метода F-преоб-разования к задаче декомпозиции коротких временных рядов и последующего их прогнозирования. Предложен алгоритм интеграции метода F-преобразова-ния с методом нечетких тенденций для улучшения качества аппроксимации временного ряда посредством извлечения дополнительной информации о поведении локальных тенденций. Описано применение генетического алгоритма к задаче поиска оптимальных параметров предлагаемой методики. Рассмотрены процедуры получения прогнозных значений компонент временного ряда.

В третьей главе приведено описание структурно-функциональных решений программной системы, реализующей методику моделирования и прогнозирования временного ряда на основе метода F-преобразования, структуры входных и выходных данных, программное обеспечение и технологические средства.

В четвертой главе показано применение методики для прогнозирования коротких временных рядов. Описаны результаты следующих экспериментов: по влиянию количества точек, покрываемого базисной функцией, на качество прогнозирования; зависимости качества прогнозирования от длины временного ряда. Приведено исследование по сравнению качества прогнозирования предлагаемого подхода с аналогами.

По результатам работы было опубликовано 15 статей, из которых 5 в журналах из перечня ВАК, 4 статьи в иностранных журналах и 6 тезисов докладов. Получено свидетельство о государственной регистрации программ для ЭВМ N0 2011614304, 2011.

Глава 1

Сравнительный обзор методов и средств математического моделирования и анализа

временных рядов

1.1. Основные определения временных рядов.

Классификация задач моделирования и анализа временных рядов

1.1.1. Определение и свойства временного ряда

Временной ряд определяется как последовательность значений, упорядоченных во времени и характеризующих уровень состояния и изменения наблюдаемого показателя [8] [1] [9]. Особенностью временного ряда является то, что каждое значение показателя зависит от прошлых состояний, т.е. важен порядок следования значений [10].

Временные ряды различаются по следующим признакам:

1. Длина ряда. Здесь употребляется в смысле числа наблюдений параметра, хотя может означать и время, прошедшее от начального до конечного наблюдения [11]. Кендел в [11] говорит, что в отличии от обычной статистической работы, в анализе временных рядов количество информации не является пропорциональным числу членов выборки, т.к. «...последовательные величины не являются независимыми».

2. Дискретность и непрерывность. Определяется характером изменения времени, в течение которого производится наблюдение. Согласно [1] дискретные ряды могут быть получены из непрерывных двумя способами:

• выборкой из непрерывных временных рядов через определенный интервал;

• нако