автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Прогнозирование временных рядов с долговременной корреляционной зависимостью
Автореферат диссертации по теме "Прогнозирование временных рядов с долговременной корреляционной зависимостью"
На правах рукописи
□□3454964
КРИЧЕВСКИЙ Андрей Михайлович
ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ С ДОЛГОВРЕМЕННОЙ КОРРЕЛЯЦИОННОЙ ЗАВИСИМОСТЬЮ
Специальность 05.13.01 - Системный анализ, управление и обработка информации (в технике и технологиях)
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
0 5 ДЕК 2008
Санкт-Петербург - 2008
003454964
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный университет аэрокосмического приборостроения» (ГУАП)
Научный руководитель:
доктор технических наук, профессор Осипов Леонид Андроникович
Официальные оппоненты:
доктор технических наук, профессор Коновалов Александр Сергеевич кандидат технических наук, доцент Муравьев Евгений Александрович
Ведущая организация: ОАО «НИИ ВС «Спектр» - Открытое акционерное общество «Научно-исследовательский институт вычислительных средств «Спектр».
Защита состоится «23» декабря 2008г. в 14 часов на заседании диссертационного совета Д 212.233.02 при Государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный университет аэрокосмического приборостроения» по адресу: 190000, Санкт-Петербург, ул.Б.Морская, 67, ГУАП.
С диссертацией можно ознакомиться в библиотеке ГУАП. Автореферат разослан «22» ноября 2008г.
Ученый секретарь диссертационного совета доктор технических наук, профессор чУ' ^ Л.А. Осипов
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Все формальные процедуры прогнозирования предусматривают перенос прошлого опыта в неопределенное будущее. Такие алгоритмы прогнозирования построены на предположении, что условия, породившие полученные ранее данные, неотличимы от условий будущего. Исключение составляют только те переменные, которые точно распознаны моделью прогнозирования. В подавляющем большинстве случаев предположение о неразличимости прошлого и будущего не выполняется в полной мере.
Одним из возможных методов улучшения точности прогнозирования служит применение новых моделей, способных к более адекватному описанию наблюдаемых данных и получению прогнозных оценок путем экстраполяции. Для построения модели временного ряда не требуются знания ни производства, ни условий, в которых протекает тот или иной процесс. Модель строится только на основе имеющейся числовой информации. Задача аналитика в этом случае заключается в том, чтобы выяснить статистическую закономерность, которой подчиняются отсчеты, образующие BP, и сделать прогноз на будущее, основываясь на этой закономерности.
Зависимость структуры ряда от времени играет ключевую роль при моделировании или анализе временных рядов различной природы. В последние годы появился увеличивающийся интерес к временным рядам, обладающим долговременной положительной корреляционной зависимостью. В английском языке синонимами этого понятия являются такие термины как long memory (долгая память), long-range dependence (долговременная зависимость), strong dependence (сильная зависимость) или persistence (персистентность). Ни у одного из этих терминов еще нет адекватного перевода на русский язык, поэтому в работе такой ряд будем называть рядом с долговременной корреляционной зависимостью (ДКЗ).
В задаче анализа временного ряда со сложной структурой часто используются модели класса ARIMA(p,d,q) (авторегрессионные проинтегрированные скользящего среднего - Autoregressive Integrated Moving Average) порядка (p.d.q), которые моделируют различные ситуации, встречающиеся при анализе стационарных и нестационарных рядов. В зависимости от анализируемого ряда модель ARIMA (p.d.q) может трансформироваться к авторегрессионной модели AR(p), модели скользящего среднего MA(q) или смешанной модели ARMA (p,q). При переходе от нестационарного ряда к стационарному значение параметра d, определяющего порядок разности, принимается равным 0 или 1, т.е. этот параметр имеет только целочисленные значения. Обычно ограничиваются выбором между d -О и d = 1. Однако из поля зрения исследователей выпадала ситуация, когда параметр d может принимать дробные значения.
Для разрешения этой проблемы в работах зарубежных ученых, в первую очередь, C.W.Granger, J.R.Hosking, P.M.Robinson, R. Beran, был
предложен новый класс моделей ARFIMA(p,d,q) (F: fractional - дробный), допускающий возможность нецелого параметра d и получивший название авторегрессионный дробно интегрированный процесс скользящего среднего. Такие ряды обладают своей спецификой: самоподобием, дробной размерностью, медленно спадающей корреляцией. Прогнозирование временных рядов с помощью модели ARFIMA(p,d,q) открывает более широкие перспективы для повышения точности прогноза, что подчеркивает актуальность темы исследования.
Цель диссертационной работы заключается в разработке алгоритмов прогнозирования временных рядов, обладающих долговременной корреляционной зависимостью, и оценке точности прогнозирования.
Для достижения поставленной цели в диссертации решаются следующие основные задачи:
• создание алгоритмов моделирования фрактальных временных рядов с ДКЗ;
• разработка алгоритмов прогнозирования для временных рядов, характеризующихся ДКЗ;
• применение искусственных нейронных сетей для получения прогнозных оценок временного ряда;
• экспериментальные исследования точности прогнозирования реальных временных рядов, обладающих ДКЗ.
Методы исследования. Для решения поставленных задач используются методы теории вероятностей, корреляционно-спектрального анализа, нейросетевого моделирования, статистической обработки экспериментальных данных.
Научная новизна работы
1. Разработанный алгоритм моделирования фрактальных временных рядов отличается от известных тем, что позволяет создавать ряды по заданным значениям показателя Херста, являющегося в определенной степени классификатором рядов, и необходимой длине исходных данных.
2. Новым в предложенном алгоритме прогнозирования являются начальный выбор параметров р и q модели ARMA(p,q) по виду и характеру изменения частной автокорреляционной функции временного ряда и последующая трансформация к модели ARFIMA(p,d,q) с вычислением показателя d.
3. Развитие нейросетевой технологии в задаче прогнозирования, реализованной в работе, заключается в использовании и построении различных конфигураций нейронных сетей, введении этапа тестирования полученной сети и расчете ошибок прогнозирования на обучающей и тестовых выборках.
4. Новизна экспериментальных исследований состоит в комплексном изучении реальных и смоделированных временных рядов, включающем в себя анализ авто- и частной корреляционных функций, спектральной плотности, расчет и нахождение главных компонентов,
построение прогнозных оценок ряда, основанных на рассмотренных теоретических моделях, оценку точности прогнозирования.
Практическая ценность. Предложенные в работе алгоритмы прогнозирования временных рядов, основанные на модели временных рядов с ДКЗ, позволяют увеличить точность прогнозных оценок и достоверность выводов. Такие методы могут быть использованы в различных ситуациях и сферах деятельности, где необходимо получать информацию о будущем поведении систем.
Полученные результаты и разработанные алгоритмы используются в аналитической деятельности инвестиционной компании «Доходъ», учебном процессе ГУАП и Международного банковского института.
Программная разработка «Исследование фрактальных рядов» зарегистрирована в Отраслевом фонде алгоритмов и программ Федерального агентства по образованию.
Положения диссертационной работы, выносимые на защиту: 1. Алгоритм моделирования фрактальных временных рядов, которые обладают долговременной корреляционной зависимостью, отличающийся от известных тем, что позволяет создавать ряды по заданным значениям показателя Херста и необходимой длине ряда.
2. Алгоритм прогнозирования временного ряда по модели АКР1МА(р,с1,ф, включающий начальный выбор параметров р и модели АЯМА(р,д) по виду и характеру измеиения частной автокорреляционной функции временного ряда и последующую трансформацию к модели А11ПМА(рЛя) с вычислением показателя с!.
3. Нейросетевое прогнозирование временных рядов, основанное на построении различных типов нейронных сетей и выборе наиболее пригодной сети по величине погрешности прогноза на обучающей и тестовой выборках.
4. Экспериментальное исследование реальных и смоделированных временных рядов, в частности, анализа авто- и частной корреляционных функций, спектральной плотности, расчета и нахождения главных компонентов, построения прогнозных оценок ряда и оценке точности прогнозирования.
Апробация работы. Результаты отдельных этапов работы докладывались и обсуждались на заседаниях 11, 12 и 14 Международной студенческой школы-семинара «Новые информационные технологии» (Москва, МИЭМ, 2003, 2004, 2006), 9 и 11 Международной научно-технической конференции студентов и аспирантов (Москва, МЭИ, 2003,2005), 4 и б Международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания» (Санкт-Петербург, МБИ, 2005, 2007), 3 Всероссийской научной конференции «Управление и информационные технологии» (Санкт-Петербург, ЛЭТИ, 2005), 3 школы-семинара БИКАМП-01 (Санкт-Петербург, ГУАП, 2001), 8 и 9 научных сессий аспирантов ГУАП (Санкт-Петербург, ГУАП, 2005,2006).
Публикации. Основные результаты диссертационной работы опубликованы в 15 печатных работах, в том числе 3 из перечня ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени доктора и кандидата наук ВАК.
Объем и структура работы. Диссертационная работа состоит из введения, четырех разделов, заключения, списка использованных источников (67 наименований), двух приложений. Основная часть работы изложена на 179 страницах машинописного текста, содержит 49 рисунков, 6 страниц приложений с двумя рисунками.
СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность выбранной темы, определена цель и сформулированы решаемые в диссертации задачи. Перечислены новые научные результаты, полученные в работе, показаны ее практическая ценность и апробация, приведены основные положения, выносимые на защиту.
В разделе 1 проводится краткий обзор литературных источников по методам анализа временных рядов, обладающих свойством ДКЗ.
Вначале рассматриваются самоподобные фрактальные временные ряды. Фрактальные пространственные объекты демонстрируют пространственное самоподобие. Фрактальные временные ряды имеют статистическое самоподобие во времени. Они являются случайными фракталами и имеют больше общего с естественными объектами, чем чистые математические фракталы.
Указывается, что для временных рядов классическая геометрия предлагает малую помощь в понимании основ поведения ряда: система так сложна, что предсказание становится невозможным. В решении проблемы прогнозирования временных рядов важную роль играет методология Бокса-Дженкинса. Эта методология основывается на параметрической модели класса ARIMA(p,d,q) и сводится к идентификации модели и оценке ее параметров. Дальнейшим развитием этой методологии является новый класс моделей ARFIMA(p,d,q) (fractional - дробный), допускающий возможность нецелого параметра d и получивший название авторегрессионный дробный интегрированный процесс скользящего среднего. Проявление интереса к временным рядам с ДКЗ возникло из анализа физических задач (исследование Г.Херста о колебаниях уровней воды в водохранилищах), перешло в область эконометрических задач, привлекло внимание к применению таких моделей в задачах передачи сигналов через Интернет.
На основании проведенного обзора делается вывод об актуальности исследования и применения моделей класса ARFIMA(p,d,q) в задаче прогнозирования. Кроме того, выполненный анализ литературных источников по тематике исследования позволил поставить цель диссертационной работы и сформулировать ее задачи.
Во втором разделе с использованием теории фракталов проводится анализ временных рядов. Вначале обсуждается сам термин «фрактал», рассматриваются пространственные фрактальные объекты, начиная с простейших геометрических объектов, и способы формирования фракталов. Далее анализируются способы генерирования фрактальных временных рядов. Продолжением исследования является изучение важного вопроса по оценке фрактальной размерности временных рядов. Приводится определение фрактала, данное Б.Мандельбротом: фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому. В двухмерном случае фракталы можно получить, задав некоторую ломаную, называемую генератором.
Для гладкой кривой ее приближенная длина Цг) определяется как произведение числа N прямолинейных отрезков, умещающихся на кривой, на длину такого отрезка г, т.е. Цг) - N -г . При длине шага г —> 0 величина Цг) стремится к конечному пределу: длине Ь рассматриваемой кривой.
Иначе обстоит дело в случае фракталов. Произведение Ы-г обращается в бесконечность, так как при г —»0 учитываются все более мелкие извивы фрактала. Однако асимптотически это стремление к бесконечности происходит по некоторому четко определенному степенному закону от г. Иначе говоря, существует некоторый критический показатель йн > 1 такой, что произведение Ы-г°" остается конечным. При показателях меньших, чем £)я , произведение расходится, т.е. обращается в бесконечность, а при показателях, больших £>я , стремится к нулю. Этот критический показатель Бн называют размерностью Хаусдорфа, определяемой как
Переходя от пространственных фракталов к временным, вначале рассматриваются способы генерирования фрактальных временных рядов, начиная с классического броуновского движения. Простейшей дискретной аппроксимацией броуновского движения служит одномерное случайное блуждание.
Далее описывается метод случайного срединного смещения (МССС) для моделирования фрактальных рядов. Сущность МССС заключается в следующем. Для построения фрактального временного ряда берется отрезок единичной длины на оси абсцисс. Этот отрезок разбивается на N = 2я частей, где т - любое положительное целое число. В результате на отрезке [0, 1] имеем N +1 точку, включая концы отрезка. В ходе работы исходный единичный отрезок постепенно разбивается на более мелкие части посредством многократного деления пополам. При этом каждый раз вычисляется значение функции хс в середине нового рабочего отрезка /с,
исходя из значений хи./ и хп., в граничных точках отрезка 1/,,/ и Для этого используется следующее выражение
хс=(х,4+хг1&) 12+1г,
где к - случайная величина, распределенная по нормальному закону с нулевым
средним и дисперсией ак, которая определяется соотношением ОГ;, =г". Здесь
г = и,.^ - //£у) / 2 - расстояние от средней точки рабочего отрезка /с, где
вычисляется новое значение функции, до концов этого отрезка; Я - показатель Херста.
На рис.1 показаны фрактальные кривые, полученные МССС, для разных значений Я. Общая тенденция ясна: чем меньше Я, тем кривая более сложная, изрезанная, и, наоборот, при больших Я кривая становится более гладкой.
Следующим шагом в работе является оценка фрактальной размерности. Существуют различные способы расчета размерности, но все они включают в себя подсчет объема или площади фрактальной формы и того, как она изменяется в масштабах в том случае, если этот объем или форма увеличиваются. Методы расчета фрактальной размерности сводятся или к подсчету степени изрезанное™ ряда с помощью окружностей определенного радиуса (метод Ричардсона), или к определению числа ячеек в пространстве, занимаемом фрактальной кривой (емкостная размерность), или посредством так называемой корреляционной суммы (корреляционная размерность), или к расчету показателя Херста Я (метод нормированного размаха). В работе приводятся формулы расчета фрактальной размерности для каждого метода. В любом случае размерность определяется напрямую из метода или через связь между размерностью и показателем Херста в виде £> = 2 - Я.
В завершение этого раздела рассматривается метод анализа временных рядов, основанный на вычислении главных компонентов.
/п /А
и
Гг
а)Я=0,2 б) Я =0,8
Рисунок 1 - Фрактальные кривые для двух значений Я
Таким образом, основными результатами этого раздела являются анализ способов генерирования фрактальных временных рядов, расчет спектров различных видов фрактальных шумов, разработка алгоритма метода случайного срединного смещения для генерирования фрактальных временных рядов, расчет главных компонентов временного ряда.
В разделе 3 вначале анализируется класс параметрических моделей временных рядов. В общем случае этот класс может быть описан моделью вида ARIMA (p,d,q) (Autoregressive integrated moving average авторегрессионная проинтегрированная модель скользящего среднего). Рассматриваются различные ситуации, приводящие к описанию ряда моделями, которые следуют из общей модели ARIMA (p.d.q)- В частности, авторегрессионная модель, которая сокращенно обозначается AR(p) (autoregressive process) порядка р, представима в виде
X, +ф2*/-2 +... +Vf,., +а"
где ф^фз,...,«^ - весовые коэффициенты; а,-помеха.
В этой модели текущее значение ряда в момент t выражается через конечное число прошлых значений и величину возмущения а,. Модель скользящего среднего (moving average) предполагает, что в ошибках модели в предшествующие периоды сосредоточена информация по всей предистории ряда. Такая модель порядка q запишется в виде
xt =at-Q[at_l-...-Q4ai_q,
где символы в/,.... вд- весовые параметры.
Смешанные модели авторегрессии - скользящего среднего, т.е. модели ARMA (p,q), которые имеют следующий вид Ф (B)X1=Q(B)al,
р ч
где Ф(5) = 1-jT 0(5) + - полиномы, представляющие
]=\ м
компоненты процессов AR и MA, соответственно; ф , 6 - весовые
коэффициенты; В = / Xt - оператор сдвига назад.
В нестационарном случае модель ARIMA (p,d,q) можно представить в
виде
Ф( B)bdXt=Q{B)an
гдеЛ^ = (l-B)d .
В последнее время значительный интерес проявился к временным рядам, которые можно охарактеризовать термином «временные ряды с долговременной корреляционной зависимостью (time series with long memory)». Существует несколько возможных определений таких рядов, но в основном они должны обладать медленно спадающей автокорреляционной
функцией (АКФ) и иметь неограниченную спектральную плотность (СП) на низких частотах. Для описания рядов с ДКЗ можно воспользоваться последней моделью, но в отличие от модели ARIMA здесь показатель d принимает дробные значения. Рассмотрение значений d из интервала с/е (-1/2,1/2) привело к дробной авторегрессионной модели скользящего среднего порядков р, d, q , аббревиатура которой определяется как ARFIMA (p,d,q) {fractional -дробный). В работе показано, что характеристики таких временных рядов обладают важными свойствами: например, X, является стационарным и обратимым для d е (-1/2,1/2). Кроме того, положительная или отрицательная зависимости определяются знаком при параметре d, т.е. автокорреляционные коэффициенты процесса X, имеют тот же знак, что и d. Медленный спад
автокорреляций объясняется тем, что при положительном d сумма последних сходится к бесконечности, а при отрицательном d - к нулю.
Затем описываются методы для оценки параметра d, являющимися в то же время и тестами для обнаружения долгой памяти во временном ряду. Параметр d можно оценить во временной или частотной областях. Предпочтение целесообразно отдать второму способу вследствие большей простоты и наглядности. Сущность этого метода заключается в построении уравнения регрессии логарифма периодограммы на низких частотах как функции частоты: ожидаемый наклон зависит от параметра d.
В итоге делается вывод о том, что в рядах, обладающих свойством ДКЗ, алгоритм прогнозирования по модели ARFIMA (p,d,q) сводится к оценке ее параметровp,d,q.
Далее в работе рассматривается прием прогнозирования, основанный на предварительном обучении. Такой подход, реализованный с помощью искусственных нейронных сетей (ИНС), является альтернативой модели ряда с долгой памятью. Типичная система обучения на примерах, состоит из генератора случайных входных векторов х е R", взятых из фиксированного, но неизвестного распределения с функцией распределения (ФРс) F(x); учителя, который возвращает выходной сигнал у на каждый входной вектор х в соответствии с условной, но также неизвестной ФРс F(y\x); обучаемой
машины, способной реализовать множество аппроксимирующих функций/(3с,©), сое Q, где Q - множество параметров.
Следующим шагом оценивается качество аппроксимации в виде разности L(y,f(x, а)) между сигналом, задаваемым учителем, и оценкой на выходе обучаемой машины для данного входного вектора х. Ожидаемая величина потерь определяется функционалом риска
R(<o) = \L(y,f(xfii)W&,y).
Теперь обучение можно рассматривать как процесс нахождения функции /(.т,ю0), которая минимизирует функционал риска в ситуации, когда совместная ФРс /7(.т,у) неизвестна, а вся доступная информация содержится только в обучающей выборке.
Приводится описание индуктивного принципа при обучении, известного как минимизация эмпирического риска (Empirical Risk Minimization - ERM). В этом случае выбирается модель из множества аппроксимирующих функций, которая минимизирует эмпирический риск или средние потери на обучающей выборке
п к=1
В противоположность принципу минимизации эмпирического риска, который минимизирует риск при любой стоимости, принцип минимизации структурного риска (ЖМ-принцип - Structural Risk Minimization) определяет лучшее соотношение между количеством эмпирических данных, качеством аппроксимации данных и величиной, которая характеризует емкость множества функций. ЖМ-принцип находит такую функцию, которая для фиксированного объема данных дает минимум гарантированного риска.
Для величины общего риска можно записать
Я(Ю) < (СО)+ Ф(Я//!,),
где первый член в правой части определяет эмпирический риск, а второй -доверительный интервал. Минимизация правой части неравенства может быть выражена в виде двух стратегий:
1.Сохранять доверительный интервал фиксированным (выбором подходящей архитектуры машины) и минимизировать эмпирический риск.
2.Сохранять величину эмпирического риска фиксированной (даже равной нулю) и минимизировать доверительный интервал.
Для реализации указанных стратегий имеются две возможности:
• применение нейронных сетей (первая стратегия);
• использование машин опорных векторов (вторая стратегия).
Поскольку изучение и применение машин опорных векторов
выходит за рамки настоящего исследования, рассматриваются только особенности ре&чизации первой стратегии с использованием нейронных сетей.
Таким образом, основными результатами этого раздела являются анализ параметрических моделей временных рядов, переход к модели ряда с ДКЗ - ARFIMA(p,d,q), рассмотрение оценок параметра d во временной и частотной областях, алгоритм прогнозирования, сводящийся к оценке параметров модели ARFIMA(p,d,q), трансформация к модели обучения на примерах в виде нейронной сети.
В разделе 4 на основе проведенного ранее теоретического анализа приводятся результаты моделирования и эксперимента. Вначале рассматриваются вопросы моделирования рядов, обладающих свойством ДКЗ. В первую очередь, это относится к временным рядам, представляющим самоподобные фрактальные шумы. По виду АКФ и СП можно принять решение о том, что ряд имеет свойство ДКЗ, поэтому смоделированные ряды сопровождаются соответствующими рассчитанными оценками корреляции и спектра.
Для ряда, изображенного на рис.1.а, рассчитанные АКФ и СП показаны на рис.2, откуда видно, при больших лагах АКФ медленно спадает, не меняя знака, что свидетельствует о наличии ДКЗ. По характеру СП видно, что вся мощность ряда сосредоточена вблизи нулевого значения частоты, а это является еще одним подтверждением наличия ДКЗ._
~ AifioconeiafionF
Sped»! erjlyse. YAR1 Herrmine «я»оЬЬ-.0357.2*11 ,**64.2411,0357
¡gi Sftsc'qaiaitaiysa: VAffl f~"
a) 6)
Рисунок 2 - Автокорреляционная функция (лаг =100) (а) и спектральная
плотность(б)
Большая часть раздела связана с анализом реальных временных рядов, в качестве которых используются данные по ежедневному изменению курса акций Аэрофлота (AFLTGO), Газпрома (GAZP), Сбербанка (SBER), Сибнефти (SIBN) и Татнефти (TATN) в период с 1.02.01 по 14.09.06 (всего по 1400 точек в каждом ряду).
Все ряды (образец, показанный на рис.3 для акций Аэрофлота, является аналогичным другим рядам) характеризуются наличием возрастающего тренда, несимметричной гистограммой (по внешнему виду близкой к экспоненциальному распределению), долгой положительной автокорреляционной связью, практически единственным выбросом на графике частной автокорреляционной связи, сосредоточением мощности процесса вблизи нулевой частоты. Указанные характеристики, в первую очередь, АКФ и СП, позволяют классифицировать данные временные ряды как ряды с ДКЗ.
В)
Partial AuSOTmlaiior FibiOîoo ¡Sloaaanl oncn assume AW cnie ci t-1 )
fo PartalAutocofreiatkinFunc&on f~
Spccoe! arjlyiii VAR1 No Cl =и«: H00
(ring w»igMs:.D357.2411 .2*1 т .0357
. tl.?J g? Spectral analysis:VARl f
Д) е)
Рисунок 3 - Основные характеристики временного ряда цены открытия акций Аэрофлота (а - временной ряд; б - гистограмма; в - АКФ на 15 лагах; г - АКФ на 300 лагах; д - частная АКФ; е - спектральная плотность)
Далее в работе с применением методологии Бокса-Дженкинса и частной АКФ для рассматриваемых рядов приходим к выводу, что модель класса ARMA является хорошим выбором для оценки семейства моделей, которое описывает данные ряды. Поскольку на графиках частной АКФ имеется только один значимый выброс, то в выбранном классе моделей значения ее параметров становятся равными: р = 1; q = 0. Таким образом, выбранная модель представляет собой авторегрессионную модель первого
порядка АЯ( 1), которую можно использовать для прогноза ВР на некоторый фиксированный горизонт, допустим, 10 шагов вперед.
На рис.4 приведен ряд акций Аэрофлота вместе с подобранной моделью вида/4Л(1). Кроме того, на этом же рисунке показан график остатков, изображенный на специальной вероятностной шкале.
Time Sequence Plot for AFLT
ARIMA(1,0,0) with constant
Residual Plot for AFLT
ARIMA(1.0,0) with constant
5 20 50 80 95 99 99,9
Рисунок 4 - Временной ряд акций Аэрофлота (слева; точки - реальные данные) и остатки модели (справа). Прогноз - на 10 точек вперед.
Следующим шагом является уточнение модели путем перехода к модели АКР1МА(р,й,ц), в которой необходимо лишь найти значение параметра й. В качестве примера на рис.5 приведены результаты расчета параметра й вместе с другими характеристиками модели для акций Аэрофлота. На рис.6 показан график прогноза на 10 шагов вперед по модели АЯР1МА(\,с1,0).
Затем рассматривается нейросетевая технология для оценки возможности построения прогноза. Вид типичной сети показан на рис.7.а. Сеть выбрана в виде трехслойного персептрона, во входном слое которого имеется 5 нейронов (аналогично пятидневной торговой неделе), в выходном слое содержится один нейрон, а количество нейронов скрытого слоя выбрано но «совету» используемого программного пакета.
*----Modified profile likelihood estimation of ARFIMAfl, d,
The estimation sample is: 1 — 90
The dependent variable is: AFLT (Datal)
d parameter AR- 1 AFLT_1 Co ns t a nt
Coefficient O.123374 -Q.127073 О.934542 3.34008
St ci . E r ro r Q. IS 4 8 О . 152 8 О. 03 445 1. 799
i—value О . 797 - О. 832 27 . 1 1. 86
:-prob 0.428 0.408 0.000 О. 0 67
log-likelihood -169.194009
no. of observations 90
AIC.T 348.388017
mean(AFLT) S1.25S6
Sigma
1.53366
no. of parameters AIC
var(AFLT) sigmaA2
3.870977! 2 9. io:
BFGS using nimerical derivatives Strong convergence
(epsl=0. ООО 1; eps2=0.005>
Рисунок 5 - Расчет параметров модели ARF¡MA(l,d,0) 14
Рисунок 6 - Прогноз цены открытия акций Аэрофлота моделью АИПМА(1,с1,0) (1 - исходный ряд; 2 - прогнозные значения)
Рисунок 7 - Схема сети (а) и проекция временного ряда (б) (1 - исходный ряд; 2 - проекция ряда до его конца и прогноз на 10 точек вперед)
Из рис.7.б следует, что кривая 2 не полностью повторяет исходный ряд и при прогнозе, который начинается с точки №95 (5 точек не учитываются, поскольку период прогноза взят, равным 5 дням), несколько отличается от тенденции ряда.
Завершающим шагом является сравнение результатов по прогнозированию различными методами (таблица). Для оценки адекватности моделей и сравнения методов прогнозирования выбирается среднеквадратичная ошибка (ЯМБЕ), которая имеется во всех методах.
Таблица Среднеквадратичная ошибка всех моделей
Акции Модель Модель Нейросете-
ЛЛ(1) АШМЛ(14,0) вая модель
Аэрофлот 1,52 1,56 1,77
Газпром 10,13 4,90 10,98
Сбербанк 1,87 1,63 1,76
Сибнефть 3,50 1,31 4,09
Татнефть 5,23 4,97 5,48
Как следует из таблицы, в большинстве случаев (за исключением акций Аэрофлота) предпочтение при выборе метода прогнозирования следует отдавать модели ARFIMA (1Д0), которая характеризует временные ряды с ДКЗ.
В заключении приводятся основные результаты, полученные в диссертационной работе.
Приложения. В приложении А приведена разработанная программа генерации фрактальных временных рядов, в приложении Б - программа расчета показателя Херста.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Рассмотрены способы генерирования фрактальных временных рядов, включающие как классическое, так и фрактальное броуновские движения, описаны и рассчитаны спектры различных видов фрактальных шумов, предложен метод случайного срединного смещения и разработан алгоритм его реализации. Подробно проанализирован метод нормированного размаха, позволяющий оценить показатель Херста и величину фрактальной размерности, приведен алгоритм этого метода и разработана программа его расчета.
2. Приведены сведения по методу сингулярного спектрального анализа, который дает возможность визуализировать временной ряд в плоскости вычисленных главных компонентов. Описаны основные этапы алгоритма расчета главных компонентов и выдвинуто предположение о возможности классификации временных рядов по виду главных компонентов или собственных векторов.
3. Проанализировано свойство долговременной корреляционной зависимости (ДКЗ) во временных рядах, рассмотрены требования к автокорреляционной функции и спектральной плотности, которым должен удовлетворять ряд с ДКЗ. Установлено, что временной ряд с ДКЗ описывается классом моделей ARIMA(p,d,q), в котором значение показателя d принадлежит интервалу (-0,5; 0,5), что приводит к появлению модели ARFIMA(p,d,q) (буква F- fractional - означает «дробный).
4. Рассмотрена модель обучения на примерах, в качестве которых используются экспериментальные данные, предложена оценка качества обучения в виде функционала риска, проанализирован эмпирический риск и указаны принципы его минимизации. Установлен принцип минимизации структурного риска, который уменьшает верхнюю границу ошибки обобщения, проведено сравнение эмпирического и структурного рисков.
5. Выбраны две стратегии минимизации фактического риска и указаны пути их реализации. В качестве первой стратегии, при которой сохраняется фиксированным доверительный интервал и минимизируется эмпирический риск, предложено использовать многослойную нейронную сеть в виде персептрона, а для второй - с сохранением эмпирического риска и
минимизации доверительного интервала - применять машину опорных векторов. Оценены основные проблемы, связанные с реализацией первой стратегии.
6. Проведено моделирование фрактальных шумов, используемых в качестве примеров самоподобных процессов. Выполнен анализ временных рядов, определяющих эти шумы, и показано, что автокорреляционная функция и спектральная плотность имеют вид, характерный для рядов с ДКЗ. Проведено сравнение временных рядов фрактальных шумов с рядом логистического отображения, приводящим к хаосу, и выявлено кардинальное отличие последнего от рядов с ДКЗ.
7. С помощью разработанного алгоритма метода случайного срединного смещения (алгоритм зарегистрирован в Отраслевом фонде алгоритмов и программ) выполнено моделирование фрактальных временных рядов при разных значениях показателя Херста. Вычислены характеристики смоделированных рядов, в первую очередь, автокорреляционной функции и спектральной плотности и показано, что такие ряды относятся к временным рядам с ДКЗ.
8. Выполнено экспериментальное исследование реальных временных рядов, в качестве которых взяты ежедневные изменения цен акций Аэрофлота, Газпрома, Сбербанка, Сибнефти и Татнефти в период 1.02.01 по 14.09.06 (1400 торговых дней). Осуществлена стандартная процедура проверки принадлежности анализируемых рядов к рядам с ДКЗ посредством вычисления автокорреляционной функции и спектральной плотности и выяснено, что все рассмотренные ряды обладают этим свойством.
9. Проведена идентификация моделей, пригодных для описания этих рядов, и установлено, что первоначальной моделью может служить модель ARFIMA(\,0,Q), трансформирующаяся к авторегрессионной модели первого порядка AR(\). Определен параметр d модели ARFIMA(\ДО), которая уточняет первоначальную модель AR( 1). Выполнен прогноз по этим моделям и вычислены ошибки прогнозирования. Показана возможность прогнозирования временных рядов с использованием искусственных нейронных сетей в виде многослойного персептрона, построена и обучена сеть, получены прогнозные характеристики временного ряда.
10. Проведено сравнение рассмотренных методов прогнозирования по величине ошибки прогноза для всех рядов анализируемых акций и установлено предпочтение модели с ДКЗ над другими моделями (авторегрессионной и нейросетевой) в задаче прогнозирования, что повышает достоверность прогноза.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Кричевский A.M. Прогнозирование временных рядов с использованием искусственных нейронных сетей. - Труды 3-ей школы-семинара БИКАМП-01, 2001, с.158-160.
2. Кричевский A.M. Оценка горизонта прогноза в хаотических временных рядах. - Тезисы докл. 11-ой Межд. школы-семинара «Новые информационные технологии»- М.: Моск. Гос. инст. электроники и матем., 2003, с.242.
3. Кричевский A.M. Оценка возможностей прогноза хаотических временных рядов. - Тезисы докл. 9-ой Межд. науч.-техн. конф. студ. и асп. - М.: Моск. энерг. инст., 2003, с.260.
4. Кричевский A.M. Реконструкция динамической системы по временному ряду,- Тезисы докл. XII Межд. школы-семинара - «Новые информационные технологии». М.: Моск. Гос. инст. электроники и матем., 2004, с. 182-184.
5. Кричевский А. М. Выбор параметров при реконструкции динамической системы. - Труды 4-ой Межд. науч.-практ. конф. «Актуальные проблемы экономики и новые технологии преподавания».
- СПб, Межд. Банковский институт, 2005, с. 199-202.
6. Кричевский А. М. Оценки размерности хаотических временных рядов.- Восьмая научная сессия ГУАП. - СПб, ГУАП, 2005, с.456-458.
7. Кричевский A.M. Реконструкция хаотических временных рядов с использованием нейронных сетей. - Сб. докл. 3-й Всеросс. научн. конф. «Управление и информационные технологии», т.1, с.224-229. СПб.: 2005, с.224-229.
8. Кричевский А.М. Применение главных компонентов для анализа нерегулярных временных рядов. - Тезисы докл. 11-ой Межд. науч.-техн. конф. студ. и асп. - М.: Моск. энерг. инст, 2005, с. 121.
9. Кричевский A.M. Главные компоненты как критерии классификации временных рядов. - Тезисы докл. XIV Межд. школы-семинара - «Новые информационные технологии». М.: Моск. гос. инст. электроники и матем., 2006, с.82-84
10. Кричевский A.M. Метод опорных векторов в задаче регрессии-Научная сессия ГУАП. - СПб, ГУАП, 2006, с.279-281.
11. Кричевский M.JI., Кричевский A.M. Инструментарий извлечения знаний в управленческих задачах. - Известия Межд. Акад. Наук высшей школы, 2006, 3(37), с.153-161 (в рекомендованном ВАК перечне публикаций).
12. Кричевский A.M. Генерирование фрактальных временных рядов.
- Труды 6-ой Межд. науч.-практ. конф. «Актуальные проблемы экономики и новые технологии преподавания». - СПб, Межд. Банковский институт, 2007, с.151-153.
13. Кричевский A.M. Свидетельство об отраслевой регистрации разработки №7923 «Исследование фрактальных рядов». - Федеральное агентство по образованию, Отраслевой фонд алгоритмов и программ, 2007.
14. Кричевский A.M. Анализ и применение моделей временных рядов с долгой памятью. - Науч.-технические ведомости СПб Гос.
Политехнического института, 2007,4, с.137-141 (в рекомендованном ВАК перечне публикаций).
15. Осипов JI.A., Кричевский A.M. Оценка и применение моделей временных рядов ■ в экономических задачах- Информационно-управляющие системы, 2007, 5, с.45-51 (в рекомендованном ВАК перечне публикаций).
Формат 60x84 1\16 .Бумага офсетная. Печать офсетная. Тираж 100. экз. Заказ № 564.
Редакционно-издательский центр ГУАП 190000, Санкт-Петербург, Б. Морская ул., 67
Оглавление автор диссертации — кандидата технических наук Кричевский, Андрей Михайлович
Введение.
1 Обзор методов анализа и прогноза временных рядов с долговременной корреляционной зависимостью. Постановка задачи исследования.
1.1 Временные ряды с долговременной корреляционной зависимостью.
1.2 Постановка задачи диссертации.
1.3 Основные результаты раздела.
2 Фрактальный анализ временных рядов.
2.1 Пространственные фрактальные объекты.
2.2 Генерирование фрактальных временных рядов.
2.3 Фрактальная размерность временных рядов.
2.4 Главные компоненты временных рядов.
2.5 Основные результаты раздела.
3 Прогнозирование рядов с долговременной корреляционной зависимостью.
3.1 Параметрические модели временных рядов.
3.2 Методология Бокса-Дженкинса.
3.3 Модель ARFIMA (p,d,q) временного ряда.
3.4 Оценивание параметра d.
3.5 Модель обучения на примерах.
3.6 Минимизация эмпирического и структурного рисков
3.7 Применение нейронных сетей для прогнозирования рядов.
3.8 Основные результаты раздела.
4 Модельные и экспериментальные исследования.
4.1 Моделирование фрактальных шумов.
4.2 Моделирование фрактальных рядов.
4.3 Экспериментальные исследования реальных рядов.
4.4 Основные результаты раздела.
Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Кричевский, Андрей Михайлович
Актуальность исследования. Все формальные процедуры прогнозирования предусматривают перенос прошлого опыта в неопределенное будущее. Такие алгоритмы прогнозирования построены на предположении, что условия, породившие полученные ранее данные, неотличимы от условий будущего. Исключение составляют только те переменные, которые точно распознаны моделью прогнозирования. В подавляющем большинстве случаев предположение о неразличимости прошлого и будущего не выполняется в полной мере.
Одним из возможных методов улучшения точности прогнозирования служит применение новых разрабатываемых моделей, способных к более адекватному описанию наблюдаемых данных и получению прогнозных оценок путем экстраполяции. Для построения модели временного ряда не требуются знания ни производства, ни условий, в которых протекает тот или иной процесс. Модель строится только на основе имеющейся числовой информации. Задача аналитика в этом случае заключается в том, чтобы выяснить статистическую закономерность, которой подчиняются отсчеты, образующие временной ряд, и сделать прогноз на будущее, основываясь на этой закономерности.
Процедуры прогнозирования могут классифицироваться как качественные и количественные. На одном полюсе находится чисто качественный аппарат, не требующий явного математического оперирования данными. На другом количественный аппарат, состоящий из процедур, которые на выходе дают числовые оценки прогноза. Отметим, что некоторые количественные алгоритмы требуют значительно более тщательной и изощренной техники обработки данных, чем другие. В данной работе рассматривается количественный подход к получению оценок прогноза как единственно верной отправной точке для эффективного прогнозирования событий.
Зависимость структуры ряда от времени играет ключевую роль при прогнозировании, моделировании и анализе временных рядов различной природы. Несмотря на наличие достаточно простых и хорошо разработанных алгоритмов прогнозирования, основанных, например, на построении «наивных» моделей, процедур сглаживания, регрессионных моделей, существуют временные ряды, которые плохо описываются этими моделями, и требуются более сложные алгоритмы для представления таких временных процессов.
В последние годы появился увеличивающийся интерес к временным рядам, обладающим долговременной положительной корреляционной зависимостью. В английском языке синонимами этого понятия являются такие термины как long memory (долгая память), long-range dependence (долговременная зависимость), strong dependence (сильная зависимость) или persistence (персистентность). Ни у одного из этих терминов еще нет адекватного перевода на русский язык, поэтому в работе такой ряд будем называть рядом с долговременной корреляционной зависимостью (ДКЗ).
В задаче прогноза и анализа временных рядов со сложной структурой часто используются модели класса ARIMA{p,d,q) (авторегрессионные проинтегрированные скользящего среднего -Autoregressive Integrated Moving Average) порядка (p,d,q), которые моделируют различные ситуации, встречающиеся при анализе стационарных и нестационарных рядов. В зависимости от анализируемого ряда модель ARIMA (p,d,q) может трансформироваться к авторегрессионной модели AR(p), модели скользящего среднего MA(q) или смешанной модели ARM A (p,q). При переходе от нестационарного ряда к стационарному, значение параметра d, определяющего порядок разности, принимается равным 0 или 1, т.е. этот параметр имеет только целочисленные значения. Однако из поля зрения исследователей выпадала ситуация, когда параметр d может принимать дробные значения.
Для анализа этой проблемы в работах зарубежных ученых, в первую очередь, C.W.Granger, J.R.Hosking, P.M.Robinson, R. Beran, был предложен новый класс моделей ARFIMA(p,d,q), допускающий возможность нецелого параметра d и получивший название авторегрессионный дробно интегрированный процесс скользящего среднего (Autoregressive Fractional Integrated Moving Average) [52, 57]. Такие ряды обладают своей спецификой: медленно спадающей корреляцией, самоподобием, дробной размерностью. Прогнозирование временных рядов с помощью модели ARFIMA(p,d,q) открывает более широкие перспективы для повышения точности прогноза, что подчеркивает актуальность темы исследования.
Цель диссертационной работы заключается в разработке алгоритмов прогнозирования временных рядов, обладающих долговременной корреляционной зависимостью, и оценке точности прогнозирования.
Для достижения поставленной цели в диссертации решаются следующие основные задачи:
• создание алгоритмов моделирования фрактальных временных рядов с ДКЗ;
• разработка алгоритмов прогнозирования для временных рядов, характеризующихся ДКЗ;
• применение искусственных нейронных сетей для получения прогнозных оценок временного ряда;
• экспериментальные исследования точности прогнозирования реальных временных рядов, обладающих ДКЗ.
Методы исследования. Для решения поставленных задач используются . методы теории вероятностей, корреляционно-спектрального анализа, нейросетевого моделирования, статистической обработки экспериментальных данных.
Основные научные результаты, полученные в диссертационной работе:
1. Разработан алгоритм моделирования фрактальных временных рядов (зарегистрирован в Отраслевом фонде алгоритмов и программ), основанный на методе случайного срединного смещения.
2. Предложен метод идентификации параметров модели ARFIMA(p,d,q) для прогнозирования реальных временных рядов.
3. Получены прогнозные оценки временных рядов с использованием моделей искусственных нейронных сетей;
4. Проведено экспериментальное исследование точности прогноза различными методами на реальных временных рядах.
Степень новизны научных результатов
1. Разработанный алгоритм моделирования фрактальных временных рядов отличается от известных тем, что позволяет создавать ряды по заданным значениям показателя Херста, являющегося в определенной степени классификатором рядов, и необходимой длине исходных данных.
2. Новым в предложенном алгоритме прогнозирования является начальный выбор параметров р и q модели ARMA(p,q) по виду и характеру изменения частной автокорреляционной функции временного ряда и последующая трансформация к модели ARFIMA(p,d,q) с вычислением показателя d.
3. Развитие нейросетевой технологии в задаче прогнозирования, реализованной в работе, заключается в использовании и построении различных конфигураций нейронных сетей, введении этапа тестирования полученной сети, расчете ошибок прогнозирования на обучающей и тестовых выборках.
4. Новизна экспериментальных исследований состоит в комплексном изучении реальных и смоделированных временных рядов, включающем в себя анализ авто- и частной корреляционных функций, спектральной плотности, расчет и вычисление главных компонентов ряда, построение прогнозных оценок ряда и оценку точности прогноза.
Степень обоснованности и достоверности научных результатов
Обоснованность полученных научных положений и выводов подтверждается сопоставлением прогнозных оценок и их точности, полученных посредством различных, рассмотренных в диссертации, моделей: нейросетевой и модели с ДКЗ. Кроме того, модель ARFIMA(p,d,q) позволяет перейти к более простым ситуациям описания временных рядов.
Достоверность научных результатов обосновывается экспериментальным изучением реальных временных рядов, включающим статистическую проверку и построение автокорреляционной функции и спектральной плотности, которые являются основными критериями принадлежности анализируемых данных к модели ARFIMA(p,d,q).
Практическая ценность. Предложенные в работе методы прогнозирования временных рядов, основанные на модели временных рядов с ДКЗ, позволяют увеличить точность прогнозных оценок и достоверность выводов. Такие методы могут быть использованы в различных ситуациях и сферах деятельности, где необходимо получать информацию о будущем поведении систем.
Полученные результаты и разработанные алгоритмы используются в аналитической деятельности инвестиционной компании «Доходъ», учебном процессе ГУАП и Международного банковского института.
Программная разработка «Исследование фрактальных рядов» зарегистрирована в Отраслевом фонде алгоритмов и программ Федерального агентства по образованию.
Положения диссертационной работы, выносимые на защиту:
1. Алгоритм моделирования фрактальных временных рядов, которые обладают долговременной корреляционной зависимостью, отличающийся от известных тем, что позволяет создавать ряды по заданным значениям показателя Херста и необходимой длине ряда.
2. Алгоритм прогнозирования временного ряда по модели ARFIMA(p,d,q), включающий начальный выбор параметров р и q модели ARMA(p,q) по виду и характеру изменения частной автокорреляционной функции временного ряда и последующую трансформацию к модели ARFIMA(p,d,q) с вычислением показателя d.
3. Нейросетевое прогнозирование временных рядов, основанное на построении различных типов нейронных сетей и выборе наиболее пригодной сети по величине погрешности прогноза на обучающей и тестовой выборках.
4. Экспериментальное исследование реальных и смоделированных временных рядов, в частности, анализа авто- и частной корреляционных функций, спектральной плотности, расчета и нахождения главных компонентов, построения прогнозных оценок ряда и оценке точности прогнозирования.
Апробация работы. Результаты отдельных этапов работы докладывались и обсуждались на заседаниях 11, 12 и 14 Международных студенческих школ-семинаров «Новые информационные технологии» (Москва, МИЭМ, 2003, 2004, 2006), 9 и 11 Международных научно-технических конференциях студентов и аспирантов (Москва, МЭИ, 2003, 2005), 4 и 6 Международных научно-практических конференциях «Актуальные проблемы экономики и новые технологии преподавания» (Санкт-Петербург, МБИ, 2005, 2007), 3 Всероссийской научной конференции «Управление и информационные технологии» (Санкт-Петербург, ЛЭТИ, 2005), 3 школы-семинара БИКАМП-01 (Санкт-Петербург, ГУАП, 2001), 8 и 9 научных сессий аспирантов ГУАП (Санкт-Петербург, ГУАП, 2005, 2006).
Публикации. Основные результаты диссертации опубликованы в 15 научных работах.
Заключение диссертация на тему "Прогнозирование временных рядов с долговременной корреляционной зависимостью"
Основные результаты, полученные автором в данном разделе, нашли отражение в работах [15,16,23,25,31].
Заключение
На основании проведенного исследования получены следующие результаты:
1. Проанализированы пространственные фрактальные объекты, начиная с простейших геометрических фракталов типа снежинки Коха и салфетки Серпинского, кратко описаны L-системы и системы итерированных функций, с помощью которых можно образовывать фрактальные объекты.
2. Рассмотрены способы генерирования фрактальных временных рядов, включающие как классическое, так и фрактальное броуновские движения, описаны и рассчитаны спектры различных видов фрактальных шумов, предложен метод случайного срединного смещения и выполнена его практическая реализация. Описаны такие виды фрактальной размерности как емкостная, корреляционная, размерность вложения. Подробно проанализирован метод нормированного размаха, позволяющий оценить показатель Херста и величину фрактальной размерности, приведен алгоритм этого метода.
3. Приведены сведения по методу сингулярного спектрального анализа, который дает возможность визуализировать временной ряд в плоскости вычисленных главных компонентов. Описаны основные этапы алгоритма расчета главных компонентов и выдвинуто предположение о возможности классификации временных рядов по виду главных компонентов или собственных векторов.
4. Рассмотрены параметрические модели временных рядов, включая авторегрессионную модель порядка р - AR(p), модель скользящего среднего порядка q - MA(q), смешанную модель порядка (p,q) - ARMA(p,q), а также нестационарный временной ряд в виде авторегрессионной проинтегрированной модели скользящего среднего - ARIMA(p,d,q), где d определяет интегрирования Установлена связь между параметрами автокорреляционной, частной автокорреляционной функциями и свойствами временного ряда, сформулированы практические рекомендации по идентификации временного ряда.
5. Проанализировано свойство долговременной корреляционной зависимости (ДКЗ) во временных рядах, рассмотрены требования к автокорреляционной функции и спектральной плотности, которым должен удовлетворять ряд с таким свойством. Установлено, что временной ряд с ДКЗ описывается классом моделей ARIMA(p,d,q), в котором значение показателя d принадлежит интервалу (-0,5; 0,5), что приводит к появлению модели ARFIMA(p,d,q) (буква F - fractional - означает «дробный).
6. Указаны пути оценки параметра d во временной и частотной областях, проведено их сравнение и выявлено предпочтение второй оценки над первой. Рассмотрены статистики для проверки гипотезы о различии между долговременной и кратковременной зависимостями временного ряда и установлено превосх одство FI/S- анализа над традиционными методами.
7. Рассмотрена модель обучения на примерах, в качестве которых используются экспериментальные данные, предложена оценка качества обучения в виде функционала риска, проанализирован эмпирический риск и указаны принципы его минимизации. Установлен принцип минимизации структурного риска, который уменьшает верхнюю границу ошибки обобщения, проведено сравнение эмпирического и структурного рисков.
8. Выбраны две стратегии минимизации фактического риска и указаны пути их реализации. В качестве первой стратегии, при которой сохраняется фиксированным доверительный интервал и минимизируется эмпирический риск, предложено использовать традиционную многослойную нейронную сеть, а для второй - с сохранением эмпирического риска и минимизации доверительного интервала - применять машину опорных векторов. Оценены основные проблемы, связанные с реализацией первой стратегии.
9. Проведено моделирование фрактальных шумов, используемых в качестве примеров самоподобных процессов. Приведены результаты моделирования коричневого и розового шумов, различающихся степенью зависимости спектра от частоты. Выполнен анализ временных рядов, определяющих эти шумы, и показано, что автокорреляционная функция и спектральная плотность имеют вид, характерный для рядов со свойством ДКЗ. Проведено сравнение временных рядов фрактальных шумов с рядом логистического отображения, приводящим к хаосу, и выявлено кардинальное отличие последнего от рядов с ДКЗ.
10. С помощью разработанного алгоритма метода случайного срединного смещения (этот алгоритм зарегистрирован в Отраслевом фонде алгоритмов и программ) выполнено моделирование фрактальных временных рядов при разных значениях показателя Херста, служащего критерием классификации рядов. Вычислены характеристики смоделированных рядов, в первую очередь, автокорреляционной функции и спектральной плотности и показано, что такие ряды относятся к временным рядам с ДКЗ. Установлено, что значение показателя Херста влияет на поведение ряда с точки зрения его обладания свойством долговременной корреляционной зависимости.
11. Выполнено экспериментальное исследование реальных временных рядов, в качестве которых взяты ежедневные изменения цен акций Аэрофлота, Газпрома, Сбербанка, Сибнефти и Татнефти в период 1.02.01 по 14.09.06 (1400 торговых дней). Осуществлена стандартная процедура проверки принадлежности анализируемых рядов к рядам с долгой памятью посредством вычисления автокорреляционной функции и спектральной плотности и выяснено, что все рассмотренные ряды обладают свойством ДКЗ.
12. Проведена идентификация моделей, пригодных для описания этих рядов, и по виду частной автокорреляционной функции установлено, что первоначальной моделью может служить модель ARFIMA{ 1,0,0), трансформирующаяся к авторегрессионной модели первого порядка AR{ 1). Определен параметр d модели ARFlMA(1,d,Q), которая уточняет первоначальную модель AR{ 1). Выполнен прогноз по этим моделям и вычислены ошибки прогнозирования. Показана возможность прогнозирования временных рядов с использованием искусственных нейронных сетей в виде многослойного персептрона, построена и обучена сеть, получены прогнозные характеристики временного ряда.
13. Проведено сравнение рассмотренных методов прогнозирования по величине ошибки прогноза для всех рядов анализируемых акций и установлено предпочтение модели ARFIMA^, d,0) над другими моделями (авторегрессионной и нейросетевой) в задаче прогнозирования, что повышает достоверность прогноза.
Библиография Кричевский, Андрей Михайлович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Бокс, Дж. Анализ временных рядов. Прогноз и управление. Вып.1/Дж. Бокс, Г. Дженкинс. М.: Мир, 1974, 408 с.
2. Большаков, А.А. Методы обработки многомерных данных и временных рядов./А.А.Большаков, Р.Н. Каримов-М.: Горячая линия Телеком, 2007, 522 с.
3. Борисов, В.Д. Метод фрактального анализа временных рядов. / В.Д. Борисов, Г.С. Садовой//Автометрия, 2000, т.6, С. 1019.
4. Боровиков, В.П. Прогнозирование в системе Statistics в среде Windows./В.П. Боровиков, Г.И. Ивченко. М.: Финансы и статистика, 1999, 384 с.
5. Вапник, В.Н. Восстановление зависимостей по эмпирическим данным. / В.Н.Вапник. М.: Физматгиз, 1979,324с.
6. Вапник, В.Н. Теория распознавания образов./ В.Н.Вапник, А.Я.Червоненкис. М.: Наука, 1974, 468с.
7. Витолин, Д. Применение фракталов в машинной графике / Д.Витолин //Сотри1ег\л/ог1с1-Россия.1995, N15.C.11.
8. Голяндина,Н.Э. Метод «Гусеницал-ЭЭА: анализ временных рядов: учебное пособие/ Н.Э.Голяндина. СПб, СПбГУ, 2004, 156 с.
9. Градштейн, И.С. Таблицы интегралов, сумм, рядов и произведений / И.М.Градштейн, И.М.Рыжик М.: Физматгиз, 1963, 1100 с.
10. Данилов, Ю.А. Лекции по нелинейной динамике/ Ю.А.Данилов. М.: Постмаркет, 2001, 118 с.
11. Дубовиков,М.М., Размерность минимального покрытия и локальный анализ фрактальных временных рядов/ М.М.
12. Дубовиков,Ф.В. Крянев., Н.В. Старченко // Вестник Росс. Универс. Дружбы народов, сер. «Прикл. и комп. матем.», 2004, т.З, №1, С.30-44.
13. Кричевский, A.M. Прогнозирование временных рядов с использованием искусственных нейронных сетей / A.M. Кричевский // Труды 3-ей школы-семинара БИКАМП-01 / ГУАП. СПб. 2001.
14. Кричевский, A.M. Оценка горизонта прогноза в хаотических временных рядах/A.M. Кричевский//Тезисы докл. 11-ой Межд. школы-семинара «Новые информационные технологии»/М. 2003. С.242.
15. Кричевский, A.M. Реконструкция динамической системы по временному ряду / A.M. Кричевский // Тезисы докл. XII Межд. школы-семинара «Новые информационные технологии» / Моск. Гос. инст. электроники и матем. М. 2004. С. 182-184.
16. Кричевский, A.M. Выбор параметров при реконструкции динамической системы / A.M. Кричевский // Труды 4-ой Межд. науч.-практ. конф. «Актуальные проблемы экономики и новые технологии преподавания» / Межд. Банковский институт. СПб. 2005. С. 199-202.
17. Кричевский, А. М. Оценки размерности хаотических временных рядов / A.M. Кричевский// Восьмая научная сессия ГУАП / ГУАП. СПб. 2005. С.456-458.
18. Кричевский A.M. Реконструкция хаотических временных рядов с использованием нейронных сетей / A.M. Кричевский // Сб. докл. 3-й Всеросс. научн. конф. «Управление и информационные технологии» / СПб. 2005. С.224-229.
19. Кричевский, A.M. Применение главных компонентов для анализа нерегулярных временных рядов / A.M. Кричевский // Тезисы докл. 11-ой Межд. науч.-техн. конф. студ. и асп. / Моск. энерг. инст. М. 2005. С.121.
20. Кричевский, A.M. Главные компоненты как критерии классификации временных рядов / A.M. Кричевский // Тезисыдокл. XIV Межд. школы-семинара «Новые информационные технологии» / Моск. Гос. инст. электроники и матем. М. 2006. С.82-84
21. Кричевский, A.M. Метод опорных векторов в задаче регрессии/A.M. Кричевский// Научная сессия ГУАП / ГУАП. СПб. 2006. С.279-281.
22. Кричевский, A.M. Инструментарий извлечения знаний в управленческих задачах / М.Л. Кричевский, A.M.Кричевский // Известия Межд. Акад. Наук высшей школы. 2006. 3(37). С. 153161.
23. Кричевский, A.M. Генерирование фрактальных временных рядов / A.M. Кричевский // Труды 6-ой Межд. науч.-практ. конф. «Актуальные проблемы экономики и новые технологии преподавания» / Межд. Банковский институт. СПб. 2007. С. 151153.
24. Кричевский, A.M. Свидетельство ' об отраслевой регистрации разработки №7923 «Исследование фрактальных рядов» / A.M. Кричевский // Федеральное агентство по образованию. Отраслевой фонд алгоритмов и программ. / М. 2007.
25. Кричевский, A.M. Анализ и применение моделей временных рядов с долгой памятью / A.M. Кричевский//Науч.-технические ведомости СПб Гос. Политехнического института. 2007. №4. С.137-141.
26. Кроновер, P.M. Фракталы и хаос в динамических системах. Основы теории / P.M.Кроновер. М.: Постмаркет. 2000. 352 с.
27. Мандельброт, Б. Фракталы и возрождение теории итераций. /в книге Пайтген Х.-О., Рихтер П.Х. Красота фракталов. М.: Мир,1993. С.131-140.
28. Мандельброт, Б. Фракталы, случай и финансы/ Б.Мандельброт. Москва Ижевск: НИЦ «Регулярная и хаотическая динамика». 2004. 228 с.
29. Мандельброт, Б. Непослушные рынки / Б.Мандельброт. М.: Издательский Дом «Вильяме». 2006. 462с.
30. Марпл, С.Л. Цифровой спектральный анализ и его приложения /С.Л. Марпл. М.: Мир.1990. 428с.
31. Осипов, J1.A. Оценка и применение моделей временных рядов в экономических задачах / Л.А.Осипов, A.M. Кричевский// Информационно-управляющие системы, 2007, № 5(30). С.45-51.
32. Оссовский, С. Нейронные сети для обработки информации / С. Оссовский. М.: Финансы и статистика. 2002. 476с.
33. Петере, Э. Хаос и порядок на рынках капитала. Новый аналитический взгляд на циклы, цены и изменчивость рынка / Э.Петере. М.: Мир. 2000. 334с.
34. Слуцкин, Л.Н. Курс МВА по прогнозированию в бизнесе / Л.Н. Слуцкин М.: Альпина Бизнес Букс. 2006. 277с.
35. Уэлстид, С. Фракталы и вейвлеты для сжатия изображений в действии / С. Уэлстид. М.: Триумф. 2003. 320с.
36. Федер, Е. Фракталы / Е. Федер. М.: Мир. 1991. 282с.
37. Хайкин, С. Нейронные сети: полный курс / С.Хайкин. М.:Издательский Дом «Вильяме». 2006. 852с.
38. Ханк, Д.Э. Бизнес-прогнозирование / Д.Э. Ханк, Д.У. Уичерн, А.Дж. Райте. М.: Издательский Дом «Вильяме». 2003. 656с.
39. Червяков, ИМ. Предсказание фрактальных временных рядов с помощью нейронных сетей / Н.И. Червяков, Э.И.Тихонов // Нейрокомпьютеры: разработка, применение. 2003. №10-11. С. 19-24.
40. Шредер, М. Фракталы, хаос, степенные законы. Миниатюры из бесконечного рая /М. Шредер. Москва-Ижевск: НИЦ «Регулярная и хаотическая динамика». 2005. 528с.
41. Bailtie, R.T. Long memory processes and fractional integration in econometrics / R.T. Baillie // Journal of Econometrics. 1996. 73. P. 5-59.
42. Barnsley, M. Fractals Everywhere / M. Barnsley. Boston. Academic Press. 1988. 462 p.
43. Breidt, F.J. The detection and estimation of long memory in stochastic Volatility / F.J.Breidt, N. Crato, P.Lima// Journal of Econometrics, 1998, 73, P.325-348.
44. Fasset, L.Fundamental of Neural Networks/ L.Fasset. New Jersey, 1994. 576 p.
45. Geweke, J. The estimation and application of long memory time series models / J. Geweke S.Porter-Hudak// Journal of Time Series Analysis, 1983, 4, P.221-238.
46. Granger, C.W. Varieties of long memory models/ C.W. Granger, Z.Ding // Journal of Econometrics, 1996, 73, P.61-77.
47. Granger, C.W. Introductoin to long-memory time series models and fractional differencing/ C.W. Granger, R.Joyeux // Journal of Time Series Analysis. 1980, v.1, P. 15-29.
48. Grassberger, P., Measuring the strangeness of strange attractors / P. Grassberger, I.Procaccia // Physica D, 1983, 9,P.189-208.
49. Gunn, S.R. Support vector machines for classification and regression / S.R.Gunn // Technical Report, University of Southampton, 1998.
50. Hertz, J. Introduction to the Theory of Neural Computation/ J. Hertz, A.Krogh , R.Palmer. Santa Fe. 1996. 328p.
51. Hilborn, R.C. Chaos and Nonlinear Dynamics / R.C.Hilborn. Oxford, University Press. 2000. 582p.
52. Hosking, J.R.M. Fractional differencing / J.R.M.Hosking// Biometrica, 68,1,P.165-176.
53. Lo, A.W. Long-term memory in stock market prices / A.W.Lo// Econometrica, 1991, 59,P. 1279-1313.
54. Muller, B. Neural Networks. An Introduction / B.Muller, J.Reinhart, Strickland M. Berlin: Springer-Verlag. 1995. 340 p.
55. Packard, N.H. Geometry from a time series/ N.H.Packard, J.P.Crutchfield, J.D. Farmer //Physical Review Letters, 1980,45, P.712-716.
56. Peters, E.E. Fractal Market Analysis: Applying Chaos Theory to Investment and Economics / E.E.Peters. N.Y.: J.Wiley & Sons, 1994. 322 p.
57. Robinson, P.M. Long-memory Time Series. / in Times Series with Long Memory. / P.Robinson. Oxford, University Press, 2003, 4-32.
58. Rumelhart, D.E. Learning internal representations by error propagation. / D.E.Rumelhart, G.E.Hinton, R.J.Williams in Parallel Distributed Processing , v.1,chap.8,1986.
59. Smola, A.J. A tutorial on support vector regression / A.J.Smola, B.Scholkopf. NeuroCOLT2 Technical Report Series, 1998.
60. Sprott, J.C. Chaos and Time-Series Analysis/ J.C.Sprott. Oxford, University Press, 2003. 508 p.
61. Takens, F. Detecting strange attractors in turbulence / In "Dynamical Systems and Turbulence" (ed. D.A.Rand, L.S.Young).-New York, Springer, 1981, 366-381.
62. Robinson, P.Times Series with Long Memory. / P.Robinson. Oxford, University Press, 2003. 284 p.
63. Vapnik, V. N. Statistical Learning Theory / V.N. Vapnik. N. Y.: Wiley. 1998. 626 p.
64. Vapnik, V. N. The Nature of Statistical Learning Theory/ V.N. Vapnik. N. Y.: Springer, 2000. 382 p.
65. Samorodnitsky, G. Stable Non-Gaussian Random Processes. G.Samorodnitsky, M. Taggu. N. Y.: Chapman & Hall, 1994. 424 p.
66. Resnick, S.I. Heavy tail modeling and teletraffic data/ S.I.Resnick. //Annals of Statistics, 1997, 25,5, P.1805-1869.
67. Willinger, W. Self-similarity in high-speed packet traffic: analysis and modeling of Ethernet traffic measurements / W.Willinger, M.S.Taqqu, W.E.Lelan. // Statistical Science, 1995, 10, 1, P.67-85.
-
Похожие работы
- Система информационной поддержки принятия решений врача при лечении вегетативных расстройств
- Моделирование сетевого трафика и алгоритмы борьбы с перегрузками на основе методов нелинейной динамики и краткосрочного прогнозирования временных рядов
- Математический метод и алгоритмы фрактального анализа динамики финансовых рынков
- Метод решения многоцелевой задачи управления движением околоземной пилотируемой станции на больших временных интервалах
- Разработка и исследование метода прогнозирования сложных процессов на основе комбинированных рядов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность