автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Оценка качества прогнозов моделей и прогнозирование при наличии структурных сдвигов
Автореферат диссертации по теме "Оценка качества прогнозов моделей и прогнозирование при наличии структурных сдвигов"
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ имени М В ЛОМОНОСОВА
ФАКУЛЬТЕТ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И КИБЕРНЕТИКИ
На правах рукописи
Китов Виктор Владимирович
ОЦЕНКА КАЧЕСТВА ПРОГНОЗОВ МОДЕЛЕЙ И ПРОГНОЗИРОВАНИЕ ПРИ НАЛИЧИИ СТРУКТУРНЫХ СДВИГОВ
Специальность 05 13 18 - математическое моделирование, численные методы и комплексы программ
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва-2008
РГБ ОД
2 е т 2008
003445454
Работа выполнена на кафедре системного анализа факультета ВМиК Московского государственного университета им М В Ломоносова
НАУЧНЫЙ РУКОВОДИТЕЛЬ кандидат физико-математических наук,
доцент Смирнов Сергей Николаевич
ОФИЦИАЛЬНЫЕ ОППОНЕНТЫ доктор физико-математических наук,
заведующий кафедрой теории вероятностей и математической статистики РУДН, профессор Хохлов Юрий Степанович,
кандидат физико-математических наук, старший научный сотрудник факультета ВМиК МГУ имени М В Ломоносова Уфимцев Михаил Валентинович
ВЕДУЩАЯ ОРГАНИЗАЦИЯ Вычислительный центр РАН
Защита состоится «_ / *0№$РА 200$ года в часов на заседании диссертационного совета Д 501 001 43 при^Московском государственном университете имени M В Ломоносова по адресу 119992 Москва, Ленинские горы, МГУ учебный корпус, факультет ВМиК, аудитория 685
С диссертацией можно ознакомиться в библиотеке факультета ВМиК Московского государственного университета им М В Ломоносова по адресу 119992 Москва, Ленинские горы, МГУ 2- учебный корпус
С текстом автореферата можно ознакомиться на официальном сайте ВМиК МГУ имени М В Ломоносова http //www eme msu ru в разделе «Наука» - «Работа диссертационных советов» - «Д 501 001 43»
Автореферат разослан -« 2008 г
Ученый секретарь диссертационного совета доктор физико-математических наук, профессор ' Захаров Е В
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. В приложениях математического моделирования часто возникает задача построения прогнозов ут+1 некоторой величины ут+1 по располагаемой фиксированной выборке наблюдений 21,22, гт, хт+и где = £ е К, £ = 1,2 Т Данная ситуация отвечает
случаю, когда у исследователя, в силу стоимостных, временных и других ограничений, нет возможности производить собственный контролируемый эксперимент, и он вынужден опираться только на имеющиеся данные Такая ситуация часто возникает, например, в экономических, геологических, астрономических и других приложениях При этом обычно предполагается, что данные описываются параметрической моделью у{+1 = <7(14+116) + е<+1, где д() - некоторая заданная функция, - известные на момент прогнозирования переменные (регрессоры), ^+1 - случайная ошибка, а 6 £ Крх1 - вектор неизвестных параметров Прогноз величины уп+\ строится согласно формуле у1+1 = гг+1,$(), где - оценка вектора в по располагаемым наблюдениям Для повышения точности прогнозов возникает задача выбора наиболее подходящей функции д() и метода оценивания величины В диссертационной работе указанные задачи решаются независимо
1,) Выбор функции д(-) Стандартной практикой, применяемой, например, в книге [1] и статьях [2], [3], [4], при выборе параметрической функции д{) для получения наилучших прогнозов, является сопоставление величин Е для различных функций д(), где /(•) - некоторая функция ка-
чества прогнозов Например, при тестировании несмещенности прогнозов, может использоваться функция /(х^у^б) = уь — д{хг,0) = £и ПРИ тестировании величины ошибки прогнозов - функция /(ж(, у¡, 0) = £{ либо = [е(/2/(]2, при тестировании наличия корреляции ошибок прогнозов - функция /(хиУ1,в) = £¿£(-1, при тестировании наличия корреляции между ошибками прогноза и прогнозами другой модели щ - функция = е4и4 Для построения точечных оценок величины Е/(х^уг,д) используется статистика = ^ /«+1 > а ПРИ тестировании гипотез -статистика Б2Я = (/«+1 _ гДе = Уи Р = Т - Я, а
Я является параметром, выбираемым исследователем
Распределение статистики Яд получено в работах [3] и [4] для случаев, когда оценка получается для каждого момента времени используя фиксированное число предшествующих наблюдений 2(_д+1,2(_д+2, , ^ (скользящее окно наблюдений), и все наблюдения 21,221 предшествующие моменту прогноза (расширяющееся окно наблюдений) Актуальным остался вопрос получения асимптотического распределения статистики, в случае использования всех располагаемых в выборке наблюдений 21,22, , 2у (полное окно наблюдений) при расчете ^ Кроме того, актуальной является задача повышения точности асимптотической аппроксимации распределения стати-
стики поскольку статистические испытания, представленные в работе [4], свидетельствуют о недостаточной точности асимптотической аппроксимации распределения указанной статистики при использовании скользящего окна наблюдений и больших значениях отношения Р/Я
Ограничением существующего метода получения точечных оценок величины Е/(хг, 0) с помощью статистики 5д служит равнозначный учет прогнозов /г+1 в различные моменты времени, в то время как сами прогнозы, в случае использования расширяющегося окна наблюдений для оценки ви различаются по точности - прогнозы в более ранние моменты времени являются менее точными, чем прогнозы в более поздние моменты времени, где параметр в оценивается по большему числу наблюдений
При использовании статистики актуальной является задача подходящего выбора параметра Я Имеют место противоречивые требования следует уменьшать Д для усреднения по большему числу прогнозов для снижения дисперсии получаемых оценок, и следует увеличивать Я для усреднения по более поздним прогнозам, в которые параметр оценивается достаточно точно, и ошибка его оценивания вызывает наименьшее смещение оценки качества прогнозов В связи с этим, встает вопрос оценки степени неравнозначности прогнозов в различные моменты времени при расчете их качества
2) Совершенствование оценок ^ Во многих ситуациях стандартные методики получения оценок в не являются удовлетворительными Одной из таких ситуаций, исследуемых в диссертационной работе, является наличие в выборке структурных сдвигов - феномена, при котором на различных участках выборки данные описываются моделью у4+1 = + £¡+1 с
различными значениями параметра 9 Структурные сдвиги описывают внутренние изменения моделируемого объекта либо окружающей среды, и часто наблюдаются, например, при анализе экономических временных рядов, что отражено в таких работах, как [5] и [6], где показывается, что ожидания экономических агентов (инвесторов, потребителей, производителей), государственная политика и общемировые события способны существенно влиять на законы изменения экономических переменных Участки выборки, в которых параметр в постоянен, в дальнейшем будут называться структурными режимами
В связи с многочисленными свидетельствами присутствия структурных сдвигов в данных, актуальной является разработка методов прогнозирования, корректно учитывающих наличие данного феномена В работе [9] показано, что применение стандартных средств при наличии структурных сдвигов ограничено учет большого числа наблюдений для получения оценки ^ приводит к сильному смещению оценки вектора неизвестных параметров и прогноза модели в связи с тем, что оценивание производится в том числе по структурным режимам, На которых вектор параметров в может существенно отличаться от своего значения в момент прогнозирования Прогноз,
использующий только наблюдения из последнего структурного режима, отвечающего моменту прогнозирования, может обладать высокой дисперсией, если число наблюдений в этом структурном режиме невелико Ограничением существующего метода (метод выбора длины окна, предложенный в работе [11]), разрешающего данное противоречие, является недостаточная гибкость к специфике данных в выборке метод использует не все располагаемые наблюдения и осуществляет целочисленную, а не непрерывную оптимизацию В целом, развитие подходов оценки качества прогнозов и методов прогнозирования при наличии структурных сдвигов является актуальной задачей для эффективного анализа данных в экономических, финансовых и других приложениях
Цель работы заключается в развитии методов построения наилучших прогнозов для зависимой переменной статистической модели по располагаемой выборке наблюдений Данная цель достигается за счет решения следующих задач
1) совершенствования методик оценки качества прогнозов
2) развития нового метода устойчивого прогнозирования при наличии структурных сдвигов в выборке наблюдений
Научная новизна работы состоит в том, что в ней
1 Усовершенствован подход к оценке качества прогнозов, за счет получения асимптотического распределения статистики ¿д в случае полного окна и за счет определения асимптотического смещения второго порядка указанной статистики для случаев полного, расширяющегося и скользящего окна наблюдений
2 В качестве альтернативы стандартному подходу, использующему статистику 5д, предложен новый метод получения точечных оценок качества прогнозов моделей, учитывающий неравнозначность прогнозов в различные моменты времени, за счет их неравномерного усреднения в оценке
3 Предложен и исследован новый метод устойчивого прогнозирования при наличии структурных сдвигов, учитывающий все наблюдения выборки
Теоретическая и практическая ценность работы.
1 Разработаны математические инструменты, повышающие точность статистических выводов о качестве прогнозов моделей
1 Найденное асимптотическое распределение статистики в случае полного окна позволяет более точно тестировать гипотезы (использующие асимптотику первого порядка) по сравнению со случаями скользящего и расширяющегося окна при больших значениях Р/Я, поскольку обладает минимальным асимптотическим смещением второго порядка
2 Учет найденного асимптотического смещения второго порядка для статистики существенно повышает точность статистических выводов при использовании скользящего окна и при тестировании гипотез с односторонней альтернативой при любом типе окна
3 Предложенный метод, учитывающий неравнозначность прогнозов в различные моменты времени при использовании расширяющегося окна, обеспечивает получение точечных оценок качества прогнозов, обладающих меньшей ошибкой, по сравнению со стандартным подходом, использующим статистику 5д, что демонстрируется на численных экспериментах Данный метод позволяет определять степень неравнозначности прогнозов при расчете их качества, что может быть полезно при выборе параметра К при использовании стандартной статистики
4 Предложенный новый метод прогнозирования при наличии структурных сдвигов в выборке наблюдений обеспечивает более точные прогнозы, по сравнению с последним предлагавшимся методом в данном классе задач (метод выбора длины окна), и более устойчивые (к величине структурного сдвига) прогнозы, по сравнению со стандартными методами прогнозирования, учитывающими все наблюдения выборки, либо наблюдения только последнего структурного режима
Практическая ценность работы заключается в возможности применения полученных математических инструментов и методов для широкого класса приложений, связаных с анализом данных и прогнозированием, в частности, при решении задач финансового анализа, планирования и прогнозирования деятельности компаний, в социологических исследованиях, Полученные результаты могут быть внедрены в информационных системах интеллектуальной бизнес-аналитики и системах управления эффективностью бизнеса
Защищаемые положения:
1 Получено асимптотическое распределение статистики в случае использования полного окна наблюдений при расчете оценок
2 Получено асимптотическое смещение второго порядка для распределения статистики в случаях использования полного, скользящего и расширяющегося окна наблюдений
3 Предложен новый метод получения точечных оценок качества прогнозов (величины Е0)), основанный на неравномерном усреднении прогнозов в случае использования расширяющегося окна наблюдений для оценки неизвестных параметров Рассмотрена процедура расчета степени неравнозначности прогнозов в различные моменты времени при построении оценки качества прогнозов
4 Предложен новый метод устойчивого прогнозирования при наличии в выборке структурных сдвигов неизвестной величины в известные моменты времени, и исследованы его основные свойства
Методика исследований. При получении теоретических результатов в работе использовались методы теории вероятностей, математической статистики, а также асимптотические методы математического анализа Для проверки полученных результатов проводились численные эксперименты в вычислительной системе МаИаЪ
Апробация работы. Основные результаты диссертации докладывались на четырех начных конференциях
• XXI научная конференция Российской экономической школы Май 2007
• XII всероссийская школа-семинар Современные проблемы математического моделирования Сентябрь 2007
• Конференция Ломоносов-2008, секция Вычислительная математика и кибернетика Апрель 2008
• Конференция молодых ученых механико-математического факультета МГУ им Ломоносова (секция Математика и механика конференции Ломоносов-2008) Апрель 2008 Доклад занял призовое место
Публикации Результаты диссертации опубликованы в семи работах автора, две из которых - в рецензируемых журналах, входящих в список ВАК
Структура диссертации. Работа состоит из введения, четырех глав, со-стоящихв совокупности из 23 разделов, списка основных результатов и списка литературы, включающего 38 наименований Полный объем диссертации -129 страниц, который включает 44 рисунка и 6 таблиц
СОДЕРЖАНИЕ РАБОТЫ
Во введении приведен краткий обзор литературы по теме диссертации, характеризующий состояние проблемы, и излагается краткое содержание работы
Первая глава диссертации посвящена задаче оценки качества прогнозов В параграфе 1.1 рассказано об актуальности данного исследования В параграфе 1.2 дана постановка задачи и приведен список предположений Рассматривается выборка 21,22, !2г> полученная с помощью некоторого строго стационарного и эргодического случайного процесса, где каждое наблюдение делится на вектор регрессоров Х{ € М1х<1 и зависимую переменную-скаляр уг zt = (ж(, уе) Значение зависимой переменной % считается удовлетворяющим модели = д{х^ в) + где В £ Жрх1 - вектор неизвестных параметров, удовлетворяющий условию экстремальной оценки
в = а^ тахЕ [ф (2, д)] ?£в
с некоторой функцией ф Примерами данной функции являются1
■ф (г, д) = — (у - д (х, д))2 нелинейный метод наименьших квадратов 1ф (г, д) = 1пр (г\д) метод максимального правдоподобия
ф (г, д) = —Л2 (г, д) метод моментов
Прогнозирование осуществляется по формуле уь+х = д{х^где ^ = = arg тах^е Ё( [ф (г, д)] Оператор обозначает выборочное среднее по скользящему, расширяющемуся либо полному окну наблюдений
/
Используются следующие обозначения2
/(хш, ум, в) = = /¿+1; /(х(+1, г/(+ь = Л+1(4) = Л+1,
ъ тг, -
Г2 ~ ^ \ дв* / > "т — ' — дЯдч' Л \ дчдя' / '
П^ = Е , = Е {ЦВКВЫ-]} , = Е {^ВР^ВИ^,}
= уес
¡м-р, им-ъ, дм-ъ
Рассматривается асимптотика, при которой с ростом объема выборки ^ = 7г + о(^), где 7г > 0 - некоторый параметр
Предполагается, что Уи € 9 (9 £ т10) выполнены условия
1 /((и) измерима и трижды непрерывно дифференцируема по и 2. Для некоторого 5 > О Е ||уес [®?=1С?(] |2+г| < оо
3 Процесс является строго перемешивающим, то есть для сигма-алгебр ££ = а {Са, Са+1, , Сь} , выполнено следующее условие
вир |Р (АВ) - Р (Л) Р (В) | = а (г) —> 0 при т —► оо,
Дополнительно предполагается, что ЭС1 . а (г) < Схт'ш, ¡щ > 2
4 ЗС2 < оо, ¿о > О У£ > ¿о Зир < г>{, где - некоторая
0е9
измеримая функция, для которой выполнено условие Е< С2
5 Е {|т/> (г, и)| х (г, м)| > К]} —> 0 равномерно относительно и € 9 при К —> 0 (1[ ] - индикаторная функция).
6 Множество 9 является компактом
7 3' в = а^тах96е1[^(г,д)] 6 ©
1р(21ч) обозначает плотность распределения с параметрами <1 в методе максимального правдоподобия, Л(г, 17) обозначает функцию в условии на моменты ЕЛ(г, 0) = О
2Оператор уес обозначает операцию векторизацию для матрицы А = {ац} е уес{Л} =
= [а1Ъ а12, ,аш,а2а,022,
8, 3D(z) . ED(z) < oo,\i>(z,q)\ < D(z) V(z,g) S (Z,6), где Z - область значений переменной г
В параграфе 1.3 приведены результаты первой главы диссертации при сделанных предположениях Найдено асимптотическое распределение статистики S¡¡ при использовании полного окна наблюдений.
Утверждение 1: В случае использования полного окна наблюдений, статистика S\ обладает следующим асимптотическим распределением
S\ Л ЩО, S), Е(0) = % + А/Л [FiBS'íh + SfhBF[] + \hhFxBShhBF{,
+0O +00
где Sjf = £ Е {(ft - Е/) - Е/)} , 5/Л = £ Е {(/, - Е/) } ,
J=—00 j=-oo
+00
5лл = £ Е {Mí-j } , Л/Ь = =
j=-oo
Аналитическая формула для £ совпадает формулой, полученной для ковариационной матрицы в работах [3] и [4] в случае использования скользящего и расширяющегося окна наблюдений В ней различаются лишь коэффициенты А/л и Дм
расширяющееся окно А/л = 1 — \ ln (1 + -к), Ahh — 2 [l — ~ ln (1 + тг)], скользящее окно (п<1) \¡h = f, А/,?, = 7г — у, скользящее окно (я > 1) A¡h = 1 — А/,/, = 1 — ^
Посредством асимптотического разложения второго порядка, получено асимптотическое смещение порядка О Для статистики Sд и нормированной статистики [Е(0х)]~2 х Зд
Утверждение 2: Асимптотическое смещение порядка О (^д) Для статистики равно
1 (+00 1 +00 , +0Q \
ьл = -^А^ X ^ + + -FXB £ А, + - £ Ф J
* \j=l J—-00 ;=-оо J=—оо /
Íln (1 + 7г), в случае расширяющегося окна 7г, в случае скользящего окна щ:, в случае полного окна
Утверждение 3. Асимптотическое смещение порядка О Для статистики [Е(0г)]~» х S\ равно
1 1 1 7Г / +0° \
bt„ = ^ - zññ^pY^ (^Е ^ + Х>J
Здесь ф, = Е {(/, - Е/() hl,} В§', <р, = F,BE {hth't_}} В§'.
Поскольку Xfh 6 (0,2), Xhh £ (0,2), наибольшая разница в смещении при использовании скользящего, расширяющегося и полного окна наблюдений достигается за счет параметра ЛьШ8, который минимален в случае полного окна наблюдений и максимален в случае скользящего окна наблюдений Следовательно, при больших значениях параметра тг асимптотическое смещение, получаемое при помощи скользящего окна, максимально, а минимально при использовании полного окна наблюдений
В параграфе 1.4 приведены результаты численных экспериментов, иллюстрирующих полученные аналитические результаты Рассматривается модель yt = ßyt-i+St, в которой ошибки предполагаются независимыми и одинаково распределенными величинами, st ~ N (0, аПараметр of = 1 предполагается известным (например, исходя из другой выборки наблюдений), а ß = 1/2 оценивается методом наименьших квадратов (МНК) Данная модель повторяет модель численного эксперимента, приведенного в работе [4] Рассматриваются три теста со следующими нулевыми гипотезами
Н0 = Н0 Е el = al Н0 . Е = О
Для каждой нулевой гипотезы тестируются три альтернативы - что значение Еft не равно, больше либо меньше своего теоретического значения
Качество асимптотической аппроксимации определяется путем сравнения фактической значимости тестов, полученной при помощи 100000 испытаний Монте-Карло, с теоретическим значением, равным 5% и 2 5% для тестов с двусторонней и односторонней альтернативной гипотезой
Результаты численных экспериментов для разных типов тестов имеют одинаковые качественные особенности При отсутствии поправки на смещение bt,{ несоответствие между теоретической и фактической значимостью тестов с двусторонней альтернативой максимально при использовании скользящего окна наблюдений, при этом данное несоответствие тем больше, чем больше отношение Р/R Это служит подтверждением выводов, полученных из аналитической формулы (1) При учете смещения bt st в тестировании гипотез, теоретическая значимость очень точно соответствует фактической значимости тестов с двусторонней альтернативой, независимо от типа выбираемого окна и значения отношения P/R Выводы относительно точности односторонних тестов повторяют выводы для двусторонних тестов за тем исключением, что их точность оказывается еще более зависимой от смещенности распределения
Выборочная плотность распределения статистики, оценивающей качество прогнозов, для тестов с тремя указанными выше нулевыми гипотезами приведена на рисунке 1 По рисунку видно, что учет смещения второго по-
нулевой уровень (среднее асимптотики 1го порядка)
-смещение 2го порядка (полученное в работе)
----- выОорочное среднее
Рис 1. Выборочная плотность статистики, оценивающей качество прогнозов, в случае скользящего окна, Я = 30, Р = 170
рядка необходим для более точного тестирования гипотез в случае скользящего окна наблюдений
В целом, согласно результатам экспериментов, учет полученного в работе смещения второго порядка почти полностью объясняет причину неудовлетворительного качества асимптотической аппроксимации распределения статистики £д при использовании скользящего окна, о котором упоминалось в работе [4]
В параграфе 1.5 приводятся заключительные замечания о полученных результатах, далее следует приложение, в котором приведены формулировки и доказательства технических лемм, использованых для получения результатов параграфа 1 3
Во второй главе диссертации предлагается идея взвешенного учета прогнозов при получении точечной оценки величины Щ{хиУи&) В параграфе 2.1 дается краткое введение, а в параграфе 2 2 дается постановка
задачи, совпадающая с постановкой задачи в первой главе за исключением того, что метод оценки параметра в не специфицируется Известно лишь, что параметр в оценивается, используя расширяющееся окно наблюдений, что делает прогнозы в различные моменты времени неравнозначными - прогнозы в более поздние моменты времени являются более точными, чем в более ранние моменты времени, поскольку в них параметр в оценивается по большему числу наблюдений В связи с этим, предлагается вместо статистики использовать неравномерное усреднение прогнозов
т т
ЕДу,х,6)ы ^ Щ-яЦуьХьвь), ^
Весовые коэффициенты предлагается находить из условия
Е (ЕГ=й+1 Щ-яНуь хи вь) - Е¡{у, х, в)) пип,
ЕГ=д+1 = 1
(2)
Утверждение 4: Решением задачи (2) является следующий вектор из весовых коэффициентов
где вектор е = (1,1, , 1)' 6 Кр, а матрица А состоит из следующих элементов
оу = Е { / (у1+д, х,+д, 0,+д) х]+п, в3+ц) - Е¡{у, х, в)) | (4)
Поскольку в выражении для матрицы А присутствуют математические ожидания от статистик, расчет которых требует знания неизвестного случайного процесса, генерировавшего случайную выборку 21,22, ,гт, то для практического расчета весовых коэффициентов предлагается использовать приближение данного случаного процесса посредством располагаемой выборки, используя процедуру бутстрапа
В параграфе 2.3 дается описание методик бутстрапа, примененных в численном эксперименте Для выборок из независимых наблюдений использовался классический алгоритм бутстрапа (случайная выборка из наблюдений 2ь 22, гт с возвращением) для генерации множественных псевдовыборок, по которым производилось усреднение в формуле (4) Для выборок из зависимых наблюдений использовались следующие шесть методов бутстрапа 1-бутстрап с перекрывающимися блоками, 2-бутстрап с неперекрывающимися блоками, 3-бустрап с блоками случайной длины, 4-параметрический бутстрап, 5-бутстрап Холецкого, 6-бутстрап марковской цепи Для методов бутстрапа, зависящих от параметра, приведена процедура для его наилучшего определения
В параграфе 2.4 приведены описания и результаты численных экспериментов Рассматривается следующая модель3.
Vt = Pо + PiXt + £(, А) = А = 0, £{ ~ jV(0, 1),
Л/"(0, crf), с вероятностью р
(5)
^ {^(0, сг|), с вероятностью 1—р xt и серийно и взаимно независимы
Ставится задача получения точечной оценки величины E/f = Ее2 Для определения истинных весов по формуле (3) производился расчет матрицы А методом Монте-Карло - усреднением по 500000 выборок, сгенерированных истинным случайным процессом (посредством модели (5)) Расчетные веса находились также по формуле (3), где матрица А была получена усреднением по 1000 бутстраповским псевдовыборокам Для того, чтобы получить общее представление о работе метода в среднем, указанная процедура повторялась для 500 выборок, сгенерированных истинным случайным процессом На рисунке 3 показаны средние значения (плюс/минус их стандартные отклонения) весовых коэффициентов при iî = 10, Т = 40, сг3 = 1, сг2 = Ю и различных значениях р, а на рисунке 4 - при R = 10, Т = 40, ui = 1, р — 0 9 и различных значениях Ог По рисункам видно, что более ранние прогнозы учитываются с меньшим весом, и диапазон изменения весов для модели (5) очень высокий, что подтверждает гипотезу о неравнозначности прогнозов в различные моменты времени На рисунке 3 различие между истинными весами и расчетными увеличивается с ростом р Это объясняется тем, что с ростом р уменьшается вероятность наблюдений Xi ~ ЛДО,^) и метод бутстрапа по меньшему числу таких наблюдений хуже восстанавливает исходное распределение
---равные веса
-------истинные веса
-расчетные веса
расчетные веса плюс/минус их стандартные отклонения
Рис 2 Условные обозначения для рисунков 3 и 4
На таблице 1 и 2 изображены средние оценки ожидаемого квадрата ошибки прогноза, полученные различными методами, а также средние квадраты отклонения оценки от точного значения а\ = 1 По таблицам видно, что взвешивающий метод обеспечивает в среднем более близкие значения оцен-
3В случае использования нормально распределенных регрессоров в модели (5), выигрыш от применения метода взвешенного учета прогнозов оказался небольшим, по сравнению со статистикой
Рис. 3. Весовые коэффициенты при R = 10, Т = 40, = 1,02 = Ю и р = 0.7 (в); р = 0.8 {б); р = 0.9 (е); р = 0.95 (г).
ки к оцениваемому параметру, и ожидаемый квадрат отклонения оценки от а\ ниже.
Таблица 1.
Оценка квадрата ошибки прогноза/ожидаемого квадрата отклонения оценки от = 1 при Т = 40, К = 10, с 1 = 1, сг2 = 10 и различных значениях р
Тип взвешивания р = 0.7 р = 0.8 . р = 0.9 р= 0.95
Равные веса 1.194/0.382 1.254/0.495 . 1.271/0.541 1.288/0.732
Истинные веса 1.112/0.127 1.141/0.166 1.253/0.171 1.310/0.202
Расчетные веса 1.114/0.132 1.164/0.246 1.176/0.282 1.206/0.376
Таблица 2.
Оценка квадрата ошибки прогноза/ожидаемого квадрата отклонения оценки от = 1 при Г = 40, Я= 10, о"! = 1, р = 0.9 и различных значениях <т2
Гил взвешивания а2 = 10 <72 = 30 (Т2 = 50
Равные веса 1.271/0.541 1.952/10.556 3.740/154.238
Истинные веса 1.253/0.171 1.693/0.931 3.128/4.083
Расчетные веса 1.176/0.282 1.414/8.010 1.648/13.018
Рис. 4. Весовые коэффициенты при R = 10, Т = 40, <?\ = 1, р = 0.9 и <72 = 30 (а); 0*2 = 50 {б).
Предлагающийся метод взвешенного учета прогнозов также был протестирован на временных рядах, генерировавшихся ARMA моделью, подо-■браннной согласно байесовскому информационному критерию по располагаемой выборке наблюдений. Ниже приведены источники данных и соответствующие им ARMA модели.
1) Ежемесячные изменения ставок по облигациям правительства Канады:
yt = 0.896yt-i - 0.801yt_2 - 0.648st_i + 1.040et-2 + 0.271st_4 + et.
2) Изменение средних за месяц ставок по кредитам в Перу:.yt = 0,321j/t-i+et.
3) Ежемесячные изменения доли финансовых организаций в ВВП Бразилии:
й = 0.262й_х + е« + 0.138е4_6.
Согласно результатам теста Жарке-Берра, ошибки et в первой модели можно было считать нормальными, а во второй и третьей - нет. Применение метода взвешенного учета наблюдений во втором и третьем случаях привело к более существенному увеличению точности оценок, по сравнению со статистикой S\, чем в первом случае. Как и в случае независимых наблюдений, это обусловлено отклонением распределения данных от нормального распределения.
На таблицах 5 и 6 приведены средние оценки величины ft = различными методами и ожидаемые квадраты отклонений этих оценок от своего истинного значения (MSPE) для случаев изменений ставок по кредитам в Перу и доли финансовых организаций в ВВП Бразилии. Из таблиц видно, что, судя по смещенности оценок и, особенно, по ожидаемому квадрату ошибки оценивания, метод взвешенного учета прогнозов дает существенно более точные оценки, чем статистика 5д.
Результаты расчетов не приведены для методов бутстрапа 1 и 2, для которых точность расчетов весовых коэффициентов оказалась существенно зависящей от нестационарности генерируемых данными методами псев-
довыборок Остальные методы генеруруют стационарные псевдовыборки, и результаты их применения отличаются несущественно
Таблица 6
Оценка квадрата ошибки прогноза при Т — 40, Я — 10, а* = 0 498
Название метода Среднее значение MSPE
Равномерное взвешивание 0 651 0127
Истинное взвешивание 0 635 0 100
Взвешивание (метод 3) 0 651 0 122
Взвешивание (метод 4) 0 649 0115
Взвешивание (метод 5) 0 643 0 105
Взвешивание (метод 6) 0 642 0119
Таблица 5
Оценка квадрата ошибки прогноза при Т = 40, Я = 10, а'\ = 0 0697
Название метода Среднее значение MSPE
Равномерное взвешивание 0 202 0185
Истинное взвешивание 0 157 0 082
Взвешивание (метод 3) 0 181 0 047
Взвешивание (метод 4) 0 182 0 060
Взвешивание (метод 5) 0 185 0 167
Взвешивание (метод 6) 0 185 0 058
Третья и четвертые главы диссертации посвящены развитию нового метода (взвешивающего метода) построения устойчивых прогнозов по выборке наблюдений, подверженной структурным сдвигам Идея метода заключается в учете наблюдений каждого структурного режима со своим весом при оценке параметров модели Сами же весовые коэффициенты предлагается находить из условия минимизации ожидаемого квадрата ошибки прогноза модели В третьей главе взвешивающий метод разрабатывается при достаточно ограничительных предположениях-для случая модели линейной регрессии, оцениваемой МНК, с независимыми ошибками и экзогенными ре-грессорами4 Используя асимптотическое приближение, показано, что взвешивающий метод дает более точные прогнозы, чем метод выбора длины окна, предложенный в статье [11], решающий аналогичную задачу при аналогичных предположениях Данный результат подтверждается результатами приводимого в конце главы численного эксперимента В четвертой главе взвешивающий метод обобщается на случай статистической модели общего вида, оцениваемой методом экстремального оценивания (включающем МНК как частный случай)
В параграфе 4.1 обосновывается актуальность темы В параграфе 4.2 дается постановка задачи Рассматривается выборка наблюдений ¿1, ¿2, . гп, где каждое наблюдение делится на вектор регрессоров и зависимую
4Экзогенность регрессоров - предположение о том, что совокупность регрессоров и совокупность ошибок в выборке независимы
переменную = (ж(,2л)Т, я« £ ®1хс1, Уг £ которые удовлетворяют модели у1 = д (хи в£) + £и XI ~ -Рц, £г ~ Ег( = О
Вектор неизвестных параметров модели вь € Крх1 удовлетворяет условию экстремального оценивания, в* — а^тахи6е Е [ф и)]
В выборке имеется т структурных сдвигов в известные моменты 71,72, тт, в которые может изменяться значение вектора в, а также распределение регрессоров и ошибок
¿ = 1,2, п = = е + = =
< = п + 1.П + 2, т2 = = е + = =
4 = тт_1 + 1,тт_1 + 2, т,„ = = в + = 2^ = 25™,
¿ = тт + 1,тт + 2, п = = = =
Используются следующие обозначения
Оператор Е&, К, = 1,2, т +1, обозначает математическое ожидание в соответствии с вероятностным пространством, порожденным моделью в структурном режиме к = д {хи в к) + х1 ~ 2^, £ ~ 2?*, £ обозначает область значений дх = ^д? = дт+1 =
фг (и) = ф (Л, и) , 1к = {т>_1 + 1, 71-1 + 2, Г* } ,
То = о, тт+1 — п, ат+1 - 1, Д0т+х = О
Як = Е* {ФЧ (в*)} , í € 4, Б* = Е^Г-оо Е* {ф' вк) [ф' ,
Р = + «292*32 + +0!т+1?т+1(Зт+1, В = -Р-1,
Б = -В^^Е: + о|д2Е2 + + а^дтБт + дт+1Ет+1)5, Ь=-ВЪ, Ь = а1д1(51Д6'1+а2д2(52А^2+ + ат?т<ЭтД0т
Делаются следующие предположения
1 В вышеприведенных условных обозначениях математические ожидания существуют, а матрицы невырождены.
2 Функция ф (г, и) трижды дифференцируема по второму аргументу при иеб.гег
3 Е {|ф (г, и)| х (г, и)| > К}} —► 0 равномерно относительно и € в при К —> 0 (1[ ] - индикаторная функция)
4 Решение максимизационной задачи 9к = а^тах^вЕ* (г«,«)] существует и единственно при к = 1,2, т+ 1
5 9 - компактное множество
6 Случайный процесс , порождающий выборку 22, г», является строго стационарным и эргодическим
7 Существует такая измеримая функция Б (г), что Е£> (г) < оо, и при í = 1,2, выполнено условие
зпр вирвирЫи)!, 1М(и)},|, Ш«)},,,,«'(«)},
8 Выполнено условие сильного перемешивания
sup {|Р (А, В) - Р (А) Р(В) |} < а
AGFlx,BeF££
где с\ - некоторая константа, F%=a {za, za+1, ¿¡,; £а, еа+\, £;,} 9. Существуют такие константы сг и сз, что
E|$|2+i < с2 <оо, Е|е(|2+<* < с3 <оо, J>0,i = l,2, ,
где Ф = vec{l, Фь Ф2, , Фт+1>, Ф^ = vec{#(0*)> - Qk)}, г € Ik
10 Для параметров ш и <5 из предположений 8 и 9 выполнено условие
__ ш5 3 7_ 2+7 > 2
11 Существует производная д'^ (ж, и) при и € О, причем найдется такая функция Gi (), что supu€01д" (хп+\, и)\ < G2 On+i)
12 Для Vu € 9 £^Em+1 {еп+1Вф'п+1_} («)} < сю
13 Случайные величины xt и et независимы при каждом i
14 Существует математическое ожидание E{£n+ivec[(g>f=^]} < оо
Для получения последующих результатов используется асимптотическое приближение, при котором, с ростом выборки, доли структурных режимов ji,общем объеме~выборки gi,Q2, qm+1 остаются постоянными, а величины " структурных сдвигов ^ убывают
В параграфе 4.3 дается описание взвешивающего оценивания
1
= arg max — u€0 п
teil »s^m «e/rn+i
(6)
При сделанных предположениях исследуются асимптотические свойства взвешивающей оценки
Утверждение 5: Имеют место следующие асимптотические свойства взвешивающей оценки при различных значениях параметра 5
ns(6 -в) Ль, при 6 € (0,
- в) Л М (Ъ,Ц , при 5 = 5, (7)
у/аф-9) Л Л/" (о, Б) , при 5 G +оо)
Утверждение 6: При 5 Е (5, справедлив следующий асимптотический переход
т/а (§ - 8 --^bj 4л/"(0,£) (8)
В параграфе 4.4, исходя из условия минимизации ожидаемого квадрата ошибки прогноза = Е уп+\ - д ^¡Гп+ь6^ определяющее оптимальные весовые коэффициенты
выводится условие,
Утверждение 7: При <5 е (§, §] и вероятности структурного сдвига в момент п+1 порядка 0(1/п25) (или меньше), задача минимизации ожидаемого квадрата ошибки прогноза эквивалентна следующей задаче
+00
п1-^ (хп+ъ в)Ь]2 - 2д'в [хп+ъ В) {еп+хф'п+1_3 (0)} +
.7=1
+д'в{хп+ъв)?,д'в(хп+1,9)т -> ш (9)
Если дополнительно Е{£п+1|г1, гг гп} = 0, то задача (9) упрощается
п1-251д'в(хп+1,е)Ь}2 + де(хп+1,в)Ядв(хп+1,в)тшш (10)
От
В конце четвертого параграфа выписываются задачи (9) и (10) для модели линейной регрессии yt = x'tвt + Ег, оцениваемой МНК В случае единственного структурного сдвига при (¿г = €¿2, в задаче (10) находится аналитическое выражение для оптимального весового коэффициента
Хп+1
~-------------------
+ <фп+1Е {х^} 1 хп+1 Таким образом, применение взвешиващего метода состоит из трех этапов
1 Найти оптимальные весовые коэффициенты, решив задачу (9)
2 Найти взвешивающую оценку (6)
3 Построить прогноз уп+1 = д(хп+1, (?)
В параграфе 4 5 приводятся результаты численного эксперимента, подтверждающего преимущества предложенного метода по сравнению со стандартными подходами Оценивается следующая модель векторной авторегрессии методом наименьших квадратов
Г у(+1 = а + Ьх1 + суг + £(+1 \ Х1+1 = с1 + ех1 + т}1+1
Нижний индекс у параметров модели векторной авторегрессии будет обозначать номер структурного режима, которому эта переменная соответствует Значения по умолчанию для величин а, Ь, с, <1, е полагались равными нулю, а значения для &2е и ац полагались равными единице, если не указано обратного, 6 = (1/2+ 1/3)/2 (выбор параметра 5 € не оказывал
существенного влияния на результаты статистических испытаний) Прогнозирование производилось для значений регрессоров хп = уп = 1 Выбор других значений по умолчанию не оказывает качественного влияния на полученные результаты Для расчета точности прогнозирования, для каждой точки осуществлялось 10000 статистических испытаний Расчеты корня из ожидаемого квадрата ошибки прогноза приведены на рисунке 6 для случая одного сдвига, и на рисунке 7 - для случая двух сдвигов Обозначения для рисунков 6-7 приведены на рисунке 5
-МНК по всем наблюдениям
-----МНК по наблюдениям последнего структурного режима
——— Взвешивающий метод (предложенный в работе)
Рис 5 Обозначения для рисунков 6-7
Случай одного структурного сдвига. Полагаем везде, где не указано обратного, что т-у = 100, п = 150 Рассматриваются следующие численные эксперименты
1 а2е = 5, a2 = t, te [-2 5,2 5], 2 a2s = 1, с2 = t, t £ [-0 95,0 95], 3 o-25 = 5, a2 = b2 = t, te [-2,2], 4 <т2г = 1, a2 = c2 = t, te [-0 4,0 4],
5 <r2e = 5, c2 = t, ct2£ = 1-0 2t, t e [-0 05,0 8],
6 a2t = 1, b2 = t, c2 = -í, te [-0 95,0 95],
7 <r2s = 5, c2 = 0 5, ti = t, t e [10,11, 130];
8 ст2£г = 5, a2 ~ —0 2, £>2 — 0 4, ti = í, te [10,11, ,130]
Случай двух структурных сдвигов. Полагаем везде, где не указано обратного, что т\ — 40, т2 = 80, п = 100 Рассматриваются следующие численные эксперименты
1 а2 = t, а3 = -t, t е [-0 6,0 6], 2 с2 = t, с3 = -í, t 6 [-0 6; 0 6], 3 = 21, а2 — t, te [-0 6,0 6], 4 Í>1 = 2 í, b2 = t, te [-0 6,0 6], 5 ci = 2 í, c2 = t, te [-0 45,0 45], 6 b2 = t, te [-1 4,1 4], 7 62 = 1, r2 = t, te [50,51, 90], 8 b2 = 1 2, a2, = t, t e [0 3,3 3]
Расчеты корня из ожидаемого квадрата ошибки прогноза приведены на рисунке 7. Из рисунков 6-7 можно заключить, что предложенный метод дает в среднем более устойчивые прогнозы к величине структурных сдвигов, чем методы МНК, примененные ко всем наблюдениям или только к наблюдениям последнего структурного режима В случае двух структурных сдвигов взвешивающий метод превосходит МНК, примененный к наблюдениям последнего структурного режима, по средней точности прогнозов при всех значениях рассмотренных величин структурных сдвигов
В заключении диссертации приведены основные выводы исследования
Рис 6 Корень из ожидаемого квадрата ошибки прогноза (ось У) в зависимости от величины сдвига Ь (ось X) Эксперименты для случая одного структурного сдвига
Рис 7 Корень из ожидаемого квадрата ошибки прогноза (ось У) в зависимости от величины сдвига 2 (ось X) Эксперименты для случая двух структурных сдвигов
Основные результаты:
1 Получено асимптотическое распределение статистики 5д, оценивающей качество прогнозов, для случая полного окна наблюдений
2 Для статистики S^ найдено асимптотическое смещение второго порядка, учет которого позволяет существенно повысить точность асимптотической аппроксимации распределения статистики в случае скользящего окна наблюдений
3 Предложен новый метод получения точечной оценки качества прогнозов, основанный, в отличие от общепринятой статистики на неравномерном усреднении прогнозов в различные моменты времени Получаемые в результате применения метода весовые коэффициенты позволяют судить о степени неравнозначности прогнозов при расчете их качества
4 Предложен новый метод устойчивого прогнозирования при наличии структурных сдвигов, основанный на взвешенном учете наблюдений из различных структурных режимов
5 Преимущество полученных в работе методов и подходов подтверждено результатами сравнительных численных экспериментов
Основные результаты диссертации опубликованы в следующих работах автора:
1 Китов В В Выбор оптимальных весов при оценке качества прогнозов модели // Тезисы выступления на XXI научной конференции Российской экономической школы Май 2007
2 Китов В В Новые методы прогнозирования при наличии структурных сдвигов и оценки качества прогнозов // Труды 12й всероссийской школы-семинара Современные проблемы математического моделирования 2007 стр 109-116
3 Китов В В Метод взвешенного учета ошибок для оценки качества прогнозов // Вестник МГУ 2008 Том 32, N1, стр 56-63
4 Китов В В Тестирование метода взвешенной оценки прогнозов на временных рядах // Кибернетика и системный анализ 2008 Том 44, N1, стр 148-158
5 Китов В В, Метод взвешенного учета наблюдений для прогнозирования при наличии структурных сдвигов // Математическое моделирование 2008 Том 20, N3, стр 29-47
6 Anatolyev S А , Kitov V V. Using all observations when forecasting under structural breaks // Finnish Economic Papers 2007 Том 20, N2, стр, 166176
7 Оценка качества прогнозов и прогнозирование при наличии структурных сдвигов // Тезисы выступления на конференции Ломоносов-2008, секция Математика и механика Апрель 2008 ISBN 978-5-91579-003-1, стр 2122
Другие работы автора
1 Китов В В Построение оптимальной инвестиционной стратегии при наличии фиксированных и пропорциональных издержек // Труды 28-ой конференции механико-математического факультета МГУ 2006 стр 7983
2 Китов В В Оптимальное управление инвестициями в актив со случайной доходностью при трагоакционных издержках // Математическое моделирование 2007 Том 19, N5, стр 45-58
Список литературы
1 Clements М Р. 2005. Evaluating Econometric Forecasts of Economic and Fmancia Variables Palgrave Macmillan New York
2 Diebold F X , Mariano R S 1995 Comparing Predictive Accuracy Journal of Business к Economic Statistics 13(3), 253-263
3 West К D 1996 Asymptotic Inference About Predictive Ability Econometrica 64(5), 1067-1084
4 West К D , McCracken M V 1998 Regression-based Tests of Predictive Ability International Economic Review 39(4), 817-40
5 Joumi J , Boutahar M 2005 Evidence on Structural Breaks in U S Time Series Economic Modelling 22(3), 391-422
6 Layton, Allan P, Valadkham, Abbas, Pahlavani, Mosayeb 2005 Multiple structural breaks in Australia's macroeconomic data an application of the Lumsdame and Papell Test International Journal of Applied Econometrics and Quantitative Studies, 2(3), 31-44
7 Manski С F 1988 Analog Estimation Methods in Econometrics NY Chapman&Hall
8 Meese R A , Rogoff К 1983 Empirical Exchange Rate Models of the Seventies Do They Fit Out of Sample ? Journal of International Economics, 14 (February, 1-2), 3-24
9 Pesaran M H , Timmermann A 2004 How costly is it to ignore breaks when forecasting the direction of a time series International Journal of Forecasting, 20(3), 411-425
10 Pesaran M H , Timmermann A 2002 Market timing and return prediction under model instability Journal of Empirical Finance 9(5), 495-510
11 Pesaran M H , Timmermann A 2007 Selection of estimation window in the presence of breaks. Journal of Econometrics, 137(1), 134-161
Напечатано с готового оригинал-макета
Издательство ООО "МАКС Пресс" Лицензия ИД N00510 от 01 12 99 г Подписано к печати 20 Об 2008 г Формат 60x90 1/16 Услпечл 1,75 Тираж 70 экз Заказ 341 Тел 939-3890 Тел./факс 939-3891 119992, ГСП-2, Москва, Ленинские горы, МГУ им М В Ломоносова, 2-й учебный корпус, 627 к
Оглавление автор диссертации — кандидата физико-математических наук Китов, Виктор Владимирович
1 Смещение второго порядка статистики, оценивающей качество прогнозов
1.1 Введение.
1.2 Постановка задачи.
1.3 Смещение второго порядка статистики оценки качества прогнозов.
1.4 Статистические испытания.
Введение 2008 год, диссертация по информатике, вычислительной технике и управлению, Китов, Виктор Владимирович
2.2 Описание метода.43
2.3 Используемые методы бутстрапа.44
2.4 Статистические испытания на независимых наблюдениях 49
2.4.1 Регрессия (нормальное распределение регрессоров) 49
2.4.2 Регрессия (нестандартное распределение регрессоров) .51
2.5 Статистические испытания на временных рядах.59
2.5.1 Процентные ставки по канадским облигациям . . 59
2.5.2 Ставка по кредитам в Перу.64
2.5.3 Доля кредитов финансовых организаций в ВВП Бразилии.67
2.6 Заключение.69
3 Взвешивающий метод прогнозирования при наличии структурных сдвигов порядка 0{ 1). 71
PL.
3.1 Введение.71
3.2 Метод взвешенного учета наблюдений.72
3.3 Свойства взвешивающего метода.74
3.3.1 Смещение и дисперсия.74
3.3.2 Сравнение ожидаемых квадратов ошибки прогноза 75
3.4 Определение оптимальных весов.76
3.4.1 Оптимизационный подход - несколько структурных сдвигов.76
3.4.2 Оптимизационный подход-один структурный сдвиг 77
3.4.3 Метод перекрестной проверки .77
3.5 Статистические испытания.78
3.6 Заключение.87
4 Обобщение взвешивающего метода прогнозирования при наличии структурных сдвигов порядка 0{~s). 94
4.1 Введение.94
4.2 Постановка задачи.96
4.3 Описание взвешивающего метода.100
4.4 Определение весовых коэффициентов.101
4.5 Статистические испытания.104
4.5.1 Случай одного структурного сдвига.105
4.5.2 Случай двух структурных сдвигов.106
4.6 Заключение.110
Ключевые слова: прогнозирование, оценка качества прогнозов, оценка свойств прогнозов, сравнение моделей, оценка параметров, асимптотика второго порядка, смещение второго порядка, проверка гипотез, неравномерное усреднение, бутстрап, структурный сдвиг, ожидаемый квадрат ошибки прогноза, метод перекрестной проверки.
К/
Введение. Краткий обзор диссертационной работы
Диссертационная работа посвящена разработке и исследованию методов математического моделирования в случае, когда у исследователя нет возможности проводить контролируемый эксперимент, и вся информация содержится в располагаемой конечной выборке наблюдений. Исследование касается вопросов оценки качества прогнозов моделей общего вида, а также повышению точности прогнозов модели линейной регрессии в случае присутствия в выборке структурных сдвигов.
Первая и вторая части работы посвящены задаче оценки качества прогнозов модели. Данная задача возникает при выборе модели, наиболее точно описывающей данные (путем оценивания ожидаемого квадрата ошибки прогноза или корреляции между прогнозом величины и ее фактической реализацией), при исследовании свойств ошибок прогноза (например, можно ли считать, что ошибки имеют нулевое математическое ожидание), а также при исследовании вопросов возможности улучшения точности прогнозов (например, за счет тестирования гипотезы о наличии корреляции между ошибками прогноза или между ошибками прогноза одной модели и прогнозами другой модели). Указанная задача решается в многочисленных эмпирических работах, например в [25, 34, 35, 27, 26, 13], однако во многих случаях при анализе данных модель, качество прогнозов которой исследуется, содержит неизвестные параметры, которые оцениваются по той же выборке, что и прогнозы рассматриваемой модели. Оценка параметров в общем случае влияет на качество прогнозов, делая их менее точными, что отражается на точечной оценке качества прогнозов и на ее распределении, делая стандартные асимптотические выводы несостоятельными. В случае, когда неизвестные параметры модели оцениваются по всем предыдущим наблюдениям в выборке до момента прогноза, прогнозы также становятся неравнозначными между собой - более ранние прогнозы являются менее точными по сравнению с более поздними. В работах [36] и [37] выводится корректное асимптотическое распределение статистики, оценивающей качество прогнозов, которое учитывает влияние оценки параметров модели на распределение статистики. Методика оценки параметров в этих работах охватывает стандартные методы оценивания, включающие метод наименьших квадратов, метод максимального правдоподобия и метод моментов. В работах рассматриваются случаи, когда неизвестные параметры модели на каждом этапе прогнозирования оцениваются либо по всем предыдущим наблюдениям, либо по фиксированному числу предшествующих наблюдений. Статистические испытания, приводимые авторами, свидетельствуют о том, что томность асимптотической аппроксимации распределения статистики, оценивающей качество прогнозов, существенно ухудшается при оценивании неизвестных параметров по фиксированному числу наблюдений, предшествующих моменту прогноза, в случае, если число этих наблюдений невелико по сравнению с общим объемом выборки.
В первой части диссертационной работы рассматривается асимптотическое разложение второго порядка статистики, оценивающей качество прогнозов, в случае оценивания неизвестных параметров модели методом экстремального оценивания, который включает в себя нелинейный метод наименьших квадратов, метод максимального правдоподобия и метод моментов как частные случаи. В работе доказано, что статистика оценки качества прогнозов имеет смещение второго порядка, которое не учитывается в асимптотическом распределении, полученном в работах [36] и [37]. Данное смещение имеет сомножитель, не принимающий больших значений в случае, когда оценивание неизвестных параметров производится по всем предшествующим наблюдениям, по в случае оценки по фиксированному числу предыдущих наблюдений данный коэффициент равен отношению числа наблюдений, по которым производится усреднение прогнозов, к числу наблюдений, по которым оцениваются неизвестные параметры модели. Следовательно, в случае, когда это отношение велико, статистика оказывается существенно смещенной, что и объясняет неудовлетворительную точность асимптотической аппроксимации в статистических испытаниях работы [37]. Приводимые статистические испытания в первой части диссертации свидетельствуют о том, что корректировка статистики на найденное смещение позволяет значительно повысить точность асимптотической аппроксимации в указанном случае. В других случаях оценивания неизвестных параметров модели учет найденного смещения также повышает точность асимптотической аппроксимации, но данное улучшение невелико. Также в первой части диссертации получено асимптотическое распределение статистики, оценивающей качество прогнозов в случае, когда неизвестные параметры модели рассчитываются в каждый момент прогноза по всем располагаемым наблюдениям в выборке.
Во второй части диссертационной работы предлагается новый метод получения оценки качества прогнозов модели общего вида, который учитывает неравнозначность прогнозов в случае, когда расчет неизвестных параметров модели производится по всем наблюдениям, предшествующим моменту прогноза. При этом сам метод оценивания неизвестных параметров может быть любым. Стандартной практикой, использующейся, например, в работах [36, 37, 18] при получении оценки качества прогнозов, является усреднение по значениям прогнозов с равными весами. Предлагаемый во второй части диссертационной работы метод позволяет получить более точные оценки качества прогнозов за счет учета прогнозов с различными весами, поскольку в рассматриваемом контексте более ранние значения прогнозов, в которых параметры модели оцениваются по сравнительно небольшому числу наблюдений, являются менее надежными, чем более поздние значения прогнозов, при построении которых неизвестные параметры модели рассчитываются точнее по большему числу наблюдений. В работе находится условие, определяющее оптимальные весовые коэффициенты с точки зрения построения наиболее точной оценки качества прогнозов. Они оказываются зависимыми от некоторых неизвестных параметров случайного процесса, с помощью которого была получена исходная выборка. Поскольку данный случайный процесс неизвестен, для практического применения предлагается использовать процедуру бутстрапа для его аппроксимации. Точность предлагаемого метода сопоставляется со стандартным методом равнозначного учета прогнозов на выборке из независимых наблюдений и па временных рядах, описывающих реальные экономические процессы. Выясняется, что метод взвешенного учета наблюдений действительно дает более точную оценку качества прогноза, чем метод усреднения с равными весами, причем преимущество предлагаемого метода в некоторых ситуациях может быть очень существенным. Помимо этого, анализ получаемых весовых коэффициентов дает наглядное представление о степени неравнозначности прогнозов, что помогает при выборе оптимального момента, начиная с которого следует учитывать прогнозы в методе равномерного усреднения при тестировании гипотез.
В третьей части диссертационной работы рассматривается задача построения наиболее точных прогнозов в модели линейной регрессии, параметры которой подвержены резким изменениям (структурным сдвигам) в определенные моменты времени. Предполагается, что с ростом объема выборки структурные сдвиги имеют порядок 0(1). Структурные сдвиги модели отвечают реким изменениям в природе объектов, поведение которых описывает модель. Наличие структурных сдвигов находит свое отражение во многих эмпирических работах, таких как [21, 22]. Во многом, рштерес к тематике структурных сдвигов возник за счет появления статистических инструментов для их обнаружения в моделях линейной регрессии. В работе [12] предлагается тест на общую стабильность модели во времени, в [32, 15] тестируется наличие структурного сдвига в известный момент времени, в [33, 7, 8] тест обобщается на случай, когда момент структурного сдвига неизвестен. В работах [23, 9] рассматриваются тесты на наличие нескольких структурных сдвигов в неизвестные моменты времени. В [28, 38] рассмотрены тесты на выбор между наличием структурного сдвига в стационарной модели и наличием единичного корня в регрессии, когда момент структурного сдвига известен и неизвестен соответственно. Однако, несмотря на появление многочисленных тестов, рассчитанных на обнаружение структурных сдвигов в модели, не так много исследований было посвящено воздействию, которое оказывают структурные сдвиги на точность прогнозов. К числу таких исследований можно отнести [29], в котором рассматривается, как влияет величина и время структурного сдвига на точность прогнозов линейной регрессир!, а также [30], в котором предлагается двухшаговая процедура прогнозирования в модели линейной регрессии, которая является устойчивой к наличию структурных сдвигов. В работе [31] рассматривается новый метод прогнозирования, в котором наряду с наблюдениями после структурного сдвига предлагается использовать некоторое число наблюдений до структурного сдвига для нахождения параметров регрессии при составлении прогноза, что, делая прогноз смещенным, тем не менее снижает дисперсию ошибки оценивания регрессионного параметра и в целом повышает точность прогнозов. В третьей части диссертационной работы предлагается новый метод прогнозирования в модели линейной регрессии, устойчивый к наличию структурных сдвигов неизвестной величины в известные моменты времени. Данный метод, используя все наблюдения, располагаемые в выборке, учитывает наблюдения каждого структурного режима (набора наблюдений между структурными сдвигами) со своим весом, что обеспечивает устойчивость прогнозирования при наличии структурных сдвигов и повышает среднюю точность прогнозов по сравнению с методом наименьших квадратов, примененным ко всей выборке или только к наблюдениям последнего структурного режима. Также данный метод прогнозирования значимо превосходит по точности метод, предложенный в работе [31], что подтверждается асиптотическим приближением распределения ошибки прогноза и статистическими испытаниями.
В четвертой части диссертационной работы рассматривается обобщение взвешивающего метода прогнозирования, при наличии структурных сдвигов порядка 0(1/п5), где п - это размер выборки. Метод прогнозирования разрабатывается без явной спецификации модели прогнозирования и при предположении,- что вектор неизвестных параметров модели оценивается методом экстремального оценивания общего вида (включающем нелинейный метод наименьших квадратов, метод максимального правдоподобия и метод моментов). Допускается зависимость между ре-грессорами и ошибками модели. Такая постановка задачи делает предлагаемый метод применимым для широкого класса приложений. Исследуются асимптотические свойства оптимальных весовых коэффициентов метода при различных значениях параметра 5, и находится в аналитическом виде условие, определяющее оптимальные весовые коэффициенты. Приводятся статистические испытания, сравнивающие точность прогнозов предлагаемого метода и методов наименьших квадратов, примененных ко всей выборке и только к последнему структурному режиму.
Автор выражает благодарность профессору Российской экономической школы Анатольеву Станиславу Анатольевичу за помощь в выборе актуальных направлений научного исследования, содействие в поиске статей, а также за ценные советы и рекомендации.
Заключение диссертация на тему "Оценка качества прогнозов моделей и прогнозирование при наличии структурных сдвигов"
Общее заключение и основные выводы диссертационной работы
Общим результатом диссертационной работы является развитие новых методов математического моделирования в ситуации, когда отсутствует возможность производить контролируемый эксперимент, и вся доступная информация находится в ограниченной выборке наблюдений. Это включает в себя нижеперечисленные результаты.
В случае, когда требуется оценить качество прогнозов параметрической модели, неизвестные параметры которой находятся методом экстремального оценивания (включающем нелинейный метод наименьших квадратов, метод максимального провдоподобия и метод моментов как частные случаи), а прогнозы оцениваются по той же выборке, что и неизвестные параметры, были получены следующие результаты.
1. Найдено асимптотическое распределение статистики, оценивающей качество прогнозов, когда вектор неизвестных параметров оценивается на кажом шаге, используя все наблюдения выборки (полное окно наблюдений). Данная статистика позволяет тестировать те же гипотезы, что и статистика, оценивающая качество прогнозов, при расширяющемся и скользящем окне (когда вектор неизвестных параметров оценивается по всем наблюдениям, предшествующим моменту прогноза, и фиксированному числу наблюдений до момента прогноза соответственно), но предпочтительна на практике, поскольку ее распределение обладает меньшим асимптотическим смещением второго порядка, что делает асимптотическое приближение первого порядка более точным, по сравнению со случаями расширяющегося и скользящего окна.
2. Получено смещение второго порядка для статистики, оценивающей качество прогонзов, в случае, когда вектор неизвестных параметров оценивается, используя полное, расширяющееся и скользящее окно. Учет найденного смещения позволяет получать более точную асимптотическую аппроксимацию распределения статистики, оценивающей качество прогнозов, и строить более точные тесты, что было подтверждено численным экспериментом. Наибольшее улучшение асимптотической аппроксимации достигается в случае тестирования гипотез с односторонней альтернативой, а также в случае использования скользящего окна для оценки неизвестных параметров.
3. Предложен новый метод получения точечных оценок качества прогнозов параметрических моделей для случая расширяющегося окна наблюдений. Данный метод позволяет получать более точные оценки качества прогнозов и дает визуальное представление о степени неравнозначности наблюдений в связи с последовательной оценкой неизвестных параметров, что позволяет более обоснованно выбирать момент в выборке, начиная с которого будут строиться прогнозы для оценки их качества. Преимущества метода проиллюстрированы на временных рядах, описывающих реальные экономические процессы с использованием различных численных методов бутстрапа. Помимо метода экстремального оценивания, предложенная методика построения точечных оценок может быть применена и при других методах оценивания неизвестных параметров.
В случае, когда необходимо построить прогноз с помощью параметрической модели, параметры которой с течением времени подвержены структурным сдвигам, были получены следующие результаты.
1. Для случая линейной регрессии, строго экзогенных регрессоров и независимых ошибок предложен новый метод прогнозирования (взвешивающий метод), основанный на учете наблюдений из каждого структурного режима с некоторыми весами, определяемым из условия минимизации ожидаемого квадрата ошибки прогноза. Найдено асимптотическое распределение регрессионного параметра, полученного предлагаемым методом. Показано аналитически и в статистических испытаниях, что разработанный метод превосходит по точности последний из предлагавшихся методов прогнозирования при наличии структурных сдвигов - метод выбора длины окна. Предложены два подхода численной реализации нового метода - оптимизационный подход и подход, использующий перекрестную проверку. В статистических испытаниях два предложенных подхода сравнивались по точности вместе с методом выбора длины окна и методами наименьших квадратов, примененными ко всем наблюдениям и наблюдениям последнего структурного режима. Был получен вывод о том, что взвешивающий метод является эффективным методом устойчивого прогнозирования при наличии в выборке структурных сдвигов неизвестной величины - при структурных сдвигах большой величины метод дает точность похожую на точность МНК, примененного к последнему структурному режиму, а при структурных сдвигах малой величины метод в большей степени напоминает по точности МНК, использующий все наблюдения выборки. Оптимизационный подход реализации взвешивающего метода является менее требовательным к вычислительным ресурсам по сравнению с реализацией посредством перекрестной проверки, а потому является более предпочтительным в приложениях.
2. Предложенный метод прогнозирования при наличии структурных сдвигов обобщен на случай, когда параметрическая модель, описывающая данные, явно не специфицируется, а вектор неизвестных параметров оценивается посредством экстремального оценивания общего вида, и допускается зависимость между ошибками и регрессорами. Рассмотренная постановка задачи делает предлагаемый метод прогнозирования применимым для широкого класса практических приложений. Для случая, когда ошибки модели не зависят от предыдущих ошибок и регрессоров, модель представляет линейную регрессию, а матрица вторых регрессионных моментов остается неизменной, получено аналитическое значение для оптимального взвешивающего коэффициента в случае единственного структурного сдвига. С ростом выборки получены выводы об асимптотическом поведении оптимальных взвешивающих коэффициентов при различной скорости стремления величин структурных сдвигов к нулю. В статистических испытаниях был получен вывод о том, что обобщенный взвешивающий метод представляет эффективный метод устой-чивовго прогнозирования при наличии в выборке структурных сдвигов неизвестной величины. При одном структурном сдвиге точность метода в среднем лежит между значениями точности методов наименьших квадратов, примененных ко всем наблюдениям и наблюдениям только последнего структурного режима, при различных структурных сдвигах напоминая больше тот метод, который обеспечивает большую точность. При двух структурных сдвигах взвешивающий метод оказывается более гибким и строго доминирует по средней точности метод наименьших квадратов, примененный к наблюдениям последнего структурного режима.
Список работ автора по теме диссертации
1. Китов В.В. Выбор оптимальных весов при оценке качества прогнозов модели. // Тезисы выступления на XXI научной конференции Российской экономической школы. Май 2007.
2. Китов В.В. Новые методы прогнозирования при наличии структурных сдвигов и оценки качества прогнозов. // Труды 12й всероссийской школы-семинара Современные проблемы математического моделирования. 2007. стр.109-116.
3. Китов В.В. Метод взвешенного учета ошибок для оценки качества прогнозов. // Вестник МГУ. 2008. Том 32, N1, стр.56-63.
4. Китов В.В. Тестирование метода взвешенной оценки прогнозов на временных рядях. // Кибернетика и системный анализ. 2008. Том 44, N1, стр. 148-158.
5. Китов В.В. Метод взвешенного учета наблюдений для прогнозирования при наличии структурных сдвигов. // Математическое моделирование. 2008. Том 20, N3, стр. 29-47.
6. Anatolyev S.A., Kitov V.V. Using all observations when forecasting under structural breaks. // Finnish Economic Papers. 2007. Том 20, N2, стр. 166-176.
7. Оценка качества прогнозов и прогнозирование при наличии структурных сдвигов. // Тезисы выступления на конференции Ломоносов-2008, секция Математика и механика. Апрель 2008. ISBN 978-5-91579-003-1, стр. 21-22.
Доклады автора на конференциях по теме диссертации
1. Выбор оптимальных весов при оценке качества прогнозов модели. // XXI научная конференция Российской экономической школы. Май 2007.
2. Новые методы прогнозирования при наличии структурных сдвигов и оценки качества прогнозов. // XII всероссийская школа-семинар Современные проблемы математического моделирования. 2007.
3. Оценка качества прогнозов и прогнозирование при наличии структурных сдвигов. // Конференция Ломоносов-2008, секция Вычислительная математика и кибернетика.
4. Оценка качества прогнозов и прогнозирование при наличии структурных сдвигов. // Конференция молодых ученых механикоматематического факультета МГУ им.Ломоносова, (секция Математика и механика конференции Ломоносов-2008). Доклад занял призовое место.
Результаты диссертации также докладывались на семинаре Анализ и моделирование финансовых рынков кафедры системного анализа факультета ВМиК МГУ им.Ломоносова.
Другие работы автора
1. Китов В.В. Построение оптимальной инвестиционной стратегии при наличии фиксированных и пропорциональных издержек. // Труды 28-ой конференции механико-математического факультета МГУ. 2006. стр 79-83.
2. Китов В.В. Оптимальное управление инвестициями в актив со случайной доходностью при транзакционных издержках. // Математическое моделирование. 2007. Том 19, N5, стр.45-58.
Библиография Китов, Виктор Владимирович, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Анатольев С.А. 2002. Эконометрика для продолжающих. Российская экономическая школа. Москва.
2. Анатольев С.А. 2003. Эконометрика для подготовленных. Российская экономическая школа. Москва.
3. Ибрагимов И.А., Линник Ю.В. 1965. Независимые и стационарно связанные величины. Наука. Ленинград.
4. Китов В.В., 2008. Метод взвешенного учета 'наблюдений для прогнозирования при наличии структурных сдвигов. Математическое моделирование 20(3), 2947.
5. Anatolyev S., Vasnev А. 1999. Markov chain approximation in bootstrapping autoregressions. Economics Bulletin 3(19),1-8.
6. Anatolyev S.A., Kitov V.V., 2007. Using all observations when forecasting using structural breaks. Finnish Economic Papers 20(2), 166-176.
7. Andrews D.W.K., 1993. Tests for parameter instability and structural change with unknown changepoint. Econometrica 61(4), 821-856.
8. Andrews D.W.K., Ploberger W. 1994. Optimal tests when a nuisance parameter is present only under the alternative. Econometrica 62(6), 1383-1414.
9. Bai J., Perron P. 1998. Estimating and testing linear models with multiple structural changes. Econometrica 66(1), 47-78.
10. Berkowitz J., Kilian L. 1996. Recent Developments in Bootstrapping Time Series. Finance and Economics Discussion Series from Board of Governors of the Federal Reserve System (U.S.) N.96-45. http://ideas.repec.Org/p/fip/fedgfe/96-4-5.html.
11. Berkowitz J., Birgean I., Kilian L. 1999. On the Finite-Sample Accuracy of Nonparametric Resampling Algorithms for Economic Time Series. Advances in Econometrics. 14, 77-107. http://ideas.repec.Org/p/fth/michet/99-01.html.
12. Brown R.L., Durbin J., Evans J.M. 1975. Techniques for testing the constancy of regression relationships over time. Journal of the Royal Statistical Society, Series B, 37(2), 149-192.
13. Diebold F.X., Rudebush G.D. 1991. Forecasting Output with the Composite Leading Index: A Real-Time Analysis. Journal of the American Statistical Association, 86(415), 603-610.
14. Diebold F.X., Mariano R.S. 1995. Comparing Predictive Accuracy. Journal of Business & Economic Statistics 13(3), 253-263.
15. Chow G., 1960. Tests of equality between sets of coefficients in two linear regressions. Econometrica 28(3), 591-605.
16. Chu C.S., Hornik K., Kuan C.M. 1995a. MOSUM tests for parameter constancy. Biometrica 82(3), 603-617.
17. Chu C.S., Hornik K., Kuan C.M. 1995b. The moving-estimates test for parameter stability. Econometric Theory 11(4), 699-720.
18. Clements M.P. 2005. Evaluating Econometric Forecasts of Economic and Financial Variables. Palgrave Macmillan. New York.
19. Frances P.H., Dijk V.D. 2000. Nonlinear Time Series Models in Empirical Finance. Cambridge University Press. Cambridge.
20. Friedman J., Hastie Т., Tibshirani R. 2001. The Elements of Statistical Learning. Springer. New York.
21. Manski C.F. 1988. Analog Estimation Methods in Econometrics. NY: Chapman&Hall.
22. Meese R.A., Rogoff K. 1983. Empirical Exchange Rate Models of the Seventies: Do They Fit Out of Sample? Journal of International Economics, 14 (February, 1-2), 3-24.
23. Meese R.A., Rogoff К. 1988. What Is Real? The Exchange Rate-Interest Rate Differential Over the Modern Floating Rate Period. Journal of Finance, 43(4), 933-948.
24. Nelson C.R. 1972. The prediction perfomance of the FRB-MIT-PENN Model of the U.S. Economy. American Economic Review, 62(5), 902-917.
25. Perron P. 1989. The great crash, the oil-price shock, and the unit root hypothesis. Econometrica 57(6), 1361-1401.
26. Pesaran M.H., Timmermann A. 2004. How costly is it to ignore breaks when forecasting the direction of a time series. International Journal of Forecasting, 20(3), 411-425.
27. Pesaran M.H., Timmermann A. 2002- Market timing and return prediction under model instability. Journal of Empirical Finance 9(5), 495-510.
28. Pesaran M.H., Timmermann A. 2007. Selection of estimation window in the presence of breaks. Journal of Econometrics, 137(1), 134-161.
29. Quandt R.E. 1958. The esimation of parameters of a linear regression system obeying two separate regimes. Journal of the American Statistical Association 53(284), 873-880.
30. Quandt R.E., 1960. Tests of the hypothesis that a linear regression obeys two separate regimes. Journal of the American Statistical Association 55(290), 324
31. Stock J.H., Watson M.W. 1993. A Procedure for Predicting Recessions with Leading Indicators: Econometric Issues and Recent Experience. Business Cycles, Indicators and Forecasting Chicago: University of Chicago Press, 95-153.
32. West K.D., Cho D. 1994. The Predictive Ability of Several Models of Exchange Rate Volatility. Journal of Econometrics, 69(2), 367-391.
33. West K.D. 1996. Asymptotic Inference About Predictive Ability. Econometrica 64(5), 1067-1084.
34. West K.D., McCracken M.V. 1998. Regression-based Tests of Predictive Ability. International Economic Review 39(4), 817-40. (http://www. nber. org/papers/t0226).
35. Zivot E., Andrews D.W.K. 1992. Further evidence on the great crash, the oil-price shock, and the unit-root hypothesis. Journal of Business and Economic Statistics330.10(3), 251-270.
-
Похожие работы
- Разработка методов оценки и прогнозирования способности льняных тканей к сдвигу нитей
- Задачи прогнозирования в управлении объектами социальных систем
- Информационная модель прогнозирования случайных процессов с позиции активного восприятия
- Модели и методы автоматизации мониторинга и оперативного прогноза численности занятых в промышленности
- Методы и средства анализа и планирования электропотребления энергообъединений и энергосистем
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность