Задача определения гарантированных уровней при прогнозировании

Замураев, Константин Александрович

Системный анализ, управление и обработка информации (по отраслям)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Задача определения гарантированных уровней при прогнозировании

кандидата физико-математических наук: Замураев, Константин Александрович
город: Санкт-Петербург
год: 2014
специальность ВАК РФ: 05.13.01
цена: 450 рублей

Диссертация по информатике, вычислительной технике и управлению на тему «Задача определения гарантированных уровней при прогнозировании»

Автореферат диссертации по теме "Задача определения гарантированных уровней при прогнозировании"

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

ЗАДАЧА ОПРЕДЕЛЕНИЯ ГАРАНТИРОВАННЫХ УРОВНЕЙ ПРИ ПРОГНОЗИРОВАНИИ

05.13.01 — Системный анализ, управление и обработка информации (по прикладной математике и процессам управления)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

1 з ФЕБ 2014

Санкт-Петербург 2014

005545119

Работа выполнена на кафедре моделирования экономических систем факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета.

Научный руководитель: доктор физико-математических наук, профессор

Прасолов Александр Витальевич

Официальный оппоненты: доктор физико-математических наук, ведущий

научный сотрудник, Кулик Борис Александрович (ФГБУН Институт проблем машиноведения РАН)

кандидат физико-математических наук, доцент, Королев Алексей Васильевич (Санкт-

Петербургский филиал ФГАОУ ВПО «Национальный исследовательский университет «Высшая школа экономики»)

Ведущая организация: ФГБОУ ВПО «Пермский государственный

национальный исследовательский университет»

Защита состоится 26 февраля 2014 г. в 17 часов 30 минут на заседании диссертационного совета Д.212.232.50 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук при Санкт-Петербургском государственном университете по адресу: 199178, Санкт-Петербург, 10 линия В.О., д. 33-35, факультет географии и геоэкологии, ауд. 74.

С диссертацией можно ознакомиться в Научной библиотеке имени М. Горького Санкт-Петербургского государственного университета по адресу: 199034, Санкт-Петербург, Университетская наб., 7/9. Автореферат размещен на сайте www.spbu.ru.

Автореферат разослан «55» 51 и Ио^СХ 2014 г.

Ученый секретарь диссертационного совета,

доктор физ.-мат. наук, профессор Курбатова Г. И.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Во многих технических, биологических и экономических задачах, в которых осуществляется работа с временными рядами, характеризующими случайные процессы, часто возникает необходимость в построении долгосрочных прогнозов.

В настоящее'время прогноз и обработка информации принимает всё более сложные формы, которые зависят от большего количества параметров и факторов. Это приводит к необходимости учета нестационарности в моделях случайных процессов. В результате могут увеличиться ошибки и дисперсия получаемого долгосрочного прогноза.

Поэтому представляется перспективным определение некоторых характеристик временных рядов данных, задающих случайные процессы. Эти характеристики способствуют более точному и разностороннему прогнозированию, а также эффективному управлению процессом.

С такими задачами, например, можно встретиться на практике:

1. При определении «гарантированной на 75% уровне» цены нефти для формирования бюджета Российской Федерации на год или более;

2. При оценивании предельных уровней цен на основное производственное сырье в текстильной промышленности;

3. При расчете различных уровней развития экономических показателей государственными органами экономического регулирования Российской Федерации и ее субъектов, с целью предупреждения развития экономики по негативному сценарию.

Приведенные выше задачи можно математически обобщить.

Обозначим за xt, t = 0Д,...,Т — 1 известные значения скалярного временного ряда. Необходимо определить некоторое значение А такое, что xt > А (или для некоторых задач xt < А) с вероятностью Q на будущем интервале времени, то есть для t = Т, ...,Т + L.

Искомый уровень А можно считать своеобразным «гарантированным уровнем» прогноза при экстраполяции ряда в будущее. Этот уровень зависит от заданной вероятности Q.

Определение 1. Для скалярного временного ряда xt, являющегося конечной реализацией стохастического процесса, гарантированным уровнем прогноза назовем такое значение А, для которого с вероятностью Q прогнозируемые значения временного ряда равны или могут превосходить его в будущем.

Существует большое число различных подходов и алгоритмов прогнозирования временных рядов, с помощью которых можно построить гарантированные уровни исходных временных рядов. Многие из этих методов основаны на регрессионном и авторегрессионом анализе. Большой вклад в эти области внесли зарубежные и отечественные исследователи: G.Box, H.Kramer, G.Jenkins, R.F.Engle, С.Granger, C.Sims, H.Akaike, T.Bollerslev, А.Н.Колмогоров,

Б.В.Гнеденко, A.B.Скороход, И.И.Елисеева, С.А.Айвазян, В.С.Мхитарян, А.И.Орлов, С.А.Анатольев, Ю.П.Лукашин и многие другие.

В основе методов указанного типа лежит идея подбора некоторой регрессионной или авторегрессионной функции, которая бы описывала поведение имеющихся данных с целью дальнейшего прогнозирования её на интересующий нас временной интервал.

К числу таких методов относятся методы, использующие парную линейную регрессию, авторегрессию, модели авторегрессии и распределенного лага (ADL), ARMA-модели, ARCH-модели, методологию Бокса-Дженкинса, модели Хольт, Уинтерса, Брауна и др. Однако их основной задачей является прогнозирование исходного ряда, а не его характеристик. Учитывая изложенное, разработка методов определения гарантированных уровней прогноза временных рядов актуальна.

Предметом исследования является задача долгосрочного прогнозирования характеристик случайных процессов по имеющейся реализации в виде конечных временных рядов.

Цель диссертационной работы заключается в разработке методов поиска гарантированных уровней стохастического процесса на будущих интервалах времени.

Ставятся задачи:

1. Исследовать возможные подходы к определению гарантированных уровней прогноза временных рядов.

2. Сформулировать метод определения гарантированных уровней прогноза, основанный на регрессионном анализе.

3. Сформулировать метод определения гарантированных уровней, который бы позволил на практике получать значения с меньшим, чем в предыдущем методе интервалом возможного разброса.

4. Решить с помощью предложенных методов реальные экономические задачи.

Научная новизна диссертации заключается в обосновании алгоритма метода определения гарантированных уровней прогноза, использующего регрессионный аппарат, а также в разработке нового метода, предполагающего первичную обработку данных, на практических примерах позволяющего получать значения с меньшим интервалом разброса случайных ошибок.

Теоретическая и практическая значимости. В работе рассматриваются способы прогнозирования случайных процессов по их реализациям в виде конечных временных рядов. Полученные результаты могут найти применение в различных областях науки и техники, в частности в экономике, где требуется определение характеристик процессов на будущих интервалах времени.

Примеры подобных задач приведены в диссертации, в частности, определены процентные уровни цен на хлопок и нефть марки Brent, также

рассмотрена проблема определения гарантированных уровней развития экономики Санкт-Петербурга с учетом влияния инвестиционного потока. В указанных и многих подобных задачах приведенные в работе методы позволяют упростить определение гарантированных уровней, а также уменьшить интервал разброса случайных ошибок.

Методы исследования. В диссертации используются аппараты прикладной математической статистики, эконометрики, анализа временных рядов.

Достоверность научных результатов обеспечивается строгостью доказательств, согласованностью с уже имеющимися результатами в данной и смежных областях.

Апробация работы. Результаты, представленные в диссертации, докладывались на ХЬ и ХЬШ международных научных конференциях аспирантов и студентов «Процессы управления и устойчивость» факультета ПМ-ПУ СПбГУ, международной научной конференции «Математика, экономика, менеджмент: 100 лет со дня рождения Л.В. Канторовича», IV международной научно-практической конференции «Государство и бизнес. Вопросы теории и практики: моделирование, менеджмент, финансы». А также на научных семинарах факультета прикладной математики - процессов управления Санкт-Петербургского государственного университета (кафедр Моделирования экономических систем, Математической теории игр и статистических решений), Санкт-Петербургского института информатики и автоматизации РАН, Института прикладных математических исследований Карельского научного центра РАН, кафедры информационных систем и математических методов в экономике экономического факультета Пермского государственного национального исследовательского университета, кафедры математического моделирования и эконометрии факультета экономики и финансов Государственного университета морского и речного флота имени адмирала С.О. Макарова.

Публикации. Материалы диссертации опубликованы в 4-х работах [1-4], из которых 2 [1,2] являются статьями в журналах, входящих в Перечень ведущих рецензируемых научных журналов и изданий ВАК.

Структура и объём работы. Диссертация изложена на 108 страницах, состоит из введения, трёх глав, заключения и списка литературы, включающего 86 наименования. Работа содержит 47 рисунков и 4 таблицы.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснованы актуальность и научная новизна диссертационной работы, сформулирована её цель, поставлены задачи.

При построении долгосрочного прогноза временного ряда, порожденного случайным процессом, важно определение не только самих прогнозируемых значений на интересующем нас временном интервале, но и некоторых вероятностных и статистических характеристик процесса.

Приведен ряд реальных экономических задач для которых в общем виде сформулирована математическая постановка, заключающаяся в оценке для скалярного временного ряда х(, £ = 0Д,...,Г — 1, некоторого значения А такого, что х( > А (или для некоторых задач х( < А) с вероятностью (} на будущем интервале для Ь = Т,...,Т + Ь.

Возможным решением данной проблемы является построение регрессионной зависимости х( = щ + £ь где объясняющая функция щ (далее - тренд) определяется из множества П по правилу минимизации дисперсий случайных ошибок -—^ тт.

Процедура определения тренда щ осуществляется с использованием метода наименьших квадратов, алгоритм которого предполагает работу с функцией суммы квадратов, для которой существует минимум.

Множество П, выбирается так, чтобы случайные ошибки £( были центрированы Е{ес) = 0. То есть, считаем, что случайные ошибки £( являются случайным процессом, стационарным в широком смысле.

Ясно, что тренд щ и гистограмма распределения остатков £с являются статистиками исходного ряда х(.

Таким образом, возникает задача определения этих двух функций (функция тренда, плотность распределения ошибок) в некотором функциональном пространстве по известным конечным реализациям.

В первой главе приведен обзор научной литературы основных направлений и методологий прогнозирования временных рядов, который показал целесообразность разработки методов определения гарантированных уровней, в том числе, с целью уменьшения интервала возможного разброса результатов.

В первой части второй главы в продолжение идеи использования средств регрессионного анализа, с целью оценки уровня А рассмотрены различные случаи вида распределения случайных ошибок £с и тренда щ.

Первым, приведен случай, когда параметр С интерпретируется, как непрерывное время. Для временного ряда х() Ь е [0, Т], для которого построена модель вида х( = щ + £(, и прогноз на интервале С £ [Т,Т + ¿], определяется уровень А: Х[ > А с вероятностью где щ - тренд некоторого вида, £,- — случайные ошибки с границами распределения £ [—с, с]: = 0.

Можно показать, что если множество, из которого выбирается функция тренда, содержит постоянную, то последнее равенство имеет место. Гистограмму остатков обозначим £(£(;), то есть это некоторое приближение плотности распределения £(. Для решения этой задачи формулируется и доказывается следующая теорема.

Теорема 1. Пусть в задаче с непрерывным временем известны непрерывная функция и плотность вероятности <У(£С) > 0, где £[ - случайные

ошибки. Тогда существует и единственен гарантированный уровень А с вероятностью Q, на интервале [Г; Т + L],

На практике временные ряды, характеризующие случайные процессы, дискретны, поэтому далее рассматриваются ситуации при дискретном времени.

Рассматривается дискретный временной ряд xt,t = ОД, ...,Т. Предполагается что для него построена модель вида xt = щ + et, и прогноз на интервале t = Т,Т + 1, ...,Т + L. Ставится задача в определении A: xt > А с вероятностью Q, на значениях t — Т,Т + 1, ...,Т + L. Здесь функция ut это тренд некоторого вида, et одинаково распределенные во времени случайные ошибки: E(et) — 0. Функция 5(£t) - это гистограмма оцененная по разностям xt — ut, то есть 5(ft) - некоторое приближение плотности распределения £с.

Для решения этой задачи сформулированы и доказаны следующие теоремы.

Теорема 2. В случае дискретного времени, при равномерном законе распределения случайных ошибок £te[—с; с] гарантированный (^-вероятный уровень А, задается в явном виде:

T+L

А = ^ щ + с — 2cLQ

t=T

на значениях времени t = Т, Т + 1,..., Т + L.

Теорема 3. В случае линейного тренда ut = at + b, дискретного времени, при равномерном законе распределения случайных ошибок £te[—c; с], уровень А, делящий с некоторой вероятностью Q множество реализаций временного

а2

ряда, задается в явном виде: А = а( 1 + L — LQ+T^ + b — с--(Г + 1) на

значениях времени t = Т,Т + 1,...,Т + L.

Далее рассмотрен вопрос существования гарантированного уровня в случае кусочно-постоянной плотности распределения.

Гистограммы, как правило, имеют кусочно-постоянный вид, и ими можно аппроксимировать другие виды распределения случайных величин. Для такого случая доказана следующая теорема.

Теорема 4. В случае кусочно-постоянной плотности распределения и некоторого тренда щ, всегда существует уровень А, делящий с некоторой вероятностью Q полосу распределения временного ряда в интервале t = Т,Т + 1.....T + L.

Сформулирован алгоритм оценки гарантированного уровня А при кусочно-постоянной плотности распределения.

Пусть имеется кусочно-постоянная плотность распределения вида: Sfe) = при ste[h^-T\h^-p]

где i — 1;т, hf+1T) - h? Г) = const, Vt = T,..:,T + L: Верхний индекс соответствует моменту времени.

Прогноз, построенный на интервале t = Т,Т + 1, ...,Т + L, представляется как последовательность вертикальных отрезков, каждый из которых есть область реализации движущейся по тренду ut случайной величины в момент t, с плотностью распределения S(st).

Каждый из отрезков соответствующих моменту t ограничен сверху и снизу функциями ut + с и ut — с соответственно.

Уровень А делит область распределения вероятности на две части с вероятностными «массами» QL (верхняя часть) и (1 — Q)L (нижняя часть).

1) Среди узлов вертикальных отрезков ищется минимальный.

В рассмотренном случае это узел (hТ + 12).

Через него проводится горизонтальный уровень А1 (xt — Аг — const).

Линия xt = Аг отсекает снизу область с вероятностной «массой» = 0.

Отсеченная «масса» сравнивается с (1 — Q)L. Так как < (1 — Q)L, то Аг не гарантированный уровень, следовательно, производим следующую итерацию.

2) Среди оставшихся узлов вертикальных отрезков выбирается следующий минимальный.

В рассмотренном случае это узел (h^; Т +

Через него проведем горизонтальную прямую Аг (xt = А2 — const).

Для учета вероятностной массы в «спорных» случаях, когда уровень пересекает какой-либо интервал принимается, что он отсекает снизу его половину. Интервалы Д( можно задать так, чтобы учет половины вероятностной массы «спорных интервалов» не давал бы большую ошибку при подсчете суммы отсеченных уровнем масс.

Линия xt — А2 отсекает снизу область с вероятностной «массой» S2 = у-

Отсеченная «масса» S2 сравнивается с (1 — Q)L. Так как S2 < (1 — Q)L, то Аг не гарантированный уровень, следовательно, производим следующую итерацию.

3) Среди оставшихся узлов вертикальных отрезков выбирается следующий минимальный.

Следующим узлом будет (/ij0); Т) (на одной линии с ним узел {h^-T + h)).

Через него проводим уровень Л3 (xt = А3 — const).

Линия xt — Л3 отсекает снизу область с вероятностной «массой» S3 = Ai + -j- < (1 — Q)L значит Аг не гарантированный уровень, следовательно, производим следующую итерацию.

4) Операции перебора последующих минимальных узлов и построения уровней xt = Ак — const, выполняются до тех пор, пока вероятностная «масса» Sk отсеченная уровнем станет не меньше (1 — Q)L, то есть Sk > (1 — Q)L.

Вероятностная масса Sk отсекаемая xt = Лг имеет вид:

«1 <*2 aL

i=1 i=1 i=1 где каждая из сумм соответствует дискретному моменту t=T,...,T + L и показывает вероятность, отсеченную уровнем Ак на вертикальном отрезке. (а1( ...,aL- могут принимать значения 1 ,...,т, кроме того, данные наборы разные при разных

Неравенства 5fc_х < (1 — Q~)L и Sk > (1 — Q)L говорят о том, что получена оценка искомого уровня А:

МАк- 1>Лк]

Таким образом, в первой части второй главы исследована возможность определения гарантированного уровня с применением регрессионного анализа.

Однако, при наличии большого объема данных разнообразие данных также становится большим.

В связи с этим трудно выбрать единую форму ut для всего ряда так, чтобы разброс ошибок был сравнительно небольшим. Кроме того, когда исследователя интересуют частные статистики, то нет необходимости принимать во внимание все свойства данных.

Во второй части второй главы предложен другой метод, позволяющий строить оценку гарантированного уровня ряда с меньшим интервалом возможного разброса.

Введены следующие определения.

Определение 2. Статистикой выборки одинаково распределенной случайной величины (xt}"=1 назовем некоторую функцию значений выборки /(*!,...,*„).

В диссертации предлагается заменить исходный временной ряд новым, состоящим из его статистик. Тогда оценка гарантированного уровня сводится к прогнозированию по тренду нового ряда. При этом новый ряд оказывается «сглаженным», то есть для него возможно построение регрессионной модели с ошибками, имеющими меньший разброс.

Приводится алгоритм этого метода.

Пусть имеются реализации случайной величины в виде временного ряда {xt}"=1. Необходимо определить некоторый ¿-процентный гарантированный

уровень на дискретном интервале времени I = п, п + 1,... ,п + к.

Начиная с первого элемента временного ряда,' будем; формировать интервалы Д; длиной к, то есть разобьем ряд на п—'к + 1 интервалов следующего вида:

Д1={*1. -,хк},'- ' Д2= {х2, ...,хк+1},

^п-к+1= {хп-к+1> —/Хп}.

Определение 3. г-ой порядковой статистикой выборки у1г •■■,ут, (1 < г < т), называется г-ый элемент У(г) выборки, получаемой после расположения элементов уг, ...,ут в - порядке ..возрастания: У(1) ^ - ^ Ум ^ - ^ У(т)-

Определение 4. Функцию, сопоставляющую, для некоторой выборки (У1< — >Ут) её ^-ую порядковую статистику (1 < й < тп), назовем функцией извлечения (¿-гарантированного уровня из выборки [у1, ...,ут} и обозначим:

6й(У1.....Ут)=У(ау ' - " 1

В каждом из интервалов Д1(..., Дм_,;+1 произведем операцию нахождения значения соответствующего (/-процентного уровня выборки, и обозначим

последовательно получаемые статистики как .

баС&п-к+г) = хп-к+1-'. ' ■

Принимается что, если с/ строго не соответствует какому-либо порядковому номеру элементов интервала, то в качестве него будет выбираться элемент с ближайшим к с/порядковым номером.

По найденному новому временному ряду х^, строится его

прогноз, причем используется тот же арсенал методов, который использовался в моделировании исходного ряда.

Для удобства принимается, что длина к интервалов Д;, соответствует длине временного отрезка, на котором необходимо построить прогноз гарантированного уровня, так как в данном случае построенный элемент х^ есть прогноз гарантированного уровня для временного ряда хг на отрезке [гг; п + /с].

Алгоритм метода первоначальной обработки данных предполагает извлечение в каждом из интервалов значений, имеющих с/-ый порядковый номер. Данная процедура аналогична получению порядковых статистик из выборки.

В третьей части второй главы приведены ' некоторые результаты, связанные со свойствами порядковых статистик. •

Рассматривается выборка реализаций центрированных вокруг нуля одинаково распределенных случайных величин х1,...,хп, для которых заданы функции и плотности распределения, а также первые моменты:

P(x) = P(xi), p(x) = p(xt), M(Xj) = 0, D(xt).

Используя указанные случайные величины, строятся порядковые статистики:

*(i) ^ ^ х(пу

Для полученных порядковых статистик функция плотности распределения будет иметь вид:

i=r

Для нормального стандартного и равномерного стандартного видов распределения дисперсия подярковых статистик D(X(r)) < D{x{).

В третьей главе решены задачи прогнозирования и управления с использованием предложенных методов.

Построены гарантированные уровни цен на хлопок на внутреннем рынке США, биржевой цены на нефть марки Brent и уровень финансового оборота организаций Санкт-Петербурга, как функцию инвестиционного потока.

В данных экспериментах были использованы официальные данные бюро экономического анализа США U.S. Bureau of Economic Analysis, агентства U.S. Energy Information Administration, территориального органа Федеральной службы государственной статистики по Санкт-Петербургу и Ленинградской области (Петростат).

Для всех практических задач получены результаты обоими методами. Проведено сравнение результатов, которое показало эффективность применения предложенных методов и подтвердило свойство сглаживания у метода подразумевающего первоначальную обработку данных.

Основные положения и результаты, выносимые на защиту.

1. Метод определения гарантированных уровней прогноза, основанный на применении регрессии и оценке гистограммы.

2. Метод определения гарантированных уровней прогноза, основанный на специальной первоначальной обработке исходной статистической информации.

3. Обоснование эффективности методов, подтвержденное результатами трех практических задач с реальными данными.

Тематика диссертации соответствует паспорту специальности 05.13.01 — системный анализ, управление и обработка информации (по прикладной математике и процессам управления).

Публикации автора по теме диссертации

Статьи в журналах, рекомендованных ВАК:

1. Замураев К. А., Прасолов A.B. Модель регулирования экономики Санкт-Петербурга за счет инвестиционного потока // Петрозаводск. Труды КарНЦ РАН. Сер. Математическое моделирование и информационные технологии. 2013. № 1.С. 38-46

2. Замураев К.А. Об управлении инвестиционным потоком в экономике Санкт-Петербурга// Финансы и бизнес. 2013. №1. С. 39-49.

Другие публикации:

3. Замураев К.А. О частных характеристиках временного ряда // Процессы управления и устойчивость: Труды 40-й международной научной конференции аспирантов и студентов / Под ред. Н. В. Смирнова, Г.Ш. Тамасяна. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2009. С. 596-602

4. Замураев К.А. Об управлении инвестиционным потоком в экономике Санкт-Петербурга // Процессы управления и устойчивость: Труды 43-й международной научной конференции аспирантов и студентов / Под ред. А. С. Ерёмина, Н. В. Смирнова. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2012. С. 494-500.

Подписано к печати 16.01.14. Формат60x84 V,. Бумага офсетная. Гарнитура Тайме. Печать цифровая. Печ. л. 1,00. _Тираж 100 экз. Заказ 5971._

Отпечатано в Отделе оперативной полиграфии химического факультета СПбГУ 198504, Санкт-Петербург, Старый Петергоф, Университетский пр., 26 Тел.: (812)428-4043, 428-6919

Текст работы Замураев, Константин Александрович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

На правах рукописи

04201456310 Замураев Константин Александрович

ЗАДАЧА ОПРЕДЕЛЕНИЯ ГАРАНТИРОВАННЫХ УРОВНЕЙ

ПРИ ПРОГНОЗИРОВАНИИ

05.13.01 - Системный анализ, управление и обработка информации (по прикладной математике и процессам управления)

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель доктор физико-математических наук, профессор А.В. Прасолов

Санкт-Петербург 2014

Оглавление

Введение............................................................................................................................................................3

1. Обзор методов прогнозирования, управления и сглаживания ... 9

2. Определение гарантированных уровней при прогнозировании 24

2.1 Метод оценки гарантированных уровней прогноза

с помощью регрессии..................................................................................................................24

2.2 Метод оценки гарантированных уровней прогноза с помощью предварительной обработки данных............................................40

2.3 Связь предварительной обработки данных с порядковыми статистиками........................................................................................................................43

3. Практическая реализация методов определения гарантированных уровней....................................................................................................49

3.1 Определение гарантированных уровней цены на хлопок .. 49

3.2 Определение гарантированных уровней цены на нефть ... 62

3.3 Использование методов определения гарантированных уровней в управлении развитием экономики

Санкт-Петербурга..........................................................................................................................83

Заключение......................................................................................................................................................99

Литература......................................................................................................................................................101

ВВЕДЕНИЕ

Во многих технических, биологических и экономических задачах, в которых осуществляется работа с временными рядами, характеризующими случайные процессы, часто возникает необходимость в построении долгосрочных прогнозов.

В настоящее время прогноз и обработка информации принимает всё более сложные формы, которые зависят от большего количества параметров и факторов. Это приводит к необходимости учета нестационарности в моделях случайных процессов. В результате могут увеличиться ошибки и дисперсия получаемого долгосрочного прогноза.

С такими задачами, например, можно встретиться на практике:

1. при определении «гарантированной на 75% уровне» минимальной цены нефти для формирования бюджета Российской Федерации на год или более;

2. при оценивании предельных уровней цен на основное производственное сырье в текстильной промышленности;

3. при расчете различных уровней развития экономических показателей государственными органами экономического регулирования Российской Федерации и её субъектов, с целью предупреждения развития экономики по негативному сценарию.

Приведенные выше задачи можно математически обобщить.

Обозначим за хи Ь = ОД,...,Г — 1 известные значения скалярного временного ряда. Необходимо определить некоторое значение А такое, что хг > А (или для некоторых задач хг < А) с вероятностью (} на будущем интервале времени, то есть для Ь = Г,..., Г + I.

Искомый уровень А можно считать своеобразным «гарантированным уровнем» прогноза при экстраполяции ряда в будущее. Этот уровень зависит от заданной вероятности

Определение 1. Для скалярного временного ряда хь, являющегося конечной реализацией стохастического процесса, гарантированным уровнем прогноза назовем такое значение А, для которого с вероятностью @ прогнозируемые значения временного ряда равны или могут превосходить его в будущем.

Существует большое число различных подходов и алгоритмов прогнозирования временных рядов, с помощью которых можно построить гарантированные уровни исходных временных рядов. Многие из этих методов основаны на регрессионном и авторегрессионом анализе. Большой вклад в эти области внесли зарубежные и отечественные исследователи: О.Вох, Н.Кгатег, ОЛепктБ, Я.Р.Еп§1е, С.Огаг^ег, С.Бкпз, Н.Акшке, Т.ВоИеЫеу,

A.Н.Колмогоров, Б.В.Гнеденко, А.В.Скороход, И.И.Елисеева, С.А.Айвазян,

B.С.Мхитарян, А.И.Орлов, С.А.Анатольев, Ю.П.Лукашин и многие другие.

К числу таких методов относятся методы, использующие парную линейную регрессию, авторегрессию, модели авторегрессии и распределенного лага (АОЬ), АЛМА-модели, АЯСН-модели, методологию

Бокса-Дженкинса, модели Хольта, Уинтерса, Брауна и другие. Однако их основной задачей является прогнозирование исходного ряда, а не его характеристик. Учитывая изложенное, разработка методов определения гарантированных уровней прогноза временных рядов, актуальна.

Предметом исследования данной диссертационной работы является задача долгосрочного прогнозирования характеристик случайных процессов по имеющейся реализации в виде конечных временных рядов. Цель диссертации заключается в разработке методов поиска гарантированных уровней стохастического процесса на будущих интервалах времени.

Таким образом, в диссертации ставятся следующие задачи:

1. Исследовать возможности определения уровней прогноза временных

рядов.

2. Сформулировать метод определения гарантированных уровней прогноза, использующий регрессионный аппарат.

3. Сформулировать альтернативный метод определения гарантированных уровней, который бы позволил на практике получать значения с меньшим разбросом.

4. Применить предлагаемые методы к реальным экономическим задачам с целью анализа получаемых результатов.

В работе рассматривается способы специального прогнозирования случайных процессов по их реализациям в виде конечных временных рядов. Полученные результаты могут найти применение в различных областях науки и техники, в частности и экономике, где требуется определения характеристик процессов на будущих интервалах времени.

Научная новизна диссертации заключается в обосновании алгоритмов

метода определения гарантированных уровней прогноза, использующего

регрессионный аппарат, а также в разработке нового метода предполагающего

первичную обработку данных, на практических примерах позволяющего получать значения с меньшим разбросом случайных ошибок.

Возможным решением данной проблемы является построение регрессионной зависимости хг = щ + еи где объясняющая функция щ (далее - тренд) определяется из множества О. по правилу минимизации дисперсий случайных ошибок О(^)-> тт.

Процедура определения объясняющей функции щ осуществляется с использованием метода наименьших квадратов, алгоритм которого предполагает работу с функцией суммы квадратов, для которой существует минимум.

Множество выбирается так, чтобы случайные ошибки ег были центрированы Е(е= 0. То есть, считаем, что случайные ошибки е1 являются случайным процессом, стационарным в широком смысле.

Ясно, что тренд щ и гистограмма распределения остатков ег являются статистиками исходного ряда

В диссертации решается задача определения гарантированного уровня скалярного временного ряда с использованием регрессии. Для этого формулируются и доказываются теоремы, позволяющие определить гарантированный уровень в явном виде или оценить гарантированный уровень в различных общих случаях.

Кроме того, предлагается метод определения уровня А, основанный на предварительной модификации исходного временного ряда.

Алгоритм данного метода предполагает выделение из исходного временного ряда случайных величин новый временной ряд статистик, обладающий выборочной и остаточной дисперсиями, по крайней мере, не превосходящими аналогичные дисперсии исходного ряда.

Данные характеристики представляются важными критериями качества получаемого результата при решении подобных задач, и часто служат сравнительной характеристикой используемых методов прогнозирования или управления.

В работе на нескольких частных случаях с использованием аппарата порядковых статистик обосновывается состоятельность предлагаемого нового метода.

Проводятся три реализации метода на практических примерах, с использованием реальных статистических данных. Первый эксперимент посвящен определению уровней цены на нефть марки Brent, ниже которых она не опустится с некоторой вероятностью. Второй - определению аналогичных уровней для цены на хлопок на внутреннем рынке США. Приведенные ценовые параметры выбраны потому, что их временные ряды имеют сложную структуру: цена на нефть характеризуется обилием факторов, влияющих на её динамику; цена на хлопок характеризуется наличием различных сезонных составляющих, то есть предлагаемый метод апробируется на достаточно сложных данных. В третьем примере рассматривается модель получения гарантированных уровней для оборота организаций и инвестиций в основной капитал с учетом идей выделения нижнего предела для оборота и верхнего для инвестиций. Для всех примеров, помимо построения прогноза, произведено построение полос возможного разброса и сравнение с аналогичными полосами исходных данных. Анализ моделирования в каждой из рассматриваемых практических задач показал

эффективность применения предлагаемого метода, в смысле снижения выборочной дисперсии получаемого гарантированного уровня.

Основные положения и результаты, выносимые на защиту:

3. Применимость методов, подтвержденная результатами трех практических задач с реальными данными.

Основные положения, представленные в диссертации, докладывались на ХЬ и ХЫП международных научных конференциях аспирантов и студентов «Процессы управления и устойчивость» факультета ПМ-ПУ СПбГУ, международной научной конференции «Математика, экономика, менеджмент: 100 лет со дня рождения Л.В. Канторовича», международной научно-практической конференции «Государство и бизнес. Вопросы теории и практики». А также на научных семинарах факультета ПМ-ПУ СПбГУ (кафедры Моделирования экономических систем, Математической теории игр и статистических решений, Компьютерного моделирования и многопроцессорных систем), Санкт-Петербургского института информатики и автоматизации РАН, Института прикладных математических исследований Карельского научного центра РАН, кафедры информационных систем и математических методов в экономике экономического факультета Пермского государственного национального исследовательского университета, кафедры математического моделирования и эконометрии факультета экономики и финансов Государственного университета морского и речного флота имени адмирала С.О. Макарова.

Глава 1

Обзор методов прогнозирования, управления и сглаживания

Задачи прогнозирования и управления различными параметрами и процессами являются одними из важнейших областей применения современной прикладной математической науки. Указанные направления исследования широко представлены в экономике, биологии, во многих областях физики и инженерии. Именно в них были достигнуты многие теоретические результаты эконометрики и математической статистики.

В основе прогнозирования динамики статистических параметров и рядов, лежит идея определения модели симулирующей поведение и тенденции развития исследуемого процесса.

Для подобных задач, одним из наиболее эффективных описательных приемов служит парная регрессия [9],[37],[69], задаваемая уравнением (1.1)

Уь = Р о + РгЩ + Ей 1 = Туп, (1-1)

и множественная регрессия [52], имеющая вид (1.2)

У1=Ро+Р1Хц + - + РкХк1 + £и 1 = Туп- (1-2)

В регрессионных моделях оценка коэффициентов уравнения чаще всего строится с помощью метода наименьших квадратов (МНК), который при удовлетворении условий Гаусс-Маркова (верна спецификация модели, детерминированность регрессора, несмещенность в среднем и постоянство

дисперсий ошибок, их некоррелированность) дает состоятельные и несмещенные оценки [4]-[55].

Правильность выбора объясняющих переменных можно определить по коэффициенту детерминации (множественной детерминации) или корреляции (множественной корреляции) [7],[22],[86]. Однако помимо практического обоснования причинно-следственных связей между исследуемыми временными рядами, их наличие можно определить тестом Грейнджера на причинность [67]. Выбор между моделями осуществляется информационными критериями, например тест Акаике [58].

Указанные условия, накладываемые на данные временных рядов с целью получения МНК-оценок, часто сложно проверить. В таких случаях идентифицировать коэффициенты уравнения регрессии можно методами максимального правдоподобия (ММП), инструментальных переменных (МИП) [31],[50] и другими.

С вычислительной точки зрения получение МНК-оценок на практике проще, нежели ММП или МИП оценки.

Кроме того, методы максимального правдоподобия и инструментальных переменных налагают на временной ряд также некоторые условия, которые при реализации экспериментов на реальных данных не всегда удовлетворяются.

Так, в методе максимального правдоподобия необходима информация о виде распределения исходных данных [28] или информация о распределении их случайных ошибок и их независимость. В практических примерах часто сложно определить вид распределения данных или ошибок, то есть гистограмму плотности распределения нельзя однозначно отнести к какому-либо классу, в таком случае, производятся ослабления требований

путем условного отнесения данных к какому-либо виду распределения. Отсюда оценки параметров уравнения регрессии функцией правдоподобия ¿(0), могут быть смещены [8].

В свою очередь, основой метода инструментальных переменных является выбор вспомогательных элементов 2, к примеру, для уравнения линейной регрессии в матричном виде они будут иметь следующую форму [54]:

У = Хр + £ (1

Х = 2П+У к ' ;

В (1.3) 2 - матрица инструментальных переменных (п х д), V - матрица ошибок (п х к), П - матрица, отражающая эффект влияния инструментальных переменных на эндогенные регрессоры, X - матрица объясняющих переменных (п х к), у - вектор наблюдений (п х 1), г - вектор случайных составляющих (к х 1), ¡3 - неизвестный вектор регрессионных параметров (к х 1).

При выборе инструментальных переменных, для построения эффективной оценки вектора /?, необходимо достижение условия не коррелированности 2 с £, то есть инструменты 2 не должны иметь прямого влияния на у (должны быть экзогенными). Данное требование при рассмотрении многих практических задач удовлетворить сложно. Несостоятельность и смещенность «слабых инструментов» часто может превосходить смещенность МНК-оценки, возникшую из-за несоблюдения условий Гаусс-Маркова [57].

Для сравнения полученных МНК и МИП оценок, а также для проверки экзогенности можно применять тест Дарбина-Ву-Хаусмана [72].

Помимо классов регрессионных моделей, при решении задач прогнозирования особый интерес представляет описание динамики процесса, для которого на текущее состояние линейно оказывают влияния предыдущие.

Для описания указанных процессов используют авторегрессионные модели АЯ(р) вида (1.5) [10], [34]

= (1.5)

1=1

модели использующие скользящее среднее МА^) (1.6) [21]

= (1-6)

Хг

;=о

а также смешанные типы, авторегрессии - скользящего среднего АЯМА(р,д) [18]

р я

1 = 1 ]=0

с = ^ «¿Х£_р + ^Г (1.7)

Для описания взаимодействия авторегрессионного параметра с другим эндогенным процессом таюке используют модели авторегрессии и распределенного лага АБЬ(р^) [38],[71],[85]

Ус

г ч

= ^ а1Уг-1 + ^ Р]Хгч + Ег. (1.8)

¿=1 ¿=0

Указанные выше модели применяются к стационарным (в широком смысле) временным рядам, то есть для которых верно постоянство среднего значения, и неизменность во времени выборочных дисперсий и автокорреляций [3]. Проверку стационарности можно осуществить тестом Дики-Фуллера на наличие единичных корней [19],[64]. Кроме того, для

определения наличия трендовой или сезонной составляющих, являющиеся признаками нестационарности ряда, возможно проведение визуального исследования графика автокорреляц

Похожие работы

Информатика, вычислительная техника и управление
05.13.00