автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Устойчивость в статистическом прогнозировании временных рядов
Автореферат диссертации по теме "Устойчивость в статистическом прогнозировании временных рядов"
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
УДК 519.283:619.25
Фурса Руслан Анатольевич
УСТОЙЧИВОСТЬ В СТАТИСТИЧЕСКОМ ПРОГНОЗИРОВАНИИ ВРЕМЕННЫХ РЯДОВ
05.13.16 — Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук
Минск
— 1998
Работа выполнена на кафедре математического моделирования и анализа данных Белорусского государственного университета
Научный руководитель: доктор физико-математических наук,
профессор ХАРИН Ю.С.
Официальные оппоненты: доктор физико-математических наук,
профессор МЕДВЕДЕВ Г.А.
доктор технических наук, профессор МУХА B.C.
Оппонирующая организация: Институт математики Национальной
академии наук Беларуси
Защита состоится "АГ" •м-ъЯ 1998г. в '"^асов на заседании совета по защите диссертаций Д02.01.14 Белорусского государственного университета по адресу: 220050, г.Минск, пр.Ф.Скорины, 4, ауд. 206.
С диссертацией можно ознакомиться в библиотеке Белорусского государственного университета.
Автореферат разослан " 6 " ci-npc^is. 1998г.
Ученый секретарь совета по защите диссертаций, профессор
О.М. Тихоненко
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы диссертации. Одним из важнейших направлений в прикладной математике является прогнозирование некоторых показателей динамических явлений на основапии имеющихся в распоряжении исследователя экспериментальных статистических данных, представляющих временной ряд. Статистическое прогнозирование временных рядов широко применяется как в системах автоматизации научных исследований, так и при построении компьютерных систем поддержки принятия решений в таких областях пауки, как физика, экономика, социология, медицина и т. д. В связи с многообразием областей применения имеется множество научных работ, посвященных этому направлению. Однако большинство разработанных к настоящему времени методов статистического прогнозирования временных рядов предъявляют достаточно "жесткие" требования как к моделям, по которым строятся прогнозы, так и к собранным данным: гауссовость случайных ошибок наблюдений, независимость наблюдений, постоянство математического ожидания и дисперсии случайных ошибок, точное знаете параметрического семейства моделей, отсутствие "выбросов" и т.д.
В практических приложениях часто возникают ситуации, когда имеют место искажения гипотетических моделей (см., например: Айвазян С.Д., Ершов Л.А., Краснснкср В.М., Хьюбер П., Хампе.ть Ф., Раусеу П., Смоляк С.А., Тмтарепко Б.П., Харин Ю.С.), т.е. собранные данные не удовлетворяют некоторым гипотетическим модельным условиям, налагаемым на них известными методами прогнозирования. Причинами могут служить малый объем выборки, ошибки при сборе и обработке данных и др. В таких случаях оказывается, что методы статистического прогнозирования, обеспечивающие оптимальный прогноз (минимизирующий риск прогнозирования) в предположении выполнения всех модельных условий относительно собранпых данных, дают неточный, а иногда и абсолютно неверный прогноз при появлении некоторых искажений гипотетической модели.
Поэтому важное значение приобретает как оценивание устойчивости традиционно используемых методов прогнозирования временных рядов к определенным типам искажений, что особенно важно в процессе принятия решений о направлении научных исследований, так и разработка более точных и надежных, чем гипотетические, моделей временных рядов с искажениями а построение на их основе новых робастных методов прогнозирования, устойчивых к искажениям. Исследования в этих направлениях пользуются в настоящее время наибольшим спросом в таких важных областях практических приложений, как автоматизация банковской деятельности, создание систем экологического мониторинга, систем оценки эффективности экономических инструментов управления, что отмечено Российским государственным высшим аттестационным комитетом при анализе тематики диссертаций по специальности 05.13.16 (см. Бюллетень ГВАК РФ, 1998, №1, С.28). Для разработки систем автоматизации научных исследований важны также работы в области синтеза алгоритмов и программных процедур, реализующих робастяые методы прогнозирования временных рядов на ЭВМ.
Связь работы с крупными научными программами, темами. Исследования проводи лись в рамках госбюджетных научных тем "Исследование проблем устойчивости и опти маяьности в теории статистического прогнозирования (1991-1996гг.)" № государственно} регистрации 19941201 по приказу Минобразования. "Разработка методов и алгоритмо! робастного (устойчивого) статистического анализа многомерных и динамических данны? при наличии функциональных искажений (1996-2000гг.)" № государственной регистрации 19963454 по Государственной программе фундаментальных исследований РБ "Алгоритм", госбюджетной НИР "Разработать систему проблемно-ориентированных паке тов прикладных программ в области статистического анализа и моделирования (19961998гг.)" № государственной регистрации 19972532 (по ГНТП "Информатика") я хоздоговора с концерном "Белхимнефтепром'1 'Разработка экономико-математических моделей и создание программного обеспечения для прогнозирования показателей химической отрасли (1995-1996гг.)" № 30891.
Цель и задачи исследования. Целью диссертационной работы является анализ устойчивости традиционно используемых методов прогнозирования временных рядов и анализ характеристик традиционно используемых критериев обнаружения искажений при наличии "выбросов" и функциональных искажений тренда, синтез новых робастных методов прогнозирования временных рядов и критериев обнаружения искажений, а также разработка алгоритмов и программных процедур, реализующих эти методы на ЭВМ. В связи с этим необходимо решить следующие задачи:
• получить точные выражения или асимптотические разложения для количественных характеристик устойчивости к "выбросам" и функциональным искажениям тренда традиционно используемых методов статистического прогнозирования временных рядов;
■ разработать новые методы прогнозирования временных рядов, робастные к "выбросам" и функциональным искажениям тренда;
• получить точные выражения для вычисления критических уровней искажений, гарантирующих заданный уровень точности методов статистического прогнозирования временных рядов при наличии "выбросов" и функциональных искажений тренда;
• получить аналитические выражения для характеристик точности традиционно используемых критериев обнаружения "выбросов" во временных рядах;
• разработать новые критерии обнаружения "выбросов" во временных рядах;
• разработать алгоритмы и создать программное обеспечение, реализующее методы статистического прогнозирования и критерии обнаружения "выбросов" для временных рядов.
Научная новизна полученных результатов.
1. Впервые проведен анализ устойчивости к "выбросам" методов прогнозирования с использованием оценки по методу наименьших квадратов (МНК) и робастной оценки Хьюбера для временных рядов с трендом: аналитически и с помощью вычислительных экспериментов.
2. Аналитически и с помощью вычислительных экспериментов получены новые опенки устойчивости среднеквадратического риска к функциональным искажениям тренда временного ряда для метода прогнозирования с использованием оценки МНК.
3. Для авторегрессионных временных рядов впервые решены задачи анализа устойчивости к "выбросам" метода, прогнозирования в случае известных параметров, метода прогнозирования в случае неточно заданных параметров и метода прогнозирования с использованием оценки МНК.
4. Разработан новый локально-медианный метод прогнозирования временных рядов с трендом, проведен аналитический анализ его устойчивости к "выбросам"; с помошью вычислительных экспериментов произведено сравнение этого метода с известными методами прогнозирования по величине риска.
5. Проведен анализ точности критерия Льюнга. обнаружения "выбросов" для временных рядов с трендом; предложен повый итерационный локально-медианный критерий обнаружения "выбросов" для временных рядов с трендом, произведено сравнение этого критерия с критерием Льюнга с точки зрения точности обнаружения "выбросов" с помощью вычислительных экспериментов.
6. Разработаны алгоритмы, реализующие в ТШП "СТАТПРО" вышеперечисленные методы прогнозирования и критерии обнаружения искажений, а также оценена их вычислительная сложность.
Практическая значимость полученпых результатов. Полученные теоретические результаты могут быть использованы в практических задачах прогнозирования по реальным данным при выборе исследователем метода прогнозирования в условиях искажений гипотетической модели данных. Разработанные алгоритмы включены в пакет прикладных программ "СТАТПРО" (СТАТистическое ПРОгнозирование), разработанный в 1997 году в НИЛ статистического анализа и моделирования в рамках НИР "Разработать систему проблемно-ориентированных пакетов прикладных программ в области статистического анализа и моделирования" (номер госрегистрации договора 19972532) по Государственной научно-технической программе "Информатика".
Экономическая значимость полученных результатов. Разработанный в НИЛ статистического анализа и моделирования пакет прикладных программ "СТАТПРО", в состав которого включены результаты диссертационной работы, может рассматриваться как коммерческий продукт, на который имеется спрос в организациях, занимающихся обработкой
результатов научных исследований, а также, в экономических, финансовых, банковских, экологических и других учреждениях.
Основные положения диссертации, выносимые на защиту.
1. Точные выражения и асимптотические разложения для количественных характеристик устойчивости к " выбросам" методов прогнозирования с использованием одеяки МНК и оценки Хьюбера для временных рядов с трендом.
2. Точные выражения для количественных характеристик устойчивости к функциональным искажениям тренда метода прогнозирования с использованием оценки МНК для временных рядов с трендом.
3. Точные выражения и асимптотические разложения для количественных характеристик устойчивости к "выбросам" метода прогнозирования в случае известных параметров, метода прогнозирования в случае неточно заданных параметров я метода прогнозирования с использованием оценки МНК для авторегрессионных временных рядов.
4. Новый локально-медианный метод прогнозирования временных рядов с трендом.
5. Оценки точности критерия Льюяга и нового локально-медианного критерия обнаружения "выбросов" для временных рядов с трендом.
Личный вклад соискателя. Основные результаты, приведенные в диссертации, получены автором самостоятельно. Соавторам в совместных работах принадлежат предметные постановки задач и выбор направления исследований.
Апробация результатов диссертации. Основные результаты диссертации докладывались и обсуждались неоднократно в 1995-1998 годах на научных семинарах кафедры математического моделирования и анализа данных, на научной конференции "Современные проблемы радиотехники, электроники и связи" в Минске (1995), республиканской научной конференции, посвященной 25-летию факультета прикладной математики и информатики в Минске (1995), международной научной конференции "Компьютерный анализ данных и моделирование" в Минске (1995), V межгосударственной научной конференции, посвященной 75-летщо Б ГУ "Актуальные проблемы информатики: математическое, программное и информационное обеспечение" в Минске (1998), международной научно-практической конференции "Проблемы теории и практики статистики в переходный период" в Минске (1996), IV Всемирном конгрессе общества Бернулли по математической статистике в Вене (1996), IV Европейском конгрессе по технологиям искусственного интеллекта и программному обеспечению в Аахене (1996), VII Белорусской математической конференции в Минске (1996), Республиканской научной конференции "Математические методы в макро- и микроэкономике" в Минске (1996), международной научной конференции "Распознавание образов и обработка информации" в Минске (1997), I Европейской конференции
по анализу сигналов и прогнозированию а Праге (1997), VI научной конференции стран СНГ "Применение многомерного статистического анализа в экономике и оценке качества продукции" в Москве (1997).
Опубликованность результатов. По теме диссертационной работы имеется 15 печатных работ, из них 5 научных статей, 2 заключительных отчета по НИР и 8 тезисов докладов на математических конференциях.
Структура и объем диссертации. Диссертация состоит из введения, общей характеристики работы, пяти глав, заключения и сииска использованных источников, включающего 89 наименований. Общий объем диссертации составляет 107 страниц машинописного текста, включая 18 рисунков и 9 таблиц.
СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Во введении дана краткая характеристика статистического прогнозирования как направления исследований и областей его применения в автоматизации научных исследований.
Первая глава диссертации носит вспомогательный характер. В ней дается обзор литературы по теории статистического прогнозирования, обоснование выбора принятого направления исследований, а также методика проведепия исследований.
Вторая глава посвящена описанию встречающихся на практике искажений гипотетических моделей временных рядов, а также описанию характеристик устойчивости методов прогнозирования.
В §2.1 приведена классификационная схема основных типов искажений и краткое математическое описание каждого типа.
В §2.2 описана гипотетическая модель временного ряда с трендом при отсутствии искажений и введены две модели с искажениями.
1. Модель временного ряда с трендом при наличии искажений типа "выбросов":
Xt = V,-+№t, yt = f(t,e°) + ut, (1)
где t £ {1,2,..., T,.. .} — дискретное время, Xт = (я()> ' = ^^ — наблюдаемый "искаженный" временной ряд; Yt — (у<), i = 1, Т — ненаблюдаемый ("гипотетический") временной ряд; /(t, 0°) — детерминированная функция тренда, в" — (0f) 6 Rm — го-вехтор параметров модели (1), {ut} — последовательность независимых в совокупности, одинаково распределенных случайных величин, имеющих нулевое математическое ожидание £{u(} = 0, конечпую дисперсию D{u,} = а2 < оо и некоторую функцию распределения ДД-г) = P{ut < z},z е 72; {vtj — последовательность независимых в совокупности случайных величин с некоторыми математическими ожиданиями E{vt} = at, дисперсией -D{fj} = Ко2, К > 1, функциями распределения
Я„,(г) = Р{г'е < е {0,1} — последовательность независимых в совокуп-
ности, одинаково распределенных случайных величин Бернулля:
Р{6 = 1} = е, = 0} = 1 - е,
0 < £ < е+ — вероятность появления "выброса" в момент времени í (уровень искажений), 0 < < 0.5 — известный максимальный уровень искажений. Последовательности {"¡}, {щ}, предполагаются взаимно независимыми.
2. Модель временного ряда Хт = (г() е 7£т с трендом при наличии функциональных искажений тренда:
е. = »« + А(1), у, = ДМ°) + «<> (2)
где А(<) — функциональное искажение тренда в момент времени I (1А(£)| < с), 0 < £ < £+ — уровень искажений, е+ — известный максимальный уровень искажений.
Отдельно выделен случай, когда тренд временного ряда является линейным параметрическим:
Л1,«0) = ^(1)> (3)
где 0(4) = ($«■(<)) 6 Я"1 — система т линейно независимых функций.
В §2.3 описана гипотетическая модель временного ряда авторегрессионного типа с заданным порядком т авторегрессии (АР(7га)) и введена модель временного ряда такого типа при наличии искажений типа "выбросов":
= е0'^;:!', + и„ х, = + (4)
Здесь I £ {1,2,..., Г} — дискретное время, У — длина наблюдаемого временного ря да Хт ~ (£(), t = 1,Т, 6° = (0°) е Лт — т-вектор параметров модели (4), = (у!,у(-1,... ,Ук) — т-вектор последовательных наблюдений временного ряда Уу с момента времени £ = & до момента времени £ = I включительно; — т-вектор начальных значений, являющихся независимыми одинаково распределенными по нормальному закону случайными величинами > 0), {и^ — последовательность независимых одинаково распределенных случайных величия с нормальным распределением Д^О.я-2), {г,'(} — последовательность независимых одинаково распределенных случайных величин с распределением N(0, Ко1), К > 1, {£,} — последовательность независимых случайных величин Бернулли:
Р{Ь = \)=е, Р{& = 0} = 1-£,
0 < е < — вероятность появ*тения "выброса" в момент времени 4 (уровень искажений), е+ 6 [0, — известный максимальный уровень искажений. Последовательности случайных величин {и!}, {&}, ,г/о} предполагаются взаимно независимыми.
В §2.4 описаны характеристики устойчивости (робастности) методов прогнозирования временных рядов, в частности, количественные характеристики устойчивости, используемые в данной работе:
1) риск прогнозирования
ге(Г,т) = ^{(ут+т-2/г+т)2}; (5)
2) гарантированный риск прогнозирования
г+(Г,т)= sup г,(Г,г); (6)
0<s<[+
3) коэффициент неустойчивости риска
it ^ гЛТ,т)~ г0(Т,т)
=-7Ж7)-' (7)
где г0(Т, г) > 0 — риск байесовского прогнозирования при отсутствии искажений;
4) i-дояустимый уровень искажений (<5 > 0 — заданный уровень)
е*(<5) = sup{e : к±(Т,т)<6}. (8)
Глава посвяшепа анализу устойчивости методов прогнозирования временных рядов с трендом. В эту главу также включен материал до точности критериев обнаружения "выбросов" во временных рядах с трендом.
В пЗ.1.1 проводится анализ устойчивости метода прогнозирования с. использованием оцепки МНК:
ir+r=f(T+r,6), i = ^'T9T)~WTXT, (9)
при наличии искажений типа "выбросов", где Фу = Ф,з = t/>j(i) — матрица размер-
ности Т х га, Х-г — (®i,. .. ,хт) , а штрих озпачает транспонирование. Теорема 3.2 Если временной ряд удовлетворяет модели (1), (3) с "выбросами", а дли прогнозирования используется метод (9), Т > т, |ФтФт| Ф 0, то риск прогнозирования (5) равен
rt(T, т) = <т2(1 + а(Т,т)) + е{К<тга(Т,т)+(1 - е)А(Т, т)-f ф2{Т,г)), (10) а коэффициент неустойчивости риска (7) равен
Ч{Ка(Т, т) + ¿((1 - (т, г) + Д (Г, г)))
где
а(Т,т) = ^'(Г + г)(ф;<1-т)-1^(Т + т) > 0,
ß\(T,r) = ¿e?W(0(4'T*T)"V(r+ г))2 > 0,
ß3(T,r) = (а'(Т)Фг(ФуФг)-Ч'(Т + г))2 >0, а(У) = (а,) — Т -вектор.
Также доказано, чту при выполнении следующих условий: 1) а(Т) — О, 2) —> -+оо при Т —> сю, где Лт,„(/1) — минимальное собственное значе-
ние матрицы А, метод статистического прогнозирования с использованием оценки МНК является асимптотически робастыым.
В пЗ.1.2 проводится анализ устойчивости метода прогнозирования с использованием оценки МНК (9) при наличии функциональных искажений тренда.
Теорема 3.3 Если временной ряд, удовлетворяет модели (2),(3) с функциональными искажениями, а для прогнозирования применяется МНК-метод (9), Т > т, |ФтФт| ф О, то риск прогнозирования (5) равен
гДТ, г) = 1 +■ д'(Т + т)д{Т + т)) + (Х(Т 4 г) - д (Т + г)Лг)3, (12)
Лт = (А(Я), д(Т + г) = (Л(2Ч г)) = Фт(ФтФг)-^(Г + г),
а коэффициент неустойчивости риска (7) равен
«+^>г>-а2- 1+д'(Т + т)д{Т + т)-
(13)
В этом параграфе также проведен анализ составляющих гарантированного риска прогнозирования (6) для метода (9) при наличии функциональных искажений тренда.
В п3.1.3 приведены результаты вычислительных экспериментов, дающих оценку риска прогнозирования по смоделированным временным рядам для метода прогнозирования с использованием оценки МНК при наличии искажений типа "выбросов" и функциональных искажений тренда. Эти результаты показывают согласие численных оценок с аналитиче скими выражениями (10)—(13) -
В §3.2 проводится анализ устойчивости метода прогнозирования с использованием оценки Хьюбера:
уг+г = в>(У + т), (14)
т
9 = зхешаУ1р(х1~в'ф(г)), (15)
» .=1
= р (г) = тах{—Ь, тгп{Ь, г}), (16)
при наличии "выбросов", где величина Ь — Ь(е) определяется как корень следующего уравнения:
г
Ф(') — стандартная нормальная функция распределения.
Теорема 3.5 Если прогнозируемый временной ряд удовлетворяет модели (1),(3) при -наличии искажений типа "выбросов по дисперсии" г 0, К > I) и выполнены следующие условия:
СЛ. Т > m; CS. |4VMt¿0;
CS. Функции распределения Hu{z) и Hv{z) являются гауссовскими;
С4■ Длина Т прогнозируемого временного ряда и число m параметров тренда бесконечно возрастают и удовлетворяют, асимптотике:
Т —> оо, hm2 —» О,
где h — максимальный диагональный элемент матрицы II = Ф^Ф^Фх)-1»!/^., то для риска прогнозирования (5) метода (Ц)-(16) верно следующее асимптотическое разложение:
re(I» = а2 + + г)(ФгФг)" ^(Г + т) + о,, (17)
где для А(с), В(е) получены явные выражения (приведенные в диссертации), Oí — остаточный член разложения более высокого порядка малости, чем главный член.
В этом параграфе приведены также результаты вычислительных экспериментов, дающих сравнительный анализ методов прогнозирования (9) и (14)—(16) с точки зрения устойчивости по отношению к "выбросам". Вычислительные эксперименты показали, что метод прогнозирования (14)—(16) более устойчив по отношению к "выбросам".
В §3.3 предлагается новый локально-медианный (ЛМ) метод прогнозирования временных рядов с трендом
$r+r=med^«V(T-t-r)}, (18)
где tfi'1 £ Rn — локальная MIIK-оцепка вектора параметров 6° по ¿-той подвыборке {г,-,,... ,£,-„} размера п из выборки X'т-
(ч 1 ФЛн) ■ V>m(¿i) \
vW _ -
\ ) \ Ф^п) ■ ФтЫ /
{г'ь ... ,гп) — подмножество индексов, взятых из МЕЮжества {1,2,... ,Т}, А/ = — количество всех подвыборок объема п, т < п < Т — заданный размер подвыборок (параметр метода). Проведен анализ устойчивости метода (18) к "выбросам".
Теорема 3.6 Для ЛМ-метода прогнозирования (18) временных рядов с трендом, удовлетворяющих модели (1),(3) при условиях Т > т, |(Фг')'Фг'| / 0 Уг = \,М, а{Т) — О, е случае гауссовских функций распределения Ни[г) и [1„(г), риск прогнозирования (5) равен:
г,{Т, т) = о1 + (/(Г + т, в0))2 + П(Т, т) - 2£(Г,т)/(Г 4 г,в0), (19)
где для Е(Т,т), 0(Т,т) получены явные выражения.
В этом параграфе приведены также результаты вычислительных экспериментов, дающих сравнительный анализ методов прогнозирования (9) и (18) с точки зрения устойчивости по отношению к "выбросам" и показывающих преимущества в устойчивости получаемого прогноза при использовании метода (18), и результаты по оптимизации п.
В §3.4 дано краткое описание существующих критериев обнаружения "выбросов" во временных рядах с трендом, а также введена величина, определяющая точность критерия:
к=кШ) = РЫХт)еТ1], (20)
где Т — множество моментов времени, в которые наблюдается временной ряд Хт = -{х,, г £ Т), Т\ £ Т — множество моментов времени, в которые во временном ряде Хт присутствуют "выбросы", г/ = 1){Хт) — момент времени, в который обнаружен "выброс". В пЗ.4.1 проведен анализ точности критерия Льюнга обнаружения "выбросов":
г) = 1?! {Хт) = а^гаах{5,}, (21)
5(= 5%Л = Я;1ф{Щх,-вТ'ф(1))Л= £ ^)фт{к), (22)
для времеШ1ых рядов с трендом, где в?--МНК-оценка т-вектора параметров модели
(1),(3) по наблюдениям Хт:
вт = (Ф?ФгГ1Ф£Хт-, Фт = (Фч), Фч = = Т^п.
Теорема 3.7 Для критерия Льюнга (21),(82) вероятность обнаружения выбросов (20) во временном ряде Хт (Т = {1,2,.. ., Т}), удовлетворяющих модели (1),(3), равна:
« = / __£(0)^31 .. .агТ, (23)
где Е(г)) —плотность Т-мерного нормального распределения с вектором мате-
матических ожиданий р. и ковариационной матрицей £(г), для которых получены явные выражения. Для временных рядов, из которых с помощью критерия (21),(28) было удалено Т\ наблюдений, из которых в Т% имелись "выбросы", вероятность обнаружения "выбросов" (20) равна:
к=£/, , . ^ (24)
где Хт• — временной ряд с пропусками, Т" = {¿1,. •. , ¿г-т,}, Т* = ^о* и Т{, где -множество моментов времени, в которые временной ряд Хт' не содержит "выбросов", 1* - множество моментов времени, в которые временной ряд Хт- содержит "выбросы", а для Д и В(г) получены явные выражения.
В этом параграфе также приведены приближенные формулы для вычисления точности критерия Льюнга в предположении, что величины {5,} не коррелированы.
В пЗ.4.2 предложен новый локально-медианный критерий обнаружения "выбросов" для временных рядов с трендом:
г) = г1i{XT) = arg max/(, (25)
где
М 7
и = 1„ (f Л (i), Д = --L—-
faT + т) i- а(Т + т) «,(ТЧ т) = фт(ТЛ т),
ЫТ + т) =
+ т), если М нечетно
Р,;(Т+т)-(-<»Г (Г+-Т)
—--если М четно
¿(М), если М четно
если М нечетно '
% = |»йг - = (в"М)Г«6(Т + г),ут+г = теа(у«т),
¡=1,м
{г'(ц} — удорядочеппое в порядке возрастания множество индексов {г*,}, =
{А^1'}, г = 1,М — множество всех возможных подвыборок размера п из выборки АV, £ Л"1 — МНК-оценкавектора параметров 0° по ¿-той ггодвыборкеиз выборки Х-т, N « М — некоторое заданное число, г — глубина прогнозирования, 1А(г) — индикаторная функция множества А.
С помощью вычислительных экспериментов показан выигрыш в точности локально-медианного критерия £25) по сравнению с критерием Льюнга (21),(22).
Глава 4 посвящена анализу устойчивости методов прогнозирования авторегрессионных временных рядов АР(т) с заданным порядком т авторегрессии к "выбросам".
В §4.1 дроведеп анализ устойчивости метода прогнозирования в случае известных коэффициентов авторегрессии:
= £ 9?гг+г-.-. *т+г-.- = ( ЙГ+Т"'' ' < " , (26)
1=1 ( ХТ+ т-„ ^ > т
и метода прогнозирования в случае неточно заданных параметров авторегрессии:
5г+т = £ в,-^.,, = { Т , (27)
^ ( г > т
где в-, = 6° + а,-, |а,-| < Л,-, г — 1,т, а = (а,) — вектор погрешностей задания коэффициентов.
Теорема 4.1 Для процедуры прогнозировапия (26) временных рядов, удовлетворяющих модели (4), риск прогнозирования (5) равен:
г.(Г,г) = сг2(1 + Е(А!")2 + Ке±{ А«)2), (28)
а коэффициент неустойчивости риска (7) равен:
где
т) = (,9)
.............. I ЛР г = ТТТтг,
А1"= Г Ар'Д^ + АГ-1', ^ = " .
I о, г > т.
\(М-т-1)
- А,(0 = О V/ < 0.
Теорема 4.2 При наличии погрешностей {а,- : г = 1,то} а задании, коэффициентов авторегрессии для процедуры прогнозирования (27) временных рядов, удовлетворяющих модели (4) с "выбросами", риск прогнозирования (5) равен:
т—1 Г т
г.(Т,г) = а2(1 + £(А<'>)2 + Е(£ ЛМА^^ОЧ (30)
• = 1 ¿ = 1 »=1
■тт. т
+/^Е(ЕЛг>Ат11-;)2 + + л«)2),
; = 1 1 = 1 ¡=1
а коэффициент неустойчивости риска (7) равен:
(яе+£(Л« + Л(0)Л
«+(Т, г) = -Ь--^--(31)
(1 + >)« +1 + „д (|А?>лй1.1)л
тт(А:-11т)
Л« = А« - А<;>, Л,« = £ АЭД + А^Л )=1
д-(0 = | • = 1 '0, г > т.
В §4.2 проведен анализ устойчивости метода прогнозирования с использованием оценки МНК:
2/т+г = ¿^¿г+т-;, ¿г+т-,- = I г/г+т~" , (32)
,=1 [ « > г
-1 4=1 1 1 = 1
где б = (¿¿) £ Я"1 — МНК-оценка т-вектора параметров 9°.
Теорема 4.3 Если наблюдаемый временной ряд хг содержит, "выбросы" (4), коэффициенты авторегрессии в° неизвестны, характеристические корни уравнения (4) лежат
в единичном круге, а для прогнозирования используется метод (32), (33), то для риска прогнозирования (5) при Т —> оо. верно следующее асимптотическое разложение:
Т — 1 ГЛ тп
г((Г,т) = <т2(1 + + 2£Л«Л/Т(0))+ о(е2), (34)
1=1 1=1 ¿=1
где
т.п(т-1 ,т)
„ / К^еЁ £ (* -к, 1-1)- 2с,-.), « = Г,т
(О, г > т,
С"1 = (с,-,), С = (с,-,-), М(М'), = Т^Т,
77Х
1=1 (=1
В §4.3 проведен сравнительный анализ устойчивости метода прогнозирования в случае известных параметров (26) и метода прогнозирования с использованием опенки МНК (32),(33) с помощью вычислительных экспериментов.
Глава 5 посвящена описанию программного обеспечения статистического прогнозирования и алгоритмов, реализующих методы прогнозирования временных рядов.
В §5.1 дана классификация статистического программного обеспечения (СПО) в общем и программного обеспечения статистического прогнозирования в частности, а также приведена мера полезности СПО.
В §5.2 описаны алгоритмы, реализующие метод прогнозирования с использованием оценки МНК для временных рядов с трендом и авторегрессионпых временных рядов, а также локально-медианный метод прогнозирования для временных рядов с трендом. В этом параграфе также приведены выражения для вычислительной сложности указанных алгоритмов в терминах простейших арифметических операций. Дано краткое описание возможностей пакета прикладных программ "СТАТПРО", в состав которого вошли описанные алгоритмы, и приведен пример практического использования пакета для прогнозирования экономико-производственных показателей химической отрасли.
В заключение, выражаю глубокую благодарность своему научному руководителю проф. Ю.С. Харину за неоценимую помощь, оказанную при проведении исследований, включенных в данную диссертационную работу, и всестороннюю поддержку.
ЗАКЛЮЧЕНИЕ
В диссертационной работе получены следующие основные результаты:
1. Впервые проведен анализ устойчивости к "выбросам" методов прогнозирования с использованием оценки по методу наименьших квадратов (МНК) и оценки Хьюбе-ра для временных рядов с трендом: аналитически и с помощью вычислительных экспериментов.
2. Аналитически и с помощью вычислительных экспериментов получены новые оценки устойчивости среднеквадратического риска к функциональным искажениям тренда временного ряда для метода прогнозирования с использованием оценки МНК.
3. Для авгорегрессионных временных рядов впервые решены задачи анализа устойчивости к "выбросам" метода прогнозирования в случае известных параметров, метода прогнозирования в случае неточно заданных параметров и метода прогнозирования с использованием оценки МНК.
4. Разработан новый локально-медианный метод прогнозирования временных рядов с трендом и получены аналитические оценки его устойчивости к "выбросам"; с помощью вычислительных экспериментов произведено сравнение этого метода с известными методами прогнозирования по величине риска.
5. Проведен анализ точности критерия Льюнга обнаружения "выбросов" для временных рядов с трендом; предложен новый итерационный локально-медианный критерий обнаружения "выбросов" для временных рядов с трендом, произведено сравнение этого критерия с критерием Льюнга с точки зрения точности обнаружения "выбросов" с помощью вычислительных экспериментов.
6. Разработаны алгоритмы, реализующие в ППП "СТАТПРО" вышеперечисленные методы прогнозирования и критерии обнаружения искажений, а также оценена их вычислительная сложность.
СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ
ДИССЕРТАЦИИ
[1] Галинский В.А., Фурса P.A. Программный комплекс прогнозирования экономических показателей // Проблемы теории и практики статистики в переходный период. Тез. докл. конф. —Минск:БГЭУ, 1996,— С.265-267.
[2] Исследование проблем устойчивости и оптимальности в теории статистического прогнозирования: отчет о НИР (заключ.) / Белгосуниверситет; Руководитель работы Ю.С.Харин; № ГР 19941201. —Минск, 1996,— 56с.
[3] Программные средства для прогнозирования производства продукции химической отрасли: отчет о НИР (заключ.) / Белгосуниверситет; Руководитель работы Ю.С.Харин; № 30891. —Минск:БГУ, 1996,— Т.1: 29с.— 1.2: 30с.
[4] Фурса Р.А. Об устойчивости статистического прогнозирования сигналов при наличии искажений // Современные проблемы радиотехники, электроники и связи. Тез. докл. конф.— Мипск:БГУИР, 1995,— С.87-88.
[5] Фурса Р.А. Об устойчивости регрессионного прогнозирования при функциональных искажениях // Республиканская научно-методическая конференция, посвященная 25-летию ФПМИ Б ГУ. Тез. докл. конф.— Минск:БГУ, 1995.— С.132-133.
[6] Фурса Р.А. Локально-медианный метод прогнозирования временных рядов с трендом при наличии "выбросов" // V межгосударственная научная конференция, посвященная 75-летию БГУ "Актуальные проблемы информатики: математическое, программное и информационное обеспечение" Тез. докл. конф.— Минск:БГУ, 1996.— С.121.
[7] Фурса Р.А. Об устойчивости прогнозирования авторегрессионных временных рядов // VII Белорусская математическая конференция. Часть 3. Тез. докл. конф.— Минск:АН Беларуси, 1996.— С.64-66.
[8] Фурса Р.А. Об устойчивости методов краткосрочного прогнозирования в микро- и макроэкономике К Математические методы в макро- и микроэкономике. Тез. докл. конф. —Минск:БГЭУ.— 1997,— С.252-254.
[9] Фурса Р.А. Устойчивость метода прогнозирования временных рядов с использованием оценки Хьюбера // Вестник Белорусского государственного университета. Сер 1: Физ.Мат.Информ.— 1997,— 2,— С.58-61.
[10] Фурса Р. А. Точность критериев обнаружения "выбросов" для временных рядов с трендом // Труды международной научной конференции "Распознавание образов и обработка информации".— Щецин. — 1997.— Т.2.— С.51-55.
¡11] Фурса Р.А. Об устойчивости прогнозирования временных рядов авторегрессионного типа при наличии "выбросов" //VI научная конференция стран СНГ "Применение многомерного статистического анализа в экономике и оценке качества продукции". Тез. докл. конф. —М..-ЦЭМИ РАН, 1997,— С.52-53.
[12] Kharin Yu.S., Fursa R.A. Robustness of time series forecasting for distorted trend model // Computer Data Analysis and Modelling. — 1995.— Minsk-.BSU.— P.47-58.
[13] Kharin Yu.S., Fursa R.A. Robustness of statistical forecasting // The Fourth World Congress of Bernoulli Society. —Vienna:VSU.— 1996. P.l 15-116.
[14j Kharin Yu.S., Fursa R.A. Robust forecasting of parametric trend for time series with outliers // Proceedings of the Fourth European Congress on Intelligent Techniques and Soft Computing.— Aachen. — 1997,— Vol.3.— P.2151-2156.
[15] Kharin Yu.S., Fuisa R.A. Robustness of signal prediction under distortions // Proceedings of the First European Conference on Signal Analysis and Prediction.— Prague:ICT Press. — 1997,— P.219-221.
РЕЗЮМЕ
Фурса Руслан Анатольевич Устойчивость в статистическом прогнозировании временных рядов.
Ключевые слова: устойчивость, статистическое прогнозирование, временные ряды, тренд, авторегрессия, "выбросы", функциональные искажения, риск.
В диссертации проведен анализ устойчивости методов статистического прогнозирования для временных рядов с трендом при наличии "выбросов" и функциональных искажений тренда, а также для авторегрессионных временных рядов при наличии "выбросов" и погрешностей в задании коэффициентов авторегрессли. Получены оценки следующих характеристик устойчивости (робастности): 1) среднеквадратический риск прогнозирования, 2) гарантированный риск прогнозирования, 3) коэффициент неустойчивости риска, 4) ¿'-допустимый уровень искажений. Построен и исследован новый локалыю-медиашшй робастный алгоритм прогнозирования. Проведен анализ точности критериев обнаружения "выбросов" во временных рядах с трендом. Разработанные алгоритмы прогнозирования временных рядов реализованы в пакете прикладных программ СТАТПРО по статистическому прогнозированию.
РЭЗЮМЭ
Фурса Руслан Анатолев1ч Устойл)васнь у статыстычным прагназаванш часавых паслядоунасцяу.
Ключавыя словы: устойл^васдь, стагыстычнае прагназаванне, часавыя паслядоунасш, трэнд, аутарэгрэс1я. "вьнады", функцыянальныя скажэнш, рызыка.
У дысертацьп праведзсны анал1з устойл1васш метадау статыстычнага прагназаван-жя для часавых паслядоунасцяу з трэядам пры наяунасщ "выйдау" 1 функцыянальных скажэнняу трэнда, а таксама для аутарзгрэсшных часавых паслядоунасцяу пры наяунасш "выкщау" 1 х1бнасцяу у задана каэфщыеятау аутарэгрэсп. Атрыманы ацэни наступных характарыстык устойл1васц1 (рабаснасщ): 1) сярэднеквадратычная рызыка прагназаван-ня, 2) гарацтаваная рызыка прагназаванвя, 3)каэфщыент няустойЛ1васц1 рызыю, 4) Ь-дапушчальны узровень скаженняу. Пабудаваны и даследваны новы лакальна-медыянны рабасны алгарытм прагназавання. Праведзены анализ дакладнасщ крытэрыяу адшукаы-ня "выкщау" у часавых паслядоунасцях з трэндам. Распрацаваныя алгарытмы прагназавання часавых паслядоунасцяу рэал^заваны у пакеце прыкладных цраграм СТАТПРО па статыстычнаму прагназаванню.
SUMMARY
Fursa Ruslan Anatolievich Robustness in statistical forecasting of time series
Keywords: robustness, statistical forecasting, time series, trend, autoregression, "outliers'', functional distortions, risk.
The analysis of robustness of statistical forecasting methods for time series with trend in case, when "outliers" and functional distortions of trend are present, and for autoTegressive time series in case, when "outliers" and rnisspecifications in autoregression parameters are present, is given in this thesis. The estimates of the following stability (robustness) measures: 1) mean-squared risk of forecasting, 2) guaranteed risk of forecasting, 3) coefficient of risk instability, 4) ¿-admissible distortion level, are calculated. The new robust local-median algorithm of forecasting is constructed and investigated. The analysis on accuracy of criterions of "outliers" detection in time series with trend is given. The developed algorithms for time series forecasting are included in the package of applied programs STATFOR, which is designed for statistical forecasting purposes.
-
Похожие работы
- Оценка и прогнозирование организационной устойчивости строительных организаций при реализации инвестиционных проектов
- Прогнозирование притока реки Обь в створе Новосибирской ГЭС на основе вариативного моделирования
- Математические модели прогнозирования индекса моторики на основе многомерного статистического анализа
- Модели, способы и программные средства поддержки принятия решений на основе прогнозирования временных рядов с переменной структурой
- Метод подбора параметров в моделях авторегрессии на основе числовых рядов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность