автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Устойчивое моделирование и прогнозирование с использованием многомерной регрессии и систем одновременных уравнений
Автореферат диссертации по теме "Устойчивое моделирование и прогнозирование с использованием многомерной регрессии и систем одновременных уравнений"
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ УДК 681.518.25:519.283
иЛ сф феор Шо
Сталевская Светлана Николаевна
УСТОЙЧИВОЕ МОДЕЛИРОВАНИЕ И ПРОГНОЗИРОВАНИЕ С ИСПОЛЬЗОВАНИЕМ МНОГОМЕРНОЙ РЕГРЕССИИ И СИСТЕМ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ
05.13.16 — применение вычислительной техники, математического моделирования и математических методов в научных исследованиях
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Минск —2000
Работа выполнена на кафедре математического моделирования и анализа данных Белорусского государственного университета
Научный руководитель: доктор физико-математических наук,
профессор Харин Юрий Семенович
Официальные оппоненты: доктор физико-математических наук,
ст.н.с. Дудин Александр Николаевич
кандидат физико-математических наук, доцент Ткалич Татьяна Алексеевна
Оппонирующая организация: Институт математики Национальной
Академии Наук Республики Беларусь
Защита состоится «17» марта 2000 года в 10 — часов на заседании совета по защите диссертаций Д 02.01.14 при Белорусском государственном университете по адресу. 220050, г. Минск, пр. Ф.Скорины 4, ауд. 206, т. 226-55-41.
С диссертацией можно ознакомиться в библиотеке Белорусского государственного университета.
Автореферат разослан « _/ » февраля 2000 г.
И.О. Ученого секретаря совета по защите диссертаций, доктор технических наук
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы диссертации. Одним из важнейших направлений современной прикладной математики является разработка принципов и методов построения математических моделей, а также создание средств автоматизации научных исследований объектов, явлений и процессов различной физической природы на базе применения математических моделей с целью дальнейшего установления их свойств и прогнозирования их динамики. Принципы и методы математического моделирования и прогнозирования используются при автоматизации научных исследований в технике, физике, социологии и в других сферах научно-практической деятельности человека. Следует отметить, что согласно отчету ГВАК Российской Федерации за 1998 год паиболее перспективными направлениями диссертационных исследований по специальности 05.13.16 являются моделирование и создание систем оценки эффективности экономических инструментов управления, экологического мониторинга и т.д.
Для построения математической модели объекта и прогнозирования его динамики важно представить связи между элементами объекта не только качественно, но и в сжатом виде количествепцо. Именно поэтому, многомерная линейная регрессия (МЛР) и системы одновременных уравнений1 (СОУ), обобщающие МЛР, нашли широкое применение в математическом моделировании сложных систем.
Для идентификации моделей МЛР и СОУ и прогнозирования используются методы, основанные на методе наименьших квадратов (МНК). Этот метод для обеспечения требуемой точности предъявляет достаточно "жесткие" требования как к моделям, так и к собраппым экспериментальным данным. Однако, на практике гипотетические модельные предположения часто нарушаются. Это связано с конечным объемом экспериментальных данных, ошибками при регистрации и при обработке наблюдений, аппроксимационной природой моделей и другими причинами. В таких случаях методы идентификации и прогнозирования, предложенные исходя из гипотетической модели, теряют свою эффективность, приводят к неудовлетворительным результатам, и не могут применяться на практике. Поэтому для построения более точных и надежных моделей объектов и явлений возникает необходимость создания новых робастпых методов моделирования и прогнозирования, устойчивых (робастпых) к "малым" отклонениям от гипотетических предположений.
В этом направлении работает ряд известных ученых: Хьюбер П., Хампель Ф., Раусеу Р., Лерой А., Айвазян С.А., Рудзкис Р., Ха-рин Ю.С. и многие другие. В области робастного моделирования
:от англ. "з'шгаИапеоиз eqдations 8уБ1етз"
и прогнозирования с использованием модели множественной линейной регрессии (являющейся частным случаем МЛР) уже получены существенные аналитические и прикладные результаты. Однако, количественные выражения для характеристик устойчивости моделирования и прогнозирования на основе МЛР не встречаются.
При идентификации СОУ подобные исследования только начинаются (Краскер В., Ронкетти Е., Уэлч Р.) и носят эвристический характер. Основные трудности здесь создают: высокая размерность СОУ, что значительно усложняет проведение аналитических исследований; сложная корреляционная структура зависимых переменных, требующая специальных методов оценивания параметров; подстановочный характер существующих методов идентификации СОУ.
Необходимость решения проблемы устойчивости при моделировании и прогнозировании с использованием МЛР и СОУ, возникающая в различных областях при автоматизации научных исследований, обуславливает актуальность темы диссертационной работы.
Связь работы с крупными научными программами, темами. Исследования проводились при выполнении в БГУ следующих научно-исследовательских работ (НИР, с указанием номера госрегистрации): г/б НИР 19972532 "Разработать систему проблемно-ориентированных пакетов прикладных программ в области статистического анализа данных и моделирования" (1997-1998 г.г.) по Республиканской научно-технической программе "Информатика", г/б НИР 19963454 "Разработка методов и алгоритмов робастного (устойчивого) статистического анализа многомерных и динамических данных при наличии функциональных искажений" (1996-1999 г.г.) по Государственной программе фундаментальных исследований РБ "Алгоритм", г/б НИР 19973433 "Разработать математическое и программное обеспечение эконометрического моделирования и прогнозирования динамики важнейших макроэкономических параметров" (1997-1998 г.г.) по Государственной научно-технической программе "Разработать экономические и социальные основы Белорусской государственности (Экономика и социальная политика)", г/б НИР 19982771 "Разработка методов, алгоритмов и программных средств устойчивого прогнозирования и восстановления зависимостей" (1998 г., грант поддержки аспирантов и студентов БГУ).
Цели и задачи исследования. Целью диссертационной работы является количественная оценка устойчивости моделирования и прогнозирования с использованием МЛР и СОУ при искажениях гипотетической модели, а также разработка и применение новых алгоритмов идентификации СОУ, устойчивых к заданным типам искажений, для моделирования и прогнозирования динамики сложных систем, что предполагает решение следующих основных задач:
1. Получить аналитические выражения характеристик устойчи-иости МНК-алгоритма моделирования и прогнозирования с использованием MJIP при нарушениях предположений гипотетической модели ("выбросы" Тьюки-Хьюбера, аддитивные ошибки в независимых переменных, функциональные искажения).
2. Получить аналитические выражения характеристик устойчивости моделирования и прогнозирования с использованием СОУ и "аппроксимационного" метода идентификации СОУ для гипотетической модели и при нарушениях предположений гипотетической модели ("выбросы" Тьюки-Хьюбера, аддитивные ошибки в независимых переменных, функциональные искажения).
3. Построить новые робастные оценки параметров СОУ и провести анализ их устойчивости к различным типам искажений гипотетической модели ("выбросам" Тьюки-Хьюбера, аддитивным ошибкам в независимых переменных, функциональным искажениям), применить их для прогнозирования динамики зависимых переменных.
4. Разработать алгоритмы, реализующие робастные оценки параметров СОУ, использовать их в пакетах прикладных программ для моделирования и прогнозирования динамики сложных систем.
Объект исследования. Объектом исследования являются модели MJIP и СОУ, а также методы и алгоритмы их идентификации и прогнозирования.
Методика исследования. Предложенная в диссертациоппой работе методика исследования устойчивости моделирования и прогнозирования с использованием MJIP и СОУ к искажениям гипотетической модели основана на аналитическом вычислении матрицы париаций и матрицы смещепия оценок, а также связанных с ними характеристик, и базируется на использовании: теории вероятностей и математической статистики, теории матриц, методов статистического моделирования, метода асимптотических разложений.
Научная новизна полученных результатов.
1. Впервые получены аналитические выражения для матрицы смещения и матрицы вариаций МНК-оценки параметров регрессии, для вектора смещения и среднеквадратичного риска МНК-прогпозирования при наличии искажений гипотетической модели MJIP ("выбросов" Тьюки-Хьюбера, аддитивных ошибок в независимых переменных и функциональных искажениях).
2. Для гипотетической модели СОУ доказана состоятельность "аппроксимационной" оценки параметров СОУ и получены аналитические выражения для вектора смещения и матрицы вариаций "аппроксимационной" оценки.
3. Впервые получены аналитические выражения для вектора смещения и матрицы вариаций "аппроксимационной" оценки пара-
метров СОУ при наличии искажений гипотетической модели СОУ ("выбросов" Тьюки-Хьюбера, аддитивных ошибок в независимых переменных и функциональных искажениях).
4. Разработаны новые оценки параметров СОУ — взвешеппая "аппроксимадионная" и медианная "аппроксимационная" оценки — и с помощью вычислительных экспериментов проведен анализ их устойчивости к "выбросам" Тыоки-Хьюбера, аддитивным ошибкам в независимых переменных и функциональным искажениям.
5. Разработаны новые алгоритмы идентификации СОУ на основе взвешенной "аппроксимационной" оценки и медианной "алпроксима-ционной" оценки, осуществлена их программная реализация.
Практическая значимость полученных результатов. Разработанные в диссертационной работе алгоритмы вычисления оценок параметров СОУ ("аппроксимадионный", взвешенный и медианный) могут применяться в организациях, занимающихся моделированием сложных систем и прогнозированием их динамики, для получения более точных и падежных моделей и прогнозов.
"Аппроксимационный" и медианный алгоритмы оценивания параметров СОУ включены в систему эконометрического моделирования и прогнозирования СЭМП (созданный в рамках ГНТП "Разработать экономические и социальные основы Белорусской государственности " в 1997-1998 г.г.) и в пакет программ "Эконометрика" (созданный в рамках РНТП "Информатика" в 1997-1998 г.г.)
Пакет СЭМП внедрен в Национальном Банке Беларуси. Акт о внедрении прилагается в Приложении 2 диссертационной работы.
Экономическая значимость полученных результатов. Разработанные па кафедре математического моделирования и анализа данных пакеты прикладных программ (ППП) СЭМП и "Эконометрика" , в состав которых включены результаты диссертационной работы, могут рассматриваться как коммерческие продукты, на которые имеется спрос в организациях, занимающихся моделированием и прогнозированием динамики сложных систем в технике, физике, медиципе, экопомике, экологии.
Основные положения диссертации, выносимые на защиту. На защиту выносятся:
1. Новые аналитические выражения для смещения и матрицы вариаций МНК-оценки параметров регрессии, смещения и среднеква-дратического риска МНК-прогноза для трех типов нарушений гипотетической модели МЛР: "выбросов" Тыоки-Хьюбера, аддитивных ошибок в независимых переменных, функциональных искажений.
2. Доказательство состоятельности "аппроксимационной" оценки параметров СОУ и аналитические выражения смещения и матрицы вариаций в условиях гипотетической модели.
3. Новые аналитические выражения для смещения и матрицы вариаций "аппроксимационпой" оценки параметров СОУ для трех типов нарушений гипотетической модели СОУ: "выбросов" Тьюки-Хыобера, аддитивных ошибок в независимых переменных, функциональных искажений.
4. Новые робастпые оценки параметров СОУ — взвешенная "ап-цроксимационная" оценка, медианная "аппроксимационная" оценка — и построенные на их основе алгоритмы идентификации СОУ.
Личный вклад соискателя. Основные результаты, приведенные в диссертации, получены автором самостоятельно. Соавторам в совместных работах принадлежат предметные постановки задач, выбор направления исследований, обсуждение результатов.
Апробация результатов диссертации. Основные результаты диссертации неоднократно докладывались и обсуждались в 1997— 1999 годах на научных семинарах кафедры математического моделирования и анализа данных, 5-ой Международной конференции "Компьютерный Анализ Данных и Моделирование" (8-12 июня 1998 года, Минск), научно-практической конференции "Формирование Экономических и Социальных Основ Белорусской Государственности" (1 июля 1998 года, Минск), 6-ом Международном симпозиуме по асимптотической статистике "Prague Stochastics'98" (23-28 августа 1998, Прага, Чехия), 4-ой Республиканской конференции студентов и аспирантов Беларуси "НИРСиА-98" (7-8 октября, Гродно), 6-ой Международной научной конференции "Актуальные проблемы информатики: математическое, программное и информационное обеспечение" (26-30 октября 1998 года, Минск), 3-ей Международной конференции "Новые информационные технологии в образовании — NITE:98" (12-13 ноября 1998 года, Минск), 5-ой Международной конференции по распознаванию образов и информационным процессам "PRIP'99" (18-20 мая 1999 года, Минск), 6-ой Международной конференции по многомерной статистике "Multivariate Statistics" (19-23 августа 1999 года, Тарту, Эстопия).
Опубликованность результатов. По теме диссертационной работы опубликовано 11 научных работ, из них 2 статьи в центральных периодических научных изданиях (журналах), 8 статей в рецензируемых сборниках научных трудов и 1 тезисы докладов на научных конференциях. Общее число страниц в публикациях ■— 75.
Структура и объем диссертации. Диссертация состоит из введения, общей характеристики работы, четырех глав, заключения, двух приложений, списка использованных источников, включающего 109 наименований. Общий объем диссертации составляет 124 страницы машинописного текста, включая 26 рисунков на 18 страницах, 2 таблицы на 1 странице, 2 приложения на 10 страницах.
ОСНОВНОЕ СОДЕРЖАНИЕ
Во введении обсуждается актуальность выбранной тематики и определяется направление диссертационного исследования.
В общей характеристике работы отражена актуальность рассматриваемых задач, связь с крупными научными темами, сформулированы цель и задачи, отмечена научная новизна полученных результатов, их экономическая и практическая значимость, изложены защищаемые положения, показан личный вклад автора, приведены сведения об апробации и опубликованности результатов, изложена структура и указан объем диссертации.
Первая глава является вводной. В ней дается обзор литературы по использованию многомерной линейной регрессии (МЛР) и систем одновременных уравнений (СОУ) в теории статистического моделирования и прогнозирования, обосновывается актуальность устойчивых методов идентификации моделей к искажениям гипотетической модели, а также проводится классификация искажений по типам.
Во второй главе проводится анализ устойчивости моделирования и прогнозирования с использованием МЛР. Результаты п наблюдений {(т/г,а^ : I — 1,п)} над стохастической системой в дискретный момент времени ¿ описываются моделью МЛР:
2н = + = (1)
где 6 — вектор независимых переменных в момент времени
у1 € П.л — вектор зависимых переменных; щ £ — вектор случайных ошибок наблюдения с нулевым средним я = 1,2,... ):
Е{«г} = Ол-, Соу{«(, и,} - - - Е{щ})т} = 6иЕ,
(2)
£ = {аф — Ш х ЛГ)-ковариационная матрица, 81з — символ Кроне-кера, в" = (0(х)|0(2)| • ■ ■ — {К х И)-матрица неизвестных истинных коэффициентов регрессии, подлежащих оцениванию; К и N — количество независимых и зависимых переменных соответственно, О// и ОлгхА' — Дивектор и (Лг х Х)-матрица соответственно, элементами которых являются нули.
Прогнозированию в момент времени п + г (г > 1) подлежит случайный Л^вектор зависимых переменных уп+т 6 И при заданном значении вектора регрессоров хп+г 6 .
Для модели (1), (2) традиционно используется алгоритм прогнозирования, основанный на МНК-оценках (|ХТЛ'| ф 0):
Уп+Т - @
(3)
где в = (^(1)1^(2)1 ■■■ |^(лг)) — классическая МНК-оцепка (К х Лг)-матршш коэффициентов регрессии:
в = {ХтХ)-хХтУ, (4)
и Хт = (гг11... |а;п), Ут = (?/1| ... \уп) — блочные матрицы.
Для анализа точности и устойчивости моделирования и прогнозирования предлагается использовать следующие количественные характеристики: (К X Лт)-матрицу смещения оценки в:
Ь = Ь{в} = Е{0}-д°- (5)
(К х /С)-матрицу взаимных вариаций столбцов Ощ, 9 ц) 6 И^:
Уц = Уц{в} = Е{((9(0 - в^)(ди) - *{>./}, цз е {1, -.., АО; (г.)
суммарная среднеквадратическая ошибка оценивания:
^ = СО
¿=1
Лг-пектор смещения прогноза уп+т-
Р = Р{уп+г} = Е{уп+т-уп+т}-, (8)
среднеквадратический риск прогнозирования:
г = Щ(у„+г - уп+т)Т(у„+т ~ Уп+т)} ■ (9)
В теореме 2.1 получены формулы для смещения и среднеква-дратического риска прогнозирования:
N
Р = Ьт{в}хп+Т, г = г0 + х1+т £ Уи{в}хп+Т.
1=1
В разделе 2.2 проведен анализ устойчивости МНК-оценок и прогноза при наличии "выбросов" и аддитивных ошибок: 1) случайные ошибки наблюдения {щ} описываются моделью "выбросов" Тьюки-Хьюбера: вероятностный закон распределения £{щ} является смесью двух ./У-мерных гауссовских распределений:
С{щ} = (1 - £1)^(0^,2) +ЕхЯм{а,С), г = М, (10)
Соу{И(, = ОлгхЯ, I Ф 5,
где 0 < £1 < 1 — вероятность появления "выброса" с математическим ожиданием а — (а,) £ Л^ и ^ х ТУ)- ковариационной матрицей С = (с^); пары и (а,С) различны;
2) независимые переменные {:£{} регистрируются с аддитивными ошибками, и вместо неслучайной последовательпости истинных значений {а^} наблюдается случайная последовательность {¿¡}:
¿4 = 11 + ^2 = (И)
где £2 > 0 — уровень искажения независимых переменных; {г^} С ЫА' — независящая от {к(}, ненаблюдаемая случайная последовательность гауссовских ошибок регистрации регрессоров:
¿Ы =Л/И0х,Е„), СотЦ,«,} = Окхк^фв. (12)
Для модели МЛР (1) с аддитивными ошибками (11), (12) МНК-оцепка матрицы в0 имеет вид:
в = (хтх)~1хту, хт = (х1\...\хп). (13)
Обозначим: \к — единичная (К х А')-матрица, 1К и lкxN — /С-пектор и (К х Лг)-матрица соответственно, элементами которых шляются единицы, I/; = Ьт((ХтХ)~'), г = 1,2. Для (т х р)-матрицы
Т = определим норму ||Г|| = (Е^Е^ •
Теорема 2.2.ЕслиМЛР (1) подвержена (е1; £2)-искажениям (10)-(12), гапк(А') п=' К < п, длительность наблюлений п — фиксирована, то при £2 —► О для МНК-оценки 9, определяемой (13), справедливы асимптотические разложения смещения (5) и вариации (6):
Ь = ^Цк+еЦК -п + 1)(ХТА')-12]„)(ХГХ)-1ХГ 1п ат+
+ 4(К -п + 1)(ХтХ)-1^0° + о{4) 1КхМ, Уу = Щ(хтхг1 + + в.ц(хтх)~1))(хтх)~1+
+ £14{К -п + г^Х)-^^ 1ТПХ + а{Хт 1„ ^)(А'ТХ)-Ч
+а19йи))1тпХ(ХтХ)-')(ХтХу1 + о(4)1КхК, (м = МУ), где Ё„ = (ХтХ)-1Е„(ХтХ)-\ Щ = {ХТХ)~1ХТЩХ,
Щ — ((! - £1)ач + £1 сп + £1(1 - + е\ сца^ 1ПХП .
Теорема 2.3. Если выполнены условия теоремы 2.2 и соотношения (2) для t = п + т, то для алгоритма прогнозирования (3), (13) асимптотические разложения смещения (8) и риска прогноза (9) при a — O.v имеют вид:
/3 = 4(К -71 + l)e0TZv(XTX)-1 + о(4) IjV)
r = r о + xl+T Е (m ((1 + 4 tv((xTx)-^v))(xTxr1+ !=1
+2е|(Я- - n + 1)Ё„) + zn+r + o(el).
Если Cij = (1 + A)<Jij, i,j = l,iV, A > 0 и E„ = Ik, to: to = (1 + £i A)(i/i + e\(vl + (K — n + 2)u2)) tr(E) + e\ i/i||0°||2 + o(e22). Если n —► oo, vi = O(nT') и £2 — o(n"2), то w = (l + £i A)^ + o(^). Отметим, что для заданного значения суммарной среднеквадра-тической ошибки оценивания u>max найдены критические значения (ef,^), гарантирующие заданную точность оценивания w < штах:
»max - Vi tr(E) « dX A ej +¿12 А £* с*2 +d2 sf, где ¿! = v\ tr(E), dn = {v\ + (К — n + 2)г/2) tr(S), = ¿12 + ЧЮР-В разделе 2.3 проведен анализ устойчивости МНК-моделировапия и прогнозирования к функциональным искажениям:
yt = e0Txt + тJf(x*t) +Ut,t = 1,2,..., (14)
где г/ = diagjiyi, щ,..., rj//} — (Дг х N)- диагональная матрица независимых случайных величин Бернулли:
Р{гц = 1} = £3Й Р{Vi = 0} = 1 - £3il i = MV; (15)
0 < ^ai < 1 — вероятность появления функционального искажения fi(Xf) в г-ом уравнении; /(•) = (/¿(-)) : R^* —> Rw — iV-векторная функция, определяющая функциональные искажения; € RA" — ii'-вектор независимых переменных; К* — общее число предикторов; x*tT = (х[\х[) и xt £ Hh ~K — подвектор ненаблюдаемых предикторов. Обозначим: = (хЦ ... |<), FT = (f(x\)\... |/«)).
Теорема 2.4.Если модель MJIP подвержена функциональным искажениям (14), (15), (2), то смещение (5) и вариация (6) МНК-оценки в, определяемой (4), имеют вид:
b=:(XTX)~1XTF£3-, Va = ац(ХтХ)~1 + Е^(ХтХ)-1Хти(Х*)^(Х*) Х(ХТХГ\
где £3 = diag{e3i, е32,.. -, — (N х N)-матрица.
Теорема 2.5.В условиях теоремы 2.4 смешение (8) и риск прогнозирования (9) вектора зависимых переменных уп+т при использованием МИК-алгоритма прогнозирования (3), (4) имеют вид:
/3 = FTX(XTX)-1xn+T - /(<+г));
г = г„(1 + хтп+т{ХтХ)-Чп+г) + рт(3.
Для двух семейств функциональных искажений:
* = {/(О : |Л(«*)| < Mtt i = MV}; Ъ = {/(**) : 11 ^Д^11 < 5},
где ||i:|| — евклидова норма ветора х, а <5 > 0, оценены точные верх-цие границы среднеквадратической ошибки оценивания (7):
sup w < tr(E)^i + jr 4 Mf tT(lnxnX(XTX)-2XTy, /(■)£Fi i= i
sup w < tr(E)i/i + бЧт(МХ(ХтХ)~2Хт),
где M = (тах{||0°та:4||, ||0°Txs||})till=T^ — (л х п)-матрица.
С использованием вычислительных экспериментов проведен анализ устойчивости МНК-алгоритма оценивания и прогнозирования для тестовой модели MJIP к "выбросам" Тьюки-Хьюбера, ошибкам в независимых переменных и функциональным искажениям. Результаты экспериментов показали, что МНК-оценка и прогноз неустойчивы к вышеперечисленным искажениям гипотетической модели.
В третьей главе проводится анализ устойчивости моделирования и прогнозирования с использованием СОУ. Для этого рассматривается полная идентифицируемая система одновременных уравнений:
yi = Y^aj + Xjp°j + j = IJV, (16)
где у3 6 R" — n-вектор наблюдений над j-ой зависимой (эндогенной) переменной; Y3 — (их Л^-матрица Nj эндогенных переменных, включенных в j-oc уравнение; A'J — (их /^-матрица Kj предопределенных (экзогенных, т.е. независимых, и лаговых эндогенных) переменных, включенпых в j-oc уравнение; £J £ Rn — n-вектор случайных ошибок наблюдения; a® £ R'Vj и в'- £ RX) — Nj- и Kj-векторы неизвестных истинных значений параметров.
Относительно случайных ошибок {£■'} предполагается: £{£'} = Л^(0„, аи 1П), Соу{?',С} = а]г 1„, Е = (^)л'х^. (17)
Введем матричные обозначения: А0 = (а^) — (Л' х ЛГ)-матрица параметров = а?-, если г-ая эндогенная переменная включена в правую часть ?-го уравнепия, иначе а^ = 0, здесь (а^) — элементы вектора а°). Аналогично строится (К х Лг)-матрицы параметров В0. Таге как система полная, то 1—Л°| ф 0.
Для модели (16), (17) используется алгоритм прогнозирования:
Уп+Т = дтхп+Т, 0 = В(Х„-А)-\ (18)
где А ж В — оценки матриц параметров А0 и В0.
В теореме 3.1 получены выражения для смещения и среднеква-дратического риска прогнозирования при наличии неслучайных отклонений (ошибок спецификации) А и В от А0 и
/3 - Вхп+Т, г = г0 + х^+тВтБхп+Т,
где В = (1м-Аот - 6АТ)-\В*Т8АТ(Ъ -Аог)-1 + 5Вт)МхК,
г0 = 1г((Ь ->10Т)-1Е(1лг -А0)-1), 8А = А - А0, 8В = В - В0.
В разделе 3.2 исследуются два алгоритма вычисления "аппрок-симационной" оценки параметров СОУ, предложенные Браверма-ном, Мучником и Чернявским2. Введем следующие обозначения:
щ = + кь а = I а1) , # = (У*.
\0/т;х1 \PiJmjXl
. п.н.
Полагая \23XX Е3\ / 0, согласно первому алгоритму, "аппроксимационная" оценка
= (2зтххтгз)-1гзтххтуз. (19)
Согласно второму алгоритму "аппроксимационная" оценка т,-строится для вектора 7° и является нормированным собственным вектором матрицы 2зТХХг23, соответствующим ее минимальному собственному значению:
7,- = уеС1(2'тХХт21), (20)
2Браверман Э.М., Мучпик И.Б., Чернявский А.Л. Аппроксимационный подход к
оцениванию систем одновременных уравнений // Автоматика и телемеханика. — 1978. — № 11. — С. 120-128.
где тГ = -а}, ИК1/?Г), Ъ = > ^ * О,
У* = (^|У^„х(л-.+1), # = (УМА^')пхК+1).
Введем обозначения: Фу, Фд- — ^ х + 1)-, х -матрицы перестановок соответственно, такие, что У3 = УФ^, = ХФ3х, 0 = — (Кх^ + К))-матрица; 0° = В^ь-А0)"1 —
(/¡Г х Л^-матрица; Ф' = Ф^} — ((ЛГ + х (т,-+1))-
матрида; = — (Я х (Л^- + 1))-матрица; в3 = вФ3 =
(0°3\Ф3Х) —■ (К х + 1))-матрица.
Теорема 3.2.Если СОУ (16) идентифицируема и при п —> оо
выполняются условия: -^Ок, ЬХТХ —> ) ф 0, то
оценка , определяемая (19), состоятельна.
Для (т х т)-матрицы И обозначим {А^-О)}^— — упорядоченная по возрастанию последовательность ее собственных значений и — ортонормированная система ее собственных вето-ров, соответствующая {А<. (!))}.
Теорема 3.3.Если СОУ (16) идентифицируема, то смещение оценки определяемой (20), и ((т^ +1) х (т; + 1))-матрица взаимных вариаций ^ 6 Цт'+1, ^ £ 11т''+1 имеют вид:
ь: = - 7;} = А=2 Щи3) ~
(21) (22)
где & - &зТ(ХтХ)2в3, = - Б3},
И"' = - £>') уес1(Д;) - .
Обозначим: Ё„ = с^{£_и, — ((ЛГ + К) х (ЛГ + Ю)-
матрица, = Ф^'И-'Ф1 и Ф = Ф3 уесД/^') \сс[ (П{)Ф{Т.
Следствие.Для СОУ (16), (17) смешение и матрица взаимных вариаций оценки -у-, определяемой (20), имеют вид (21) и (22) и
IV = ет(л'тА)3еФтЁц+ЁиФгвт(х:гх)3е+1г(ФтЁи)0т(хтх)3©+
+ 1г(Фт0г(Л'тХ)3е)Ёц + 1г((ХтХ)2)ЁиФт£и+ + Ц(ХтХ))2ЁиФЁи + 1г(ЁиФ) 1г((ХгХ)2)Ёи, \¥> = tr(Xг.Y)ФJTSцФ^ £„ = -А^)-1^-А0)
В разделе 3.3 проведен анализ устойчивости "аппроксимационно-го" метода идентификации СОУ к аддитивным ошибкам и "выбросам" Тьюки-Хьюбера.
Предположим, что имеет место модель с аддитивными ошибками в независимых неременных (11), (12), и пусть случайные величины описываются моделью "выбросов" Тьюки-Хыобера (10). Тогда, в формуле (20) вместо X, X3 используются соответственно "иска-жеппые" матрицы X, ХК_
Примем обозначения: £„ = егд diag{0лгxлг^
Шх = 1г(Ё„)Я + 1г(ХгХ)Е„ + (п + 1) (ЯЁ„ + Ё„Я) ,
ТУ„ = +1г(Л'гХ)) Ёц, Я = ет(ХтХ)в.
Теорема 3.4.Если идентифицируемая СОУ (16) подвержена (£], ^-искажениям (10), (11), (12), а = 0^, то при е^ —» 0 для "ап-проксимационной" ■ оценки гу] выражения смещения и матрицы взаимных вариаций имеют вид (21) и (22), где
ТУ* = &т(\¥и + + о{е\) Цк+кмн+к))&,
№ = + Схх + Сги + Сиг + о(г2) 1
£и = (1лг -Аог)-15(Ъ -А0)"1, 5 = (зу)лгхлг, зц = (1 - ех)ац + £1 су,
н для С; получены аналитические выражения.
В разделе 3.4 проведен анализ устойчивости "аппроксимационно-го" метода идентификации СОУ к функциональным искажениям. Пусть СОУ подвержена с функциональным искажениям:
у1 = + + + уГ ^ + ^ (23)
(/¡Ы \
где /;(Х) = ; , ¡¿{х^ : —>■ И — функция, определяю-
щая искажения по предопределенным переменным; — (п х Л^--)-матрица эндогенных переменных, не учитываемых при оценивании.
Обозначим: Р — (/х(А')|... |/лг(Х)) — (пх Лг)-матрицу, аналогично как для А0 построим (./V х Л^-матрицу А == (§_,•) и в предположении, что 11дг — А0 — Д| ф 0, (п х ДГ)-матрицу
С = IV -А0 - Л)"1 + ХВ\ 1м -А0)-1(1дг -А0 - Д)-1.
Теорема 3.5.Для идентифицируемой СОУ с функциональными искажениями (23), (17) смещение и матрица, взаимных вариаций оценки определяемой (20), имеют вид (21) и (22), где
= + &ГНФ>,
и получен аналитический вид матриц IV = IV'(С); II = Н(С).
Раздел 3.5 посвящен разработке новых робастных алгоритмов идентификации СОУ. Построена взвешенная "алпроксимационная" оценка являющаяся решением нелинейной системы уравнений:
Е •шк^тхкхкт&ъ = Е юк^тхкхкту\ (24)
¿=1 Ь=1
где веса предлагается выбирать в виде:
\ Н^Ц-П^' -^7)-||-СО8(1-0О)1 , /л тг.
^ = ГМ0,2]- (25)
С использованием вычислительных экспериментов исследовалась устойчивость оценки (24), (25) в зависимости от параметра фо. На рисунке представлена зависимость коэффициента к = ^ от параметра фо для модели "выбросов" Тьюки-Хьюбера (10) при £х = 0; 0,1; 0.3, число прогонов имитационной модели составило <3 = 250, здесь (1а и йц относительная среднеквадратичная ошибка оценивания с использованием "аннроксимационной" и взвешенной "аппроксима-ционпой" оценок соответственно.
Вычислительные эксперименты показали, что взвешенная оценка имеет наибольшую точность при фц —> 0. Используя этот факт, была построена медианная "алпроксимационная" оценка:
7У = агёшш Е ~ I, (26)
11
и исследовала ее устойчивость к искажениям гипотетической модели с использованием вычислительных экспериментов. Как показали результаты вычислительных экспериментов, медианная "алпроксимационная" оценка устойчива к "выбросам'' Тьюки-Хьюбера, ошибкам в независимых переменных и функциональным искажениям.
Четвертая глава посвящена описанию программного обеспечения для моделирования и прогнозирования динамики сложных систем и его применению для решения прикладных задач.
В разделе 4.1 представлены разработанные в диссертации итера-циоппые алгоритмы вычисления оценок параметров СОУ ("аппрок-симационной", взвешенной "аппроксимационной" и медианной "ап-проксимационной" ).
В разделе 4.2 проведен сравнительный анализ существующего программного обеспечения для статистического моделирования и прогнозирования (ППП TSP, GAUSS, STADIA, STATISTICA) с ППП, разработанными на кафедре математического моделирования и анализа данных Белгосуииверситета (СЭМП, "Эконометрика"), в которые включены алгоритмы из раздела 4.1.
В разделе 4.3 рассмотрена актуальная прикладная задача построения модели динамики важнейших макроэкономических показателей народного хозяйства Республики Беларусь. Параметры СОУ, включающей G эпдогенных (N = 6) и 8 предопределенных (К = 8) переменных, были оценены с использованием двухшагового МНК, "аппроксимационного" и медианного "аппроксимациопного" методов. На основе полученных моделей проведено сравнение точности моделирования и прогнозирования (так, с использованием медианного метода достигнута относителная погрешность прогнозирования 9.7 % по сравнению с 23 % для двухшагового МНК).
В конце каждой главы приводится перечень результатов и выводов, в ней полученных, со ссылками на работы соискателя, в которых .они были опубликованы.
В приложении 1 приводятся статистические данные, используемые в ходе вычислительных экспериментов. Приложение 2 содержит акты внедрения результатов диссертационной работы.
ЗАКЛЮЧЕНИЕ
Проведенные исследования позволяют сделать основные выводы.
1. Впервые вычислены количественные характеристики устойчивости МНК-алгорима моделирования и прогнозирования для MJIP при наличии "выбросов" Тьюки-Хьюбера, аддитивных ошибок в независимых переменных и функциональных искажений, показывающие смещенность и несостоятельность МНК-оценок коэффициентов MJIP и МНК-прогноза и позволяющие количественно оценить критический уровень искажений, гарантирующий заданную точность [1,5,6].
2. Впервые аналитически исследованы свойства "аппроксимаци-оппого" метода идентификации СОУ: доказана состоятельность и получены аналитические выражения смещения и вариации "аппрок-симационной" оценки для гипотетической модели [3].
3. Вычислены новые количественные характеристики устойчивости "анпроксимациопной" оценки параметров СОУ к "выбросам" Тыоки-Хьюбера, аддитивным ошибкам в независимых переменных и к функциональным искажениям [3, 5].
4. Построены новые робастные оценки параметров СОУ — взвешенная и медианная "аппроксимационные" оценки — проведен численный апализ их устойчивости к искажениям гипотетической модели [2, 3, 10, 11].
5. Осуществлена программная реализация алгоритмов идентификации СОУ в ППП СЭМП и "Эконометрика". Программы, реализующие на ЭВМ методы идентификации СОУ, применены для экономе-трического моделирования и прогнозирования динамики важнейших макроэкономических показателей экономики Беларуси [7, 8].
СПИСОК ОПУБЛИКОВАННЫХ РАБОТ Статьи в журналах
[1] Харин Ю.С., Сталевская С.Н. Об устойчивости линейного регрессионного прогнозирования // Весщ Акадэмй навук Беларусь Сер. ф1з.-мат. навук. — 1997. — № 4. — С. 9-13.
[2] Сталевская С.Н. Робастный вариант "аппроксимационного подхода" к оцениванию параметров эконометрических систем одновременных уравнений / Ред. ж. Изв. HAH Беларуси. Сер. физ.-мат. н. — Минск, 1999. — 24 с. — Деп. в ВИНИТИ 08.07.99. — № 2225-В99 // Изв. HAH Беларуси. Сер. физ.-мат. н. — 1999. — № 4. — С. 138.
Статьи в рецензируемых сборниках
[3] Staleuskaya S. Robustness of "approximating approach" in identification of econometric simultaneous-equations models // Computer Data Analysis and Modeling: Proc. of the 5th Int. Conf. / Ed. Ayvazyan S.A. — Minsk, 1998. — Vol. 2. — P. 122-127.
[4] Сталевская C.H. Анализ устойчивости прогнозирования с помощью систем одновременных уравнений // Компьютерный Анализ Данпых и Моделирование: Сб. научных статей 5-ой Международной конференции. / Под ред. Айвазяна С.А. — Минск, 1998. — Ч. 4. — С. 174-178.
[5] Kharin Yu.S., Staleuskaya S. Robustness in statistical analysis of regression and simultaneous-equations models // Stochastics'98: Proc. of 13th Prague Conf. / Eds. Huskova M. et al. — Prague, 1998. — Vol. 1. — P. 289-294.
[6] Сталевская C.H. Аиализ устойчивости метода наименьших квадратов к функциональным искажениям для многомерной линейной регрессии // Актуальные Проблемы Информатики: Сб. тр. 6-ой Межд. Конф. / Под ред. Чернявского А.Ф.— Минск, 1998. — Ч. 2. — С. 365-371.
[7] Малюгин В.И., Харин Ю.С., Сталевская С.Н. Компьютерная система эконометрического моделирования и прогнозирования // Актуальные Проблемы Информатики: Сб. тр. 6-ой Межд. Конф. / Под ред. Чернявского А.Ф.— Минск, 1998. — Ч. 2. — С. 371-380.
[8] Малюгин В.И., Харин Ю.С., Сталевская С.Н. Математическое и программное обеспечение эконометрического моделирования и прогнозирования динамики важнейших макроэкономических показателей // Формирование Экономических и Социальных Основ Белорусской Государственности: Материалы научно-практической конференции. /Под ред. Никитенко П.Г. — Минск, 1998. —С. 110-117.
[9] Сталевская С.Н. Устойчивость метода наименьших квадратов при лаличип зависимых ошибок наблюдения // Новые Информационные Технологии в Образовании: Сб. тр. 3-ей Межд. конф. / Под ред. Морозевича А.Н. — Минск, 1998. — Ч. 1. — С. 27-29.
[10] Сталевская С.Н. Робастизация "аппроксимационного" подхода к оцениванию параметров систем одновременных уравнений // РRIP'99: Proc. of the 5th Int. conf. / Eds. Sadykhov R. et al. — Minsk, 1999. — Vol. 2. — P. 363-367.
Тезисы
[11] Staleuskaya S., Kharin Yu. Robust version of "approximating approach" in forecasting by econometric simultaneous-equations models // Multivariate Statistics: Abstracts. / Ed. Kollo T. — Tartu, 1999. — P. 51. X
РЕЗЮМЕ
Сталевская Светлана Николаевна Устойчивое моделирование и прогнозирование с использованием многомерной регрессии и систем одновременных уравнений
Ключевые слова: статистическое моделирование и прогнозирование, идентификация, многомерная линейная регрессия, системы одновременных уравнений, искажения гипотетической модели, устойчивость (робастность).
В диссертации проведен анализ устойчивости моделирования и прогнозирования с использованием многомерной линейной регрессии и систем одновременных уравнений к искажениям гипотетической модели.
Вычислены количественные характеристики устойчивости моделирования и прогнозирования динамики сложных систем на основе метода наименьших квадратов для многомерной линейной регрессии и на основе "аппроксимационного" метода оценивания параметров для систем одновременных уравнений при наличии "выбросов" Тыоки-Хьюбера, аддитивных ошибок в независимых переменных и функциональных искажениях гипотетической модели.
Разработаны робастные алгоритмы идентификации систем одновременных уравнений — взвешенный и медианный — и исследована их устойчивость к искажениям гипотетической модели с использованием вычислительных экспериментов.
Разработанные и исследованные алгоритмы идентификации систем одновременных уравнений вошли в пакеты прикладных программ СЭМП (Система Эконометрического Моделирования и Прогнозирования) и "Эконометрика".
РЭЗЮМЭ
Сталеуская Святлана Мшалаеуна
Устойл1вао мадэл1раванне i прагназ]раванпе з выкарыстаннем мпагамернай рэгрэсй i астэм адначасовых урауненняу
Ключавыя словы: статыстычнае мадэл!раватшс i лрагназ1раван-не, ¡дэнтыфжацыя, мнагамерная лшейная рэгрэая, сктэмы адначасовых урауненняу, скажэнш гшатэтычнай мадэл!, устойл1васць (ра-баснасць).
У дысертацьп праведзены аналЬ устойл1васщ мадэл1равання i прагназ1равання для мнагамернай лшейнай рэгрэсй i астэм адначасовых урауненняу да скажэнняу гшатэтычнай мадэлги
Атрыманы колъкасныя характарыстыю устойл1васщ мaдэлipa-н.шня i прагназ1равання па аспове метаду найменшых квадратау для мнагамернай лшейнай рэгрэсй i на аснове "аппрак-амацыйнага" метаду ацэньвання параметрау для сктэм адначасовых урауненняу да "выкщау" Цюш-Хубера, адытыупых памылак у незалежных пераменных i функцыянальных скаженняу гшатэтыч-пай мадэль
Распрацавапы рабаспыя алгарытмы щэнтыфшацъп астэм адначасовых урауненняу — узважанны i медыянны — i даследавана ix устойл1васць да скажэпняу гшатэтычнай мадэл1 з выкарыстаннем выл1чальных эксперыментау.
Распрацаваныя i даследаваныя алгарытмы щэнтыфшацъп cíct3m адпачасовых урауненняу увайшл1 у пакеты прыкладных праграм СЭМП (Слстэма Эканаметрычнага Мадэл1равання i Прагназ1раван-ня) i "Эканаметрыка".
SUMMARY
Staleuskaya Sviatlana Mickalaeuna Robust modelling and forecasting by multivariate regression and simultaneous equations systems
Key words: statistical modelling and forecasting, identification, multivariate linear regression, simultaneous equations systems, distortions of hypothetical model, robustness.
This thesis is devoted to the problem of analysis of robustness modelling and forecasting by multivariate linear regression and simultaneous equations model in presence of distortions of hypothetical model.
The stability measurements of modelling and forecasting based on least squares method for multivarite linear regrssion and based on "approximating" method for simultaneous equations systems in presence of Tukey-Huber "outliers", errors in exogenous variables and model mis-speducations are given.
The new robust algorithms of identification of simultaneous equations systems (weighted and median) are developed and investigated in presence of distortions of hypothetical model by simulations.
The developed and investigated algorithms of identification of simultaneous equations systems are realized in the packeges of applied programms SEMF (System of Econometric Modelling and Forecasting) and "Econometrica".
-
Похожие работы
- Асимптотическая теория устойчивого оценивания
- Разработка и исследование многомерно-матричных алгоритмов линейного оценивания характеристик многоагрегатных ТП и массивов экспериментальных данных
- Энтропийное моделирование динамики многомерных стохастических систем
- Планирование эксперимента, оценивание параметров и выбор структуры при построении моделей многофакторных объектов по неоднородным, негауссовским, зависимым наблюдениям
- Оптимизация минимально контрастного оценивания нелинейной однопараметрической парной регрессии
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность