автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Экспериментальное исследование эффективности теоретико-информационных методов прогнозирования

кандидата технических наук
Приставка, Павел Анатольевич
город
Новосибирск
год
2011
специальность ВАК РФ
05.13.01
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Экспериментальное исследование эффективности теоретико-информационных методов прогнозирования»

Автореферат диссертации по теме "Экспериментальное исследование эффективности теоретико-информационных методов прогнозирования"



На правах рукописи

005004848

Приставка Павел Анатольевич

ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВНИЕ ЭФФЕКТИВНОСТИ ТЕОРЕТИКО-ИНФОРМАЦИОННЫХ МЕТОДОВ ПРОГНОЗИРОВАНИЯ

Специальность: 05.13.01 «Системный анализ, управление и обработка информации» (связь и информатизация)

- 8 ДЕК 2011

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Новосибирск — 2011

005004848

Работа выполнена на кафедре прикладной математики и кибернетики Федерального государственного образовательного бюджетного учреждения высшего профессионального образования "Сибирский государственный университет телекоммуникаций и информатики "ФГОБУ ВПО «СибГУТИ»").

Научный руководитель:

доктор технических наук,

профессор

Рябко Б.Я.

Официальные оппоненты:

Ведущая организация:

доктор технических наук, профессор Трофимов В.К.

кандидат физико-математических наук, доцент

Монарев В.А.

ФГБОУ ВПО "Томский государственный университет систем управления и радиоэлектроники"

Защита состоится "16" декабря 2011 г. в "13" часов на заседании диссертационного совета Д 219.005.03 при ФГОБУ ВПО "Сибирский государственный университет телекоммуникаций и информатики", по адресу: 630102, г. Новосибирск, ул. Кирова, д. 86, ком. 625.

С диссертацией можно ознакомиться в библиотеке ФГОБУ ВПО "СибГУТИ".

Автореферат разослан ; " 15" ноября 2011 г

Ученый секретарь

диссертационного совета Д 219.005.03 кандидат технических наук,

доцент / Бунцев И. А..

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Диссертация посвящена

экспериментальному исследованию теоретико-информационных методов прогнозирования сложных прикладных процессов.

Известно, что методы прогнозирования служат для исследования системных связей и закономерностей функционирования и развития объектов и процессов с использованием современных методов обработки информации и являются важным средством в анализе сложных прикладных систем, обработке информации, целенаправленном воздействии человека на объекты исследования, с целью повышения эффективности их функционирования.

Методы прогнозирования, т.е. специального научного исследования конкретных перспектив развития какого-либо процесса, находят самое широкое применение на практике в различных областях. К их числу можно отнести, например, анализ социальных, экономических и геофизических событий.

Особое внимание уделяется проблеме прогнозирования временных рядов, т. е. функции, определённой на оси времени, так как этот класс задач широко связан с многими проблемами экономики, геофизики и других областей. Эти методы играют ключевую роль в повышения эффективности, надежности и качества технических, экономических, биологических, медицинских и социальных систем.

Благодаря практической важности методов прогнозирования их разработке и совершенствованию посвящены работы многих исследователей в нашей стране и за рубежом, среди которых можно отметить К. Гаусса, К. Пирсона, Дж. Бокса, Г. Дженкинса, Р. Шамвей, В. Вандаеле, Л. Вей, Р. Хиндмана. Также с целью развития исследований в области прогнозирования и его использования для решения прикладных задач был создан Международный Институт Прогнозистов (International Institute of Forecasters), организовывающий ежегодные международные тематические конференции; на различных уровнях на регулярной основе проводятся конкурсы для определения наиболее точных методов прогнозирования.

Среди наиболее известных методов прогнозирования мы отметим многомерную регрессию, в том числе с использованием непараметрических оценок плотности распределения, которая представляет на настоящий момент основной статистический аппарат прогнозирования. Отметим также, что для автоматизации и контроля части операций при построении прогноза возможно использование специальных компьютерных программ. Среди подобных инструментов прогнозирования можно выделить такие программы как Autobox, Statistica.

Несмотря на наличие многих эффективных методов прогнозирования, связанных с разнообразным математическим аппаратом (спектральный анализ, регрессивный анализ и другое), алгоритмов, связанных с построением экспертных оценок, многие проблемы еще далеки от своего разрешения. Одна из

з

важнейших таких проблема - повышение качества прогнозирования характеристик систем, описываемых временными рядами. Например, в журнале «Международный журнал прогнозирования» («International Journal of Forecasting») более половины статей посвящены вопросам прогнозирования временных рядов. В специализированных журналах, посвященных системному анализу и прогнозированию экономических процессов, таких как, например, «Журнал экономического прогнозирования» ("Journal for Economic Forecasting"), этому направлению уделяется большое внимание.

Число публикаций, посвященных методам прогнозирования временных рядов, постоянно увеличивается. Полученные в них новые научные знания постоянно применяются для решения задач в сложных прикладных системах.

Объектом цсследовапия являются методы и алгоритмы прогнозирования временных характеристик сложных прикладных систем в экономике, геофизике и других областях.

Целью работы является экспериментальное исследование теоретико-информационных методов прогнозирования применительно к задачам анализа временных характеристик сложных прикладных систем, обработке информации, целенаправленном воздействии человека на процессы с целью повышения эффективности их функционирования. Ранее в работах1,2 Рябко Б.Я. было доказано, что разработанные методы прогнозирования являются асимптотически оптимальными (т.е. оптимальны при объеме наблюдений стремящемся к бесконечности), однако сведения об оценке качества получаемых на их основе прогнозов при решении практически важных задач отсутствовали.

Задачи исследования. Для достижения поставленной цели были решены следующие задачи:

1. Анализ известных методов прогнозирования характеристик сложных систем.

2. Разработка алгоритмов и программных реализаций теоретико-информационных методов прогнозирования.

3. Прогнозирование характеристик экономических систем, описывающих интегральные показатели их эффективности (на примере показателей безработицы, курсов валют, показателей ВВП).

1 Рябко Б. Я. Прогноз случайных последовательностей и универсальное кодирование // Проблемы передачи информации. 1988. Т. 24, № 2. Р. 3-14.

2 Ryabko В. Compression-Based Methods for Nonparametric Prediction and Estimation of Some Characteristics of Time Series // IEEE Transactions on Information Theory. 2009. V. 55, № 9. P. 4309-4315.

4. Прогнозирование характеристик геофизических процессов, влияющих на функционирование экономических систем.

5. Разработка практических рекомендаций по применению теоретико-информационных методов прогнозирования.

Достоверность результатов обеспечивается корректным применением методов математической статистики и теории вероятностей.

Научная новизна диссертации заключается в следующем:

1. Разработан алгоритм прогнозирования временных рядов, основанный на универсальных кодах, время работы которого близко к линейному, что позволяет использовать его при прогнозировании практически важных процессов.

2. Разработана методика применения данного алгоритма к прогнозированию характеристик сложных экономических систем и показано, что получаемые прогнозы обладают более высоким качеством, чем ранее известные методы.

3. Разработана методика применения данного алгоритма к прогнозированию характеристик сложных геофизических систем и показано, что получаемые прогнозы обладают более высоким качеством, используемые в настоящее время методы.

4. Выработаны практические рекомендации по применению теоретико-информационного подхода к прогнозированию временных характеристик различных сложных систем.

Практическая ценность полученных результатов

Разработанные алгоритмы являются важными методами интеллектуальной поддержки при принятии управленческих решений в различных сложных системах с целью повышения эффективности их функционирования. При решении ряда задач прогнозирования разработанные методы обеспечивают на порядок более высокое, чем ранее известные методы, качество прогнозов.

Внедрение результатов исследования в практику Основные результаты использованы при выполнении следующих проектов и государственных программ:

• Проект Федеральной целевой программы «Разработка эффективных методов кодирования, передачи, защиты и хранения информации, основанных на теоретико-информационном подходе». Государственный контракт № 02.740.11.0396

• Проект РФФИ 09-07-00005-а «Разработка эффективных методов стеганографии и стегоанализа» (руководитель - Рябко Б. Я.)

• Гранты для выполнения научных исследований аспирантами, магистрантами и молодыми преподавателями ФГОБУ ВПО «СибГУТИ», 2009 и 2010 гг.

Результаты работы внедрены в учебный процесс на кафедре ПМиК в программах курсов «Защита информации» (бакалавриат) и «Современные

проблемы информатики» (магистратура) по направлению подготовки 230100 «Информатика и вычислительная техника».

Апробация работы

Основные результаты диссертационной работы докладывались и обсуждались на следующих российских и международных конференциях:

• ХП1 Российская конференция «Распределенные информационные и вычислительные ресурсы» (Новосибирск, 2010)

• XLIX Международная научная студенческая конференция «Студент и научно-технический прогресс» (Новосибирск, 2011)

• «Информатика и проблемы телекоммуникаций» (Новосибирск, 2011)

• Applied Methods of Statistical Analysis. Simulations and Statistical Inference (Russia, Novosibirsk, 2011)

• International Symposium on Forecasting (Czech Republic, Prague, 2011)

Предложенные методы были представлены на международный конкурс по прогнозированию, где показали высокую точность.

Публикации. По теме диссертации опубликовано 9 печатных работ, в том числе 2 работы в научных журналах и изданиях, внесённых в перечень журналов и изданий, утвержденных ВАК. Результаты работы отражены в отчетах по грантам и НИР. Список работ приведен на странице 16-17 автореферата.

Основные положения, выносимые на защиту

1. Экспериментально доказано, что теоретико-информационные методы прогнозирования, основанные на универсальном кодировании, обеспечивают высокое качество прогноза при их практическом применении к сложным системам.

2. Качество результатов разработанного метода при прогнозировании сложных прикладных экономических и геофизических систем выше, чем у ранее известных методов.

3. Разработанные методы целесообразно применять при прогнозировании характеристик сложных систем в экономике, геофизике и других областях при решении задач управления и обработки информации.

Структура диссертации. Диссертация занимает 153 страницы текста и состоит из введения, пяти глав, заключения, списка литературы и приложения. Работа содержит 18 таблиц и 29 рисунков. Список литературы включает 102 источника.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, сформулированы цель и задачи исследования, представлены основные положения диссертационной

работы, выносимые на защиту.

В первой главе в общем виде формулирется задача прогнозирования временных рядов. Пусть есть некоторый источник, порождающий последовательности хгхг... элементов из некоторого множества А, которое может быть как конечным множеством, так и некоторым непрерывным интервалом. Предполагается, что распределение вероятностей символов на выходе источника не изменяется со временем и не зависит от конкретной реализации процесса (источник является стационарным и эргодическим). Пусть источник порождает сообщение вида ...xt^1xt, X; е Л для всех i, i = 1,2, ...,t, и требуется спрогнозировать п следующих элементов. Ошибкой прогноза называется апостериорная величина отклонения прогноза от действительного состояния объекта. Отмечается, что ошибка прогноза может характеризовать его качество. Рассматривается наиболее приближенный к реальности случай, когда априорные сведения о распределении вероятностей источника отсутствуют. Предлагается решить задачу прогнозирования путем нахождения точных оценок вероятностей указанного распределения. Приводится описание подхода, базирующегося на алгоритмах сжатия данных, и подхода на основе универсальной меры, направленных на достижение данной цели. Производится описание конкретного метода, который разработан и исследован в диссертационной работе.

По определению мера р называется универсальной, если для любого стационарного и эргодического источника Р верны следующие равенства:

limi(—logPC^i -^t) — logOi -*t)) = 0

t-»C° t

с вероятностью 1, и

lim 7 У P(u) log(F(u)//;(u)) = 0 t-> 00 t ' 1 USA*

(Здесь и ниже log* = log2 x.)

Данные равенства показывают, что, в некотором смысле, мера ц является непараметрической оценкой для (неизвестной) меры Р. По этой причине универсальные меры могут быть использованы для оценки статистических характеристик процесса и прогнозирования. Впервые, подобная попытка была предпринята Рябко БЛ. в 1988 году, и на сегодняшний день известно, что универсальные коды могут успешно применяться для проверки гипотез, оценки параметров и прогнозирования временньж рядов. Однако в настоящее время имеются лишь предварительные данные о результатах применения данных методов прогнозирования к решению практических задач.

Далее приводится описание универсальной меру R, которая была использована в качестве основы для метода прогнозирования в данной работе. Предлагаемый метод может использовать любую другую универсальную меру. Выбор нами именно меры R связан с тем, что она основана на асимптотически оптимальном универсальном коде, т.е. коде, который преобразует последовательность символов, порожденную дискретным источником, таким

образом, что длина полученной кодовой последовательности асимптотически минимальна. Для описания меры Я приводится определение меры Кричевского Кт > 0, которая сама по себе тоже является вероятностной оценкой для множества Марковских источников с памятью, или связностью, ш, ш > 0; По определению,

1

Кт(х1 =

\А\*

ГТ иаел(Т(ухСВа) + 1/2)/Т(1/2)))

1ИГ1 1ЛбДт (Г(уХ(0) + |Л|/2)/Г(|Л|/2))

гдео^О?)— число последовательностей д, встречающихся в х, ух(т9) = 2аеА х — хг - хи а ГО- это гамма-функция. Определяется также

распределение вероятностей {ы = ыъи>2, — } для целых {1,2,...} как

щ = 1/1оеС* + 1) - 1/1ое(£ + 2), I = 1,2,...

Мера К определяется как

00

КС*! ...Х{) = ^ СО^К^Х! ...Х() 1=0

Итак, значение меры Я может служить оценкой вероятности исхода процесса и использоваться для решения задачи прогнозирования дискретного источника.

Предлагается следующий способ прогнозирования процессов, которые порождают значения из непрерывного интервала.

Пусть {П,Р,Р} - вероятностное пространство Х1,Х2,... -стохастический процесс, каждое Х( которого принимает значения из стандартного Борелевого пространства. Предположим, что совместное распределение Рп для (Х1,Х2,— Дп) имеет функцию плотности вероятности р{х1х2-.хп) по отношению к сигма-конечной мере!. В качестве Ь может выступать мера Лебега, счетная мера и т.д. Пусть {Яп}, п > 1, будет возрастающей последовательностью конечных разбиений 12, которые асимптотически генерирует борелевское поле на Р, и пусть обозначает элемент Пк, который содержит точку При этому саму процедуру получения таких разбиений будем называть квантизацией. Для целых «и п следующим образом определим приближение величины плотности:

рЧхг.....хп) = Р(х^.....-*пИ)

Определим теперь соответствующую плотность г как:

со

5=1

Плотность г(хг является оценкой неизвестной плотности р(хх ... х^, а соответствующая условная плотность

г{а\хг ...хг) = г(хг ...х^/фг ...х£)

является подходящей оценкой р(а[хг

В силу того, что на практике статистические характеристики процессов могут изменяться со временем, и, следовательно, «старые» данные не будут содержать информации о «новых» статистических характеристиках, может возникнуть вопрос о том, последовательность какой длины нужно использовать в качестве входных данных. . Если ответ на данный вопрос не очевиден, то возможно использовать меру Ё, определение которой приводится далее. Пусть хг... - некоторая последовательность источника. Пусть N - множество различных натуральных чисел. Для каждого п из N рассмотрим выборку х^п+1...х1. Другими словами, фактически, каждая выборка состоит из п последних элементов исходной последовательности. Каждую отдельно взятую выборку данного множества назовем «окном», а соответствующее п - его размером. Предположим, N = (тгх, ...,пк},к > 1, тогда:

к

Й(х1 ...хг) = ...Л*),

¡=1

где 5}ь ¿о2,..., - это распределение ненулевых вероятностей, £¡=1 с31 = 1. Аналогично величине Я, Ё может использоваться для оценки вероятности исхода процесса и использоваться для прогнозирования. Как видно из определения, при расчете данной величины учитываются последовательности («окна») различной длины, и соответствующие Я «склеиваются» с некоторыми вероятностями. В общем случае вычисления на основе Ё, должны автоматически обеспечивать удобство использования метода без существенного снижения качества прогнозов. Отмечается, что подобный режим вычислений в дальнейшем будет называться адаптивным.

В конце главы приводятся практические аспекты реализации метода. Вторая глава посвящена прогнозированию солнечной активности методом на основе универсальной меры. В начале главы приводится описание объекта исследования и показывается его практическая важность. Известно, что солнечная активность оказывает влияние на множество критически важных для человека процессов на Земле. Так, например, в 18-ом веке английский ученый У. Гершель установил существенную корреляцию между солнечной активностью (СА), урожаями и ценами на хлеб. В 19-ом веке исследователями Джевонсом, а поднее Мовесом и Делоне, была выявлена взаимосвязь социальной динамики и СА, что помогло объяснить существование экономических циклов в сельском хозяйстве и промышленности. А. Чижевский установил синхронизацию между максимумами СА и появлениями эпидемии и эпизоотий, а также ускоренным размножением некоторых биологических видов. Более того, была установлена взаимосвязь между революциями и войнами и максимумами СА и показано, что наиболее ярко выраженные изменения в жизни социума происходят в периоды резкого увеличения СА. Изучением СА занимаются многие коллективы и организации, поддерживаемые на разных уровнях.

Далее, производится прогнозирование временных рядов, состоящих из следующих показателей СА: среднемесячное и сглаженное среднемесячное число солнечных пятен, абсолютный ежедневный и ежемесячный потоки солнечного излучения. На основе полученных результатов показывается, что для каждого рассмотренного временного ряда в ходе экспериментов были выявлены параметры расчетов, при которых средняя абсолютная ошибка прогноза за 25 экспериментов составляет менее 2.5% от длины интервала, из которого процесс принимает значение.

Производится сравнение качества краткосрочных прогнозов СА: полученного на основе исследуемого метода и сформированного используемой в настоящее время сотрудниками Национального центра геофизических данных США (NGDC) программой. Для иллюстрации результата приводится рис. 1.

При использовании программы NGDC сопоставимая средняя абсолютная ошибка прогноза наблюдалась лишь на первых четырех прогнозных значениях и была равной 1.95. При проведении 10 экспериментов она выросла до 5.51, а по завершении всех 21 вычислений данной серии экспериментов указанная величина составила 16.39, при этом наблюдалась ярко выраженная тенденция к росту ошибки прогноза с увеличением его порядкового номера.

Реа!ы«е временного ряда

прогноз грели»*« NGDC —— — прогноз на основа меры R

Рис. 1. Результаты прогнозирования СА

Таким образом, на основании графика можно сказать, что в данном случае при построении краткосрочного прогноза исследуемый метод на основе

ю

универсального кода Л оказался более эффективным. Данные на сервере NGDC представлены так, что провести другие эксперименты по сравнению получаемых краткосрочных прогнозов невозможно.

В третьей главе рассматривается прогнозирование геомагнитной активности и показателей уровня моря с помощью метода на основе универсальной меры. В начале главы приводятся необходимые сведения об исследуемых процессах и показывается их актуальность. Так, например, указывается, что сильные геомагнитные бури опасны для людей, страдающих сердечно-сосудистыми заболеваниями. В периоды геомагнитных бурь у людей снижается внимание и реакция, что естественным образом затрагивает различные сферы, так как многие критически важные функции, такие как диспетчер, водитель, оператор и другие, по-прежнему выполняются человеком. В 1989 году сильная геомагнитная буря на восемь часов оставила без электричества столицу Канады Оттаву. В 1997 году из-за всплеска геомагнитной активности произошло отключение телевизионного спутника Telstar 401 компании AT&T. Годом позже по той же причине произошли сбои в работе спутника Galaxy IV, управлявшего банкоматами и системами авиационного слежения. Геомагнитные бури вызывают помехи в мобильной связи, сбои в работе сети Интернет, нарушают работу высокочастотной авиационной радиосвязи. Что касается уровня моря, то процесс его изменения также оказывает влияние на функционирование нашей планеты, вызывая различные последствия: затопление низкорасположенных территорий, эрозию морских побережий и отвесных скал, проникновение солей в водоносные слои, повышение уровня грунтовых вод, усиление ущерба от наводнений и штормов. Средний уровень моря играет исключительно важную роль в авиации, где стандартное давление моря используется для измерения высоты над уровнем поря при полетах. В виду особой важности процесса, для изучения его и его последствий было создано множество специальных организаций, к которым относятся, например, Permanent Service for Mean Sea Level (PSMSL) и National Oceanographic and Atmospheric Organization (NOAA).

В качестве показателя геомагнитной активности рассматривается обще принятый DST-индекс и проводится его прогнозирование на один шаг вперед методом на основе универсальной меры R и пакетом прогнозирования Statistica 8.0 с последующим сравнением качества достигнутых результатов. Отмечается, что при вычислениях статистическим пакетом использовался его модуль «Data Miner», реализующий технологию Data Mining, представляющую собой средство интеллектуального анализа данных, позволяющее определять скрытые зависимости и закономерности в последовательностях входных данных без каких-либо априорных сведений о них. Результаты сравнения показаны в табл. 1.

Первая колонка таблицы содержит длину последовательности известных членов временного ряда, которая использовалась для формирования соответствующих прогнозов. Вторая и третья колонка содержат значения средней абсолютной ошибки прогноза за 25 экспериментов, полученные при использовании исследуемого метода на основе универсальной меры R и пакета Statistica 8.0 соответственно. (Отметим, что значение средней абсолютной

и

ошибки выражается в наноТеслах).

На основе данных, представленных в табл. 1 делается вывод о том, что в условиях отсутствия априорных сведений о распределении вероятностей исходов процесса использование метода R обеспечило более точные, чем при использовании модуля Data Miner пакета Statistica 8.0, результаты.

Таблица 1. Результаты прогнозирования значений DST-индекса

Длина R Statistica 8.0

500 3.08 4.36

1000 1.88 7.56

2000 3.68 6.16

3000 3.24 10.00

4000 3.6 18.24

Выполняется сравнение между собой результатов прогнозирования на один шаг вперед для 15-минутных показателей уровня моря зафиксировнного рядом с Дувром, Соединенное Королевство: полученного с помощью метода на основе меры К и вычисляемого в Национальном океанографическом центре

Соединенного Королевства (НОЦСК).

Вычисления исследуемым методом проводятся в сочетании с предварительным преобразованием временного ряда. В качестве средства предварительной обработки использованных; в экспериментах данных была применена операция дифференцирования, под которой будем погашать преобразование исходной последовательности в последовательность

^...ср, где <р1=х1+1-хь I = 1,2, ...,М. Прогнозное значение х£+1 определяется путем сложения последнего известного члена исходной последовательности х( и прогнозного значения сри вычисленного на основе данных продифференцироного временного ряда. Результаты вычислении

содержатся в табл. 2.

Первая колонка табл. 2 содержит названия методов, на основе которых строился прогноз. Здесь, II - это исследуемый метод на основе универсальной меры, а ЮС - это метод НОЦСК. Оставшиеся колонки содержат значения средней абсолютной ошибки за 10 экспериментов, выраженные в метрах. Следует отметить, что для прогнозирования с помощью исследуемого метода данная величина вычислялась либо при использовании соответствующей длины временного ряда, либо при вычислениях в адаптивном режиме. Для прогнозов N00 данная величина вычислялась на предоставленных НОЦСК данных о

качестве результатов их прогнозов.

Таблица 2. Результаты прогнозирования значений 15-минутных показателей уровня моря в сочетании с предварительным дифференцированием временного

ряда

Метод 500 1000 2000 5000 Адаптив.

R 0.034 0.038 0.040 0.037 0.037

NOC 0.18 0.134 0.126 0.134 -

На основе сравнительного анализа результатов прогнозирования 15-минутных показателей уровня моря делается вывод, что использование используемого метода в сочетании предварительным дифференцированием исходного временного ряда позволило обеспечить преимущество рассмотренной реализации метода над используемой НОЦСК программой для прогнозирования.

В четвертой главе рассматривается процесс прогнозирования методом на основе универсальной меры таких социально-экономических индексов как уровень безработицы, показатели внутреннего валового продукта (ВВП), валютные курсы EUR/USD и EUR/GBP. Приводится описание рассматриваемых процессов и показывается их практическая значимость. Уровень безработицы является важнейшим показателем, характеризующим положение социальную обстановку в регионе. Высокий уровень безработицы, например, может способствовать снижению доходов населения, потерю квалификации работниками, таким экономическим явлениям как снижение ВВП, ухудшению криминогенной обстановки. ВВП, в свою очередь, является центральным макроэкономическим показателем, применяемым во всем мире для характеристики функционирования национальной экономики. Что касается валютного курса, то огромное влияние этого показателя на макроэкономику очевидно. С помощью валютного курса производится сопоставление цен на товары и услуги в различных странах мира. Конкурентоспособность отечественных товаров и услуг на мировом рынке, объемы экспорта и импорта также напрямую зависят от значений этого показателя. Колебания валютного курса могут показывать экономическую и политическую стабильность государства.

Осуществляется прогнозирование на один шаг вперед ежемесячного уровня безработицы и ежегодных показателей ВВП США с последующей оценкой качества достигнутых результатов путем их сравнения с прогнозами, полученными с помощью использования инерционного метода прогнозирования, в котором последнее известное значение временного ряда считается прогнозным значением следующего элемента. Несмотря на кажущуюся простоту, инерционное прогнозирование действительно является одним из действенных

способов проверки и контроля создаваемых методов прогнозирования и является средством оценки методов прогнозирования, рекомендованным сервисом ForecastmgPrinciples.com, поддерживаемым Международным Обществом Прогнозистов. По результатам сравнения делается вывод о преимуществе

исследуемого метода.

Производится прогнозирование на один шаг вперед ежедневных значении валютного курса EUR/USD и EUR/GBP с помощью метода на основе универсальной меры R, инерционного прогнозирования и программы Autobox 6.0 с последующим сравнением между собой качества полученных результатов Программа Autobox б.Опредставляет собой разработанное компанией Automated Forecasting Systems средство для прогнозирования временных рядов. Согласно представленной на сайте компании информации программа Autobox 6.0 выбрана в качестве «Лучшей специализированной в области прогнозирования» программы в учебнике «Принципы прогнозирования»3. На последнем проведенном конкурсе прогнозирования "NN5" году в категории «Ежедневные данные» она заняла 1-ое место среди автоматизированных средств. В материалах сайта, посвященных описанию свойств программного продукта, подчеркивается, что отличительной чертой Autobox 6.0, помимо высокого качества результатов, является простота использования ("Autobox is simply the easiest way to forecast"), так как все необходимые предварительные настроики для вычислений способны осуществляться автоматически. В силу того что основными преимуществами исследуемого метода прогнозирования также являются высокое качество прогнозов и способность автоматически обнаруживать скрытые зависимости и закономерности в последовательности входных данных, делается вывод об обоснованности выбора программы Autobox 6.0 в автоматическом режиме прогнозирования в качестве средства, с которым

осуществлялось сравнение.

Результаты экспериментальных вычислений, относящиеся к результатам прогнозирования рассмотренных валютных курсов, содержатся в табл. 3 и табл. 4 соответственно.

Таблица 3. Результаты прогнозирования валютного курса EUR/USD

Метод 500 1000

I 0.0030 0.0059

Autobox 6.0 0.0142 0.0191

R 0.0030 0.0058

3 Armstrong J.S. Principles of forecasting: a practitioners. Kluwer Academic Publishers, New York, 2002

handbook for researchers and

Таблица 4. Результаты прогнозирования валютного курса EUR/GBP

Метод 500 1000

I 0.0025 0.0010

Autobox 6.0 0.0195 0.0012

R 0.0019 0.0009

Табл. 3 и табл. 4 имеют следующую структуру. Первая колонка содержит названия методов, на основе которых строился прогноз. Как и прежде, R и I - это исследуемый метод на основе универсальной меры и инерционное прогнозирование соответственно, а Autobox 6.0 - это одноименная программа прогнозирования. Оставшиеся колонки содержат значения средней абсолютной ошибки прогноза за 10 экспериментов, полученные при прогнозировании с использованием соответствующей длины последовательности известных членов временного ряда.

Делается вывод, что при прогнозировании значений ежедневных валютных курсов EUR/USD и GBP/EUR метод на основе универсальной меры R действительно оказался эффективнее и инерционного способа прогнозировании, и программы Autobox 6.0 в автоматическом режиме.

В пятой главе описывается представление разработанного метода на основе универсальной меры в международном конкурсе методов прогнозирования М4, проводимого при поддержке Международного Общества Прогнозистов.

Подробно описываются цели конкурса, среди которых изучение качества, действенности и пригодности различных методов прогнозирования, обеспечение объективности и возможности повторного воспроизведения результатов, представление полученных результатов и выводов в сети Интернет и открытие публичной дискуссии на тему улучшения значимости прогнозирования путем увеличения его полезности и важности для специалистов по принятию решений. Подробно описываются предоставленные организаторами наборы данных. Среди прочего отмечается, что для обеспечения большей объективности все временные ряды разделены на различные категории. Описывается способ формирования прогнозов разработанным методом для участия в конкурсе. Известно, что существуют различные способы прогнозирования с применением исследуемого метода на основе универсальной меры R, включающие, прежде всего, использование различных длин последовательностей известных членов временного ряда, а также предварительное преобразование его членов. Учитывая, что все представленные в рамках конкурса процессы носят различный характер, с целью обеспечения наиболее точных результатов перед

формированием прогноза для каждого временного ряда на его данных производилась предварительная настройка параметров использования метода, заключающаяся в следующем. Для каждого временного ряда определялось некоторое количество последних элементов и, далее, осуществлялось их прогнозирование с использованием набора различных параметров метода. Параметры, обеспечивающие наиболее точные результаты, использовались для формирования требуемого в рамках конкурса прогноза. Параметры метода задают различные длины периода основания прогноза, а также наличие предварительного дифференцирования временного ряда.

Для наглядности приводятся результаты настройки метода для отдельно взятой категории, содержащей наименьшее количество временных рядов. Указывается, что аналогичные результаты достигаются при прогнозировании временных рядов других категорий. По результатам анализа отношения средней абсолютной ошибки прогнозов к длине интервала, из которого процесс принимает значение, делается вывод о том, что применение универсальной меры Л обеспечивает высокое качество получаемых прогнозов.

ОСНОВНЫЕ ЗАКЛЮЧЕНИЯ И ВЫВОДЫ

В рамках диссертационной работы было осуществлено экспериментальное исследование теоретико-информационных методов прогнозирования, основанных на универсальном кодировании, применительно к практически важным данным. Анализ результатов исследования показал, что разработанные подходы и методы во многих случаях в аналогичных условиях обеспечивают более высокое качество, чем применяемые в настоящее время средства прогнозирования, включающие специализированные для некоторых данных методы, а также программные средства общего назначения. Полученный результат позволяет утверждать, что разработанные подходы и методы целесообразно применять при прогнозировании характеристик сложных систем, представляющих социально-экономические, геофизические и другие области.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Приставка П.А., Экспериментальное исследование метода прогнозирования, основанного на универсальных кодах II Вестник СибГУТИ. 2010. № 4. С. 26-35.

2. Приставка П. А. Применение теоретико-информационных методов прогнозирования к анализу экономических и геофизических данных // Вестник СибГУТИ. 2011. № 2. С. 35-41.

3. Приставка П, А. Использование суперкомпьютера для экспериментального исследования метода прогнозирования, основанного на универсальных кодах // ХШ Российская конференция «Распределенные информационные и вычислительные ресурсы». Новосибирск,, 30 ноября —3 декабря, 2010. С. 23.

4. Приставка П. А. Использование универсальных кодов для прогнозирования временных рядов // XLIX Международная научная студенческая конференция "Студент и научно-технический прогресс", Информационные технологии. Новосибирск, 16-20 апреля, 2011. С. 244.

5. Приставка П. А. Применение архиваторов для обнаружения скрытых структур данных во временных рядах // Российская научно-техническая конференция «Информатика и проблемы телекоммуникаций». Новосибирск, 21-22 апреля, 2011. С. 40-41.

6. Приставка П. А. Использование метода прогнозирования на основе универсальной меры в сочетании с предварительным преобразованием членов временного ряда ряда // Российская научно-техническая конференция «Информатика и проблемы телекоммуникаций». Новосибирск, 21-22 апреля, 2011. С. 41-42.

7. Ryabko В., Pristavka P. Experimental investigation of forecasting methods based on universal measures // The 31st Annual International Symposium on Forecasting, Prague, Czech Republic, June 26 - June 29,2011. P.l 16.

8. Ryabko В., Pristavka P. Practical application of forecasting method based on universal measure // Applied Methods of Statistical Analysis. Simulations and Statistical Inference. Novosibirsk, Russia, September 20 - September 22, 2011. P. 269.

9. Программа для прогнозирования значений временных рядов с помощью метода на основе универсального кода // Свидетельство о регистрации программы для ЭВМ № 2011613813 от 16.05.2011 Федеральной службы по интеллектуальной собственности, патентам и товарным знакам.

Приставка Павел Анатольевич

Экспериментальное исследование эффективности теоретико-информационных методов прогнозирования

Автореферат диссертации на соискание ученой степени кандидата технических наук

Подписано в печать НОЗГрЯ 2011 г. Формат бумаги 60x84/16, отпечатано на ризографе, шрифт № 10, изд. л. 1,6, заказ №5?, тираж 100 экз., ФГОБУ ВПО "СибГУТИ". 630102, г. Новосибирск, ул. Кирова, д. 86.

Оглавление автор диссертации — кандидата технических наук Приставка, Павел Анатольевич

Введение.

Глава 1. Описание методов прогнозирования.

1.1. Введение.

1.2. Краткий обзор современных тенденций в области прогнозирования.

1.3. Прогнозирование на основе методов сжатия данных.

1.4. Прогнозирование на основе универсальной меры.

1.4.1 Описание подхода.

1.4.2 Практические аспекты реализации и использования метода.

1.4.2.1 Реализация метода.

1.4.2.2 Определение параметров метода при практическом использовании.

1.4.3 Пример практического применения.

Выводы.

Глава 2. Прогнозирование солнечной активности.

2.1. Описание предметной области.

2.2. Экспериментальные результаты.

2.2.1 Прогнозирование на один шаг вперед.

2.2.2 Сравнение краткосрочных прогнозов.

Выводы.

Глава 3. Прогнозирование геомагнитной активности и показателей уровня моря.

3.1. Описание предметной области.

3.1.1 Геомагнитная активность.

3.1.2 Уровень моря.

3.2. Экспериментальные результаты.

3.2.1 Прогнозирование ОБТ-индексов.

3.2.2 Прогнозирование показателей уровня моря.

Выводы.

Глава 4. Прогнозирование социально-экономических процессов.

4.1. Описание предметной области.

4.1.1 Безработица.

4.1.2 Валовой внутренний продукт.

4.1.3 Валютный курс.

4.2. Экспериментальные результаты.

4.2.1 Прогнозирование уровня безработицы США.

4.2.2 Прогнозирование ВВП США.

4.2.3 Прогнозирование валютных курсов.

Выводы.;.:.

Глава 5. Участие в международном конкурсе по прогнозированию М

5.1. Международный конкурс по прогнозированию М4.

5.2. Прогнозирование данных для участия в конкурсе М4.

Выводы.

Основные заключения и выводы.

Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Приставка, Павел Анатольевич

Актуальность исследования Диссертация посвящена экспериментальному исследованию теоретико-информационных методов прогнозирования сложных прикладных процессов. '

Известно, что методы прогнозирования служат для исследования системных связей и закономерностей функционирования,и развития' объектов и процессов с использованием современных методов обработки информации и являются важным средством в анализе сложных прикладных систем, обработке информации, целенаправленном воздействии человека на объекты исследования, с целью повышения эффективности их функционирования.

Методы: прогнозирования, т.е: специального научного: исследования конкретных перспектив развития какого-либо процесса, находят самое широкое: применение на практике в различных» областях. К их числу можно отнести, например^ анализ социальных, экономических и геофизических: событий^

Особое, внимание уделяется; проблеме прогнозирования временных рядов,- т. е. функции, определённой' на осивремени,. так как этот класс1 задач широко' связан с: многими проблемами экономики, геофизики и других областей; Эти методы играют ключевую роль в повышения эффективности, надежности и качества технических, экономических, биологических, медицинских и социальных систем.

Благодаря практической важности методов прогнозирования- их разработке и совершенствованию посвящены работы многих исследователей в нашей стране и за рубежом, среди которых можно отметить К. Faycca, К. Пирсона,, Дж; Бокса, Г. Дженкинса, Р. Шамвей, В; Вандаеле, JI: Вей, Р. Хиндмана. Также с целью развития исследований в области прогнозированиями его использования для решения прикладных задач был создан Международный Институт Прогнозистов: (International Institute of"' Forecasters), организовывающий ежегодные международные тематические конференции; на различных уровнях на регулярной основе проводятся конкурсы для определения наиболее точных методов прогнозирования.

Среди наиболее известных методов прогнозирования мы отметим многомерную регрессию, в том числе с использованием непараметрических оценок плотности распределения, представляющую на сегодняшний день основной инструмент прогнозирования Отметим также, что для автоматизации и контроля части операций при построении прогноза возможно использование специальных компьютерных программ. Среди подобных средств прогнозирования можно выделить такие программы как Autobox, Statistical

Несмотря на наличие многих эффективных методов прогнозирования, связанных с разнообразным математическим аппаратом (спектральный анализ, регрессивный анализ и другое), алгоритмов, связанных' с построением экспертных оценок, многие проблемы еще далеки от своего разрешения. Одна из' важнейших таких проблема - повышение качества прогнозирования характеристик систем, описываемых временными рядами: Например, в журнале «Международный журнал прогнозирования» («International Journal ' of Forecasting»)- более половины статей посвящены вопросам прогнозирования, временных рядов. В специализированных журналах, посвященных системному анализу и прогнозированию экономических процессов, таких как, например, «Журнал экономического прогнозирования» ("Journal for Economic Forecasting"), этому направлению уделяется большое внимание.

Число публикаций, посвященных методам прогнозирования временных рядов, постоянно увеличивается. Полученные в них новые научные знания постоянно применяются для решения задач в сложных прикладных системах.

Объектом исследования являются методы и алгоритмы г прогнозирования временных характеристик сложных прикладных систем в экономике, геофизике и других областях.

Цели работы и задачи исследования является экспериментальное исследование теоретико-информационных методов прогнозирования применительно к задачам анализа, временных характеристик сложных прикладных систем, обработке информации, целенаправленном воздействии человека на процессы с целью повышения эффективности их функционирования. Ранее работах Рябко Б.Я. [4,67] было показано, что разработанные методы прогнозирования являются асимптотически оптимальными (т.е. оптимальны при объеме наблюдений- стремящемся к бесконечности), однако сведения об оценке качества получаемых на1 их основе прогнозов при решении практически важных задач отсутствовали. ' '

Для достижения поставленной цели были!решены следующие задачи:

1. Анализ известных методов прогнозирования, характеристик сложных систем.

2. Разработка алгоритмов и программных реализаций теоретико-информационных методов прогнозирования.

3. Прогнозирование характеристик экономических систем, описывающих интегральные показатели их эффективности (на примере* показателей безработицы, курсов валют, показателей ВВП).

4. Прогнозирование характеристик геофизических процессов, влияющих на функционирование экономических систем.

5. Разработка практических рекомендаций по применению теоретико-информационных методов прогнозирования.

Достоверность результатов обеспечивается- корректным применением методов математической статистики и теории вероятностей.

Научная новизна диссертации заключается в следующем:

1. Разработан алгоритм прогнозирования временных рядов, основанный на универсальных кодах, время работы которого близко к линейному, что позволяет использовать его при прогнозировании практически важных процессов.1 '

2. Разработана методика применения данного алгоритма к прогнозированию характеристик сложных экономических систем и показано, что получаемые прогнозы обладают более высоким качеством, чем ранее известные методы.

3. Разработана методика применения данного алгоритма к прогнозированию характеристик сложных; геофизических систем- и показано, что получаемые прогнозы обладают более- высоким, качеством, чем используемые в настоящее время методы.

4. Выработаны практические рекомендации по применению теоретиког информационного подхода к прогнозированию г временных характеристик различных сложных систем

Практическая ценность реализации Разработанные алгоритмы являются важными методами^ интеллектуальной поддержки при принятии, управленческих решений в различных сложных системах с целью повышения эффективности их функционирования. При. решении ряда задач? прогнозирования; разработанные методы обеспечивают на порядок более высокое, чем ранее известные методы, качество прогнозов.

Внедрение результатов исследования в практику Основные результаты ' использованы при выполнении следующих проектов и государственных программ:

• Проект Федеральной целевой, программы «Разработка эффективных методов кодирования, передачи, защиты и хранения информации, основанных на теоретикогинформационном подходе». Государственный контракт № 02.740; 11.0396 -.

• Проект РФФИ 09-07-00005-а «Разработка эффективных методов стеганографии и стегоанализа» (руководитель - Рябко Б. Я.)

• ; Гранты для" выполнения научных исследований '" аспирантами, магистрантами и молодыми преподавателями ФГОБУ ВПО «СибГУТИ», 2009 и 2010 гг.

Результаты работы внедрены в учебный процесс на кафедре ПМиК в программах курсов «Защита информации» (бакалавриат) и «Современные проблемы информатики» (магистратура) по направлению подготовки 230100 «Информатика и вычислительная техника».

Апробация работы

Основные результаты диссертационной работы докладывались и обсуждались на следующих российских и международных конференциях:

• XIII Российская конференция «Распределенные информационные и вычислительные ресурсы» (Новосибирск, 2010)

• XLIX Международная научная студенческая конференция «Студент и научно-технический прогресс» (Новосибирск, 2011)

• «Информатика и проблемы телекоммуникаций» (Новосибирск, 2011)

• Applied Methods of Statistical Analysis. Simulations and Statistical Inference (Russia, Novosibirsk, 2011)

• International Symposium on Forecasting (Czech Republic, Prague, 2011)

Публикации

По теме диссертации опубликовано 9 печатных работ, в том числе 2 работы в научных журналах и изданиях, внесённых в перечень журналов и изданий, утвержденных ВАК. Результаты работы отражены в отчетах по грантам и НИР. Список работ приведен на страницах 16-17 автореферата.

Основные положения, выносимые на защиту

1. Экспериментально доказано, что теоретико-информационные методы прогнозирования, основанные на универсальном кодировании, обеспечивают высокое качество прогноза при их практическом применении к сложным системам.

2. Качество результатов разработанного метода при прогнозировании сложных прикладных экономических и геофизических систем выше, чем

• у ранее известных методов.

3. Разработанные методы целесообразно применять при прогнозировании характеристик, сложных систем в экономике, геофизике и других областях при решении задач управления и обработки информации.

Структура диссертации Диссертация занимает 153 страницы текста и состоит из введения, пяти глав, заключения, списка литературы и приложения. Работа содержит 18 таблиц и 29 рисунков. Список литературы включает 102 источника.

Заключение диссертация на тему "Экспериментальное исследование эффективности теоретико-информационных методов прогнозирования"

ОСНОВНЫЕ ЗАКЛЮЧЕНИЯ И ВЫВОДЫ

В рамках диссертационной работы было осуществлено экспериментальное исследование теоретико-информационных методов прогнозирования, основанных на универсальном кодировании, применительно к практически важным данным. Анализ результатов исследования показал, что разработанные подходы и методы во многих случаях в аналогичных условиях обеспечивают более высокое качество прогнозов, чем применяемые в настоящее время средства прогнозирования, включающие специализированные для некоторых данных методы, а также программные средства общего назначения. Полученный результат позволяет утверждать, что разработанные подходы и методы целесообразно применять при прогнозировании характеристик сложных систем, представляющих социально-экономические, геофизические и другие области.

Библиография Приставка, Павел Анатольевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Дуванин А.И. Уровень моря. Л.: Гидрометеоиздат, 1956. с. 59

2. Колмогоров А. Н. Три подхода к определению понятия "количество информации" // Проблемы передачи информации. 1965. Т. 1, № 1, Р. 3-11.

3. Рябко Б. Я. Дважды универсальное кодирование // Проблемы передачи информации. 1984. Т. 20, № 3. С. 24-28

4. Рябко Б. Я. Прогноз случайных последовательностей и универсальное кодирование //Проблемы передачи информации. 1988. Т. 24, № 2. Р. 3-14.

5. Сайт FIFA Электронный ресурс. Режим доступа: http://www.fifa.com/worldcup/archive/, свободный.

6. Сайт конкурса по прогнозированию M4competition » Электронный ресурс. Режим AOCTynahttp://m4competition.com/, свободный.

7. Сайт конкурса по прогнозированию NN5 Электронный ресурс. Режим доступа : http://www.neural-forecasting-competition.com/NN5/index.htm, свободный.

8. Сайт организации «Automatic Forecasting Systems» Электронный ресурс. Режим доступа: http://autobox.com/, свободный.

9. Сайт организации «National Océanographie and Atmospheric Organization» Электронный ресурс. — Режим доступа: http://www.noaa.gov/, свободный.

10. Сайт организации «International Institute of forecasters» Электронный ресурс. Режим доступа: http://www.forecasters.org/, свободный.

11. Сайт организации «Permanent Service for Mean Sea Level»Электронный ресурс. Режим доступа: http://www.psmsl.org/, свободный .

12. Сайт организации «StatSoft» Электронный ресурс. Режим доступа: http://www.statsoft.ru/, свободный.

13. Сайт сервиса «British Oceanographic Data Centre. UK National Tide Gauge Network» Электронный ресурс. — Режим доступа: https://www.bodc.ac.uk/data/onlinedelivery/ntslf/, свободный.

14. Сайт сервиса «ForecastinPriciples.com» Электронный ресурс. Режим доступа: http://www.forecastingprinciples.com/, свободный.

15. Сайт сервиса «FreeLunch.com» Электронный ресурс. — Режим доступа: http://www.economy.com/freelunch/default.asp, свободный.

16. Сайт сервиса «FXHISTORICALDATA.COM» Электронный ресурс. -Режим доступа: http://www.fx-historicaldata.com/, свободный.

17. Сайт сервиса «Geomagnetic Data & Models» Электронный ресурс. -Режим доступа: http://www.ngdc.noaa.gov/geomag/geomag.shtml, свободный.

18. Сайт сервиса «Space Weather & Solar Events» Электронный ресурс. — Режим доступа: http://www.ngdc.noaa.gov/stp/spaceweather.html, свободный.

19. Сайт сервиса,«Space Weather Prediction Center» Электронный ресурс. — Режим доступа http://www.swpc.noaa.gov/, свободный .

20. Фитингоф Б. М. Оптимальное кодирование при неизвестной и меняющейся статистике сообщений // Проблемы передачи информации. 1966. Т. 2, № 2. С.3-11.

21. Цариков М.В. Влияние С А на людей и экономику. Электронный ресурс. Режим доступа: http://tonos.ru/articles/sunpower, свободный.

22. Aha D. Lazy learning. Kluwer Academic Publishers, Norwell, MA, USA, 1997.

23. Ahmed N. et al. An empirical comparison of machine learning models for time series forecasting // Econometric Reviews. 2010. V. 29, Issue 5-6. P. 594-621.

24. Alpaydin E. Introduction to Machine Learning, Second Edition.( Adaptive Computation and Machine Learning). The MIT Press, February 2010.

25. Anders U., Korn O. Model selection in neural networks // Neural Netw./ 1999. V. 12, Issue 2. P.309-323.

26. Arctowskij H. On solar. faculae; and solar constant- variations > //Proceedings of the National Academy of Sciences of USA-. 4940,. June-15- V. 26. Issue, 6.JP.

27. Armstrong J;S. Principles of forecasting: a handbook for researchers and practitioners. Kluwer Academic Publishers, New York, 2002.

28. Atiya A. et all, A comparison between neural-network forecasting techniques -case study: River flow forecasting // IEEE Transactions on Neural Networks. 1999. V. 10. P.402-409.

29. Bates J; M., Granger, C. W. J. The combination.of forecasts // OR. 1969. V. 20, Issue 4'. P.451-468.

30. Bontempi G. Local Learning Techniques for Modeling, Prediction-and Control. Ph.d., IRIDIA-Universit de Libre de Bruxelles, BELGIUM; 1999.

31. Bontempi G. Long term time series prediction with multi-input multi-output local learning // In Proceedings of the 2nd European. Symposium on Time Series-Prediction (TSP), ESTSP08. Helsinki, Finland, February 2008. P. 145-154.

32. Bontempi G., Taieb S. Conditionally dependent strategies for multiple-step-ahead prediction in local learning // International Journal of Forecasting. 2011. V. 27, Issue 3. P. 689-699.

33. Camp etf al. Karst aquifer investigation' using absolute: gravity // Eos» Transi P^Cti. 200 6. V: 87, Issue:30'; R 298

34. Chapellc O., Vapnikr V. Model selection for support vector machines. In Advances in Neural Information Processing Systems 12. MIT Press, 2000.

35. Cheng H. et al. Multistep-ahead time series prediction // Lecture Notes in Computer Science. 2006. V. 3918. P. 765-774.

36. Clemen R. Combining forecasts: A- review and' annotated bibliography // International Journal of Forecasting. 1989: V. 5, Issue 4. P. 559-583 .

37. Engle R. Autoregressive conditional heteroscedasticity with estimates of the variance ofUnitedKingdom//Econometrica. 1982. V. 50, Issue 4. P. 987-1007.

38. Fayyad U., Uthurusamy R., Data mining and knowledge discovery in databases. 1996. Comm. ACM. V. 39, Issue 11. P. 24-27.

39. Foukal P. V., Mack P. E., Vernazza J. E. The effect of sunspots and faculae on the solar constanthe // Astrophysical Journal. 1977. V. 215. P. 952.

40. Gallager R. G. Information Theory and Reliable Communication, John Wiley & Sons, New York, 1968.

41. Gooijer J., Hyndman R. 25 years of time series forecasting // International Journal of Forecasting. 2006. V. 22, Issue 3. P. 443-473.

42. Gooijer J., Kumar K. Some recent developments in non-linear time series modelling, testing, and forecasting // International Journal of Forecasting. 1992. V. 8, Issue 2. P. 135- 156.

43. Gruzin A., Ryabko B. Practical Application of Universal-Codes to Time Series Forecasting // In Proceedings of 2009 XII International Symposium on Problems, of Redundancy in Information and Control Systems. P. 10 15.

44. Hamzaebi C., Akay D., Kutay F. Comparison of direct and' iterative articial neural network forecast approaches in multi-periodic time series forecasting // Expert Systems with Applications. 2009. V. 36, Issue 2, Part 2. P. 3839- 3844.

45. Hand. D. Mining-the past to-determine the future: Problems and possibilities //' International Journal of Forecasting. 2009. V. 25, Issue 3. P. 441-451.

46. Hastie T., Tibshirani R., Friedman J. The elements of statistical learning: data mining, inference and prediction. Springer, 2 edition, 2009.

47. Hylleberg S. Modelling seasonality. Oxford University Press, Oxford, UK, 2 edition, 1992.

48. Kelly J.L. A new interpretation of information rate. // Bell System Tech. J. 1956. V. 35, P. 917-926.

49. Kline D. M. Methods for multi-step time series forecasting with neural networks // Neural Networks in Business Forecasting. 2004. P. 226-250.

50. Krichevsky R. A relation between the plausibility of information about a source andencoding redundancy // Problems Inform. Transmission. 1968. V. 4, Issue.3. P. 48-57.

51. Krichevsky R. Universal Compression and Retrival. Kluver Academic Publishers, 1993.

52. Lapedes A., Farber R. Nonlinear signal processing using neural networks: prediction and system modelling. Technical Report LA-UR-87-2662, Los Alamos National Laboratory, Los Alamos, NM, 1987.

53. Lendasse A. ESTSP 2007: Proceedings, 2007.

54. Lendasse A. ESTSP 2008: Proceedings, 2008.

55. Makridakis S., Wheelwright S., Hyndman R. Forecasting: Methods and Applications. John Wiley & Sons, 1998.

56. Mitchell T. Machine Learning. McGraw-Hill, New York, 1997.

57. Nelson M. et al. Time series forecasting using neural networks: should the data be deseasonalized first? // Journal of Forecasting. 1999. V. 18, Issue 5. P. 359367.

58. Nevill-Manning, C.G., Witten, I.H. Identifying Hierarchical Structure in Sequences: A linear-time algorithm //Journal of Artificial Intelligence Research.1997. Y. 7. P. 67-82.i s

59. Nevill-Manning, C.G., Witten, I.H., Paynter, G.W. Lexically-Generatedi Subject Hierarchies for Browsing Large Collections// International Journal ofi

60. Digital Libraries. 1999. V. 2, Issue 3. P: 111-123.i

61. Palit A. K., Popovic D. Computational Intelligence in Time Series Forecasting: Theory and Engineering Applications (Advances in Industrial Control). Springer

62. Verlag New York, Inc., Secaucus, NJ, USA, 2005.

63. Poskitt D.S., Tremayne A.R. The selection and use of linear and bilinear time s series models // International Journal of Forecasting. 1986. V 2, Issue 1. P. 101114

64. Price S. Mining the past to determine the future: Comments // International Journal of Forecasting. 2009. V. 25, Issue 3. P.452-455.

65. Rissanen J. Universal coding, information, prediction, and estimation // IEEE Transactions on Information Theory. 1984. V. 30, Issue 4. P. 629-636.

66. Ryabko В. Compression-based methods for nonparametric on-line prediction, regression, classification and density estimation of time series.

67. Festschrift in Honor of Jorma Rissanen on the Occasion of his 75th Birthday, Tampere, 2008, P. 271 288.

68. Ryabko B. Compression-Based Methods for Nonparametric Prediction and Estimation of Some Characteristics of Time Series // IEEE Transactions on Information Theory. 2009. V. 55, № 9. P. 4309-4315.

69. Ryabko B. Applications of Universal Source Coding to Statistical Analysis of Time Series. In: Isaac Woungang et al. (Eds.), Selected Topics inTnformation and Coding Theory, World Scientific Publishing, 2010. P. 289 338.

70. Ryabko B. Ya. The complexity and effectiveness of prediction algorithms // J. Complexity. 1994; V. 10, Issue. 3. P. 281-295.

71. Ryabko В., Astola J. Universal Codes as a Basis,-for Time Series Testing // Statistical Methodology. 2006. V. 3, № 4, P. 375-397.

72. Ryabko В., Monarev V. Using Information Theory Approach to Randomness Testing // Journal of Statistical Planning and Inference. 2005. V. 133, № l.P. 95110.

73. Ryabkoi В., Monarev V. Experimental Investigation of Forecasting Methods Based on Data Compression Algorithms // Problems of Information Transmission. 2005. V.41, Issue. 1. P. 65-69.

74. Sorjamaa A. et al. Methodology for long-term prediction of time series // Neurocomputing. 2007. V. 70, Issue 16-18. P. 2861-2869.

75. Sorjamaa A., Lendasse A. Time series prediction using dirrec strategy // In M. Verleysen, editor, ESANN06, European Symposium on Artificial Neural Networks. Bruges, Belgium, April 26-28 2006. P. 143-148.

76. Souhaib B. et al. Long-term prediction of time series by combining direct and mimo strategies // International Joint Conference on Neural Networks, 2009.

77. Sven Crone. NN3 Forecasting Competition. Электронный ресурс. — Режим доступа: http://www.neural-forecasting-competition.com/NN3/index.htm, свободный.

78. Sven F. Mining the past to determine the future: Comments // International Journal of Forecasting. 2009. V. 25, Issue 3. P.456-460.

79. Taieb S. et al. A review and comparison of strategies for multi-step ahead time series forecasting based on the NN5 forecasting competition. Электронный ресурс. ' Режим доступа: http://arxiv.Org/PScache/arxiv/pdf/1108/l 108.3259vl.pdf, свободный. 2011.

80. Tiao G., Tsay R. Some advances in non-linear andi adaptive modelling in time-series // Journal of Forecasting. 1994. V. 13, Issue 2. P. 109-131.

81. Timmermann A. Forecast combinations. In G. Elliott, C. Granger, and A. Timmermann, editors, Handbook of Economic Forecasting. P. 135-196. Elsevier Pub., 2006

82. Tong H. Non-linear Time Series: A Dynamical System Approach. Oxford University Press, 1990.

83. Tong H. Threshold models in Nonlinear Time Series Analysis. Springer Verlag, Berlin, 1983.

84. Tong H., Lim K. S. Threshold autoregression, limit cycles and cyclical data //. Journal of the Royal Statistical. Series В (Methodological). 1980. V.42, Issue 3. P. 245-292.

85. Usoskin I. Millennium-Scale Sunspot Number Reconstruction: Evidence for an Unusually Active Sun since the 1940s // Phys. Rev. Lett. . 2003. V. 21. P.211101-211104.

86. Weigend A. S., Gershenfeld N. A. Time series prediction: Forecasting the future and understanding the past, 1994

87. Weigend A. S., Huberman B. A., Rumelhart D. E. Predicting sunspots and exchange rates with connectionist 48networks. In M. Casdagli and S. Eubank, editors, Nonlinear modeling and forecasting. P. 395-432. Addison-Wesley, 1992

88. Werbos P. Beyond Regression: New Tools for Prediction and Analysis in the Behavioral Sciences. PhD thesis, Harvard University, Cambridge, MA, 1974.

89. Werbos P. Generalization of backpropagation with application to a recurrent gas market model // Neural Networks. 1988. V. 1, Isuue 4. P.339- 356.

90. Willson et al. Observations of Solar Irradiance Variability // Science. 1981. V. 211, Issue 4483. P. 700-702.

91. Yapici T. Influences of interplanetary magnetic field on the variability of the aerospace media. Электронный ресурс. Режим доступа: http://www.ae.metu.edu.tr/~tyapici/, свободный

92. Zhang G. P., Qi M. Neural network forecasting for seasonal and trend time series // European Journal of Operational Research. 2005. V. 160, Issue 2. P.501-514.

93. Zhang G., Patuwo В. E., Michael Y. H. Forecasting with articial neural networks:: The state of the art // International Journal of Forecasting. 1998. V. 14, Issue 1. P. 35-62.

94. Работы автора, в которых изложены основные результаты диссертации

95. Статьи и доклады на конференциях, зарегистрированные программы

96. Приставка П. А. Экспериментальное исследование метода прогнозирования, основанного на универсальных кодах // Вестник СибГУТИ. 2010. № 4. С. 26-35.

97. Приставка П. А. Применение теоретико-информационных методов прогнозирования к анализу экономических и геофизических данных //

98. Вестник СибГУТИ. 2011. № 2. С. 35-41.

99. Приставка П. А. Использование универсальных кодов для прогнозирования временных рядов // XLIX Международная научная студенческая конференция "Студент и научно-технический прогресс", Информационные технологии. Новосибирск, 16-20 апреля, 2011. С. 244.

100. Приставка П. А. Применение архиваторов для обнаружения скрытых структур данных во временных рядах // Российская научно-техническая конференция «Информатика и проблемы телекоммуникаций». Новосибирск, 21-22 апреля, 2011. С. 40-41.

101. Ryabko В., Pristavka P. Experimental investigation of forecasting methods based on universal measures // The 31st Annual International Symposium on Forecasting, Prague, Czech Republic, June 26 June 29, 2011. P. 116.

102. Ryabko В., Pristavka P. Practical application of forecasting method based on universal measure // Applied Methods of Statistical Analysis. Simulations and Statistical Inference. Novosibirsk, Russia, 20 -22 September, 2011. P. 269.