автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов
Автореферат диссертации по теме "Метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов"
ИГНАТОВ НИКОЛАЙ АНАТОЛЬЕВИЧ
МЕТОД ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ С РЕГУЛЯРНЫМИ ПЕРИОДИЧЕСКИМИ КОМПОНЕНТАМИ НА ОСНОВЕ МОДЕЛИ ПЕРИОДИЧЕСКИ КОРРЕЛИРОВАННЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ
СПЕЦИАЛЬНОСТЬ 05.13.01 «Системный анализ, управление и обработка информации» (информатика, управление и вычислительная техника)
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
2 9 ГЕН 2011
Москва 2011
4854813
Работа выполнена на кафедре «Автоматизированные системы обработки информации и управления» Московского авиационного института (государственного технического университета) «МАИ».
Научный руководитель:
доктор технических наук, профессор Хахулин Геннадий Федорович
Официальные оппоненты:
доктор технических наук, профессор Балык Владимир Митрофанович
кандидат технических наук Мелихов Василий Олегович
Ведущая организация: ОАО ВПК "НПО машиностроения", Россия, 143966, Московская область, г. Реутов, ул. Гагарина, д.ЗЗ.
Защита диссертации состоится 10 октября 2011 г. в 11 часов 00 минут на заседании диссертационного совета Д 212.125.11 при Московском авиационном институте (государственном техническом университете) «МАИ» по адресу: 125993, А-80, ГСП-3, Москва, Волоколамское шоссе, дом 4, зал заседаний Ученого Совета МАИ.
С диссертацией можно ознакомиться в библиотеке МАИ.
Автореферат разослан 8 сентября 2011 г.
Ученый секретарь
диссертационного совета Д 212.125.1 кандидат технических наук, доцент
Горбачев Ю.В.
/
ВВЕДЕНИЕ
Актуальность исследования
Решение задачи прогнозирования играет важнейшую роль в процессах как стратегического планирования, так и оперативного управления в различных сферах науки и техники.
Прогнозирование временного ряда (или реализации скалярного случайного процесса) является одной из распространенных форм постановки задачи прогнозирования.
Применение каких-либо из существующих в настоящее время математических моделей и методов прогнозирования временных рядов тесно связано со спецификой предметной области и классификацией прогнозируемого временного ряда.
Рассматриваемый в настоящей работе класс временных рядов с регулярными периодическими компонентами является весьма распространенным, в частности, для предметных областей, в которых существенно влияние периодических факторов. Примерами таких рядов являются: различные макроэкономические показатели (например, помесячные значения индексов промышленного производства), аэродинамические коэффициенты летательного аппарата в процессе полета, почасовые объемы выработки электрической и тепловой энергии объектами генерации и, как следствие, цена 1 кВтч электрической энергии на нерегулируемом рынке Российской Федерации, почасовые объемы потребления электрической энергии объектами ЖКХ и некоторыми промышленными предприятиями, метеорологические и гидрологические процессы и множество других. Таким образом, в силу наличия временных рядов данного класса в самых разных сферах в принципе, решение задачи их прогнозирования является актуальной и важной научно-технической задачей.
Существует несколько математических моделей и методов, специально разработанных для прогнозирования временных рядов с регулярными периодическими компонентами, например, модель сезонного скользящего среднего (Хольт и Винтере, 1950-1960), сезонная модель АРПСС (Бокс и Дженкинс, 1970), метод сингулярного спектрального анализа (реализация, названная методом «Гусеница» в России, разрабатывалась в Санкт-Петербургском Государственном Университете в 1997-2010 годах), а также ряд нейросетевых алгоритмов прогнозирования, в основном, получившим распространение с середины 90-х годов XX века.
Проведенный в настоящей работе анализ выявил ряд существенных недостатков данных методов. В частности, сезонное скользящее среднее и сезонная модель АРПСС не учитывают в полном объеме всю информацию о корреляционной связи между сечениями прогнозируемого ряда, а практическое применение метода сингулярного спектрального анализа и нейросетевых алгоритмов затруднено их слабой формализацией и необходимостью высокой квалификации оператора.
\
Таким образом, актуальной является задача разработки нового метода прогнозирования временных рядов с регулярными периодическими компонентами, лишенного указанных недостатков других методов и моделей: более полный, по сравнению с сезонным скользящим средним и сезонной моделью АРПСС, учет статистических характеристик прогнозируемого ряда увеличивает эффективность прогнозирования, а разработка и реализация формального алгоритма применения метода - обеспечить легкость решения практических задач.
Объект исследования
Временньш ряды с регулярными периодическими компонентами.
Предмет исследования
Задача прогнозирования временных рядов с регулярными периодическими компонентами.
Цель исследования
Повышение эффективности прогнозирования временных рядов с регулярными периодическими компонентами с точки зрения критерия среднего квадрата ошибки.
Задачи исследования
Для достижения поставленной цели были решены следующие научно-технические задачи:
1. Разработан метод решения задачи прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированного случайного процесса;
2. Разработанный метод прогнозирования реализован в программном комплексе «Автоматизированная система прогнозирования динамических процессов»;
3. Разработана методика проверки возможности применения разработанного метода прогнозирования и выполнено ее применение для статистического исследования временного ряда с регулярными периодическими компонентами;
4. Проведены статистические испытания разработанного метода прогнозирования на имеющихся данных и выполнено сравнение его эффективности с сезонной моделью АРПСС и нейросетевыми методами прогнозирования.
Методы исследования
Поставленные задачи решались с использованием методов системного анализа, математического программирования, теории оптимального планирования и управления, теории вероятностей и математической статистики, статистической динамики и теории эффективности систем управления, объектно-ориентированного программирования.
Научная новизна работы заключается в следующем:
I. Разработан и реализован метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов;
2. Показана более высокая эффективность разработанного метода в рамках решения задачи прогнозирования временных рядов с регулярными периодическими компонентами по сравнению с актуальными в настоящее время сезонной моделью АРПСС и нейросетевой моделью.
Научные результаты, выносимые на защиту:
1. Разработанный метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов;
2. Алгоритмическая и программная реализация разработанного метода прогнозирования;
3. Разработанная методика проверки возможности применения разработанного метода прогнозирования;
4. Результаты статистических испытаний, подтверждающие эффективность разработанного метода прогнозирования по сравнению с актуальными в настоящее время сезонной моделью АРПСС и нейросетевой моделью.
Практическая значимость результатов
Программный комплекс «Автоматизированная система прогнозирования динамических процессов», реализующий разработанный метод, внедрен и используется в группе компаний «ТеплоЭлектроГенерация» в процессе разработки режимов управления производством электрической энергии.
Апробация работы
Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:
1) Всероссийская конференция молодых ученых и студентов «Информационные технологии в авиационной и космической технике-2008». 21-24 апреля 2008 г. Москва.
2) 2-я Всероссийская конференция молодых ученых и студентов «Информационные технологии в авиационной и космической технике-2009». 20-24 апреля 2009 г. Москва.
3) XVII Международный научно-технический семинар. Алушта, 2008.
4) 8-я Международная конференция «Авиация и космонавтика-2009». г. Москва.
5) XVIII Международный научно-технический семинар. Алушта, 2009.
6) XIX Международный научно-технический семинар. Алушта, 2010.
Публикации
Основные результаты диссертационной работы опубликованы в 8 печатных работах, в том числе, 1 публикация в ведущем рецензируемом научном журнале «Мехатроника, автоматизация, управление», входящем в список ВАК РФ; 1 публикация в ведущем рецензируемом научном журнале «Научные труды: Институт народнохозяйственного прогнозирования РАН», входящем в список ВАК РФ;
выполнена государственная регистрация программного комплекса, реализующего разработанный метод, в качестве программы для ЭВМ, свидетельство №2011613068.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения, списка источников из 57 наименований и двух приложений. Объем диссертации - 140 страниц машинописного текста, включает 64 рисунка и 14 таблиц.
СОДЕРЖАНИЕ РАБОТЫ
В первой главе проведен системотехнический анализ процесса прогнозирования как этапа процесса управления, приведены общие сведения о решении задачи прогнозирования временных рядов. В устоявшейся в настоящее время терминологии в теории прогнозирования понятие временного ряда определяется как единственная наблюдаемая в дискретные моменты времени реализация скалярного случайного процесса (естественно, в общем случае, нестационарного).
Основой для прогнозирования случайного процесса всегда служит математическая модель. Большинство моделей подразумевают, что прогнозирование случайного процесса общего вида основано на его декомпозиции на трендовую, периодическую (циклическую) и случайную компоненты.
В общем случае, допускается как аддитивное представление случайного процесса (сумма трендовой, периодической и стохастической компонент), так и мультипликативное (их произведение).
Тренд случайного процесса представляет собой некоторую детерминированную компоненту, не содержащую периодических составляющих, кроме, возможно, тех, периоды которых заведомо больше объема имеющейся выборки.
Периодическая компонента случайного процесса обычно определяется как совокупность неслучайных гармонических колебаний, периоды которых заведомо меньше, чем объем имеющейся выборки.
Случайная компонента, в свою очередь, представляет собой центрированный случайный процесс.
Выбор и применение какой либо из известных в настоящее время математических моделей прогнозирования связаны, в первую очередь, с определением степени статистической значимости каждой из данных компонент (доли дисперсии компоненты в дисперсии процесса) и степени ее регулярности (параметры регулярных компонент меняются сравнительно медленно, закон их изменения известен или возможно получение его достоверной оценки).
Для определенных временных рядов наибольшую статистическую значимость могут иметь регулярные периодические (циклические) компоненты.
Трендовая компонента в таких рядах, как правило, является монотонной, имеет постоянные либо сравнительно медленно меняющиеся параметры, проблем с построением ее модели и прогнозированием обычно не возникает, случайная же
компонента либо имеет малую статистическую значимость, либо носит периодический характер, аналогичный сезонной.
Природа таких временных рядов может быть самой разной, примерами могут служить различные макроэкономические показатели (например, помесячные значения индексов промышленного производства), колебательные движения летательного аппарата в процессе полета, почасовые объемы выработки электрической и тепловой энергии объектами генерации (как для отдельных объектов генерации, так и для региональных рынков) и, как следствие, цена 1 кВтч электрической энергии на нерегулируемом рынке Российской Федерации, почасовые объемы потребления электрической энергии объектами ЖКХ и некоторыми промышленными предприятиями, ежедневные объемы продаж некоторых товаров, пользующихся преимущественно сезонным спросом, помесячные объемы пассажирских перевозок, метеорологические и гидрологические процессы и множество других.
Это подтверждает актуальность решения задачи прогнозирования таких временных рядов для различных областей науки и техники.
Графики реализаций некоторых из этих процессов приведены на рисунках 1-3.
О 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 (»«
——--^ Индекс вь|пуска товаров и услу^
Рисунок 1 - график индекса выпуска товаров и услуг по базовым видам деятельности Российской Федерации, в процентах относительно предыдущего периода
о_I
Рисунок 2 - график аэродинамического коэффициента момента крена ЛА
I О О О О О О О
ооооооосэ
И
Рисунок 3 - график цены 1 кВтч электрической энергии на нерегулируемом рынке
Российской Федерации
Теория случайных процессов классифицирует такие временные ряды как реализации скалярных квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами.
Квазистационарность случайного процесса означает, что скорость изменения его статистических свойств относительно начала отсчета значительно меньше скорости изменения их же относительно расстояния между рассматриваемыми сечениями.
Формализацию задачи прогнозирования случайного процесса удобно осуществить, сводя ее к задаче поиска оптимального по некоторому критерию (критерию прогнозирования) оператора (прогнозирующего), которая является одной из наиболее распространенных среди задач статистической оптимизации систем управления.
Оптимальным оператором, в классическом понимании, называется оператор, обеспечивающий экстремальное значение некоторого критерия качества функционирования некоторой системы, на вход которой поступает случайный процесс Х(0 с известными статистическими характеристиками.
Постановка задачи прогнозирования предполагает, что на выходе прогнозирующей системы в момент времени I требуется получить сигнал ХСИ-у), равный спрогнозированному на интервал у входному сигналу. На самом же деле, в момент времени I система формирует выходной сигнал У(0, являющийся оптимальной по некоторому критерию оценкой Х(Н7). Разность идеального и реального выходного сигналов, очевидно, возникает вследствие невозможности точно предсказать будущее процесса.
Ошибка прогнозирования определяется в этом случае соотношением
Е(1) = У(1) - Х(1+у). (1)
Качество прогнозирования случайного процесса в конечном итоге часто характеризуется экономическим эффектом, полученным в результате применения рассчитанных прогнозов. На практике данный экономический эффект оценивается, во-первых, интегрально на значительном интервале времени (кварталы, годы), во-вторых, в среднем.
Исходя из этих соображений, генеральным критерием прогнозирования и, как следствие, критерием качества функционирования прогнозирующей системы, обычно является и выбран в рамках настоящей работы средний квадрат ошибки прогнозирования:
<2(1) = М[Е2(1)] = М[(У(1) - Х(Н7))2]. (2)
Критерий <3(1), очевидно, является квадратичной функцией, что дает возможность, в случае, когда прогнозирующая система является линейной, минимизировать его аналитически.
Исходными данными для прогнозирования является наблюдаемая на интервале [1о, I] реализация прогнозируемого случайного процесса Х(0 с заданным интервалом дискретизации:
Х(У,к=0..Ы,1к+1-1к = Д, (3)
Окончательно, формальная постановка задачи предполагает оптимальную по критерию среднего квадрата ошибки прогнозирования оценку значения наблюдаемой реализации X (У случайного процесса Х(0 в момент времени 147.
В диссертационной работе рассмотрен ряд распространенных в настоящее время методов и моделей, позволяющих решать задачи прогнозирования временных рядов с регулярными периодическими компонентами. Особое внимание уделяется их недостаткам.
Обобщенный метод экспоненциального сглаживания (метод Винтерса), реализует обычный стационарный фильтр с экспоненциально затухающей импульсной переходной функцией. Учет периодической компоненты при прогнозировании обеспечивается взятием значений прогнозируемого процесса через интервал периодичности. Такой подход, очевидно, позволяет учесть только закономерности процесса, проявляющиеся на интервале периодичности, с соответствующим экспоненциальным сглаживанием.
Сезонная модель АРПСС уходит от экспоненциального сглаживания, однако, учет периодической компоненты по-прежнему обеспечивается взятием значений прогнозируемого процесса через интервал периодичности. Упрощение модели посредством ограничения порядка авторегрессии и скользящего среднего существенно снижает качество прогнозирования в случае, если прогнозируемый процесс содержит сложные корреляционные связи.
Метод сингулярного спектрального анализа изначально предполагает значительную зависимость от решений, принимаемых на каждом его этапе, в частности, от выбора параметров (длины окна, числа компонент), способа группировки компонент, алгоритма восстановления ряда. Это требует крайне высокого уровня эксперта, адаптирующего его для решения конкретной задачи, и значительно ограничивает возможности его применения.
Результаты применения нейросетевых алгоритмов существенно зависят от структуры нейронной сети, функций активации, данных, на которых проводилось обучение. Несмотря на доказанную теоретическую сходимость нейронных сетей к минимуму целевой функции, их применение нередко приводит к результатам простейших методов.
Проведенный качественный анализ подтвердил целесообразность разработки метода прогнозирования временных рядов с регулярными периодическими компонентами (позволяющего учесть эти компоненты в явном виде), отвечающего следующим свойствам:
- учет взаимосвязи сечений не только на интервале периодичности;
- инвариантность относительно предметной области в рамках выбранного класса прогнозируемых процессов;
- наличие прозрачного, теоретически обоснованного алгоритма оптимизации;
- возможность регуляризации по небольшому числу параметров.
Вторая глава содержит теоретическое описание реализованного метода прогнозирования на основе модели периодически коррелированных случайных
процессов, обоснование его эффективности по сравнению с распространенными в настоящее время методами и моделями, и описание его алгоритмической и программной реализации в подсистеме автоматизированной системы прогнозирования динамических процессов.
В диссертационной работе предлагается метод, основанный на аддитивном представлении временного ряда в виде неслучайной трендовой и периодической стохастической компонент.
Х(1) = Хт(1) + Хс(1), (4)
где Хт(1) - трендовая, а Хс(0 - стохастическая периодическая компонента, соответственно.
Прогнозирование на интервал у в этом случае предполагает решение задачи выработки оптимальной оценки прогнозируемого сигнала У^), равной сумме оптимальной оценки трендовой компоненты УтИ и оптимальной оценки периодической стохастической компоненты УС(Ч):
У(1) = УТ(1) + УС(1), (5)
Неслучайная трендовая компонента описывается монотонной функцией времени. Вид функции и метод оценки ее параметров определяется видом прогнозируемого процесса.
Прогнозирование данной компоненты осуществляется очевидным образом -подстановкой в данную неслучайную функцию времени необходимого аргумента:
Ут(1) = Хт(1+7), (6)
Периодическая стохастическая компонента, представляющая собой центрированный квазистационарный скалярный случайный процесс с регулярными периодическими стохастическими компонентами, описывается моделью периодически коррелированного случайного процесса.
Прогнозирование данной компоненты осуществляется с помощью оптимального по критерию среднего квадрата ошибки линейного экстраполятора.
Предлагаемый в настоящей работе метод прогнозирования центрированных квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами основан на статистической модели периодически коррелированных случайных процессов (ПКСП), представляющих собой частный случай периодически нестационарных в широком смысле слова случайных процессов.
Модель ПКСП предполагает как стохастичность, так и повторяемость (цикличность) процесса, для описания которого она применяется.
Такая модель процесса предполагает, что для его автокорреляционной функции выполняется условие инвариантности относительно сдвига обоих ее аргументов на фиксированную величину Т - интервал периодичности:
Кх(11+Т,12+Т) = Кх(М2). (7)
Одним из свойств ПКСП, очевидно вытекающих из (7), является то, что последовательность
7.(Х(0,10, к) = ХОо + кТ), 0<1о<Т, к = 0,1,..оо, (8)
то есть последовательность отсчетов его значений относительно некоторого начального значения ^ с интервалом, равным периоду его автокорреляционной функции, является эргодической.
Данное свойство должно выполняться для всех значений 1ос[0, Т), и проверка его на практике может быть использована для выявления периодической коррелированное™ случайного процесса.
Из свойства (8) следует, что оценку автокорреляционной функции случайного процесса при рассмотрении его как ПКСП можно получить по одной продолжительной реализации, несмотря на то, что с точки зрения классической теории он является нестационарным.
Выведена формула оценки АКФ ПКСП по реализации длиной N точек:
'2 (х(иА + /Г) -тх(иА + ¡Т)\х(уА + /Г) -тх(уА + <Т)) Кх{иА,„А) = ^-:-:-• Г01
'шах V '
(ЛГ - шах(а, у))Д
Т
Описание прогнозирующей системы получено в результате решения задачи статистической оптимизации.
Пусть на вход оптимизируемой прогнозирующей системы на интервале (Ч0, ^ поступает скалярный случайный процесс - сигнал Х(0 с известными статистическими характеристиками. Реализуя некоторое преобразование А входного сигнала, система формирует выходной сигнал = А{Х(1)}.
Решая задачу поиска оптимального преобразования А, обеспечивающего минимум критерия (3, методами вариационного исчисления, получено общее условие оптимальности линейного прогнозирующего устройства:
М[Е(1)0{Х(1)}] = 0, (10)
где в - произвольное преобразование того же класса, что и А.
Одним из свойств необходимого и достаточного условия оптимальности применительно к прогнозирующей системе является некоррелированность ошибки прогноза с выходным сигналом прогнозирующей системы (самим прогнозом) в один и тот же момент времени, что можно использовать как один из методов проверки оптимальности полученного прогноза.
Ограничивая процесс поиска оптимального по условию (10) оператора классом линейных, физически реализуемых, нестационарных операторов и учитывая, что в этом случае
I
У(1) = А{Х(1)}= { а(1, т) Х(т) ёт, (П)
'о
где а(1,т) - импульсная весовая функция оптимальной системы, из необходимого и достаточного условия минимума критерия С> выводится интегральное уравнение Винера для оптимального по критерию (2) прогнозирующего устройства
(экстраполятора) на интервал прогнозирования у центрированного процесса (периодической стохастической компоненты Х(0): /
| а(I,12) Кх(12,1,) <112 = Кх(1+у, 10,1о < I, < I, (12)
'о
причем трендовая компонента в данном уравнении не учитывается в силу того, что модель ПКСП используется только для прогноза стохастической периодической компоненты, как раз и представляющей собой центрированный случайный процесс.
Подстановка в уравнение (12) автокорреляционной функции случайного процесса в виде автокорреляционной функции ПКСП (7) и позволяет получить в результате его решения импульсную весовую функцию оптимальной прогнозирующей линейной системы, учитывающую наличие в прогнозируемом случайном процессе Х(0 регулярных стохастических периодических компонент.
Уравнение (12) допускает численное решение для непрерывного случая, . однако, так как исходные данные (оценки автокорреляционной функции) заданы дискретно, то целесообразно решать его в дискретной форме.
Дискретизируя выражение (11) с учетом (3), получено уравнение оптимального по критерию среднего квадрата ошибки прогноза процесса Х(0 из точки с индексом к на интервал у с помощью линейного экстраполятора, учитывающего п значений известной реализации периодической стохастической компоненты процесса Хс(1):
Гс('*)=1>,(у)*с('*-/). (13)
/=о
где коэффициенты ак(у) соответствуют импульсной весовой функции дискретной оптимальной линейной прогнозирующей системы и определяются из системы линейных уравнений, которую можно записать, дискретизируя уравнение (12) с учетом соотношений (3) и (13):
"¿а,-(у)КХс 0Ы,1Ы) =КХс 0 у,), 0< 1 <п. (14)
/=о *+д
Размерность данной системы равна, очевидно, числу значений (или сечений) реализации прогнозируемого процесса п, на основе которых непосредственно строится прогноз.
Учет регулярных стохастических периодических компонент при прогнозировании случайного процесса Х(0 с помощью соотношений (13) и (14) обеспечивается расчетом оценки автокорреляционной функции прогнозируемого процесса по формуле (9).
На практике, интервал оценки автокорреляционной функции ограничивают, чтобы снизить влияние старых значений процесса на прогноз. С учетом этого, соотношение (9) применяется для оценки АКФ стохастической периодической компоненты на интервале [1к-Т0Ц, 1к] в несколько измененном виде:
'2[хс(1к - иД -¡Т)\хе(1к-v^-/Т))
Кх(иА,уЛ) = -
( /А. -тах(">1'))л
где Тоц - величина интервала оценки, при этом, очевидно, для обеспечения точности оценки, Тоц/Д должно значительно превосходить п.
Пример результатов работы предлагаемого метода прогнозирования приведен на рисунке 4.
Выходной сианал оптимального прогнозирующего устройства У((*)
Число точек, используемых для построения прогноза п = 12
Интервал оценки статистических характеристик Т0ц = 80 _
Интервал прогнозирования у = 1
Рисунок 4 - пример результатов работы предлагаемого метода прогнозирования
По аналогии с общим случаем, можно оценить минимальное теоретически возможное в классе линейных оптимальных преобразований значение среднего квадрата ошибки прогноза для рассматриваемого прогнозируемого процесса: <?тт(1) = Пх(1+7)-Оу(0.
С учетом того, что априорных данных об автокорреляционной функции прогнозируемого процесса нет, и в основе решения уравнения Винера лежит ее оценка, на практике возможно получить лишь оценку значения данного критерия прогнозирования.
При применении модели ПКСП, встает вопрос выбора величины интервала периодичности Т как параметра ПКСП, очевидно, его целесообразно решать на основе результатов спектрального анализа реализации прогнозируемого процесса.
Выполнено сравнение с одной из наиболее распространенных и эффективных современных моделей для прогнозирования реализаций случайных процессов, содержащих периодические или циклические компоненты - сезонной моделью АРПСС (Season ARIMA, SARIMA).
Уравнение прогноза реализации случайного процесса X(t) на интервал, кратный интервалу сезонности Т, посредством авторегрессионной компоненты сезонной модели АРПСС можно записать следующим образом:
(17)
к=0
где коэффициенты регрессии at определяются методом наименьших квадратов исходя из минимума среднего квадрата ошибки прогнозирования, либо с помощью известных соотношений (например, уравнения Юла-Уолкера, или методом максимального правдоподобия).
Соотношение (17) позволяет сделать вывод, что сезонная модель АРПСС не учитывает возможную взаимную корреляцию последовательностей (8) Z(X(t),to,k) для разных to. Сравнивая соотношения (17) и (13) можно заметить, что сезонная модель АРПСС предполагает только стационарность связи между сечениями процесса, отстоящими от точки, из которой осуществляется прогнозирование на интервалы, кратные интервалу сезонности.
Исходя из этого, можно утверждать, что для ПКСП предлагаемый метод с точки зрения теоретического значения критерия среднего квадрата ошибки прогнозирования будет гарантированно не хуже сезонной модели АРПСС. Одинаковые теоретические значения критерия получатся в случае отсутствия взаимной корреляции последовательностей (8) Z(X(t),t0,k) для разных t0, в остальных случаях, предлагаемый метод будет лучше.
Необходимость регуляризации прогнозирующей модели возникает, в первую очередь, для приближения выборочных значений критерия прогнозирования к минимальному теоретически возможному.
Существует множество способов регуляризации прогнозирующей модели; одним из распространенных и эффективных способов является введение внешнего критерия регулярности.
Предлагаемый метод предполагает дополнительную регуляризацию прогнозирующей модели по критерию регулярности - оценке среднего квадрата
ошибки прогнозирования в зависимости от параметра регуляризации - числа точек, используемых для решения задачи прогнозирования п.
Исходя из структуры математической модели, сделанных допущений и предположений, разработан алгоритм прогнозирования, обеспечивающий регулярность прогнозирующей модели.
Алгоритм прогнозирования предполагает изначальный ввод исходных данных - реализации прогнозируемого процесса в виде (3), и ее статистического анализа.
По итогам статистического анализа необходимо определить вид и параметры трендовой компоненты, интервалы, на которых будет происходить оценка статистических характеристик прогнозируемого процесса, моделирование процесса прогнозирования и непосредственно прогноз.
Параметры алгоритма прогнозирования приведены в таблице 1.
Таблица 1 - Параметры алгоритма прогнозирования
№ Условное Описание
пп обозначение
1 У Интервал прогнозирования (интервал упреждения, глубина прогноза)
2 Т Интервал периодичности (цикличности) модели ПКСП
3 Т Величина интервала оценки статистических характеристик прогнозируемого процесса (интервал обучения прогнозирующей модели)
4 Т 1 мод Величина интервала моделирования процесса прогнозирования
5 tmax Правая граница интервала моделирования процесса прогнозирования
6 П Число точек, используемых для построения однократного прогноза
7 tk Момент времени, из которого строится прогноз
8 ^min Минимальное значение параметра регуляризации
9 Птах Максимальное значение параметра регуляризации
Однократное прогнозирование предполагает решение задачи
min Q(tk) = M[E2(tk)] = M[(Y(tk) - X(tk+y))2], (18)
то есть, выработку оптимальной оценки прогнозируемого на интервал у сигнала в момент времени tk, равной сумме оптимальной оценки трендовой компоненты YT(tk) и оптимальной оценки случайной компоненты Yc(tk) в соответствии с выражением (5).
Порядок действий при решении данной задачи выглядит следующим образом:
1) На интервале Тоц, У рассчитать оценки трендовой компоненты и оценки автокорреляционной функции стохастической периодической компоненты по формуле (15);
2) Вычислить оптимальный прогноз Ут((к) трендовой компоненты по формуле
(6);
3) На основании оценок АКФ стохастической периодической компоненты, сформировать систему линейных алгебраических уравнений (14);
4) Вычислить оценку п значений весовой функции оптимального экстраполятора на основании решения системы линейных алгебраических уравнений (14) размерности пхп методом Гаусса;
5) Вычислить оптимальный прогноз Ус(1:к) стохастической периодической компоненты по формуле (13);
6) Вычислить оптимальный прогноз процесса У0к) как.сумму У-КУ и Ус0к).
Моделирование процесса прогнозирования (статистические испытания
разработанного метода) осуществляется по следующему известному алгоритму на интервале [1тах-Тмод, 1т„]:
1) Положить ^ = 1тах;
2) Для текущего момента времени ^ решить задачу однократного прогнозирования (2.8.2) на интервал у вперед, получив значение прогноза У(0;
3) Для текущего момента времени ^ рассчитать значения ошибки прогнозирования по формуле
Е(1к) = У(У-Х(1к+у). (19)
4) Если 1к < 1тах, то к=к+1 и переход к (2).
5) Оценить статистические характеристики Е(1) на интервале моделирования
[^тах Тмод, 1тах].
Алгоритм, очевидно, является итерационным и повторяется до тех пор, пока не будут получены значения ошибки для всех точек на заданном интервале моделирования [1тах - Тмод, 1тах], после чего оцениваются статистические характеристики ошибки прогнозирования - математическое ожидание и дисперсия.
Регуляризация прогнозирующей модели описывается следующим алгоритмом:
1) Положить п = птш;
2) Осуществить моделирование процесса прогнозирования и оценку статистических характеристик для текущего параметра регуляризации п на интервале [1тах - Тмод, 1щах] в соответствии с алгоритмом 2.8.3;
3) Если п<птах, то п=п+1 и переход к (2);
4) Выбрать оптимальное значение параметра регуляризации попт, обеспечивающий минимум оценки среднего квадрата ошибки прогнозирования.
После регуляризации прогнозирующей модели - выявления оптимального значения параметра регуляризации п, модель может быть использована для непосредственно прогнозирования.
Анализ показал более высокую вычислительную сложность разработанного алгоритма прогнозирования по сравнению с сезонной моделью АРПСС.
Алгоритм прогнозирования реализован в программном комплексе «Автоматизированная система прогнозирования динамических процессов» (АСПДП), разработанном на объектном языке программирования Object Pascal.
В третьей главе описана методика проверки возможности применения предложенного метода прогнозирования и ее применение к выбранным для статистических испытаний временным рядам: декомпозицию на трендовую и стохастическую компоненты, оценку параметров и проверку адекватности трендовой компоненты, оценку и исследование статистических характеристик стохастической компоненты, классификацию данных рядов как квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами, подтверждение возможности применения разработанного метода прогнозирования.
Прежде чем применять предложенный метод прогнозирования на основе модели ПКСП к произвольному случайному процессу, в общем случае, необходимо предварительно проверить возможность его применения.
Проверка возможности предложения предложенного метода прогнозирования, по сути, сводится к проверке двух основных допущений, сделанных при разработке метода:
1) Процесс можно адекватно представить в виде суммы трендовой и периодической стохастической компонент (4);
2) Периодическая стохастическая компонента может быть адекватно описана посредством модели ПКСП.
Выполнение первого допущения связано с выделением неслучайного тренда и проверкой его адекватности, выполнение второго - с проверкой выполнения свойств ПКСП, в частности, свойства (8), у периодической стохастической компоненты.
Таким образом, методика проверки возможности предложения предложенного метода прогнозирования на основе модели ПКСП, в общем случае, предполагает следующий порядок действий:
1) Качественный анализ реализации случайного процесса и его структурная декомпозиция на трендовую и периодическую стохастическую компоненты.
2) Оценка параметров, анализ и проверка адекватности трендовой компоненты.
3) Оценка параметров, анализ и проверка свойств ПКСП периодической стохастической компоненты.
В случае, если подобный анализ случайного процесса подтверждает возможность применения предложенного метода, его можно использовать для решения задачи прогнозирования данного процесса.
Для проведения статистических испытаний разработанного метода прогнозирования выбраны исходные данные - почасовые значения средневзвешенной цены 1 МВтч (в тыс. рублей) электрической энергии на нерегулируемом рынке Российской Федерации у сбытовых компаний (Xi(t) - ОАО «Мосэнергосбыт», X2(t) -ОАО «Кубанская энергосбытовая компания», X3(t) - ОАО «Челябэнергосбыт»), являющиеся реализациями квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами.
Выбор данных процессов обусловлен тем, что. в отличие от других, упомянутых в качестве примеров, по ним открыто доступен значительный объем статистики, достаточный для проведения всесторонних исследований и статистических испытаний.
Применение к данным процессам методики проверки возможности применения разработанного метода прогнозирования позволило сделать следующие выводы:
1) Исследуемые процессы являются квазистационарными;
2) Исследуемые процессы содержат трендовую компоненту в виде наклонной прямой и периодическую стохастическую компоненту;
3) Стохастическая компонента исследуемых процессов представлена регулярными стохастическими составляющими;
4) Исследуемые процессы обладают свойствами ПКСП.
В ходе исследований получены оценки автокорреляционных функций стохастических компонент исследуемых случайных процессов, рассчитанные как оценки автокорреляционной функции ПКСП с периодом Т=24 в соответствии с соотношением (9). График одной из них приведен на рисунке 5.
Рисунок 5 - график оценки автокорреляционной функции стохастической компоненты случайного процессах^) как ПКСП с периодом 24
Результаты исследований подтвердили возможность применения разработанного метода на основе ПКСП для их прогнозирования.
В четвертой главе диссертации приведены результаты статистических испытаний эффективности реализованного метода прогнозирования на основе модели ПКСП и его сравнение с распространенными в настоящее время методами и моделями прогнозирования, в частности, сезонной моделью АРПСС, и нейросетевой моделью.
Статистические испытания заключаются в моделировании процесса прогнозирования на известных данных с целью получения реализаций случайных процессов ошибки прогнозирования и оценки их статистических характеристик:
Ме - оценка математического ожидания ошибки прогнозирования;
Д, - оценка дисперсии ошибки прогнозирования;
М2 - оценка среднего квадрата ошибки прогнозирования;
М2
<3пр - прогнозирующая способность модели, (3„р = (1 —100%, где Ох -
оценка дисперсии прогнозируемого процесса по среднему на интервале моделирования.
Проведены статистические испытания - моделирование процесса прогнозирования на интервале от 00:00, 01.01.2010 до 23:00, 31.12.2010, интервал прогнозирования у = 24 часа, интервал периодичности ПКСП Т=24, величина интервала оценки статистических характеристик Тоц = 2500 часов, число точек, используемых для построения прогноза п = 25.
Проведены статистические испытания - моделирование процесса прогнозирования на интервале от 00:00, 01.01.2010 до 23:00, 31.12.2010, интервал прогнозирования у = 168 часов, интервал периодичности ПКСП Т=168, величина интервала оценки статистических характеристик Тоц = 3500 часов, число точек, используемых для построения прогноза п = 170.
Проведено сравнение эффективности предлагаемого метода с эффективностью сезонной модели АРПСС в аналогичных условиях (краткосрочное прогнозирование на 24 часа и среднесрочное прогнозирование на 168 часов).
Статистические характеристики ошибок предлагаемой модели на основе ПКСП и сезонной модели АРПСС приведены в таблице 2.
Строки 6 и 12 в таблице 2 характеризуют уменьшение среднего квадрата ошибки предлагаемого метода прогнозирования на основе модели ПКСП по сравнению с сезонной моделью АРПСС в %, строки 7 и 13 - улучшение прогнозирующей способности, соответственно, в %.
Таблица 2 - сравнение статистических характеристик ошибок предлагаемого метода прогнозирования и сезонной модели АРПСС
№ пп Статистическая характеристика х,(1) Х2(0 Х3(1)
1 26 016,07 37 492,75 20 689,40
Краткосрочное прогнозирование на интервал 24 часа
2 А^пксп 7 451,33 11 698,62 6 122,50
3 м] АРПСС 7 993,14 12 457,23 6 694,13
4 <2прПКСП 71,81% 68,79% 70,95%
5 <Эпр АРПСС 69,75% 66,77% 68,24%
6 м2 / (1- 'ПКСП/. )-100% / м / • ЛРПСС 6,78% 6,09% 8,54%
7 ё / ( "'ПКСП/ -1)-100% /б / V АРПСС 2,95% 3,02% 3,97%
Среднесрочное прогнозирование на интервал 168 часов
8 М2 пксп с 10 616,03 18 250,22 11 567,12
9 АРПСС 11 670,05 20 649,70 12 848,52
10 С?пр ПКСП 59,19% 51,32% 44,0%
И <3пр АРПСС 55,14% 44,92% 37,90%
12 м3 / -ПКСП/ )-100% / м / • ЛРПСС 9,03% 11,62% 9,97%
13 д / ( "Р пксп/ -1)-100% / V ЛРПСС 7,34% 14,25% 16,09%
Результаты анализа таблицы 2 показывают, что статистические испытания подтвердили более высокую эффективность предлагаемого метода прогнозирования на основе модели ГТКСП по сравнению с сезонной АРПСС, особенно в случае среднесрочного прогноза по сравнению с краткосрочным.
Графики участка реализации прогнозируемого процесса Х^) и наложенного на него участка реализации краткосрочного прогноза на интервале с 00:00, 01.11.2010 до 23.00, 31.12.2010 представлены на рисунке 6.
1-Х1 -У I
Рисунок 6 - график участка реализации случайного процесса Х^О и соответствующего участка реализации краткосрочного прогноза
Дополнительно проведены следующие исследования:
- проверка выполнения необходимого и достаточного условия оптимальности прогноза (10), подтвердившие его выполнение и теоретическую оптимальность разработанного метода;
- исследование эффекта регуляризации прогнозирующей модели по параметру п, подтвердившие эффективность и целесообразность регуляризации.
- оценки временных затрат, подтвердившие более высокую вычислительную сложность по сравнению с сезонной моделью АРПСС.
Также выполнено качественное сравнение эффективности предложенного метода с нейросетевыми прогнозирующими моделями на основе полученных в других работах результатов прогнозирования аналогичных временных рядов. Рассмотренные нейросетевые модели, несмотря на возможность учета сторонних факторов, помимо самого прогнозируемого процесса, продемонстрировали в условиях, аналогичных рассмотренным в диссертационной работе, прогнозирующую способность не более 45-55% для краткосрочного и среднесрочного прогнозирования, что значительно меньше, чем у разработанного метода (см. таблицу 2).
ОСНОВНЫЕ РЕЗУЛЬТАТЫ
1. Проведен анализ распространенных в настоящее время моделей и методов прогнозирования временных рядов, выявивший их существенные недостатки применительно к особому классу временных рядов с регулярными периодическими компонентами, актуальному для широкого спектра предметных областей. Поставлена задача разработки нового метода прогнозирования, лишенного выявленных недостатков, в частности, теоретически обоснованного, более полно учитывающего статистические характеристики прогнозируемого ряда
2. Разработан новый метод прогнозирования временных рядов с регулярными периодическими компонентами, основанный на статистической модели периодически коррелированных случайных процессов, учитывающий статистические связи между всеми доступными для исследования сечениями прогнозируемого временного ряда и предполагающий регуляризацию по числу используемых для построения прогноза сечений. Это повышает точность прогнозирования временных рядов с регулярными периодическими компонентами по критерию среднего квадрата ошибки прогнозирования.
3. Осуществлена алгоритмическая и программная реализация разработанного метода прогнозирования в программном комплексе «Автоматизированная система прогнозирования динамических процессов». Выполнена государственная регистрация данного программного комплекса. Программный комплекс внедрен в группе компаний «ТеплоЭлектроГенерация» и успешно используется в процессе управления производством электрической энергии.
4. Предложена методика, позволяющая проверить выполнение свойства периодической коррелированное™ у временного ряда общего вида, и, таким образом, обосновать возможность применения разработанного метода для его прогнозирования.
5. Проведенные статистические испытания разработанного метода показали состоятельность и эффективность получаемых прогнозов, его более высокую прогнозирующую способность (около 70% при краткосрочном и 44-59% при среднесрочном прогнозе) как по сравнению с сезонной моделью АРПСС (превосходство в 3-4% при краткосрочном и 7-16% при среднесрочном прогнозе) так и по сравнению с нейросетевыми моделями в аналогичных задачах (их прогнозирующая способность не превышает 45-55% при краткосрочном и среднесрочном прогнозах).
При этом предложенный метод требует больших вычислительных затрат в силу более сложной обработки прогнозируемого ряда, что однако, не является существенным при решении реальных задач.
СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
В рецензируемых журналах из списка ВАК
1) Игнатов H.A. Реализация концепции энергоэффективности в автоматизированных системах управления на основе прогнозирования параметров рынка электрической энергии // Мехатроника. Автоматизация. Управление. №6, 2011.
2) Игнатов H.A. Прогнозирование временных рядов с регулярными циклическими компонентами с помощью модели периодически коррелированных случайных процессов // Научные труды: Институт народнохозяйственного прогнозирования РАН, 2011.
В других изданиях
3) Игнатов H.A., Булыгин B.C. Автоматизированная система прогнозирования динамических процессов. // Обеспечение качества на всех этапах жизненного цикла изделия / под ред. проф. Б.В. Бойцова и проф. Ю.Ю. Комарова.-М.: Изд-во МАИ-ПРИНТ, 2008.-452 е.: ил.
4) Игнатов H.A. Автоматизированная система прогнозирования динамических процессов. Всероссийская конференция молодых ученых и студентов «Информационные технологии в авиационной и космической технике-2008». 21-24 апреля 2008 г. Москва. Тезисы докладов. М.: Изд-во МАИ-ПРИНТ, 2008.-124с.
5) Игнатов H.A. Применение численного решения интегрального уравнения Винера в задачах прогнозирования. Современные технологии в задачах управления, автоматики и обработки информации: Труды XVII Международного научно-технического семинара. Сентябрь 2008., Алушта. Тезисы докладов. СПб.: ГУАП, 2008.
6) Игнатов H.A., Хахулин Г.Ф. Распараллеливание вычислительного процесса оптимизации прогнозирующей математической модели. 2-я Всероссийская конференция молодых ученых и студентов «Информационные технологии в авиационной и космической технике-2009». 20-24 апреля 2009 г. Москва. Тезисы докладов. М.: Изд-во МАИ-ПРИНТ, 2009.
7) Игнатов H.A. Применение модели сезонно-стационарных случайных процессов для прогнозирования цены на свободном рынке электрической энергии. 8-я Международная конференция «Авиация и космонавтика-2009».Тезисы докладов. М.: Изд-во МАИ-ПРИНТ, 2009.-240 с.
8) Игнатов H.A. Исследование эффективности применения сезонной корреляционной модели случайного процесса в задачах прогнозирования. Современные технологии в задачах управления, автоматики и обработки информации: Труды XVIII Международного научно-технического семинара. Сентябрь 2009., Алушта. Тезисы докладов. М.: МИРЭА, 2009.-306 с.
Подписано в печать: 05.09.11
Объем: 1,5 усл.п.л. Тираж: 100 экз. Заказ № 469 Отпечатано в типографии «Реглет» 119526, г. Москва, Страстной бульвар, 6/1 (495) 978-43-34; www.reglet.ru
Оглавление автор диссертации — кандидата технических наук Игнатов, Николай Анатольевич
ВВЕДЕНИЕ.
1 АКТУАЛЬНОСТЬ РЕШЕНИЯ ЗАДАЧИ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ С РЕГУЛЯРНЫМИ ПЕРИОДИЧЕСКИМИ КОМПОНЕНТАМИ.
1.1 Прогнозирование как этап процесса управления.
1.2 Общие сведения о прогнозировании временных рядов.
1.3 Временные ряды с регулярными периодическими компонентами.
1.4 Формальная постановка задачи прогнозирования случайного процесса.
1.5 Краткий обзор распространенных моделей и методов прогнозирования случайных процессов.
1.5.1 Экспоненциальное сглаживание.
1.5.2 Модель АРПСС.
1.5.3 Метод сингулярного спектрального анализа (метод «Гусеница»).
1.5.4 Нейросетевые модели прогнозирования.
1.6 Обоснование необходимости разработки метода прогнозирования временных рядов с регулярными периодическими компонентами.
1.7 Выводы.
2 РАЗРАБОТКА И РЕАЛИЗАЦИЯ МЕТОДА ПРОГНОЗИРОВАНИЯ НА ОСНОВЕ МОДЕЛИ ПЕРИОДИЧЕСКИ КОРРЕЛИРОВАННЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ.
2.1 Общее описание прогнозирующей модели.
2.2 Статистическая модель периодически коррелированного случайного процесса.
2.3 Прогнозирование на основе модели периодически коррелированного случайного процесса.
2.4 Требования к исходным данным.
2.5 Определение интервала периодичности ПКСП.
2.6 Концептуальное сравнение предлагаемого метода и сезонной модели АРПСС.
2.7 Регуляризация прогнозирующей модели.
2.8 Реализация метода прогнозирования на основе модели периодически коррелированных случайных процессов на ЭВМ.
2.8.1 Описание алгоритмической реализации.
2.8.2 Алгоритмическая реализация модели однократного прогнозирования.
Однократное прогнозирование предполагает решение задачи.
2.8.3 Алгоритмическая реализация моделирования процесса прогнозирования.
2.8.4 Алгоритмическая реализация решения задачи регуляризации.
2.8.5 Вычислительная сложность алгоритма прогнозирования.
2.8.6 Реализация алгоритма прогнозирования в подсистеме автоматизированной системы прогнозирования динамических процессов.
2.9 Выводы.
3 МЕТОДИКА ИССЛЕДОВАНИЯ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ РАЗРАБОТАННОГО МЕТОДА ПРОГНОЗИРОВАНИЯ.
3.1 Методика проверки возможности применения предложенного метода прогнозирования.
3.2 Описание исходных данных.
Интервал дискретизации соответствует интервалу дискретизации, с которым работает оператор нерегулируемого рынка электрической энергии.
3.3 Качественный анализ и структурная декомпозиция исходных данных.
3.4 Анализ трендовых компонент.
3.4.1 Структура трендовых компонент.
3.4.2 Оценка параметров трендовых компонент.
3.4.3 Проверка адекватности трендовых компонент.
3.5 Анализ стохастических компонент.
3.5.1 Определение стохастических компонент.
3.5.2 Исследование одномерного закона распределения стохастических компонент.
3.5.3 Корреляционный анализ стохастических компонент.
3.5.4 Спектральный анализ стохастических компонент.
3.6 Применение модели периодически коррелированных случайных процессов к исследуемым случайным процессам.
3.6.1 Проверка наличия признаков периодически коррелированного случайного процесса у исследуемых случайных процессов.
3.6.2 Оценка автокорреляционных функций стохастических компонент исследуемых случайных процессов как автокорреляционной функции периодически коррелированного случайного процесса.
3.7 Выводы.
4 ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ РАЗРАБОТАННОГО МЕТОДА ПРОГНОЗИРОВАНИЯ.
4.1 Описание условий статистических испытаний.
4.2 Моделирование процесса краткосрочного прогнозирования.
4.2.1 Условия статистических испытаний.
4.2.2 Результаты статистических испытаний.
4.2.3 Проверка необходимого и достаточного условия оптимальности прогнозирующей системы.
4.3 Моделирование процесса среднесрочного прогнозирования.
4.3.1 Условия статистических испытаний.
4.3.2 Результаты статистических испытаний.
4.3.3 Проверка необходимого и достаточного условия оптимальности прогнозирующей системы.
4.4 Исследование влияния величины интервала оценки статистических характеристик на оценки среднего квадрата ошибки прогнозирования.
4.5 Исследование влияния регуляризации по числу точек, используемых для построения прогноза, на оценки ошибок краткосрочного прогнозирования.
4.6 Исследование влияния регуляризации по числу точек, используемых для построения прогноза, на оценки ошибок среднесрочного прогнозирования.
4.7 Сравнение эффективности предлагаемого метода и сезонной модели АРПСС.
4.8 Сравнение эффективности предлагаемого метода и нейросетевых алгоритмов прогнозирования.
4.9 Оценка временных затрат.
4.10 Выводы.
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Игнатов, Николай Анатольевич
Актуальность исследования
Решение задачи прогнозирования играет важнейшую роль в процессах как стратегического планирования, так и оперативного управления в различных сферах науки и техники.
Прогнозирование временного ряда (или реализации ' скалярного случайного процесса) является одной из распространенных форм постановки задачи прогнозирования.
Применение каких-либо из существующих в настоящее время математических моделей и методов прогнозирования временных рядов тесно связано со спецификой предметной области и' классификацией прогнозируемого временного ряда.
Рассматриваемый в настоящей работе класс временных рядов с регулярными периодическими компонентами является весьма распространенным, в частности, для предметных областей, в которых существенно влияние периодических факторов. Примерами таких рядов являются: различные макроэкономические показатели (например, помесячные значения индексов промышленного производства), аэродинамические коэффициенты летательного аппарата в процессе полета, почасовые объемы выработки электрической и тепловой энергии объектами генерации и, как следствие, цена 1 кВтч электрической энергии на нерегулируемом рынке Российской Федерации, почасовые объемы потребления электрической энергии объектами ЖКХ и некоторыми промышленными предприятиями, метеорологические и гидрологические процессы и множество других. Таким образом, в силу наличия временных рядов данного класса в самых разных сферах в принципе, решение задачи их прогнозирования является актуальной и важной научно-технической задачей.
Существует несколько математических моделей и методов, специально разработанных для прогнозирования временных рядов с регулярными периодическими компонентами, например, модель сезонного скользящего среднего (Хольт и Винтере, 1950-1960), сезонная модель АРПСС (Бокс и Дженкинс, 1970), метод сингулярного спектрального анализа (реализация, названная методом «Гусеница» в России, разрабатывалась в Санкт-Петербургском Государственном Университете в 1997-2010 годах), а также ряд нейросетевых алгоритмов прогнозирования, в основном, получившим распространение с середины 90-х годов XX века.
Проведенный в настоящей работе анализ выявил ряд существенных недостатков данных методов. В частности, сезонное скользящее среднее и сезонная модель АРПСС не учитывают в полном объеме всю информацию о корреляционной связи между сечениями прогнозируемого ряда, а практическое применение метода сингулярного спектрального анализа и нейросетевых алгоритмов затруднено их слабой формализацией и необходимостью высокой квалификации оператора.
Таким образом, актуальной является, задача разработки нового метода прогнозирования временных рядов с регулярными периодическими компонентами, лишенного указанных недостатков других методов и моделей: более полный, по сравнению с сезонным скользящим средним и сезонной моделью АРПСС, учет статистических характеристик прогнозируемого ряда увеличивает эффективность прогнозирования, а разработка и реализация формального алгоритма применения метода — обеспечить легкость решения практических задач.
Объект исследования
Временные ряды с регулярными периодическими компонентами.
Предмет исследования
Задача прогнозирования временных рядов с регулярными периодическими компонентами.
Цель исследования
Повышение эффективности прогнозирования временных рядов с регулярными периодическими компонентами с точки зрения критерия среднего квадрата ошибки.
Задачи исследования
Для достижения поставленной цели были решены следующие научно-технические задачи:
1. Разработан метод решения задачи прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированного случайного процесса;
2. Разработанный метод прогнозирования реализован в программном комплексе «Автоматизированная система прогнозирования динамических процессов»;
3. Разработана методика проверки возможности применения разработанного метода прогнозирования и выполнено ее применение для статистического исследования временного ряда с регулярными периодическими компонентами;
4. Проведены статистические испытания разработанного метода прогнозирования на имеющихся данных и выполнено сравнение его эффективности с сезонной моделью АРПСС и нейросетевыми методами прогнозирования.
Методы исследования
Поставленные задачи решались с использованием методов системного анализа, математического программирования, теории оптимального планирования и управления, теории вероятностей и математической статистики, статистической динамики и теории эффективности систем управления, объектно-ориентированного программирования.
Научная новизна работы заключается в следующем:
1. Разработан и реализован метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов;
2. Показана более высокая эффективность разработанного метода в рамках решения задачи прогнозирования временных рядов с регулярными периодическими компонентами по сравнению с актуальными в настоящее время сезонной моделью АРПСС и нейросетевой моделью.
Научные результаты, выносимые на защиту:
1. Разработанный метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов;
2. Алгоритмическая и программная реализация разработанного метода прогнозирования;
3. Разработанная методика проверки возможности применения разработанного метода прогнозирования;
4. Результаты статистических испытаний, подтверждающие эффективность разработанного метода прогнозирования по сравнению с актуальными в настоящее время сезонной моделью АРПСС и нейросетевой
- моделью.
Практическая значимость результатов
Программный комплекс «Автоматизированная система прогнозирования динамических процессов», реализующий разработанный метод, внедрен и используется в группе компаний «ТеплоЭлектроГенерация» в процессе разработки режимов управления производством электрической энергии.
Апробация работы
Основные положения и результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:
1) Всероссийская конференция молодых ученых и студентов «Информационные технологии в авиационной и космической технике-2008». 21-24 апреля 2008 г. Москва.
2) 2-я Всероссийская конференция молодых ученых и студентов «Информационные технологии в авиационной и космической технике-2009».
20-24 апреля 2009 г. Москва.
3) XVII Международный научно-технический семинар. Алушта, 2008.
4) 8-я Международная конференция «Авиация и космонавтика-2009». г. Москва.
5) XVIII Международный научно-технический семинар. Алушта, 2009.
6) XIX Международный научно-технический семинар. Алушта, 2010.
Публикации
Основные результаты диссертационной работы опубликованы в 8 печатных работах, в том числе, 1 публикация в ведущем рецензируемом научном журнале «Мехатроника, автоматизация, управление», входящем в список ВАК РФ; 1 публикация в ведущем рецензируемом научном журнале «Научные труды: Институт народнохозяйственного прогнозирования РАН», входящем в список ВАК РФ; выполнена, государственная регистрация программного комплекса, реализующего разработанный метод, в качестве программы для ЭВМ, свидетельство №2011613068.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения, списка источников из 57 наименований и двух приложений. Объем диссертации - 140 страниц машинописного текста, включает 64 рисунка и 14 таблиц.
Заключение диссертация на тему "Метод прогнозирования временных рядов с регулярными периодическими компонентами на основе модели периодически коррелированных случайных процессов"
4.10 Выводы
Проведены статистические испытаний эффективности реализованного метода прогнозирования на основе модели периодически коррелированных случайных процессов.
Результаты испытаний подтвердили его теоретическую оптимальность при прогнозировании временных рядов с регулярными периодическими компонентами.
Сравнение с распространенными в настоящее время методами и моделями прогнозирования, в частности, сезонной моделью АРПСС, и нейросетевой моделью, показало преимущество предлагаемого метода как при краткосрочном (24 часа), так и при среднесрочном (168 часов) прогнозировании по критерию среднего квадрата ошибки прогнозирования, что достигается ценой значительно больших временных затрат.
ЗАКЛЮЧЕНИЕ
1. Проведенный анализ распространенных в настоящее время моделей и методов прогнозирования временных рядов выявил их существенные недостатки применительно к особому классу временных рядов с регулярными периодическими компонентами, актуальному для широкого спектра предметных областей. Поставлена задача разработки нового метода прогнозирования, лишенного выявленных недостатков, в частности, теоретически обоснованного, более полно учитывающего статистические характеристики прогнозируемого ряда.
2. Разработан новый- метод прогнозирования временных рядов с регулярными периодическими компонентами, основанный на статистической модели периодически коррелированных случайных процессов, учитывающий статистические связи между всеми доступными для исследования сечениями прогнозируемого временного ряда и предполагающий регуляризацию по числу используемых для построения прогноза сечений. Это повышает точность прогнозирования временных рядов с регулярными периодическими компонентами по критерию среднего квадрата ошибки прогнозирования. '
3. Осуществлена алгоритмическая и программная реализация-разработанного метода прогнозирования в программном комплексе «Автоматизированная система прогнозирования динамических процессов». Выполнена государственная регистрация! данного программного комплекса. Программный^ комплекс внедрен в группе компаний «ТеплоЭлектроГенерация» и успешно используется в процессе управления производством электрической энергии.
4. Предложена методика, позволяющая'проверить выполнение свойства периодической коррелированности у временного ряда общего вида, и, таким образом, обосновать возможность применения разработанного метода для его прогнозирования.
5. Проведенные статистические испытания разработанного метода показали состоятельность и эффективность получаемых прогнозов, его более высокую прогнозирующую способность (около 70% при краткосрочном и 4459% при среднесрочном прогнозе) как по сравнению с сезонной моделью АРПСС (превосходство в 3-4% при краткосрочном и 7-16% при среднесрочном прогнозе) так и по сравнению с нейросетевыми моделями в аналогичных задачах (их прогнозирующая способность не превышает 4555% при краткосрочном и среднесрочном прогнозах).
При этом предложенный метод требует больших вычислительных затрат в силу более сложной обработки прогнозируемого ряда, что однако, не является существенным при решении реальных задач.
Библиография Игнатов, Николай Анатольевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Абрамов A.M., Капустин В.Ф. Математическое программирование. -Л.: ЛГУ, 1976.
2. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Классификация и снижение размерности.— М.: Финансы и статистика, 1989.— 607 с.
3. Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. М.: Юнити, 1998.
4. Алексеев В.Г. Об оценках спектральных плотностей гауссовского периодически-коррелированного случайного процесса // Проблемы передачи информации, Том 24, выпуск 2. М.: Изд-во ИППИ РАН, 1988.-е. 31-38
5. Алексеев В.Г. Эмпирический спектральный анализ периодически коррелированных случайных процессов. Альтернативный подход // Проблемы передачи информации, Том 33, выпуск 4. М.: Изд-во ИППИ РАН, 1997.-е. 61-69
6. Андерсон Т. Статистический анализ временных рядов. М.: Мир, 1976.
7. Боков В.Н., Бухановский A.B., Иванов H.E., Рожков В.А. Пространственно-временная изменчивость поля ветра в умеренных широтах Северного полушария // Известия АН РАН Физика атмосферы и океана, т.37, №2, 2001.-С.170-181.
8. Бокс Д.Ж., Дженкинс Г. Анализ временных рядов, прогноз и управление. М.: Мир, 1974.
9. Бомас В.В., Красовская М.А. Компьютерное исследование точности статистических методов: Учебное пособие. — М.: Изд-во МАИ, 1998.
10. Ю.Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде WINDOWS. Издательство ФИНАНСЫ И СТАТИСТИКА, 2006.
11. П.Булыгин B.C. Избранные задачи статистической оптимизации. М.: МАИ, 1978.
12. Булыгин B.C., Красовская М.А., Хахулин Г.Ф. Теоретические основы автоматизированного управления (задачи, методы, алгоритмы теории оптимального планирования и управления). — М.: Издательство МАИ, 2005.
13. Вентцель Е.С. Теория вероятностей: Учебник для студ. вузов. — М.: Издательский центр «Академия», 2003. 576 с.
14. Вентцель Е.С., Овчаров JI.A. Теория вероятностей и ее инженерные приложения. -М.: Наука, 1988.
15. Грешилов A.B., Стакун В.А., Стакун A.A. Математические методы построения прогнозов. М.: Радио и связь, 1997.-112 с.
16. Грицай А., Гаак А. Краткосрочное прогнозирование потребления электроэнергии с использованием нейронной сети // Энергорынок №11, 2007.
17. Драган Я.П. Периодические и периодически нестационарные случайные процессы // Отбор и передача информации. Киев: Наук, думка, 1985. Вып. 72. С. 3-17.
18. Ескин В.И. Модели и методы оптимального планирования эксперимента и регрессионного анализа при исследовании сложных технических систем. Учебное пособие. М.: МАИ, 1998.
19. Иванова Г.С., Ничушкина Т.Н., Пугачев Е.К. Объектно-ориентированное программирование (3-е издание), издательство «МГТУ им. Н. Э. Баумана», 2007.
20. Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными системами. — К: Техшка, 1975.
21. Ивахненко А.Г., Мюллер Й.А. Самоорганизация прогнозирующих моделей. К: Техшка, 1985.
22. Игнатов H.A., Булыгин B.C. Автоматизированная система прогнозирования динамических процессов. // Обеспечение качества навсех этапах жизненного цикла изделия / под ред. проф: Б.В. Бойцова и проф. Ю.Ю. Комарова.-М.: Изд-во МАИ-ПРИНТ, 2008.-452 е.: ил.
23. Игнатов H.A. Применение модели сезонно-стационарных. случайных процессов для прогнозирования цены на свободном рынке электрической энергии. 8-я Международная конференция «Авиация и. космонавтика-2009».Тезисы докладов. М.: Изд-во МАИ-ПРИНТ, 2009:240 с.
24. Игнатов H.A. Прогнозирование временных рядов с регулярными циклическими компонентами с помощью модели периодически коррелированных случайных процессов // Научные труды: Институт народнохозяйственного прогнозирования РАН, 2011. с. .
25. Ким Д.П. Теория автоматического управления. М.: ФИЗМАТЛИТ,. 2003.31 .Комиссарчик В.Ф., Зуев В.Н., Киселев А.Н. Применение нейронных сетей для краткосрочного прогнозирования электропотребления. // Программные продукты и системы №1, 2009.
26. Красовская М.А. Методы и алгоритмы нелинейного программирования в АСУ. -М.: Изд-во МАИ, 1994.
27. Кендэл М. Временные ряды. М.: Финансы и статистика, 1981.
28. Макоклюев Б.И. Методология и система моделей прогноза электропотребления // Рынок электротехники №4, 2007.
29. Манжиров А. В., Полянин А. Д. Справочник по интегральным уравнениям. Методы решения, М.: Изд-во Факториал Пресс, 2000, 384 стр.
30. Мышкис А. Д. Математика для технических вузов, спец. курсы, 2-е изд, СПб.: Изд-во Лань, 2002, 640 с.
31. Орлов Ю.Н., Осминин К.П. Нестационарные временные ряды: Методы прогнозирования с примерами анализа финансовых и сырьевых рынков. M.: URSS, 2011.-384с.
32. Прохоров С.А. Аппроксимативный анализ случайных процессов. Самара, 2001 г.
33. Пугачев B.C., Синицын И.Н. Стохастические дифференциальные системы. М.: 1990.
34. Розанов Ю.А. Случайные процессы. Изд. 2-е, перераб. и доп. М.: Наука, 1979.-184 с.
35. Росин М.Ф., Булыгин B.C. Статистическая динамика и теория эффективности систем управления. М.: Машиностроение, 1981.
36. Рытов С.М. Введение в статистическую радиофизику. М.: Наука, 1976.
37. Саймон Хайкин Нейронные сети: полный курс. Neural Networks: А Comprehensive Foundation. — 2-е. —М.: «Вильяме», 2006. — С. 1104.
38. Сергиенко А. Б. Цифровая обработка сигналов. — 2-е. — Спб: Питер, 2006. —С. 751.
39. Соломкин А.В. Применение нейросетевых методов для прогнозирования потребления электроэнергии // Электроника и информационные технологии №3, 2009.
40. Суслов В. И., Ибрагимов Н. М., Талышева JI. П., Цыплаков А.А. Эконометрия. —Новосибирск: СО РАН, 2005. — 744 с.
41. Хахулин Г.Ф. Основы конструирования имитационных моделей: учеб: пособие. — М.: НТК Поток, 2002. — 222 с.
42. Хованова Н.А., Хованов И.А. Методы анализа временных рядов: Учебное пособие. Саратов, Изд-во ГосУНЦ Колледж, 2001.
43. Цыплаков А.А. Введение в прогнозирование в классических моделях временных рядов. Квантиль. — 2006. — № 1. — С. 3-19.
44. Шарифуллин В.Н., Шарифуллин А.В., Абдрахманова Д.Ф. Оценка случайной компоненты потребления электрической энергии промышленным предприятием // Промышленная энергетика №4, 2009.-с.32-35.
45. Постановление Правительства Российской Федерации от 31 августа 2006 г. № 529 г. Москва "О совершенствовании порядка функционирования оптового рынка электрической энергии (мощности)".
46. Главные компоненты временных рядов: метод "Гусеница" / Под редакцией Д.Л.Данилова и А.А.Жиглявского. СПбу, 1997.
47. D'Agostino R.B. Transformation to normality of the null distribution of gi // Biometrika, 57, 1970. -P.679-681.
48. Yaglom A.M. Correlation theory of stationary and related random functions. V. I, II. New York: Springer-Verlag, 1987.
49. ОАО «АТС». Веб-сайт www.atsenergo.ru.
50. Свидетельство №2011613068 о государственной регистрации программ для ЭВМ и баз данных.
-
Похожие работы
- Математические модели многокомпонентных временных рядов в системах газораспределения
- Перестановочные методы генерирования случайных процессов с требуемыми статистическими свойствами
- Разработка и исследование алгоритмов и устройств совместной фильтрации параметров многоуровневых импульсных коррелированных сигналов
- Синтез алгоритмов и устройств фильтрации параметров статистически связанных импульсных сигналов в системах передачи непрерывных сообщений и изображений
- Статистические методы выявления скрытых периодичностей и их применение для анализа колебательной структуры геомагнитных пульсаций
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность