автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Модели, алгоритмы и программное обеспечение обработки техногенных временных рядов
Автореферат диссертации по теме "Модели, алгоритмы и программное обеспечение обработки техногенных временных рядов"
„ 00461^74У
На Ьравал руКОПИСИ
у.
Кувайскова Юлия Евгеньевна
МОДЕЛИ, АЛГОРИТМЫ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ОБРАБОТКИ ТЕХНОГЕННЫХ ВРЕМЕННЫХ РЯДОВ
Специальность: 05.13.18 - Математическое моделирование,
численные методы и комплексы программ
Автореферат
диссертации на соискание ученой степени кандидата технических наук
1 3 НОЯ 2010
Ульяновск - 2010
004612749
Работа выполнена на кафедре «Прикладная математика и информатика» Ульяновского государственного технического университета
Научный руководитель - доктор физико-математических наук, профессор
Валеев Султан Галимзянович
Официальные оппоненты - доктор технических наук, профессор
Негода Виктор Николаевич
Ведущая организация - ФНПЦ ОАО «НПО «МАРС» г. Ульяновск
Защита диссертации состоится «24» ноября 2010 г. в 12 часов 00 минут на заседании диссертационного совета Д 212.277.02 при Ульяновском государственном техническом университете по адресу: 432027, г. Ульяновск, ул. Северный Венец, 32 (ауд. 211, Главный корпус).
С диссертацией можно ознакомиться в библиотеке Ульяновского государственного технического университета.
Автореферат разослан » октября 2010 г.
Ученый секретарь диссертационного совета,
доктор технических наук, профессор Смагин Алексей Аркадьевич
доктор технических наук, профессор
В.Р. Крашенинников
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Математические модели временных рядов в технических приложениях (модели техногенных временных рядов - ТВР) играют важную роль при решении задач прогнозирования и, соответственно, задач повышения эффективности управления.
С момента появления классических работ по анализу ВР (Бокса и Дженкинса, Андерсона и других) и по сегодняшний день постоянное внимание с целью повышения точности уделяется расширению классов моделей, методам их идентификации и диагностики.
В настоящее время в технических приложениях для описания стационарных и нестационарных случайных процессов (СП) используются (после удаления трендов) известные модели авторегрессии (АР), скользящего среднего (СС), смешанной модели авторегрессии скользящего среднего (АРСС) и модели авторегрессии проинтегрированного скользящего среднего (АРПСС). Однако модель АРПСС предполагает соблюдение условия однородности нестационарного процесса, которое в ряде случаев не выполняется для нестационарных ТВР с меняющимися не только математическими ожиданиями, но и дисперсиями. Кроме того, требуют решения задачи разработки алгоритмов идентификации компонент в условиях многокомпонентное™ математической модели ТВР и программной автоматизации этого процесса. Из анализа следует, что для технических приложений ВР эти задачи не решались.
В итоге можно констатировать актуальную задачу анализа, синтеза и разработки эффективных алгоритмов идентификации и диагностики многокомпонентной модели ТВР в условиях возможной неоднородной нестационарности СП. Под неоднородным нестационарным СП понимается нестационарный СП, у которого меняется не только математическое ожидание, но и дисперсия. Решение этой задачи и рассматривается в данной диссертации.
Цель и задачи исследования
Целью диссертационной работы является повышение точности математического описания динамики и прогнозирования значений ТВР, что способствует принятию эффективных оперативных и перспективных управленческих решений.
Для достижения указанной цели решались следующие задачи:
1. Построение математических моделей ТВР, учитывающих многокомпонентность систематической и случайной составляющих ВР и неоднородный характер нестационарных СП.
2. Разработка методики моделирования и прогнозирования значений ТВР на основе расширения подхода динамического регрессионного моделирования (ДРМ), предусматривающего дополнительно предварительную оценку меры регулярности ВР, эффективную идентификацию и диагностическую проверку компонент модели, в том числе, в условиях неоднородной нестационарности.
3. Синтез алгоритма статистической идентификации АРСС-модели, позволяющего выводить из нее шумовые слагаемые.
4. Разработка программного комплекса для реализации методики анализа, моделирования и прогнозирования ТВР в условиях многокомпонентное™ математической модели и неоднородной нестационарности с автоматизированным выполнением сценариев обработки данных.
5. Анализ эффективности разработанных алгоритмов идентификации компонент модели ТВР.
Диссертационная работа выполнялась в соответствии с г/б направлением НИР УлГТУ «Оптимизация математических моделей обработки данных и информационные технологии».
Методы исследования
При решении поставленных задач в диссертационной работе использовались методы математического моделирования, прикладной математической статистики, анализа временных рядов, численные методы; при разработке программного обеспечения применялись методы объектно-ориентированного программирования.
Достоверность полученных результатов подтверждена результатами вычислительных экспериментов, корректным применением методов исследования, а также эффективностью функционирования алгоритмов и программного обеспечения при внедрении.
Научная новизна результатов, выносимых на защиту
1. Предложены математические модели ряда нестационарных ВР техногенных характеристик, случайные составляющие которых в виде структур условной гетероскедастичности описывают более широкий класс СП, чем модели АРПСС.
2. Разработана методика моделирования и прогнозирования ТВР, последовательно включающая оценку степени регулярности ВР, идентификацию и диагностическую проверку модели ВР в условиях многокомпонентности ее систематической и случайной составляющих и неоднородности нестационарного СП.
3. Синтезирован алгоритм идентификации АРСС-модели для случая статистической незначимости отдельных ее слагаемых.
4. Разработан программный комплекс моделирования и прогнозирования ТВР широкого спектра возможностей с автоматизацией процессов идентификации и диагностики в условиях многокомпонентности моделей СП.
Практическая значимость работы
Разработанный программный комплекс, созданный на основе расширенного ДРМ-подхода, предложенных алгоритмов и методики моделирования ТВР, может быть использован в производственной и научной деятельности для математического описания и прогнозирования динамики ТВР, обеспечивая при этом заметное повышение точности моделирования и
прогнозирования по сравнению с точностью при использовании стандартных методов.
Внедрение результатов
Программное обеспечение, алгоритмы и практические результаты внедрены в ФНПЦ ОАО «НПО «МАРС» города Ульяновска, Ульяновском центре по гидрометеорологии и мониторингу окружающей среды, а также в учебном процессе УлГТУ при курсовом и дипломном проектировании по специальности «Прикладная математика», что подтверждается соответствующими актами. Программный комплекс используется для моделирования и прогнозирования трафика в вычислительном центре УлГТУ.
Апробация работы
Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях, семинарах и симпозиумах: межвузовская студенческая научно-техническая конференция «Студент — науке будущего» (Ульяновск, 2006); международная конференция «Континуальные алгебраические логики, исчисления и нсйроинформатика в науке и технике: информатика, системы искусственного интеллекта и моделирование технических систем» (Ульяновск, 2006); международная конференция по логике, информатике, науковедению «Математические методы и модели в науке, технике, естествознании и экономике» (Ульяновск, 2007); шестая международная научно-практическая конференция «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2008); вторая Всероссийская научная конференция с международным участием «Нечеткие системы и мягкие вычисления» (Ульяновск, 2008); IX Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (Кемерово, 2008); восьмая международная научно-техническая конференция «Интерактивные системы: проблемы человеко-компьютерного взаимодействия» (Ульяновск, 2009); десятый Всероссийский симпозиум по прикладной и промышленной математике (Сочи - Дагомыс, 2009); шестая международная конференция «Инноватика — 2010» (Ульяновск, 2010); научно-техническая конференция профессорско-преподавательского состава УлГТУ (Ульяновск, 2007, 2008,2009 и 2010 годы).
Публикации
По теме диссертации опубликовано 22 печатные работы, в том числе, 17 статей, из которых 3 - в изданиях, входящих в перечень ВАК; получено свидетельство о государственной регистрации программы для ЭВМ.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы. Основное содержание изложено на 136 страницах, включая 61 рисунок и 2 таблицы. Список литературы включает 145 наименований использованных литературных источников.
СОДЕРЖАНИЕ РАБОТЫ
' Во введении рассмотрена актуальность темы диссертационной работы, определена ее цель и задачи, сформулированы положения, выносимые на защиту, их научная новизна и практическая ценность, представлены сведения об использовании, реализации и апробации результатов работы, структуре диссертации.
В первой главе выполнен обзор математических моделей, методов и программного обеспечения, применяемых для обработки ТВР.
Проведенный обзор показал, что в настоящее время для моделирования ТВР применяются: методы описания тренда полиномами, сплайнами, другими моделями регрессии; гармонический анализ; метод группового учета аргументов; модели АРСС, АРПСС и др. Тем не менее, в разработанных методах и подходах обработки ТВР не используется имеющийся в теории математический инструментарий для описания динамики ТВР в условиях неоднородной нестационарности; не в полной мере проводится идентификация и диагностическая проверка различных регулярностей, лежащих в основе структуры BP, что в итоге приводит к снижению точности математического описания и прогнозирования динамики ТВР.
В первой главе также представлен обзор существующих программных средств для моделирования BP (модуль «Временные ряды и прогнозирование» пакета STATISTICA, GRETL (Gnu Regression, Econometrics and Time-series Library), RATS (Regression Analysis of Time Series), система ЭВРИСТА (Экспериментальные Временные Ряды Интерактивный Статистический Анализ), реализация метода «Гусеница» - Caterpillar SSA; пакет STADIA и др.)
На сегодняшний день не существует универсального программного пакета по обработке IBP, решающего в комплексе проблемы разведочного анализа, корректности и полноты регулярного описания для повышения точности моделирования и прогнозирования, а также проблемы автоматизации при построении многокомпонентных моделей BP.
В связи с вышесказанным актуальным является применение ДРМ-подхода, в соответствии с которым ТВР могут быть описаны многокомпонентными (комплексными) математическими моделями, а также его расширения, позволяющего значительно повысить точность и эффективность обработки данных.
Во второй главе рассматриваются элементы ДРМ-подхода, а также методика моделирования ТВР.
Пусть задан процесс Y(t), наблюдаемый в равноотстоящие моменты времени ^ , t2,..., tN:
Y(0 =/(0 + <p(t)+ W(t) + £(t), t= (1)
где y(i,), Y(t2).....Y(tN) - ряд наблюдений случайной функции, называемый BP;
fit) - неслучайная (долговременная) функция тренда; g(t) - неслучайная периодическая функция; yAf) - случайная с элементами регулярности функция; е(г) - нерегулярная случайная компонента.
ДРМ-подход, предложенный С. Валеевым и практически апробированный в геофизических приложениях (С. Валеев, С. Куркина), представляет собой реализацию метода многоэтапной структурно-параметрической идентификации, на каждом этапе применения которого проводятся построение и анализ соответствующей компоненты модели ВР, оценка ее точности аппроксимации и прогнозирования, диагностика свойств остатков и при необходимости - адаптация. Для применения этого подхода необходима база функций - набор конкурирующих математических структур.
Методика моделирования ТВР на основе расширения ДРМ-подхода нацелена на решение ряда проблем обработки ТВР и предусматривает: 1, разведочный (мультифрактальный) анализ для выявления степени регулярности ряда; 2. применение методов и алгоритмов, повышающих точность моделирования при аномальных данных и наличии статистически незначимых слагаемых в АРСС-компоненте; 3. расширение набора возможных структур при описании случайной составляющей ВР за счет комплекса А11СН((ЗА11СН)-моделей; 4. использование сценариев автоматизированного многокомпонентного моделирования.
1. На начальном этапе анализа ВР требуется определить, какие из неслучайных функций /(I) и <р(0 присутствуют в разложении (1). Существует множество тестов на наличие тенденции в динамике процесса, основанных на корреляционном анализе уровней ряда. Однако классические методы расчета корреляционных функций (Дж. Бендат, А. Пирсол) могут применяться лишь в случае стационарных процессов, а для получения надежных оценок корреляций требуются процессы большой длительности. Применение мультифрактального анализа на разведочном этапе анализа свойств ВР позволяет избежать данных ограничений, что определяется возможностью его эффективного использования при рассмотрении нестационарных СП малой длительности и проведения количественной оценки меры регулярности СП.
Применение мультифрактального анализа позволяет по значениям экспонент Гельдера судить о корреляциях в динамике процесса, по спектру сингулярностей определять неоднородность изучаемого объекта, методом максимумов модулей вейвлет-преобразований устанавливать регулярность в точках динамики исследуемого процесса.
2. После идентификации значительной регулярности с помощью мультифрактального анализа предпринимается попытка выделения трендовой составляющей ряда /(*)• Выбор оптимальной функции тренда осуществляется методом перебора из некоторого множества парных зависимостей и полиномов т-ой степени по критерию минимума среднеквадратического отклонения (СКО). Для оценивания параметров трендовой составляющей применяется метод наименьших квадратов (МНК) с оценкой значимости слагаемых модели.
Нестационарные ТВР могут иметь заметную долю аномальных данных, использование которых приводит к неустойчивым оценкам параметров. Для снижения в некоторой степени влияния выбросов предложено применить робастные методы оценивания, позволяющие получить приемлемую итоговую
оценку искомых параметров и повысить качество модели по внешней и внутренней точности.
Удалив тренд, можно идентифицировать в динамике процесса неслучайную периодическую функцию <р(г). Методом спектрального анализа исследуются остатки ВР с целью обнаружения периодических слагаемых. Если спектр мощностей анализируемого ВР свидетельствует о присутствии тригонометрического тренда, то методом пошаговой регрессии определяются статистически значимые гармоники, входящие в модель ВР.
После идентификации неслучайных составляющих (ДО и (¡К!)) целью анализа ВР является моделирование случайной с элементами регулярности функции цК?). В качестве данной составляющей модели ряда могут служить различные конкурирующие между собой математические структуры, но иногда в модель бывает полезно включить линейную комбинацию, состоящую из нескольких структур (АР, СС, АРСС).
Для определения порядка модели АРСС в основном применяются предложенные Дж. Боксом и Г. Дженкинсом методы идентификации, основанные на анализе выборочных автокорреляционной и частной автокорреляционной функций при условии, что поведение теоретических автокорреляционной и частной автокорреляционной функций процессов АР, СС и АРСС известно. Выбор адекватной модели основывается на анализе остатков, которые должны иметь свойства белого шума. При таком методе идентификации возникает ряд проблем: 1) неоднозначность в определении структуры и параметров модели, т.е. можно подобрать несколько подходящих моделей; 2) проблема «перепараметризации» модели, т. е. в ней могут появиться избыточные (шумовые) слагаемые.
Т. Андерсоном была высказана идея определения порядка модели АР, используя г-критерий по аналогии с моделями обычной регрессии.
Для решения указанных проблем при определении порядка АРСС-модели был синтезирован алгоритм идентификации АРСС-модели, основанный на применении /-статистик для выделения статистически значимых слагаемых.
На первом этапе формируются модели АРСС(р,^), где параметры порядка модели р и д принимают значения не более 1. Оцениваются параметры моделей нелинейным МНК по схеме Марквардта. Проверяются предположения нормальности распределения и некоррелированности остатков моделей. Если предположения принимаются, то проверяется гипотеза о значимости входящих в модель слагаемых по Г-статистикам. При условии значимости слагаемых в нескольких рассматриваемых моделях выбирается структура с наименьшим СКО. Если модель, для которой выполняются все предположения, не найдена, то увеличивается порядок модели на единицу и расчеты производятся заново, пока не найдена модель, удовлетворяющая всем рассматриваемым критериям. Порядок модели увеличивается до тех пор, пока число оцениваемых параметров будет меньше на порядок количества наблюдений.
3. Традиционные модели ВР, такие как АРСС, не могут адекватно учесть все особенности, которыми обладают ТВР, в частности, ВР в технических приложениях могут формироваться изменчивым потоком заявок или в условиях
нестабильного управления. В основе классических моделей АРСС и АРПСС лежит предположение, что случайные остатки модели являются белым шумом с нулевым безусловным (и условным) математическим ожиданием и конечными, не зависящими от времени, безусловной (и условной) дисперсией и ковариациями. При моделировании случайной составляющей ТВР моделями АРСС условная дисперсия остатков модели может зависеть от истории процесса, т.е. наблюдаться условная гетероскедастичность. Таким образом, применение моделей АРСС и АРПСС не всегда позволяет адекватно описывать случайную составляющую ТВР. С читается (А. Айвазян), что с помощью модели АРПСС можно описать достаточно широкий класс нестационарных процессов, однако еще утверждалось, что их нестационарность чаще всего проявляется лишь в наличии зависящей от времени неслучайной составляющей Дг), имеющей вид алгебраического полинома некоторой степени, и после применения к ряду ¿-кратной процедуры метода последовательных разностей BP может быть описан моделью АРСС. Таким образом, модели АРПСС пригодны только для описания однородных нестационарных СП, т.е. в условиях изменения только математического ожидания. На практике сгущения (кластеры) больших значений математического ожидания сопровождаются большими значениями дисперсии, что не учтено в модели АРПСС. Эта задача может быть решена применением комплекса моделей авторегрессионной условной гетероскедастичности (ARCH, GARCH, ARCH-N, GARCH-N, ARCH-M, GARCH-M, EGARCH), учитывающих зависимость условной дисперсии ошибок модели от истории процесса (Р. Энгл и др.). Оптимальным выходом для условия неоднородной нестационарности СП является использование модели, сочетающей АРСС с ARCH(GARCH). В этом случае, модель АРСС используется для моделирования поведения условного математического ожидания, a ARCH(GARCH) - для моделирования условной дисперсии. Кроме того модели типа ARCH-M позволяют оценивать параметры не только условной дисперсии, но и условного математического ожидания.
Процесс типа ARCH р-то порядка описывается АР моделью, в которой, в частности, условная дисперсия ошибки случайной составляющей BP может зависеть от квадрата ошибки предыдущих наблюдений.
Пусть yrt = Д^,., +... + /Зту/,_п + £, - это процесс АР(т) с ошибкой имеющей свойства,
М{£; | £(Ч ) = 0- условное математическое ожидание, (2)
| ,-,£,.р) = М + У,£,2., +... + Y/l, - условная дисперсия. (3)
Тогда остаток АР процесса можно представить как
+ У АI +... + У„е1р + Ш, (4)
где £(/) - остатки ARCH-процесса, являющиеся белым шумом.
Процесс типа GARCH(p,#) является альтернативной модификацией модели ARCH, в которой условная дисперсия ошибки зависит как от квадратов ошибок предыдущих наблюдений, так и от дисперсий этих ошибок.
Модификации моделей АЯСН-^ и вАЯСН-И позволяют описывать СП, условное распределение которого является нормальным.
Модель типа АИСН-М предполагает явную функциональную зависимость условного среднего случайной величины от собственной условной дисперсии. В модели СтАЛСН-М непосредственно в уравнение регрессии добавляется условная дисперсия. В экспоненциальной модели ЕОАИСН логарифм условной дисперсии определяется с помощью функции стандартизованных ошибок.
Для определения наличия в модели условной гетероскедастичности в данной работе предложено использование теста Энгла, с помощью которого исследуется ВР на присутствие АЫСН-эффекта посредством представления квадратов предшествующих значений ВР в виде:
+ +- + ГР<Р- (5)
Если ВР не содержит АЯСН-эффекта, то коэффициент детерминации Я2 будет мал. АЯСН-компонента считается обнаруженной, если статистика 7К2 (Т - число квадратов значений ВР, включаемых в регрессию) превышает критическое значение £2(а),где а - уровень значимости.
Применение для описания случайной составляющей многокомпонентных моделей ВР АЛСН(САЯСН)-структур дает ряд преимуществ перед классическими моделями АРСС и АРПСС. При построении прогноза на следующий (7+1 )-й период в ошибку прогноза вносит свой вклад, во-первых, ошибка ем, а во-вторых, разница между оценками параметров и истинными значениями параметров, которые являются двумя составляющими ошибки прогноза. Метод максимального правдоподобия, применяемый при оценивании параметров моделей с условно гетероскедастичными остатками, позволяет получить более эффективные оценки параметров, чем обычные или обобщенные МНК. Таким образом, использование более точных оценок позволяет уменьшить в некоторой степени вторую составляющую ошибки прогноза. С другой стороны, в обычных моделях ВР с неизменными условными дисперсиями (например, АРСС) неопределенность ошибки прогноза - это некоторая возрастающая функция горизонта прогноза, которая (если не учитывать разницу между оценками параметров и истинными значениями) не зависит от момента прогноза. Однако в присутствии АЯСН-ошибок точность прогноза будет нетривиально зависеть от текущей информации и, следовательно, от момента прогноза. Поэтому для корректного построения прогноза требуется иметь оценки будущих условных дисперсий ошибки. В общем случае модели АРПСС имеют хорошее качество подгонки, но не гарантируют высокой точности прогноза. Таким образом, учитывая меняющуюся во времени условную дисперсию, можно значительно увеличить точность получаемых по модели прогнозов.
После структурно-параметрической идентификации модели ВР проверяется соблюдение условий применения «регрессионного анализа (РА)-МНК»: постоянство дисперсии, независимость регрессоров, нормальность распределения ошибок, нулевое значение математического ожидания ошибок,
независимость ошибок. Если основные условия РА-МНК соблюдаются, построенная комплексная модель ВР используется для прогнозирования.
4. На основе данной методики разработаны два сценария обработки данных: «жесткий» сценарий и псевдополный перебор.
Сценарий псевдополного перебора включает: на разведочном этапе проведение мультифрактального анализа ВР; при обнаружении корреляций значений ряда динамики - построение тренда, оценивание параметров которого проводится МНК или робастными методами; после удаления тренда -проведение спектрального анализа остатков, при обнаружении периодической составляющей - нахождение значимых гармоник методом пошаговой регрессии; идентификацию следующей компоненты ВР (построение наборов АРСС и АЯСН(ОАЯСН) моделей по отдельности и в комбинации друг с другом и выбор структурной модели с наименьшим СКО прогнозирования); проверку соблюдений условий применения РА-МНК; построение комплексной модели ВР. На каждом этапе проверяется условие уменьшения ошибки; если СКО прогнозирования модели на очередном этапе не снижается, то оптимальной структурой признается модель предыдущего шага.
При интерактивной обработке ТВР был выявлен ряд однотипных компонент комплексных моделей динамики ВР, в результате был предложен алгоритм «жесткого» сценария, являющийся реализацией одного из возможных вариантов псевдополного перебора и включающий такие компоненты ВР как тренд, гармоники и АКСН(ОАК.СН)-модель.
Предложенная методика в сравнении с методикой АРПСС (Дж. Бокс, Г. Дженкинс) позволяет точнее идентифицировать и исключать регулярную составляющую ВР; удалять шумовые слагаемые из компонент модели ВР; описывать случайную составляющую ряда в условиях неоднородности нестационарного СП; проводить диагностическую проверку адекватности модели, учитывая все условия применения РА-МНК, что в итоге приводит к повышению точности описания и прогнозирования динамики ТВР.
Однако разработанная методика имеет ограничение по применяемым видам АЛСН(ОАКСН)-структур, так как не учтены другие возможные зависимости дисперсии от времени. Эта задача может быть решена расширением соответствующего наполнения программного комплекса. Другим ограничением методики является неизбежное «старение» модели ВР и необходимость «обновления» ее коэффициентов, а также, возможно, ее компонент по мере поступления новых данных. Тем не менее, такая модель может быть мощным инструментом для оперативных и перспективных управленческих решений.
Разработанная методика специализирована на описание ТВР с ярко выраженной особенностью - нестабильностью характера технологического процесса (в частности, потока заявок), в котором при описании присутствуют линейный тренд и сезонные колебания, обусловленные технологическими и физиологическими ритмами, а также АЯСН-эффекты, отражающие неоднородную нестационарность СП - изменчивость не только математического ожидания, но и дисперсии в различных частях (кластерах) ВР.
В третьей главе описано программное обеспечение «Автоматизированная система ДРМ - техническая версия» (АС ДРМ-Т), предназначенное для разработки комплексных моделей ТВР с последующим их использованием для прогноза динамики ряда.
Пакет состоит из базовой части и программных модулей, расширяющих возможности динамического моделирования по обработке ТВР: «Мультифрактальный анализ», «АРСС», «вАИСН», «Робастные методы оценивания», «Сценарии обработки данных».
Математическое наполнение базовой версии пакета представлено на Рис. 1.
Рис. 1. Схема математического наполнения базовой версии пакета На Рис. 2 показана схема функционального наполнения пакета АС ДРМ-Т.
Рис. 2. Схема функционального наполнения пакета АС ДРМ-Т
Программный комплекс реализован в системе визуального объектно-ориентированного программирования Turbo Delphi. Интерфейс пакета состоит из различных графических компонент: строка меню, панель инструментов, программных и диалоговых окон. В программе существует возможность разделения основных функций системы и добавления новых для реализации различных методов расчета. Объем пакета составляет 3,72 Мбайт.
В четвертой главе приводятся результаты анализа, моделирования и прогнозирования для ряда ТВР с применением пакета АС ДРМ-Т. Ниже представлены результаты моделирования BP веб-трафика сайта издательства «Венец» УлГТУ; результаты по остальным BP описываются вкратце.
При моделировании привлечены данные веб-трафика сайта издательства «Венец» УлГТУ, передаваемые клиентам за каждый час в период с 1 апреля 2009 года по 30 апреля 2010 года (9476 наблюдений).
На Рис. За представлен график исходного ряда трафика в зависимости от времени. На Рис. 36 представлен график аппроксимации по комплексной модели ряда этого же периода; этапы ее получения описываются ниже.
1ГО020йОЗООй4000&{ЯаБ000 7[ХЯаСЮ090ГО
Время, часы Время, часы
а) б)
Рис. 3. а) График исходного ВР; б) График аппроксимации по комплексной модели ВР
Ряд признан нестационарным. Мультифрактальным анализом получены экспоненты Гельдера й(д)>0,8; следовательно, динамика ряда коррелированна и ВР имеет регулярную составляющую.
По графику ряда (Рис. За) визуально наблюдаются выбросы. Найдены оценки параметров трендовой составляющей с применением робастного метода Хубера с коэффициентом корреляции Я = 0,42. Модель имеет вид:
Тга$1с(/)=1,498Т07 + 28645-г + Х,(1), (6)
где Тгсфф) - наблюдения значений трафика в момент времени Г; Х,(г) -остатки модели после вычитания из исходного ВР трендовой составляющей.
СКО модели равно о = 89,071 Мбайт, внешнее СКО - од= 38,602 Мбайт.
Для получения внешнего СКО од (ошибки прогнозирования) исходный ВР делится на две части: 90 % точек используется для построения модели, а 10 % -
ДЛЯ КОНТРОЛЯ (получения СТд).
Без использования робастных методов СКО модели составляет а = 93,555 Мбайт, Од = 44,625 Мбайт. Таким образом, применение робастного оценивания улучшило качество модели по внутренней и внешней точности.
Результаты спектрального анализа свидетельствуют о присутствии периодических слагаемых. Методом пошаговой регрессии выделено две статистически значимые гармоники. Гармоническая модель имеет вид:
ХД) = 6,964 -10' • вш) — + 245,51) + 3,323• 107 • + 18,8б) + (7)
\ 24 ) ^4738 )
где Х2(1) - остатки после вычитания из Х,(1) гармонической модели.
СКО модели равно а = 76,385 Мбайт, внешнее СКО - од= 34,923 Мбайт. Проведена идентификация модели АРСС по разработанному алгоритму путем устранения незначимых слагаемых и построена модель АРСС(1,0):
Х/*) = 0,629-Х20-1) + Х3(0, (8)
где Хр) - остатки модели после вычитания из Х2(г) АР составляющей.
СКО модели - а = 59,356 Мбайт, стд= 31,616 Мбайт. Тест Энгла указывает на наличие АКСН-компоненты в остатках. Построена модель АЯСН(1):
Х,(1) = 0,263 • X, (I -1) + е(() + е(0, (9)
где £(/) - остатки АР-модели, представляющие собой процесс АКСН(1):
е1 (/) = 2,0538 • 1015 + 0,62203 • е1 (* -1), (10)
е(г) - остатки после ЛИСН-процесса.
В итоге ряд описан комплексной моделью в виде суммы трендовой, периодической составляющих, АРСС(1,0) и АЯСН(1):
Тгфф) = 1,498 • 10' + 28645 ■ I + 6,964 • 10' • + 245,51 ]+
1 ; (И)
+ 3,323 • 107 • ип| +18,861 + 0,629 • Х2(< -1) + 0,263 • Ху(г -1) + еЦ) + «(О, ^4738 )
где £(0 - вычисляется по формуле (10), е(/) - остатки модели.
СКО итоговой комплексной модели составило ст = 55,385 Мбайт, внешнее СКО - од= 30,063 Мбайт. Результаты диагностики остатков последнего шага: -остатки распределены нормально; - авторегрессия отсутствует.
Коэффициенты полученной модели статистически значимы на уровне значимости 0,05. Отметим, что модель трафика, как и любая модель ВР, подвержена «старению». Поэтому при поступлении новых данных параметры модели необходимо корректировать, адаптируя модель к новьм условиям развития процесса.
При моделировании веб-трафика выявлен возрастающий тренд, свидетельствующий о том, что объем передаваемой информации увеличивается от начала (сентябрь) к концу (май) учебного года. Выделены 2 гармоники с периодами 24 часа и 6-6,5 месяцев. Период в 24 часа свидетельствует о том, что от начала суток и в течение первой половины дня объем трафика постепенно увеличивается, достигая своего максимального значения к середине дня; затем постепенно снижается и к концу суток принимает минимальное значение. Период в 6-6,5 месяцев характеризует то, что в период летних отпусков, зимних праздников и каникул объем трафика уменьшается; активное использование
ресурсов сайта начинается с начала учебного семестра, возрастая к его завершению. Наличие ARCH-эффекта объясняется изменчивостью (волатильностью) обращения пользователей к ресурсам сайта.
Рад был обработан с использованием двух сценариев анализа данных. При обработке ряда по жесткому сценарию получена модель, включающая тренд, две гармоники и модель GARCH(1,1) с а = 55,737 Мбайт и стд= 31,114 Мбайт.
При анализе ряда с использованием сценария псевдополного перебора получена такая же, как и при интерактивном режиме, комплексная модель.
Обработка BP с помощью жесткого сценария занимает примерно 1 минуту, с помощью. псевдополного перебора - около 10 минут. При реализации интерактивной обработки динамики трафика перебор всевозможных структур комплексных моделей занимает около 3-4 часов. Таким образом, автоматизированное построение комплексных моделей, основанное на сценариях обработки ТВР, обеспечивает более быстрое (в 20-25 раз по сравнению с интерактивной обработкой) построение моделей BP.
По модели (11) выполнен прогноз на 264 часа (на период с 1 по 11 мая 2010 года). Интервал удовлетворительного прогноза (интервал времени, на котором предсказываемые значения более всего соответствуют реальным данным) составил 48 часов. На Рис. 4 показан график предсказанных (пунктирная линия) и исходных (сплошная линия) значений BP на 264 часа.
Статистически значимый коэффициент корреляции между точечными оценками прогноза и исходными данными на 264 часа равен 0,501, на интервале удовлетворительного прогноза - 0,758.
Время, часы
Рис. 4. Графики наблюдений и предсказанных значений трафика на 264 часа
Аналогично обработаны данные трафиков 22 портов вычислительной сети предприятия «НПО «Марс» и данные по уровню загрязнения воздуха диоксидом азота и диоксидом серы за период 01.01.2007 - 30.11.2008, полученные в Комитете по охране окружающей среды и природопользованию мэрии г. Ульяновска.
Все исследованные ВР обладают сильной регулярностью с показателями экспонент Гельдера, меняющимися в диапазоне от 0,8 до 1,5. Комплексные модели для всех ВР включают составляющие в виде тренда, гармоник,
АИСЩСАИСЩ-компонент; в некоторые модели включается АРСС. Другой особенностью рассматриваемого класса ТВР является сезонный характер гармоник, формируемых производственными циклами. Колебания от суперпозиции гармоник описываются АРСС и АЕСН(ОАЕ.СН)-компонентами, учитывающими меняющиеся во времени условное математическое ожидание и условную дисперсию, объясняемыми изменчивостью воздействия человеческого фактора на динамику процесса (при запросах, управлении, функционировании и прочее). Анализ остатков ВР после моделирования свидетельствует, что последние являются «белым шумом» с нулевым средним и постоянной дисперсией.
Для сравнительного анализа эффективности разработанных методики и программного обеспечения использовалась методика построения моделей АРПСС, реализованная в пакете 51аЙ5иса.
В таблице 1 представлены результаты сравнения по точности внутри выборки (о) и по точности за пределами выборки (сгд ) ряда ТВР.
Таблица 1. Оценка точности аппроксимации (с) и прогнозирования (<тд ) для ВР при использовании двух методик
Ряд АРПСС (Statistica) Методика (AC ДРМ-Т)
F R5 <T 0Д F R a Од
Веб-трафик 14 699 0,6081 64,078 39,953 28 837 0,7527 55,385 30,063
Диоксид азота 374,69 0,3493 0,0283 0,0178 1423,31 0,6709 0,0215 0,0170
Диоксид серы 360,53 0,3406 0,00949 0,00315 937,211 0,5731 0,00816 0,00267
Port 1 7,694 0,1407 37,3 36,9115 237,316 0,8347 17,544 12,893
Port l=mars 0,013 0,0003 96,185 128,661 95,7862 0,6438 73,853 36,22
Port 2 0,447 0,0084 3,945 5,812 158,859 0,7498 2,259 1,867
Port3 2,414 0,0436 29 020 21460 204,511 0,7942 13 298 10 438
Port 4 21,855 0,2919 2 516 2 713 209,681 0,7982 1 507 1 327
Port 14 65,84 0,5835 9,928 12,784 578,999 0,9249 3,055 3,736
Port 1306 28,39 0,3765 41 709 64 102 252,573 0,8431 21 193 29 994
Значения СКО прогнозирования (Од), .Р-статистики и коэффициента детерминации (Л2) для пакета 81аЙБЙса были вычислены путем импортирования остатков соответствующих моделей в пакет АС ДРМ-Т.
Результаты численных экспериментов свидетельствуют об эффективности использования методики и программного комплекса АС ДРМ-Т при моделировании и прогнозировании ТВР: точность моделирования и прогнозирования данных возрастает от 1,5 до 3,5 раз по сравнению с точностью при использовании методики АРПСС. Модели АРПСС в ряде случаев оказались статистически незначимыми по ^критерию.
Повышение точности аппроксимации и прогнозирования при моделировании ТВР вызвано применением многоэтапной структурно-параметрической идентификации (ДРМ-подхода), эффективность которого ранее была доказана в геофизических приложениях, и введением АКСН(ОАЫСН)-моделей, учитывающих неоднородность нестационарного СП.
При описании данных по уровню загрязнения воздуха диоксидом азота и диоксидом серы повышение точности статистически значимо (при а = 0,05); кроме того, степень адекватности по ? и Л критериям для комплексных моделей значительно выше.
Для иллюстрации эффективности разработанных алгоритмов, методики моделирования ТВР и программного обеспечения дополнительно проведено моделирование и исследование эталонных ВР: процесса АРСС и двух трехкомпонентных процессов.
Процесс АРСС. Анализировалась точность модифицированного алгоритма идентификации АРСС-модели, представленной в виде искусственно созданного процесса АРСС(1,1) (1000 наблюдений):
г(0 = 0,71 • е{1 -1) + £(г) - 0,3 • & -1). (12)
При обработке ряда с помощью пакета АС ДРМ-Т идентификация ряда проведена по модифицированному алгоритму; выявлена модель АРСС(1,1) с СКО сг= 1,0215 и ¿гд= 1,0826:
£(0 = 0,712 • £(* -1) + ¿(0 - 0,269 • £ (г -1). (13)
Результаты анализа остатков: - остатки распределены нормально; - авторегрессия отсутствует; - математическое ожидание остатков равно нулю.
При обработке ВР по методике АРПСС использовался пакет БгаЬзиса. Для идентификации модели АРПСС рассматривались автокорреляционные и частные автокорреляционные функции. Так как автокорреляционная функция процесса экспоненциально убывает, а частная автокорреляционная функция имеет обрыв после второй задержки, то можно идентифицировать процесс как АР(2) или как процессы АРСС(1,1) или АРСС(2,1). Возникает проблема неоднозначности выбора. Результаты моделирования приведены в таблице 2.
Таблица 2. Построенные АРСС-модели
Модель Формула a Oh.
АРСС(2,0) £(/) = 0,423 ■ E(t -1) + 0,155 • E(t - 2) + £(r) 1,0218 1,0845
АРСС(1,1) е (i) = 0,717 • e(t -1) + 4 (г) - 0,294 • -1) 1,0218 1,0828
АРСС(2,1) £(t) = 0,586 • E(t -1) + 0,072 • e{t - 2) + 4(t) - 0,166 • ¿¡(t -1) 1,0222 1,2928
Диагностическая проверка остатков по графикам автокорреляционных функций показывает, что остатки моделей некоррелированы; следовательно, все модели можно считать адекватными. Однако, структура АРСС(2,1) имеет два незначимых (шумовых) слагаемых, при устранении которых точность прогнозирования модели повышается примерно в 1,2 раза; при этом модель совпадает со структурой (13).
Результаты моделирования процесса АРСС иллюстрируют возможность (при применении модифицированного алгоритма) устранять неоднозначность в определении параметров модели, а при наличии незначимых слагаемых выводить их из состава, повышая точность прогнозирования.
Трехкомпонентные процессы. Для иллюстрации эффективности предлагаемой и стандартной методик моделирования ТВР были искусственно сформированы два процесса.
Первый процесс представляет собой сумму линейного тренда, одной гармоники и АРСС(1,1), к которой добавлен шум е(0, представляющий собой последовательность нормально распределенных случайных величин с нулевым средним и единичной дисперсией (1000 наблюдений):
Х(1) =2 + 0,05 • г+5 • +X, (0 + е((), (14)
где ХД) = 0,71-Х,(*-1) + £(0-0,3£((-1) - процесс АРСС(1,1).
Моделирование данного процесса по методике, реализованной в пакете АС ДРМ-Т, приводит к модели с ^статистикой, равной 209 107:
Х(1) = 2,28 + 0,05 • г + 4,86 ■ «п^+0,01 ^+Х,(<) + е(г), (15)
где Х//) = 0,7-Х|(г-1) + #(<)-0,26-£(*-1) -процесс АРСС(1,1). СКО модели ст = 1,019 ио4= 1,092.
Результаты анализа остатков: - авторегрессия отсутствует; - остатки распределены нормально; - математическое ожидание остатков равно нулю; - дисперсия остатков гомоскедастична.
При моделировании процесса с использованием методики АРПСС (пакет 81айвйса) получена модель АРПСС(2,1,1)( 1,0,0) с ^статистикой - 127 182; СКО модели сг= 1,105 и Од= 1,108; остатки модели некоррелированы.
Использование разработанной методики моделирования ТВР для процесса «Тренд+Гармоника+АРСС(1,1)» позволяет однозначно восстанавливать структуру модели, повышая степень ее адекватности и сохраняя, по меньшей мере, точность аппроксимации и прогнозирования по сравнению с моделью АРПСС.
Второй процесс представляет собой сумму линейного тренда, гармоники, процесса АИСН(1) и шума е(/) (1000 наблюдений):
Х(0 = 2 + 0,05 • г + 5 ■ + Х,(0 + е(0> (16)
где = 0,95-Х,(/-1)+ £(*), £2(0 = 0,65 + 0,3-£20-1)+е(0 -процесс АИСН(1).
При моделировании процесса по разработанной методике получена модель с /''-статистикой -1 031 230:
Х(!) = 1,78+0,05 • Г+5,04 • «п^+0,07^ + X, (г) + е(0. (17)
где Х{1) = 0,95 ■ X, (г -1) + £(1), (Г) = 0,66 + 0,3 • (1 -1) + - процесс АЯСН( 1).
СКО модели а= 0,406 и Од= 0,426. Диагностика остатков свидетельствует о соблюдении основных предположений РА-МНК.
С использованием пакета БйИвЦса получена модель АРПСС(1,1,0)(1,0,0) с ^статистикой - 329 293; СКО модели а = 0,816 и <Гд = 0,843; остатки модели некоррелированы.
Результаты исследования процесса «Тренд+Гармоника+АЯСНО)» иллюстрируют тот факт, что точность моделирования и прогнозирования по разработанной методике возрастает в 2 раза по сравнению с классическим
подходом АРПСС, не учитывающим условную гетероскедастичность; при этом заметно повышается степень адекватности модели.
Таким образом, модель АРПСС позволяет описывать только однородные нестационарные процессы, не учитывая возможность изменения дисперсии; обладая хорошими аппроксимационными свойствами, она не гарантирует высокой точности прогноза. Учет условной гетероскедастичности может заметно повысить точность прогнозирования динамики ТВР.
В заключительной части сформулированы основные результаты и выводы, полученные при выполнении диссертационной работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Предложены математические модели ряда ТВР, случайные составляющие которых в виде структур условной гетероскедастичности описывают более широкий класс процессов, чем модели АРПСС.
2. Разработана методика моделирования и прогнозирования ТВР, включающая помимо известных процедур и модифицированного алгоритма идентификации АРСС-модели: - проверку свойств ВР на наличие регулярности и трендоустойчивости методом мультифрактального анализа, позволяющего исследовать нестационарные процессы и процессы малой длительности; - оценивание параметров трендовой составляющей робастными методами для получения устойчивых к выбросам оценок параметров; - анализ свойств ВР на наличие АКСН(ОАЫСН)-компонент с помощью теста Энгла и построение соответствующих описаний АЯСН(САКСН); - «жесткий» и псевдополный сценарии структурно-параметрической идентификации для автоматизации расчетов. В случае неоднородной нестационарности СП оптимальным выходом является использование модели, сочетающей АРСС с АЯСН(ОАКСН) и позволяющей одновременно описывать поведение условного математического ожидания и условной дисперсии.
3. Показано, что применение разработанной методики при моделировании ТВР точность аппроксимации и предсказания построенных комплексных моделей выше в 1,5-3,5 раза точности моделей, получаемых классическими подходами, в частности, широко используемого АРПСС. На искусственно сформированных процессах показано, что применение разработанной методики для моделирования многокомпонентных процессов позволяет восстанавливать структуру модели, повышая степень ее адекватности, а при наличии условной гетероскедастичности в остатках, точность моделирования и прогнозирования возрастает в 2 раза по сравнению с моделью АРПСС.
4. Синтезирован алгоритм идентификации АРСС-модели для случая статистической незначимости отдельных ее слагаемых. Эффективность применения алгоритма проиллюстрирована при моделировании искусственно сформированного процесса АРСС. Показано, что использование алгоритма позволяет выявлять и выводить незначимые слагаемые модели, а также устранять неоднозначность в определении структуры модели по сравнению с алгоритмом, основанным на визуальном исследовании автокорреляционной и
частной автокорреляционной функций. При устранении шумовых слагаемых точность прогнозирования модели повышается в 1,2 раза.
5. На основе алгоритмов и методики моделирования ТВР создан программный комплекс АС ДРМ-Т, позволяющий автоматически выполнять сценарии структурно-параметрической идентификации с увеличением быстродействия примерно в 20 раз при построении комплексной модели по сравнению с интерактивной обработкой данных.
' Основные положения диссертации опубликованы в следующих работах:
Публикации в изданиях, рекомендованных ВАК
1. Валеев С.Г., Кувайскова Ю.Е. Адаптация пакета АС ДРМ к решению экономических и производственных задач // Вопросы современной науки и практики. Университет им. В.И.Вернадского. - Тамбов: ТГТУ, 2008. №2(12). Том2.-С. 60-63.
2. Валеев С. Г., Кувайскова Ю. Е., Куркина С. В., Фасхутдинова В. А. Программный комплекс для обработки временных рядов // Вопросы современной науки и практики. Университет им. В.И.Вернадского. - Тамбов: ТГТУ, 2008. №4(14). Том 2. - С. 102-107.
3. Валеев С. Г., Кувайскова Ю. Е. Программное обеспечение обработки временных рядов техногенных характеристик // Обозрение прикладной и промышленной математики. - Москва: ТВП, 2009. Т. 16, вып. 6. - С. 1037-1038.
Статьи в других изданиях
4. Валеев С. Г., Куркина С. В., Кувайскова Ю. Е. Модели сглаживания временных рядов II Труды международной конференции «Континуальные алгебраические логики, исчисления и нейроинформатика в науке и технике: Информатика, системы искусственного интеллекта и моделирование технических систем». - Ульяновск: УлГТУ, 2006. - С. 83-85.
5. Валеев С. Г., Кувайскова Ю. Е. Смешанные процессы авторегрессии и скользящего среднего для обработки временных рядов // Вестник Ульяновского государственного технического университета. - Ульяновск: УлГТУ, 2006. №4. -С. 37-41.
6. Валеев С. Г., Кувайскова Ю. Е., Сухарева Е. В. Моделирование нестационарных временных рядов на основе ДРМ-подхода и АКСН-структур И Труды международной конференции по логике, информатике, науковедению: «Математические методы и модели в науке, технике, естествознании и экономике». - Ульяновск: УлГТУ, 2007. - С. 52-54.
7. Валеев С. Г., Кувайскова Ю. Е. Использование АЯСН-структур и фильтра Калмана для моделирования динамики технико-экономических показателей // Вестник Ульяновского государственного технического университета. - Ульяновск: УлГТУ, 2007. №2. - С. 29-33.
8. Валеев С. Г., Кувайскова Ю. Е., Губайдуллина С. А. Применение мультифрактального анализа при описании временных рядов в технике и экономике // Вестник Ульяновского государственного технического университета. - Ульяновск: УлГТУ, 2008. №. 2. - С. 23-27.
9. Валеев С. Г., Кувайскова Ю. Е. Прецизионное моделирование техногенных и экономических временных рядов // Сборник трудов шестой международной научно-практической конференции «Исследование, разработка и применение высоких технологий в промышленности» / под редакцией А.П. Кудинова, Г.Г. Матвиенко. - СПб: изд. политехнического университета, 2008. -С. 11-12.
10. Валеев С. Г., Кувайскова Ю. Е. Информационно-математические технологии для обработки временных рядов в технике и экономике // Сборник научных трудов второй Всероссийской научной конференции с международным участием «Нечеткие системы и мягкие вычисления». -Ульяновск: УлГТУ, 2008. Т. 1. - С. 232-240.
11. Валеев С. Г., Кувайскова Ю. Е. Прогнозирование региональной инфляции // Вестник Ульяновского государственного технического университета. - Ульяновск: УлГТУ, 2008. №. 3. - С. 16-20.
12. Валеев С. Г., Кувайскова Ю. Е. Моделирование техногенных временных рядов // Труды седьмой международной конференции «Математическое моделирование физических, экономических, технических, социальных систем и процессов». - Ульяновск: УлГУ, 2009. - С.59-60.
13. Кувайскова Ю. Е. Моделирование распределения во времени промышленных примесей в атмосфере // Вестник Ульяновского государственного технического университета. - Ульяновск: УлГТУ, 2009. №. 3. -С. 12-16.
14. S. G. Valeev, Yu. Е. Kuvayskova, А. М. Velikanov Scenarios of technogenic time series treatment in the environment of a package AS DRM-T // Interaktive Systems and Technologies: the Problems of Human-Computer Interaction. Volume III. - Collection of scientific papers. - Ulyanovsk: U1STU, 2009. - 370-373 p.
15. Валеев С. Г., Кувайскова Ю. Е., Стецко A.A. Моделирование трафика вычислительной сети // Сборник научных трудов Всероссийской конференции с элементами научной школы для молодежи «Проведение научных исследований в области обработки, хранения, передачи и защиты информации». - Ульяновск: УлГТУ, 2009. - С. 190-198.
16. Валеев С.Г., Кувайскова Ю. Е., Юдкова М.В. Робастные методы оценивания: программное обеспечение, эффективность // Вестник Ульяновского государственного технического университета. - Ульяновск: УлГТУ, 2010. №. 1. - С. 29-33.
17. Кувайскова Ю. Е. Инновационные технологии моделирования показателей производственной деятельности // Труды международной конференции «Инноватика - 2010». - Ульяновск: УлГУ, 2010. Том 1. -С. 106-107.
Доклады и тезисы конференций
18. Валеев С. Г., Кувайскова Ю. Е. Алгоритмы и программное обеспечение усреднения при обработке временных рядов // Сборник тезисов Межвузовской
студенческой научно-технической конференции «Студент - науке будущего». -Ульяновск: УлГТУ, 2006. - С. 34.
19. Кувайскова Ю. Е. Моделирование reo- и гелиофизических временных рядов на основе ДРМ-подхода и ARCH-структур // Сборник тезисов 41-й научно-технической конференции Ульяновского государственного технического университета «Вузовская наука в современных условиях». -Ульяновск: УлГТУ, 2007. - С. 130.
20. Кувайскова Ю. Е. Применение GARCH-структур для моделирования динамики производственных экономических показателей // Сборник тезисов 42-й научно-технической конференции Ульяновского государственного технического университета «Вузовская наука в современных условиях». -Ульяновск: УлГТУ, 2008. - С. 139.
21. Кувайскова Ю. Е. Модификация программного комплекса АС ДРМ для обработки временных рядов в технике и экономике // Сборник тезисов девятой Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям. - Новосибирск: ИВТ СО РАН, 2008. - С. 81-82.
22. Кувайскова Ю. Е. Прогнозирование темпов инфляции // Сборник тезисов девятой Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям. . -Новосибирск: ИВТ СО РАН, 2008. - С. 52.
Свидетельства о государственной регистрации программ для ЭВМ
23. Валеев С. Г., Кувайскова Ю. Е. Автоматизированная система динамического регрессионного моделирования - техническая версия (АС ДРМ-Т). Свидетельство о государственной регистрации программы для ЭВМ, №2010614437.
Кувайскова Юлия Евгеньевна
МОДЕЛИ, АЛГОРИТМЫ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ОБРАБОТКИ ТЕХНОГЕННЫХ ВРЕМЕННЫХ РЯДОВ
Автореферат
Подписано в печать 18.10.2010. Формат 60x84/16. Усл. печ. л. 1,39. Тираж 100 экз. Заказ 1083. Типография УлГТУ, 432027, г. Ульяновск, ул. Сев. Венец, 32
Оглавление автор диссертации — кандидата технических наук Кувайскова, Юлия Евгеньевна
1. МЕТОДЫ И ПРОБЛЕМЫ ИССЛЕДОВАНИЯ ТЕХНОГЕННЫХ ВРЕМЕННЫХ РЯДОВ.
1.1. Методы обработки и модели описания временных рядов.
1.2. Программное обеспечение обработки временных рядов.
1.2.1. Пакеты общего назначения.
1.2.2. Специализированные пакеты.
1.2.3. Недостатки существующих пакетов.
1.3. Проблемы моделирования динамики техногенных характеристик.
1.3.1. Временные ряды показателей технических систем.
1.3.2. Временные ряды промышленных примесей.
1.4. Выводы по обзору.
1.5. Постановка задач исследования.
2. АДАПТАЦИЯ ПОДХОДА ДИНАМИЧЕСКОГО РЕГРЕССИОННОГО МОДЕЛИРОВАНИЯ (ДРМ) К ОПИСАНИЮ ВРЕМЕННЫХ РЯДОВ ТЕХНОГЕННЫХ ХАРАКТЕРИСТИК.
2.1. Элементы ДРМ-подхода.
2.2. Расширение инструментария динамического моделирования.
2.2.1. Мультифракталъный анализ.
2.2.2. Модель авторегрессии-сколъзящего среднего.
2.2.3. Авторегрессионная модель с условной гетероскедастичностью
2.2.4. Обобщенная модель ARCH (GARCH).
2.2.5. Другие одномерные параметризации ARCH-модели.
2.2.6. Робастные методы оценивания.
2.3. Алгоритм идентификации АРСС-модели.
2.4. Методика моделирования ТВР.
3. ПРОГРАММНЫЙ КОМПЛЕКС АС ДРМ-Т ДЛЯ ОБРАБОТКИ ТЕХНОГЕННЫХ ВРЕМЕННЫХ РЯДОВ.
3.1. Базовая версия пакета (АС ДРМ).
3.1.1. Назначение и структура пакета.
3.1.2. Функциональное наполнение базовой версии пакета.
3.2. Программный пакет для обработки техногенных временных рядов
3.2.1. Общее описание.
3.2.2. Модуль «Мулътифрактальный анализ».
3.2.3. Модуль авторегрессии-сколъзящего среднего.
3.2.4. Авторегрессионные модели условной гетероскедастичности.
3.2.5. Процедура робастного оценивания.
3.2.6. Сценарии обработки данных.
4. СТАТИСТИЧЕСКИЙ АНАЛИЗ ТЕХНОГЕННЫХ ВРЕМЕННЫХ РЯДОВ.
4.1. Моделирование динамики технологических характеристик.,.
4.2. Моделирование распределения во времени промышленных примесей в атмосфере.
4.3. Сравнение результатов по точности моделирования и прогнозирования
4.4. Моделирование эталонных временных рядов.
Введение 2010 год, диссертация по информатике, вычислительной технике и управлению, Кувайскова, Юлия Евгеньевна
Актуальность темы. Математические модели временных рядов в технических приложениях (модели техногенных временных рядов — ТВР) играют важную роль при решении задач прогнозирования и, соответственно, задач повышения эффективности управления.
С момента появления классических работ по анализу ВР (Бокса и Дженкинса, Андерсона и других) и по сегодняшний день постоянное внимание с целью повышения точности уделяется расширению классов моделей, методам их идентификации и диагностики.
В настоящее время в технических приложениях для описания стационарных и нестационарных случайных процессов (СП) используются (после удаления трендов) известные модели авторегрессии (АР), скользящего среднего (СС), смешанной модели авторегрессии скользящего среднего (АРСС) и модели авторегрессии проинтегрированного скользящего-среднего (АРПСС). Однако модель АРПСС предполагает соблюдение условия однородности нестационарного процесса, которое в ряде случаев не выполняется для нестационарных ТВР" с меняющимися не только математическими ожиданиями, но- и дисперсиями. Кроме того, требуют решения задачи разработки алгоритмов идентификации компонент в условиях многокомпонентности математической модели ТВР и программной автоматизации этого процесса. Из анализа следует, что для технических приложений ВР эти задачи не решались.
В итоге можно констатировать актуальную задачу анализа, синтеза и разработки эффективных алгоритмов идентификации и диагностики многокомпонентной модели ТВР в условиях возможной неоднородной нестационарности СП. Под неоднородным нестационарным СП понимается нестационарный СП, у которого меняется не только математическое ожидание, но и дисперсия. Решение этой задачи и рассматривается в данной диссертации.
Целью диссертационной работы является повышение точности математического описания динамики и прогнозирования значений ТВР, что способствует принятию эффективных оперативных и перспективных управленческих решений.
Для достижения указанной цели решались следующие задачи:
1. Построение математических моделей ТВР, учитывающих многокомпонентность систематической и случайной составляющих ВР и неоднородный характер нестационарных СП.
2. Разработка методики моделирования и прогнозирования значений ТВР на основе расширения подхода динамического регрессионного моделирования (ДРМ), предусматривающего дополнительно предварительную оценку меры регулярности ВР, эффективную идентификацию и диагностическую проверку компонент модели, в том числе, в условиях неоднородной нестационарности.
3. Синтез алгоритма статистической идентификации АРСС-модели, позволяющего выводить из нее шумовые слагаемые.
4. Разработка программного комплекса для реализации методики анализа, моделирования и прогнозирования ТВР в условиях многокомпонентности математической модели и неоднородной нестационарности с автоматизированным выполнением сценариев обработки данных.
5. Анализ эффективности разработанных алгоритмов идентификации компонент модели ТВР.
Диссертационная работа выполняется в соответствии с г/б направлением НИР УлГТУ «Оптимизация математических моделей обработки данных и информационные технологии».
При решении поставленных задач в диссертационной работе использовались методы математического моделирования, прикладной математической статистики, анализа1 временных рядов, численные методы; при разработке программного обеспечения применялись методы объектно-ориентированного программирования.
Достоверность полученных результатов подтверждена результатами вычислительных экспериментов, корректным применением методов исследования, а также эффективностью функционирования алгоритмов и программного обеспечения при внедрении.
Научная новизна результатов, выносимых на защиту:
1. Предложены математические модели ряда нестационарных ВР техногенных характеристик, случайные составляющие которых в виде структур условной гетероскедастичности описывают более широкий класс СП, чем модели АРПСС.
2. Разработана методика моделирования и прогнозирования ТВР, последовательно включающая оценку степени регулярности ВР, идентификацию и диагностическую проверку модели ВР в условиях многокомпонентности ее систематической и случайной составляющих и неоднородности нестационарного СП.
3. Синтезирован алгоритм идентификации АРСС-модели для случая статистической незначимости отдельных ее слагаемых.
4. Разработан программный комплекс моделирования и прогнозирования ТВР широкого спектра возможностей с автоматизацией процессов идентификации и диагностики в условиях многокомпонентности моделей СП.
Практическая значимость работы заключается в том, что разработанный программный комплекс, созданный на основе расширенного ДРМ-подхода, предложенных алгоритмов и методики моделирования ТВР, может быть использован в производственной и научной деятельности для математического описания и прогнозирования динамики ТВР, обеспечивая при этом заметное повышение точности моделирования и прогнозирования по сравнению с точностью при использовании стандартных методов.
Программное обеспечение, алгоритмы и практические результаты внедрены в ФНПЦ ОАО «НПО «МАРС» города Ульяновска, Ульяновском центре по гидрометеорологии и мониторингу окружающей среды, а также в учебном процессе УлГТУ при курсовом и дипломном проектировании по специальности «Прикладная математика», что подтверждается соответствующими актами. Программный комплекс используется для моделирования и прогнозирования трафика в вычислительном центре УлГТУ.
Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях, семинарах и симпозиумах:
- межвузовская студенческая научно-техническая конференция «Студент - науке будущего» (Ульяновск, 2006);
- международная конференция «Континуальные алгебраические логики, исчисления и нейроинформатика в науке и технике: информатика, системы искусственного интеллекта' и моделирование технических систем» (Ульяновск, 2006);
-международная конференция.по логике, информатике, науковедению «Математические методы и модели в науке, технике, естествознании и экономике» (Ульяновск, 2007);
- шестая международная научно-практическая конференция «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2008);
- вторая Всероссийская научная конференция с международным участием «Нечеткие системы и мягкие вычисления» (Ульяновск, 2008);
- IX Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям (Кемерово, 2008);
- восьмая международная научно-техническая конференция «Интерактивные системы: проблемы человеко-компьютерного взаимодействия» (Ульяновск, 2009);
- десятый Всероссийский симпозиум по прикладной и промышленной математике (Сочи - Дагомыс, 2009);
-шестая международная конференция «Инноватика - 2010» (Ульяновск, 2010);
- научно-техническая конференция профессорско-преподавательского состава УлГТУ (Ульяновск, 2007, 2008, 2009 и 2010 годы).
Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы. Основное содержание изложено на 136 страницах, включая 61 рисунок и 2 таблицы. Список литературы включает 145 наименований использованных литературных источников.
Заключение диссертация на тему "Модели, алгоритмы и программное обеспечение обработки техногенных временных рядов"
Результаты исследования процесса «Тренд+Гармоника+АЯСН(1)>> иллюстрируют тот факт, что точность моделирования и прогнозирования по разработанной методике возрастает в 2 раза по сравнению с классическим подходом АРПСС, не учитывающим условную гетероскедастичность; при этом заметно повышается степень адекватности модели.
Таким образом, модель АРПСС позволяет описывать только однородные нестационарные процессы, не учитывая возможность изменения дисперсии; обладая хорошими аппроксимационными свойствами, она не гарантирует высокой точности прогноза. Учет условной гетероскедастичности может заметно повысить точность прогнозирования динамики ТВР.
ЗАКЛЮЧЕНИЕ
Основными результатами диссертации являются:
1. Предложены математические модели ряда ТВР, случайные составляющие которых в виде структур условной гетероскедастичности описывают более широкий класс процессов, чем модели АРПСС.
2. Разработана методика моделирования и прогнозирования ТВР, включающая помимо известных процедур и модифицированного алгоритма идентификации АРСС-модели:
- проверку свойств ВР на наличие регулярности и трендоустойчивости методом мультифрактального анализа, позволяющего исследовать нестационарные процессы и процессы малой длительности;
- оценивание параметров трендовой составляющей робастными методами для получения устойчивых к выбросам оценок параметров;
- анализ свойств ВР на наличие АЕ.СН(ОА11СН)-компонент с помощью теста Энгла и построение соответствующих описаний АИСН(ОАЯСН);
- «жесткий» и псевдополный сценарии структурно-параметрической идентификации для автоматизации расчетов.
В случае неоднородной нестационарности СП оптимальным выходом является использование модели, сочетающей АРСС с АЯСН(ОАКСН) и позволяющей одновременно описывать поведение условного математического ожидания и условной дисперсии.
3. Показано, что применение разработанной методики при моделировании ТВР точность аппроксимации и предсказания построенных комплексных моделей выше в 1,5-3,5 раза точности моделей, получаемых классическими подходами, в частности, широко используемого АРПСС. На искусственно сформированных процессах показано, что применение разработанной методики для моделирования многокомпонентных процессов позволяет восстанавливать структуру модели, повышая степень ее адекватности, а при наличии условной гетероскедастичности в остатках, точность моделирования и прогнозирования возрастает в 2 раза по сравнению с моделью АРПСС.
4. Синтезирован алгоритм идентификации АРСС-модели для случая статистической незначимости отдельных ее слагаемых. Эффективность применения алгоритма проиллюстрирована при моделировании искусственно сформированного процесса АРСС. Показано, что использование алгоритма позволяет выявлять и выводить незначимые слагаемые модели, а также устранять неоднозначность в определении структуры модели по сравнению с алгоритмом, основанным на визуальном исследовании автокорреляционной и частной автокорреляционной функций. При устранении шумовых слагаемых точность прогнозирования модели повышается в 1,2 раза.
5. На основе алгоритмов и методики моделирования ТВР создан программный комплекс АС ДРМ-Т, позволяющий автоматически выполнять сценарии структурно-параметрической идентификации с увеличением быстродействия примерно в 20 раз при построении комплексной модели по сравнению с интерактивной обработкой данных.
Библиография Кувайскова, Юлия Евгеньевна, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Колмогоров А. Н. Интерполяция и экстраполяция стационарных случайных последовательностей // Изв. АН СССР. Сер. матем. 1941. Т. 5. № З.-С. 18-24.
2. Бартлетт М. С. Введение в теорию случайных процессов. М.: Изд-во иностр. лит., 1958.-384 с.
3. Свешников А. А. Прикладные методы случайных функций. — М.: Наука, 1968. 172 с.
4. Четыркин Е. М. Статистические методы прогнозирования. М.: Статистика, 1977. -200 с.
5. Себер Дж. Линейный регрессионный анализ. М.: Мир, 1980. - 456 с.
6. Маленво Э. Статистические методы эконометрии. М.: Статистика, 1976.-327 с. ■ "
7. Кендэл М. Временные ряды. М.: Финансы и статистика, 1981. -199 с.
8. Кремер Н. Ш., Путко Б. А. Эконометрика: Учебник для вузов / Под ред проф. Н. Ш. Кремера. М.: ЮНИТИ-ДАНА, 2003. - 311 с.
9. Елисеева И. И., Курышева C.B., Костеева Т.В. и др. Эконометрика: Учебник / И. И. Елисеева, С. В. Курышева, Т. В". Костеева и др.; Под ред. И. И. Елисеевой. 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2005. - 576 с.
10. Андерсон Т. Статистический анализ временных рядов. М.: Мир, 1976.-756 с.
11. Линник Ю. В. Метод наименьших квадратов^ основы математико-статистической теории обработки наблюдений. М.: Физматгиз, 1962. -333 с.
12. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов / Пер. с англ.; Под ред. X. Д. Икрамова. М.: Наука, 1986. - 230 с.
13. Валеев С. Г. Регрессионное моделирование при обработке наблюдений. М.: Наука, 1991. - 272 с. (второе издание, дополненное ипереработанное: Валеев С. Г. Регрессионное моделирование при обработке данных. Казань: ФЭН, 2001. - 296 с.)
14. Носко В. П. Эконометрика. Введение в регрессионный анализ временных рядов. -М.: ИЭПП., 2002. 254 с.
15. Вайну Я. Я.-Ф. Корреляция рядов динамики. М.: Статистика, 1977. -119 с.
16. Montgomery D. С., Johnson L. A., Gardiner J. S. Forecasting and Time Series Analysis. New York:Mc Graw-Hill, 1990. - 394 p.
17. Крамер Г. Математические методы статистики. — М.: Изд-во иностр. лит., 1948.-631 с.
18. Хеннан Э. Анализ временных рядов. М.: Статистика, 1964. - 215 с.
19. Кашьяр Р. Л., Рао А. Р. Построение динамических стохастических моделей по экспериментальным данным. М.: Наука. 1983. - 384 с.
20. Кендалл М., Стьюарт А. Статистические выводы и связи. М.: Наука, 1973. - 899 с.
21. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. М.: Статистика, 1973. - 392 с.
22. Енюков И. С. Методы, алгоритмы, программы многомерного статистического анализа. М-.: Финансы и статистика, 1986; - 230 с.
23. Чуй К. Введение в вейвлеты. М.: Мир, 2001. - 412 с.
24. Бриллинджер Д. Временные ряды. Обработка данных и теория. М.: Мир, 1980.-536 с.
25. Shumway R. Н. Applied statistical time series analysis. — Englewood Cliffs, NJ: Prentice Hall, 1988. 179 p.
26. Bloomfield P. Fourier analysis of time series: An introduction. New York: Wiley, 1976. - 258 p.
27. Brillinger D. R., Krishnaiah P.R. Handbook of Statistics, Vol. 3. Time Series in the Frequency Domain. 1983. 486 p.
28. Вентцель E. С. Теория вероятностей. М.:Наука, 1968. - 536 с.
29. Пугачев В. С. Введение в теорию вероятности. М.: Наука, 1968. -368 с.
30. Дженкинс Г., Ватте Д. Спектральный анализ и его применение. Т.1. — М.: Мир, 1971.-316 с.
31. Журбенко И.Г. Спектральный анализ временных рядов. М.: Изд-во Моск. ун-та, 1982. - 168 с.
32. Jenkins G.M., Watts D.G. Spectral Analysis and Its Application. San Francisco: Golden-Day, 1968. — 525 p.
33. Губанов В. А., Ковальджи А. К. Выделение сезонных колебаний на основе вариационных принципов // Эконом, и мат. методы, 2001, Т.37, № 1. -С. 91-102.
34. Губанов В. А. Выделение нестационарной циклической составляющей из временных рядов // Эконом, и мат. методы, 2003, Т. 39, №1. -С. 76-89.
35. Кендалл М., Стьюарт А. Многомерный статистический анализ и временные ряды. М. Наука, 1976. - 736 с.
36. Кильдишев Г. С., Френкель А. А. Анализ временных рядов и прогнозирование. М.: Статистика, .1973. - 103 с.
37. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики. -М.: ЮНИТИ, 1998. 1024с.
38. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М.: Мир, 1974. - 242 с.
39. Безручко Б.П., Смирнов Д.А. Статистическое моделирование по временным рядам. Учебно-методическое пособие. Саратов: Издательство ГосУНЦ «Колледж», 2000. - 23 с.
40. Yule G.U. On a method of investigating periodicities in disturbed series with special reference to wolfer's sunspot numbers // Phil.Trans.R.Soc.London A, 1927. Vol. 226. P. 267-298.
41. Льюнг JI. Идентификация систем. Теория для пользователя. М.: Наука, 1991.-432 с.
42. Bails D. G., Peppers L. С. Business fluctuations: forecasting techniques and applications. — Englewood Cliffs, NJ : Prentice Hall, 1993. — 607 p.
43. Engle Robert F. Autoregressive Conditional Heteroskedasticity with Estimates of the Variance of U.K. Inflation // Econometrica, 1982. v. 50. -P. 987-1008.
44. Bollerslev Tim Generalized Autoregressive Conditional Heteroskedasticity// Journal of Econometrics, 1986. v. 31. P. 307-327.
45. McSharry P. E., Smith L. A. Better Nonlinear Models from Noisy Data: Attractors with Maximum Likelihood // Phys. Rev. Lett., 1999. v. 83. -P. 4285-4288.
46. Крисилов B.A., Олешко Д.Н., Трутнев А.В. Применение нейронных сетей в задачах интеллектуального анализа информации.// Труды Одесского политехнического университета, Вып.2 (8). 1999. — С. 134.
47. Картавцев В.В'. Нейронная сеть предсказывает курс доллара? // Компьютеры + программы. 1993. N 6(7). С. 10-13.
48. Ежов А.А., Шумский С.А. Нейрокомпьютинг и его применения в экономике и бизнесе. М.: МИФИ, 1998. - 222 с.
49. Розенблатт Ф. Принципы нейродинамики. Перцептроны и теория механизмов мозга. -М.: Мир, 1965. 302 с.
50. Уоссермен Ф. Нейрокомпьютерная техника. М.: Мир, 1992. - 250 с.
51. Галушкин А. И. Теория нейронных сетей. М: ИПРРЖР, 2000. -416 с.
52. Статистические и математические системы // Тысячи программных продуктов: Каталог: Вып. 2. М., 1995. С. 88-92.
53. Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере: Учеб. Пособие / Под ред. В. Э. Фигурнова. -М.: ИНФА-М: Финансы и статистика, 1995.-384 с.
54. Горчаков A.A. Математический аппарат для инвестора // Аудит и финансовый анализ, 1997. №3. (статья pdf)
55. Кузнецов С. Е. и др. Система статистического анализа временных рядов МЕЗОЗАВР. -М.: Финансы и статистика, 1991.
56. Дайитбегов Д. М. Компьютерные технологии анализа данных в эконометрике. М.: ИНФРА-М - Вузовский учебник, 2008. XIV. - 578 с.
57. Кулаичев А.П. Методы и средства анализа данных в среде Windows. STADIA 6.0. M.: Информатика и компьютеры, 1996. - 257 с.65. http://smile.nsu.ru/matlab/ExponentaRU/66. http://www.gistatgroup.com/
58. Валеев С.Г., Куркина С. В. Программная реализация ДРМ-подхода для обработки и анализа временных рядов // Известия вузов. Геодезия и аэрофотосъемка, 2006. № 5. С. 10-21.
59. Валеев С.Г., Куркина C.B. Программный комплекс для обработки временных рядов// Вестн. Ул. гос. техн. ун-та, 2005. №4. С. 27-31.69. http://www.eviews.com
60. Молчанов И.Н., Герасимова И.А. Компьютерный практикум по начальному курсу эконометрики (реализация на Eviews): Практикум /
61. Ростовский государственный экономический университет. — Ростов-н/Д., — 2001.-58 с.71. http://www.forecasting-soft.rn72. http://www.graphpad.com73. http://www.brodgar.com/74. http://www.isa.ru/75. http://www.spss.ru/76. http://mvtu.power.bmstu.ru/
62. Brown R. L., Durbin J., Evans J. M. Techniques for Testing the Constancy of Regression Relationship over Time // Journal, of the Royal Statistical Society. Series В (Methodological), 1975.Vol. 37. No. 2: P. 149-192.
63. Никифоров И. В. Последовательное обнаружение изменения свойств временных рядов. -М: Наука. 1983. - 200 с.
64. Пилипенко А. М. Модели и методы нахождения и учета структурного изменения в динамических регрессиях и их применение // (http://www.bogdinst.ru/vestnik/doc 16/06.doc)
65. Галустов Г. F., Бровченко С. П., Мелешкин С.Н. Математическое моделирование и прогнозирование в технических системах: Учебное пос. -Таганрог: Изд-во ТТИ ЮФУ, 2008. 30 с.
66. Шибаева Е.С. Линейный анализ сетевого трафика // Труды 52-й научной конференции МФТИ «Современные проблемы фундаментальных и прикладных наук»: Часть I. Радиотехника и кибернетика. Том 1. М.: МФТИ, 2009.-182 с.
67. Akaike Н. A New Look at the Statistical Model Identification // IEEE Transactions on Automatic Control, 1974. AC. 19. P. 716-723.
68. Гурский С. К. Адаптивное прогнозирование временных рядов в электроэнергетике. Мн.: Наука и техника, 1983. - 271 с.
69. Бэнн Д. В., Фармер Е. Д. Сравнительные модели прогнозирования электрической нагрузки. М.: Энергоатомиздат, 1987. - 200 с.
70. Ляпунов A.A., Багриновская Г.П. О методологических вопросах математической биологии. // Математическое моделирование в биологии. — М., 1975.-С. 5-19.
71. Петросян H.A., Захаров В.В. Введение в математическую экологию. -Д.: Изд-во Ленингр. ун-та, 1986. 222 с.
72. Сельскохозяйственные экосистемы / Пер. с англ. A.C. Каменского, Ю.А. Смирнова, Э.Е. Хавкина, Под ред. Л.О. Карпачевского. М.: Агропромиздат, 1987.-223 с.
73. Ризниченко Г.Ю., Рубин А.Б. Математические модели биологических продукционных процессов. М.: Изд. МГУ, 1993. - 301 с.
74. Розенберг Г. С., Шитиков В. К., Брусиловский П. М. Экологическое прогнозирование (Функциональные предикторы временных рядов). — Тольятти, 1994. 182 с.
75. Никитин А. Я., Сосунова И. А. Анализ и прогноз рядов в экологических наблюдениях и экспериментах. Иркутск: Изд-во Иркут. гос. пед. ун-та, 2003. - 73 с.
76. Сотникова М.В., Демьянова B.C., Дярькин Р.В., Канеева А.Ш. Анализ и прогнозирование выбросов загрязняющих веществ в атмосферу от автотранспортного комплекса // Экология и промышленность России, 2008. №7.-С. 29-31.
77. Фогель Л., Оуэне А., Уолш М. Искусственный интеллект и эволюционное моделирование. -М.: Мир, 1969. 230 с.
78. Букатова И. Л. Эволюционное моделирование и его приложения. — М.: Наука, 1979.-232 с.
79. Ивахненко А. Г. Долгосрочное прогнозирование и управление сложными системами. — Киев: Техника, 1975. — 312 с.
80. Ивахненко А. Г. Индуктивный метод самоорганизации моделей сложных систем. Киев: Наук, думка; 1982. -296 с.
81. Бутов A.A. Некоторые вероятностные задачи, возникающие при построении моделей // Обозрение прикладной и промышленной математики, 1997. Т. 4. Вып. 1.-С. 5-17.
82. Куркина С. В. Разработка и исследование статистических моделей гелио- и геофизических характеристик на основе динамического, регрессионного моделирования: автореф. дис. канд. тех. наук. / УлГТУ. — Ульяновск: УлГТУ, 2006. 23 с.
83. Иайтген X. О., Рихтер П. X. Красота фракталов. М.: Мир, 1993. -176 с.
84. Федер Е. Фракталы. М.: Мир, 1991. - 254 с.
85. Шредер М. Фракталы, хаос, степенные законы: Миниатюры из бесконечного рая. Ижевск: РХД, 2001. - 528 с.
86. Mandelbrot В:В. The Fractal Geometry of Natur. San Francisco: W.II.Freeman, 1982. -210 p.
87. Peters E. Fractal structure in the capital markets // Financial analysis journal, 1989.-P. 32-37.
88. Петере Э. Фрактальный анализ финансовых рынков: приложение теории хаоса в инвестициях и экономике. М.: Интернет-трейдинг, 2004. -304 с.
89. Зельдович Я.Б., Соколов Д.Д. Фракталы, подобие, промежуточная размерность // УФН, 1985. Т. 146, №3. С. 493-506.
90. Зосимов В.В., Лямшев JliM. Фракталы в волновых процессах // УФН, 1995. Т.165, №4: С.361-401.
91. Соколов И.М. Размерности и другие геометрические критические показатели в теории протекания // УФН, 1986. Т. 150. №2. С. 221- 255.
92. Arneodo A., Decoster N., Roux S.G. Intermittency, lognormal statistics, and multifractal cascade process in highresolution satellite images of cloud structure //Phys. Rev. Lett., 1999. V.83. -P. 1255-1258.
93. Chabra A., Meneveau C., Jensen R.V., Sreenivasan K.R. Direct determination of the f(a) singularity spectrum and its application to fully developed turbulence // Phys. Rev. A., 1989. V.40. P. 5284-5294.
94. Family F., Vicsek T. Dynamics of Fractal Surfaces. Singapore: World Scientific, 1991.-376 p.
95. Астафьева H.M. Вейвлет-анализ: основы теории и примеры применения // УФН, 1996. Т. 166. №11. С. 1145-1170.
96. Дремин И. М. , Иванов О. В., Нечитайло В. А. Вейвлеты и их использование // УФН, 2001. Т. 171. № 5. С. 465-501.
97. Короновский А. А., Храмов А. Е. Непрерывный вейвлетный анализ и его приложения. М:: Физматлит, 2003. - 176 с.
98. Grossmann A., Morlet S. Decomposition ofiHardy functions into square integrable wavelets of constant shape // SIAM J. Math. Anal., 1984. V. 15. № 4. -P. 723-736.
99. Божокин С. В., Иашин Д. А. Фракталы и мультифракталы. -Ижевск: НИЦ'«Регулярная и хаотическая динамика», 2001. — 128 с.
100. Muzy J.F., Bacry Е., Arneodo A. Multifractal- formalism for fractal signals: the structure-function approach versus the wavelet-transform modulus-maxima method // Phys. Rev. E. 1993. V.47. P.875-884.
101. Павлов A.H., Анищенко B.C. Мультифрактальный анализ сложных сигналов // УФН, 2007. Т. 177, №8. С. 859-876.
102. Павлов А.Н., Сосновцева О.В., Зиганшин А.Р. Мультифрактальный анализ хаотической динамики взаимодействующих систем // Изв. ВУЗов. Прикладная нелинейная динамика, 2003'. Т. И, №; 2. С. 39-54.
103. Peng C.-K., Havlin S., Stanley H.E., Goldberger A.L. Quantification of scaling exponents and crossover phenomena in nonstationary heartbeat time series // Chaos. 1995. V.5. P.82-87.
104. Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А.А. Эконометрия: Учебное пособие. Новосибирск: Издательство СО РАН, 2005. -744 с.
105. Engle R., Kroner К. Multivariate Simultaneous GARCH // Econometric Theory 11. 1995.-P. 122-150.
106. Bollerslev Т., Engle R.F., Nelson D.B. ARCH Models // Handbook.of Econometrics, Vol. IV, Ch. 49, Elsevier Science, 1994. P. 2959-3038.
107. Bollerslev Tim, Engle Robert F., Nelson Daniel B. ARCH« Models // University of California, San Diego, 1993.
108. Bera A.K., Higgins M.L. ARCH Models: Properties, Estimation and Testing // Journal of Economic Surveys, 7, 1993. P. 305-362.
109. Nelson D.B. Conditional Heteroskedasticity in Asset Returns: A. New Approach//Econometrica, 1991. Vol. 59. No. 2. P. 347-370.
110. Предтеченский А.Г. Построение моделей авторегрессионной условной гетероскедастичности, (ARCH) некоторых индикаторов российского финансового рынка (дипломная работа), ЭФ НГУ 2000. http://www.nsu.ru/e£'tsy/ecmr/garch/predtech/index.htm.
111. Крянев А.В Математические методы обработки неопределенных данных. М.: ФИЗМАТЛИТ, 2003. - 211 с.
112. Хубер П. Робастность в статистике. -М.: Мир 1984. 304 с.
113. Смоляк С.А., Титаренко Б.П. Устойчивые методы оценивания: Статистическая обработка неоднородных совокупностей. — М.: Статистика, 1980.-208 с.
114. Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике. Подход на основе функций влияния. М.: Мир, 1989. - 512 с.
115. Айвазян С. А., Енкжов И. С., Мешалкин JL Д. Прикладная статистика. Основы моделирования и первичная обработка данных. — М.: Финансы и статистика, 1983. 472 с.
116. Durbin J., Watson G. S. Testing for serial correlation in least squares regression // Biometrica, 1950. №37. P. 409-428.
117. Дж. Бендат, А. Пирсол. Применения корреляционного и спектрального анализа. М.: Мир, 1983. - 310 с.
118. Engle R.F., Patton A.J. What Good is a Volatility Model? // Quantitative Finance, 2001. № 1(2). -P. 237-245.
119. Валеев С. Г., Кувайскова Ю. Е. Смешанные процессы авторегрессии и скользящего среднего для обработки временных рядов // Вестник Ульяновского государственного технического университета: Ульяновск: УлГТУ, 2006. №4. - С. 37-41.
120. Валеев С.Г., Кувайскова Ю. Е., Юдкова М.В. Робастные методы оценивания: программное обеспечение, эффективность // Вестник Ульяновского государственного технического университета. Ульяновск: УлГТУ, 2010. №. 1. - С. 29-33.
121. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде Windows. -М.: Финансы и статистика, 1999. 384 с.
122. Кувайскова Ю. Е. Моделирование распределения во времени промышленных примесей в атмосфере // Вестник Ульяновского государственного технического университета. Ульяновск: УлГТУ, 2009. №. З.-С. 12-16.
-
Похожие работы
- Модель, метод и алгоритм оценки риска техногенных аварий
- Автоматизация организационно-технологического проектирования ремонтно-строительных работ на техногенных объектах
- Растровые модели и алгоритм визуализации пространственных данных в системах мониторинга природных и техногенных катастроф
- Оптимизационные модели аграрного производства в решении задач оценки природных и техногенных рисков
- Оценка техногенной безопасности станций заправки жидким моторным топливом наземных транспортных средств
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность