автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом

кандидата технических наук
Гадзаов, Алексей Федорович
город
Москва
год
2009
специальность ВАК РФ
05.13.18
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом»

Автореферат диссертации по теме "Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом"

На правах рукописи

Гадзаов Алексей Федорович

МАТЕМАТИЧЕСКИЕ МОДЕЛИ И АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧИ РАЗДЕЛЕНИЯ ДВИЖЕНИЯ ДЛЯ ЭМПИРИЧЕСКИХ ДАННЫХ С ТРЕНДОМ

Специальность 05.13.18: «Математическое моделирование, численные методы и комплексы программ»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 2009

003471603

Работа выполнена на кафедре «Прикладная математика» Государственного образовательного учреждения высшего профессионального образования (ГОУ ВПО) «Московский государственный институт радиотехники, электроники и автоматики (технический университет)»

Научный руководитель:

Официальные оппоненты:

Заслуженный деятель науки РФ, доктор технических наук, профессор Кузьмин Виктор Иванович

доктор технических наук, профессор Ткаченко Владимир Максимович

кандидат технических наук, Михеев Олег Валерьевич

Ведущая организация: Институт электронных управляющих машин (ИНЭУМ) 3 о

Защита состоится «¡7» си-ОМ 2009г. в 14 часов в аудитории Г-412, на заседании диссертационного совета Д212.131.03 при Московском государственном институте радиотехники, электроники и автоматики (техническом университете) по адресу: 119454 г. Москва, проспект Вернадского 78,.

С диссертацией можно ознакомиться в библиотеке ГОУ ВПО МИРЭА (ТУ).

Отзывы на автореферат в двух экземплярах, заверенные печатью, просим направлять по адресу: 119454, г. Москва, пр-т Вернадского 78, диссертационный совет Д212.131.03

Автореферат разослан «(3» 2009 г.

Ученый секретарь диссертационного совета кандидат технических наук, доцент Тягунов O.A.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. При исследовании эмпирических данных часто решается задача о разделении движения. При этом для эффективного определения параметров колебаний требуется разделить исходный эмпирический ряд на трендовую и колебательную составляющие.

Для механических систем, где тренд описывается уравнением движения центра масс, его исключение не представляет особой сложности. Решение задачи о разделении движения, когда уравнения для опорной траектории неизвестны, связано с большими трудностями. Регулярных методов решения этой задачи фактически нет.

Стандартные методы исключения тренда основываются на аппроксимации исходного ряда определенной зависимостью. После определения параметров используемой модели считается, что уравнения тренда теперь известны.

В действительности, использование этого метода не гарантирует исключение тренда без потери существенной информации о процессе или возникновения колебаний, изначально не присутствующих в исследуемых эмпирических данных. Это происходит из-за несоответствия используемых моделей свойствам реальных процессов.

При исследовании оставшихся после исключения тренда колебаний возникают аналогичные проблемы. Исследуемым колебаниям навязывается определенная структура, например, ряд Фурье. Эффективный анализ колебаний возможен, когда структура модели соответствует исходным данным, что на практике встречается довольно редко. Их несоответствие компенсируется изменением структуры самой модели до тех пор, пока полученный результат не будет отвечать определенным критериям. Однако, при этом теряется физический смысл получаемых параметров, становится неясной их связь с реальным процессом.

Актуальной проблемой является разработка моделей, алгоритмов и программ, позволяющих реализовать исключение тренда, гарантирующих сохранение структуры колебаний, выявление

структурного полного набора почти-перйодов и определение на этой основе характеристик самого процесса.

Актуальными задачами, позволяющими решать эту проблему, являются:

1) решение задачи исключения тренда в эмпирических данных без потери существенной информации о процессе;

2) определение полного набора колебаний на основе алгоритмов, не связанных с их заданной структурой;

3) восстановление трендовой составляющей процесса без априорного предположения о его функциональном виде. Предмет исследования. Математические модели и методы

анализа эмпирических данных. Методы исключения и восстановления тренда и определения параметров колебаний.

Объект исследования. Эмпирические данные с трендами и колебаниями, результаты измерения характеристик функционирования природных, физических, технических и экономических систем.

Цель исследования. На основе общих свойств эмпирических данных разработать модели, алгоритмы и программный комплекс исследования эмпирических данных с трендом.

Для достижения поставленной цели требуется решить следующие задачи:

1) Разработать модели и методы, гарантирующие исключение тренда без искажения информации об исследуемом процессе.

2) Разработать алгоритмы, не предъявляющие к исходным данным жесткой структуры колебаний, ориентированные на определение иерархии почти-периодов.

3) Разработать методы согласования алгоритмов исключения трендов и определения почти-периодов.

4) Разработать методы выделения трендовой составляющей эмпирических данных.

Методы исследования. Методы исследования основывались на применении теории дифференциальных уравнений, функционального анализа и теории почти-периодических функций.

Научная новизна.

Разработан класс моделей, алгоритмов и программ решения задачи о разделении движения в эмпирических данных, включающих:

1) модели исключения тренда на основе свойств линейного дифференциального уравнения первого порядка с переменными коэффициентами, гарантирующие исключение тренда с выделением колебаний относительно нулевого уровня без искажения их структуры;

2) алгоритмы определения почти-периодов, основанные на метриках функционального анализа, без привязки к заданной структуре колебаний;

3) класс обобщенных сдвиговых функций, обеспечивающих согласование алгоритмов исключения трендов и определения почти-периодов;

4) алгоритм определения трендовой составляющей исследуемых данных, согласованный с характеристиками самого процесса.

Основные положения, выносимые на защиту:

1) Модели, алгоритмы и программы исключения трендов в эмпирических данных, обеспечивающие нулевое среднее для оставшихся данных.

2) Модели и методы определения иерархии почти-периодов.

3) Алгоритмы согласования результатов исключения трендов и анализа колебаний.

4) Алгоритмы восстановления трендовой составляющей процесса.

5) Алгоритмы проверки полученных результатов. Обоснованность и достоверность научных результатов

основываются как на фундаментальных результатах теории дифференциальных уравнений, теории почти-периодических функций и функционального анализа, так и на предъявлении эффективности разработанных моделей, алгоритмов и программ при анализе динамики нелинейных колебаний с трендом. Практическая ценность.

1. Решена задача разделения движения в эмпирических данных с трендом.

2. Разработаны алгоритмы, позволяющие исключать тренд без искажения информации об исследуемом процессе.

3. Разработаны алгоритмы анализа колебаний, выявляющие иерархии почти-периодов на основе общих свойств почти-периодических функций.

4. Разработан метод определения трендовой составляющей исследуемого процесса на основе полученных характеристик самого процесса.

5. Разработан программный комплекс в среде Matlab для решения задачи разделения движения в эмпирических данных.

Публикации. Основные результаты диссертационной работы опубликованы в 10 научных работах, в том числе 2 статьи в журналах из перечня ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения и списка литературы. Объем основного текста состоит из 118 печатных страниц, включая 2 таблицы, 38 рисунков и список литературы из 98 наименований.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ Во введении обоснованы актуальность темы диссертации и выбор объекта диссертационного исследования. Сформулирована цель и очерчен круг решаемых задач. Приведены признаки научной новизны и основные положения, выносимые на защиту.

В первой главе проводится обзор современного состояния проблем в выбранной сфере исследования. Формулируются основные проблемы, возникающие в процессе анализа данных различной структуры. Рассматриваются основные подходы и методы решения поставленных задач, проводится разбор положительных и отрицательных сторон имеющихся решений.

На основе проведенных исследований обоснованы задачи диссертационной работы.

Во второй главе приводятся математические модели и алгоритмы, используемые для исключения тренда из эмпирических данных, основанные на свойствах линейного неоднородного дифференциального уравнения первого порядка с переменными

коэффициентами. Такое уравнение позволяет описать широкий класс трендов, и его общие свойства могут стать методической основой разработки моделей и алгоритмов исключения тренда. Представлен алгоритм определения почти-периодов на основе метрик функционального анализа и теории почти-периодических функций. Изложены способы согласования алгоритмов исключения тренда и определения почти-периодов, выделения трендовой составляющей на основе полученных характеристик процесса.

В общем случае, анализ и обработка эмпирических данных часто связаны с трудностями выделения колебаний, сопутствующих трендам. Анализ структуры колебаний в эмпирических данных с трендом требует решения задачи о разделении движения на трендовую составляющую и колебания. Регулярных методов решения этой задачи нет.

Рассмотрим в качестве основы для моделирования тренда линейное неоднородное дифференциальное уравнение первого порядка с переменными коэффициентами:

y(x) + p(x)-y(x) = q(x). (1)

Пусть известны два частных решения уь у2 неоднородного уравнения, тогда общее решение можно получить без квадратур

Л*) = Мх) + С-{у2(х)-у1 (х)) ■ Пусть уз - частное решение, отличное от у,, у2. Тогда,

Уз W = )'i (х) + С, • {у2 (X) - J'] (х)). Отсюда выводится соотношение:

Уг(х)-у3(х) = 1-С|

•УзОО-М*) С1

т.е. всякая интегральная кривая линейного уравнения делит в постоянном отношении отрезок ординаты между какими-либо двумя интегральными кривыми этого уравнения (рис.1). Из этого следует. что секущие N1M1, N3M3. N2M2... должны пересекаться в одной точке или быть параллельными. При неограниченном уменьшении секущих они перейдут в касательные. Таким образом, касательные к интегральным кривым линейного уравнения, проведенные в точках пересечения этих кривых прямой, параллельной оси Oy, или пересекаются в одной точке, или параллельны.

Рис.1 Иллюстрация геометрических свойств решений (1)

Эти свойства интегральных кривых широко распространены в характеристиках объектов самой различной природы.

Полученные критерии соответствуют модели Кирквуда:

*- = К, (2)

Хп+1 ~Х,

где К - постоянная.

Таким образом, пропорция Кирквуда является интегралом линейного неоднородного дифференциального уравнения для фиксированного значения аргумента, то есть представляет собой значения среднего фазового состояния системы Хп относительно состояний и Хп+\. Для оценки динамических характеристик систем перейдем от среднего значения по фазовому состоянию к среднему значению по времени, то есть будем считать среднее состояние X, как определяемое соседними состояниями

Х/+А[ + X

и Тогда, при К=1 получается Х1 =----.

Примером содержательности такого подхода являются модели ограниченного роста. Для уравнения Гомперца получим:

( \ У

Ж КУоо)

Ее интефалом является функция /Ую) = —е

-Ш-10)

В результате или

У, У,-м ekàl-\ Обозначим xt = lny,. Тогда,

Xt+At ~ */ = P(xt ~ Xt-At) или —— ~P,

xt Xt-At

что соответствует уравнению Кирквуда (2), интефирование которого определяет экспоненциальную зависимость от фиксированного уровня.

В результате, задавшись определенным значением для смещения аргумента, можно компенсировать влияние тренда для класса процессов типа ограниченного роста.

При постоянных первых разностях нулевое значение вторых разностей приводит к соотношению вида:

А2*/ = ln;w-2\пУ1 + Iny,^ = = 0.

yf

Значит, преобразование эмпирических данных в координатах

\ny<±ALllz-AL ~ t (3)

Уг

приводит к исключению из исходной зависимости кусочно-экспоненциальных трендовых участков.

Значение вторых разностей для у,, без логарифмирования, приводит к соотношению вида:

д2xt =yl+M-2yt+yt-At=:0-

Тогда преобразование эмпирических данных в координатах

1ПZI+âlIII^ÂL ^ t (4)

2- У/

исключает из исходной зависимости кусочно-линейные трендо-вые участки.

Эффективность алгоритмов исключения трендов будем характеризовать близостью к нулю математического ожидания полученных в результате исключения тренда колебаний.

Рассмотрим применение полученных соотношений для исключения тренда на данных солнечной активности с 1922 по 1964 года, характеризующихся ростом амплитуды колебаний.

Рис.2 Динамика среднего числа пятен на Солнце с 1922 по 1964 года

Рис.3 Данные рис.2 после исключение тренда при М=\2 месяцев для соотношения (3)

Метод обработки временных рядов, который бы позволил выявлять в исследуемом процессе колебания различных периодов и анализировать соотношения и взаимодействия между ними, не используя при этом таких априорных предположений, как суперпозиция колебаний различной длительности, гармоническая форма этих колебаний и постоянство их фазы на протяжении всего времени наблюдения, должен основываться на наиболее общем подходе к анализу периодичностей.

Необходимой общностью обладает способ выявления периодичностей с помощью оценки степени повторяемости поведения исследуемого временного ряда при различных временных сдвигах. Такой подход опирается, прежде всего, на фундаментальное характеристическое свойство периода функции, состоя-

щее в повторении значений функции через интервал изменения независимой переменной, равный периоду.

Как правило, в реальных данных приходится иметь дело с нелинейными колебаниями, в связи с чем чистые периоды встречаются достаточно редко. В результате, максимум, на что можно рассчитывать - это на выявление значений наиболее близких к периодам. Такие значения называются почти-периодами.

Рассмотрим следующее определение почти-периодической функции: число т называется е - почти-периодом (е - смещением) функции f(x) (-со < х < со), если для всех х выполняется неравенство

|/(/ + т)-/(0|<£ (5)

Если /(/)- периодическая функция и р - ее период, то есть f{t + т) = /(/),то, очевидно, р является так же и почти-периодом для любого е>0, точно так же как и любое число вида пр(п = ±1, ±2,...).

Чаще всего для анализа колебаний используют Фурье - анализ, что приводит к навязыванию результатам измерений их представление через Фурье - спектр.

Принципиальным при анализе нелинейных колебаний является определение их структуры как не связанной с некоторой жесткой системой паттернов.

Для выявления периодов, свободных от априорных предположений, используется фундаментальное свойство почти-периодической функции (5).

Для дискретного случая, если п общее число отсчетов функции /(О, заданной экспериментальными значениями, вводится следующая метрика:

а(г) = —lV(< + *)-/(')|, (6)

которая называется сдвиговой или функцией Альтера - Джонсона.

Система почти-периодов г функции f(t) определяется как совокупность локальных минимумов сдвиговой функции г = arg min а{г) rmin < г < rmax,,

где гП1Ш и гтах - естественные пределы поиска периода, выбираемые таким образом, что, с одной стороны, отбрасываются т<ттт, при которых функция а(т) может принимать малые значения из-за инерционности функции /(0 и, с другой стороны, отбрасываются большие т >- ттах, при которых определение средней а(т) становится ненадежным из-за малости числа а(п-х) - предела суммирования в выражении (б).

Фактически в этом случае выявляются почти-периоды, представленные в экспериментальных данных, вне зависимости от формы колебаний.

Аналогично этому, функция Альтера - Джонсона определяет среднее расстояние по модулю по оси ординат между точками, расположенными по оси абсцисс друг от друга на расстоянии т.

В функциональном анализе рассматривается ряд метрик для определения расстояния на метрическом пространстве.

п

1) р(х,у) = '£\х1-у,|, х = (хь....,х„),у = О,,....,уп)-множест-г=1

во действительных чисел.

При замене х1 = /(/ + г), у1 =/(0 и взятии оператора усреднения, получается функция Альтера - Джонсона:

Ф) = — 1|Я' + Т)-Д0|-

П-Т г=!

2) р{х,у) =

3) р„(^П = (Е|х( -у,\)р а(т) = —(1|/(< + т)-т\У

/=1 (=1 Эти функции широко используются в теории распознавания образов при решении задач классификации, определяя расстояние между объектами или группами в метрическом пространстве.

Проиллюстрируем эффективность представленных алгоритмов определения почти-пер йодов на полных данных о солнечной активности.

К*,-*)2

а{ г) = -

ы

и-т

!(/(' + *)-ДО)2.

Рис.4 Динамика среднего числа пятен на Солнце (числа Вольфа), по оси абсцисс - время в годах

Начнем с рассмотрения результата с разложения данных в ряд Фурье, что соответствует стандартной процедуре определения периодов колебаний (рис.5).

1П X;* «в«-< 4,5них» 1 !

J ил/^....................................

■'ОООООООООООООООО Г-МГО^ЮФЬ-СОЛОТ-Г^Л^Ц)

Рис.5 Спектр Фурье для циклов солнечной активности

оооооооооооооооооооо т-М«'*ШЦ>Гч.СО<ЛОт-гЧ{')'^1Л<в|-чСО<Л|

Рис.6 Результат обработки данных сдвиговой функцией

Здесь содержательно выявляется 11-летний цикл. На этом содержательная часть информации об остальных циклах исчерпывается, для выявления других циклов необходимо использование дополнительных методов обработки данных.

Применение сдвиговой функции на тех же данных (рис.6) определило совокупность почти-периодов солнечной активности последовательностью значений: 11, 22, 33, 43, 54, 67, 78 , 89, 100, 110, 121, 132, 143, 156, 168, 179, 189, 200 лет.

Из полученных результатов видна принципиальная разница информативности получаемых результатов. При использовании метода Фурье, основанного на навязывании эмпирическим данным фиксированной структуры, выделяется 11-летний период. При этом периоды большей длительностью выявлены не были.

При использовании сдвиговых функций, основанных на метриках функционального анализа, которые не задают структуру колебаний, выявляется набор почти—периодов, значения которых отличаются на порядок. Эти результаты соответствуют значениям циклов, выявленных различными авторами в течение последних двухсот лет.

На рис.7 отображена сдвиговая функция для данных фрагмента солнечной активности (рис.2) после исключения тренда.

О 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32

Рис.7 Функция Альтера-Джонсона данных для рис.2

Полученные почти-периоды равны Ю.З, 20.5 лет и соответствуют ранее полученным результатам. Таким образом, применение преобразований для исключения тренда с эффективным значением сдвижки не исказили параметров колебаний.

Таким образом, принципиальный характер перехода при анализе нелинейных колебаний на основе метрик функциональ-

нош анализа по сравнению с Фурье-анализом очевиден.

Алгоритм оценки набора почти-периодов в эмпирических данных с трендом состоит из двух этапов, в каждом из которых присутствуют времена сдвига от текущего значения.

Величина сдвига в (3),(4) влияет на форму колебаний, полученных в результате исключения тренда. Это приводит к необходимости ее согласования со сдвигом т, используемым для вычисления сдвиговых функций.

В качестве основы для такого согласования рассматривается фундаментальное свойство периода: /(/ + т) — /(0 = 0.

Это соотношение задает нулевое отклонение функции, смещенной на период от значения в данный момент времени, что позволяет для почти-периодов в качестве метрики, характеризующей наилучшее приближение из набора, полученного при вариации А1 в (3),(4), выбрать такое значение ДС для которого амплитуда колебаний сдвиговой функции будет минимальной.

В результате для оценки системы почти-периодов в экспериментальных данных с трендом требуется расширить понятие сдвиговой функции, включив в нее, кроме аргумента т, величину Д1 в зависимостях (3) и (4), что приведет к построению следующих функций на основе метрик, исключающих тренд:

] п-т-й/

а(т,М) =- X

л - т - Д/ ,=1

Л И-г-Д!

я(г,Д/) =-- X

л-г-ДГ ,=1

1П У<-ы+т' У/+е.1+г __ ]п У/-А< ' У/+м (7) (У,+т)2 (У,)2 I

|п т 'У/+М+Т _ |п У>-ы ' У/+м

(.у1+г)2 (У,)2

(8)

Исследование системы минимумов этих функции по т и Д1 позволяет определить набор значений почти-периодов, соответствующих исходному эмпирическому ряду.

Можно выявлять согласованные локальные минимумы для т и М. Для этого строятся функции, характеризующие среднюю сумму значений по каждому аргументу функции а(т,А1), то есть:

= ^ £а(г,ДО, (9) ЧЧД0=41а(г,Д0, (Ю)

где N и Ь - количество значений по аргументу. Минимумы функ-

ций (9), (10) определяют положение почти-периодов.

На рис.8 представлена обобщенная сдвиговая функция (7) для данных рис.2.

Рис.8 Обобщенная сдвиговая функция (7) для данных рис.2 и средние значения амплитуд.

Для выявления тренда необходимо использовать методы, позволяющие, во-первых, избежать навязывания определенной зависимости предполагаемому тренду, во-вторых, согласовать выделение тренда с уже найденными характеристиками процесса. Для этого используется метод, при котором из исследуемых данных исключаются колебания, присутствующие в исходном ряду. В качестве такого метода используем скользящую среднюю:

/(о=- !>('+*), сю

т т--х 2

*

где у (I) - значения трендовой составляющей у^), т- количество элементов, по которым ведется усреднение.

Исключим из исходной зависимости колебание, равное по величине почти-периоду. Применяя к у (!) соотношение (11) с другими т, можно исключить основные почти-периоды, в результате остается тренд.

На рис.9 представлены результаты исключения 11-летнего цикла из данных рис.2. На рис.10 представлена сдвиговая функция после исключения тренда рис.9. Совпадение значений почти-периодов говорит о содержательности выявленного тренда.

Рис.9 Данные после исключе- Рис.10 Сдвиговая функция дан-ние колебаний в 11 лет ных рис.4 после исключение

тренда рис.9.

Общая схема алгоритма исследования эмпирических данных, представленная на рис.11, реализуется в несколько этапов:

1) исключение трендовой составляющей;

2) определение параметров колебаний;

3) согласование алгоритмов исключения тренда и определения значений почти-периодов;

4) исключение колебаний и выделение тренда;

5) сравнение значений почти-периодов, найденных в п.З и п.4

6) в зависимости от результатов сравнения принимается решение о завершении алгоритма или о его повторном прохождении.

В третьей главе рассматривается эффективность разработанных моделей и алгоритмов на реальных данных, применение полученных результатов для анализа и прогнозирования динамики сложных систем.

Эффективность сдвиговых функций для выявления периодических характеристик процессов была рассмотрена на данных

18

ЭКГ здоровых и больных людей [4]. На рис.12 изображены данные ЭКГ здорового человека.

Исходные данные

Исключение колебаний

| Трендовая 1 составляющая

^.............................Т"""....................'

| Исключение тренда

Исключение тренда $*■■■■

Определение почти - периодов

Согласование алгоритмов

Определение почти Ц 1 I - периодов

:.....::::: :х

Почти - периоды

Почти - периоды

-Свойства ЛДУ 1-го порядка

: Координаты исключения тренда

Свойства почти -периода

Метрические пространства

Почтм-периоды не совпадают;

Почтм-периоды __совпадают........

Сравнение результатов

Конец

Рис.11 Общая схема алгоритма

Сравнение результатов, аолученных на основе разложения в ряд Фурье (рис. 13), с полученными на основе сдвиговых функций (рис.14), представлено на рис.15 и показывает наличие существенной систематической ошибки в оценке длительности сердечного цикла по методу Фурье.

11 ^ | Преобразование Фурье

/(х) = - у & г Ьч 51П{Ах))

|/ 5 10 15 20 25 30 35 Щ. 45 50 55 60 у Секунды

Рис.12 Фрагмент записи ЭКГ Рис.13 Разложение в ряд Фурье здорового человека данных рис. 1§Ь

Рис.14 Сдвиговая функция Рие.15 Частость встречаемости Альтера-Джонсона для данных длительностей сердечного рис. ритма на анализируемом

интервале ЭКГ

Разработанные алгоритмы были использованы при анализе данных о распространенности и температурах кипения химических элементов и данных экономической статистики.

На рис.16 представлен исходный ряд Н.Д. Кондратьева, на котором он иллюстрировал большие циклы конъюнктуры. Проблемой при обсуждении его результатов был метод выделения тренда и его влияние на величины периодов. На рис.17 представлены результаты обработки этих данных.

{Ун^ек с ,то р го в ы х цен в Англии с 1780 по 1915 года в золоте

/м/!",'1!?! Исходный ряд

1 11 Л ........_______

—и-п

I ..........1.....1 \

,__, Тренд

•1 ' "

) ! | \ 1. п

V--

, -Д/.

я--

80

1780 1795 1810 1825 1840 1855 1870 1885 1900 1915

Рис. 16 Индекс торговых цен в Англии с 1780 по 19)5 года в золоте

Рис.17. Обобщенная сдвиговая функция (7) для данных рис.16 и средние значения амплитуд

Проведенные исследования показывают справедливость полученных Н.Д. Кондратьевым оценок длительностей больших циклов.

В целом проведенные исследования показали эффективность получаемых значений почти-периодов и трендов, характеризующих большие статистические выборки.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

В результате выполнения комплекса исследований, связанных с разработкой математических моделей и алгоритмов для решения задачи разделения движения для эмпирических данных с трендом, получены следующие результаты:

1. Разработаны математические модели и алгоритмы исключения тренда без искажения информации об исследуемом процессе, гарантирующие исключение тренда с выделением колебаний относительно нулевого уровня.

2. Разработаны алгоритмы определения почти-периодов на основе сдвиговой функции.

3. Разработан класс обобщенных сдвиговых функций, обеспечивающих согласование алгоритмов исключения трендов и определения почти-периодов.

4. Разработан метод выявления тренда сглаживанием по почти-периодам.

5. Разработан программный комплекс, позволяющий исключать тренд без потери информации о структуре колебаний, определять структурно полный набор почти-перйодов, определять характеристики тренда. Комплекс реализован в среде Ма11аЬ и зафиксирован в Отраслевом Фонде Алгоритмов и Программ (ОФАП).

6. Эффективность разработанных алгоритмов и программ проверена на классических данных и использовалась в научно-исследовательских работах, в учебном процессе МИРЭА в курсах "Методы построения моделей по эмпирическим данным" и "Математические модели в естествознании".

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Кузьмин В.И., Гадзаов А.Ф. Методы определения почти-периодов в эмпирических данных. / Электромагнитные волны и электронные системы. М., 2009 г., №4. С. 24-28.

2. Гадзаов А.Ф. Алгоритмы выявления почти-периодов в результатах измерений. / Журнал научных аспирантов и докторантов. К.,2008 г, №3. С. 131-34.

3. Кузьмин В.И., Гадзаов А.Ф. Программа решения задачи разделения движения в данных с трендом. / М.: Отраслевой фонд алгоритмов и программ (ОФАП). Свидетельство об отраслевой регистрации №12275 от 6 февраля 2009 г.

4. Кузьмин В.И., Гадзаов А.Ф. Методы выявления почти-периодов в данных с трендом. // Естественные и технические науки. М., 2009 г., №2. С. 302-305.

5. Бокерия Л.А., Кузьмин В.И., Ключников И.В., Гадзаов А.Ф. Подход к анализу ритмов в кардиологии. / Клиническая физиология кровообращения. М., 2008 г., №1. С. 5-10.

6. Кузьмин В.И., Гадзаов А.Ф. Методы определения почти-периодов в данных с трендом. / Современные методы и средства обработки пространственно - временных сигналов: сборник статей VI Всероссийской научно - технической конференции. - П., 2008 г. С. 60-63.

7. Кузьмин В.И., Гадзаов А.Ф. Анализ статистических выборок на основе обратной функции распределения. / Современные методы и средства обработки пространственно - временных сигналов: сборник статей VI Всероссийской научно-технической конференции. - П., 2008 г. С.15-17.

8. Кузьмин В. И., Гадзаов А.Ф. К методам обработки больших статистических выборок. / 57 Научно-техническая конференция. Сборник статей. Часть 2. Физико - математические науки. М., 2008 г. С. 69-73.

9. Гадзаов А.Ф. // разд. в кн.: Кузьмин В.И., Галуша Н.А, Пронина Е.Н. Категории ритмического единства природы. - М.: АВН, 2008. С. 97-127.

10. Кузьмин В. И., Гадзаов А.Ф. Методы определения почти-периодов в эмпирических данных с трендом. /Информационно -вычислительные технологии в решении фундаментальных и прикладных научных задач. Сборник материалов конференции ИВТН-2008. М, 2008 г. С. 49.

Подписано в печать 20.04.2009. Формат 60x84 1/16. Усл. печ. л. 1,16. Усл. кр.-отт. 4,64. Уч.-изд. л. 1,25. Тираж 100 экз. Заказ 266

Государственное образовательное учреждение высшего профессионального образования "Московский государственный институт радиотехники, электроники и автоматики (технический университет)" 119454, Москва, пр. Вернадского, 78

Оглавление автор диссертации — кандидата технических наук Гадзаов, Алексей Федорович

Введение.

Глава 1. Обзор проблем разделения движения.

1.1. Постановка задачи разделения движения.

1.2. Методы моделирования трендов.

1.3. Методы выявления колебаний.

1.4. Требования к моделям и алгоритмам решения задачи разделения движения.

Глава 2. Модели и алгоритмы обработки эмпирических данных с трендом.

2.1. Модели исключения тренда.

2.2. Модели и алгоритмы определения почти периодов.

2.3. Согласование алгоритмов исключения тренда и определения величины почти - периодов.".

2.4. Алгоритм определения трендовых составляющих в эмпирических данных.

2.5. Алгоритм решения задачи разделения движения.

Вывод.

Глава 3. Исследование динамических характеристик нелинейных систем по эмпирическим данным.

3.1. Выделение колебаний в данных с трендом.

3.2. Определение набора почти-периодов.

3.3. Определение эффективных значений характерных времен при исключении тренда и определении почти-периодов.

3.4 Выделение трендовых составляющих в эмпирических данных.

Выводы.

Введение 2009 год, диссертация по информатике, вычислительной технике и управлению, Гадзаов, Алексей Федорович

Актуальность работы. При исследовании эмпирических данных часто решается задача о разделении движения на трендовую и колебательную составляющие. х Для механических систем, где тренд описывается уравнением движения центра масс, его исключение не представляет особой сложности. Решение задачи о разделении движения, когда уравнения для опорной траектории неизвестны, связано с большими трудностями. Регулярных методов решения этой задачи фактически нет.

Стандартные методы исключения тренда основываются на аппроксимации исходного ряда определенной зависимостью. После определения параметров используемой модели считается, что уравнения тренда теперь известны.

В действительности, использование этого метода не гарантируют исключение тренда без потери существенной информации о процессе или возникновения колебаний, изначально не присутствующих в исследуемых эмпирических данных. Это происходит из-за несоответствия используемых моделей свойствам реальных процессов.

При исследовании оставшихся после исключения тренда колебаний возникают аналогичные проблемы. Исследуемым колебаниям навязывается определенная структура, например, ряд Фурье. Эффективный анализ колебаний возможен, когда структура модели соответствует исходным данным, что на практике встречается довольно редко. Их несоответствие компенсируется изменением структуры самой модели до тех пор, пока полученный результат не будет отвечать определенным критериям. Однако, при этом теряется физический смысл получаемых параметров, становится неясной их связь с реальным процессом.

Актуальной проблемой является разработка моделей, алгоритмов и программ, позволяющих реализовать исключение тренда, гарантирующих сохранения структуры колебаний, выявление структурного полного набора почти-периодов и определение на этой основе характеристик самого процесса.

Актуальными задачами, позволяющими решать эту проблему, являются:

1) решение задачи исключения тренда в эмпирических данных без потери -существенной информации о процессе;

2) определение полного набора колебаний на основе алгоритмов, не связанных с их заданной структурой; ' • •

3) восстановление трендовой составляющей процесса; без априорного предположения о его функциональном виде.

Предмет исследования. Математические модели и методы анализа эмпирических данных. Методы исключения и восстановления тренда и определения параметров колебаний.

Объект исследования. Эмпирические данные с трендами и колебаниями, результаты измерения характеристик функционирования природных, физических, технических и экономических систем.

Цель исследования. На основе общих свойств эмпирических данных разработать модели, алгоритмы и программный комплекс исследования эмпирических данных с трендом.

Для достижения поставленной цели требуется решить следующие задачи:

1) Разработать модели и методы, гарантирующие исключение тренда без искажения информации об исследуемом процессе.

2) Разработать алгоритмы, не предъявляющих к исходным данным жесткой структуры колебаний, ориентированные на определение иерархии почти-периодов.

3) Разработать методы согласования* алгоритмов исключения трендов и определения почти-периодов.

5 t I

4) Разработать методы выделения трендовой составляющей эмпирических данных.

Методы, исследования. Методы исследования основывались на применении теории дифференциальных уравнений, функционального анализа и теории почти-периодических функций. Научная новизна.

Разработан класс моделей, алгоритмов и программ решения задачи о разделении движения в эмпирических данных, включающих:

1) модели исключения тренда на основе свойств линейного дифференциального уравнения первого порядка с переменными коэффициентами, гарантирующие исключение тренда с выделением колебаний относительно нулевого уровня, без искажения их t структуры;

2) алгоритмы определения почти-периодов, основанные на метриках функционального анализа, без привязки к заданной структуре колебаний;

3) класс обобщенных сдвиговых функций, обеспечивающих согласование алгоритмов исключения трендов и определения почти-периодов;

4) алгоритм определения трендовой составляющей исследуемых данных, согласованный с характеристиками самого процесса.

Основные положения, выносимые на защиту:

1) Модели, алгоритмы и программы исключения трендов в эмпирических данных, обеспечивающие нулевое среднее для оставшихся данных.

2) Модели и методы определения иерархии почти-периодов.

3) Алгоритмы согласования результатов исключения трендов и- анализа колебаний.

4) Алгоритмы восстановления трендовой составляющей процесса.

5) Алгоритмы проверки полученных результатов. Обоснованность и достоверность научных^ результатов основываются' как на фундаментальных результатах теории дифференциальных уравнений, теории почти - периодических функций и функционального анализа, так и на предъявлении эффективности разработанных моделей, алгоритмов и программ при анализе эмпирических данных, включающих нелинейные колебания с трендом.

Практическая ценность.

1. Решена задача разделения движения в эмпирических данных с трендом.

2. Разработаны алгоритмы, позволяющие исключать тренд без искажения информации об исследуемом процессе.

3. Разработаны алгоритмы анализа колебаний, выявляющие иерархии почти—периодов на основе общих свойств почти-периодических функций.

4. Разработан метод определения трендовой составляющей исследуемого процесса на основе полученных характеристик самого процесса.

5. Разработан программный комплекс в среде Matlab для решения задачи разделения движения в эмпирических данных.

Публикации. Основные результаты диссертационной работы опубликованы в 10 научных работах, в том числе 2 статьи в журналах из перечня ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения и списка литературы. Объем основного текста состоит из 118 печатных страниц, включая 2 таблицы, 38 рисунков, и список литературы из 98 наименований.

Заключение диссертация на тему "Математические модели и алгоритмы решения задачи разделения движения для эмпирических данных с трендом"

109 Выводы

1. Из приведенных примеров отчетливо видна эффективность разработанных математических моделей и методов анализа колебаний эмпирических данных с трендом.

2. Методы исключения тренда, основанные на свойствах неоднородного линейного дифференциального уравнения с переменными коэффициентами, позволяют анализировать данные о динамике нелинейных систем, без потери существенной информации о процессе, как колебания относительно нулевого уровня.

3. Алгоритмы анализа колебаний, на основе метрик функционального анализа и свойств почти-периодических функций позволяют выявлять иерархию почти - периодов.

4. Согласование этих методов дает возможность выявление колебаний наиболее сильным образом проявленных в исследуемых данных.

Заключение

В общем случае, анализ и обработка эмпирических данных часто связана с трудностями выделения колебаний, сопутствующих трендам. Без извлечения трендовой составляющей анализ колебаний достоверно провести проблематично, так как тренд будет вносить неточности в получаемый результат. Однако регулярных методов решения этой задачи нет. Используемые в настоящий момент методы не всегда могут адекватно описать исследуемую зависимость и исключить тренд без потери информации о процессе.

На основе общих свойств линейного неоднородного дифференциального уравнения решалась задача исключения трендов из эмпирических данных. Это уравнение описывает достаточно широкий класс динамических процессов, чтобы гарантировать исключение тренда из данных любой конфигурации без потери важной информации о процессе. Результатом работы алгоритма являются колебания относительно нулевого уровня.

Не смотря на многообразие методов анализа колебаний, их характерным недостатком является навязывание определенной структуры колебаний эмпирическим данным. Такое предположение о характере колебаний не позволяет получить достоверную информацию об исследуемом процессе.

На основе общих свойств почти - периодических функций и метрик функционального анализа решалась задача определения колебаний без привязки исследуемого процесса к жесткой структуре. В результате стало возможным достоверно определять параметры колебаний и их иерархию, что зачастую не возможно при использовании стандартных методов.

Разработаны алгоритмы определения трендовой составляющей исследуемых данных, согласованной с характеристиками самого процесса.

Результатом явилось создание программного комплекса, позволяющего анализировать эмпирические данные с трендом. Структурно программный комплекс состоит из четырех частей: в первой части исключается тренд и остаются колебаний относительно нулевого уровня; во второй части исследуются колебания в данных после исключения тренда; в третьей части вводится класс обобщенных сдвиговых функций и проводится согласование алгоритмов исключения трендов и определения почти — периодов; в четвертой части происходит сглаживание исходных данных по почти-периодам, определяются тренды

Библиография Гадзаов, Алексей Федорович, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Ньютон И. Математические начала натуральной философии. М.: Наука, 1989.

2. Винер Н. Я математик. - М.: Наука, 1970.

3. Гиббс Дж. Термодинамика. Статистическая механика. М.: Наука, 1982.

4. Кондратьев Н.Д. Проблемы экономической динамики. М.: Экономика, Изд. ин. лит., 1989.

5. Демиденко Е.З. Линейная и нелинейная регрессия. М.: Финансы и статистика, 1981.

6. Мостеллер Ф., Тыоки Дж. Анализ данных и регрессия. М.: Финансы и статистика, 1982.

7. Себер Дж. Линейный регрессионный анализ.- М.: Мир, 1980. '' >

8. Дрейпер, Н., Смит, Г. Прикладной регрессионный анализ: В 2-х кн. ■— М: Финансы и статистика, 1986:

9. Хардле В. Прикладная непараметрическая регрессия. М.: Мир, 1993.

10. Отнес Р., Эноксон Л. Прикладной анализ временных рядов.г М.: Мир, 1982.

11. Абловиц М., Сигур X. Солитоны и метод обратной задачи. -М.: Мир 1987г.

12. Андронов А.А., Витт А.А., Хайкин С.Э. Теория колебаний. 3-е изд. М.: Физматгиз, 1981.

13. Бахарева И.Ф. Нелинейная неравновесная термодинамика. -С.: Изд. Саратовского Университете, 1976.

14. Г. М. Заславский, Р. 3. Сагдеев Введение в нелинейную физику: От маятника до турбулентности и хаоса. —М.: Наука, 1988. — 368 с.

15. Захаров В.Е., Манаков С.В., Новиков С.П., Питаевский Л.П. Теория солитонов. Метод обратной задачи. М., Наука; 1980.16